底层技术:为什么差距如此之大
HDD 在旋转盘片上磁性存储位,需要每次随机读取 3-15 ms 的物理头部移动。SATA SSD 使用闪存单元,可在微秒内访问,但通过为旋转磁盘设计的传统 AHCI/SATA 协议通信。NVMe SSD 使用相同的闪存,但通过专为并行、低延迟访问从头设计的协议在 PCIe 上对话 — 差距随处可见。
7,200 RPM HDD 平均 8.3 ms 的旋转延迟加上 3-12 ms 的寻道时间,总随机读取延迟约为 5-15 ms。SATA SSD 通过电子闪存消除两者,将延迟降至约 100 微秒(快 50-100 倍),但受 SATA AHCI 协议的单命令队列瓶颈限制,有 32 个未完成的 I/O。NVMe(非易失性内存高速接口,2011 年标准化)专门为闪存设计:PCIe 传输(路径中无 SATA 控制器)、64K 命令队列,每个有 64K 命令(相对于 AHCI 的 32),以及简化的命令集。结果:端到端 NVMe 延迟降至 10-50 微秒,并行性几乎与队列深度线性扩展,单个 NVMe 驱动器可以维持 1+ 百万随机 IOPS,而 SATA SSD 在 100K 附近达到顶峰。技术差距不是 "渐进的更好" — 在每个重要指标上是 10-100 倍。
IOPS、延迟和吞吐量对比
典型 2026 数字。HDD:100-200 随机 IOPS,5-15 ms 延迟,200 MB/s 顺序。SATA SSD:50K-100K 随机 IOPS,约 100 μs 延迟,500-550 MB/s 顺序。NVMe Gen 4 SSD:500K-1M 随机 IOPS,10-50 μs 延迟,5-7 GB/s 顺序。NVMe Gen 5 SSD:1.5M-2M IOPS,约 10 μs 延迟,12-14 GB/s 顺序。
这些是 2026 年的典型零售和企业定价范围,不是绝对最低或最高。消费者 NVMe 定价压缩比企业级更快;消费者 Gen 4 NVMe(约 70 EUR/TB)与高耐久性企业 NVMe(约 150 EUR/TB)之间的差距现在主要是耐久性(DWPD — 每天驱动器写入)和断电保护电容,而不是原始性能。对于主机服务商,相关选择几乎普遍是企业 NVMe,因为消费者驱动器缺乏共享工作负载所需的持续写入性能和 PLP。
| 指标 | 7.2K HDD | SATA SSD | NVMe Gen 4 | NVMe Gen 5 |
|---|---|---|---|---|
| 随机读 IOPS (4K) | 100-200 | 约 95K | 500K-1M | 1.5M-2M |
| 随机写 IOPS (4K) | 100-200 | 约 85K | 300K-700K | 1M-1.4M |
| 读延迟 (典型) | 5-15 ms | 约 100 μs | 10-50 μs | 约 10 μs |
| 顺序读 | 150-250 MB/s | 500-550 MB/s | 5-7 GB/s | 12-14 GB/s |
| 接口 | SATA 6 Gb/s | SATA 6 Gb/s | PCIe 4.0 x4 | PCIe 5.0 x4 |
| 最佳协议队列深度 | 1 | 32 | 65,536 | 65,536 |
| 2026 每 TB 成本 (企业级) | 约 15-25 EUR | 约 80-120 EUR | 约 100-150 EUR | 约 150-220 EUR |
| 2026 每 TB 成本 (消费级) | 约 25-35 EUR | 约 50-70 EUR | 约 70-100 EUR | 约 120-180 EUR |
NVMe 何时重要
NVMe 在随机 IOPS 和尾延迟主导工作负载性能的任何地方都重要:关系数据库、键值存储、搜索索引、消息队列、容器构建场、CI/CD 管道,以及任何高并发工作负载。应用越快,从 NVMe 中受益越多 — 瓶颈从磁盘转移到 CPU。
三类工作负载从 NVMe 看到显著收益。数据库工作负载 — Postgres、MySQL、SQL Server — 在索引上发出许多并发随机 4-16 KB 读取;延迟直接转化为查询时间。SATA SSD 上的典型 OLTP 工作负载在第 95 百分位查询延迟墙约 1 ms 处命中;在 NVMe 上,相同的工作负载以亚 200 微秒 p95 运行。容器工作负载 — Docker、Kubernetes — 在镜像拉取和层提取期间执行数千次小读取;NVMe 将冷启动时间减少 5-10 倍。CI/CD 和构建管道 — bazel、gradle、npm install — 病态地是随机 IO 受限的;从 SATA 切换到 NVMe 通常将构建时间减半。共同主线:许多并发小操作排队的任何工作负载都受益于 NVMe 的队列深度扩展。单线程顺序工作负载受益较少,因为 SATA SSD 已经可以饱和其接口。
NVMe 何时不重要(以及 HDD 可能足够)
静态内容分发、视频流媒体、冷备份存储、日志归档和大文件批处理不会从 NVMe 看到有意义的收益,因为它们是顺序的和带宽受限的,而不是 IOPS 受限的。7,200 RPM HDD 或甚至 250 MB/s 顺序的 Hammer SMR 驱动器就够了 — 每 TB 便宜 5-10 倍。
三种工作负载模式几乎不使用 IOPS。静态内容分发顺序服务 100-KB 到多 MB 的文件;OS 预读和磁盘缓存使 SATA SSD 或甚至 HDD 对最终用户来说几乎与 NVMe 一样快(尤其是当 CDN 在前面时)。视频流媒体类似地以长顺序读取运行,具有强页缓存局部性;即使 4K 内容的 10 Gbps 流也很容易由 250 MB/s HDD 池供给。冷备份和归档存储关心每 TB 成本和耐久性,而不是延迟 — Backblaze、AWS Glacier 和大多数企业备份层级仍然为很少访问的 PB 级归档使用 HDD(或磁带)。在支付 NVMe 溢价之前,确定您的工作负载是 IOPS 受限还是带宽受限;对于规模顺序工作负载,HDD 在每字节经济性上仍然获胜。
2026 年每 GB 成本权衡
2026 年每 TB 企业定价(典型范围):HDD 约 15-25 EUR,SATA SSD 约 80-120 EUR,NVMe Gen 4 约 100-150 EUR,NVMe Gen 5 约 150-220 EUR。HDD 到 SATA 的差距已缩小;SATA 到 NVMe 的差距现在足够小,大多数新的主机部署默认标准化为 NVMe,HDD 保留用于备份和归档层级。
两年前,SATA 到 NVMe 的价格差距足够有意义,中级 VPS 方案仍然以 SATA SSD 作为标准发售。到 2026 年,差距在企业 SKU 上已缩小到大约 20-30%,性能差距(IOPS 上 10 倍,延迟上 5 倍)使数学很容易:多支付 20%,获得 10 倍性能。几乎每个通用 VPS 主机现在默认提供 NVMe Gen 4 用于主存储。SATA SSD 主要在具有更多驱动器槽的独立服务器平台中持续存在,其中 RAID-10 中的 8-12 个 SATA SSD 提供与软件 RAID 中 2-4 个 NVMe 驱动器不同的成本配置。HDD 仍然主要用于备份、归档和大容量存储工作负载,其中每 TB 成本比 IOPS 更重要。对于任何新的主数据库部署,NVMe 是唯一明智的默认。
RAID、冗余和规格表不告诉您的内容
单驱动器性能只是故事的一半。NVMe RAID 增加 CPU 开销,除非使用硬件 NVMe RAID 卡(罕见且昂贵);软件 md RAID-1 镜像很常见,RAID-5/6 较少。耐久性(DWPD)和断电保护(PLP)与 IOPS 一样重要 — 没有 PLP 的消费者 NVMe 驱动器在持续写入期间主机崩溃时可能丢失数据。
三个细节通常从规格表中遗漏。第一,NVMe 上的软件 RAID-5/6 是 CPU 受限的而不是磁盘受限的 — 在 1+ 百万 IOPS 时,奇偶校验计算可以饱和多个核心。大多数生产 NVMe 部署改为运行 RAID-1 镜像,并依靠备份提供镜像之外的耐久性。第二,驱动器耐久性以 DWPD(每天驱动器写入)在 5 年保修期间评级;消费者 NVMe 是 0.3-0.5 DWPD,主流企业级是 1-3 DWPD,密集写入企业级是 10+ DWPD。消费者驱动器上的密集写入数据库工作负载可以在几个月内磨损它。第三,断电保护 — 在断电时将机内电容刷新到闪存中 — 在企业驱动器上是标准的,在大多数消费者驱动器上缺失。没有 PLP,fsync 期间的主机崩溃可能损坏数据,尽管应用程序做了一切正确。始终在规格表上检查这三个细节,而不仅仅是 IOPS。