量子模拟的瓶颈到底在哪里

很多人第一次接触量子模拟时，会把瓶颈归结为“算法复杂”。这当然没错，但在工程实现层面，真正先撞上的常常是状态向量的尺寸与内存带宽。

指数增长带来的不是抽象复杂度，而是具体的字节数

状态向量模拟的核心问题很直接：qubit 数增加，向量规模指数增长。增长的不是“感觉上的难”，而是你必须真的去分配、读取和更新那块内存。

很多量子门应用到状态向量上时，计算量并不夸张，但需要对大块数据进行规律性访问。这意味着：

如果瓶颈主要来自状态搬运，那么判断 GPU、CPU 或 FPGA 是否合适时，就不能只看理论算力，还要看：

量子模拟不是一个“随便写个 kernel 就结束”的问题。它更像是：

所以我更愿意把量子模拟视为一个系统工程问题，而不是单纯算法问题。