Series

计算瓶颈

讨论内存、带宽、精度选择与系统级计算瓶颈。

2026年3月10日

为什么很多程序慢,不是因为算力不够,而是因为内存

讨论带宽、缓存与数据移动成本,解释为什么很多性能问题首先是内存问题。

performancehpcmemorygpu

2026年3月3日

FP16、FP32、FP64:精度选择背后的工程现实

精度不是数学洁癖,而是吞吐、误差、带宽和可维护性之间的系统级权衡。

precisionperformancegpuhpc

2024年9月21日

关于实验进度追不上截稿日被迫使用GPU做异构计算这件事

NULL

GPU