实验记录归档

可以检索所有历史仿真实验、性能基准测试报告及系统调优记录。

EXP-010 2026-01-10

实验十:FlashAttention 性能分析与 Kernel Profiling

深入 CUDA/MUSA Kernel 层面,验证 FlashAttention 加速比与 I/O 瓶颈分析

阅读报告
EXP-009 2026-01-03

实验九:单机多进程模拟分布式训练 (Pseudo-DDP) 与通信故障排查

在单卡环境验证 MCCL/NCCL 启动流程、进程组初始化及驱动上下文切换稳定性

阅读报告
EXP-008 2026-01-02

实验八:LoRA (Low-Rank Adaptation) 高效微调

验证 PEFT 技术下的显存/算力平衡点,探测 Adapter 切换延迟与显存碎片化极限

阅读报告
EXP-007 2026-01-01

实验七:梯度检查点 (Gradient Checkpointing) 的时空权衡

量化开启 GC 后的显存节省与计算损耗,探究国产显卡的“续命”策略

阅读报告
EXP-006 2025-12-29

实验六:混合精度 (AMP) 的稳定性与 Loss Scaling

验证 FP16/BF16 在 MUSA 架构下的数值稳定性与算子回退机制

阅读报告
EXP-005 2025-12-28

实验五:训练显存解构与梯度累积 (Gradient Accumulation)

全量微调下的显存构成分析与梯度累积策略验证

阅读报告
EXP-004 2025-12-27

实验四:超长上下文与 KV Cache 的物理极限

长文本生成下的显存碎片化研究、PagedAttention 机制验证与 Swap 颠簸测试

阅读报告
EXP-003 2025-12-20

实验三:量化精度损失与算子一致性校验

Int4/Int8 量化对模型困惑度(Perplexity)及算术精度的影响评估,以及静默数据损坏 (SDC) 的排查

阅读报告
EXP-002 2025-11-25

实验二:推理吞吐量与 Continuous Batching 压测

vLLM Continuous Batching 机制下的吞吐量-延迟权衡分析

阅读报告
EXP-001 2025-11-21

实验一:显存解剖学与精度边界测试

基于精度的静态显存占用分析与 OOM 触发阈值探测

阅读报告