实验记录归档
可以检索所有历史仿真实验、性能基准测试报告及系统调优记录。
EXP-010 2026-01-10
实验十:FlashAttention 性能分析与 Kernel Profiling
深入 CUDA/MUSA Kernel 层面,验证 FlashAttention 加速比与 I/O 瓶颈分析
阅读报告
EXP-009 2026-01-03
实验九:单机多进程模拟分布式训练 (Pseudo-DDP) 与通信故障排查
在单卡环境验证 MCCL/NCCL 启动流程、进程组初始化及驱动上下文切换稳定性
阅读报告
EXP-008 2026-01-02
实验八:LoRA (Low-Rank Adaptation) 高效微调
验证 PEFT 技术下的显存/算力平衡点,探测 Adapter 切换延迟与显存碎片化极限
阅读报告
EXP-007 2026-01-01
实验七:梯度检查点 (Gradient Checkpointing) 的时空权衡
量化开启 GC 后的显存节省与计算损耗,探究国产显卡的“续命”策略
阅读报告
EXP-006 2025-12-29
实验六:混合精度 (AMP) 的稳定性与 Loss Scaling
验证 FP16/BF16 在 MUSA 架构下的数值稳定性与算子回退机制
阅读报告
EXP-005 2025-12-28
实验五:训练显存解构与梯度累积 (Gradient Accumulation)
全量微调下的显存构成分析与梯度累积策略验证
阅读报告
EXP-004 2025-12-27
实验四:超长上下文与 KV Cache 的物理极限
长文本生成下的显存碎片化研究、PagedAttention 机制验证与 Swap 颠簸测试
阅读报告
EXP-003 2025-12-20
实验三:量化精度损失与算子一致性校验
Int4/Int8 量化对模型困惑度(Perplexity)及算术精度的影响评估,以及静默数据损坏 (SDC) 的排查
阅读报告
EXP-002 2025-11-25
实验二:推理吞吐量与 Continuous Batching 压测
vLLM Continuous Batching 机制下的吞吐量-延迟权衡分析
阅读报告
EXP-001 2025-11-21
实验一:显存解剖学与精度边界测试
基于精度的静态显存占用分析与 OOM 触发阈值探测
阅读报告