May 5, 2026 8 张 4090 微调 235B 模型:RoundPipe 如何打破消费级 GPU 训练的天花板 RoundPipe 通过无状态 GPU 池和非对称流水线切分,在 8 张 4090 上实现 235B MoE 模型的 LoRA 微调,吞吐量达到 A800 方案的 76%+。 #AI #llm #训练优化