← 返回日报
🌐 机器翻译 · DeepSeek · HF Blog

Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL


通过 Hub Bucket 部署万亿参数:TRL 中的增量权重同步

理解并利用权重更新稀疏性实现通信高效的分布式强化学习

论文 • 2602.03839 • 发布于 9 天前

📖 阅读原文 →