Blog
AI API设计 CTR DAPO DeepSeek-R1 GPU GRPO KV Cache LLM Roofline Model Serving Transformer WebRTC agent ai-coding benchmark engineering-philosophy evaluation in-context-learning infrastructure llm methodology obsidian productivity real-time software-quality statistics vLLM web3 writing 产品策略 健康 分布式系统 创业 后端架构 基础设施 多模态 大模型 字节跳动 工具 并行计算 广告 广告系统 开发 强化学习 思考 推理优化 推荐 推荐系统 支付系统 机器学习 架构 架构设计 深度学习 算力 算法 视频生成 训练优化 语音AI 量化 金钱 阅读
X 开源推荐算法拆解:一个精妙的特化系统,而非通用推荐范式
X (Twitter) 2026 年开源的 For You 推荐算法是一个为自身场景量身定制的特化系统。本文从广告系统工程师视角分析其核心设计,并与字节、快手的通用架构对比,拆解其真实的可迁移价值。
8 张 4090 微调 235B 模型:RoundPipe 如何打破消费级 GPU 训练的天花板
RoundPipe 通过无状态 GPU 池和非对称流水线切分,在 8 张 4090 上实现 235B MoE 模型的 LoRA 微调,吞吐量达到 A800 方案的 76%+。
Agent Benchmark 正在失效:为什么静态评估无法衡量真实的 Agent 能力
Claw-Eval-Live 揭示静态 Agent 评估的三种失效模式,提出需求驱动的活 benchmark 设计——季度刷新任务分布,同时保持版本内可复现。
No matching posts found.