- 揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案 (0篇回复)
- 强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍 (0篇回复)
- 让 AI 听懂你的语言:DeepSeek 提示词技巧介绍 (0篇回复)
- 剑桥大学研发 AI 天气预报系统:计算速度比现有方法快数十倍,台式机也能用 (0篇回复)
- 来了!十个构建Agent的大模型应用框架 (0篇回复)
- 关于LLMs 复读机问题 (0篇回复)
- AI将使勒索软件更加危险 (0篇回复)
- 为什么批判性思维是应对即将到来的Deepfake海啸的最佳武器 (0篇回复)
- 刚刚,谷歌AI智能体首次上线手机,Gemini看懂屏幕实时交流! (0篇回复)
- 氛围编程师崛起!年薪87万一天15小时,Karpathy用400行AI代码点燃硅谷 (0篇回复)
- Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页 (0篇回复)
- AI 写代码=安全危机?第一声“警哨”已吹响 (0篇回复)
- 腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗? (0篇回复)
- 三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU (0篇回复)
- 为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need (0篇回复)
- CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位 (0篇回复)
- Perplexity CEO泼冷水:Agent 2025落地不靠谱!下月将推出自研浏览器——目前构建通用智能体的唯一方法! (0篇回复)
- 击败思维链(CoT),草稿链(CoD)称王!推理成本降低近94%,低时延,准确率更高! (0篇回复)
- Meta 推出强化学习新框架 SWEET-RL,让 AI 更懂人类意图 (0篇回复)
- 王兴:美团已开发内部大模型 LongCat,AI 策略是主动进攻 (0篇回复)