- Meta坐不住了!高管辟谣:Llama4没刷榜!训练没有使用测试集!模型稳定实现需要时间,bug正在修 (0篇回复)
- Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发 (0篇回复)
- 斯坦福2025 AI Index报告来了:DeepSeek在全文中被提到45次 (0篇回复)
- 大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略 (0篇回复)
- Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告 (0篇回复)
- AI在供应链中的潜力 (0篇回复)
- 初级开发者过度依赖 AI 的风险 (0篇回复)
- Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车 (0篇回复)
- 中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14% (0篇回复)
- CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强! (0篇回复)
- 论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」 (0篇回复)
- 清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗 (0篇回复)
- 反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗? (0篇回复)
- 铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025 (0篇回复)
- OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升 (0篇回复)
- 谷歌研究:合成数据使大模型数学推理能力提升八倍 (0篇回复)
- 五年复合增长率达35.2%!2028年中国AI总投资规模将超千亿美元 (0篇回复)
- 改变世界的十大算法 (0篇回复)
- LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略 (0篇回复)
- Meta LLaMA 4:对抗 GPT-4o 与 Claude 的开源王牌 (0篇回复)