- 比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架 (0篇回复)
- 不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限 (0篇回复)
- 新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战 (0篇回复)
- 本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知 (0篇回复)
- 模型过剩危机:OpenAI壮士断腕,能否终结开发者'选择恐惧症'? (0篇回复)
- DeepSeek冲击之下,大模型六小强如何「回应」? (0篇回复)
- 免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了?? (0篇回复)
- 零基础也能看懂的ChatGPT等大模型入门解析! (0篇回复)
- 大语言模型的解码策略与关键优化总结 (0篇回复)
- 微信与百度相继接入DeepSeek,AI技术普惠开启超级加速度 (0篇回复)
- Nature:全球博士生数量锐减,钱少、事多、前途迷茫 (0篇回复)
- 服务器总是繁忙?DeepSeek-R1本地部署图文版教程来啦 (0篇回复)
- 微软开源创新框架:可将DeepSeek,变成AI Agent (0篇回复)
- AI 新突破:扭矩聚类算法亮相,无需人工标注、自主学习准确率高达 97.7% (0篇回复)
- DeepSeek-R1下载量超1000万次,成最受欢迎开源大模型! (0篇回复)
- DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解 (0篇回复)
- 用DeepSeek+Xmind, 3分钟实现万字报告秒变思维导图! (0篇回复)
- 大模型前缀缓存技术,有望将服务成本降低90% (0篇回复)
- AI大地震!微信百度同日接入DeepSeek,“技术洗牌”后是“流量大迁徙”? (0篇回复)
- Meta首席AI科学家认为当前GenAI和LLM将很快过时 (0篇回复)