- 撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开 (0篇回复)
- Spring Boot 接入 DeepSeek API:实现智能应用的全新路径 (0篇回复)
- 从一个简单的神经网络模型开始 (0篇回复)
- DeepSeek公务员上岗!公务员铁饭碗不保? (0篇回复)
- Transformer 的三大优化技术!! (0篇回复)
- 再谈什么是神经网络,透过现象看本质 (0篇回复)
- DeepSeek+CodeWave实战,打通组织内落地DeepSeek的最后一公里 (0篇回复)
- OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密 (0篇回复)
- 大模型强化学习新发现:删减84%数据反提升效果 (0篇回复)
- 从大模型性能优化到DeepSeek部署 (0篇回复)
- 谷歌推出全新工具“职业梦想家”:用 AI 帮你找到理想工作 (0篇回复)
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT (0篇回复)
- 英伟达开源4K图像生成模型Sana,可在16G显存电脑部署,支持ComfyUI和LoRA训练 (0篇回复)
- 20年磨一剑!微软发布全球首个拓扑量子芯片,一夜改变半导体 (0篇回复)
- 六大诀窍帮你释放扩散模型的创造力 (0篇回复)
- 新突破!中国电信复现DeepSeek R1,探索行业大模型建设新路径 (0篇回复)
- OpenAI的GPT-5即将问世:目前我们所知道的一切 (0篇回复)
- 量子计算里程碑!微软单芯片可百万量子比特,Nature研究爆火 (0篇回复)
- 复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述 (0篇回复)
- 简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理 (0篇回复)