AI资讯新闻榜单内容搜索-深度思考

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 深度思考
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。虽然网络版和 APP 版已经足够好用,但把模型部署到本地,才能真正实现独家定制,让 DeepSeek R1 的深度思考「以你为主,为你所用」。

来自主题: AI技术研报
6277 点击    2025-02-04 19:57
服务崩溃,DeepSeek该给金主一个贴金的机会

服务崩溃,DeepSeek该给金主一个贴金的机会

服务崩溃,DeepSeek该给金主一个贴金的机会

2月1日,就在OpenAI上新o3-mini推理模型同时,DeepSeek深度思考和联网搜索功能被爆暂时停止服务。一天之后,经字母榜实测,目前DeepSeek深度思考服务已恢复正常,但联网搜索仍提示“由于技术原因,暂不可用”。

来自主题: AI资讯
8036 点击    2025-02-04 12:55
最懂医疗的国产推理大模型,果然来自百川智能

最懂医疗的国产推理大模型,果然来自百川智能

最懂医疗的国产推理大模型,果然来自百川智能

就在本周,Kimi 的新模型打开了强化学习 Scaling 新范式,DeepSeek R1 用开源的方式「接班了 OpenAI」,谷歌则把 Gemini 2.0 Flash Thinking 的上下文长度延伸到了 1M。1 月 24 日上午,百川智能重磅发布了国内首个全场景深度思考模型,把这一轮军备竞赛推向了高潮。

来自主题: AI资讯
6024 点击    2025-01-26 12:16
刚刚,豆包1.5模型家族硬核登场!「深度思考」秘笈曝光,多模态冲爆榜单

刚刚,豆包1.5模型家族硬核登场!「深度思考」秘笈曝光,多模态冲爆榜单

刚刚,豆包1.5模型家族硬核登场!「深度思考」秘笈曝光,多模态冲爆榜单

刚刚发布的豆包大模型1.5,不仅多模态能力全面提升,霸榜多个基准;更难得的是,它在训练过程中从未使用过任何其他模型生成的数据,坚决不走蒸馏「捷径」。

来自主题: AI资讯
8551 点击    2025-01-23 13:44
仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o

仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o

仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o

OpenAI o1和o3模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的Scaling Law逐渐受到质疑的今天,基于探索的强化学习有望带来新的Scaling Law。

来自主题: AI资讯
6184 点击    2025-01-06 14:56
不到20人小团队用AI教外国人学中文:市场潜在用户12亿

不到20人小团队用AI教外国人学中文:市场潜在用户12亿

不到20人小团队用AI教外国人学中文:市场潜在用户12亿

近日,在多知OpenTalk第48期“全球起航!‘教育+AI’出海进行时”活动上,嗨你好教育创始人李晓兵分享了一年来的创业历程和关于外国人学中文这一市场的深度思考。

来自主题: AI资讯
7410 点击    2024-12-23 17:30
DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

近期,LLM领域有不少关于系统1和系统2思考的讨论,在Agent方向上这方面的讨论还很少。如何让AI agents既能快速响应用户,又能进行深度思考和规划,一直是一个巨大的挑战。

来自主题: AI技术研报
5378 点击    2024-10-17 10:25