AI资讯新闻榜单内容搜索-8

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 8
DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星

DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星

DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星

黑科技来了!开源LLM微调神器Unsloth近期更新,将GRPO训练的内存使用减少了80%!只需7GB VRAM,本地就能体验AI「啊哈时刻」。

来自主题: AI资讯
9750 点击    2025-02-09 21:29
昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

2月8日,昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeek R1 + 联网搜索”功能。这一全新升级,不仅解决了用户长期以来关注的DeepSeek联网功能无法使用的问题,还优化了R1版本偶尔崩溃的困扰,为用户带来更加稳定、高效、智能的AI体验。

来自主题: AI资讯
8791 点击    2025-02-08 17:20
朱啸虎态度180度大反转,大喊“我肯定会投deepseek“!

朱啸虎态度180度大反转,大喊“我肯定会投deepseek“!

朱啸虎态度180度大反转,大喊“我肯定会投deepseek“!

“我肯定会投啊!我肯定会投!——这个价格已经不太重要了,关键是参与在这里面。”1年前,2024年初,在我们关于《朱啸虎讲了一个中国现实主义AIGC故事》的报道中,朱啸虎的观点淋漓尽致地展现了一个现实版中国AI故事。他用“我们一看就知道,这个肯定没戏”,“我们一开始就说了,我就不看好大模型”,“ 我都不愿意去聊,你知道吗?这没有意义”,表态绝不会投资6家中国大模型创业公司中的任何一家。

来自主题: AI资讯
9657 点击    2025-02-08 14:38
谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

谷歌DeepMind最新数学AI,一举解决了2000-2024年IMO竞赛中84%的几何问题。AlphaGeometry2论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。

来自主题: AI技术研报
8033 点击    2025-02-08 13:55
浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。然而,这一核心能力目前缺乏完善的评测基准。为解决上述问题,浙大通义联合发布WorfBench——一个涵盖多场景和复杂图结构工作流的统一基准,以及WorfEval——一套系统性评估协议,通过子序列和子图匹配算法精准量化大模型生成工作流的能力。

来自主题: AI技术研报
8475 点击    2025-02-08 13:19
DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。

来自主题: AI技术研报
9678 点击    2025-02-07 17:54
“AI三杰”都是广东人,为何都没在广东发展?

“AI三杰”都是广东人,为何都没在广东发展?

“AI三杰”都是广东人,为何都没在广东发展?

最近在网上看多一个说法:中国“AI三杰”都是广东人,但都没有在广东创业和发展。‍‍‍‍ 网友口中的“AI三杰”指的是DeepSeek的创始人梁文锋、Kimi创始人‍‍‍杨植麟、人工智能领域的杰出科学家何恺明.公开资料显示,这三位蜚声全球的AI大牛都很年轻,其中两个是80后、一个是90后,一个在杭州上大学和创业,一个在北京上大学和创业,另一个在美国MIT任教。

来自主题: AI资讯
7520 点击    2025-02-06 12:58
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报
7283 点击    2025-02-05 16:54
成就DeepSeek奇迹的芯片,敲响英伟达警钟

成就DeepSeek奇迹的芯片,敲响英伟达警钟

成就DeepSeek奇迹的芯片,敲响英伟达警钟

过去两周,DeepSeek已经成为了全球的热点。尤其是在西方世界,这个来自于中国的生成式人工智能系统引发了广泛讨论。

来自主题: AI资讯
7170 点击    2025-02-05 11:54
“禁”还是“用”?高校AI使用现状调查

“禁”还是“用”?高校AI使用现状调查

“禁”还是“用”?高校AI使用现状调查

据麦可思数据,国内高校师生几乎全部都曾在学习和工作中使用生成式AI,从未使用过生成式AI的高校师生比例仅为1%。这表明,在高校中,生成式AI的应用已实现普及。若将“每天多次使用”和“每周多次使用”视作频繁使用,两者累计计算,近六成高校师生频繁使用生成式AI。其中18%的高校师生每天多次使用,已成生成式AI“重度用户”。

来自主题: AI资讯
8722 点击    2025-02-05 11:53