AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

作为首批入选印度“IndiaAI Mission”国家级项目、承担构建印度主权基础大模型任务的公司之一,Sarvam AI 近日发布了名为 Sarvam-M 的模型。这是一个基于 Mistral Small 构建的 240 亿参数、权重开放的混合语言模型。

来自主题: AI资讯
8990 点击    2025-05-27 14:44
3步轻松微调Qwen3,本地电脑就能搞,这个方案可以封神了!【喂饭级教程】

3步轻松微调Qwen3,本地电脑就能搞,这个方案可以封神了!【喂饭级教程】

3步轻松微调Qwen3,本地电脑就能搞,这个方案可以封神了!【喂饭级教程】

大家好,我是袋鼠帝 今天给大家带来的是一个带WebUI,无需代码的超简单的本地大模型微调方案(界面操作),实测微调之后的效果也是非常不错。

来自主题: AI技术研报
7245 点击    2025-05-27 13:38
与Gemini Diffusion共振!首个扩散式「发散思维链」来了

与Gemini Diffusion共振!首个扩散式「发散思维链」来了

与Gemini Diffusion共振!首个扩散式「发散思维链」来了

近年来,思维链在大模型训练和推理中愈发重要。近日,西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。该方法将反向扩散过程中的每一步中间结果都看作大模型的一个「思考」步骤,然后利用基于结果的强化学习去优化整个生成轨迹,最大化模型最终答案的正确率。

来自主题: AI技术研报
5969 点击    2025-05-27 13:21
对话CMU李磊:好的AI学者绝不只搞“纯学术”,大厂AI Lab请集中资源干大事

对话CMU李磊:好的AI学者绝不只搞“纯学术”,大厂AI Lab请集中资源干大事

对话CMU李磊:好的AI学者绝不只搞“纯学术”,大厂AI Lab请集中资源干大事

2002年,在拿下中国高校第一个ACM(计算机领域最顶尖的程序设计大赛)金牌后,上海交大设立了“ACM班”,这个用最高竞赛命名的班级后来人尽皆知,成为中国AI人才的重要阵地。也在那年,李磊成为ACM班第一届的学生。在ACM班他第一次意识到,“原来计算机能帮助解决人类的这么多问题。”

来自主题: AI资讯
7612 点击    2025-05-27 10:17
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型巨无霸体量,让端侧部署望而却步?华为联手中科大提出CBQ新方案,仅用0.1%的训练数据实现7倍压缩率,保留99%精度。

来自主题: AI技术研报
8064 点击    2025-05-26 15:21
刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权

刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权

刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权

全球网友用闲置显卡组团训练大模型。40B大模型、20万亿token,创下了互联网上最大规模的预训练新纪录!去中心化AI的反攻,正式开始。OpenAI等巨头的算力霸权,这次真要凉了?

来自主题: AI资讯
4813 点击    2025-05-26 14:42
她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

2023年,业界还在卷Scaling Law,不断突破参数规模和数据规模时,微软亚洲研究院张丽团队就选择了另一条路径。

来自主题: AI技术研报
5881 点击    2025-05-26 14:35
AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

Vending-Bench模拟环境可以测试大模型管理自动售货机的能力,结果显示,Claude 3.5 Sonnet表现最佳,人类屈居第四!

来自主题: AI技术研报
7794 点击    2025-05-25 16:22