AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业

独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业

独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业

。过去的行业共识是:端侧只能跑小模型,性能与体验必须妥协;真正的能力仍得依赖云端最强模型。万格智元要打破的,正是这条旧认知。公司正在打造的cPilot端侧算力引擎,选择了一条更难、却更接近未来的路径:通过自研的非GPU推理引擎,让300亿、500亿等超大模型在性能有限制的消费硬件上高效推理

来自主题: AI资讯
9457 点击    2025-12-26 15:49
英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

英伟达在开源模型上玩的很激进: “最高效的开放模型家族”Nemotron 3,混合Mamba-Transformer MoE架构、NVFP4低精度训练全用上。而且开放得很彻底:

来自主题: AI资讯
7033 点击    2025-12-26 15:48
智谱首席科学家唐杰:领域大模型是伪命题!AI模型应用的第一性不应是创造新App,在线学习和自我评估是新Scaling范式

智谱首席科学家唐杰:领域大模型是伪命题!AI模型应用的第一性不应是创造新App,在线学习和自我评估是新Scaling范式

智谱首席科学家唐杰:领域大模型是伪命题!AI模型应用的第一性不应是创造新App,在线学习和自我评估是新Scaling范式

最近,清华大学教授、智谱AI首席科学家唐杰发了一条长微博,总结了自己2025年对大模型进展的感悟。从预训练到中后训练、长尾场景的对齐能力,再到Agent、多模态和具身智能的发展,其中有不少亮点。

来自主题: AI资讯
8343 点击    2025-12-26 15:42
别只盯着DeepSeek:上海推出“能调三维地图的AI”,政务大模型有了新答案

别只盯着DeepSeek:上海推出“能调三维地图的AI”,政务大模型有了新答案

别只盯着DeepSeek:上海推出“能调三维地图的AI”,政务大模型有了新答案

近日,由上海市规划资源局与商汤大装置联合打造的全国规划资源领域首个基础大模型“云宇星空大模型”(专业版)上线。这并非一个简单的对话机器人,而是一个6000亿参数、深度嵌入规资全业务系统的行业大模型:它能调取地图、做统计,能理解规划图纸、会写报告,覆盖从知识检索、空间分析到决策支撑的完整工作闭环。

来自主题: AI资讯
8002 点击    2025-12-25 22:51
超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

刚刚,由SciMaster团队推出的AI机器学习专家ML-Master 2.0,基于国产开源大模型DeepSeek,在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流,刷新全球SOTA,再次登顶!目前该功能已在SciMaster线上平台开放waiting list,欢迎申请体验。

来自主题: AI技术研报
6233 点击    2025-12-25 14:22
游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

英伟达让AI仅靠「看直播」就学会了通用游戏操作。虚拟世界已成为物理智能的黑客帝国,看4万小时直播学会几乎所有游戏!

来自主题: AI技术研报
6317 点击    2025-12-25 14:17
硅谷青睐的中国模型更新了!一觉醒来,直接套壳

硅谷青睐的中国模型更新了!一觉醒来,直接套壳

硅谷青睐的中国模型更新了!一觉醒来,直接套壳

智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型GLM-4.7并开源!

来自主题: AI技术研报
5756 点击    2025-12-25 10:21
北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。

来自主题: AI技术研报
6554 点击    2025-12-25 09:46