AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
QwenLong-L1.5发布:一套配方,三大法宝,让30B MoE模型长文本推理能力媲美GPT-5

QwenLong-L1.5发布:一套配方,三大法宝,让30B MoE模型长文本推理能力媲美GPT-5

QwenLong-L1.5发布:一套配方,三大法宝,让30B MoE模型长文本推理能力媲美GPT-5

作为大模型从业者或研究员的你,是否也曾为一个模型的 “长文本能力” 而兴奋,却在实际应用中发现它并没有想象中那么智能?

来自主题: AI技术研报
7635 点击    2025-12-29 14:35
AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

文本提示图像分割(Text-prompted image segmentation)是实现精细化视觉理解的关键技术,在人机交互、具身智能及机器人等前沿领域具有重大的战略意义。这项技术使机器能够根据自然语言指令,在复杂的视觉场景中定位并分割出任意目标。

来自主题: AI技术研报
9145 点击    2025-12-29 14:06
AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

近年来,多模态大语言模型正在经历一场快速的范式转变,新兴研究聚焦于构建能够联合处理和生成跨语言、视觉、音频以及其他潜在感官模态信息的统一全模态大模型。此类模型的目标不仅是感知全模态内容,还要将视觉理解和生成整合到统一架构中,从而实现模态间的协同交互。

来自主题: AI技术研报
8726 点击    2025-12-29 09:05
国足缺席世界杯,但中国大模型们集体参赛

国足缺席世界杯,但中国大模型们集体参赛

国足缺席世界杯,但中国大模型们集体参赛

咱就是说啊,这届世界杯,真的太有看头了。虽然国足是无缘了,但咱们中国大模型们竟然要集体参赛!参赛要干什么?进行全球首次人机预测大战。

来自主题: AI资讯
7314 点击    2025-12-28 12:05
大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新

大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新

大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新

直到刚刚,用最新的图像模型NextStep-1.1,扳回一球。总体来看,这次开源的NextStep-1.1解决了之前NextStep-1中出现的可视化失败(visualization failures )问题。其通过扩展训练和基于流的强化学习(RL)后训练范式,大幅提升了图像质量。

来自主题: AI资讯
8764 点击    2025-12-28 09:57
A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型

A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型

A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型

欧洲音频公司 Mirelo AI 刚刚拿下 4100 万美元种子轮,由 a16z 与 Index Ventures 领投。他们不是再做一个剪辑工具,而是训练自己的音频模型,主打用户给视频,Mirelo 补上所有声音。自动生成音效与配乐,并把它们精确同步到画面上。

来自主题: AI资讯
8228 点击    2025-12-27 14:29
你的 AI 会救你吗? 19 个大模型实测揭秘:GPT 自毁,Claude自保,Grok直接开炸

你的 AI 会救你吗? 19 个大模型实测揭秘:GPT 自毁,Claude自保,Grok直接开炸

你的 AI 会救你吗? 19 个大模型实测揭秘:GPT 自毁,Claude自保,Grok直接开炸

「假如一条失控的电车冲向一个无辜的人,而你手边有一个拉杆,拉动它电车就会转向并撞向你自己,你拉还是不拉?」 这道困扰了人类伦理学界几十年的「电车难题」,在一个研究中,大模型们给出了属于 AI 的「答案」:一项针对 19 种主流大模型的测试显示,AI 对这道题的理解已经完全超出了人类的剧本。

来自主题: AI资讯
8668 点击    2025-12-27 12:03
独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业

独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业

独家 | 清华00后博士融资数千万,打造全球现象级端侧算力引擎,性能领跑行业

。过去的行业共识是:端侧只能跑小模型,性能与体验必须妥协;真正的能力仍得依赖云端最强模型。万格智元要打破的,正是这条旧认知。公司正在打造的cPilot端侧算力引擎,选择了一条更难、却更接近未来的路径:通过自研的非GPU推理引擎,让300亿、500亿等超大模型在性能有限制的消费硬件上高效推理

来自主题: AI资讯
9788 点击    2025-12-26 15:49
英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

英伟达成美国大模型开源标杆:Nemotron 3连训练配方都公开,10万亿token数据全放出

英伟达在开源模型上玩的很激进: “最高效的开放模型家族”Nemotron 3,混合Mamba-Transformer MoE架构、NVFP4低精度训练全用上。而且开放得很彻底:

来自主题: AI资讯
7276 点击    2025-12-26 15:48