AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

文本领域的大模型满分选手,换成语音就集体挂科?大模型引以为傲的多轮对话逻辑,在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge,直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示,强如Gemini 3 Pro在真实场景下的通过率也仅过半数,而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报
9930 点击    2026-01-06 16:46
8亿部Gemini设备在路上!三星AI“全家桶”来了:冰箱AI管吃喝,电视AI教你做饭

8亿部Gemini设备在路上!三星AI“全家桶”来了:冰箱AI管吃喝,电视AI教你做饭

8亿部Gemini设备在路上!三星AI“全家桶”来了:冰箱AI管吃喝,电视AI教你做饭

今日,三星在CES 2026“First Look”活动上发布了AI家居“全家桶”,三星将其比喻为“AI生活伴侣”,分为娱乐伴侣、家庭伴侣、健康伴侣三部分。娱乐伴侣方面,三星发布了130英寸Micro RGB电视、电视AI技术Vision AI Companion(VAC)、wifi音响Music Studio 5和Music Studio 7

来自主题: AI资讯
10672 点击    2026-01-05 16:48
对话 Kuse: 没融资 3 个月 1000 万美金 ARR,用 NotebookLM 的方法重做 Notion

对话 Kuse: 没融资 3 个月 1000 万美金 ARR,用 NotebookLM 的方法重做 Notion

对话 Kuse: 没融资 3 个月 1000 万美金 ARR,用 NotebookLM 的方法重做 Notion

今年我比较喜欢的 AI 产品中,一个是 Google 旗下的 NotebookLM,我觉得它的价值还没有真正体现出来。还有一个是国内团队做的 Kuse,其团队在没融资的情况下,3 个月做到了差不多 1000 万美金的 ARR。

来自主题: AI资讯
7686 点击    2026-01-05 15:06
语义分割别无脑用Argmax!港中文新算法:三行代码,推理速度提升10倍

语义分割别无脑用Argmax!港中文新算法:三行代码,推理速度提升10倍

语义分割别无脑用Argmax!港中文新算法:三行代码,推理速度提升10倍

香港中文大学提出了一个全新的算法框架RankSEG,用于提升语义分割任务的性能。传统方法在预测阶段使用threshold或argmax生成掩码,但这种方法并非最优。RankSEG无需重新训练模型,仅需在推理阶段增加三行代码,即可显著提高Dice或IoU等分割指标。

来自主题: AI技术研报
9535 点击    2026-01-05 14:27
过去一年最被低估的 AI 产品,这次更新后迎来了最佳上车时机

过去一年最被低估的 AI 产品,这次更新后迎来了最佳上车时机

过去一年最被低估的 AI 产品,这次更新后迎来了最佳上车时机

Notion 创始人 Ivan Zhao 在最新的博文中提到,我们正处于 AI 的「水车阶段」,还在试图把新时代的引擎,硬塞进旧时代的马车里。 原文🔗 https://www.notion.com/b

来自主题: AI资讯
10240 点击    2026-01-05 11:22
拒绝Meta收购、本月量产GPU,这家韩国公司正猛攻英伟达护城河

拒绝Meta收购、本月量产GPU,这家韩国公司正猛攻英伟达护城河

拒绝Meta收购、本月量产GPU,这家韩国公司正猛攻英伟达护城河

十年前,三星工程师 June Paik 因跟腱断裂卧床,却意外在床上洞察到了 AI 浪潮。十年后,他创立的 FuriosaAI 拒绝了 Meta 的收购,带着名为「叛逆者(RNGD)」的芯片,誓要在英伟达主宰的算力帝国中撕开一道缺口。

来自主题: AI资讯
9869 点击    2026-01-05 10:18
科研人福音!一键生成PPT和科研绘图,北大开源Paper2Any,全流程可编辑

科研人福音!一键生成PPT和科研绘图,北大开源Paper2Any,全流程可编辑

科研人福音!一键生成PPT和科研绘图,北大开源Paper2Any,全流程可编辑

你是否经历过这样的至暗时刻: 明明实验数据已经跑通,核心逻辑也已梳理完毕,却在面对空白的 PPT 页面时陷入停滞; 明明脑海里有清晰的系统架构,却要在 Visio 或 Illustrator 里跟一根歪歪扭扭的线条较劲半小时; 好不容易用 AI 生成了一张精美的流程图,却发现上面的文字是乱码,或者为了改一个配色不得不重新生成几十次……

来自主题: AI技术研报
10121 点击    2026-01-05 09:52
信息论证明,小模型跑在本地才是Agent的终极解法|斯坦福重磅

信息论证明,小模型跑在本地才是Agent的终极解法|斯坦福重磅

信息论证明,小模型跑在本地才是Agent的终极解法|斯坦福重磅

在近一年里,Agentic System(代理系统/智能体系统)正变得无处不在。从Open AI的Deep Research到Claude Code,我们看到越来越多的系统不再依赖单一模型,而是通过多模型协作来完成复杂的长窗口任务。

来自主题: AI技术研报
9151 点击    2026-01-04 10:20
比 JSON 省一半钱的格式,为什么大厂不敢用?

比 JSON 省一半钱的格式,为什么大厂不敢用?

比 JSON 省一半钱的格式,为什么大厂不敢用?

最近在研究 RAG 系统优化的时候,发现了一个有意思的格式叫 TOON。全称是 Token-Oriented Object Notation,翻译过来就是面向 Token 的对象表示法。

来自主题: AI技术研报
9248 点击    2026-01-03 14:02
微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

近日,腾讯微信 AI 团队提出了 WeDLM(WeChat Diffusion Language Model),这是首个在工业级推理引擎(vLLM)优化条件下,推理速度超越同等 AR 模型的扩散语言模型。

来自主题: AI技术研报
9938 点击    2026-01-03 13:56