AI资讯新闻榜单内容搜索-不

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 不
跟这个音乐Agent聊会儿,分分钟生成抖音神曲 | 对话音乐创作Agent产品Tunee

跟这个音乐Agent聊会儿,分分钟生成抖音神曲 | 对话音乐创作Agent产品Tunee

跟这个音乐Agent聊会儿,分分钟生成抖音神曲 | 对话音乐创作Agent产品Tunee

“人人都能玩点音乐”,Tunee真的做到了。这也说明,AI创作领域产品真的从“工具产品”迈向“智能体交互产品”了。在AI创作领域,玩家可不少。诸如星流、Manus、海螺AI、美图秀秀等成熟玩家,以及近期爆火的Liblib AI纷纷入场卷起Agent能力,产品功能或围绕平台生态、或深入垂直场景不断迭代优化细节。

来自主题: AI资讯
9066 点击    2025-11-02 10:22
少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

直观经验却告诉我们,只要把同一物体的 “对应部分” 对齐,形状就会变得清晰。基于这一朴素而有效的直觉,作者提出SERES(Semantic-Aware Reconstruction from Sparse Views),在不改动主干框架的前提下,把跨视角的语义一致性变成一种训练期先验注入到模型里,用低成本的方法去解决高价值的歧义问题,让少量视角也能得到清晰而完整的几何。

来自主题: AI技术研报
7615 点击    2025-11-02 10:03
AI 画作卖出 100 多万,这个世界没有疯

AI 画作卖出 100 多万,这个世界没有疯

AI 画作卖出 100 多万,这个世界没有疯

不知道还有多少人记得,三年前有一幅名为《太空歌剧院》的作品:恢弘的大厅里,名伶身着华服,站在舞台上,庄重又华丽。这幅作品由游戏设计师杰森·艾伦(Jason Allen)借助 Midjourney 生成,并经由 Photoshop 润色完成。美国科罗拉多州博览会的艺术比赛中夺得数字艺术类别的头奖——一经公示,质疑声四起,许多人指责艾伦「拿 AI 的成果充当自己的作品」去参赛。

来自主题: AI资讯
9220 点击    2025-11-01 13:11
最新外国「自研」大模型,都是套壳国产?

最新外国「自研」大模型,都是套壳国产?

最新外国「自研」大模型,都是套壳国产?

绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文?据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝滑。

来自主题: AI资讯
9264 点击    2025-11-01 13:08
人在美国,待过三家AI Lab,全凉了!

人在美国,待过三家AI Lab,全凉了!

人在美国,待过三家AI Lab,全凉了!

科技行业全球10万大裁员,连10年老将田渊栋都被Meta裁掉了!昨天,南洋理工大学的副教授Boyang Li吊足了大家的胃口:Meta FAIR最近的事件很抓马,但工业研究为什么这么难?我想知道大家愿不愿意听一下我的观点。

来自主题: AI资讯
9005 点击    2025-11-01 09:40
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

最新最强的开源原生多模态世界模型—— 北京智源人工智能研究院(BAAI)的悟界·Emu3.5来炸场了。 图、文、视频任务一网打尽,不仅能画图改图,还能生成图文教程,视频任务更是增加了物理真实性。

来自主题: AI资讯
8348 点击    2025-11-01 09:36
内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本

在NeurIPS 2025论文中,来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST(Vision-centric Token Compression in LLM),为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是,这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报
9681 点击    2025-11-01 09:23
Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

月之暗面最新发布的开源Kimi Linear架构,用一种全新的注意力机制,在相同训练条件下首次超越了全注意力模型。在长上下文任务中,它不仅减少了75%的KV缓存需求,还实现了高达6倍的推理加速。

来自主题: AI技术研报
10556 点击    2025-10-31 15:46
让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

Voice Agent 赛道正在爆发,但它迫切需要一个能让对话真正「流动起来」的底层引擎,一个能撑起下一代交互体验的 TTS 模型。竞争的焦点,已经从 LLM 的「大脑」,延伸到了 TTS 的「嗓音」。谁掌握嗓音,谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型,似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯
9415 点击    2025-10-31 15:35
颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞

颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞

颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞

刚刚,OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。目前,Aardvark还处于beta测试阶段。OpenAI称,Aardvark开创了「防御者优先」的新范式:作为自主安全研究智能体,随代码不断演化,为团队提供持续保护(continuous protection)。

来自主题: AI资讯
9467 点击    2025-10-31 15:34