AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。

来自主题: AI技术研报
4957 点击    2025-05-13 08:54
OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手

OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手

OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手

OpenAI,如今已经命悬一线了?如果未能成功转型为公共利益公司,它或将遭受重大打击,从此一蹶不振。微软也是急得很,虽然和OpenAI快闹崩了,但在谈判数十亿美元合作条款时,还是硬着头皮忍痛割肉股份,只为续命2030年后的AI入场券。

来自主题: AI资讯
7839 点击    2025-05-13 08:44
全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

如何将一句简单的文字描述变成物理稳定的乐高模型?LegoGPT通过物理感知技术,确保98.8%的设计稳如磐石。

来自主题: AI资讯
7844 点击    2025-05-12 16:12
又快又好!豆包文生图3.0重构企业视觉内容生产线

又快又好!豆包文生图3.0重构企业视觉内容生产线

又快又好!豆包文生图3.0重构企业视觉内容生产线

最近我们AI爱好者的群里玩的全都是豆包和即梦生成的海报图片,大家评价做图片和海报效果真的很不错,豆包进步了,即梦也进步了。真的进步太大了!下面是我的朋友们尝试过的一些趣味玩法:

来自主题: AI资讯
8334 点击    2025-05-12 14:23
全网惊了!陶哲轩带AI下场,33分钟「盲证」数学

全网惊了!陶哲轩带AI下场,33分钟「盲证」数学

全网惊了!陶哲轩带AI下场,33分钟「盲证」数学

菲尔兹奖得主陶哲轩再放大招,仅数天时间,开源的概念验证工具借助Copilot迭代至2.0版本。而在最新视频中,他甚至用AI在33分钟「盲做」形式化一页证明,效率惊人。

来自主题: AI技术研报
9155 点击    2025-05-12 12:24
SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而,我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的。例如,在拍摄赛车追逐的场景时,镜头通常跟随赛车运动,并通过扣人心弦的超车时刻来展示赛事的白热化。

来自主题: AI技术研报
9076 点击    2025-05-12 10:31
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

字节Seed首次开源代码模型!Seed-Coder,8B规模,超越Qwen3,拿下多个SOTA。它证明“只需极少人工参与,LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力。

来自主题: AI资讯
7871 点击    2025-05-11 15:18
超300家医院接入DeepSeek!清华专家顶刊文章:步子走得太快!

超300家医院接入DeepSeek!清华专家顶刊文章:步子走得太快!

超300家医院接入DeepSeek!清华专家顶刊文章:步子走得太快!

今年3月,DeepSeek迅速席卷全国医疗机构。据不完全统计,短短一个月内全国已经有 超300家 医院完成DeepSeek的本地部署,遍布北京、上海、安徽、四川、广东、河北、湖南、江苏等二十多个省市和自治区。

来自主题: AI资讯
8245 点击    2025-05-11 15:09
一个「always」站在大模型技术C位的传奇男子

一个「always」站在大模型技术C位的传奇男子

一个「always」站在大模型技术C位的传奇男子

怎么老是你???(How old are you)尤其是最近Meta FAIR研究员朱泽园分享了他们《Physics of Language Models》项目的系列新进展后,有网友发现,其中提到的3-token因果卷积相关内容,沙哥等又早在三年前就有相关研究。这是最近网友不断对着Transformer八子之一的Noam Shazeer(为方便阅读,我们称他为沙哥)发出的灵魂疑问。

来自主题: AI资讯
9010 点击    2025-05-11 15:02