AI资讯新闻榜单内容搜索-sota

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: sota
VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

现有的视频编辑模型往往面临「鱼与熊掌不可兼得」的困境:专家模型精度高但依赖 Mask,通用模型虽免 Mask 但定位不准。来自悉尼科技大学和浙江大学的研究团队提出了一种全新的视频编辑框架 VideoCoF,受 LLM「思维链」启发,通过「看 - 推理 - 编辑」的流程,仅需 50k 训练数据,就在多项任务上取得了 SOTA 效果,并完美支持长视频外推!

来自主题: AI技术研报
7929 点击    2025-12-23 14:53
智谱IPO敲钟前,连夜把开源编程大模型SOTA了

智谱IPO敲钟前,连夜把开源编程大模型SOTA了

智谱IPO敲钟前,连夜把开源编程大模型SOTA了

2025倒计时,新SOTA模型涌现没有放缓迹象。一夜之间,编程SOTA模型易主,而且上线即开源,依然来自中国大模型公司——智谱AI,GLM-4.7。

来自主题: AI资讯
8219 点击    2025-12-23 10:38
复杂空间推理新SOTA,性能提升55%!中山大学新作SpatialDreamer

复杂空间推理新SOTA,性能提升55%!中山大学新作SpatialDreamer

复杂空间推理新SOTA,性能提升55%!中山大学新作SpatialDreamer

中山大学等机构推出SpatialDreamer,通过主动心理想象和空间推理,显著提升了复杂空间任务的性能。模拟人类主动探索、想象和推理的过程,解决了现有模型在视角变换等任务中的局限,为人工智能的空间智能发展开辟了新路径。

来自主题: AI技术研报
10200 点击    2025-12-23 09:27
对标GPT-4o和香蕉!浙大开源ContextGen:布局身份协同新SOTA

对标GPT-4o和香蕉!浙大开源ContextGen:布局身份协同新SOTA

对标GPT-4o和香蕉!浙大开源ContextGen:布局身份协同新SOTA

浙江大学ReLER团队开源ContextGen框架,攻克多实例图像生成中布局与身份协同控制难题。基于Diffusion Transformer架构,通过双重注意力机制,实现布局精准锚定与身份高保真隔离,在基准测试中超越开源SOTA模型,对标GPT-4o等闭源系统,为定制化AI图像生成带来新突破。

来自主题: AI技术研报
8922 点击    2025-12-22 16:08
谷歌版两门「小钢炮」开源!2.7亿参数干翻SOTA

谷歌版两门「小钢炮」开源!2.7亿参数干翻SOTA

谷歌版两门「小钢炮」开源!2.7亿参数干翻SOTA

谷歌这波像开了「大小号双修」:前脚用Gemini把大模型战场搅翻,后脚甩出两位端侧「师兄弟」:一个走复古硬核架构回归,一个专职教AI「别光会聊,赶紧去干活」。手机里的智能体中枢,要开始卷起来了。

来自主题: AI资讯
9196 点击    2025-12-19 14:00
6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind成员以元系统重塑大模型调用方式,该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首,而成本仅为此前最优方法的一半。

来自主题: AI技术研报
7939 点击    2025-12-15 11:31
GPT-5.2已上线24小时:差评如潮!

GPT-5.2已上线24小时:差评如潮!

GPT-5.2已上线24小时:差评如潮!

网友吐槽GPT-5.2「不通人性」。 X 上充斥着对 GPT-5.2 的恶评。昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业知识工作上最强大的模型系列」,在众多基准测试中,GPT-5.2 也都刷新了最新的 SOTA 水平。

来自主题: AI资讯
8436 点击    2025-12-13 15:50
告别「盲目自信」,CCD:扩散语言模型推理新SOTA

告别「盲目自信」,CCD:扩散语言模型推理新SOTA

告别「盲目自信」,CCD:扩散语言模型推理新SOTA

扩散语言模型(Diffusion Language Models)以其独特的 “全局规划” 与并行解码能力广为人知,成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下,其通常面临

来自主题: AI技术研报
7180 点击    2025-12-13 10:59
谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招:Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交互API(Interactions API)。

来自主题: AI资讯
8984 点击    2025-12-12 08:14
Jina-VLM:可在笔记本上跑的多语言视觉小模型

Jina-VLM:可在笔记本上跑的多语言视觉小模型

Jina-VLM:可在笔记本上跑的多语言视觉小模型

今天我们正式发布 Jina-VLM,这是一款 2.4B 参数量的视觉语言模型(VLM),在同等规模下达到了多语言视觉问答(Multilingual VQA)任务上的 SOTA 基准。Jina-VLM 对硬件需求较低,可在普通消费级显卡或 Macbook 上流畅运行。

来自主题: AI资讯
7968 点击    2025-12-09 14:48