AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
夸克、浙大开源OmniAvatar,一张图+一段音,就能生成长视频

夸克、浙大开源OmniAvatar,一张图+一段音,就能生成长视频

夸克、浙大开源OmniAvatar,一张图+一段音,就能生成长视频

近期,夸克技术团队和浙江大学联合开源了OmniAvatar,这是一个创新的音频驱动全身视频生成模型,只需要输入一张图片和一段音频,OmniAvatar即可生成相应视频,且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外,还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。

来自主题: AI资讯
6261 点击    2025-07-25 17:07
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲

斯坦福大模型推理课免费了,谷歌推理团队创始人主讲

斯坦福大模型推理课免费了,谷歌推理团队创始人主讲

如何理解大模型推理能力?现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。 就是那位和清华姚班马腾宇等人证明了只要思维链足够长,Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法,在斯坦福大学CS25上讲了一堂“LLM推理”课。

来自主题: AI资讯
5556 点击    2025-07-25 16:57
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索,让智能体能够从其他任务的成功经验中学习,显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报
6626 点击    2025-07-25 16:50
Elad Gil 复盘 AI 投资:GPT Ladder,AI Agent,AI 领域将迎来大规模整合并购

Elad Gil 复盘 AI 投资:GPT Ladder,AI Agent,AI 领域将迎来大规模整合并购

Elad Gil 复盘 AI 投资:GPT Ladder,AI Agent,AI 领域将迎来大规模整合并购

硅谷 AI 投资人 Elad Gil 昨天发布了自己对 AI 领域投资的总结回顾与预测。在他看来,过去四年 AI 经历了从 “技术迷雾”到“商业马拉松” 的变化:随着模型能力的不断提升,过去 12 个月里一系列 AI 应用落地的细分场景在得到验证,头部公司浮现,一定程度上,未来 1-2 年的市场格局初定,AI 应用层正进入收敛周期:

来自主题: AI资讯
5776 点击    2025-07-25 12:27
仅凭「Prompt」,Gemini拿下IMO2025金牌 | 附提示词

仅凭「Prompt」,Gemini拿下IMO2025金牌 | 附提示词

仅凭「Prompt」,Gemini拿下IMO2025金牌 | 附提示词

就在昨天,来自UCLA的两位研究者黄溢辰和杨林做了一件让整个AI圈都震惊的事。他们用Google的Gemini 2.5 Pro模型,在2025年国际数学奥林匹克竞赛中拿下了金牌水平的成绩,6道题解对了5道。这可不是什么花架子,IMO被公认为是测试AI推理能力的终极试金石,因为它需要的不仅仅是计算,更需要创造性思维和严密的逻辑推理。

来自主题: AI资讯
5861 点击    2025-07-25 10:20
老板,AI不是“裁员工具”

老板,AI不是“裁员工具”

老板,AI不是“裁员工具”

AI引入企业管理并非单纯效率工具,而是引发战略定位、组织流程与数据底层的系统性变革。忽视准备将导致混乱而非增效。实现“AI原生”需平衡效率与风险,重构人机协作规则。企业需清晰战略、完善数据基建,并通过文化建设降低员工抵触,方能将AI潜力转化为核心竞争优势,避免误用为裁员工具。

来自主题: AI资讯
5836 点击    2025-07-25 10:13
亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

如何让机器人从看懂世界,到理解意图,再到做出动作,是具身智能领域当下最受关注的技术重点。 但真机数据的匮乏,正在使对应的视觉-语言-动作(VLA)模型面临发展瓶颈。

来自主题: AI资讯
5170 点击    2025-07-25 10:07
提速79%!上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%!上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%!上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报
7399 点击    2025-07-25 09:51
GPT-5终极版爆8月初上线,奥特曼亲证AI秒杀人类时刻降临

GPT-5终极版爆8月初上线,奥特曼亲证AI秒杀人类时刻降临

GPT-5终极版爆8月初上线,奥特曼亲证AI秒杀人类时刻降临

2025年8月,OpenAI将正式发布下一代大模型GPT-5!这一备受瞩目的升级版AI由CEO奥特曼亲自预热,集成了o系列推理能力,定位为通往AGI(通用人工智能)的关键一步。

来自主题: AI资讯
7218 点击    2025-07-25 09:11