AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而,它们在长视频理解和检索等长上下文任务中仍表现不佳。

来自主题: AI技术研报
5951 点击    2025-06-30 10:24
AI一眼认出95万物种,还能分辨雄雌老幼,2亿生物图像炼成“生命视觉”大模型

AI一眼认出95万物种,还能分辨雄雌老幼,2亿生物图像炼成“生命视觉”大模型

AI一眼认出95万物种,还能分辨雄雌老幼,2亿生物图像炼成“生命视觉”大模型

让AI看懂95万物种,并自己悟出生态关系与个体差异!俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。

来自主题: AI技术研报
5432 点击    2025-06-29 16:59
AI时代不再只有独角兽了,这家创业Studio想用AI赋能普通人,致力于AI超级个体一人公司,每年孵化出10万个“驴角兽”

AI时代不再只有独角兽了,这家创业Studio想用AI赋能普通人,致力于AI超级个体一人公司,每年孵化出10万个“驴角兽”

AI时代不再只有独角兽了,这家创业Studio想用AI赋能普通人,致力于AI超级个体一人公司,每年孵化出10万个“驴角兽”

你有没有想过,创业这件事可能彻底变了?不再是硅谷精英的专利,不再需要巨额资金和深厚技术背景,甚至不再需要风险投资的支持。AI 正在彻底重新定义创业的门槛和玩法。

来自主题: AI资讯
5661 点击    2025-06-29 13:01
深度分析:为什么a16z敢1500万美金押注一个"作弊工具"?Attention is All You Need的AI时代!

深度分析:为什么a16z敢1500万美金押注一个"作弊工具"?Attention is All You Need的AI时代!

深度分析:为什么a16z敢1500万美金押注一个"作弊工具"?Attention is All You Need的AI时代!

你有没有想过,一个因为开发作弊工具被哥伦比亚大学开除的 21 岁学生,竟然能在短短几个月内获得 a16z 领投的 1500 万美元融资?

来自主题: AI资讯
7040 点击    2025-06-29 11:31
刚刚,OpenAI四位华人学者集体被挖,还是Meta重金出手

刚刚,OpenAI四位华人学者集体被挖,还是Meta重金出手

刚刚,OpenAI四位华人学者集体被挖,还是Meta重金出手

再一次,Meta「搜刮」了 OpenAI 的成员。The Information 发布了文章,谈到 Meta 再聘四名 OpenAI 研究人员。这离上一次 OpenAI 苏黎世办公室被 Meta 一锅端只隔了短短几天时间。

来自主题: AI资讯
7736 点击    2025-06-29 10:46
无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

在高质量视频生成任务中,扩散模型(Diffusion Models)已经成为主流。然而,随着视频长度和分辨率的提升,Diffusion Transformer(DiT)模型中的注意力机制计算量急剧增加,成为推理效率的最大瓶颈。

来自主题: AI技术研报
5896 点击    2025-06-28 16:09
这个扩散LLM太快了!没有「请稍后」,实测倍速于Gemini 2.5 Flash

这个扩散LLM太快了!没有「请稍后」,实测倍速于Gemini 2.5 Flash

这个扩散LLM太快了!没有「请稍后」,实测倍速于Gemini 2.5 Flash

只需一眨眼的功夫,Mercury 就把任务完成了。「我们非常高兴地推出 Mercury,这是首款专为聊天应用量身定制的商业级扩散 LLM!Mercury 速度超快,效率超高,能够为对话带来实时响应,就像 Mercury Coder 为代码带来的体验一样。」

来自主题: AI技术研报
5442 点击    2025-06-28 13:01
ICML 2025 | 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

ICML 2025 | 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

ICML 2025 | 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

但在当今的深度 Transformer LLMs 中仍有其局限性,限制了信息在跨层间的高效传递。 彩云科技与北京邮电大学近期联合提出了一个简单有效的残差连接替代:多路动态稠密连接(MUltiway Dynamic Dense (MUDD) connection),大幅度提高了 Transformer 跨层信息传递的效率。

来自主题: AI技术研报
5637 点击    2025-06-28 11:33
阿里国际站张阔:如何打响这场“AI轴心战”

阿里国际站张阔:如何打响这场“AI轴心战”

阿里国际站张阔:如何打响这场“AI轴心战”

阿里国际站总裁张阔强调AI转型需全员设定目标,Accio AI搜索工具半年用户超百万,询盘量月环比增10倍。张阔考察中美贸易摩擦后发现中国供应链不可或缺,外贸订单强劲增长。AI从卖家侧提升效率后转向买家搜索,推动业务全面AI化,618外贸订单增42%。

来自主题: AI资讯
7772 点击    2025-06-28 10:49
DeepSeek-R2为什么还没发?

DeepSeek-R2为什么还没发?

DeepSeek-R2为什么还没发?

全网翘首以盼的DeepSeek-R2,再次被曝推迟!据The Information报道,由于DeepSeek CEO梁文锋始终对R2的表现不满意,因此R2迟迟未能发布。此外,他们还援引两位国内知情人士的消息称,R2研发进程缓慢可能是由于缺少英伟达H20芯片。

来自主题: AI资讯
8076 点击    2025-06-27 16:46