AITNT-让一部分人先用AI实现商业化

SIGGRAPH Asia 2025｜电影级运镜一键克隆！港中文&快手可灵团队发布CamCloneMaster

作为视频创作者，你是否曾梦想复刻《盗梦空间》里颠覆物理的旋转镜头，或是重现《泰坦尼克号》船头经典的追踪运镜？

来自主题: AI技术研报

8448 点击 2025-10-23 11:32

LiblibAI完成1.3亿美元B轮融资，拿下国内最大单笔AI应用投资

10月23日，AI应用公司LiblibAI宣布完成1.3亿美元B轮融资，由红杉中国、CMC资本及一战略投资方联合领投，多家老股东超额增持。高榕创投曾于2023年联合领投LiblibAI天使轮。在AI

来自主题: AI资讯

9604 点击 2025-10-23 11:30

攻克长文档与多模态挑战，Paper2Video实现学术视频的自动化生产

学术展示视频作为科研交流的重要媒介，制作过程仍高度依赖人工，需要反复进行幻灯片设计、逐页录制和后期剪辑，往往需要数小时才能产出几分钟的视频，效率低下且成本高昂，这凸显了推动学术展示视频自动化生成的必要性。

来自主题: AI技术研报

9232 点击 2025-10-23 11:25

比Transformer更强的架构来了？浙大新作Translution，一统卷积和自注意力

近日，范鹤鹤（浙江大学）、杨易（浙江大学）、Mohan Kankanhalli（新加坡国立大学）和吴飞（浙江大学）四位老师提出了一种具有划时代意义的神经网络基础操作——Translution。该研究认为，神经网络对某种类型数据建模的本质是：

来自主题: AI技术研报

9507 点击 2025-10-23 10:59

只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

整个Hugging Face的趋势版里，前4有3个OCR，甚至Qwen3-VL-8B也能干OCR的活，说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里，有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比，也有很多人都在问，能不能再解读一下百度那个OCR模型（也就是PaddleOCR-VL）。

来自主题: AI资讯

10926 点击 2025-10-23 10:58

碾压超算13000倍！1个月内，谷歌量子AI连斩诺奖+Nature封面

当谷歌用量子计算机窥探到经典世界无法触及的物理秘密时，我们离那个能设计新药、创造新材料的「量子霸权」又近了一大步，下一个诺贝尔奖的种子或许已在此刻种下。

来自主题: AI资讯

8842 点击 2025-10-23 10:48

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

太卷了，DeepSeek-OCR刚发布不到一天，智谱就开源了自家的视觉Token方案——Glyph。既然是同台对垒，那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下：

来自主题: AI技术研报

8961 点击 2025-10-22 23:58

Accel领投2200万美元，这家让YC创始人都心动的公司，打造浏览器AI agent的"操作系统"

虽然浏览器 AI agent 的概念听起来很美好，但实际构建这样的系统却面临巨大挑战。这正是 Kernel 要解决的核心问题。我发现很多开发者想要构建 AI agent，但却在基础设施层面遇到了各种障碍：性能不稳定、运行时间不可靠、定价不合理、身份认证复杂、权限管理混乱，以及一个本来就不是为 agent 设计的互联网世界。

来自主题: AI资讯

9271 点击 2025-10-22 16:25

ChatGPT缔造者联手DeepMind大神，用AI攻坚高温超导，半个硅谷抢着投

OpenAI前研究副总裁Liam Fedus与DeepMind材料科学领军者Ekin Cubuk共创Periodic Labs，以一轮高达3亿美元的种子融资走出隐身模式，震惊硅谷。然而，曾给出祝福的前东家OpenAI，并未参与本轮投资。

来自主题: AI资讯

9575 点击 2025-10-22 16:10

OpenAI设立秘密项目，招募华尔街专家训练AI构建金融模型，时薪上千元

10月21日消息，据最新披露的文件显示，OpenAI正在秘密推进一项名为“水星项目”（Project Mercury）的绝密计划，已招募超过100名前投资银行家，协助训练AI系统构建复杂的金融模型，从而取代初级投行员工耗费大量时间的工作。

来自主题: AI资讯

7052 点击 2025-10-22 15:37

刚刚，Dexbotic开源！VLA性能+46%，机器人叠盘子100%成功，统一具身智能底座

刚刚，这个开源的VLA一站式平台，不仅让UR5e真机实现了100%成功率，还在五大仿真环境中全面领先，最高性能提升高达46%，而且还支持RTX 4090训练！最近，由Dexmal 原力灵机重磅开源的Dexbotic，则构建了一个「VLA统一平台」。Dexbotic作为具身智能VLA模型一站式科研服务平台，可以为VLA科研提供基础设施，加速研究效率。

来自主题: AI资讯

8911 点击 2025-10-22 15:34

速递｜OpenAI 日本竞争对手 Sakana 正洽谈以 25 亿美元估值融资

总部位于东京的人工智能开发商Sakana AI 正与美国和日本投资者洽谈，拟以 25 亿美元的估值融资 1 亿美元，较一年前一轮融资的估值上涨 66%。参与商谈的两位知情人士透露了这一消息。

来自主题: AI资讯

6906 点击 2025-10-22 15:24

ICCV 2025最佳论文出炉！何恺明、孙剑等十年经典之作夺奖

ICCV最佳论文新鲜出炉了！今年，CMU团队满载而归，斩获最佳论文奖和最佳论文提名。同时，何恺明团队论文，RBG大神提出的Fast R-CNN，十年后斩获Helmholtz Prize，实至名归。

来自主题: AI技术研报

8743 点击 2025-10-22 15:22

刷屏的《海贼王》真人版片场花絮，居然是 AI 做的，4 步教你复刻同款

视频里，演员们穿着精致的戏服，在片场与工作人员互动、准备拍摄；摄影机、灯光、演员、助理，全都在忙。就是这样一个 35 秒的「泄露」片段，在社交媒体上迅速疯传，YouTube 相关视频播放量破千万。

来自主题: AI资讯

8153 点击 2025-10-22 15:15

如果中国大模型不再开源

美国 AI 圈开始出现“担心中国开源断供”的苗头了吗？10 月 20 日，在专注于开源模型讨论、拥有 55 万成员的 Reddit 分论坛“r/LocalLLaMA”上，一位网友发布了一则“当中国公司停止提供开源模型时会发生什么？”的提问，并表达了假如中国模型逐渐闭源或开始收费该怎么办的担忧。

来自主题: AI资讯

8511 点击 2025-10-22 15:06

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

8107 点击 2025-10-22 15:00

轻量高效，即插即用：Video-RAG为长视频理解带来新范式

尽管视觉语言模型（LVLMs）在图像与短视频理解中已取得显著进展，但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一难题，厦门大学、罗切斯特大学与南京大学联合提出了一种轻量高效、无需微调的创新框架 ——Video-RAG。

来自主题: AI技术研报

7714 点击 2025-10-22 14:57

长序列推理不再卡顿！北大华为KV缓存管理框架实现4.7倍推理加速

北大华为联手推出KV cache管理新方式，推理速度比前SOTA提升4.7倍！大模型处理长序列时，KV cache的内存占用随序列长度线性增长，已成为制约模型部署的严峻瓶颈。

来自主题: AI技术研报

7357 点击 2025-10-22 14:52

SIGGRAPH Asia 2025 | OmniPart框架，让3D内容创作像拼搭积木一样简单

在3D内容创作领域，如何像玩乐高一样，自由生成、编辑和组合对象的各个部件，一直是一个核心挑战。香港大学、VAST、哈尔滨工业大学及浙江大学的研究者们联手，推出了一个名为 OmniPart 的全新框架，巧妙地解决了这一难题。该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。

来自主题: AI技术研报

6872 点击 2025-10-22 14:48

只用 ChatGPT 帮你上网，OpenAI 的 Agent 浏览器 Atlas 来了

传闻许久的 OpenAI AI Agent 浏览器，如今这个靴子终于正式落地。但 AI 浏览器已经是巨头新贵正在不断涌入的赛道，OpenAI 还未正式下场，就已经有了十足的火药味：预热推文评论区最高赞的评论，就是一名用户表示自己已经卸载了 Chrome，等待 Atlas，颇有点「打扫卫生再请客」的感觉。

来自主题: AI资讯

10296 点击 2025-10-22 13:57

深度｜获得金沙江、险峰投资，AI网红营销头部公司 DeepLink ARR 已超500万美金

在出海营销的赛道上，AI 已经成了人人必提的“标配”。在这股AI狂潮中，有一家成立仅一年的公司，悄悄跑出一条“反直觉”的增长曲线 —— DeepLink，这家创立于2024年的AI网红营销公司，已获得阿尔法、险峰长青、金沙江联合等多家一线机构投资，ARR突破500万美元。

来自主题: AI资讯

7851 点击 2025-10-22 13:14

被H-1B签证折磨10年，前微软科学家用AI「掀桌」

美国签证体系，尤其在科技人才领域，长期被诟病为成本高、周期长、透明度低。前微软科学家Priyanka Kulkarni创办Casium，尝试用AI改造签证服务，把3–6个月的材料准备缩至10个工作日左右；部分案例不到1个月即可入职。

来自主题: AI资讯

9566 点击 2025-10-22 13:10

OpenAI也缺卡！僧多粥少，自曝内部抢卡抢到发疯

OpenAI正面临绝对的算力稀缺。

来自主题: AI资讯

9577 点击 2025-10-22 13:03

具身智能学界业界思想「惊人的统一」？美团在IROS开了个学术年会

最近机器人和 AI 相关领域的读者或多或少都在关注 IROS。

来自主题: AI资讯

9205 点击 2025-10-22 12:59

都怪AI让游戏供给井喷，玩家都不够用了

游戏太多，玩家却不够了。这是海外科技媒体TechSpot在不久前发布的一篇文章中描述的情况，他们警告游戏行业可能会出现结构性错配。

来自主题: AI资讯

8313 点击 2025-10-22 12:48

速递｜Viven用AI为员工打造数字分身，获3500万美元种子轮融资

尽管员工每天大部分时间都在项目中进行沟通与协作，但这一努力常因关键人员的缺席而受阻。当掌握重要信息的同事不在岗时——无论是休假还是处于不同时区，团队其他成员往往只能等待对方回复才能推进工作。

来自主题: AI资讯

8323 点击 2025-10-22 12:17

AI牛马实现“干中学”！上海AI Lab联合推出智能体自我进化新框架

在人工智能的广阔世界里，我们早已习惯了LLM智能体在各种任务中大放异彩。但有没有那么一瞬间，你觉得这些AI“牛马”还是缺了点什么？

来自主题: AI技术研报

9644 点击 2025-10-22 12:13

一张照片，一个3D「你」：计算所等提出HumanLift，实现高保真数字人重建

创建具有高度真实感的三维数字人，在三维影视制作、游戏开发以及虚拟/增强现实（VR/AR）等多个领域均有着广泛且重要的应用。

来自主题: AI技术研报

9861 点击 2025-10-22 12:07

比人类网瘾更可怕，AI患上“脑腐”后彻底没救

“脑腐”（Brain Rot）指的是接触了过多社交媒体的低质量、碎片化信息后，人类的精神和智力状态恶化，如同腐烂一般。它曾入选 2024 年牛津大学出版社年度热词。

来自主题: AI技术研报

8101 点击 2025-10-22 12:02

DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源”

DeepSeek最新开源的模型，已经被硅谷夸疯了！

来自主题: AI技术研报

8423 点击 2025-10-22 11:57

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

SIGGRAPH Asia 2025｜电影级运镜一键克隆！港中文&快手可灵团队发布CamCloneMaster

LiblibAI完成1.3亿美元B轮融资，拿下国内最大单笔AI应用投资

攻克长文档与多模态挑战，Paper2Video实现学术视频的自动化生产

比Transformer更强的架构来了？浙大新作Translution，一统卷积和自注意力

只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

碾压超算13000倍！1个月内，谷歌量子AI连斩诺奖+Nature封面

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

Accel领投2200万美元，这家让YC创始人都心动的公司，打造浏览器AI agent的"操作系统"

ChatGPT缔造者联手DeepMind大神，用AI攻坚高温超导，半个硅谷抢着投

OpenAI设立秘密项目，招募华尔街专家训练AI构建金融模型，时薪上千元

刚刚，Dexbotic开源！VLA性能+46%，机器人叠盘子100%成功，统一具身智能底座

速递｜OpenAI 日本竞争对手 Sakana 正洽谈以 25 亿美元估值融资

ICCV 2025最佳论文出炉！何恺明、孙剑等十年经典之作夺奖

刷屏的《海贼王》真人版片场花絮，居然是 AI 做的，4 步教你复刻同款

如果中国大模型不再开源

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

轻量高效，即插即用：Video-RAG为长视频理解带来新范式

长序列推理不再卡顿！北大华为KV缓存管理框架实现4.7倍推理加速

SIGGRAPH Asia 2025 | OmniPart框架，让3D内容创作像拼搭积木一样简单

只用 ChatGPT 帮你上网，OpenAI 的 Agent 浏览器 Atlas 来了

深度｜获得金沙江、险峰投资，AI网红营销头部公司 DeepLink ARR 已超500万美金

被H-1B签证折磨10年，前微软科学家用AI「掀桌」

OpenAI也缺卡！僧多粥少，自曝内部抢卡抢到发疯

具身智能学界业界思想「惊人的统一」？美团在IROS开了个学术年会

都怪AI让游戏供给井喷，玩家都不够用了

速递｜Viven用AI为员工打造数字分身，获3500万美元种子轮融资

AI牛马实现“干中学”！上海AI Lab联合推出智能体自我进化新框架

一张照片，一个3D「你」：计算所等提出HumanLift，实现高保真数字人重建

比人类网瘾更可怕，AI患上“脑腐”后彻底没救

DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源”