AITNT-让一部分人先用AI实现商业化

破解多模态大模型“选择困难症”！内部决策机制首次揭秘：在冲突信息间疯狂"振荡"

多模态大语言模型（MLLMs）在处理来自图像和文本等多种来源的信息时能力强大。然而，一个关键挑战随之而来：当这些模态呈现相互冲突的信息时（例如，图像显示一辆蓝色汽车，而文本描述它为红色），MLLM必须解决这种冲突。模型最终输出与某一模态信息保持一致的行为，称之为“模态跟随”（modality following）

来自主题: AI技术研报

7843 点击 2025-11-14 13:54

AI 生成的歌首次登顶权威音乐榜，还把人听哭了？

无人注意的角落里，权威榜单 Billboard 接二连三地迎来一批新歌手上榜，低调但行动快速，闷声就登顶了。权威音乐榜单 Billboard 旗下的乡村音乐排名榜，最新首位《Walk My Walk》，是一首 AI 生成的歌曲作品，Breaking Rust 自然也是一位 AI 歌手。从数据来看，它不仅登顶了，还连续在榜了三周。对于任何一个新人来说，都是堪称「爆」了的成绩。

来自主题: AI资讯

9403 点击 2025-11-14 10:59

太卷了！专属Coding的新一代Arena榜单来了，有国产模型登上榜首

大模型编程最近太猛了。

来自主题: AI资讯

10511 点击 2025-11-14 10:59

最适合AI原生硬件的交互界面是什么？

智能戒指领域又出现一个新成员。与一年多时间获得接近300万枚销量的Oura Ring不同，这个叫Stream Ring的产品不是一个专注在健身与健康领域的戒指，而是想做一个让用户能完全掌控、自由表达创意的交互界面，甚至是人们随身的“第二大脑”。

来自主题: AI资讯

6223 点击 2025-11-14 10:58

全球首个跟AI结婚的女生出现了...

日本一位 32 岁女子和 ChatGPT 结婚了。

来自主题: AI资讯

8382 点击 2025-11-14 10:57

不只是UI，都要下岗位了？新的AI UI+交互工具来了！飞书智能体+nanobanana也能生成UI了！

现在ai工具的发展真是日新月异，很多互联网从业者通过ai工具搭建工作流来帮助自己提高工作效率。不管怎么说吧，打不过就要加入，与其天天抱怨不如来看看用这些工具能不能帮你提高核心竞争力。

来自主题: AI技术研报

8313 点击 2025-11-14 10:56

AI产品的需求文档怎么写，与传统产品的PRD有何异同（附模版）

我们仍在用 10 年前的思维框架，描述10年后的产品形态 “AI产品革命”都快三年了，还没个像样的 PRD 模板出来，实在不像样。这篇文章，或许可以“救命”： 1. 论述传统产品与 AI 产品的 P

来自主题: AI技术研报

8714 点击 2025-11-14 10:32

对话李彦宏：Chatbot 不是一切，我在 AI 上看到了更让人兴奋的未来

从人的状态看，李彦宏比以前更「放松」了，而从事儿的角度看，百度似乎有意识的聚焦了。

来自主题: AI资讯

7479 点击 2025-11-14 10:23

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

谷歌在第三天发布了《上下文工程：会话与记忆》(Context Engineering: Sessions & Memory) 白皮书。文中开篇指出，LLM模型本身是无状态的 (stateless)。如果要构建有状态的（stateful）和个性化的 AI，关键在于上下文工程。

来自主题: AI技术研报

6382 点击 2025-11-14 10:22

RAE+VAE? 预训练表征助力扩散模型Tokenizer，加速像素压缩到语义提取

近期，RAE（Diffusion Transformers with Representation Autoencoders）提出以「冻结的预训练视觉表征」直接作为潜空间，以显著提升扩散模型的生成性能。

来自主题: AI技术研报

10480 点击 2025-11-14 10:21

LeCun在Meta的最后一篇论文

《LeJEPA：无需启发式的可证明且可扩展的自监督学习》。

来自主题: AI技术研报

6534 点击 2025-11-14 10:20

下一代目标检测模型：3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

多模态大语言模型（MLLM）在目标定位精度上被长期诟病，难以匹敌传统的基于坐标回归的检测器。近日，来自 IDEA 研究院的团队通过仅有 3B 参数的通用视觉感知模型 Rex-Omni，打破了这一僵局。

来自主题: AI技术研报

6002 点击 2025-11-14 10:18

只演示一次，机器人就会干活了？北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗

近日，来自北京大学与BeingBeyond的研究团队提出DemoHLM框架，为人形机器人移动操作（loco-manipulation）领域提供一种新思路——仅需1次仿真环境中的人类演示，即可自动生成海量训练数据，实现真实人形机器人在多任务场景下的泛化操作，有效解决了传统方法依赖硬编码、真实数据成本高、跨场景泛化差的核心痛点。

来自主题: AI技术研报

8119 点击 2025-11-14 09:44

Llama 4造假丑闻幕后：小扎豪赌143亿，却为中国AI「做了嫁衣」

Llama4性能造假丑闻，OpenAI烧钱的速度远超过了盈利能力；另外一方面：国产模型凭借足够强大的性能与超高性价比，迅速占领了国际开源模型市场。是时候再次为国产AI鼓掌了！

来自主题: AI资讯

9638 点击 2025-11-14 09:43

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

当前视频检索研究正陷入一个闭环困境：以MSRVTT为代表的窄域基准，长期主导模型在粗粒度文本查询上的优化，导致训练数据有偏、模型能力受限，难以应对真实世界中细粒度、长上下文、多模态组合等复杂检索需求。

来自主题: AI技术研报

5875 点击 2025-11-14 09:41

王小川的“AI医生梦”，要被蚂蚁做成了？

AI医疗不是一门新生意，但确是一个“性感”的赛道。

来自主题: AI资讯

7545 点击 2025-11-14 09:40

一个模型读懂所有医学数据，Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC

从影像诊断到手术指导，从多语言问诊到罕见病推理—— 医学AI正在从“专科助手”进化为“全能型选手”。

来自主题: AI技术研报

8884 点击 2025-11-14 09:40

2.4万亿参数原生全模态，文心5.0一手实测来了

刚刚，文心5.0正式发布了！全新一代主打原生全模态，最开始就把语言/图像/视频/音频放在同一套自回归统一架构里，做统一的理解与生成训练。所以，最终模型能够做到支持全模态输入（文字/图片/音频/视频）+全模态输出（文字/图片/音频/视频），创意写作、指令遵循、智能体规划方面也更强了。

来自主题: AI资讯

9154 点击 2025-11-13 21:01

阿里将向AI C端市场投入一枚重磅

虎嗅独家获悉，9月后，从北京、广东等地“调”来的超过百位核心工程师，汇聚到了阿里巴巴杭州西溪园区C4楼。此后，C4楼封闭了两层办公楼层，员工需要刷工牌及特殊的安保审批，方能进入。

来自主题: AI资讯

8049 点击 2025-11-13 20:52

Nature公开谷歌IMO金牌模型技术细节！核心团队仅10人，一年给AI编出8000万道数学题训练

谷歌DeepMind的IMO金牌模型，完整技术全公开了！

来自主题: AI技术研报

8310 点击 2025-11-13 16:46

【首发】医疗大模型企业全诊医学获1亿元B轮融资，创投行业期待中国的Abridge

中国最早进行医疗大模型后训练的创新企业之一 ——杭州全诊医学科技有限公司（以下简称“全诊医学”）正式宣布完成1亿元B轮融资：2024年4季度由A股上市公司“创新医疗”(SZ.002173)完成战略轮投资；2025年2季度由中国医药工业百强“好医生集团”完成B轮投资，探针资本担任本轮融资的独家财务顾问。

来自主题: AI资讯

6421 点击 2025-11-13 16:46

AI 时代，印度崛起了

大家好，我是 Ai 学习的老章最近 GitHub 发布了 2025 年度开发者趋势报告

来自主题: AI技术研报

6179 点击 2025-11-13 16:45

李飞飞3D世界模型公测，网友已经玩疯了

就在今天，李飞飞发布了全新的世界模型，开启公测，人人可玩。

来自主题: AI资讯

10704 点击 2025-11-13 16:44

Claude Skills 新玩法：用 skill-creator 10 分钟搞定 Excel 报表自动化，职场人必学

skill‑creator 是 Anthropic 在 Claude Skills 体系中提供的“元技能”。它本身是一个可直接在 Claude 对话中调用的 Skill，专门用于帮助用户快速创建、编辑、打包其他自定义 Skill，从而让 Claude 能够在特定业务场景下拥有专业化的能力。

来自主题: AI技术研报

7660 点击 2025-11-13 16:22

速递｜Anthropic豪掷500亿美元联手Fluidstack，自建AI计算基础设施新纪元开启

Anthropic 周三宣布与英国新锐云服务商 Fluidstack 达成一项雄心勃勃的数据中心合作协议，将投入 500 亿美元在美国多地建设设施以满足其不断增长的计算需求。

来自主题: AI资讯

7049 点击 2025-11-13 16:21

百度连甩两款自研AI芯片！昆仑芯五年路线图公开

目标2030年百万卡集群点亮。

来自主题: AI资讯

6692 点击 2025-11-13 16:21

从 NBA 到奥运会，全球顶级赛事为何都选择阿里 AI ？

答案藏在阿里 AI + 云的全栈布局里。2025 年 11 月 12 日，杭州阿里全球总部的访客登记系统跳出一串特殊信息——柯丝蒂·考文垂，国际奥委会首位非洲籍、女性主席。

来自主题: AI资讯

8478 点击 2025-11-13 16:20

审美、镜头、视听语言……TapNow是我见过最像导演的AI

在这个AI生成视频泛滥的时代，我们习惯看到“AI一键出片”“模版复刻”，却少有真正能触碰商业大片质感的作品。

来自主题: AI资讯

9223 点击 2025-11-13 16:19

2M大小模型定义表格理解极限，清华大学崔鹏团队开源LimiX-2M

提到 AI 的突破，人们首先想到的往往是大语言模型（LLM）：写代码、生成文本、甚至推理多模态内容，几乎重塑了通用智能的边界。但在一个看似 “简单” 的领域 —— 结构化表格数据上，这些强大的模型却频频失手。

来自主题: AI技术研报

9243 点击 2025-11-13 15:22

稚晖君最新188机器人，阅后即焚

具身智能机器人太火了。

来自主题: AI资讯

10371 点击 2025-11-13 15:22

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

破解多模态大模型“选择困难症”！内部决策机制首次揭秘：在冲突信息间疯狂"振荡"

AI 生成的歌首次登顶权威音乐榜，还把人听哭了？

太卷了！专属Coding的新一代Arena榜单来了，有国产模型登上榜首

最适合AI原生硬件的交互界面是什么？

全球首个跟AI结婚的女生出现了...

不只是UI，都要下岗位了？新的AI UI+交互工具来了！飞书智能体+nanobanana也能生成UI了！

AI产品的需求文档怎么写，与传统产品的PRD有何异同（附模版）

对话李彦宏：Chatbot 不是一切，我在 AI 上看到了更让人兴奋的未来

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

RAE+VAE? 预训练表征助力扩散模型Tokenizer，加速像素压缩到语义提取

LeCun在Meta的最后一篇论文

下一代目标检测模型：3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

只演示一次，机器人就会干活了？北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗

Llama 4造假丑闻幕后：小扎豪赌143亿，却为中国AI「做了嫁衣」

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

王小川的“AI医生梦”，要被蚂蚁做成了？

一个模型读懂所有医学数据，Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC

2.4万亿参数原生全模态，文心5.0一手实测来了

阿里将向AI C端市场投入一枚重磅

Nature公开谷歌IMO金牌模型技术细节！核心团队仅10人，一年给AI编出8000万道数学题训练

【首发】医疗大模型企业全诊医学获1亿元B轮融资，创投行业期待中国的Abridge

AI 时代，印度崛起了

李飞飞3D世界模型公测，网友已经玩疯了

Claude Skills 新玩法：用 skill-creator 10 分钟搞定 Excel 报表自动化，职场人必学

速递｜Anthropic豪掷500亿美元联手Fluidstack，自建AI计算基础设施新纪元开启

百度连甩两款自研AI芯片！昆仑芯五年路线图公开

从 NBA 到奥运会，全球顶级赛事为何都选择阿里 AI ？

审美、镜头、视听语言……TapNow是我见过最像导演的AI

2M大小模型定义表格理解极限，清华大学崔鹏团队开源LimiX-2M

稚晖君最新188机器人，阅后即焚