AITNT-让一部分人先用AI实现商业化

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

Meta推出KernelLLM，这个基于Llama 3.1微调的8B模型，竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示，它的单次推理性能超越GPT-4o和DeepSeek V3，多次生成时得分飙升。

来自主题: AI技术研报

8011 点击 2025-05-27 18:00

月之暗面前核心产品负责人明超平，入局AI Coding

“月之暗面给了我AGI信仰，但Kimi不是唯一的路。”

来自主题: AI资讯

7002 点击 2025-05-27 17:54

Claude 4被诱导窃取个人隐私！GitHub官方MCP服务器安全漏洞曝光

被选为GitHub Copilot官方模型后，Claude 4直接被诱导出bug了！

来自主题: AI资讯

7835 点击 2025-05-27 17:38

One RL to See Them All？一个强化学习统一视觉-语言任务！

强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而，RL 在推理任务之外的应用，尤其是在目标检测和目标定位等感知密集型任务中的应用，仍有待深入探索。

来自主题: AI技术研报

10116 点击 2025-05-27 17:33

谷歌·搜索：献给AI的第一个「祭

谷歌正用AI重塑搜索，引发自身商业模式的深刻危机。AI Overviews与AI Mode大幅削弱用户点击网站的需求，改变传统搜索架构，使谷歌从信息入口变为信息终点。

来自主题: AI资讯

6969 点击 2025-05-27 17:26

解剖「智元机器人」：“华为系”操盘手，用经营大公司的方式创业

在“华为系”团队操盘下，智元机器人表现出不同于创业公司的风格和打法。不少行业人士对我们形容其“用运营大公司的方式创业”、“从DayOne就开启全要素竞争”。

来自主题: AI资讯

10250 点击 2025-05-27 17:20

【万字长文】大模型开源开发全景与趋势解读

“当我们看到这些数据趋势的时候，一个词浮现在我的眼前——黑客松（Hackathon），AI 领域的项目，快速地出现、快速地停更，他们似乎在做一场真实市场里的黑客松，那么，什么领域涌现了最多项目，哪些方面是停更的重灾区，哪些项目幸存了，激烈竞争的项目们如今怎么样了，我们都尝试着在这份趋势报告里叙述一二。”

来自主题: AI资讯

6699 点击 2025-05-27 17:13

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

推理大模型开卷新方向，阿里开源长文本深度思考模型QwenLong-L1，登上HuggingFace今日热门论文第二。

来自主题: AI技术研报

8285 点击 2025-05-27 16:58

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

在大型推理模型（例如 OpenAI-o3）中，一个关键的发展趋势是让模型具备原生的智能体能力。具体来说，就是让模型能够调用外部工具（如网页浏览器）进行搜索，或编写/执行代码以操控图像，从而实现「图像中的思考」。

来自主题: AI技术研报

10936 点击 2025-05-27 16:53

百度心响上线iOS版，多智能体协作应用终于卷对地方了

今年的4月26日，我们测评了百度新发布的多智能体协作应用心响APP。当时只上线了安卓版，很多网友在线求苹果版链接。

来自主题: AI资讯

6218 点击 2025-05-27 16:48

Cognition，10块奥数金牌撑起的AI编程奇迹，这家华人公司是否能笑到最后？

自 2024 年 3 月 Devin 首次亮相以来，AI 编程世界的叙事就被彻底改写。这款由 Cognition 打造的“全自动 AI 软件工程师”，在短短数月内登上技术话题的C位：一段其独立修复开源 Bug 的演示视频在 X 平台播放量突破 3000 万，成为AI圈罕见的“破圈时刻”。

来自主题: AI资讯

10704 点击 2025-05-27 16:40

大厂程序员：AI正在将我们变成高速流水线工人，受不了了

万万没想到，大厂程序员真要成流水线工人了。

来自主题: AI资讯

10037 点击 2025-05-27 16:26

扩散语言模型九倍推理加速！上海交大：KV Cache并非自回归模型的专属技巧

首个用于加速扩散式大语言模型（diffusion-based Large Language Models, 简称 dLLMs）推理过程的免训练方法。

来自主题: AI技术研报

11310 点击 2025-05-27 16:22

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

随着大语言模型（LLM）能力的快速迭代，传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征，例如价值观、性格和社交智能？如何建立更全面、更可靠的 AI 评估体系？北京大学宋国杰教授团队最新综述论文（共 63 页，包含 500 篇引文），首次尝试系统性梳理答案。

来自主题: AI技术研报

10263 点击 2025-05-27 16:13

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

作为首批入选印度“IndiaAI Mission”国家级项目、承担构建印度主权基础大模型任务的公司之一，Sarvam AI 近日发布了名为 Sarvam-M 的模型。这是一个基于 Mistral Small 构建的 240 亿参数、权重开放的混合语言模型。

来自主题: AI资讯

11566 点击 2025-05-27 14:44

红杉中国xbench全球首发，AI智能体真实战力揭榜！

刚刚，全新AI基准测试工具xbench诞生，通过双轨评估体系和长青评估机制，追踪模型能力与实际场景价值。

来自主题: AI技术研报

11790 点击 2025-05-27 14:04

医疗行业拐点将至！木头姐最新发声：测序、AI和基因编辑带来治疗革命！

“科技女皇”木头姐，再一次力挺AI医疗。

来自主题: AI资讯

9290 点击 2025-05-27 13:53

o3不听指令拒绝关机，7次破坏关机脚本！AI正在学会「自我保护」机制

AI居然不听指令，阻止人类把自己给关机了？？？

来自主题: AI技术研报

10107 点击 2025-05-27 13:48

3步轻松微调Qwen3，本地电脑就能搞，这个方案可以封神了！【喂饭级教程】

大家好，我是袋鼠帝今天给大家带来的是一个带WebUI，无需代码的超简单的本地大模型微调方案（界面操作），实测微调之后的效果也是非常不错。

来自主题: AI技术研报

10042 点击 2025-05-27 13:38

与Gemini Diffusion共振！首个扩散式「发散思维链」来了

近年来，思维链在大模型训练和推理中愈发重要。近日，西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。该方法将反向扩散过程中的每一步中间结果都看作大模型的一个「思考」步骤，然后利用基于结果的强化学习去优化整个生成轨迹，最大化模型最终答案的正确率。

来自主题: AI技术研报

8200 点击 2025-05-27 13:21

豆包为什么要给 AI 助手「开眼」？

当 AI 同时拥有了耳朵和眼睛，在未来硬件创新的支持下，还将解放更大的创新潜力。

来自主题: AI资讯

8696 点击 2025-05-27 13:11

2025，AI Agent赛道还有哪些机会？

进入2025年以来， AI Agent的发展明显提速。5月6日，OpenAI宣布以30亿美元收购 Windsurf；编程工具Cursor的母公司Anysphere也获得了9亿美元的融资，估值高达90亿美元；号称中国第一个通用AI Agent的Manus在五月也获得了硅谷老牌风险投资公司Benchmark领投的7500万美元的融资；

来自主题: AI资讯

9485 点击 2025-05-27 13:06

腾讯在AI上做对了什么？有哪些困境？

腾讯自发布一季报以来股价表现平平，虽有小涨，但未能创出新高。今年2月我在《Deepseek带来的价值重估腾讯还能涨多久？》中说过，腾讯股价接下来能不能继续上涨，要看AI能带来多少实实在在的收入贡献。在一季报中，腾讯管理层虽然强调了AI对广告业务的提升，但未量化到具体的收入，也没有披露任何与AI相关的运营数据。

来自主题: AI资讯

9540 点击 2025-05-27 12:59

AI搜索成本归零后，我们再也回不去了

当AI搜索完全免费后，我们的工作流、交互方式、信息记录方式都会有什么变化？

来自主题: AI资讯

9621 点击 2025-05-27 12:56

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

只用5%的参数，数学和代码能力竟然超越满血DeepSeek？

来自主题: AI资讯

9665 点击 2025-05-27 12:45

99%的人都理解错了，AI Agent ≠ Agentic AI，康奈尔大学发33页论文澄清关键区别。

TL;DR：如果您有一个AI产品，用户问您这是AI Agent还是Agentic AI？如果您回答不出来，或者认为这两个概念是一回事，那您可能需要重新审视自己的技术认知了。不过没关系，因为99%的人都不知道，现在您只需要看完这篇文章就可以了。

来自主题: AI技术研报

7892 点击 2025-05-27 12:40

被AI误伤，我该怎么证明“我没有用AI作弊”？

AI 火了之后，我就想问：有谁还没有用过 AI？

来自主题: AI资讯

7792 点击 2025-05-27 12:09

TPU vs GPU: 2025年会有何不同？

AI无处不在——从聊天机器人、推荐引擎到语音助手和ChatGPT或谷歌Gemini等工具。但在所有这些智能技术的背后，有一样东西经常被忽视：使这一切成为可能的硬件。

来自主题: AI技术研报

10366 点击 2025-05-27 11:21

微软开源浏览器Agent，可实时跟踪、控制智能体，超4000颗星

微软在官网开源了一个专用于浏览器网络任务的Agent——Magentic-UI。Magentic-UI是基于微软曾经开源的 Magentic-One基础之上开发而成，并支持人机协同的控制方法来提升智能体的执行效率和准确率。

来自主题: AI资讯

10199 点击 2025-05-27 10:46

对话CMU李磊：好的AI学者绝不只搞“纯学术”，大厂AI Lab请集中资源干大事

2002年，在拿下中国高校第一个ACM（计算机领域最顶尖的程序设计大赛）金牌后，上海交大设立了“ACM班”，这个用最高竞赛命名的班级后来人尽皆知，成为中国AI人才的重要阵地。也在那年，李磊成为ACM班第一届的学生。在ACM班他第一次意识到，“原来计算机能帮助解决人类的这么多问题。”

来自主题: AI资讯

9836 点击 2025-05-27 10:17

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

月之暗面前核心产品负责人明超平，入局AI Coding

Claude 4被诱导窃取个人隐私！GitHub官方MCP服务器安全漏洞曝光

One RL to See Them All？一个强化学习统一视觉-语言任务！

谷歌·搜索：献给AI的第一个「祭

解剖「智元机器人」：“华为系”操盘手，用经营大公司的方式创业

【万字长文】大模型开源开发全景与趋势解读

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

百度心响上线iOS版，多智能体协作应用终于卷对地方了

Cognition，10块奥数金牌撑起的AI编程奇迹，这家华人公司是否能笑到最后？

大厂程序员：AI正在将我们变成高速流水线工人，受不了了

扩散语言模型九倍推理加速！上海交大：KV Cache并非自回归模型的专属技巧

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

红杉中国xbench全球首发，AI智能体真实战力揭榜！

医疗行业拐点将至！木头姐最新发声：测序、AI和基因编辑带来治疗革命！

o3不听指令拒绝关机，7次破坏关机脚本！AI正在学会「自我保护」机制

3步轻松微调Qwen3，本地电脑就能搞，这个方案可以封神了！【喂饭级教程】

与Gemini Diffusion共振！首个扩散式「发散思维链」来了

豆包为什么要给 AI 助手「开眼」？

2025，AI Agent赛道还有哪些机会？

腾讯在AI上做对了什么？有哪些困境？

AI搜索成本归零后，我们再也回不去了

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

99%的人都理解错了，AI Agent ≠ Agentic AI，康奈尔大学发33页论文澄清关键区别。

被AI误伤，我该怎么证明“我没有用AI作弊”？

TPU vs GPU: 2025年会有何不同？

微软开源浏览器Agent，可实时跟踪、控制智能体，超4000颗星

对话CMU李磊：好的AI学者绝不只搞“纯学术”，大厂AI Lab请集中资源干大事