AI资讯新闻榜单内容搜索-算法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 算法
GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们,或许都曾面临一个共同的困扰:当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型(SLMs)时,效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著,但一旦应用到 1.7B 甚至更小参数的模型上,性能提升就微乎其微。

来自主题: AI技术研报
8310 点击    2026-05-07 10:16
阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

用强化学习(RL)优化文生图模型的 prompt following 能力,是一条被广泛验证的路径 —— 让模型根据 prompt 用不同随机种子生成多张图片,通过 reward model 计算 reward,再利用相关 RL 算法优化模型。

来自主题: AI技术研报
7203 点击    2026-05-06 14:27
全球首创!字节跳动首个AI药物曝光,背后37人团队亮相,前信达总裁任顾问!

全球首创!字节跳动首个AI药物曝光,背后37人团队亮相,前信达总裁任顾问!

全球首创!字节跳动首个AI药物曝光,背后37人团队亮相,前信达总裁任顾问!

近日,字节跳动旗下AI制药子公司Anew Therapeutics在AAI 2026上进行了口头报告,披露旗下位于临床前阶段的IL-17小分子抑制剂。该药物是全球首个小分子全谱(AA/AF/FF)IL-17抑制剂,利用AI驱动的虚拟筛选技术,结合分子生成算法成功识别而来,有望转化为银屑病和其他自身免疫性疾病的最佳治疗方法。

来自主题: AI资讯
8130 点击    2026-04-29 10:47
日本AI公司 Sakana AI 推出基于多智能体编排系统的基础模型 Sakana Fugu

日本AI公司 Sakana AI 推出基于多智能体编排系统的基础模型 Sakana Fugu

日本AI公司 Sakana AI 推出基于多智能体编排系统的基础模型 Sakana Fugu

以自然启发式 AI 算法闻名的 Sakana AI 宣布,其全新商用 AI 产品——多智能体编排系统「Sakana Fugu」正式开启 Beta 测试。

来自主题: AI资讯
9117 点击    2026-04-28 17:30
刷榜风波惊动OpenAI后,百度伐谋(Famou)拿回Agent硬核榜单第一

刷榜风波惊动OpenAI后,百度伐谋(Famou)拿回Agent硬核榜单第一

刷榜风波惊动OpenAI后,百度伐谋(Famou)拿回Agent硬核榜单第一

近日,在由 OpenAI 主导设立的权威基准测试 MLE-Bench 上,企业级算法自主优化智能体百度伐谋(Famou)击败了各路玩家登顶,并刷新了 SOTA 成绩。

来自主题: AI资讯
10470 点击    2026-04-11 14:24
Mac用户可以在oMLX中使用TurboQuant了,搭配Gemma-4-31B,谷歌全家桶实测很能打!

Mac用户可以在oMLX中使用TurboQuant了,搭配Gemma-4-31B,谷歌全家桶实测很能打!

Mac用户可以在oMLX中使用TurboQuant了,搭配Gemma-4-31B,谷歌全家桶实测很能打!

对本地部署玩家,尤其是Mac用户来说,长上下文推理最大的痛点往往不是“模型不够聪明”,而是稍微多用点上下文,统一内存就被撑爆了”,这一点在最近的Gemma-4 31B的部署中尤为明显,在同等上下文的情况,显存占用比Qwen3.5-27B高约一倍不止,直接劝退了不少人。但好消息是,谷歌近期提出的TurboQuant KV缓存量化算法,正是为了解决这个痛点而生。

来自主题: AI技术研报
8426 点击    2026-04-09 09:47
十分钟破解加密货币!谷歌在量子计算领域发现了什么?

十分钟破解加密货币!谷歌在量子计算领域发现了什么?

十分钟破解加密货币!谷歌在量子计算领域发现了什么?

第一篇论文(白皮书)由 Google Quantum AI 发表。他们针对逻辑层面的 Shor 算法进行了优化,专门用于破解比特币和以太坊的签名。该算法在针对 256 位椭圆曲线 secp256k1 时,仅需约 1000 个逻辑量子比特即可运行。由于电路深度较低,一台快速的超导量子计算机可以在几分钟内恢复私钥。

来自主题: AI资讯
10406 点击    2026-04-09 09:46
CVPR 2026|DROID-W:复杂室外动态场景,也能稳定SLAM

CVPR 2026|DROID-W:复杂室外动态场景,也能稳定SLAM

CVPR 2026|DROID-W:复杂室外动态场景,也能稳定SLAM

SLAM 在自动驾驶、机器人、AR/VR 乃至具身智能系统中都是至关重要的环节,它决定了算法能否在一个陌生环境中一边“看懂世界”,一边“知道自己在哪”。

来自主题: AI技术研报
7580 点击    2026-04-08 09:13
顶级恐怖!MIT数学实锤证明:ChatGPT正诱发「AI精神病」,全球14人已死亡

顶级恐怖!MIT数学实锤证明:ChatGPT正诱发「AI精神病」,全球14人已死亡

顶级恐怖!MIT数学实锤证明:ChatGPT正诱发「AI精神病」,全球14人已死亡

就在刚刚,MIT伯克利斯坦福的研究者给出数学铁证:ChatGPT正诱发「AI精神病」!哪怕你是理想的贝叶斯理性人,也难逃算法设下的「妄想螺旋」。

来自主题: AI资讯
9672 点击    2026-04-04 11:00