AI资讯新闻榜单内容搜索-Ai模型

美团新独立APP，点不了菜只能点AI

用外卖的打法做AI模型？美团这是跟“又快又稳”杠上了（doge）。

来自主题: AI技术研报

6950 点击 2025-11-03 14:49

谁是AI之王？聊聊备受争议的AI评测与崛起的LMArena

当AI模型排行榜开始被各种刷分作弊之后，谁家大模型最牛这个问题就变得非常主观，直到一家线上排行榜诞生，它叫：LMArena。在文字、视觉、搜索、文生图、文生视频等不同的AI大模型细分领域，LMArena上每天都有上千场的实时对战，由普通用户来匿名投票选出哪一方的回答更好。

来自主题: AI资讯

9486 点击 2025-11-03 09:41

均值至上假繁荣！北大新作专挑难题，逼出AI模型真本事

大模型后训练的痛点：均值优化忽略低概率高信息路径，导致推理能力停滞。RiskPO双管齐下，MVaR目标函数推导梯度估计，多问题捆绑转化反馈，实验中Geo3K准确率54.5%，LiveCodeBench Pass@1提升1%，泛化能力强悍。

来自主题: AI技术研报

7926 点击 2025-10-25 14:32

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

香港科技大学KnowComp实验室提出基于《欧盟人工智能法案》和《GDPR》的LLM安全新范式，构建合规测试基准并训练出性能优异的推理模型，为大语言模型安全管理提供了新方向。

来自主题: AI技术研报

9933 点击 2025-10-23 12:20

我在 iPhone 17 Pro Max 上跑 AI 模型，体验了一把十年前「越狱」的快乐

在 iPhone 上部署端侧 AI 模型，成了互联网的新显学。在 iPhone 上体验端侧模型，门槛其实不算高。打开 App Store，搜索 PocketPal AI，下载安装。如果不习惯英文界面，可以在设置 (Setting) 里找到语言 (Language) 选项，切换成中文。

来自主题: AI资讯

10142 点击 2025-10-19 22:11

分析NVIDIA的近百笔AI投资：什么是AI行业的现在和未来？

AI模型是现在，Physical AI是未来

来自主题: AI资讯

8919 点击 2025-10-17 10:30

Anthropic深夜掀桌！5个月前顶配模型，现在价格只要1/3，速度还翻倍

Anthropic用Haiku 4.5打响了AI性价比之战！曾经的顶配性能，如今以三分之一的价格、两倍的速度下放，可以说是对高价AI模型的一次降维打击。

来自主题: AI资讯

9154 点击 2025-10-16 15:44

刚刚，奥特曼亲赴，韩国「举国」投靠！

奥特曼亲自飞赴首尔，与韩国总统、两大财阀巨头会晤并达成合作。三星电子与SK海力士将加速生产先进存储芯片，目标月产能达90万片DRAM晶圆，以满足OpenAI模型的需求。随着奥特曼逐渐握紧硬件的咽喉，留给竞争对手的时间，不多了。

来自主题: AI资讯

11741 点击 2025-10-03 00:04

“iFold”，苹果AI新成果

起猛了，苹果怎么搞起跨界AI模型了？？发布了一个基于流匹配的蛋白质折叠模型SimpleFold，被网友戏称为“iFold”。SimpleFold没有花里胡哨的专属模块设计，就靠通用的Transformer模块，搭配流匹配生成范式，3B参数版本追平了该领域顶流模型谷歌AlphaFold2的性能。

来自主题: AI资讯

10167 点击 2025-09-26 23:59

谁是最强“打工AI”？OpenAI亲自测试，结果第一不是自己

OpenAI发布最新研究，却在里面夸了一波Claude。他们提出名为GDPval的新基准，用来衡量AI模型在真实世界具有经济价值的任务上的表现。具体来说，GDPval覆盖了对美国GDP贡献最大的9个行业中的44种职业，这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验的行业专家的代表性工作设计而成。

来自主题: AI技术研报

11302 点击 2025-09-26 16:03