AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
达摩院发布世界模型评测基准,自家模型一个都没上榜......

达摩院发布世界模型评测基准,自家模型一个都没上榜......

达摩院发布世界模型评测基准,自家模型一个都没上榜......

达摩院联合高校推出WorldOlympiad评测基准,跳出传统视频“唯画质”的评价逻辑,以物理真实性、三维几何一致性、长时序交互保真度三大维度,搭配游戏、机器人、通用实景三大场景,打造一套全方位的视频世界模型评测体系。

来自主题: AI技术研报
8809 点击    2026-06-17 14:28
蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

更聪明的计算远比更多的计算更有效。

来自主题: AI技术研报
6458 点击    2026-06-17 14:06
ICML 2026 | 大模型为什么算不对加法?南大团队提出等本位和轨迹,揭示LLM算术错误的几何机制

ICML 2026 | 大模型为什么算不对加法?南大团队提出等本位和轨迹,揭示LLM算术错误的几何机制

ICML 2026 | 大模型为什么算不对加法?南大团队提出等本位和轨迹,揭示LLM算术错误的几何机制

尽管大语言模型(Large Language Models, LLMs)在复杂数学推理、代码生成和知识问答上表现突出,但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报
7239 点击    2026-06-17 14:05
ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,LLM agents 正在被用于越来越复杂的 agentic applications:deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报
5729 点击    2026-06-17 14:05
葬AI基准测试发布:GLM 5.2第一,超越Opus 4.8

葬AI基准测试发布:GLM 5.2第一,超越Opus 4.8

葬AI基准测试发布:GLM 5.2第一,超越Opus 4.8

这是葬AI起号以来工作量最大的一篇文章。为了严肃评测国产模型的能力,我自研了一个Benchmark,完整测试了智谱、Qwen、Kimi、Minimax、Deepseek这些最新国产模型,还引入了境外势力Claude作对照组。

来自主题: AI资讯
8035 点击    2026-06-17 13:30
小米云端办公龙虾Xiaomi MiMo Claw来了!打通了WPS,14.9元交个朋友

小米云端办公龙虾Xiaomi MiMo Claw来了!打通了WPS,14.9元交个朋友

小米云端办公龙虾Xiaomi MiMo Claw来了!打通了WPS,14.9元交个朋友

昨晚,小米正式上线了Xiaomi MiMo Claw,一款云端Claw类产品,搭载与OpenClaw框架深度适配的MiMo-V2.5-Pro旗舰模型,同时联动了金山办公生态,实现一站式办公,现在可以在MiMo Studio上进行体验。

来自主题: AI资讯
8617 点击    2026-06-17 11:08
刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大

刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大

刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大

刚刚被 SpaceX 宣布以 600 亿美元收购的 Cursor,发布大模型了。本周二,Cursor 宣布了一个新的 1.5 万亿 + 参数模型,该模型在超过 10 万块 GPU 上进行了预训练。消息是在旧金山举行的 Cursor Compile 上宣布的,这是 Cursor 举办的首届旗舰大会。

来自主题: AI资讯
9027 点击    2026-06-17 10:59
PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5

PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5

PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5

大模型再强,也读不懂你公司那一柜子的合同、发票和扫描件。在"纸张世界"和"LLM世界"之间,缺一座桥——而百度开源的 PaddleOCR,可能就是当下最稳的那座。

来自主题: AI技术研报
6948 点击    2026-06-17 10:32