AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
黄仁勋都被问毛了:顶级AI厂商在去CUDA?“你的前提就是错的”

黄仁勋都被问毛了:顶级AI厂商在去CUDA?“你的前提就是错的”

黄仁勋都被问毛了:顶级AI厂商在去CUDA?“你的前提就是错的”

很少看到黄仁勋这么激动。接近两个小时,正面回答关于英伟达一路在大模型时代涨到4万亿美元市值的种种问题。黄仁勋在“硅谷最受欢迎播客”的全新访谈,信息量有点高。视频发布半天,单在油管上的观看量已经超过10万+。

来自主题: AI资讯
6882 点击    2026-04-19 13:41
SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

伯克利团队归纳出7种反复出现的模式:智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。

来自主题: AI技术研报
8792 点击    2026-04-19 13:40
比Nano Banana还夯的生图模型泄露,截图不再是证据了 | 附提示词

比Nano Banana还夯的生图模型泄露,截图不再是证据了 | 附提示词

比Nano Banana还夯的生图模型泄露,截图不再是证据了 | 附提示词

4 月初,LM Arena 评测平台上出现了三个匿名图像模型,代号分别是 maskingtape-alpha、packingtape-alpha、gaffertape-alpha。几小时后它们消失了。OpenAI 官方还没有正式宣布这个模型,但根据 API 返回的元数据和用户侧的测试记录,它已经有了一个被广泛接受的名字:GPT Image 2。

来自主题: AI资讯
8239 点击    2026-04-19 13:39
「外星科技」Mythos 带来重大国家风险,白宫顶着禁令也要部署了

「外星科技」Mythos 带来重大国家风险,白宫顶着禁令也要部署了

「外星科技」Mythos 带来重大国家风险,白宫顶着禁令也要部署了

前一阵特朗普刚下令五角大楼禁用 Claude,现在 Anthropic 最强新模型 Claude Mythos 的强大网络攻防能力,让白宫无法忽视这把双刃剑,顶着自己下的禁令,宁可打自己脸也要全面部署 Mythos 了。

来自主题: AI资讯
10041 点击    2026-04-19 13:38
智元机器人,要做AI大模型平台和开放生态

智元机器人,要做AI大模型平台和开放生态

智元机器人,要做AI大模型平台和开放生态

上个月,智元刚刚跨过“机器人量产下线一万台”的门槛。4月17日,这家由前华为“天才少年”彭志辉与前华为副总裁邓泰华共同创立的机器人公司在合作伙伴大会上,花了大量的时间和篇幅介绍软件上的新产品。相较之下,硬件的篇幅反倒很少。

来自主题: AI资讯
7340 点击    2026-04-19 13:36
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。

来自主题: AI技术研报
7781 点击    2026-04-19 13:33
Claude Code新功能Auto Mode能否替代人工审核?首个压力测试来了

Claude Code新功能Auto Mode能否替代人工审核?首个压力测试来了

Claude Code新功能Auto Mode能否替代人工审核?首个压力测试来了

随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。

来自主题: AI资讯
7339 点击    2026-04-19 13:28
梁文锋,被曝融资20亿!

梁文锋,被曝融资20亿!

梁文锋,被曝融资20亿!

今日,据外媒The Information报道,DeepSeek正首次寻求外部融资,目标估值超过100亿美元(约合人民币681.8亿元)。据多位知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元(约合人民币20.5亿元),以补充资金储备,应对AI大模型研发日益高昂的成本竞争。

来自主题: AI资讯
9926 点击    2026-04-18 07:30
全球最大触觉数据集Daimon-Infinity,竟然出自一家具身上游公司

全球最大触觉数据集Daimon-Infinity,竟然出自一家具身上游公司

全球最大触觉数据集Daimon-Infinity,竟然出自一家具身上游公司

4 月 15 日,戴盟机器人联合Google DeepMind、中国移动、新加坡国立大学、香港科技大学、上海交通大学、日本东北大学等海内外数十家顶尖学术机构与知名企业,发布了全球最大规模含触觉全模态物理世界数据集Daimon-Infinity。

来自主题: AI技术研报
5840 点击    2026-04-18 07:27
速递|AI内容电商OS「K2 Lab」再完成数千万天使轮融资,内测用户首周出单率70%,抢跑A2A原生电商新时代

速递|AI内容电商OS「K2 Lab」再完成数千万天使轮融资,内测用户首周出单率70%,抢跑A2A原生电商新时代

速递|AI内容电商OS「K2 Lab」再完成数千万天使轮融资,内测用户首周出单率70%,抢跑A2A原生电商新时代

近日,AI内容电商OS K2Lab宣布再次完成数千万元天使轮融资,这也是K2Lab三个月以来完成的第二轮融资,本轮融资由华控资本领投、云时资本跟投,心流资本FlowCapital担任长期财务顾问。本轮融资资金将用于A2A原生电商Agent OS建设、多模态垂直模型打造、海外用户规模化增长和AI Native团队的持续建设。

来自主题: AI资讯
9141 点击    2026-04-18 07:26