AI第一次科研竞赛中击败人类!Opus 4.7狂飙2930步创世界纪录
AI第一次科研竞赛中击败人类!Opus 4.7狂飙2930步创世界纪录Prime Intellect把Opus 4.7和GPT 5.5关进H200集群,不给人类指导,跑了1万次实验。结果:AI第一次在科研竞赛中打破人类纪录。2930步,递归自改进的卢比孔河,被跨过了。
搜索
Prime Intellect把Opus 4.7和GPT 5.5关进H200集群,不给人类指导,跑了1万次实验。结果:AI第一次在科研竞赛中打破人类纪录。2930步,递归自改进的卢比孔河,被跨过了。
Anthropic 刚刚出了一份 36 页的创始人手册:创建一家 AI Native 的公司,几个人,做几百人的事儿。由着这个问题,手册把创业拆成四个阶段(想法、MVP、上线、规模化),每个阶段讲清楚该做什么、容易踩什么坑、Claude 的三个产品形态(Chat、Cowork、Code)分别在什么时候用
没错,大洗牌之后,xAI紧锣密鼓地发上重磅新品了——首个Coding Agent,Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁,属于是摆在明面上的。
今天,阿里发布Qoder 1.0,从AI IDE升级为智能体自主开发工作台,用户只需专注需求定义,Agent团队即可“自动驾驶”,自主完成执行、验证和交付全流程任务。目前,Windows、macOS和Linux系统用户均可下载使用。
微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。
LeCun念叨了好几年的JEPA,被160行代码给复刻了。GitHub上有个开发者,用极简单文件形式,用PyTorch把JEPA核心系列全部实现了一遍,从I-JEPA到LeWorldModel,五个变体一个没落,就为了——
上海交通大学、上海创智学院与瑞金医院联合发布的CX-Mind,是目前首个将胸片诊断推进为「可验证推理链」的多模态大模型——从看到异常,到解释为什么、排除了什么、结论怎么来的,每一步都有影像证据支撑。
今天凌晨,俄勒冈州立大学杰出教授(荣休)、arXiv 计算机科学分区 CoRR 的机器学习板块首席版主 Thomas G. Dietterich 宣布:根据我们的行为准则,在论文上署名即表示每位作者对其全部内容承担完全责任,无论这些内容是如何生成的。
如果你想在今天的互联网上毁掉一幅世界名画,最快的方法不是物理消灭它,而是只需要给它贴上一个标签:「这是 AI 画的」。最近,X 用户 @SHL0MS 进行了一场充满恶趣味的社会实验。他上传了一幅法国印象派大师克劳德·莫奈的《睡莲》真迹,特意打上平台的「Made with AI」标签,并配上了一段文案:
LiberAI已于近期连续完成种子轮、天使轮及天使+轮融资,累计金额数亿元人民币,投资方包括真格基金、红杉中国、美团龙珠、顺为资本等一线机构。公司成立于2025年12月,CEO刘松铭是清华特等奖学金获得者,师从清华大学朱军教授,在ICML、NeurIPS等顶会发表多篇一作论文。
美国具身卷到飞起,明星企业Figure再整新活: 这一次,他们让机器人进厂打工,8小时不间断直播放送。
大家等这个等太久了。 本周五,OpenAI 宣布 Codex 手机版在 ChatGPT App 中上线,安卓和 iOS 版都已开启 preview,面向包括免费版的所有用户。
47 天 GitHub 破万星,飞书 CLI 彻底火了!26 年春季,飞书已经成为开发者用脚投票选出的最佳 Agent 工作平台。
近日,美国德州家庭起诉OpenAI及创始人山姆·奥特曼,指责该公司旗下AI平台ChatGPT提供了错误的医疗建议,导致了其19岁儿子萨姆·尼尔森(Sam Nelson)因药物过量死亡。
英国AI安全研究所(AISI)昨天扔下重磅炸弹:Mythos在模拟企业内网32步渗透任务中10次过6,GPT-5.5也跟着10次过3,连此前所有模型都没破过的Cooling Tower靶场都被首次攻破!更炸的是——Cyber能力翻倍周期一路压到4.5个月,瓶颈不是智力,是Token。这场ASI决赛,人类评测已经追不上AI了。
Anthropic 将 Agent SDK 用量从订阅中剥离,按 API 零售价另给固定额度。重度用户的可用量缩水近十倍。同一周,OpenAI 向企业用户推出 Codex 两个月免费迁移。ASI 决赛圈的第一场定价战,开打了。
如果只看这场 Meetup 的嘉宾名单,你大概会先想到海外芯片巨头,或者某家国际 AI 基础设施公司。
通常我们见到的电脑芯片只有指甲盖大小,GPU 也就巴掌大,美国加州一家叫 Cerebras 的公司造出的芯片跟一个大号餐盘差不多,直径超过 200 毫米,面积 46,225 平方毫米,集成了 4 万亿个晶体管。
原力灵机释放商业化信号。
五一出了趟远门,本意是远离AI,结果发现不管是我还是中亚人民,已经完全被AI包围了,擦肩而过的中国游客的手机里都在外放豆包。我太懂你们这种感觉了,接下来,我会用最直接、最真相、最一针见血、最开门见山、最单刀直入、最只戳关键、保证全程无广的方式来讲我在中亚的AI观察:
5月12日,中际旭创突破万亿市值后,再次迎来新的“里程碑”——股价突破1000元,成为创业板历史上第二只千元股。
你可能最近也在短视频平台上刷到这样一类吐槽视频:某公司老板用了两天豆包、刷到几个 OpenClaw 视频,就觉得自己打通了 AI 的任督二脉,第二天就在工作群发了条消息:“从今天起,全员必须使用 AI 工具提升工作效率,各部门本周提交 AI 应用方案。”
很多事情,认知不够, 就想当然地想得简单。
AI 圈现在招人,连岗位名字都透着点不寻常。
刚刚,OpenAI 把 Codex 塞进了手机了,将Codex 集成进 ChatGPT 移动端 APP,目前正以 preview 形式在 iOS 和 Android 上滚动上线,并且面向所有 ChatGPT plans,包括 Free 和 Go开放。
路透社今天报道称,美国已经批准约10家中国公司购买英伟达H200芯片,包括阿里巴巴、腾讯、字节跳动、京东、联想和富士康等。报道同时提到,虽然美国已经给出许可,但目前还没有H200芯片实际交付。
jina-embeddings-v5-omni正式发布,我们把 v5-text 向量模型的能力延伸到图像、音频和视频。文本侧不变,v5-omni 产出的文本向量与 v5-text逐字节一致,无需重建任何已有索引。
开普勒机器人前 CEO 胡德波已开启具身智能赛道的第二次创业,新公司名为「索塔无界」。这一次,他选择了一条和开普勒不同的路。索塔无界将在今年夏天展示完整大脑能力,包括世界模型、多模态 VLA 以及 Physica-Claw 机器人操作系统,并在实验室跑通早期商业场景全流程。
1968 年的旧金山,计算机科学家道格拉斯·恩格尔巴特在一场后来被称为「演示之母(The Mother of All Demos)」的发布会上,拿出一个带着两个金属轮子的木制小盒子,向世界介绍了一个新物种:鼠标。
“帮我搭个读书笔记网站,带登录和搜索,能导出的那种。”