刚刚,Anthropic王炸Claude泄露!全面碾压Opus 4.6引爆全网
刚刚,Anthropic王炸Claude泄露!全面碾压Opus 4.6引爆全网刚刚,《财富》独家爆出——由于一次罕见的「人为配置」错误,最强大模型「Claude Mythos」绝密细节公之于众。Claude Mythos代号「Capybara」,代表最高「层级」,是一款具有划时代意义的全新模型。
刚刚,《财富》独家爆出——由于一次罕见的「人为配置」错误,最强大模型「Claude Mythos」绝密细节公之于众。Claude Mythos代号「Capybara」,代表最高「层级」,是一款具有划时代意义的全新模型。
就在刚刚,NeurIPS在X上公开道歉,并表明: 我们已经更新了手册,与ACM、IEEE以及其他国际会议和往届NeurIPS的投稿规则保持一致。与往年一样,NeurIPS欢迎所有符合合规要求的机构和个人提交论文。
硅心科技(aiXcoder)发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型 aiX-apply-4B。基准测试结果显示,在 20 多种主流编程语言及 Markdown 等多类型文件格式的测试中,aiX-apply-4B 的平均准确率达到 93.8%,超越 Qwen3-4B 基座模型 62.6% 的准确度
这场圆桌由杨植麟主持,嘉宾是智谱的张鹏、无问芯穹的夏立雪、小米MiMo的罗福莉,还有港大的黄超。这场圆桌由杨植麟主持,嘉宾是智谱的张鹏、无问芯穹的夏立雪、小米MiMo的罗福莉,还有港大的黄超。
就在昨天,ARC-AGI-3刚把全球顶尖大模型按在地上摩擦,结果一家名不见经传的公司却给出惊天消息:他们的AI在首日就取得了36.08%的成绩!这匹黑马究竟靠什么撕开全球最难AI考试的铁幕?是真突破,还是另有玄机?
据外媒The Information援引知情人士消息透露, Anthropic的高管们已经讨论过最早于今年第四季度进行该公司的IPO(首次公开募股),可能在IPO中筹集超过600亿美元(约合4146.9亿元人民币)的资金。
我最近实测阿里Qoder「专家团模式(Experts Mode)」后,发出了上述感慨。在「专家团模式」下,Qoder直接给我组织了一支赛博工程团队,我就负责看,专家团负责干。它帮我自动解析需求,分配任务,调配前端、后端、测试、运维等不同职责的“工程师”,驱动多个智能体同时推进任务,直接让我躺着当了回CTO。
昨日凌晨,谷歌正式推出其最高质量的音频和语音模型——实时语音模型Gemini 3.1 Flash Live,并在Gemini App、Search Live以及Google AI Studio中同步开放,其中后者以预览版本向开发者提供。
就在刚刚,据彭博社报道,iOS 27 将引入一套名为「Extensions」的新机制,允许用户通过设置面板,把 Google Gemini、Anthropic Claude 等第三方 AI 接入 Siri,就像现在调用 ChatGPT 一样直接从 Siri 发起请求。
前几天,一篇来自Kimi的论文「ATTENTION RESIDUALS」在 AI 圈引发了激烈讨论——马斯克罕见地发出评价:"Impressive work from Kimi"。同时,两位前Openai大佬也同样发出了高度评价,OpenAI 「推理模型之父」Jerry Tworek表示“深度学习2.0时代即将到来”。
近日,金融AI领跑者讯兔科技(Alpha派)正式完成近2亿元A轮融资。继去年10月完成超亿元Pre-A轮融资后,讯兔科技在短短5个月内再获顶级机构强强加持。讯兔科技的核心团队成员均来自国内头部资管机构,拥有稀缺的投研基因。团队成员曾主导头部公募基金数字化体系建设,并曾在FactSet、标普全球、汤森路透等国际金融资讯巨头担任过技术研发与商业化核心高管。
前两天,知名畅销书作家 Adam Kay 在社交媒体 X 分享了自己的经历:他心血来潮,把自己的作品丢进一款 AI 检测器里查重,结果系统信誓旦旦地判定其中有 29.7% 的内容由机器生成。
昨日晚间,前阿里千问大模型负责人林俊旸(Junyang Lin)在社交平台X上发表了《从“推理式思考”到“智能体式思考”(From "Reasoning" Thinking to "Agentic" Thinking)》的长文,引起AI技术产业圈关注。
今夜,整个AI圈震动了。全球最难AGI测试ARC-AGI-3一上线,就把全球顶尖AI打到集体失声,人类满分通关,最强模型Opus 4.6得分仅0.2%,还不到1%。AI这是一夜被打回「原始人」了。
Cursor套壳Kimi这事还没完…… 最新消息,Cursor放出Composer 2技术报告,力证自己还是有在“自研”。(doge) 不是纯套,而是有技术地套、循序渐进地套。用的方法,还是他们一开始就强调的预训练+强化学习。
最近,一家名为 Memvid 的初创公司发布了一则颇具争议的招聘:寻找一名“职业 AI 喷子”,用整整一天时间,对主流聊天机器人进行高强度压力测试,核心任务只有一个——把 AI 的“记忆缺陷”问题彻底暴露出来。
「我造了一个东西」的感觉,是我在任何手机上都没体验过的。 作者|张勇毅 编辑|靖宇 去年,Nothing 发布了它的第一台旗舰机 Phone (3)。今年,它没有接着发旗舰,而是发了一台中端机——Ph
OpenClaw 又开始日更了:Skills 安装终于不用自己猜缺什么了,系统会手把手告诉你下一步;控制台界面也大改,找东西不再像在迷宫里转。另外堵上了一个文件访问的安全漏洞,Telegram、Discord、WhatsApp 的频道 bug 也扫了一轮。
2026年3月26日彭博独家爆料,AI独角兽Moonshot AI(月之暗面)正处于考虑在香港进行IPO的早期阶段,计划登陆香港资本市场。
一个好的「AI 陪伴」产品该长什么样?
很怀念过去的 PC 市场。
用 Claude Code 写代码的人都熟悉一个场景:Claude 每执行一个命令、每改一个文件,都要你点一次“同意”。Anthropic 的数据显示,用户 93% 的操作都会批准。也就是说,这个“安全审批”环节,绝大多数时候只是一个条件反射。
「人形机器人如果有最终形态,那一定会是有头有脸,你觉得呢?」
凌晨三点,Claude Code 迎来了一个大动作,堪称里程碑式的深水炸弹!
广大科研人们,属于你们的科研龙虾SciClaw横空出世了!用它接管深夜的实验室,博士僧们终于可以睡个好觉了。
看过 HBO 神剧《硅谷》(Silicon Valley)的朋友,想必都对那个名为 Pied Piper(魔笛手)的虚构公司念念不忘。
葬AI开源了两个项目,一个没有前端,一个没有后端。
小红书博主 @AI Dance 整理了一份「百虾大战」名单,我在她基础上又补了一轮,国内加海外,能叫得上名字的龙虾产品——我数了一下,40 多个。
一份「反常识」的财报背后,是 Keep 在 AI 时代转型的决心和结果。
能无限进步的「超级智能体」来了!