谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了
谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
欢迎大家尝试前不久GitHub的日榜榜首项目——Claude Context。通过在AI coding场景引入混合检索,Claude Context相比使用grep的原生 Claude Code 能大幅提升检索精度和效率,减少约 40% 的 不必要Token 消耗。
谷歌豪掷400亿美元加注Anthropic,自家Gemini正面对垒的「敌人」。当Claude年化收入一年暴涨30倍冲到300亿,当算力成为AI下半场唯一硬通货,与其用Gemini硬刚,不如把对手变成TPU最大买家。
Buzzy(https://www.buzzy.now/)是AI内容创作公司“感知阶跃”旗下的视频编辑Agent平台,主要面向C端内容创作者和中小型商家。好比“视频版的PhotoShop”,用户只需下达自然语言指令,就能驱动Agent对视频进行背景去除、光线修正、产品替换、背景/视角更改等编辑操作。
就在今天,AI机器人初创Medra正式发布美国规模最大的AI全自动自主实验室ML001。这座实验室不到90天建成,占地3.8万平方英尺,配备数百台机器人,全天候不间断运行。
OpenAI向全美医生免费开放临床版ChatGPT,功能直指转诊信、保险预授权、病历文书,但医生必须得先证明自己真是医生才能入场。OpenAI这波操作,是要直接抢占全美医生的桌面。
4月24日,AI生物制造企业天鹜科技发布对话式蛋白质研发智能体 MatwingsVenus™(晓鹜™)。该平台能通过对话智能体完成行业研究、标签数据库检索、蛋白质设计、自动化实验验证、专家在线协同等工作, 实现“设计即验证、验证即迭代”的智能化研发。
阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景,在架构上引入Multi-Token Prediction(多Token预测)以提升推理效率,并通过扩展上下文窗口强化长内容识别能力。
近日,AI医疗企业奥明星程宣布完成超亿元A轮融资,继Pre-A轮之后,该企业在一年内实现融资规模超5倍增长。
今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器。