
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度
Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度
今年3月,阿里巴巴旗下淘天有限公司发文,正式启动2026届春季实习生全球招聘活动。该次招聘开放七大职类,提供超50个不同岗位。此前,阿里巴巴集团CEO吴泳铭曾宣布,未来三年将投入超过3800亿元用于建设云和AI硬件基础设施。2月27日,阿里巴巴启动2026届春季实习生招聘,开放的3000多个岗位中,AI相关岗位占到了五成。
谷歌 Gemma 3 上线刚刚过去一个月,现在又出新版本了。
据外媒报道,OpenAI 正计划以约 30 亿美元收购 AI 编码助手初创公司 Windsurf(前身为 Codeium),以进一步完善其在全栈编码领域的技术布局。
AI智商再创新高!OpenAI o3以惊人的136分刷新门萨智商测试纪录,超越不久前登顶的Gemini 2.5 Pro。更令人瞩目的是其强大的图像理解能力:仅凭一张无EXIF信息的菜单或风景照,o3就能精准推理并反向定位拍摄地点,引发了用AI玩「照片寻址(GeoGuessr)」的新热潮。
知道大模型接下来要卷视觉推理,但没想到这么卷——数学试卷都快要不够用了。
公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Claude-3.7-Sonnet这些顶尖大模型全部惨败!最强的AI正确率也只有57.5%,而人类TOP选手却能接近满分。
谷歌发布首款混合推理模型Gemini 2.5 Flash,引入了革命性「思考预算」,可灵活控制推理深度,性能一举击败Claude 3.7,比肩o4-mini。而且,关闭思考模式成本直降600%。
根据彭博社消息,广受欢迎的 AI 编程助手 Windsurf 的开发商正与 OpenAI 洽谈收购事宜,交易金额约为 30 亿美元。
作为玩家基数庞大的60级显卡新品,RTX 5060 Ti带来了显著的性能飞跃。得益于强大的DLSS 4多帧生成黑科技,它不仅能在合理设置下以4K运行大型3A游戏,而且还能轻松跑通本地AI大模型。