沉迷贪吃蛇,7B小模型竟变身「数学天才」!几何推理碾压GPT-4o
沉迷贪吃蛇,7B小模型竟变身「数学天才」!几何推理碾压GPT-4oNVIDIA等研究团队提出了一种革命性的AI训练范式——视觉游戏学习ViGaL。通过让7B参数的多模态模型玩贪吃蛇和3D旋转等街机游戏,AI不仅掌握了游戏技巧,还培养出强大的跨领域推理能力,在数学、几何等复杂任务上击败GPT-4o等顶级模型。
搜索
NVIDIA等研究团队提出了一种革命性的AI训练范式——视觉游戏学习ViGaL。通过让7B参数的多模态模型玩贪吃蛇和3D旋转等街机游戏,AI不仅掌握了游戏技巧,还培养出强大的跨领域推理能力,在数学、几何等复杂任务上击败GPT-4o等顶级模型。
深夜,沉寂已久的Kimi突然发布了新模型—— 开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。
你有没有想过,那些每天花费数千美元、耗时数月的市场调研项目,竟然可以在几天内完成,成本还能降低81%?当我看到Outset这家仅有14名员工的旧金山创业公司刚刚完成1700万美元A轮融资时,我意识到一个存在了几十年的行业正在被彻底颠覆。
假作真时真亦假,无为有处有还无。
图像生成界的“大魔王”Midjourney也来卷视频生成了?!
5月15日晚,区瀚楠、陈睿轩走进了上海浦东的一栋民宿。 这里没有食物、没有智能手机、没有浏览器、没有APP,只有一台预装AI工具的联网电脑、一部非智能手机、一瓶饮用水和100元生存资金,他们将在这个封闭房间里依靠AI工具生存72小时。
特朗普政府的AI大计划还没正式亮相,就在GitHub泄露了!一个叫ai.gov的网站即将上线,要把AI塞进政府每个角落。聊天机器人、超级API、实时监控工具,野心大到吓人,但网友们已经开怼:这靠谱吗?
当学术研究沦为「填空游戏」,利用美国NHANES公共数据集,结合AI工具如ChatGPT,研究者通过套用模板、排列变量,批量生产看似精美却质量堪忧的论文。背后不仅是技术的滥用,更是科研评价体系扭曲的缩影。
上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
AI从医疗工具变身为协作队友,斯坦福大学研究揭示:医生诊断准确率竟飙升10%!70名美国执业医生参与的真实测试,AI-first、AI-second与传统诊断,谁能更精准破解临床谜题?