
反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假
反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假上周,福布斯、Wired等争相报道「全球最快开源推理模型」K2-Think,,甚至图灵奖得主Yann LeCun转发推文。但仅三天后,ETH五位研究员的博客如晴天霹雳:87数学评估题竟藏在训练集中!这不仅仅是技术突破,更是行业诚信的警钟。
上周,福布斯、Wired等争相报道「全球最快开源推理模型」K2-Think,,甚至图灵奖得主Yann LeCun转发推文。但仅三天后,ETH五位研究员的博客如晴天霹雳:87数学评估题竟藏在训练集中!这不仅仅是技术突破,更是行业诚信的警钟。
当Mark Lee 还在哈佛法学院就读时,一门商标法课程让他见识到仿冒产业的惊人规模——这个非法产业年产值超过 3 万亿美元。Sequoia Capital(红杉资本)前亚洲分支机构正在投资一家鲜为人知的初创公司——Marq Vision ,该公司致力于追踪并帮助下架未经授权的 AI 芯片、药品、游戏和奢侈品销售列表。
人类的大脑,会在梦里筛选记忆。如今,AI也开始学会在「睡眠」中整理、保存,甚至遗忘。Bilt部署数百万智能体,让科幻小说里的设问——「仿生人会梦见电子羊吗?」——逐步成真。那么,当AI也能选择忘记时,它会变得更像人,还是更陌生?
AI Agent是否正在催生一个全新的经济层?谷歌DeepMind和多伦多大学联合表示:是的。在这里,智能体能够以超出人类直接监管的规模和速度进行交易与协作。
很多人认为,Scaling Law 正在面临收益递减,因此继续扩大计算规模训练模型的做法正在被质疑。最近的观察给出了不一样的结论。研究发现,哪怕模型在「单步任务」上的准确率提升越来越慢,这些小小的进步叠加起来,也能让模型完成的任务长度实现「指数级增长」,而这一点可能在现实中更有经济价值。
关注 AI 行业的朋友都知道,今年上半年 MCP 火得离谱。现在热度稍微降了一些,但已经有一些产品靠 MCP 开始赚钱了。
氛围编程,正批量制造「AI保姆」。一位15年资深开发者,为赶工用AI编程,结果bug成山不得不推翻重来,痛哭半小时。如今,一种全新职业「氛围编程清理专家」冲上了热榜。
生成式AI的快与好,终于能兼得了?
你有没有想过,为什么我们每天与 ChatGPT 或其他 AI 助手聊天时,从来没有看到过广告?这并不是因为这些公司不想赚钱,而是因为没有人真正搞清楚如何在 AI 对话中优雅地植入广告。
随着Agent的爆发,大型语言模型(LLM)的应用不再局限于生成日常对话,而是越来越多地被要求输出像JSON或XML这样的结构化数据。这种结构化输出对于确保安全性、与其他软件系统互操作以及执行下游自动化任务至关重要。