
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看谷歌又放新大招了,将图像生成常用的“扩散技术”引入语言模型,12秒能生成1万tokens。
谷歌又放新大招了,将图像生成常用的“扩散技术”引入语言模型,12秒能生成1万tokens。
当OpenAI、谷歌还在用Sora等AI模型「拍视频」,英伟达直接用视频生成模型让机器人「做梦」学习!新方法DreamGen不仅让机器人掌握从未见过的新动作,还能泛化至完全陌生的环境。利用新方法合成数据直接暴涨333倍。机器人终于「做梦成真」了!
今年,Google算是打了个翻身仗。
2025 年以来,Agent 开发量和使用量都有明显提高。Agent 的爆发带来了 Agent Infra 需求的爆发。在过去 1-2 年,Agent 开发大多依赖开发者手动使用传统 Infra 搭建,开发工程量大、流程复杂,但随着越来越多 Agent-native Infra 涌现,Agent 开发的难度和周期都在缩小,开发的范式正在重构和收敛。
HALO框架通过三大创新机制重塑多Agent(MAS)协作方式:层次化推理架构克服了认知过载问题,让智能体各司其职;动态角色实例化能针对不同任务匹配专业智能体;基于MCTS的搜索引擎自动探索最优推理路径。它能将模糊的用户查询转化为专业提示,分解复杂任务并动态调整执行计划。
你以为照镜子只能看出自己昨晚熬夜没睡好?现在,科学家开发出一款AI工具「FaceAge」,通过一张脸,就能判断你到底多「老」——不是身份证上的年龄,而是藏在细胞深处的生物年龄!关键是,这不光是「看起来老不老」,还关系到你扛不扛得住癌症治疗!
AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。
与当前大部分AI+research产品的关注点不同,Bridgetown Research通过AI赋能市场调查中的专家访谈、竞品对比以及数据分析的全过程,从二手数据开始,结合领域专家的知识框架提出关键假设,AI通过联系专家和客户进一步收集原始数据并进行分析,完成最终报告,极大缩减尽职调查所需的时间成本。
昨天,微软在 Build 大会上刚刚甩出“Windows 子系统”和“Copilot 开源”的重磅炸弹,整个开发者圈还没从热议中缓过劲来,转眼今天凌晨,谷歌就在 I/O 大会上掏出了自己的“王炸”牌——一场 AI 盛宴,正式上演!
5月23-24日AICon上海站,聚焦Agent、多模态、端侧智能、Data for AI 等 50+ 热点话题,涉及 20+ AI 应用案例,兼具实操价值与未来洞见。