具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会最近机器人和 AI 相关领域的读者或多或少都在关注 IROS。
搜索
最近机器人和 AI 相关领域的读者或多或少都在关注 IROS。
美团LongCat团队发布了当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench(Versatile Interactive Tasks Benchmark)。VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频生活场景为典型载体,构建了一个包含66个工具的交互式评测环境,并设计了跨场景综合任务。
从C端的小美,到B端的“袋鼠参谋”、“袋鼠管家”和“智能管家”,美团已经作出了一个“AI助手”矩阵。未来,这些AI助手之间如何配合和协作,形成一个新的AI原生生态,充满了想象、但也充满了挑战。
最近,美团在AI开源赛道上在猛踩加速。今天,在开源其首款大语言模型仅仅24天后,美团又开源了其首款自研推理模型LongCat-Flash-Thinking。与其基础模型LongCat-Flash类似,效率也是LongCat-Flash-Thinking的最大特点。美团在技术报告中透露,LongCat-Flash-Thinking在自研的DORA强化学习基础设施完成训练
啊?今天早上9点多的时候。 美团上线了他们的首个生活类Agent。 名字,叫小美。 大厂们卷疯了。 这战场,真的从WAIMAI打到了AI了我靠。 而且还真的居然被我猜中了。 我上周写过美团的开源大模型
LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。
用过才知道,「快」不是万能药。
起猛了,美团这下真的开始明牌干AI了。
国内外开发者:亲测,美团新开源的模型速度超快!
没想到啊,最新SOTA的开源大模型…… 来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。