One RL to See Them All?一个强化学习统一视觉-语言任务!
One RL to See Them All?一个强化学习统一视觉-语言任务!强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而,RL 在推理任务之外的应用,尤其是在目标检测 和目标定位等感知密集型任务中的应用,仍有待深入探索。
强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而,RL 在推理任务之外的应用,尤其是在目标检测 和目标定位等感知密集型任务中的应用,仍有待深入探索。
超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。
国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」国外大模型。
我用MiniMax最近发布的MCP Server,做了一个 《会说话的博物馆》
Transformer架构主导着生成式AI浪潮的当下,但它并非十全十美,也并非没有改写者。
国内最大MCP中文社区上线了,支付宝、MiniMax明星服务在魔搭MCP广场独家首发,还有近1500款MCP服务全领域覆盖,再次降低AI开发门槛。
MiniMax尤为特殊,从一开始就跟其他玩家不在同一赛道竞争。通用大模型上,MiniMax坚持“产模一体”的理念,即所有的底座模型都要服务于产品。同处于To C赛道,Kimi主战地在国内,MiniMax战略重点在海外市场。
2月19日消息,钛媒体AGI独家获悉,中国AI大模型独角兽MiniMax(稀宇科技)合伙人、公司副总裁、开放平台负责人魏伟,已经于近期离职。对上述消息,MiniMax向钛媒体AGI独家回应:消息属实,MiniMax 国内B端业务迎来新的发展阶段,将由其他负责人带领团队。MiniMax将持续提升技术能力,为海内外更多客户带来高质量体验。
"不要用移动互联网的逻辑来做AI"——这句来自MiniMax创始人闫俊杰的观点,在《晚点》刊发后迅速引发行业热议。它不仅道出了当下AI创业者的迷思,更揭示出整个行业正在经历的转折.
早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。