
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦!
超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦!
企业内落地 Agent,三个关键点是模型、数据、场景。
技术在进化,验证码也该变得更有人情味一点。
扩散模型(Diffusion Models, DMs)如今已成为文本生成图像的核心引擎。凭借惊艳的图像生成能力,它们正悄然改变着艺术创作、广告设计、乃至社交媒体内容的生产方式。
从来没想过,AI 跑出来的语音,竟然可以摆脱「外国人说中文」,对味儿!Google 系的第一大爆款 NotebookLM 发布更新,现在(终于)支持多达五十种语言来生成播客——包括中文。
Midjourney v7上线后,配套的角色参考(cref)功能一直迟迟未公布。当时我就有个预感,也在评测文章里说过:这可能是个全新功能的伏笔。果然,今天Midjourney正式公布「Omni-Reference」,即「全向参考」,或翻译成「万能参考」,配合--oref、--ow两个参数使用,这不是Character Reference的v7升级版,而是一次全面的参考进化。
世界首个公开可用AI科学家天团,刚刚组团出道!FutureHouse发布了四个AI科学家Agent,科研能力直接超越o3,文献搜索已经超过人类博士。
MCP逐渐行业标准,提出者Anthropic也官宣了Claude两项重大的针对性更新——
25年前,10岁的Rose Yu收到一台改变命运的电脑,从玩游戏到成为AI领域的领军人物,她如何用物理学与深度学习破解交通、飓风和核聚变的难题?跟随她的脚步,揭秘一位天才科学家的开挂人生!
AI裁员时代,大幕开启!Shopify CEO的内部信震惊了全网:全员All in AI,使用AI要形成条件反射;每年贡献提升20%-40%才有竞争力;团队要想招人,先要证明AI做不到。正式打响AI裁员第一枪!
毫无疑问,AI 现在是最火热的话题与生意,这两个简单的字母蕴藏了太多的创业热情与机会,AI 医疗、AI 教育、AI 服务,甚至赛博算命 AI 占卜也大行其道,整个社会进入了 AI 时间。
当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要复杂规划和错误恢复的任务时常常力不从心。
南加州大学团队只用9美元,就能在数学基准测试AIME 24上实现超过20%的推理性能提升,效果好得离谱!而其核心技术只需LoRA+强化学习,用极简路径实现超高性价比后训练。
大模型竞技场的可信度,再次被锤。
Hi,我想先请你只看下面这张照片,推测它的拍摄城市:
近日,ISCA Fellow 2025 入选结果揭晓!
这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。
LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。
随着技术成熟度提升,以及人们逐渐认识到AI节省时间与成本的潜力,预计将涌现大批面向消费者的AI产品,实现全流程任务代劳。
日前,诺奖得主、AI教父Geoffrey Hinton联合10名前OpenAI员工及其他业内人士联合发表公开信反对OpenAI的重组计划,理由非常直接:OpenAI违背了他们的慈善宗旨,即确保AGI的安全开发和造福人类。
昆仑自研的AI模型(SOTA)就像是“最好的锄头”,正在助力公司开采AIGC领域那片“最肥沃的金矿”。
这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉,目前网传信息的真实性含量很低。
Mona(Multi-cognitive Visual Adapter)是一种新型视觉适配器微调方法,旨在打破传统全参数微调(full fine-tuning)在视觉识别任务中的性能瓶颈。
现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。
其实……不用大段大段思考,推理模型也能有效推理!
近日,美国 AI 初创公司 Anthropic(Claude 背后公司)就美国商务部的《人工智能扩散框架》临时最终规则提交意见书,呼吁加强对高端AI 芯片的出口控制。更具争议性的是,Anthropic 在博客中声称,中国已建立起高度成熟的芯片走私网络,涉及金额高达数亿美元。
Anthropic 刚推出了 Integrations 和 Advanced Research 模式更新。这不仅是 Claude 在 DeepResearch 发展历程中的关键里程碑,更是 AI 协作和研究领域的一次重大飞跃
“与AI健康APP签订长寿协议?”这或许听起来不可思议,但确实是AI健康应用Cudis在海外抛出的最新概念。2024年9月,Cudis获得了由Draper Associates领投的500万美元种子资金,同年12月,其推出了一款官方定价为349美元的智能戒指Cudis 002。
这段时间 “Agent” 成了热词,开会、聊天、朋友圈,大家都在聊。但每个人说的 “Agent” 其实都不一样,听多了反而更迷糊:究竟什么是 Agent?和我们熟悉的生成式 AI 有什么不同?这是我目前见过最清晰解释 Agent 的文章。
当AI闯入营销界,会掀起怎样的风暴?哥大辍学天才Kennan打造的Icon,以1美元成本颠覆6000亿广告市场,30天狂揽500万美元ARR,用技术改写行业。