多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满
多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了!
就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了!
微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。
在麻省理工学院工作的好处之一,是能够窥见未来科技的轮廓——从量子计算的突破、可持续性能源的生产,到新型抗生素设计。若问我是否对这些领域都有深刻理解?答案是否定的。但当研究者邀请我为他们的工作拍摄纪实图像时,我能够理解其中的大部分内容。
AI能写论文、画图、考高分,但连「看表读时间」「今天是星期几」都错得离谱?最新研究揭示了背后惊人的认知缺陷,提醒我们:AI很强大,但精确推理还离不开人类。
本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。
在全球AI应用市场竞争日益激烈的今天,了解成功产品的内容构建策略至关重要。我最近深入研究了两个AI应用领域的出海标杆产品:Pollo.ai和Monica.im,希望通过这些成功案例,探索面向消费者(to C)的AI应用应该构建什么类型的内容,以如何何在不同内容类型上合理分配精力投入。
ChatGPT悄悄上线的直连Github新功能太强大!一旦连上Github,立马化身「研究怪兽」:不管是DeepSeek这样的明星开源项目,还是自己DIY的文档资料,只要放进仓库,就能交给深度研究,一键生成专业到飞起的报告。
我们发现,当模型在测试阶段花更多时间思考时,其推理表现会显著提升,这打破了业界普遍依赖预训练算力的传统认知。
本文作者分别来自中国科学院大学和中国科学院计算技术研究所。第一作者裴高政为中国科学院大学博士二年级学生,本工作共同通讯作者是中国科学院大学马坷副教授和黄庆明教授。
太疯狂了,AlphaGo的「第37步」时刻,已经来临。谷歌的AlphaEvolve,让我们从此进入AI创造科学的时代,人类科研将彻底颠覆!背后的研究者也首次接受采访,揭秘研究过程中的一些惊人细节。