
颠覆传统信息搜索,效果是之前SOTA的三倍?UIUC韩家炜、孙冀萌团队开源DeepRetrieval,让模型端到端地学会搜索!
颠覆传统信息搜索,效果是之前SOTA的三倍?UIUC韩家炜、孙冀萌团队开源DeepRetrieval,让模型端到端地学会搜索!在信息检索系统中,搜索引擎的能力只是影响结果的一个方面,真正的瓶颈往往在于:用户的原始 query 本身不够好。
在信息检索系统中,搜索引擎的能力只是影响结果的一个方面,真正的瓶颈往往在于:用户的原始 query 本身不够好。
Q-Insight不再简单地让模型拟合人眼打分,而是将评分视作一种引导信号,促使模型深度思考图像质量的本质原因。有了会思考的“大脑”,视频云技术栈不仅得以重塑也让用户体验有了跃迁。
路由LLM是指一种通过router动态分配请求到若干候选LLM的机制。论文提出且开源了针对router设计的全面RouterEval基准,通过整合8500+个LLM在12个主流Benchmark上的2亿条性能记录。将大模型路由问题转化为标准的分类任务,使研究者可在单卡甚至笔记本电脑上开展前沿研究。
图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练,以强化其指令跟随能力。受语言领域的启发,多模态偏好优化技术凭借其在数据效率和性能增益方面的优势,被广泛用于对齐人类偏好。目前,该技术主要依赖高质量的偏好数据标注和精准的奖励模型训练来提升模型表现。然而,这一方法不仅资源消耗巨大,训练过程仍然极具挑战。
我之前拉了一个AI自媒体的群,就...同行交流,互相学习。
今日凌晨,Meta AI 部门副总裁 Ahmad Al-Dahle 发文,回应了近日发布的 Llama 4 大模型的争议问题:对于「不同服务中模型质量参差不齐」这一问题,Ahmad Al-Dahle 解释称,由于模型一准备好就发布了,所以 Meta 的团队预计所有公开的应用实现都需要几天时间来进行优化调整,团队后续会继续进行漏洞修复工作。
随着AI能力的迭代升级,可以发现一个明显的趋势,AI已经从最初理解人类进行智能对话,逐渐演变成一种情感治愈工具。而这种工具的体现形式不仅仅限于正值火热的AI萌宠硬件、AI社交软件,还有一些小众的细分应用,比如AI解梦。
Agentic AI 的 3 要素是:tool use,memory 和 context,围绕这三个场景会出现 agent-native Infra 的机会。
Kimi 开放平台的朋友们,基于 Moonshot AI 一年来的技术积累和性能优化,我们已经在北京时间 2025 年 04 月 07 日 0 点对 Kimi 开放平台提供的模型推理服务进行价格调整,具体调整方案如下:
2025 CSRankings新鲜出炉了!CMU稳坐全球第一,中国高校强势崛起,清华摘得第2,上交大与浙大并列第3,北大位居第5。中国在AI领域表现尤为抢眼,上交大、清华、北大、浙大包揽前四,中国科学院与哈工大也跻身全球前十。
几天前,AI 驱动的演示工具 Tome 宣布,将在四月底前关闭 Tome Slides 功能,并转型至销售领域(「搞定交易,而非幻灯片」:面向销售的 AI 助手)。
近日,北京字跳网络技术有限公司登记“即梦AI/Dreamina AI”作品著作权,作品类别为美术。即梦AI作为一款面向创意爱好者的AI表达平台,功能丰富。然而,在我国现行法律框架下,AI生成内容的著作权归属尚无明确界定,引发广泛讨论。
推理性能提升的同时,还大大减少Token消耗!
AI眼镜,究竟为什么这么热?
如何让大模型更懂「人」?
新的AI进化法则
推理增强型大语言模型LRM(如OpenAI的o1、DeepSeek R1和Google的Flash Thinking)通过在生成最终答案前显式生成中间推理步骤,在复杂问题解决方面展现了卓越性能。然而,对这类模型的控制仍主要依赖于传统的输入级操作,如提示工程(Prompt Engineering)等方法,而你可能已经发现这些方法存在局限性。
想象一下,你坐着时光机回到1750年——那个时代没有电,远程通信就意味着要么大声呼喊,要么朝天鸣炮,所有的交通工具都靠消耗饲料来运行。你到了那里,找一个1750年的人
在最近的一封全员邮件中,Shopify 首席执行官 Tobi Lütke 提出了一个非常激进的管理策略:团队必须证明为什么 AI 不能完成工作,然后才可能获得对应的招聘 HC。同时,他鼓励所有员工必须熟练使用 AI 。
Nacos 可以帮助应用快速把业务已有的 API 接口,转换成 MCP 协议接口,结合 Higress AI 网关,实现 MCP 协议和存量协议的转换。其中,Nacos 提供存量的服务管理和动态的服务信息定义,帮助业务在存量接口不改动的情况下,通过 Nacos 的服务管理动态生效 Higress 网关所生成的 MCP Server 协议。
奥特曼最新访谈回应一切!
AI菩萨OpenRouter连发两大招宣布推出两项重大更新。
Meta最新基础模型Llama 4发布36小时后,评论区居然是这个画风:
据 The Information 报道,Glean,一家为企业开发搜索聊天机器人的公司 ,正在与投资者进行谈判,可能筹集数亿美元的新融资,包括用于在招标中回购员工股份的资金。
「未来,99% 的 attention 将是大模型 attention,而不是人类 attention。」这是 AI 大牛 Andrej Karpathy 前段时间的一个预言。这里的「attention」可以理解为对内容的需求、处理和分析。也就是说,他预测未来绝大多数资料的处理工作将由大模型来完成,而不是人类。
对于「AI 危害」,每家公司都有不同的解决方案,但没有完美方案。
Noprop:没有反向传播或前向传播,也能训练神经网络。
最近计划用AI编程重写自己的网站,后台功能已开发差不多。
德琪医药学到了阿基米德的精髓
让大语言模型更懂特定领域知识,有新招了!