AI资讯新闻榜单内容搜索-语言模型

这一次，天玑9500的端侧AI能力，友商赶不上了

9 月 22 日下午，联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500，并展示了一系列新形态端侧的 AI 应用，在公众层面首次推动端侧 AI 从尝鲜到好用。现在，让手机端大语言模型（LLM）处理一段超长的文本，最长支持 128K 字元，它只需要两秒就能总结出会议纪要，AI 还能自动修改你的错别字。

来自主题: AI资讯

8827 点击 2025-09-22 19:09

突破单链思考上限，清华团队提出原生「并行思考」scale范式

近年来，大语言模型（LLMs）在复杂推理任务上的能力突飞猛进，这在很大程度上得益于深度思考的策略，即通过增加测试时（test-time）的计算量，让模型生成更长的思维链（Chain-of-Thought）。

来自主题: AI技术研报

7973 点击 2025-09-18 14:49

1个 AI Agent=4个工厂老师傅？｜和王筱圃聊时序大模型和 toB Agent 这门生意

本周，我们关注 Agent 与工业结合正在发生的变化，我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃，和我们聊一聊什么是时序大模型，和大语言模型的区别和具体的案例，他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。

来自主题: AI资讯

9487 点击 2025-09-17 09:29

想让LLM精确输出？试下XML格式Prompt语法约束解码GCD，帮你迭代收敛到稳定解

随着Agent的爆发，大型语言模型（LLM）的应用不再局限于生成日常对话，而是越来越多地被要求输出像JSON或XML这样的结构化数据。这种结构化输出对于确保安全性、与其他软件系统互操作以及执行下游自动化任务至关重要。

来自主题: AI技术研报

8350 点击 2025-09-16 10:19

全新开源模型复现o3视觉推理，无需大量训练即可实现深度思考

OpenAI o3的多轮视觉推理，有开源平替版了。并且，与先前局限于1-2轮对话的视觉语言模型（VLM）不同，它在训练限制轮数只有6轮的情况下，测试阶段能将思考轮数扩展到数十轮。

来自主题: AI技术研报

9840 点击 2025-09-16 10:02

LLaSO 横空出世：逻辑智能推出全球首个完全开源语音大模型框架，定义 LSLM 研究新基准

北京深度逻辑智能科技有限公司推出了 LLaSO—— 首个完全开放、端到端的语音语言模型研究框架。LLaSO 旨在为整个社区提供一个统一、透明且可复现的基础设施，其贡献是 “全家桶” 式的，包含了一整套开源的数据、基准和模型，希望以此加速 LSLM 领域的社区驱动式创新。

来自主题: AI技术研报

8452 点击 2025-09-15 08:39

谢菲尔德大学：模型幻觉的数学必然性

幻觉不是 bug，是数学上的宿命。谢菲尔德大学的最新研究证明，大语言模型的幻觉问题在数学上不可避免—— 即使用完美的训练数据也无法根除。而更为扎心的是，OpenAI 提出的置信度阈值方案虽能减少幻

来自主题: AI技术研报

10369 点击 2025-09-15 08:34

将KV Cache预算降至1.5%！他们用进化算法把大模型内存占用砍下来了

只用 1.5% 的内存预算，性能就能超越使用完整 KV cache 的模型，这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路。

来自主题: AI技术研报

8182 点击 2025-09-15 08:33

扩散语言模型有MoE版了！蚂蚁&人大从头训练LLaDA-MoE，将完全开源

挑战自回归的扩散语言模型刚刚迎来了一个新里程碑：蚂蚁集团和人大联合团队用 20T 数据，从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数仅 1.4B，但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B，而且推理速度更快。这为扩散语言模型的技术可行性提供了关键验证。

来自主题: AI技术研报

9761 点击 2025-09-15 08:30

你知道吗？相较于产生幻觉，LLM其实更会「说谎」｜卡梅隆最新

幻觉并非什么神秘现象，而是现代语言模型训练和评估方式下必然的统计结果。它是一种无意的、因不确定而产生的错误。根据OpenAI9月4号论文的证明，模型产生幻觉(Hallucination)，是一种系统性缺陷。

来自主题: AI技术研报

9470 点击 2025-09-12 10:41