AI资讯新闻榜单内容搜索-LLM

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

大模型Agent帮你自动操作电脑，理想很丰满，现实却骨感。

来自主题: AI技术研报

7452 点击 2025-10-27 16:56

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持上仍存挑战。

来自主题: AI技术研报

7487 点击 2025-10-27 16:46

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

在一篇论文中，研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询，其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%，即便用户的提问涉及操纵、欺骗或其他人际伤害等情境，模型仍倾向于给予肯定回应。

来自主题: AI技术研报

6697 点击 2025-10-27 15:57

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

聚焦大型语言模型（LLMs）的安全漏洞，研究人员提出了全新的越狱攻击范式与防御策略，深入剖析了模型在生成过程中的注意力变化规律，为LLMs安全研究提供了重要参考。论文已被EMNLP2025接收

来自主题: AI技术研报

5450 点击 2025-10-27 10:25

NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻

近期，来自北航等机构的研究提出了一种新的解决思路：自回归奖励引导表征编辑（ARGRE）框架。该方法首次在 LLM 的潜在表征空间中可视化了毒性从高到低的连续变化路径，实现了在测试阶段进行高效「解毒」。

来自主题: AI技术研报

5820 点击 2025-10-26 10:28

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

为破解大模型长思维链的效率难题，并且为了更好的端到端加速落地，我们将思考早停与投机采样无缝融合，提出了 SpecExit 方法，利用轻量级草稿模型预测 “退出信号”，在避免额外探测开销的同时将思维链长度缩短 66%，vLLM 上推理端到端加速 2.5 倍。

来自主题: AI技术研报

7871 点击 2025-10-24 16:53

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

全球六大LLM实盘厮杀，新王登基！今天，Qwen3 Max凭借一波「快狠准」操作，逆袭DeepSeek夺下第一。Qwen3 Max，一骑绝尘！而GPT-5则接替Gemini 2.5 Pro，成为「最会赔钱」的AI。照目前这个趋势，估计很快就要跌没了……

来自主题: AI资讯

8740 点击 2025-10-23 16:48

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

香港科技大学KnowComp实验室提出基于《欧盟人工智能法案》和《GDPR》的LLM安全新范式，构建合规测试基准并训练出性能优异的推理模型，为大语言模型安全管理提供了新方向。

来自主题: AI技术研报

8820 点击 2025-10-23 12:20

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

7351 点击 2025-10-22 15:00

AI资讯新闻榜单内容搜索-LLM

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”