AI资讯新闻榜单内容搜索-语言模型

杨震原：2021 年字节团队曾训出大语言模型，但当时 “没眼光”

ChatGPT 横空出世之前，字节跳动曾在 2021年有过一次提前关注大语言模型的机会

来自主题: AI资讯

10160 点击 2025-11-26 11:14

AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐

随着大型视觉语言模型在多个下游任务的广泛应用，其潜在的安全风险也开始快速显露。研究表明，即便是最先进的大型视觉语言模型，也可能在面对带有隐蔽的恶意意图的图像 — 文本输入时给出违规甚至有害的响应，而现有的轻量级的安全对齐方案都具有一定的局限性。

来自主题: AI技术研报

7855 点击 2025-11-25 09:30

AI安全新漏洞：一首诗就能攻破顶级大模型？

如果你想恶意攻击一个大语言模型（LLM），比如 Gemini 或者 Deepseek，你会怎么做？

来自主题: AI资讯

5884 点击 2025-11-24 10:44

通用的dLLM开发框架，让BERT掌握扩散式对话

扩散式语言模型（Diffusion Language Model, DLM）虽近期受关注，但社区长期受限于（1）缺乏易用开发框架与（2）高昂训练成本，导致多数 DLM 难以在合理预算下复现，初学者也难以真正理解其训练与生成机制。

来自主题: AI技术研报

8067 点击 2025-11-24 10:19

“美国公司制造的最好开源模型”，基模来自DeepSeek

总部位于旧金山的初创公司 Deep Cogito 发布了其最新一代旗舰模型 Cogito v2.1 671B。公司 CEO Drishan Arora 在社交平台 X 上豪情万丈地宣布：“今天，我们发布了由美国公司制造的最好的开源大语言模型。”

来自主题: AI资讯

8060 点击 2025-11-22 11:36

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

就在一周前，全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型，好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化，扩展到图像与视频扩散模型上，相较于先前的视频和图像生成框架，速度提升最高可达 57%：

来自主题: AI技术研报

7521 点击 2025-11-22 11:33

登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」

在过去两年，大语言模型 (LLM) + 外部工具的能力，已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行等场景中，大模型要想精准调用工具，不仅要求模型本身具备推理能力，还需要借助海量高质量、针对性强的函数调用训练数据。

来自主题: AI技术研报

10596 点击 2025-11-19 16:40

速递｜日本AI独角兽Sakana AI，以26.5亿美元估值完成1.35亿美元B轮融资

当美国巨头如Google、OpenAI 和 Anthropic 竞相开发支撑其 AI 产品的大型语言模型时，Sakana AI、Mistral AI、DeepSeek 和 AI21 Labs 等初创公司正凭借为特定地区、行业或独特功能设计的专业模型开辟自己的细分市场。

来自主题: AI资讯

8975 点击 2025-11-18 16:35

Agent的RL和LLM的RL是一回事吗？牛津用500+论文写成综述，一次说清Agentic RL

当我们谈论大型语言模型（LLM）的"强化学习"（RL）时，我们在谈论什么？从去年至今，RL可以说是当前AI领域最炙手可热的词汇。

来自主题: AI技术研报

9721 点击 2025-11-18 15:11

Lumina-DiMOO：多模态扩散语言模型重塑图像生成与理解

上海人工智能实验室推出了一款革新的多模态生成理解一体化的扩散语言模型 ——Lumina-DiMOO。基于离散扩散建模（Discrete Diffusion Modeling），Lumina-DiMOO 打破了多模态任务之间的壁垒，在同一离散扩散框架下，完成从文本→图像、图像→图像、图像→文本的全栈能力闭环。

来自主题: AI技术研报

8273 点击 2025-11-17 14:33