基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传 基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传 关键词: AI,模型训练,人工智能,LIFEBENCH 你是否曾对大语言模型(LLMs)下达过明确的“长度指令”? 来自主题: AI技术研报 7941 点击 2025-05-29 15:12