
中文大模型幻觉测评系列:事实性幻觉测评结果发布!
中文大模型幻觉测评系列:事实性幻觉测评结果发布!SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。
来自主题: AI资讯
8115 点击 2025-04-15 17:04
SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。
国产大模型,多模态能力都开始超越GPT-4-Turbo了??