GPT-4o准确率仅为24%!权威中文教育基准:知识+情商的双重考验
GPT-4o准确率仅为24%!权威中文教育基准:知识+情商的双重考验华东师范大学智能教育学院发布OmniEduBench,首次从「知识+育人」双维度评测大模型教育能力。测评2.4万道中文题后,实验结果显示:GPT-4o等顶尖AI会做题,却在启发思维、情感支持等育人能力上远不及人类,暴露AI当老师的关键短板。
来自主题: AI技术研报
8049 点击 2025-11-15 10:15
搜索
华东师范大学智能教育学院发布OmniEduBench,首次从「知识+育人」双维度评测大模型教育能力。测评2.4万道中文题后,实验结果显示:GPT-4o等顶尖AI会做题,却在启发思维、情感支持等育人能力上远不及人类,暴露AI当老师的关键短板。