AI资讯新闻榜单内容搜索-DrafterBen

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DrafterBen
大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令,全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力,研究结果发现当前主流大模型虽有一定能力,但整体水平仍不足以满足工程一线需求。

来自主题: AI技术研报
5740 点击    2025-07-18 12:58