Bayescore

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Bayescore
访问
7
15003

我们给自己打了46分(满分100分),并发布了结果。


Bayescore 是一款基于双通对抗性大语言模型评估的文档 claims 评分工具。你只需传入包含主张的文档,它就能自动提取主题与标准构成的假设,推导出谓词并逐一评分,还会将缺乏证据视为不利证据。该工具团队对自己进行了测试,最终得出 46/100 的 D 级评分并公开了完整分析结果。