登录成功后会自动刷新界面
我们给自己打了46分(满分100分),并发布了结果。
Bayescore 是一款基于双通对抗性大语言模型评估的文档 claims 评分工具。你只需传入包含主张的文档,它就能自动提取主题与标准构成的假设,推导出谓词并逐一评分,还会将缺乏证据视为不利证据。该工具团队对自己进行了测试,最终得出 46/100 的 D 级评分并公开了完整分析结果。