AI资讯新闻榜单内容搜索-Claude3

多模态能力全球TOP3，来自中国从容大模型

国产多模态大模型的头号交椅，再次易主

来自主题: AI资讯

7749 点击 2024-07-02 18:20

击败Gemini-1.5-Pro、GPT-4V，从容大模型多模态能力跻身全球前三

近日，云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，仅次于 GPT-4o（69.9）和 Claude3.5-Sonnet（67.9）。

来自主题: AI资讯

10157 点击 2024-06-29 00:19

陈丹琦团队图表解读新基准：新王Claude3.5刚及格，但已是模型最强推理表现

Claude 3.5 Sonnet的图表推理能力，比GPT-4o高出了27.8%。针对多模态大模型在图表任务上的表现，陈丹琦团队提出了新的测试基准。新Benchmark比以往更有区分度，也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报

11021 点击 2024-06-29 00:07

大模型测试题爆火，GPT-4和Claude3都跪了，LeCun转发：新Benchmark

还有12款大模型全军覆没……

来自主题: AI资讯

12216 点击 2024-06-25 10:36

陈丹琦团队新作：微调8B模型超越Claude3 Opus，背后是RLHF新平替

比斯坦福DPO（直接偏好优化）更简单的RLHF平替来了，来自陈丹琦团队。该方式在多项测试中性能都远超DPO，还能让8B模型战胜Claude 3的超大杯Opus。而且与DPO相比，训练时间和GPU消耗也都大幅减少。

来自主题: AI资讯

10863 点击 2024-05-27 16:39

a16z 对话 Poe 创始人：大模型幻觉是创业公司的机会；AI 的未来是多模型、多模态

作为 Meta 的前 CTO，Quora CEO Adam D'Angelo 目前还是 OpenAI 的董事会成员，在 Quora 之外推出的 Poe，成为当下接入大模型最多的 Chatbot 平台：GPT-4、Claude3、Mistral 等模型都有，用户也可以在上面搭建自己的 Chatbot 机器人，如果有别的用户使用，还可以产生收益。

来自主题: AI技术研报

11343 点击 2024-04-02 10:05