AI资讯新闻榜单内容搜索-Arena

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Arena
大模型常用评测基准汇总

大模型常用评测基准汇总

大模型常用评测基准汇总

基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯
12269 点击    2024-07-23 19:24
力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议

力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议

力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议

导读:时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上,以27B的参数击败了许多更大规模的模型,甚至超过了70B的Llama-3-Instruct,成为开源模型的性能第一!

来自主题: AI资讯
9443 点击    2024-07-02 11:20
3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick 关注前沿科技 量子位 2024-05-28 12:29 北京

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick 关注前沿科技 量子位 2024-05-28 12:29 北京

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick 关注前沿科技 量子位 2024-05-28 12:29 北京

3D生成也有自个儿的人工评测竞技场了~ 来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测

来自主题: AI资讯
9707 点击    2024-05-28 20:50
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

最公平的大模型基准测试诞生了!来自LLM竞技场,最接近人类偏好,数据新鲜、速度快、成本低,严格分离学渣和学霸。

来自主题: AI技术研报
10839 点击    2024-05-20 16:20
新测试基准发布,最强开源Llama 3尴尬了

新测试基准发布,最强开源Llama 3尴尬了

新测试基准发布,最强开源Llama 3尴尬了

随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。

来自主题: AI资讯
3882 点击    2024-04-22 20:58
超越GPT-4,Claude 3超大杯成新王!

超越GPT-4,Claude 3超大杯成新王!

超越GPT-4,Claude 3超大杯成新王!

太疯狂了!Claude 3 Opus竟然干掉了GPT-4。在Chatbot Arena最新的聊天机器人对战排行榜中,Claude 3的超大杯成功登顶,就连最小的Claude 3 HaiKu都达到了GPT-4水平!

来自主题: AI资讯
5615 点击    2024-03-27 17:47
GPT-4不服被Bard反超:最新模型已入场

GPT-4不服被Bard反超:最新模型已入场

GPT-4不服被Bard反超:最新模型已入场

“大模型排位赛”权威榜单Chatbot Arena刷新:谷歌Bard超越GPT-4,排名位居第二,仅次于GPT-4 Turbo。

来自主题: AI技术研报
7303 点击    2024-01-31 11:42