AI资讯新闻榜单内容搜索-eva

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: eva
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。

来自主题: AI技术研报
10185 点击    2024-08-21 14:28
大模型常用评测基准汇总

大模型常用评测基准汇总

大模型常用评测基准汇总

基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯
10319 点击    2024-07-23 19:24
大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16存储,模型大小约为350GB,而即使是英伟达最新的B200 GPU 内存也只有192GB ,更不用说其他GPU和边缘设备。

来自主题: AI技术研报
8506 点击    2024-06-19 23:30
网红已经开始用AI克隆自己赚钱了

网红已经开始用AI克隆自己赚钱了

网红已经开始用AI克隆自己赚钱了

2023 年 5 月中旬,小冰公司在中国和日本市场悄悄启动了一项 “克隆人” 计划。最近,这项计划正式被揭开了面纱。

来自主题: AI资讯
7269 点击    2024-01-12 17:40
一言不合就跑分,国内AI大模型为何沉迷于“刷榜”

一言不合就跑分,国内AI大模型为何沉迷于“刷榜”

一言不合就跑分,国内AI大模型为何沉迷于“刷榜”

商业利益的加入,就必然会驱使AI大模型厂商争先恐后去刷榜了。“不服跑个分”这句话,相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件,由于能够在一定程度上反映手机的性能,因此备受玩家的关注。

来自主题: AI资讯
5251 点击    2023-12-03 15:31
ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。

来自主题: AI资讯
4945 点击    2023-11-16 13:18