AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
最强开源大模型Llama 3来了,4000亿参数狙击GPT-4,训练数据达Llama 2七倍

最强开源大模型Llama 3来了,4000亿参数狙击GPT-4,训练数据达Llama 2七倍

最强开源大模型Llama 3来了,4000亿参数狙击GPT-4,训练数据达Llama 2七倍

智东西4月19日消息,Meta推出迄今为止能力最强的开源大模型Llama 3系列,发布8B和70B两个版本。 Llama 3在一众榜单中取得开源SOTA(当前最优效果)。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。

来自主题: AI技术研报
9273 点击    2024-04-20 12:10
去年爆火的大模型综述,如今出书了(免费获取见文末)

去年爆火的大模型综述,如今出书了(免费获取见文末)

去年爆火的大模型综述,如今出书了(免费获取见文末)

相信很多朋友都看过这篇论文,在 2023 年 3 月,一支来自加拿大滑铁卢大学、清华大学和新加坡管理大学的团队,发表了一篇大模型综述《A Survey of Large Language Models》.

来自主题: AI资讯
8509 点击    2024-04-20 10:31
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题

来自主题: AI资讯
7547 点击    2024-04-19 21:21
“3SB大战”12周年,三个老伙伴要决战大模型之巅?

“3SB大战”12周年,三个老伙伴要决战大模型之巅?

“3SB大战”12周年,三个老伙伴要决战大模型之巅?

日前,360周鸿祎在第二十七届哈佛中国论坛炮轰百度李彦宏“开源不如闭源”的言论,称其胡说八道。有网友评论:当年的那个老周仿佛回来了

来自主题: AI技术研报
4648 点击    2024-04-19 20:40
李彦宏不寒碜:不赚钱,做大模型干吗?

李彦宏不寒碜:不赚钱,做大模型干吗?

李彦宏不寒碜:不赚钱,做大模型干吗?

一位行业领袖对技术路线的断言甚至是“拉踩”,其影响,或许将远超公众预判

来自主题: AI技术研报
6807 点击    2024-04-19 18:59
5亿个token之后,我们得出关于GPT的七条宝贵经验

5亿个token之后,我们得出关于GPT的七条宝贵经验

5亿个token之后,我们得出关于GPT的七条宝贵经验

自 ChatGPT 问世以来,OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月,OpenAI 官方宣布,开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。

来自主题: AI资讯
9835 点击    2024-04-19 17:20