AI资讯新闻榜单内容搜索-LAM

RAG微调Llama 3竟超越GPT-4！英伟达GaTech华人学者提出RankRAG框架

来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。

来自主题: AI技术研报

6087 点击 2024-07-09 15:50

开源视频版GPT-4o？快速记忆，实时问答，拿下CVPR'24长视频问答竞赛冠军

基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型（Large Language Models，LLMs）的强大理解、生成和推理能力

来自主题: AI技术研报

11355 点击 2024-07-07 16:35

少即是多！10亿参数「小巨人」击败ChatGPT

只有10亿参数的xLAM-1B在特定任务中击败了LLM霸主：OpenAI的GPT-3.5 Turbo和Anthropic的Claude-3 Haiku。上个月刚发布的苹果智能模型只有30亿参数，就连奥特曼都表示，我们正处于大模型时代的末期。那么，小语言模型（SLM）会是AI的未来吗？

来自主题: AI技术研报

8262 点击 2024-07-04 16:25

Llama也能做图像生成！港大字节推出开源自回归文生图模型，在线体验已开放

只需Image Tokenizer，Llama也能做图像生成了，而且效果超过了扩散模型。

来自主题: AI资讯

10348 点击 2024-07-04 11:09

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议

导读：时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上，以27B的参数击败了许多更大规模的模型，甚至超过了70B的Llama-3-Instruct，成为开源模型的性能第一！

来自主题: AI资讯

10329 点击 2024-07-02 11:20

谷歌最强开源模型Gemma 2发布，270亿参数奇袭Llama 3，单张A100可全精度推理

可在单张A100/H100 GPU或TPU主机上高效运行全精度推理。

来自主题: AI资讯

7120 点击 2024-06-29 11:32

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、经济！

性能翻倍的Gemma 2，让同量级的Llama3怎么玩？

来自主题: AI技术研报

9048 点击 2024-06-29 00:27

谷歌开源系模型第二代免费开放！27B媲美LLaMA3 70B，单H100或TPU主机可跑

谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜—— 除27B模型外，还有一个更轻的9B版本。 DeepMind创始人哈萨比斯表示，27B参数规模下，Gemma 2提供了同类模型最强性能，甚至还能与其两倍大的模型竞争。

来自主题: AI技术研报

9258 点击 2024-06-29 00:02

OpenAI服务受限？别担心，来这里丝滑玩转700亿参数Llama3，还有100元券免费薅！

如何无痛玩转Llama 3，这个手把手教程一看就会！80亿参数推理单卡半分钟速成，微调700亿参数仅用4卡近半小时训完，还有100元代金券免费薅。

来自主题: AI资讯

9932 点击 2024-06-26 18:18

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Sohu推理性能超H100二十倍！

史上最快Transformer芯片诞生了！用Sohu跑Llama 70B，推理性能已超B200十倍，超H100二十倍！刚刚，几位00后小哥从哈佛辍学后成立的公司Etached，宣布再融资1.2亿美元。

来自主题: AI资讯

12084 点击 2024-06-26 17:44