AI资讯新闻榜单内容搜索-大模

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。

来自主题: AI技术研报

6495 点击 2024-02-22 15:31

NLP独角兽被曝停工停产！融了10亿仍难造血，大模型热浪中更难活了

明星NLP公司突发消息：停工停产6个月。

来自主题: AI资讯

9456 点击 2024-02-22 15:20

谷歌最强开源大模型亮相！Gemini技术下放，笔记本就能跑，可商用

谷歌大模型，开源了！一夜之间，Gemma系列正式上线，全面对外开放。

来自主题: AI技术研报

10280 点击 2024-02-22 15:14

阿里大模型员工也自曝了996作息表

思维链作者、从谷歌跳槽OpenAI的Jason Wei前脚刚自曝996作息表，国内的“卷王”们就按耐不住了。

来自主题: AI资讯

11181 点击 2024-02-22 15:07

开源大模型王座易主，谷歌Gemma杀入场，笔记本可跑，可商用

刚刚，谷歌杀入开源大模型。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini，Gemma 更加轻量，同时保持免费可用，模型权重也一并开源了，且允许商用。

来自主题: AI资讯

9824 点击 2024-02-22 11:52

大模型时代，现代BI的底层已经被颠覆了？

大模型进场，从指标的量化开始做起

来自主题: AI资讯

6127 点击 2024-02-22 11:48

AIGC爆火，第一家要倒下的大模型企业出现了？

2月21日，知名AI创业公司竹间智能突然宣布因业务需求减少，给公司带来了严重的现金流压力和挑战，停工停产6个月。

来自主题: AI资讯

7781 点击 2024-02-22 11:45

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强？ Deepmoney金融大模型魔改方案分享&在线实测

在微调大型模型的过程中，一个常用的策略是“知识蒸馏”，这意味着借助高性能模型，如GPT-4，来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中心论相似，把GPT-4等模型视为更接近唯一的逻辑或真理的存在。

来自主题: AI资讯

9536 点击 2024-02-21 16:49

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

这两天，Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片，实现每秒500tokens大模型生成，感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff，让不少人直呼：英伟达要被碾压了……

来自主题: AI资讯

5062 点击 2024-02-21 16:39

宾夕法尼亚大学推出 AI 学位课程，开启未来科技新纪元

在人工智能领域，OpenAI 继其 GPT-4 模型后，再次引领科技风潮，近期发布了令人瞩目的文生视频大模型 Sora。这一创新不仅再次证明了 AI 技术的无限潜力，也加速了全球对人工智能专业人才的追求。宾夕法尼亚大学工程学院顺应时代潮流，宣布推出一个全新的人工智能（AI）专业的工程学士学位课程，以培育未来将在这一领域引领变革的杰出人才。

来自主题: AI资讯

10582 点击 2024-02-21 11:51