AI资讯新闻榜单内容搜索-大语言模型

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

不使用外部工具也能让大语言模型（LLMs）实现严谨可信的推理，新国立提出 SymbCoT 推理框架：结合符号化逻辑（Symbolic Logical）表达式与思维链，极大提升推理质量，鲁棒性与可信度。

来自主题: AI技术研报

9144 点击 2024-06-07 14:39

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。

来自主题: AI技术研报

8624 点击 2024-06-04 17:45

LLM的「母语」是什么？

在以英语为主的语料库上训练的多语言LLM，是否使用英语作为内部语言？对此，来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报

8858 点击 2024-06-03 10:53

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

时空预测技术，迎来ChatGPT时刻。

来自主题: AI技术研报

8862 点击 2024-06-01 18:44

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick 关注前沿科技量子位 2024-05-28 12:29 北京

3D生成也有自个儿的人工评测竞技场了～来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena，和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承，要让大伙儿对3D生成模型来一场公开、匿名的评测

来自主题: AI资讯

8558 点击 2024-05-28 20:50

不影响输出质量还能追踪溯源，「大模型无偏水印」入选ICLR 2024 Spotlight

随着大语言模型（LLM）的快速发展，其在文本生成、翻译、总结等任务中的应用日益广泛。如微软前段时间发布的Copilot+PC允许使用者利用生成式AI进行团队内部实时协同合作，通过内嵌大模型应用，文本内容可能会在多个专业团队内部快速流转，对此，为保证内容的高度专业性和传达效率，同时平衡内容追溯、保证文本质量的LLM水印方法显得极为重要。

来自主题: AI技术研报

6867 点击 2024-05-28 20:05

Transformer大杀器进入蛋白质组学，一文梳理LLM如何助力生命科学领域大变革

科学家们把Transformer模型应用到蛋白质序列数据中，试图在蛋白质组学领域复制LLM的成功。本篇文章能够带你了解蛋白质语言模型（pLM）的起源、发展，以及那些尚待解决的问题。

来自主题: AI技术研报

9838 点击 2024-05-26 14:16

英伟达赢麻了！马斯克xAI超级算力工厂曝光，10万块H100、数十亿美元

最近几年，随着大语言模型的飞速发展与迭代，科技巨头们都竞相投入巨额财力打造超级计算机（或大规模 GPU 集群）。他们认为，更强大的计算能力是实现更强大 AI 的关键。

来自主题: AI资讯

9549 点击 2024-05-26 13:46

AI大牛杨红霞离职创业，曾为字节和阿里大模型研发主力

36氪从多个独立信源处获悉，字节跳动大语言模型研发技术专家杨红霞，已于近日从字节跳动离职，并开始筹备AI创业项目。

来自主题: AI资讯

3886 点击 2024-05-25 10:58

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

以 OpenAI 的 GPT 系列模型为代表的大语言模型（LLM）掀起了新一轮 AI 应用浪潮，但是 LLM 推理的高昂成本一直困扰着业务团队。

来自主题: AI技术研报

9982 点击 2024-05-24 20:58

AI资讯新闻榜单内容搜索-大语言模型

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

LLM的「母语」是什么？

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick 关注前沿科技 量子位 2024-05-28 12:29 北京

不影响输出质量还能追踪溯源，「大模型无偏水印」入选ICLR 2024 Spotlight

Transformer大杀器进入蛋白质组学，一文梳理LLM如何助力生命科学领域大变革

英伟达赢麻了！马斯克xAI超级算力工厂曝光，10万块H100、数十亿美元

AI大牛杨红霞离职创业，曾为字节和阿里大模型研发主力

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick 关注前沿科技量子位 2024-05-28 12:29 北京