AI资讯新闻榜单内容搜索-训练

首次攻克「图基础模型」三大难题！港大开源OpenGraph：零样本学习适配多种下游任

港大发布通用图基座模型OpenGraph，巧妙从LLM中蒸馏零样本图泛化能力。

来自主题: AI技术研报

9400 点击 2024-03-15 12:29

LLM开源从Infra做起！Meta公布了自己训练Llama 3的H100集群细节，看来Llama 3快来了。

来自主题: AI技术研报

5250 点击 2024-03-15 12:25

为了让AI更像科学家，他们将人类知识注入大模型…

来自主题: AI技术研报

6682 点击 2024-03-15 12:21

数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。

来自主题: AI技术研报

9054 点击 2024-03-14 16:14

刚刚，芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息，「我们发布了世界上最快的芯片，该芯片拥有高达 4 万亿个晶体管。」

来自主题: AI资讯

7134 点击 2024-03-14 16:11

刚刚，Meta 宣布推出两个 24k GPU 集群（共 49152 个 H100），标志着 Meta 为人工智能的未来做出了一笔重大的投资。

来自主题: AI资讯

10413 点击 2024-03-13 14:42

大模型对齐新方法，让数学推理能力直接提升9%。

来自主题: AI技术研报

6757 点击 2024-03-13 11:10

基于大模型的Agent，已经成为了大型的博弈游戏的高级玩家，而且玩的还是德州扑克、21点这种非完美信息博弈。

来自主题: AI技术研报

4078 点击 2024-03-12 18:13

微软亚研院等发布bGPT，仍旧基于Transformer，但是模型预测的是下一个字节（byte）。

来自主题: AI技术研报

8902 点击 2024-03-11 18:04

华人科学家程博文官宣即将入职OpenAI，加入后训练团队参与多模态模型研究。值得一提的是，他还是著名华人计算机泰斗Thomas Huang的学生。

来自主题: AI技术研报

5556 点击 2024-03-11 17:44