AI资讯新闻榜单内容搜索-研究

ChatGPT变笨新解释：世界被AI改变，与训练时不同了

对于ChatGPT变笨原因，学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出：在训练数据截止之前的任务上，大模型表现明显更好。

来自主题: AI技术研报

4708 点击 2024-01-01 23:12

Hugging Face：2023开源LLM大爆发，数据竞赛已开启！

2023年的LLM开源社区都发生了什么？来自Hugging Face的研究员带你回顾并重新认识开源LLM

来自主题: AI资讯

11008 点击 2023-12-31 14:34

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

近日，来自华为诺亚方舟实验室、北京大学等机构的研究者提出了盘古 π 的网络架构，尝试来构建更高效的大模型架构。

来自主题: AI资讯

10493 点击 2023-12-30 15:20

从模型、数据和框架三个视角出发，这里有份54页的高效大语言模型综述

大规模语言模型（LLMs）在很多关键任务中展现出显著的能力，比如自然语言理解、语言生成和复杂推理，并对社会产生深远的影响。然而，这些卓越的能力伴随着对庞大训练资源的需求（如下图左）和较长推理时延（如下图右）。因此，研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报

4796 点击 2023-12-30 15:16

60年首次！AI发现首批新抗生素，MIT重磅研究登Nature！人类有望对抗超级细菌

在AI的帮助下，MIT科学家解锁了60年以来的第一批用于对抗金黄色葡萄球菌的新抗生素！

来自主题: AI资讯

7914 点击 2023-12-30 14:50

多模态大模型学杂了能力反下降？新研究：MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”，大模型可能会“学得多错得多”，因为不同任务之间的冲突，导致泛化能力下降。

来自主题: AI资讯

4894 点击 2023-12-30 14:39

全球最强「开源版Gemini」诞生！全能多模态模型Emu2登热榜，多项任务刷新SOTA

最强的全能多模态模型来了！就在近日，智源研究院重磅发布了开源界的「Gemini」——Emu2，一口气刷新多项SOTA。

来自主题: AI资讯

9150 点击 2023-12-27 15:12

给Transformer降降秩，移除特定层90%以上组件LLM性能不减

MIT、微软联合研究：不需要额外训练，也能增强大语言模型的任务性能并降低其大小。

来自主题: AI资讯

2348 点击 2023-12-26 14:55

陈天桥：追加10亿元投入“AI+脑科学”，AI 是人类有史以来最伟大的发明｜钛媒体焦点

12月25日下午，据“天桥脑科学研究院”官方帐号消息，盛大集团创始人陈天桥创立的天桥脑科学研究院（Tianqiao and Chrissy Chen Institute，简称TCCI）近日宣布，追加10亿元人民币投入“人工智能（AI）+脑科学”，旨在推动人类智慧和机器智慧的相互结合与促进。

来自主题: AI资讯

10918 点击 2023-12-26 10:16

这个AI，可预报你的死亡时间

. 12月底，《自然-计算科学》发表研究，揭示丹麦科技大学国际研究团队的新产品——“Life2vec”的预报原理。它可以直接预测人的死亡率，准确率高达78%，据称是目前市面上准确度最高的预测方式。团队使用七年间超过230万名35至65岁丹麦人群的数据，分析个人生命历程中的事件序列，预测接下来最有可能发生的事情。

来自主题: AI资讯

9956 点击 2023-12-26 10:09