AI资讯新闻榜单内容搜索-模型

CMU副教授：在多智能体流行的当下，不要忽视单智能体系统

「多智能体系统」是人工智能领域最热门的流行词之一，也是开源框架 MetaGPT 、 Autogen 等研究的焦点。但是，多智能体系统就一定是完美的吗近日，来自卡内基梅隆大学的副教授 Graham Neubig 在文章《Don't Sleep on Single-agent Systems》中强调了单智能体系统也不可忽视。

来自主题: AI资讯

5888 点击 2024-10-10 17:06

ChatGPT幕后大佬、o1推理模型作者官宣离职！OpenAI大洗牌，后训练团队换将

就在刚刚，又一位元老级人物官宣离职OpenAI了。 o1推理模型贡献者之一Luke Metz发文称，「我即将离开OpenAI，结束这段超过两年的奇妙旅程」。

来自主题: AI资讯

5405 点击 2024-10-10 16:58

成熟的AI要学会自己搞研究！MIT推出「科研特工」

近日，MIT团队推出了自动搞科研的AI系统——SciAgents。在仿生材料的研究中，模型揭示了以前被认为无关的一些跨学科联系，实现了超越传统人类研究方法的规模、精度和探索能力。

来自主题: AI资讯

8806 点击 2024-10-10 14:43

清华微软最新力作：用物理学革新Transformer注意力，「大海捞针」精度暴涨30%！

随着诺贝尔物理学奖颁给了「机器学习之父」Geoffrey Hinton，另一个借鉴物理学概念的模型架构也横空出世——微软清华团队的最新架构Differential Transformer，从注意力模块入手，实现了Transformer的核心能力提升。

来自主题: AI技术研报

9175 点击 2024-10-10 14:24

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出，常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题，学术界和工业界提出了一系列对齐（Alignment）技术，旨在优化模型的输出，使其更加符合人类的价值观和期望。

来自主题: AI技术研报

9778 点击 2024-10-10 12:21

这篇论文非常火！差分Transformer竟能消除注意力噪声，犹如降噪耳机

Transformer 的强大实力已经在诸多大型语言模型（LLM）上得到了证明，但该架构远非完美，也有很多研究者致力于改进这一架构，比如机器之心曾报道过的 Reformer 和 Infini-Transformer。

来自主题: AI技术研报

7512 点击 2024-10-10 12:15

GR-2登场！ByteDance Research提出机器人大模型，具备世界建模和强大泛化能力

最近，ByteDance Research 的第二代机器人大模型 —— GR-2，终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性，预示着机器人大模型技术将爆发出巨大潜力和无限可能。

来自主题: AI资讯

8071 点击 2024-10-10 12:04

AI图像革命才刚刚开始

本期AGI路线图中关键节点：DiT架构、Stable Diffusion 3.0、Flux.1、ControlNet、1024×1024分辨率、医学影像、英伟达Eagle模型、谷歌Med-Gemini系列模型、GPT-4o端到端、Meta Transfusion模型。

来自主题: AI资讯

6442 点击 2024-10-10 11:42

OpenAI o1引爆推理算力新革命，趋境科技发布新产品助力企业实现高效推理

当备受期待的GPT-5历经数次跳票，OpenAI全新发布的o1模型及时挽回了行业的信心，并从此为大模型领域开启了一个新的竞技方向——当推理模型大行其道时，行业如何从Infra层面着手降低推理阶段的算力成本？

来自主题: AI资讯

8752 点击 2024-10-10 11:30

上交大发布首个OpenAI o1复现项目进展报告，满满的经验洞察

在人工智能领域掀起巨浪的 OpenAI o1 模型发布三周后，一支由高校年轻研究者组成的团队今天发布了题为 "o1 Replication Journey: A Strategic Progress Report (o1 探索之旅：战略进展报告)" 的研究进展报告。

来自主题: AI技术研报

6360 点击 2024-10-09 12:55