AI资讯新闻榜单内容搜索-模型

让模型预见数据分布变化，东京大学等提出时态域泛化全新框架

在数据分布持续变化的动态环境中，如何进行连续模型泛化？

来自主题: AI技术研报

9417 点击 2024-11-21 14:02

「全球最严榜单」，阶跃拿下中国TOP 1！杀入世界前五，超过GPT-4o紧跟o1-mini

在「全球最难LLM评测榜单」上，国产万亿参数模型杀入全球第五，拿下中国第一！国内明星初创阶跃星辰的这个自研模型太过亮眼，甚至引起了外国网友的热议。

来自主题: AI资讯

5408 点击 2024-11-21 13:59

405B大模型也能线性化！斯坦福MIT最新研究，0.2%训练量让线性注意力提分20+

近日，来自斯坦福、MIT等机构的研究人员推出了低秩线性转换方法，让传统注意力无缝转移到线性注意力，仅需0.2%的参数更新即可恢复精度，405B大模型两天搞定！

来自主题: AI技术研报

5287 点击 2024-11-21 13:47

史上最严“中文真实性评估”：OpenAI o1第1豆包第2，其它全部不及格

新的大语言模型（LLM）评估基准对于跟上大语言模型的快速发展至关重要。

来自主题: AI技术研报

7478 点击 2024-11-21 13:47

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你「LLM+外部数据」的正确使用姿势

论文提出了一种RAG任务分类法，将用户查询分为四个级别，并讨论了将外部数据集成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。

来自主题: AI技术研报

7615 点击 2024-11-21 13:39

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

大模型的执行力从哪里来？

来自主题: AI技术研报

10502 点击 2024-11-21 10:12

全球最大AI Agent生态系统来了，适配超1800个模型

5款预构建Agent、数百万AI协作前景。

来自主题: AI资讯

5858 点击 2024-11-21 09:50

获2亿美元新融资，Writer帮企业节省90%的AI使用成本

企业AI的基本技术架构也已经达成共识：强大的AI模型+图技术加持的RAG+Agent搭建+安全护栏。

来自主题: AI资讯

5805 点击 2024-11-21 09:19

登上“最不可能作弊”的榜单，阶跃星辰Step-2位列中国大模型第一

在“最难AI榜”，拿下中国第一、全球第五。

来自主题: AI资讯

6343 点击 2024-11-21 09:15

DeepSeek 推理模型预览版上线，解密 o1 推理过程

今天，DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。所有用户均可登录官方网页（chat.deepseek.com），一键开启与 R1-Lite 预览版模型的超强推理对话体验。DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。

来自主题: AI资讯

10070 点击 2024-11-20 23:11