AI资讯新闻榜单内容搜索-Mu

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

7016 点击 2024-08-10 11:45

CMU教授、机器学习系主任空降OpenAI董事会，曾用一句话攻破ChatGPT

就在刚刚，CMU教授Zico Kolter正式宣布加入OpenAI董事会，并成为安全与安保委员会成员。OpenAI这是终于要在安全上下功夫了？

来自主题: AI资讯

8649 点击 2024-08-10 10:58

OpenAI突然公布SearchGPT，谷歌搜索大敌已至

靴子终于落地，OpenAI的AI搜索还是来了。7月26日，就在推出小模型GPT-4o mini的一周后，OpenAI方面公布了备受外界关注的搜索产品SearchGPT。尽管目前SearchGPT仅向10000名测试用户开放，但OpenAI CTO Mira Murati在社交平台已经透露，最终目标是将搜索功能直接整合到ChatGPT中。

来自主题: AI技术研报

7852 点击 2024-08-05 12:26

CMU&清华新作：让LLM自己合成数据来学习，特定任务性能同样大幅提升

为了解决这个问题，一些研究尝试通过强大的 Teacher Model 生成训练数据，来增强 Student Model 在特定任务上的性能。然而，这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下，如何持续迭代模型的能力，成为了亟待解决的问题。

来自主题: AI技术研报

6778 点击 2024-08-01 15:55

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

自回归训练方式已经成为了大语言模型（LLMs）训练的标准模式，今天介绍一篇来自阿联酋世界第一所人工智能大学MBZUAI的VILA实验室和CMU计算机系合作的论文，题为《FBI-LLM: Scaling Up Fully Binarized LLMs from Scratch via Autoregressive Distillation》

来自主题: AI技术研报

7457 点击 2024-07-28 23:25