AI资讯新闻榜单内容搜索-模型

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改进模型！附代码

适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。

来自主题: AI技术研报

11490 点击 2024-07-29 20:20

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecDiff

用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。

来自主题: AI技术研报

9724 点击 2024-07-29 19:58

GPT-4o mini凭什么登顶竞技场？OpenAI刷分秘诀被扒，原来奥特曼早有暗示

为啥GPT-4o mini能登顶大模型竞技场？？

来自主题: AI资讯

10868 点击 2024-07-29 19:47

上海交通大学温颖教授：打造“通才”Agent｜Agent Insights

解决问题：语言智能体的动作通常由 Token（令牌，语言模型中表示单词/短语/汉字的最小符号单元）序列组成，直接将强化学习用于语言智能体进行策略优化的过程中，一般需要预定义可行动作集合，同时忽略了动作内 Token 细粒度信用分配问题，团队将 Agent 优化从动作层分解到 Token 层，为每个动作内 Token 提供更精细的监督，可在语言动作空间不受约束的环境中实现可控优化复杂度

来自主题: AI资讯

4119 点击 2024-07-29 17:50