AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
利用公开知识定向提升大模型,腾讯优图&上交大提出新方法,性能达SOTA

利用公开知识定向提升大模型,腾讯优图&上交大提出新方法,性能达SOTA

利用公开知识定向提升大模型,腾讯优图&上交大提出新方法,性能达SOTA

告别传统指令微调,大模型特定任务性能提升有新方法了。 一种新型开源增强知识框架,可以从公开数据中自动提取相关知识,针对性提升任务性能。 与基线和SOTA方法对比,本文方法在各项任务上均取得了更好的性能。

来自主题: AI资讯
4703 点击    2024-09-29 15:59
从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制

从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制

从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制

Sutton 等研究人员近期在《Nature》上发表的研究《Loss of Plasticity in Deep Continual Learning》揭示了一个重要发现:在持续学习环境中,标准深度学习方法的表现竟不及浅层网络。研究指出,这一现象的主要原因是 "可塑性损失"(Plasticity Loss):深度神经网络在面对非平稳的训练目标持续更新时,会逐渐丧失从新数据中学习的能力。

来自主题: AI资讯
5653 点击    2024-09-29 14:39
《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。

来自主题: AI资讯
4830 点击    2024-09-29 14:26
AI技术在微创外科中的应用和思考

AI技术在微创外科中的应用和思考

AI技术在微创外科中的应用和思考

外科医生Dr. Lee在一次美敦力的学术讨论上说到,“外科医生和精英运动员非常相似,都在团队环境中工作,不断的重复训练已达到顶尖的成绩。但运动员往往花费更多的时间在影像室,回顾和研究过去的表现。而医生目前还没有得到足够、及时的信息反馈,以学习和提升手术技能。”

来自主题: AI技术研报
10594 点击    2024-09-28 17:03
形式化定理证明新突破:SubgoalXL框架让大模型在Isabelle中性能暴涨

形式化定理证明新突破:SubgoalXL框架让大模型在Isabelle中性能暴涨

形式化定理证明新突破:SubgoalXL框架让大模型在Isabelle中性能暴涨

在这种背景下,研究团队提出了一个全新的框架:SubgoalXL,结合了子目标(subgoal)证明策略与专家学习(expert learning)方法,在 Isabelle 中实现了形式化定理证明的性能突破。

来自主题: AI技术研报
5812 点击    2024-09-27 20:57
3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转弯降低超93%,热变形减少25%

3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转弯降低超93%,热变形减少25%

3D打印新突破!曼大等提出DQN多样化图形路径规划器:锐角转弯降低超93%,热变形减少25%

香港中文大学等机构的研究团队通过深度强化学习(DQN)开发了一种3D打印路径规划器,有效提升了打印效率和精度,为智能制造开辟了新途径。

来自主题: AI技术研报
8846 点击    2024-09-27 19:28
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和9.1%。

来自主题: AI技术研报
11526 点击    2024-09-27 19:26
666条数据教会AI写万字长文!模型数据集都开源

666条数据教会AI写万字长文!模型数据集都开源

666条数据教会AI写万字长文!模型数据集都开源

仅需600多条数据,就能训练自己的长输出模型了?!

来自主题: AI技术研报
8993 点击    2024-09-27 18:33
颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

“通用人工智能(AGI)的设计和开发,需要进行根本性改变。” 人工智能(AI)模型的参数规模越大,生成的答案就越准确?就更加可信? 还真不一定!

来自主题: AI资讯
4085 点击    2024-09-27 10:31