AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
COLM 24 | 从正确中学习?大模型的自我纠正新视角

COLM 24 | 从正确中学习?大模型的自我纠正新视角

COLM 24 | 从正确中学习?大模型的自我纠正新视角

大型语言模型(LLMs)虽然进展很快,很强大,但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】,大概就是看自己输出的结果,自己反思一下有没有错,如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报
9140 点击    2024-09-17 21:26
昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

前些天,OpenAI 发布了 ο1 系列模型,它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高,以至于 OpenAI 不得不限制每位用户的使用量:每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

来自主题: AI技术研报
6606 点击    2024-09-17 19:14
OpenAI o1式思维链,开源模型也可以有,成功案例来了

OpenAI o1式思维链,开源模型也可以有,成功案例来了

OpenAI o1式思维链,开源模型也可以有,成功案例来了

北京时间 9 月 13 日午夜,OpenAI 发布了推理性能强大的 ο1 系列模型。之后,各路研究者一直在尝试挖掘 ο1 卓越性能背后的技术并尝试复现它。当然,OpenAI 也想了一些方法来抑制窥探,比如有多名用户声称曾试图诱导 ο1 模型公布其思维过程,然后收到了 OpenAI 的封号威胁。

来自主题: AI资讯
6308 点击    2024-09-17 19:02
DeepMind再迎挑战者,ESM作者带队6个月超越AlphaFold 3,代码权重全开源

DeepMind再迎挑战者,ESM作者带队6个月超越AlphaFold 3,代码权重全开源

DeepMind再迎挑战者,ESM作者带队6个月超越AlphaFold 3,代码权重全开源

一家刚成立6个月的初创公司Chai Discovery最近发布了能对打甚至超越AlphaFold 3的模型Chai-1,而且放出了模型权重和推理代码。不开源的DeepMind这回还能坐得住吗?

来自主题: AI技术研报
10477 点击    2024-09-16 21:12
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

MMMU-Pro通过三步构建过程(筛选问题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。

来自主题: AI技术研报
10168 点击    2024-09-16 21:08
ECCV 2024 | 一眼临摹:瞥一眼就能模仿笔迹的AI

ECCV 2024 | 一眼临摹:瞥一眼就能模仿笔迹的AI

ECCV 2024 | 一眼临摹:瞥一眼就能模仿笔迹的AI

来自华南理工大学、新加坡国立大学、昆仑万维以及琶洲实验室的研究者们提出一种新的风格化手写文字生成方法,仅需提供单张参考样本即可临摹用户的书写风格,支持英文,中文和日文三种文字的临摹。

来自主题: AI资讯
11773 点击    2024-09-16 20:40