AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

OpenAI 的 Sora 在今年 2 月横空出世,把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限,但是在各媒体平台上,Sora 的身影无处不在,大家都在期待着使用它。

来自主题: AI资讯
6688 点击    2024-03-15 15:28
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。

来自主题: AI技术研报
9029 点击    2024-03-14 16:14
浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。

来自主题: AI技术研报
4052 点击    2024-03-12 18:13
不依赖token,字节级模型来了!直接处理二进制数据

不依赖token,字节级模型来了!直接处理二进制数据

不依赖token,字节级模型来了!直接处理二进制数据

微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。

来自主题: AI技术研报
8871 点击    2024-03-11 18:04
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人科学家程博文官宣即将入职OpenAI,加入后训练团队参与多模态模型研究。值得一提的是,他还是著名华人计算机泰斗Thomas Huang的学生。

来自主题: AI技术研报
5533 点击    2024-03-11 17:44
「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

GraphEdit方法可以有效地去除图网络中的噪声连接,还能从全局视角识别节点间的依赖关系,在不同的实验设置中都被验证为有效且稳健。

来自主题: AI技术研报
8052 点击    2024-03-11 17:34
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

挖掘大模型固有的长文本理解能力,InfLLM在没有引入额外训练的情况下,利用一个外部记忆模块存储超长上下文信息,实现了上下文长度的扩展。

来自主题: AI技术研报
5976 点击    2024-03-11 17:31