AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
2024金智维大模型应用暨新品发布会成功举办,AI Agent新品K-Agent重磅发布

2024金智维大模型应用暨新品发布会成功举办,AI Agent新品K-Agent重磅发布

2024金智维大模型应用暨新品发布会成功举办,AI Agent新品K-Agent重磅发布

过去一年,从通用大模型的爆发性成长,再到垂直行业大模型与场景化应用的深度融合,人工智能正以前所未有的速度影响甚至改变世界。

来自主题: AI技术研报
9710 点击    2024-03-29 11:52
一张图即出AI视频!谷歌全新扩散模型,让人物动起来

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!

来自主题: AI技术研报
8430 点击    2024-03-28 16:52
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4

Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4

Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4

【新智元导读】Claude 3在通用任务上是全球最强已经毋庸置疑。更令人惊叹的是,它在专业领域的表现,比如化学任务,也能远远领先GPT-4。

来自主题: AI技术研报
6511 点击    2024-03-28 16:32
GPTs大翻车后,OpenAI再宣布给开发者送钱!美国码农狂欢

GPTs大翻车后,OpenAI再宣布给开发者送钱!美国码农狂欢

GPTs大翻车后,OpenAI再宣布给开发者送钱!美国码农狂欢

【新智元导读】OpenAI给开发者分钱了!就在刚刚,OpenAI宣布GPT将「货币化」,所有美国开发者都可以得到收入分成,具体细节还在摸索。开发者欢呼:爱死OpenAI了!

来自主题: AI技术研报
7228 点击    2024-03-28 16:22
全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。

来自主题: AI技术研报
9258 点击    2024-03-28 16:09
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了生成式 AI 的应用前景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样时间端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。

来自主题: AI技术研报
6333 点击    2024-03-28 15:31
ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

RLHF 通过学习人类偏好,能够在难以手工设计奖励函数的复杂决策任务中学习到正确的奖励引导,得到了很高的关注,在不同环境中选择合适的人类反馈类型和不同的学习方法至关重要

来自主题: AI技术研报
9446 点击    2024-03-28 09:59
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

【新智元导读】GPT-5还未发布,GPT-6已经在路上了?微软工程师曝出,为GPT-6搭建10万个H100训练集群,整个电网却被搞崩。通往AGI大关,还需要破解电力难题。

来自主题: AI技术研报
7151 点击    2024-03-27 15:57
Stability AI开源3B代码生成模型:可补全,还能Debug

Stability AI开源3B代码生成模型:可补全,还能Debug

Stability AI开源3B代码生成模型:可补全,还能Debug

Stable Diffusion 3 还没全面开放,这家公司的代码生成模型先来了。本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。

来自主题: AI技术研报
7106 点击    2024-03-27 11:15
Transformer还不够好,它的作者决定让大模型自主进化

Transformer还不够好,它的作者决定让大模型自主进化

Transformer还不够好,它的作者决定让大模型自主进化

让大模型自己动手,好过让人类动手。黄仁勋对话Transformer八子时,最后一位离开谷歌的论文作者Llion Jones,相信这是大模型技术的关键趋势。他还卖了个关子,预告他创立的Sakana AI马上就有大动作。

来自主题: AI技术研报
8891 点击    2024-03-26 14:33
阿里云&魔搭社区×特工宇宙丨Multi-agent AI 创客松来了!

阿里云&魔搭社区×特工宇宙丨Multi-agent AI 创客松来了!

阿里云&魔搭社区×特工宇宙丨Multi-agent AI 创客松来了!

LLM-Powered Agent凭借长期记忆+自主规划+自动执行等特性,是探索人工通用智能(AGI)的可能途径之一。从单一智能体到多智能体的迭代,是实现AI执行更多更复杂的工作的重要跨越。

来自主题: AI技术研报
11730 点击    2024-03-26 14:32
阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。

来自主题: AI技术研报
9239 点击    2024-03-25 12:48
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora,该框架整合了几种先进的视觉 AI 智能体,以复制 Sora 所展示的通用视频生成能力。

来自主题: AI技术研报
5078 点击    2024-03-23 21:22
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。

来自主题: AI技术研报
10257 点击    2024-03-21 18:35
3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

受人类视觉系统的启发,MVDiffusion++结合计算方法高保真和人类视觉系统灵活性,可以根据任意数量的无位姿图片, 生成密集、高分辨率的有位姿图像,实现了高质量的3D模型重建。

来自主题: AI技术研报
7747 点击    2024-03-21 10:24
Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

近日,Stability AI又发布了新作SV3D,基于视频扩散模型的SV3D将3D模型生成的效果提升了一大截,模型权重已在huggingface开放。

来自主题: AI技术研报
4816 点击    2024-03-21 10:20
微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工

微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工

微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工

成立2年,估值40亿美元AI初创公司,被微软一夜吞噬。今天,Inflection两位联创官宣加入微软成立的新部门Microsoft AI,分别担任负责人和首席科学家。网友纷纷表示微软仅通过「雇佣」就把Inflection「收购了」。

来自主题: AI技术研报
8170 点击    2024-03-21 10:06
Kimi.ai与ChatGPT:长文本理解与科研辅助的比较研究

Kimi.ai与ChatGPT:长文本理解与科研辅助的比较研究

Kimi.ai与ChatGPT:长文本理解与科研辅助的比较研究

一直以来,我都习惯于用各种各样的外部工具辅助自己的科研全过程。从论文阅读、文献查找、公式理解,再到论文润色,AI工具都能在不同程度地帮上我。

来自主题: AI技术研报
8188 点击    2024-03-21 09:40
旷视实战大模型:把多模态扎进行业

旷视实战大模型:把多模态扎进行业

旷视实战大模型:把多模态扎进行业

距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻,已经过去了整整一年的时间。在这一年里,国内外大量公司涌入大模型的“斗兽场”,加速大模型技术的迭代与跃迁。

来自主题: AI技术研报
8622 点击    2024-03-20 16:24
如何从头开始编写LoRA代码,这有一份教程

如何从头开始编写LoRA代码,这有一份教程

如何从头开始编写LoRA代码,这有一份教程

作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报
7628 点击    2024-03-20 16:16
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

3D 生成领域迎来新的「SOTA 级选手」,支持商用和非商用。Stability AI 的大模型家族来了一位新成员。昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Video 3D」(简称 SV3D)。

来自主题: AI技术研报
7263 点击    2024-03-20 16:10
锚定智算引擎,联想首台国产AI服务器在安徽合肥交付 | 新氪度

锚定智算引擎,联想首台国产AI服务器在安徽合肥交付 | 新氪度

锚定智算引擎,联想首台国产AI服务器在安徽合肥交付 | 新氪度

国产化不再是一个简单的口号,而是落实在具象产品之中。3月19日,36氪安徽从联宝(合肥)电子科技有限公司(简称“联宝科技”)获悉,联想首台可搭载国产AI算力芯片的联想问天WA5480 G3服务器在合肥成功交付。

来自主题: AI技术研报
4511 点击    2024-03-20 11:23
百万token上下文窗口也杀不死向量数据库?CPU笑了

百万token上下文窗口也杀不死向量数据库?CPU笑了

百万token上下文窗口也杀不死向量数据库?CPU笑了

“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?”

来自主题: AI技术研报
3841 点击    2024-03-19 17:44
如何从零开始训练大模型(minicpm分享&讨论)

如何从零开始训练大模型(minicpm分享&讨论)

如何从零开始训练大模型(minicpm分享&讨论)

根据scaling law,模型越大,高质量数据越多,效果越好。 但还有一个很直观的情况,随着预训练样本的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。

来自主题: AI技术研报
3371 点击    2024-03-19 15:55