AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
打破AI计算生态系统的瓶颈,Foundry获8000万美元新融资

打破AI计算生态系统的瓶颈,Foundry获8000万美元新融资

打破AI计算生态系统的瓶颈,Foundry获8000万美元新融资

目前,GPU芯片紧缺成为AI行业面临的问题,另一方面,因为传统云服务计算架构与AI计算负载的不匹配,大量GPU计算资源没有被充分利用。

来自主题: AI技术研报
5570 点击    2024-04-18 13:23
无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖

无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖

无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖

Karger 算法可以在时间为 O (m log^3n) 的图中找到一个最小割点,他们将这个时间称之为近线性时间,意思是线性乘以一个多对数因子

来自主题: AI技术研报
8805 点击    2024-04-17 20:21
Meta无限长文本大模型来了:参数仅7B,已开源

Meta无限长文本大模型来了:参数仅7B,已开源

Meta无限长文本大模型来了:参数仅7B,已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案

来自主题: AI技术研报
7425 点击    2024-04-17 20:17
首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

前段时间,X 平台知名 AI 博主 Aran Komatsuzaki 自己写了一首歌,专门用来表达对另一位 AI 科学家 ——Gary Marcus 的不满

来自主题: AI技术研报
6217 点击    2024-04-17 20:03
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

近日,由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka,推出了他们最新的多模态语言模型——Reka Core

来自主题: AI技术研报
6141 点击    2024-04-17 19:11
用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

多任务机器人学习在应对多样化和复杂情景方面具有重要意义。然而,当前的方法受到性能问题和收集训练数据集的困难的限制

来自主题: AI技术研报
7851 点击    2024-04-17 18:16
智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!

智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!

智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!

继之前公开课之后(周鸿祎:2024 年 AI 产业发展的 16 个趋势。)红衣大叔兑现诺言,开源了 7B 系列大模型

来自主题: AI技术研报
9062 点击    2024-04-17 18:03
脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑机接口最新进展登上Nature子刊,深度学习三巨头之一的LeCun都来转发。

来自主题: AI技术研报
8410 点击    2024-04-17 17:06
Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

纵观生成式AI领域中的两个主导者:自回归和扩散模型。 一个专攻文本等离散数据,一个长于图像等连续数据。 如果,我们让后者来挑战前者的主场,它能行吗?

来自主题: AI技术研报
10882 点击    2024-04-17 17:02
技术Blog | 超强端侧多模态大模型MiniCPM-V 2.0: 具备领先OCR和理解能力

技术Blog | 超强端侧多模态大模型MiniCPM-V 2.0: 具备领先OCR和理解能力

技术Blog | 超强端侧多模态大模型MiniCPM-V 2.0: 具备领先OCR和理解能力

MiniCPM 系列的最新多模态版本 MiniCPM-V 2.0。该模型基于 MiniCPM 2.4B 和 SigLip-400M 构建,共拥有 2.8B 参数。MiniCPM-V 2.0 具有领先的光学字符识别(OCR)和多模态理解能力

来自主题: AI技术研报
8523 点击    2024-04-16 22:20
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结

来自主题: AI技术研报
6088 点击    2024-04-16 21:53
模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

现今,机器学习(ML),更具体地说,深度学习已经改变了从金融到医疗等广泛的行业。在当前的 ML 范式中,训练数据首先被收集和策划,然后通过最小化训练数据上的某些损失标准来优化 ML 模型

来自主题: AI技术研报
6447 点击    2024-04-16 21:48
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报
6686 点击    2024-04-16 18:08
陶哲轩力荐!史上最全「数学AI资源」清单出炉

陶哲轩力荐!史上最全「数学AI资源」清单出炉

陶哲轩力荐!史上最全「数学AI资源」清单出炉

史上最全的「数学人工智能资源」清单出炉了。 陶哲轩,信奉AI将在2026年成为人类数学家的重要合著者,一早便转发了这份清单。

来自主题: AI技术研报
7183 点击    2024-04-15 17:29
还在卷长文本?谷歌最新论文直接把文本干到…无限长了

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

通过这项技术,能使transformer大模型在有限的计算资源 条件下,处理无限长度的输入。

来自主题: AI技术研报
6671 点击    2024-04-15 15:15
曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

风格化图像生成,也常称为风格迁移,其目标是生成与参考图像风格一致的图像。

来自主题: AI技术研报
5657 点击    2024-04-14 17:48
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。

来自主题: AI技术研报
12053 点击    2024-04-14 17:41
剑指Sora!120秒超长AI视频模型免费开玩

剑指Sora!120秒超长AI视频模型免费开玩

剑指Sora!120秒超长AI视频模型免费开玩

120秒超长AI视频模型来了!不但比Sora长,而且免费开源

来自主题: AI技术研报
8310 点击    2024-04-14 15:41
CVPR 2024 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景

CVPR 2024 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景

CVPR 2024 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景

自 2020 年神经辐射场 (Neural Radiance Field, NeRF) 提出以来,将隐式表达推上了一个新的高度。作为当前最前沿的技术之一

来自主题: AI技术研报
5154 点击    2024-04-14 14:04
谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用,并提出了一个全新的视角

来自主题: AI技术研报
8684 点击    2024-04-14 13:07
改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。 为此,北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法,在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。

来自主题: AI技术研报
11502 点击    2024-04-13 16:50