AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
666条数据教会AI写万字长文!模型数据集都开源

666条数据教会AI写万字长文!模型数据集都开源

666条数据教会AI写万字长文!模型数据集都开源

仅需600多条数据,就能训练自己的长输出模型了?!

来自主题: AI技术研报
6724 点击    2024-09-27 18:33
最强服务器CPU来了!AI性能直接翻倍

最强服务器CPU来了!AI性能直接翻倍

最强服务器CPU来了!AI性能直接翻倍

服务器CPU领域持续多年的核心数量大战,被一举终结了!

来自主题: AI技术研报
6551 点击    2024-09-27 18:12
AI教育硬件全景报告 | 量子位智库

AI教育硬件全景报告 | 量子位智库

AI教育硬件全景报告 | 量子位智库

近一年来,AI硬件在教育领域迎来爆发式增长

来自主题: AI技术研报
5785 点击    2024-09-27 12:03
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

SafeEar是一种内容隐私保护的语音伪造检测方法,其核心是设计基于神经音频编解码器的解耦模型,分离语音声学与语义信息,仅利用声学信息检测,包括前端解耦模型、瓶颈层和混淆层、伪造检测器、真实环境增强四部分。

来自主题: AI技术研报
9479 点击    2024-09-26 15:25
一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

FP8通过其独特的数值表示方式,能够在保持一定精度的同时,在大模型训练中提高训练速度、节省内存占用,最终降低训练成本。

来自主题: AI技术研报
2707 点击    2024-09-26 11:57
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图

调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图

调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图

自适应系统在动态和不确定的环境中具有关键作用,广泛应用于自动驾驶、智能制造、网络安全和智能医疗等领域。

来自主题: AI技术研报
2968 点击    2024-09-26 11:13
斯坦福新作:无指令调优的指令遵循

斯坦福新作:无指令调优的指令遵循

斯坦福新作:无指令调优的指令遵循

指令调优(Instruction tuning)是一种优化技术,通过对模型的输入进行微调,以使其更好地适应特定任务。先前的研究表明,指令调优样本效率是很高效的,只需要大约 1000 个指令-响应对或精心制作的提示和少量指令-响应示例即可。

来自主题: AI技术研报
3086 点击    2024-09-26 11:06
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展现出了强大的能力,为科学研究带来了前所未有的可能性。然而,如何系统化地利用这些模型来加速机器学习研究仍然是一个有待解决的问题。

来自主题: AI技术研报
7459 点击    2024-09-25 20:20
【深度】OpenAI o1技术原理分析及产业影响

【深度】OpenAI o1技术原理分析及产业影响

【深度】OpenAI o1技术原理分析及产业影响

深入探讨OpenAI o1模型的技术原理以及产业影响。

来自主题: AI技术研报
8569 点击    2024-09-25 18:19
ACM TOG|仅通过手机拍照就可以对透明物体进行三维重建

ACM TOG|仅通过手机拍照就可以对透明物体进行三维重建

ACM TOG|仅通过手机拍照就可以对透明物体进行三维重建

三维重建是计算机图形学的经典任务,具有很强的使用价值。近年来,诸如神经辐射场的隐式场方法 [1][2][3][4] 正成为重建任务广泛采用的表示。

来自主题: AI技术研报
8151 点击    2024-09-25 09:13
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升

英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升

英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升

NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。

来自主题: AI技术研报
7547 点击    2024-09-24 12:27
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!

来自主题: AI技术研报
5141 点击    2024-09-24 12:07
北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。

来自主题: AI技术研报
7490 点击    2024-09-23 15:30
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。

来自主题: AI技术研报
9121 点击    2024-09-22 15:00
ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

视觉 / 激光雷达里程计是计算机视觉和机器人学领域中的一项基本任务,用于估计两幅连续图像或点云之间的相对位姿变换。它被广泛应用于自动驾驶、SLAM、控制导航等领域。最近,多模态里程计越来越受到关注,因为它可以利用不同模态的互补信息,并对非对称传感器退化具有很强的鲁棒性。

来自主题: AI技术研报
9288 点击    2024-09-22 14:00
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报
7249 点击    2024-09-21 18:19
OpenAI o1 self-play RL 技术路线推演

OpenAI o1 self-play RL 技术路线推演

OpenAI o1 self-play RL 技术路线推演

OpenAI的self-play RL新模型o1最近交卷,直接引爆了关于对于self-play的讨论。

来自主题: AI技术研报
7631 点击    2024-09-21 14:20
大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

当谷歌的Gemini建议给比萨加胶水时,网友尚能发挥娱乐精神玩梗解构;但当LLM输出的诽谤信息中伤到到真实人类时,AI搜索引擎的未来是否值得再三思量?

来自主题: AI技术研报
8451 点击    2024-09-20 20:04
KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

近日,来自海德堡大学的研究人员推出了图语言模型 (GLM),将语言模型的语言能力和知识图谱的结构化知识,统一到了同一种模型之中。

来自主题: AI技术研报
8014 点击    2024-09-20 20:01
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?

来自主题: AI技术研报
8459 点击    2024-09-20 19:48
港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒,训练速度最多提升50倍

港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒,训练速度最多提升50倍

港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒,训练速度最多提升50倍

近日,香港大学发布最新研究成果:智能交通大模型OpenCity。该模型根据参数大小分为OpenCity-mini、OpenCity-base和OpenCity-Pro三个模型版本,显著提升了时空模型的零样本预测能力,增强了模型的泛化能力。

来自主题: AI技术研报
8576 点击    2024-09-19 21:58
AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真

AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真

AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真

AI开启模拟宇宙!近日,来自马克斯·普朗克研究所等机构,利用宇宙学和红移依赖性对宇宙结构形成进行了场级仿真,LeCun也在第一时间转发和推荐。

来自主题: AI技术研报
6529 点击    2024-09-19 19:29
QuestMobile2024 AI智能体应用洞察半年报:AI类APP月活超6600万,智能体形成八大玩法门类,商业化路径已开启

QuestMobile2024 AI智能体应用洞察半年报:AI类APP月活超6600万,智能体形成八大玩法门类,商业化路径已开启

QuestMobile2024 AI智能体应用洞察半年报:AI类APP月活超6600万,智能体形成八大玩法门类,商业化路径已开启

APP内“智能体”数量大增,如通义已经超过14000个、讯飞星火超过11000个、豆包超过5000个

来自主题: AI技术研报
6153 点击    2024-09-19 14:56
ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生,师从黄高副教授,主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报
6044 点击    2024-09-19 11:14