AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
GPU 经济学:算力背后的成本与未来

GPU 经济学:算力背后的成本与未来

GPU 经济学:算力背后的成本与未来

算力供需平衡预计到2030年才能实现

来自主题: AI技术研报
6323 点击    2024-04-08 10:30
牙科AI史上最大融资诞生,行业开始逆袭

牙科AI史上最大融资诞生,行业开始逆袭

牙科AI史上最大融资诞生,行业开始逆袭

牙科AI加速渗透:抉择与挑战 口腔行业重磅融资来袭!

来自主题: AI技术研报
8532 点击    2024-04-08 10:25
阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。

来自主题: AI技术研报
7849 点击    2024-04-08 10:09
抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。

来自主题: AI技术研报
6315 点击    2024-04-08 09:55
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度提高了500%!

来自主题: AI技术研报
6130 点击    2024-04-07 17:49
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了!它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的自拍照或者隐私聊天,该怎么办?

来自主题: AI技术研报
7642 点击    2024-04-07 17:48
二次元专用超分AI模型APISR:在线可用,入选CVPR

二次元专用超分AI模型APISR:在线可用,入选CVPR

二次元专用超分AI模型APISR:在线可用,入选CVPR

《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分,它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候,我们会突然有重温这些童年回忆的冲动,但我们却可能会略带遗憾地发现这些童年回忆的分辨率非常低,根本无法在客厅的 4K 大屏电视上创造出良好的视觉体验,以至于可能阻碍我们与在高分辨率数字世界中成长的孩子分享这些童年回忆。

来自主题: AI技术研报
7976 点击    2024-04-07 17:46
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。

来自主题: AI技术研报
5466 点击    2024-04-07 17:46
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

Gecko 是一种通用的文本嵌入模型,可用于训练包括文档检索、语义相似度和分类等各种任务。文本嵌入模型在自然语言处理中扮演着重要角色,为各种文本相关任务提供了强大的语义表示和计算能力。

来自主题: AI技术研报
7467 点击    2024-04-07 17:45
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B + RAG 方案快 36 倍。

来自主题: AI技术研报
8417 点击    2024-04-07 17:44
中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。

来自主题: AI技术研报
6384 点击    2024-04-07 13:10
从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。AI 方法可以发现新的抗生素,但现有方法有明显的局限性。性质预测模型很难扩展到大型化学空间。直接设计分子的生成模型可以快速探索广阔的化学空间,但生成的分子难以合成。

来自主题: AI技术研报
6395 点击    2024-04-06 15:23
ICLR 2024 | 联邦学习后门攻击的模型关键层

ICLR 2024 | 联邦学习后门攻击的模型关键层

ICLR 2024 | 联邦学习后门攻击的模型关键层

联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程,参与者可以篡改本地训练模型,从而对联邦学习的全局模型构成安全序隐患,如后门攻击。

来自主题: AI技术研报
5412 点击    2024-04-06 15:16
「有效上下文」提升20倍!DeepMind发布ReadAgent框架

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

模仿人类阅读过程,先分段摘要再回忆,谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能,有效上下文提升了3-20倍。

来自主题: AI技术研报
8156 点击    2024-04-06 14:48
AI下一个重大飞跃是理解情感!第一个具有情商的对话型AI来了

AI下一个重大飞跃是理解情感!第一个具有情商的对话型AI来了

AI下一个重大飞跃是理解情感!第一个具有情商的对话型AI来了

一家来自纽约的初创公司Hume AI发布了一款标榜为「第一个具有情商的对话式人工智能」的共情语音接口(EVI),并表示其能够从用户那里检测到53种不同的情绪。

来自主题: AI技术研报
8091 点击    2024-04-06 14:39
论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。

论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。

论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。

特工少女说:顾洲洪老师是复旦大学数据科学博士,最近新发表了一篇《AgentGroupChat: An Interactive Group Chat Simulacra For Better Eliciting Emergent Behavior》的论文,此文是顾老师自己对论文的解读,经授权转载自顾老师的知乎,点击文末阅读原文可跳转原文链接,学术交流可加文末顾老师的微信。

来自主题: AI技术研报
5788 点击    2024-04-06 13:58
10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

“只需”10万美元,训练Llama-2级别的大模型。尺寸更小但性能不减的MoE模型来了:它叫JetMoE,来自MIT、普林斯顿等研究机构。性能妥妥超过同等规模的Llama-2。

来自主题: AI技术研报
8608 点击    2024-04-05 17:13
谷歌更新Transformer架构,更节省计算资源!50%性能提升

谷歌更新Transformer架构,更节省计算资源!50%性能提升

谷歌更新Transformer架构,更节省计算资源!50%性能提升

谷歌终于更新了Transformer架构。最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计算模式。它通过动态分配大模型中的计算资源,跳过一些不必要计算,显著提高训练效率和推理速度。

来自主题: AI技术研报
7796 点击    2024-04-05 17:04
最懂AI的诺奖经济学得主去世,大模型关键技术受他研究启发

最懂AI的诺奖经济学得主去世,大模型关键技术受他研究启发

最懂AI的诺奖经济学得主去世,大模型关键技术受他研究启发

一位90岁巨擘的逝世,正在牵动整个科技圈的关注。 正如YC创始人Paul Graham所说: 我关注的每一个人,都在对丹尼尔·卡尼曼表达敬意。

来自主题: AI技术研报
6327 点击    2024-04-05 16:42
CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

FoundationPose模型使用RGBD图像对新颖物体进行姿态估计和跟踪,支持基于模型和无模型设置,在多个公共数据集上大幅优于针对每个任务专门化的现有方法.

来自主题: AI技术研报
7121 点击    2024-04-05 16:27
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

一年一度的CVPR 2024录用结果出炉了。今年,共有2719篇论文被接收,录用率为23.6%。

来自主题: AI技术研报
9142 点击    2024-04-05 16:09
GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

今天,陆续有网友晒出OpenAI发给自己的红队邀请邮件,看起来,GPT-5已经进入红队测试了?网友们纷纷展开畅想,对Sam Altman在线「催更」。另有外媒曝出,OpenAI的一个mini版数十亿「星际之门」,最快2026年就会启动。

来自主题: AI技术研报
7273 点击    2024-04-05 15:52
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们追求更高阶的人工智能的时候,无非是希望赋予机器这种与生俱来的天赋。

来自主题: AI技术研报
4285 点击    2024-04-05 15:37
值得你花时间看的扩散模型教程,来自普渡大学

值得你花时间看的扩散模型教程,来自普渡大学

值得你花时间看的扩散模型教程,来自普渡大学

Diffusion 不仅可以更好地模仿,而且可以进行「创作」。扩散模型(Diffusion Model)是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法,扩散模型另辟蹊径,其主要思想是一种先对图像增加噪声,再逐步去噪的过程,其中如何去噪还原图像是算法的核心部分。而它的最终算法能够从一张随机的噪声图像中生成图像。

来自主题: AI技术研报
46696 点击    2024-04-05 15:30