AI资讯新闻榜单内容搜索-arXiv

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: arXiv
arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集

arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集

arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集

「这才是开放研究该有的样子。」 经常刷 arXiv 的同学,你有没有发现页面上多了个新功能?这个新功能(图中的「Hugging Face」按钮)隐藏在「Code, Data, Media」选项卡下,选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。

来自主题: AI技术研报
2936 点击    2024-10-25 14:22
六年、六届学生接力,共铸上交大图像合成工具箱libcom

六年、六届学生接力,共铸上交大图像合成工具箱libcom

六年、六届学生接力,共铸上交大图像合成工具箱libcom

如果你对 arXiv 的版本号有所了解,你就知道这篇论文已经更新了 4 次,现在已经来到了第 5 个版本。实际上,这个 arXiv 编号属于上海交通大学牛力团队一篇持续更新了四年的综述报告。

来自主题: AI技术研报
4786 点击    2024-10-12 14:51
吴恩达弟子打造arXiv弹幕版,每篇论文都能自由讨论了

吴恩达弟子打造arXiv弹幕版,每篇论文都能自由讨论了

吴恩达弟子打造arXiv弹幕版,每篇论文都能自由讨论了

网友:学术圈该有的样子! 现在,arXiv的每篇论文,都能直接提问讨论了! 只需把URL中的arXiv替换成AlphaXiv,就能对任意一篇论文发布提问或讨论。

来自主题: AI资讯
7306 点击    2024-08-02 10:30
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

前几天,普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型,论文提出构建完全可微的MoE模型,是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报
9531 点击    2024-05-20 16:10
原作者带队,LSTM真杀回来了!

原作者带队,LSTM真杀回来了!

原作者带队,LSTM真杀回来了!

20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所存在的局限性使其风光不再。

来自主题: AI资讯
7140 点击    2024-05-10 10:19
何恺明谢赛宁解剖扩散模型,新作刚刚出炉

何恺明谢赛宁解剖扩散模型,新作刚刚出炉

何恺明谢赛宁解剖扩散模型,新作刚刚出炉

大神最新论文刚刚挂上arXiv,还是热乎的:解构扩散模型,提出一个高度简化的新架构l-DAE(小写的L)。

来自主题: AI资讯
7384 点击    2024-01-27 10:40
蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

该算法现已在GitHub上开源,相关论文公布在ARXIV。近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。

来自主题: AI资讯
7382 点击    2024-01-17 14:08