AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。

来自主题: AI技术研报
8033 点击    2025-01-04 14:20
Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

预训练语言模型通常在其参数中编码大量信息,并且随着规模的增加,它们可以更准确地回忆和使用这些信息。

来自主题: AI技术研报
6926 点击    2025-01-04 14:14
轻松进行动态图异常检测,南洋理工提出GeneralDyG

轻松进行动态图异常检测,南洋理工提出GeneralDyG

轻松进行动态图异常检测,南洋理工提出GeneralDyG

此项研究成果已被 AAAI 2025 录用。该论文的第一作者是南洋理工大学计算与数据科学学院 (CCDS) 的硕士生杨潇,师从苗春燕教授,主要研究方向是图神经网络。

来自主题: AI技术研报
6912 点击    2025-01-04 14:07
斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手

斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手

斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手

斯坦福大学最新AI进展!开源STORM&Co-STORM系统,只需填写主题,就可以全面整合资源,避开信息盲点生成高质量长文。

来自主题: AI技术研报
6139 点击    2025-01-03 17:18
AAAI 2025 | 多模态大语言模型空间智能新探索:仅需单张图片或一句话,就可以精准生成3D建模代码啦!

AAAI 2025 | 多模态大语言模型空间智能新探索:仅需单张图片或一句话,就可以精准生成3D建模代码啦!

AAAI 2025 | 多模态大语言模型空间智能新探索:仅需单张图片或一句话,就可以精准生成3D建模代码啦!

计算机辅助设计(CAD)已经成为许多行业设计、绘图和建模的标准方法。如今,几乎每一个制造出来的物体都是从参数化 CAD 建模开始的。

来自主题: AI技术研报
1715 点击    2025-01-03 16:07
北大、港理工革新性LiNo框架:线性与非线性模式有效分离,性能全面超越Transformer

北大、港理工革新性LiNo框架:线性与非线性模式有效分离,性能全面超越Transformer

北大、港理工革新性LiNo框架:线性与非线性模式有效分离,性能全面超越Transformer

时间序列数据,作为连续时间点的数据集合,广泛存在于医疗、金融、气象、交通、能源(电力、光伏等)等多个领域。有效的时间序列预测模型能够帮助我们理解数据的动态变化,预测未来趋势,从而做出更加精准的决策。

来自主题: AI技术研报
4908 点击    2025-01-03 15:53
数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆

数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆

数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆

最近 AI 社区很多人都在讨论 Scaling Law 是否撞墙的问题。其中,一个支持 Scaling Law 撞墙论的理由是 AI 几乎已经快要耗尽已有的高质量数据,比如有一项研究就预计,如果 LLM 保持现在的发展势头,到 2028 年左右,已有的数据储量将被全部利用完。

来自主题: AI技术研报
8288 点击    2025-01-03 15:46
复旦等提出「中国版GPT-Zero」!毕业论文AI率自查神器|AAAI 2025

复旦等提出「中国版GPT-Zero」!毕业论文AI率自查神器|AAAI 2025

复旦等提出「中国版GPT-Zero」!毕业论文AI率自查神器|AAAI 2025

复旦大学等机构的研究人员最新提出的AI内容检测器ImBD涵盖多任务检测(润色、扩写、改写、纯生成),支持英语、中文、西班牙语、葡萄牙语等多种主流语言;仅需500对样本、5分钟训练时间,就能实现超越商用检测器!

来自主题: AI技术研报
8331 点击    2025-01-03 15:41
Agent 最全 Playbook:场景、记忆和交互创新

Agent 最全 Playbook:场景、记忆和交互创新

Agent 最全 Playbook:场景、记忆和交互创新

AI Agent 是我们紧密追踪的范式变化,Langchain 的一系列文章对理解 Agent 的发展趋势很有帮助。在本篇编译中,第一部分是 Langchain 团队发布的 State of AI Agent 报告。

来自主题: AI技术研报
7139 点击    2025-01-03 12:13
微软论文意外「走光」,OpenAI参数全泄密!GPT-4o仅200B,o1 300B

微软论文意外「走光」,OpenAI参数全泄密!GPT-4o仅200B,o1 300B

微软论文意外「走光」,OpenAI参数全泄密!GPT-4o仅200B,o1 300B

穿越重重迷雾,OpenAI模型参数终被揭开!一份来自微软华盛顿大学医疗论文,意外曝光了GPT-4、GPT-4o、o1系列模型参数。让所有人震惊不已的是,GPT-4o mini仅8B。

来自主题: AI技术研报
6115 点击    2025-01-02 17:23
全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

近年来,视觉语言基础模型(Vision Language Models, VLMs)大放异彩,在多模态理解和推理上展现出了超强能力。现在,更加酷炫的视觉语言动作模型(Vision-Language-Action Models, VLAs)来了!通过为 VLMs 加上动作预测模块,VLAs 不仅能 “看” 懂和 “说” 清,还能 “动” 起来,为机器人领域开启了新玩法!

来自主题: AI技术研报
5813 点击    2025-01-02 16:29
比扣子简单! Cline+MCP 快速打造Agent工作流: 实战案例解析

比扣子简单! Cline+MCP 快速打造Agent工作流: 实战案例解析

比扣子简单! Cline+MCP 快速打造Agent工作流: 实战案例解析

随着人工智能技术的不断进步,构建个性化智能体的需求日益增加。国内虽然已有一些智能体平台,如豆包扣子,但这些平台要求开发者将代码和数据上传到第三方服务器,对于一些商业信息敏感的客户来说,这种做法可能带来数据泄露的风险。

来自主题: AI技术研报
9638 点击    2025-01-02 15:11
比人类神经元快10亿倍!港中文、中科院「超级大脑」:1秒识图3479万张

比人类神经元快10亿倍!港中文、中科院「超级大脑」:1秒识图3479万张

比人类神经元快10亿倍!港中文、中科院「超级大脑」:1秒识图3479万张

想象一下,一个比人类大脑快10亿倍「超级大脑」是什么概念?来自港中文、中科院物理所等机构研究人员,提出了突破性激光人工神经元,完美复刻了人类神经细胞功能,更创造了惊人的处理速度记录。

来自主题: AI技术研报
7023 点击    2025-01-02 14:49
多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格

多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格

多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格

GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~ 名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。

来自主题: AI技术研报
5977 点击    2025-01-02 14:19
4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

微软又把OpenAI的机密泄露了??在论文中明晃晃写着: o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……

来自主题: AI技术研报
6850 点击    2025-01-02 14:03
OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。

来自主题: AI技术研报
7083 点击    2025-01-01 17:28
上交大揭露大模型审稿风险:一句话就能让论文评分飞升

上交大揭露大模型审稿风险:一句话就能让论文评分飞升

上交大揭露大模型审稿风险:一句话就能让论文评分飞升

近年来,大语言模型在多个领域展现出了令人惊叹的潜力。同行评审作为一项既繁琐又至关重要的任务,正在引起越来越多学者的关注并尝试利用大语言模型来辅助甚至替代审稿,力图提高这一传统流程的效率。

来自主题: AI技术研报
7068 点击    2025-01-01 17:24
每月都有重磅研究,2024全年值得一读的论文都在这了

每月都有重磅研究,2024全年值得一读的论文都在这了

每月都有重磅研究,2024全年值得一读的论文都在这了

2024 年,是 AI 领域让人兴奋的一年。在这一年中,各大科技公司、机构发布了数不胜数的研究。

来自主题: AI技术研报
7604 点击    2025-01-01 17:18
理解生成协同促进?华为诺亚提出ILLUME,15M数据实现多模态理解生成一体化

理解生成协同促进?华为诺亚提出ILLUME,15M数据实现多模态理解生成一体化

理解生成协同促进?华为诺亚提出ILLUME,15M数据实现多模态理解生成一体化

多模态理解与生成一体化模型,致力于将视觉理解与生成能力融入同一框架,不仅推动了任务协同与泛化能力的突破,更重要的是,它代表着对类人智能(AGI)的一种深层探索。

来自主题: AI技术研报
6924 点击    2024-12-31 14:19
设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成,无需重训练!

设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成,无需重训练!

设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成,无需重训练!

平面设计是一门艺术学科,它们致力于创造一些吸引注意力和有效传达信息的视觉内容。为了减轻人类设计师的负担,各种各样的海报生成模型相继被提出。它们只关注某些子任务,远未实现设计构图任务;它们在生成过程中不考虑图形设计的层次信息。为了解决这些问题,作者将分层设计原理引入多模态模型(LMM),并提出LaDeCo算法。

来自主题: AI技术研报
5062 点击    2024-12-31 13:02
苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

苹果要搞人形机器人这事儿现在传得沸沸扬扬。 最近他们确实有新动作——开发了一套机器人感知系统! 系统名为ARMOR,软硬件协同增强机器人的“空间意识”,能动态防碰撞的那种。

来自主题: AI技术研报
6574 点击    2024-12-30 19:30
一张图生成高质量广视野3D场景,还可控制摄像轨迹

一张图生成高质量广视野3D场景,还可控制摄像轨迹

一张图生成高质量广视野3D场景,还可控制摄像轨迹

只需一张图,就能生成高质量、广范围的3D场景! 泰迪熊、花园、山谷都从平面图片变成了仿佛触手可及的立体物品。

来自主题: AI技术研报
6539 点击    2024-12-30 19:13
小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

你是否想过在自己的设备上运行自己的大型语言模型(LLMs)或视觉语言模型(VLMs)?你可能有过这样的想法,但是一想到要从头开始设置、管理环境、下载正确的模型权重,以及你的设备是否能处理这些模型的不确定性,你可能就犹豫了。

来自主题: AI技术研报
7380 点击    2024-12-30 16:53
中国发表AI论文数量,全球第一!这些互联网大厂功不可没

中国发表AI论文数量,全球第一!这些互联网大厂功不可没

中国发表AI论文数量,全球第一!这些互联网大厂功不可没

事情是这样的,我今天刷信息流的时候注意到,蚂蚁集团今天发布了 2024 科技生态白皮书,展示了他们在论文、专利、开源、标准、产学研等几个方面的进展。

来自主题: AI技术研报
7766 点击    2024-12-30 14:53
9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠

9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠

9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠

视觉价值模型(VisVM)通过「推理时搜索」来提升多模态视觉语言模型的图像描述质量,减少幻觉现象。实验表明,VisVM能显著提高模型的视觉理解能力,并可通过自我训练进一步提升性能。

来自主题: AI技术研报
6694 点击    2024-12-30 14:43
斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧

斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧

斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧

随着 o1、o1 Pro 和 o3 的成功发布,我们明显看到,推理所需的时间和计算资源逐步上升。可以说,o1 的最大贡献在于它揭示了提升模型效果的另一种途径:在推理过程中,通过优化计算资源的配置,可能比单纯扩展模型参数更为高效。

来自主题: AI技术研报
8179 点击    2024-12-30 14:32
港科大开源VideoVAE+,视频重建质量全面超越最新模型

港科大开源VideoVAE+,视频重建质量全面超越最新模型

港科大开源VideoVAE+,视频重建质量全面超越最新模型

港科大团队重磅开源 VideoVAE+,提出了一种强大的跨模态的视频变分自编码器(Video VAE),通过提出新的时空分离的压缩机制和创新性引入文本指导,实现了对大幅运动视频的高效压缩与精准重建,同时保持很好的时间一致性和运动恢复。

来自主题: AI技术研报
4968 点击    2024-12-30 13:51
AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

韦伯区位问题源自一个经典的运筹优化问题,它首先由著名数学家皮耶・德・费马提出,后被著名经济学家阿尔弗雷德・韦伯(著名社会学家马克斯・韦伯的弟弟)扩展,在机器学习、人工智能、金融工程及计算机视觉等众多领域均有广泛应用。

来自主题: AI技术研报
4937 点击    2024-12-30 13:45