AI技术研报-这里有最前沿的人工智能技术解读

AAAI 2025 | 多模态大语言模型空间智能新探索：仅需单张图片或一句话，就可以精准生成3D建模代码啦！

计算机辅助设计（CAD）已经成为许多行业设计、绘图和建模的标准方法。如今，几乎每一个制造出来的物体都是从参数化 CAD 建模开始的。

来自主题: AI技术研报

3755 点击 2025-01-03 16:07

北大、港理工革新性LiNo框架：线性与非线性模式有效分离，性能全面超越Transformer

时间序列数据，作为连续时间点的数据集合，广泛存在于医疗、金融、气象、交通、能源（电力、光伏等）等多个领域。有效的时间序列预测模型能够帮助我们理解数据的动态变化，预测未来趋势，从而做出更加精准的决策。

来自主题: AI技术研报

6695 点击 2025-01-03 15:53

数据不够致Scaling Law撞墙？CMU和DeepMind新方法可让VLM自己生成记忆

最近 AI 社区很多人都在讨论 Scaling Law 是否撞墙的问题。其中，一个支持 Scaling Law 撞墙论的理由是 AI 几乎已经快要耗尽已有的高质量数据，比如有一项研究就预计，如果 LLM 保持现在的发展势头，到 2028 年左右，已有的数据储量将被全部利用完。

来自主题: AI技术研报

9839 点击 2025-01-03 15:46

复旦等提出「中国版GPT-Zero」！毕业论文AI率自查神器｜AAAI 2025

复旦大学等机构的研究人员最新提出的AI内容检测器ImBD涵盖多任务检测（润色、扩写、改写、纯生成），支持英语、中文、西班牙语、葡萄牙语等多种主流语言；仅需500对样本、5分钟训练时间，就能实现超越商用检测器！

来自主题: AI技术研报

10352 点击 2025-01-03 15:41

Agent 最全 Playbook：场景、记忆和交互创新

AI Agent 是我们紧密追踪的范式变化，Langchain 的一系列文章对理解 Agent 的发展趋势很有帮助。在本篇编译中，第一部分是 Langchain 团队发布的 State of AI Agent 报告。

来自主题: AI技术研报

10008 点击 2025-01-03 12:13

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B

穿越重重迷雾，OpenAI模型参数终被揭开！一份来自微软华盛顿大学医疗论文，意外曝光了GPT-4、GPT-4o、o1系列模型参数。让所有人震惊不已的是，GPT-4o mini仅8B。

来自主题: AI技术研报

7473 点击 2025-01-02 17:23

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

近年来，视觉语言基础模型（Vision Language Models, VLMs）大放异彩，在多模态理解和推理上展现出了超强能力。现在，更加酷炫的视觉语言动作模型（Vision-Language-Action Models, VLAs）来了！通过为 VLMs 加上动作预测模块，VLAs 不仅能 “看” 懂和 “说” 清，还能 “动” 起来，为机器人领域开启了新玩法！

来自主题: AI技术研报

7596 点击 2025-01-02 16:29

比扣子简单! Cline+MCP 快速打造Agent工作流: 实战案例解析

随着人工智能技术的不断进步，构建个性化智能体的需求日益增加。国内虽然已有一些智能体平台，如豆包扣子，但这些平台要求开发者将代码和数据上传到第三方服务器，对于一些商业信息敏感的客户来说，这种做法可能带来数据泄露的风险。

来自主题: AI技术研报

13003 点击 2025-01-02 15:11

比人类神经元快10亿倍！港中文、中科院「超级大脑」：1秒识图3479万张

想象一下，一个比人类大脑快10亿倍「超级大脑」是什么概念？来自港中文、中科院物理所等机构研究人员，提出了突破性激光人工神经元，完美复刻了人类神经细胞功能，更创造了惊人的处理速度记录。

来自主题: AI技术研报

9038 点击 2025-01-02 14:49

多模态长文档新基准来了！20多项任务覆盖理解推理定位，GPT-4o也就刚及格

GPT-4o仅得分64.5，其余模型均未及格！全面、细粒度评估模型多模态长文档理解能力的评测集来了～名为LongDocURL，集成了长文档理解、数值推理和跨元素定位三个主任务，并包含20个细分子任务。

来自主题: AI技术研报

6932 点击 2025-01-02 14:19

4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

微软又把OpenAI的机密泄露了？？在论文中明晃晃写着： o1-preview约300B参数，GPT-4o约200B，GPT-4o-mini约8B……

来自主题: AI技术研报

9057 点击 2025-01-02 14:03

OpenAI o1「作弊」修改系统，强行击败专业象棋AI！全程无需提示

在与专用国际象棋引擎Stockfish测试中，只因提示词中包含能力「强大」等形容词，o1-preview入侵测试环境，直接修改比赛数据，靠「作弊」拿下胜利。这种现象，表明AI安全任重道远。

来自主题: AI技术研报

9424 点击 2025-01-01 17:28

上交大揭露大模型审稿风险：一句话就能让论文评分飞升

近年来，大语言模型在多个领域展现出了令人惊叹的潜力。同行评审作为一项既繁琐又至关重要的任务，正在引起越来越多学者的关注并尝试利用大语言模型来辅助甚至替代审稿，力图提高这一传统流程的效率。

来自主题: AI技术研报

9535 点击 2025-01-01 17:24

每月都有重磅研究，2024全年值得一读的论文都在这了

2024 年，是 AI 领域让人兴奋的一年。在这一年中，各大科技公司、机构发布了数不胜数的研究。

来自主题: AI技术研报

9483 点击 2025-01-01 17:18

ViT作者飞机上也要读的改进版Transformer论文，花2个小时详细批注解读分享出来

ViT核心作者Lucas Beyer，长文分析了一篇改进Transformer架构的论文，引起推荐围观。

来自主题: AI技术研报

9032 点击 2024-12-31 14:43

理解生成协同促进？华为诺亚提出ILLUME，15M数据实现多模态理解生成一体化

多模态理解与生成一体化模型，致力于将视觉理解与生成能力融入同一框架，不仅推动了任务协同与泛化能力的突破，更重要的是，它代表着对类人智能（AGI）的一种深层探索。

来自主题: AI技术研报

8758 点击 2024-12-31 14:19

设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成，无需重训练！

平面设计是一门艺术学科，它们致力于创造一些吸引注意力和有效传达信息的视觉内容。为了减轻人类设计师的负担，各种各样的海报生成模型相继被提出。它们只关注某些子任务，远未实现设计构图任务；它们在生成过程中不考虑图形设计的层次信息。为了解决这些问题，作者将分层设计原理引入多模态模型（LMM），并提出LaDeCo算法。

来自主题: AI技术研报

7014 点击 2024-12-31 13:02