AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范
8113点击    2025-10-06 19:53

不是拼凑知识点,AI这次是真搞研究。


一个叫Virtuous Machines的AI系统,花了17小时、114美元,找了288个真人做实验,写了一篇30页的学术论文。


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


而且还是从选题到成稿全自动化速通!?


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


来看看这个AI都写了点啥。


AI自动化做科研:从灵光一现到可发表论文


像人类一样搞科研


AI自主完成的这个论文属于认知心理学领域,具体聚焦于人类视觉认知相关的研究方向。


而且它可不是瞎写,而是靠人类的科研套路来。


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


先是基于认知心理学理论提出研究问题,比如“视觉工作记忆与心理旋转能力有没有关系”、“心理意象清晰度对视觉认知任务表现有什么影响”等。(视觉工作记忆是指人类维持并处理视觉信息的能力,涉及信息存储、操作和提取过程;心理旋转是指通过心理操作实现空间客体旋转以完成知觉匹配的认知过程)


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


接着设计实验方案,考虑到了样本量计算、控制变量,还用VVIQ2量表测量被试(对象)的心理意象清晰度;


在确定好实验方案后,它还通过在线平台Prolific招募了288名被试对象,等277份有效数据(部分被试未完成实验,被AI筛除了)收上来,它又连续写了8小时Python代码,用重复测量方差处理数据。


在分析数据的过程中,甚至会识别异常值、调整统计模型;


最后整理结果时,还能引用40+篇PubMed、Semantic Scholar上的真实文献,连论文的“方法”“结果”“讨论”部分都符合APA格式规范。


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


这么高效,如何做到的?


不同功能的AI组队,专人专职


那就来扒一下这个AI系统的架构。


它的自主科研能力源于协作+模拟人类认知机制+动态知识交互的技术设计。


在协同架构中,Master是核心控制模块,总领全局。


其他的AI助手模块聚焦文献检索、数据分析、实验设计等细分任务。


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


而支撑类人类认知机制发挥作用的底层能力基础则像“洋葱圈”。


AI花17小时写了篇30页学术论文!自主选题,包含实验,还符合APA格式规范


最核心的是知识检索能力,能从海量学术数据库精准抓取知识;接着是抽象提炼能力,可从众多具体研究里总结通用逻辑;再往上是元认知反思能力,让AI能自我检查,比如做完数据分析会反问方法是否恰当、结论与假设逻辑是否通顺。


然后是任务分解能力,把科研大工程拆解成可执行的小任务,比如写论文拆分为文献综述、实验设计等环节;还有自主迭代能力,无需人工干预,AI会反复修改论文草稿、调试崩溃的代码,直到满意。


最外层是多智能体协作能力,不同功能的AI小助手组队,让系统做到文献检索、实验设计、数据分析专人专职。


除此之外,还有个d-RAG实时记忆库,能一边查最新文献,一边记自己之前的研究,新老知识能交互整合。


这一套架构下来,17小时写出30页论文也算是手拿把掐。


速度很快,小缺点也有


不过,这AI虽然卷,但也不是完美的。


虽然优点很明显:效率比人类团队快10倍以上,数据分析严谨到会拒绝统计显著性陷阱(就算p<0.05,但如果效应量过小,也会说明“结果实际意义有限”),还能处理真实实验中的噪音数据等。


但它偶尔也会出现理论误解,比如把已有研究结论说成首次发现;漏标图表的Y轴单位、把“跨试次间隔”和“刺激呈现间隔”混用等。


只能说,AI搞研究速度是挺牛,但想完全取代人类研究员的理论深度和创新思维,目前看来还差点意思~


研究地址:https://arxiv.org/abs/2508.13421
参考链接:https://x.com/IntuitMachine/status/1972252510585847835


文章来自于微信公众号 “量子位”,作者 “量子位”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI