Nature:光影真相vs算法幻象,AI时代的科学摄影

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Nature:光影真相vs算法幻象,AI时代的科学摄影
8801点击    2025-05-20 09:56

在麻省理工学院工作的好处之一,是能够窥见未来科技的轮廓——从量子计算的突破、可持续性能源的生产,到新型抗生素设计。若问我是否对这些领域都有深刻理解?答案是否定的。但当研究者邀请我为他们的工作拍摄纪实图像时,我能够理解其中的大部分内容。


科学摄影师的职业乐趣在于,我必须了解自己正在记录的事物,才能为那些向我敞开实验室大门的研究者拍摄出兼具信息传递功能与可信度的图像,究其本质,这些图像本身也是一种实验数据存在。


Nature:光影真相vs算法幻象,AI时代的科学摄影

载玻片上的油滴内含铁微粒,对下方磁体产生响应。图片来源:Felice Frankel


然而,随着生成式人工智能工具的广泛普及,一系列问题亟待探讨。是否会存在某个时刻,科学家仅需几次键盘输入与提示,就能像我用相机那样创建研究的“视觉化”成果,并将该图像视为工作的记录?科研人员、期刊编辑与读者能否准确辨识人工合成图像,并理解其本质并非真实研究过程的记录?以及,最后我的个人关心的问题,在人工智能时代,是否仍需要科学摄影师这类角色来推动科研传播?通过亲身体验人工智能图像生成工具,我有了一些看法。


真实与表征之辨


我们首先需要明确传统摄影与AI生成图像的本质差异,前者每个像素都对应真实世界的光子,后者则通过扩散模型构建。这种复杂计算过程可以生成看似真实却可能从未存在的事物。


为探究这种差异,我在哈佛大学科学可视化专家Gaël McGill的帮助下,尝试用Midjourney和OpenAI的DALL-E复现我拍摄的经典科学影像。


1997年,麻省理工学院的化学家穆恩吉·鲍温迪(Moungi Bawendi)邀请我拍摄他的纳米晶体(nanocrystals,即量子点)。这些晶体在紫外光激发下会发出荧光,其发射波长随着晶体尺寸的不同而变化。鲍温迪因这项工作后来获得了诺贝尔奖,但他并不喜欢这张照片,当时我将试管平放在实验台上俯拍得到的第一张照片(参见图示)。你可以从画面中管内的气泡看出我的摆放方式。这是有意为之,我认为它增强了图像的视觉吸引力。


Nature:光影真相vs算法幻象,AI时代的科学摄影

三重视角。组图呈现三种试管影像:首幅为摄影师视角,试管内气泡清晰可见;第二幅呈现科学家对颜色的重视;第三幅由AI生成,并非真实刻画。 Credit: Felice Frankel


修改后的第二版照片被选用为1997年11月《物理化学B期刊》(Journal of Physical Chemistry B)封面。这幅影像不仅为研究提供了直观记录,更凸显了科学摄影师与研究者协作的重要性,这正是我工作流程中不可或缺的环节。


为在DALL-E中生成类似的图像,我输入以下提示词:"生成一张在黑色背景前的Moungi Bawendi的纳米晶体试管图片,其中试管受紫外光激发后因纳米晶体尺寸差异呈现不同波长荧光"*。


原提示词:create a photo of Moungi Bawendi’s nanocrystals in vials against a black background, fluorescing at different wavelengths, depending on their size, when excited with UV light.


Nature:光影真相vs算法幻象,AI时代的科学摄影


Nature:光影真相vs算法幻象,AI时代的科学摄影

图片由AI生成


你可能会认为程序生成的图像颇具美感,但其真实性与原始照片相去甚远。DALL-E在画面中生成了提示词未提及的珠状微粒结构,这或许是因为其算法在底层模型数据集中检索到"量子点"(quantum dots)这一术语后,将该概念替换了原本的"纳米晶体"(nanocrystals)表述。


更值得警惕的是,每个试管内含有多色微粒结构,暗示样本含有在多种波长发荧光的混合材料,这与事实不符。此外,部分微粒被描绘为散落在实验台表面,这种处理是否出自模型的美学考量?我认为生成的视觉效果非常吸引人。


Nature:光影真相vs算法幻象,AI时代的科学摄影

图片由AI生成


在AI生成实验中,我获得的图像往往是难以被实现的卡通式图像,更遑论作为科学记录,但技术迭代终将突破这层壁垒。通过与科研界及计算机科学领域同行的深入探讨,我们达成共识,必须建立明确的许可性规范。在我看来,AI生成的视觉作品视觉内容永远不应被允许作为文档记录。


Nature:光影真相vs算法幻象,AI时代的科学摄影

图片由AI生成


图像处理与AI生成的本质分野


人工智能的出现意味着我们必须澄清视觉传播领域的三个核心议题,也就是阐释性图示(illustration)与影像记录(documentation)的差异、图像处理(image manipulation)的伦理规范,以及对科学家与工程师进行视觉传播训练(visual-communication training)的迫切需求。


影像构图,就是选择纳入或舍弃哪些元素,本身就是对现实的一种修饰。人们所选用的工具也是这种修饰的一部分。每一台数码相机都能拍出独特的照片;苹果iPhone的图像算法在色彩增强方面与三星手机截然不同;同样,詹姆斯·韦伯太空望远镜所拍摄的近红外图像,虽与哈勃太空望远镜的光学扫描不同,但正是为了与之互为补充。


更进一步来说,那些震撼人心的宇宙影像中呈现的瑰丽色彩皆经过数字增强(digitally enhanced),创造出对现实的多维诠释。如此说来,人类多年来实际上一直在"人工生成图像"。然而,通过软件增强照片以刻画现实,与基于训练数据集创造虚拟现实之间,存在着根本性差异。


作为科学摄影师,我深谙阐释性图示与记录影像之间的界限,但对人工智能程序是否具备这样的判断力持保留态度。阐释性图示或图表通过符号、色彩、形状等元素对概念进行主观转译与视觉描述,其本质是对某个事物的表征;而基于光学摄影或扫描/透射电子显微技术获取的纪实影像,尽管并非实体本身,却是使用光子或电子形成的客观记录。二者本质差异在于其目的。


阐释性图示的核心目的在于描述并阐明研究内容,生成式AI在此领域或将大放异彩。但对纪实影像而言,其目的在于将现实世界最大限度还原。两者本质上均属于修饰或人工生成行为,这也凸显出在引入生成式AI工具前,进行深度探讨并建立相关伦理规范的必要性。


当前出版机构已配备相应软件用于检测既有图像中的各类修饰行为(参见Nature 626, 697–698; 2024),但坦率而言,人工智能程序终将具备规避此类防护机制的能力。学界正致力于构建图像溯源体系,以期完整记录原始影像的任何修改痕迹。例如,法证摄影(forensic photography)界通过全球性组织"内容来源与真实性联盟"(Coalition for Content Provenance and Authenticity),向相机制造商提供技术指导,通过在设备端记录所有图像处理操作来实现照片溯源。但不出所料,并非所有制造商都采纳了这一标准。


科学界仍有时间构建透明化体系并制定AI生成图像的相关准则。最低限度要求是,所有生成式AI图像都必须明确标注其属性,且须清晰说明创作过程与使用工具,并在可能情况下注明提供给AI引擎的源图像信息。然而,溯源清单的建立仍面临重大挑战。


有两篇重要论文揭示了扩散模型应用中潜在的隐私与版权风险(N. Carlini et al. Preprint at arXiv https://doi.org/grqmsb (2023);另见go.nature.com/4jqyevn)。版权归属仅适用于训练数据已知且完整记录的封闭系统(扩散模型尚不满足此条件)。例如,Nature期刊的出版方Springer Nature近期在其政策中为Google DeepMind的AlphaFold程序增设特例条款,允许其基于特定科学数据集训练的模型进行应用。但需特别指出,AlphaFold并非生成图像的生成式AI工具,其输出内容为结构模型(structural models,即坐标数据),后续仍需由科研人员(而非生成式AI工具)转化为图像。


令人欣慰的是,相关努力正着手解决隐私问题。创作者现可使用一种名为"内容凭证"(Content Credentials)的防篡改元数据,正如Adobe技术手册所述,该技术旨在"使创作者获得应有的认可并提升创作过程的透明度"。


伦理标准


多年来,我一直呼吁科研工作者亟需接受视觉传播伦理的系统化训练,而人工智能图像生成工具的普及应用,更凸显了相关讨论的迫切性。


例如,我曾遇到一位工程师擅自修改了我为其研究拍摄的照片,并希望将处理后的图像与投稿论文一并发表。该研究者并未意识到,篡改图像实质上等同于篡改数据,这种认知缺失源于其从未接受过图像处理与视觉传播的基础伦理教育。


Nature:光影真相vs算法幻象,AI时代的科学摄影


Nature:光影真相vs算法幻象,AI时代的科学摄影


Nature:光影真相vs算法幻象,AI时代的科学摄影

作者拍摄的图片与被修改的图片


计算机科学领域同行指出,关于人工智能伦理的讨论虽已广泛开展,但这些讨论主要发生在科学界之外。令我忧虑的是,整个科研共同体尚未充分认识到,图像处理不仅是美学问题,更是一个需要严肃对待的伦理命题。


一幅图像经过多大程度的修饰后仍可被视为科学记录?我们如何判断数据在图像中是否得到如实呈现,是否存在刻意或无意遗漏?面对完全基于算法筛选现实素材、以记录为目的而从头构建的生成式AI视觉作品,其伦理边界应如何界定?诸多问题仍待解答。


未来愿景


显然生成式AI图像必将成为我们未来的一部分。尽管多数可能归类于阐释性图示范畴,但必须正视其作为科研记录使用的潜在可能性。基于此,科研界亟需构建指导规范,要求研究者在提交含图像的论文时,至少需回应以下质询:


1.该图像是否由AI生成?若是,则必须进行明确标注并包含标识其属性的元数据。


2.具体采用了何种生成式AI模型及其版本?


3.生成该图像时使用了哪些提示词?


4.是否使用了图像来辅助提示词?若有,请一并提交该图像并注明来源信息。


摄影师的职责


为回应本文开篇的问题——人工智能时代是否仍有科学摄影师的立足之地?我向OpenAI的ChatGPT寻求答案。以下是其精简答复:


"在人工智能生成图像的领域中,记录科学对象的摄影师扮演着独特角色,他们在这个准确性及表征真实性至关重要的领域,提供着专业技术、真实性与批判的视角。"


ChatGPT进一步阐释:"简而言之,在人工智能时代,科学摄影师仍具有不可替代的价值。他们引导负责任的实践范式,提供高质量输入数据,确保生成式AI图像承担知识传播功能而非误导受众。他们既是科学影像真实性的守护者,又是开拓新视觉疆域的先锋。"


我对这个答案很满意。


原文链接:https://www.nature.com/articles/d41586-025-00532-2


文章来自于“追问nextquestion”,作者“Felice Frankel”。


Nature:光影真相vs算法幻象,AI时代的科学摄影

关键词: AI , AI摄影 , AI成像 , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0