裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验
7877点击    2025-12-01 10:44

我们能否像《头号玩家》那样伸手就能触摸到虚拟世界?像《阿凡达》那样植物和动物仿佛就在眼前飞舞?这不再只是科幻。11 月 26 日,在一篇最新 Nature 论文中,来自复旦大学团队和上海人工智能实验室的研究人员打造出一款名为 EyeReal 的裸眼 3D 显示器。


它的屏幕很普通,就是使用普通的液晶显示屏。它把好几层液晶显示屏叠在一起,中间加上偏光片,再使用一个白色液晶显示屏做背光,用“便宜货”做出了“黑科技”,即在普通液晶显示屏上实现了全方位、无闪烁、不眼晕的裸眼 3D 效果,未来的玩游戏、学知识和做手术都可能因为 EyeReal 变得完全不同。


裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

(来源:https://www.nature.com/articles/s41586-025-09752-y#additional-information)


EyeReal 解决了两个大问题:它不会让你眼晕,因为它能模拟真实的焦距变化,你看近处的东西时眼睛会自动对焦近处,你看远处的东西时眼睛会自动放松,就像真实世界一样;它还不挑人,不管你的两眼眼距是宽还是窄,它都能适应,不再会出现以前观看 3D 电影时的那种重影或模糊。


它不像 3D 电影需要特制眼镜,也不像 VR 游戏需要笨重的头盔,也不像以前的屏幕那样平均地分配光的信息,而是把最亮的光打在你眼睛最需要的地方。


它知道你的眼睛在哪里:其屏幕上方有一个小小摄像头就像手机的前置摄像头一样,能够捕捉到你双眼的位置。你动、它也动,也就是说它永远知道你在看哪里。它能为你定制光线:通过一个深度学习模型,它会为你实时计算出最适合你双眼的光线图案,让左眼和右眼分别看到最适合的图像。


裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

(来源:https://www.nature.com/articles/s41586-025-09752-y#additional-information)


核心突破:AI 如何实现“千人千面”的裸眼 3D?


由于我们的左眼和右眼的位置不同,因此看到的图像有着细微差别,大脑正是利用这个差别来感知立体感。如前所述,在 EyeReal 里有一个深度学习算法,它可以在百分之一秒内完成一场复杂的思考。


它会在数字世界里根据你真实的双眼位置创造出两个虚拟的眼睛摄像机。然后,它开始进行逆向推演。同时,它还要确保为右眼准备的光线,不会跑错路钻进左眼里捣乱。


由于深度学习算法经过了特殊训练,因此能同时为你的左右眼计算完全不同的复杂光线指令,并且确保它们互不干扰。


前面提到,EyeReal 并不需要昂贵和复杂的设备,它只需使用三四块液晶显示屏像叠三明治一样叠在一起,中间加上一些特殊的偏光薄膜,再用一个白色的液晶显示屏灯从后面照亮。


之所以无需使用昂贵、复杂的光学元件,是因为它把“魔法”都交给了深度学习算法。这意味着一旦技术成熟,其完全有可能以大家都能接受的价格走进千家万户。


裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

(来源:https://www.nature.com/articles/s41586-025-09752-y#additional-information)


基于以上设计,让 EyeReal 在百分之一秒的时间就可以完成以下复杂工作:


首先,可以构建虚拟摄像机,它可以在数字世界里根据你真实的双眼位置,创建出两个虚拟的眼睛摄像机。


其次,它可以逆向推演光路,比如它会做这样一个思考过程:“要让你左眼的摄像机看到正确的图像,得让屏幕上的哪些像素点发出怎样的光?这些光线要经过几层液晶屏?每层屏幕应该呈现出什么样的相位图,才能最终精准地汇入你的左眼?”


再次,它还需要解决“光打架”的难题,它必须确保设计给右眼的光线不会跑错路钻进左眼以至于造成干扰。因此,它通过一个互斥损失函数的规则,学会了如何让左右眼的光线和谐共处,互不干扰。这一切计算都在瞬间完成,速度超过每秒 50 次。所以无论你怎么移动,看到的永远都是为你专门打造的立体画面。


当 EyeReal 这样的技术得到普及之后,我们的学习、工作和娱乐可能会迎来以下变化。当玩游戏时,不再是从上帝视角俯视,而是感觉自己真的站在那个方块世界里,需要侧身才能穿过峡谷、抬头才能望见山顶的雪。当观看足球比赛直播时,从沙发走到餐桌就能看到球门的角度随之变化。


当上地理课时,一个立体的地球仪悬浮在空中,就可以“伸手”拨动它,并能观看季风的流动和板块的飘移。汽车设计师在屏幕前就能全方位地审视新车的外观,从而不会放过任何一个微小的曲线瑕疵。


外科医生可以在 EyeReal 上针对病人器官进行解剖演习,从多个角度观察肿瘤与血管、肿瘤与神经的位置关系,从而制定出最安全和最精准的手术方案。


裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

(来源:https://www.nature.com/articles/s41586-025-09752-y#additional-information)


总结一下 EyeReal 的工作流程就是:用摄像头实时捕捉双眼位置-AI 根据位置计算出需要投射给每只眼睛的光线图案-将指令下达给液晶显示屏-屏幕协同工作并发射出两束为你定制的光-两束光投入你的左眼和右眼-你的大脑将它们融合并产生一个生动和立体的世界。


裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

(来源:https://www.nature.com/articles/s41586-025-09752-y#additional-information)


背后的魔法:深度学习与多组屏幕的协同


很多人看 3D 电影或者玩 VR 游戏时间长了都会头晕和恶心,而 EyeReal 从根源上解决了这一问题。


其一,它解决了视觉辐辏-调节冲突的问题。


在现实世界中,假如你近距离观看自己的手指,你的双眼会向内转动也就是辐辏,同时眼内的肌肉会收缩,让晶状体变凸以便聚焦也就是进行调节。需要说明的是,这两个动作是联动的。


但是,对于传统 3D 屏幕来说,无论影像看起来是近还是远,你的眼睛始终聚焦在屏幕本身的平面上。这种辐辏和调节的信号冲突,会让大脑非常困惑,从而引发疲劳和眩晕。


EyeReal 则通过多层屏幕和精确的光线控制,能够模拟出不同深度的真实焦距。当你观看近处的虚拟物体,眼睛就需要对焦;当你观看远处的虚拟物体,就需要放松眼睛。这完全符合我们观看真实世界的习惯,因此可以极大地减轻视觉疲劳。


其二,它解决了瞳距不匹配的问题。


每个人两眼之间的距离也就是瞳距都是不一样的。以前的裸眼 3D 屏幕有预设的最佳观看点位,如果你的瞳距与之不符,就会看到重影非常难受。而 EyeReal 是以动态形式工作的,它通过摄像头能够获悉你的精确瞳距,然后可以为你生成合成的影像。


裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

图 | 论文一作是复旦博士生马炜杰(来源:https://www.nature.com/articles/s41586-025-09752-y#additional-information)


尾声:从屏幕魔法到世界之窗


EyeReal 只是一个起点,研究团队还在继续构想它的未来:


一方面,其希望实现多人同时观看。当前的 EyeReal 可服务于一位用户。未来,通过时分复用或定向背光等技术,它可以让围坐在屏幕前的一家人都能看到属于自己的、正确的立体图形;


另一方面,其希望实现更大的尺寸和更高的效率。结合更先进的 mini-LED 背光和技术,未来的屏幕可以做得像整个墙面那么大,亮度和色彩也会更加惊艳;


最后,其将与交互进行结合,通过使用手势识别技术和力反馈技术,人们将不仅能看到立体影像,还能触摸并移动影像,实现真正的隔空操作。未来,客厅墙壁就是一整块屏幕,当你需要时,它可以变为通向任何地区的传送门,也许是热带雨林、也许是海底深渊、也许是火星表面。


1965 年,美国科学家、“虚拟现实之父”伊万·萨瑟兰(Ivan Sutherland)提出了终极显示的概念:一个无法与真实世界区分的虚拟世界。在过去,这只是一个疯狂的梦想。但在今天,像 EyeReal 这样的技术正在一步步地将这个梦想变为现实。


这群来自中国的科学家用他们的智慧找到了一条在现有物理规律下钻空子的巧妙路径,把不可能变为了可能,更和我们的学习、娱乐和生活有着紧密联系,期待有一天 EyeReal 能够真正走进你我生活之中。


参考资料:

https://www.nature.com/articles/s41586-025-09752-y


文章来自于“DeepTech深科技”,作者 “罗以”。

关键词: AI新闻 , AI 3D , EyeReal , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales