前OpenAI工程师团队推出 AI 原生无限视觉浏览器原型Flipbook，颠覆HTML！

11719点击 2026-04-24 10:46

想象一下：你打开浏览器，没有代码、没有 HTML、没有 CSS 布局引擎。屏幕上每一帧画面，都是 AI 模型实时生成的像素视频流。

它能瞬间理解你的意图，动态重塑整个界面——从巴黎旅行规划到复杂数据可视化，全是手绘级插图般生动，还能随点击无缝变形、交互。

满满的科幻降临既视感！

这就是 Zain Shah（前 OpenAI、YC 校友）和团队刚刚发布的 Flipbook 原型。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

体验地址：flipbook.page

短短一天，X 平台爆火两百百万浏览。网友们已经

玩疯了！手机上也能玩。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

如果你开启 live video stream 模式，体感会更震撼~

Zain 放出了优化后的 LTX Studio 视频模型实现的真实演示：1080p 24fps 实时流式传输，背后是 Modal GPU 服务器。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

传统 Web 开发范式被彻底击穿：

无需前端布局、上网像翻书一样

现在的网页阅读，“是由僵硬的代码和规则生成的，这使得传达复杂而详尽的想法变得困难。”

而 Flipbook 摒弃了这一点，它的理念是：一图胜千言。你落到的每一个“页面”都是一张图像。

奇妙之处在于，点击图像中的任何一个角落，你都会得到一张新的图像，可以继续对该事物进行更深入的探索。

你所看到的内容都不包含任何 HTML、代码、特定的链接或字段。整个网络仅仅是显示在你屏幕上的生成像素，甚至连文字也都是图片中的像素构成。

真正的翻书页一样的体验。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

过去 20 年，我们依赖 HTML + CSS + JavaScript + React 等构建界面。现在，Flipbook 把一切简化为“像素流”：模型直接决定你看到什么、怎么交互。

无需布局引擎：插图随窗口自适应变形，不再被 CSS 框死。
全屏互动：任何像素都能响应点击，模型实时判断意图，不再局限于预定义按钮。
视觉优先：复杂概念用插图、动画、真实渲染表达，而不是枯燥文字和矩形框。

转给我的一个信号就是：前端工程师的“写代码搭界面”时代可能走向终结。

AI原生浏览，真的无敌

小编立刻去体验来一把，的确有一种“无限探索式阅读”的感觉。

例如：今天Qwen3.6-27B 模型发布了，之前总要仔细看下各项基准评分的对比，现在我直接交给 Flipbook 帮我解读了。

我点击了业界现在非常关注的“SWE-bench Verified”，片刻后，它就像一个放大镜工具一样，帮我生成了更为具体对比数字和分析。

我继续点击强相关的 Agentic Flow，它就给出了可视觉化的Loop图。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

这种自带强烈探索感的交互方式前所未有。

如果你想返回上个页面怎么办，导航栏里已经帮你做好了路径记忆，只需要回溯点击即可。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

别小看这个小工具，外界对此视为一个行业地震信号。

除了解读复杂的图表，我还发现了别的妙用：解读现实人物微表情。

解读明星的表情特质。本着不浪费的原则，我把“沈腾时代周刊封面”喂给了 Flipbook。这表情，从眉毛、眼睛到鼻子、嘴，就连酒窝也被解读的明明白白的。

得，沈腾这张脸，太权威了。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

其实还有很多奇怪的用途，只有你想不到，没有 Flipbook 做不到的。

让它帮小学生做作业，抽象的数学题全都被“可视化”了，这不就很容易解题了吗？

总之，所有抽象的东西到这里都变得形象、容易感知了起来！

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

不止这些，想象空间很大，但凡是图片都能给它解读。

直播中不认识嘉宾是谁，可以找它

（ps：现在能力还不够强，只能识别出知名度高的人物，容易翻车），

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

更绝的来了！

没有图片，怎么办？你可以直接在url输入prompt。比如小编，

帮我做一张樱木花道灌篮动作的拆解图！

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

而且，别忘了，其实上面的每一帧画面都有更高阶的“实时视频流”的版本，只怪小编的网速不够，不然可以可以直接樱木花道灌篮的慢动作了。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

可想而知，未来的产品原型也将从“画 Wireframe”变成“直接 prompt 生成可交互视频界面”。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

而低代码/无代码，也将进化成“零代码 AI 原生界面”。

无限视觉的AI原生浏览器：

AI视频模型的实时化突破

Zain 在 X 上特别提到了实时视频的进化技术：优化版的 LTXStudio 视频模型。

“为了让这些图片栩栩如生地活过来，为了让这些图像栩栩如生，我们对 @LTXStudio 的视频模型进行了大幅优化。它能直接以 24fps 的速度向用户的屏幕流式传输 1080p 视频，通过 WebSocket 直接连接到 @modal_labs 的无服务器 GPU 基础设施。”

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

现在看起来，这个 Flipbook 既像 AI 原生浏览器，又像 AI 原生播放器。背后而且交互起来毫无磕绊感，这跟一般的视频生成大不相同，怎么实现的呢？

其实，Flipbook 背后的核心技术，则是 Lightricks （一家专攻 AI-first 创意的科以色列科技公司）的 LTX-2/LTX-2.3 系列开源 DiT 模型。它可以实现高压缩 latent space、多尺度渲染、同步音视频，速度快于实时（H100 上几秒生成数秒视频），支持 native 4K/1080p portrait。

有了它，生成的视频，就具备了实时、状态感知、交互式生成。结合 agentic search，模型还能拉取实时数据，确保准确性。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

下一步野望：结构化UI编程

如此高燃的产品体验，下一步会怎样放大呢？

Zain 坦承 Flipbook 还很有限，所以团队目前选择围绕视觉解释来设计它。

但其实他们的野心更大：随着模型变得更准确和更有状态，这种方式值得做的事情集合将会扩展。甚至那些你认为需要结构化 UI 的，比如编程。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

正如刚才提到的，这项技术可以颠覆我们现有的几乎所有工作流，速度也会十倍提升：

UI/UX 设计：从静态 mockup 到动态视频原型，迭代速度提升 10 倍+。设计师 prompt 一下，就能测试完整用户旅程。
内容创作与教育：旅行规划、教程、数据故事，全变成沉浸式视觉叙事。教育界可能迎来“AI 动态教科书”。
电商/产品演示：商品页面不再是图片+文字，而是实时生成的 3D-like 交互场景，根据用户偏好个性化变形。
游戏与 AR/VR：实时生成 cutscenes、界面，为轻量级 AI 驱动体验铺路。

这还没完，当前的产品体验还受制于模型能力的上限。如果模型发展到足够稳的状态，整个软件界面都可能变成“生成式”。

到那时，浏览器还在，但里面跑的不再是网页，而是 AI 驱动的“无限视觉浏览器”。

Flipbook的背后：

两个字：烧钱，但未来很值得

But，如此前瞻的技术体验，想要继续 Scaling 普及到每一个人，还是有不小的难度的。

主要还是算力成本问题。大家都知道，传统网页客户端渲染几乎免费，然而，Flipbook 需要服务器端持续 GPU 推理。带宽和成本的瓶颈（视频流 vs 文本流的 50-150x 差距）需要解决。

但这块问题并非无解。如果按照黄仁勋、a16z等业内人士或机构的说法，推理算力的成本每年都会下降至原来的20%，甚至10%，此外开源模型的本地化（FP8 量化）节奏也在加速。预计 5-10 年内，经济性方面的问题就会打下来。

此外，Lightricks 等公司正推动开源 + 企业版，Modal 等基础设施已 ready。谁先解决 scaling，谁就吃到最大红利。

更大的一个信号是：互联网计算范式从“客户端主导”转向“云端 AI 生成主导”。那么，我们现在所有的技术栈：云计算、边缘计算、浏览器架构都会被重塑，甚至会催生新“AI OS”。

背后团队

小编也扒了一下 Flipbook 背后的团队背景。

Flipbook 背后的团队，其实是一个小型、跨界协作的“创意技术”小组，而不是传统意义上的正式公司团队。

某种程度上，它甚至可以说是一个side project，是由一群热情的 maker 和技术极客在社区实验室环境中快速拼凑而成的。

其中的核心人物：Zain Shah，是主导者和发起人。Zain 的履历包括：三星的创意技术专家，他负责三星未来设备、穿戴设备、AI 助手等原型开发。再之前则是 OpenAI 研究员，当然了他还是YC S13 校友（曾创办 Watchsend）、Opendoor 数据科学/工程经验。

总之，Zain 非常擅长将 AI 与交互界面、硬件原型结合。

此外，值得一提的是，他还共同创立了 MadSci ，旧金山中心的一个非营利社区 makerspace 和实验室。Flipbook 的很多灵感和实际开发很可能发生在这里。

另外，他在个人网站上提到 Flipbook 时，用了

“It took a village”

（这需要整个村庄/集体努力），显示这是一个协作成果，而非他一人完成。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

Zain 在 Flipbook 发布帖子中也特别感谢以下几位：

旧金山创业者社区

South Park Commons 成员，曾任职 Humane、Slack、Brown 的 Eddie Jiao，没错，又是东方面孔！

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

另一位核心成员则是曾任职苹果的Drew O'Carr。

HTML死了！前OpenAI工程师掀起网页革命：用AI将整个屏幕变成无限直播像素流，无一行html代码，网友：传统Web开发结束，前端真要失业了！

从这几位的履历不难看出，三位都有一个共性，都是探索“AI时代界面形态”的实验型构建者。

AI原生交互时代爆发前夜

从2023年开始，业界就已经开始喧喧嚷嚷地讨论起“AI原生产品”的话题。

大家对于生成式AI时代，产品到底该长什么样子，做出了不少探索。

从在传统互联网产品中添加“Chat框”，再到 ClaudCode 式的纯CLI，前者已经被称为鸡肋，后者则很难在非程序员群体中快速推广。

但 Flipbook 似乎有希望做到！

从写 CSS 转向 prompt engineering、从在 URL中写一句提示，就让想得到的信息在上一帧像素之间流动重组。

图片即一切的可交互体验，配合 prompt 的生成魔法，可以说触碰到了“AI原生浏览器”的定义点。

可以预见，我们未来的一切交互，不管是工作中的营销设计、编程、写PPT、写原型设计，还是平时生活中旅游出行、教娃写作业、搜明星热搜，这些体验都有可能迎来全新的“视觉化”重塑。

写在最后：HTML 离退隐不远了

当然，正如前文所说，Flipbook 目前还是原型阶段，主要用于“视觉化解释”，实际速度还有优化空间。

但它清晰指向未来：

当 AI 模型够快、够聪明，界面将像现实世界一样丰富、即时、个性化。

可以想象，我们的网站终将革掉“填色块的网页”的形态，化身成“为每一个人量身生成的视觉宇宙”。

总之，HTML 距离退隐江湖，已经不远了！

可以肯定的是，这波 AI 界面革命，才刚刚开始。

参考链接：

https://x.com/zan2434/status/2046982383430496444

https://medium.com/@kapildevkhatik2/ltx-2-the-open-source-audio-video-generation-model-changing-content-creation-979100b131b5

https://sandner.art/ltx-video-locally-facts-and-myths-debunked-tips-included/

文章来自于微信公众号 "51CTO技术栈"，作者 "51CTO技术栈"

关键词: AI新闻 , Flipbook , AI 原生无限视觉浏览器原型 , AI原生浏览 , LTX Studio , Lightricks

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales