这两年 AI 生图、一键做 PPT 确实很牛,可以说效率直接翻了十倍。
但大伙发现没,不管AI生成的架构图还是流程图,往往都是一张张死图。

图虽然好看,但凡你想微调一下里面的文字,或者挪动一下排版,就只能调整提示词不断抽卡。
更憋屈的是,还得祈求 AI 在改动时,不会把其它敲定的元素给改掉
不过莫理这两天在 GitHub 上淘到了一个开源的实用工具,刚好能把这块短板给彻底补齐!
这就是咱们今天的主角:Edit Banana,通用内容再编辑器。

简单来说就是一句话,它能把不能编辑的死图,瞬间拆分成可以随意拖拽、修改文字和形状的活图!

说实话,莫理看到这个功能的第一时间就想到了设计 Agent 的分层编辑功能。
不过!在经过莫理的实际体验对比后发现,这两兄弟还是有区别的。
比如星流的分层编辑,基本只能把文本和整张的图片给剥离开。

而 Edit Banana 这玩意可以把图里几乎所有的元素都给你扒得干干净净,全部分离!

但凡事有利有弊。
当面对那种包含大量复杂图片的场景时,Edit-Banana 的“暴力强拆”反而会直接破坏画面,给你拆得稀碎。

Edit Banana编辑

星流分层编辑
所以莫理更建议大伙用它来处理一些排版、文字、架构图。
不过!在实操之前,莫理得先给大伙说明一下。
虽然 Edit-Banana 已经把代码开源了,但莫理强烈建议大伙直接去用作者搭好的网页版!

因为作者在项目主页都明说了,目前 GitHub 仓库的代码更新进度,是落后于在线服务的。

使用方法极其傻瓜式,直接打开网页,用邮箱注册个账号就能立刻开搞。

唯一的问题是注册账号后只有十次处理机会,用完就需要通过拉新来继续获取次数了。
不过拿来应急处理几个复杂的 PPT 或论文插图完全够用了
好了,老规矩,莫理必须得给大伙整一波硬核实测!
咱们直接看看这玩意在面对地狱级难度的复杂图表时,到底能有多丝滑。
下面是一张极其复杂的“牛脸识别双子网络架构图”。

要是用传统方法,你只能打开 Visio 或者 PPT,对着屏幕一点一点重新画,一个下午的青春就这么没了
但是当我把它直接丢进 Edit Banana 后,你能看见的地方通通变成了可编辑的元素。
鼠标双击,直接改字!拖拽色块,无损排版!

而且在两侧的工具栏中,各种组件那是应有尽有!
几何图形、表格、箭头……凡是你编辑图表需要的,它都给你备齐了。

总体来说,使用体验还是非常不错的
能把底层结构反向剥离得这么干净,Edit-Banana 绝对是目前莫理见过的第一个。
趁着现在还是免费的,很推荐大伙收藏起来。
毕竟以后遇到做 PPT、搞学术插图、改架构图的活儿,这玩意绝对是你的应急救星。
开源地址:
https://github.com/BIT-DataLab/Edit-Banana
文章来自于微信公众号 "莫理",作者 "莫理"
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0