ssrr和shadowrocket
前几天我不是横测了一下开源的混元图像 3 嘛,但只是 API 的版本,我想试试本地化部署是不是有所不同。
不差钱的老板可以用 140 万左右购买 8 台 H20,或者 18 万直接买 12 台顶配的 Mac Mini 进行本地化部署。
8 × A800 显存刚好 640 G ,生成一张图大概要 8 分钟,一个小时只能生成 9 张图,虽然设备相对便宜(46 元/小时) ,平均每张图 5 元。
但生成一张图只需要两分钟左右,一个小时能生成约 26 张图,平均每张图 2.3 元,单价比 8 × A800 便宜一半ssrr和shadowrocket。
接着填你的提示词,如果你不知道填什么,可以点击「快速选择」按钮,点击一下「手气不错」,系统就会从几百个提示词模板里随便挑选一个给你生成。
因为混元图像 3 还不支持 2K / 4K(也可能是我姿势不对),超过 1356 宽度的好像都会变成 1280 宽度的图。
Gemini 3 Pro 一张是 0.14 刀,即梦一个月会员费是 69,差不多是一个多小时服务器的钱。
和普通用户需求不同,如果你是商业设计师、建筑师,或者任何涉及商业机密的创作者,你的设计稿、你的客户项目,以及每一张喂给云端 API 的图片,理论上都已经离开了你的控制范围。
但如果你线 万的 Mac Mini 放在那儿,除非你的业务划分能够撑满这些算力, 7 × 24 不间断生图(比如你是生图 API 服务商),不然弹性计算是性价比最高的私有化部署方案。
使用节奏:服务器是按秒计费的,一定要提前准备好提示词,集中时间批量生成。 不要开着服务器再慢慢想提示词,那真的是在烧钱。
迭代步数:默认 30 步基本够用。 对细节要求高可以拉到 50 步,但生成时间会明显变长。不建议 20 步以下(不允许 10 步以下),质量下降比较明显。
垫图:混元图像 3 的垫图能力挺强的,特别适合建筑渲染、产品设计这类需要保持结构一致性的场景。
说实线B 参数的生图模型跑在自己的服务器里,再看着它一张一张地吐出图片的时候,那种成就感和调 API 完全不同。
过程中我不断调试,我会更清楚知道,这个模型的能力边界。这种 AI 工程化的理解,不完全靠看Paper、看测评获得。绝知此事要躬行。



