AI 虚拟模特换装自动化工作流
n8n + 飞书 + Nanobanana Pro:自动生成真人试穿效果图
1. 核心价值
- 串联 n8n + 飞书 + Nanobanana Pro,实现“衣服图 + 背景图 + 模特描述”自动生成以假乱真的真人试穿效果图。
- 解决痛点:无需昂贵模特拍摄、无需租赁摄影棚、缩短上架周期。
- 成本与效率:单张图片成本可压缩至约 0.3–0.4 元,生成时间约 1.5–2 分钟/图。
2. 视频展示 & 配置视频
3. 效果展示
4. 技术架构 (Tech Stack)
- 涉及多服务协同,请确保相关账号:
| 模块 | 使用工具/服务 | 核心作用 |
|---|---|---|
| 中控台 | 飞书多维表格 | 上传素材、管理任务状态、查看最终成图。 |
| 中转站 | Cloudflare R2 | (关键) 将飞书私有图片转为公网链接,供 AI 读取(兼容 S3 协议)。 |
| 视觉大脑 | Google Gemini | (亮点) 分析背景图的光影与环境,确保合成图不违和。 |
| 逻辑大脑 | OpenRouter / GPT | 将视觉分析结果转化为精准的英文绘画提示词(Prompt)。 |
| 绘图引擎 | Evolink | 调用 Nano Banana Pro 模型执行图像生成/换装。 |
5. 自动化流程拆解
🟢 第一阶段:素材准备
- 触发监听:n8n 定时扫描飞书表格。
- 上传素材:按需上传背景图、模特图和产品图。
- 智能筛选:自动提取状态为“未换装”且素材齐全(背景+商品+模特)的任务。
- 图床中转:自动下载飞书附件,上传至 R2 存储桶,生成 AI 可读取的 URL。
🔵 第二阶段:视觉分析与策略 (AI Agent)
- 环境理解(Gemini):分析背景图光线方向、色调冷暖、场景类型,避免光影不贴合。
- 图片打标(Gemini + 豆包):为每张图片打标签,便于后续理解。
- 提示词工程(LLM):组合背景分析、商品描述、模特设定,生成英文 Prompt 指挥绘图模型。
🟠 第三阶段:生成与回传
- 图像生成:调用 Nanobanana Pro 接口,执行换装任务(约 45–60 秒)。
- 异步轮询:自动循环查询任务进度,直至完成。
- 闭环归档:将高清生成图上传回飞书表格,并将任务状态更新为“已换装”。
6. 飞书多维表格配置(必填)
- 请新建多维表格并按下表配置字段:
| 字段名称 | 字段类型 | 填写说明/示例 |
|---|---|---|
| 状态 | 单选 | 选项:未换装(默认)、已换装、生成中 |
| 参考背景图 | 附件 | 上传希望模特出现的场景底图 |
| 商品图 | 附件 | 上传衣服的平铺图或挂拍图 |
| 模特图 | 附件 | (可选) 参考模特的脸型或姿势 |
| 商品图描述 | 文本 | 英文描述,如:Red silk dress, vintage style |
| 模特图描述 | 文本 | 英文描述,如:Asian female, 20 years old |
| 换装图片 | 附件 | (留空) 用于接收 AI 生成的结果 |
7. 部署注意事项
- S3 配置:默认使用 Cloudflare R2(流量免费)。如需阿里云 OSS / AWS S3,请在 S3 节点替换凭证。
- API 鉴权:
- Feishu:飞书开放平台创建应用,开启
bitable:app、drive:file等权限。 - Evolink / Nanobanana:确保账户有余额。
- Openrouter:确保账户有余额。
- Gemini:可用谷歌赠金。
- Feishu:飞书开放平台创建应用,开启
8. JSON 工作流模板
- 查看:AI 虚拟模特换装自动化工作流.json|下载:点击下载
9. 飞书多维表格模板
- 模板链接:n8n+nanobanana-pro