image-blaster 是一个基于 Claude AI Agent 的自动化工作流工具,能够将一张普通图像在 5 分钟内 转化为完整的 3D 可交互资产包,包括:
静态环境的 3D 高斯泼溅(Gaussian Splatting)动态物体的 3D 网格模型(.glb / .obj)环境氛围音效 + 物体物理音效(.mp3)非常适合游戏开发、影视预演、建筑可视化等场景的快速原型构建。
核心能力输出类型
格式
用途
静态环境
.spz (SOGS)
高保真 3D 背景,支持 NeRF/GS 渲染
动态物体
.glb / .obj
可导入 Unity/Unreal/Blender 的带 PBR 材质模型
音效
.mp3
环境循环音 + 交互音效(如开门、碰撞)
技术栈与模型集成image-blaster 并非单一模型,而是通过 Claude Skills 编排多个专业 AI 服务:
功能
使用的模型/服务
3D 环境重建
World Labs marble-1.1
图像预处理
nano-banana 或 gpt-image-2(用于去水印、清理背景)
3D 物体重建
Tencent Hunyuan 3D(通过 FAL API)
音效生成
ElevenLabs SFX 模型
智能编排
Claude(作为 Agent 控制流程)
所有操作由 Claude 自动执行,用户只需提供原始图像并确认关键步骤。
快速上手前置条件安装 Claude CLI:curl -fsSL https://claude.ai/install.sh | bash获取 World Labs 和 FAL 的 API Key(用于 3D 生成)准备一张清晰的输入图(建议含前景物体+背景)使用步骤# 1. 克隆仓库
git clone https://github.com/neilsonnn/image-blaster
cd image-blaster
# 2. 将图片放入 input/ 目录
cp your_image.jpg input/
# 3. 启动 Claude
claude
# 4. 在 Claude 对话中输入:
> blast it and confirm each step with meClaude 会自动:
分析图像内容调用 nano-banana 清理图像用 marble-1.1 生成高斯泼溅环境用 Hunyuan 3D 提取前景物体为 3D 模型用 ElevenLabs 生成匹配的音效输出完整资产包到 output/自定义参数(Hunyuan 3D)你可以在 Claude 提示中指定 3D 模型参数:
--face-count 100000 # 面数(默认 50,000)
--enable-pbr true # 启用 PBR 材质(默认开启)
--generate-type LowPoly # 生成低多边形版本
--polygon-type quadrilateral # 使用四边面支持的集成平台生成的资产可直接用于:
游戏引擎:Unity / Unreal Engine / Godot3D 软件:Blender / Maya / 3ds MaxWeb 应用:Three.js / React 3D Viewer(项目自带 viewer)提示:若需 Claude 修改内置 React 查看器,删除 .claudeignore 中的 /app 行即可。
典型应用场景游戏关卡快速搭建:上传概念图 → 自动生成可玩 3D 场景室内设计预览:手机拍房间 → 生成 3D 模型 + 环境音机器人仿真环境:提供场景图 → 输出带物理属性的训练环境电影分镜转 3D:故事板 → 可漫游预演场景项目地址GitHub: https://github.com/neilsonnn/image-blaster注意:需自行申请 World Labs 和 FAL 的 API 密钥,部分服务可能产生费用。
这是一个典型的 AI Agent + 多模态工具链 范例——用自然语言驱动复杂 3D 内容生产,真正实现“所想即所得”。
image-blaster:从单张图片一键生成 3D 场景、音效与模型
image-blaster 是一个基于 Claude AI Agent 的自动化工作流工具,能够将一张普通图像在 5 分
阅读:0
点赞:0