Skip to content

gemini-imagegen

通过 Gemini API 生成或编辑图片、logo、贴纸、产品 mockup 等 bitmap 资产。

基本信息

字段内容
Skillgemini-imagegen
类型internal-only
研发链路位置Code
入口internal_only
Sourceskills/gemini-imagegen/SKILL.md

描述

This skill should be used when generating and editing images using the Gemini API (Nano Banana Pro). It applies when creating images from text prompts, editing existing images, applying style transfers, generating logos with text, creating stickers, product mockups, or any image generation/manipulation task. Supports text-to-image, image editing, multi-turn refinement, and composition from multiple reference images.

何时使用

  • 需要 AI 生成或编辑图片素材。
  • 需要根据参考图做风格迁移或多轮图片 refinement。
  • 需要为网页或文章创建视觉资产。

工作步骤

  • 读取 plan、task pack、bug report 或明确实现目标。
  • 建立小步任务列表,按现有代码模式做最小必要修改。
  • 运行聚焦验证、测试、构建、浏览器或平台检查。
  • 把 diff、验证结果和剩余风险交给 review 或 knowledge 阶段。

输出

  • 实现 diff、测试结果、构建输出、浏览器截图或运行证据。
  • 必要时输出 blocked 原因,而不是扩大 scope。

Agent 调度

  • 小任务通常 inline;大任务可按文件边界使用 serial 或 parallel workers。
  • 调试、优化、UI、平台专项可引入对应 specialist agents,但 orchestrator 负责最终集成。

边界

  • 不适合编辑代码原生 SVG 或已有图标系统。
  • 生成资产仍需要人工或浏览器验证。