/ 目录 / 演练场 / banana-claude
● 社区 AgriciDaniel ⚡ 即开即用

banana-claude

作者 AgriciDaniel · AgriciDaniel/banana-claude

Claude Code 的 AI 图像生成技能——由 Gemini 驱动的创意总监,代你编写 prompt。

Banana Claude 让 Claude Code 成为你的 AI 图像创意总监。你用简洁的语言描述想法,技能会自动展开成包含构图、光线和风格指令的 Gemini prompt,然后调用 Gemini 生成。特别适合生成文章主图、社交配图和品牌统一的静态图像。

为什么要用

核心特性

实时演示

实际使用效果

banana-claude-skill.replay ▶ 就绪
0/0

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "banana-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AgriciDaniel/banana-claude",
        "~/.claude/skills/banana-claude"
      ],
      "_inferred": true
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "banana-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AgriciDaniel/banana-claude",
        "~/.claude/skills/banana-claude"
      ],
      "_inferred": true
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "banana-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AgriciDaniel/banana-claude",
        "~/.claude/skills/banana-claude"
      ],
      "_inferred": true
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标,然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "banana-claude-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AgriciDaniel/banana-claude",
        "~/.claude/skills/banana-claude"
      ],
      "_inferred": true
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "banana-claude-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AgriciDaniel/banana-claude",
        "~/.claude/skills/banana-claude"
      ]
    }
  ]
}

Continue 使用服务器对象数组,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "banana-claude-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/AgriciDaniel/banana-claude",
          "~/.claude/skills/banana-claude"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add banana-claude-skill -- git clone https://github.com/AgriciDaniel/banana-claude ~/.claude/skills/banana-claude

一行命令搞定。用 claude mcp list 验证,claude mcp remove 卸载。

使用场景

实战用法: banana-claude

如何为博客文章生成主图

👤 需要快速生成精美主图的作者和营销人员 ⏱ ~5 min beginner

何时使用: 你有了文章标题和初步想法,需要在 2 分钟内生成一张主图。

前置条件
  • Gemini API key — 在环境变量中设置 GEMINI_API_KEY
  • 技能已安装 — git clone https://github.com/AgriciDaniel/banana-claude ~/.claude/skills/banana-claude
步骤
  1. 描述想法
    Banana Claude:为《凌晨 2 点那个花了我们 4 万块的 bug》生成主图——阴郁、电影感、开发者坐在笔记本前,被屏幕的光照亮。✓ 已复制
    → 技能展开 prompt,并回显镜头和光线细节
  2. 查看并生成
    生成 2 个变体并保存到 assets/hero-2am-bug.png✓ 已复制
    → 2 张 PNG 文件,展现了对想法的不同理解

结果: 一张看起来像委托制作的主图,而不是 AI 生成。

注意事项
  • 所有输出都有'Gemini 风格' — 添加风格锚点——比如'采用 Annie Leibovitz 肖像的风格'——来打破默认风格
搭配使用: smart-illustrator-skill

生成符合品牌风格的社交配图套装

👤 独立营销人员,需要保持社交媒体的一致性风格 ⏱ ~15 min beginner

何时使用: 你需要 6-10 张看起来像出自同一品牌的图片。

前置条件
  • 品牌风格说明(配色、氛围) — 写 3-5 行说明;技能会用这个作为风格参考
步骤
  1. 锁定风格锚点
    我的品牌风格:柔和的配色、等距风格、软阴影。请锁定这个作为本次会话的风格锚点。✓ 已复制
    → 技能确认并回显锚点
  2. 逐个文章生成
    现在用锚点为这 6 篇文章生成配图。✓ 已复制
    → 6 张符合品牌风格的图片

结果: 一套协调一致的图片,可以直接用于一周的社交发布。

注意事项
  • 生成到第 3 张时风格开始飘 — 每生成 2-3 张后重新说一遍锚点;Gemini 对图片细节的上下文记忆会模糊

组合

与其他 MCP 搭配,撬动十倍杠杆

banana-claude-skill + smart-illustrator-skill

Banana 用于主图和品牌图,Smart Illustrator 用于文章内的图表

对于 posts/launch.md:用 banana-claude 生成主图,用 smart-illustrator 生成里面的架构图。✓ 已复制
banana-claude-skill + ai-marketing-claude-code-skill

营销技能规划活动,Banana 负责创意渲染

用营销技能规划一个 7 篇文章的发布活动,然后用 banana-claude 为每一篇生成主图。✓ 已复制

工具

此 MCP 暴露的能力

工具输入参数何时调用成本
expand_brief brief: str, style_anchor?: str 生成前,用来构建丰富的 prompt ~1k Claude tokens
generate_image prompt: str, variants?: int, out_path?: str brief 展开并确认后 1 Gemini call per variant
save_template name, prompt 当某个 prompt 模式持续产出高质量结果时 0

成本与限制

运行它的成本

API 配额
Gemini 免费层:每分钟 15 次请求,每天 1500 次
每次调用 Token 数
prompt 展开约 1-3k Claude tokens
费用
Gemini 免费层无费用;付费层约 $0.04/图
提示
保存成功的 prompt 作为模板,避免重复支付展开调用的费用。

安全

权限、密钥、影响范围

凭据存储: GEMINI_API_KEY 存储在环境变量中
数据出站: 所有输入和输出都会发送到 Google Gemini

故障排查

常见错误与修复

Gemini 返回模糊或低质量的图片

在输入中加入分辨率和宽高比提示;要求'photographic, high detail, 4K'

安全过滤器阻止了生成

简化输入;移除关于人物或品牌的模糊指代

技能没有触发

显式调用效果最好:'Use banana-claude to ...'

验证: ls ~/.claude/skills/banana-claude/SKILL.md

替代方案

banana-claude 对比其他方案

替代方案何时用它替代权衡
Smart Illustrator 技能你需要带位置检测的图表和封面,而不仅仅是静态图对创意需求的指导较少
Midjourney / Sora你需要更高保真度的输出需要单独的 UI,无法集成到 Claude

更多

资源

📖 阅读 GitHub 上的官方 README

🐙 查看未解决的 issue

🔍 浏览全部 400+ MCP 服务器和 Skills