/ Каталог / Песочница / markdownify-mcp
● Сообщество zcaceres ⚡ Сразу

markdownify-mcp

автор zcaceres · zcaceres/markdownify-mcp

Convert PDFs, Word docs, spreadsheets, slide decks, web pages, images, audio, and YouTube videos to clean markdown from chat.

zcaceres/markdownify-mcp is a TypeScript MCP that wraps conversion tools (including Microsoft's markitdown and a YouTube transcript fetcher) behind a uniform interface. Great feeder for RAG pipelines and for pasting legacy docs into a markdown-native workflow.

Зачем использовать

Ключевые функции

Живое демо

Как выглядит на практике

markdownify.replay ▶ готово
0/0

Установка

Выберите клиент

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Откройте Claude Desktop → Settings → Developer → Edit Config. Перезапустите после сохранения.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Cursor использует ту же схему mcpServers, что и Claude Desktop. Конфиг проекта приоритетнее глобального.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Щёлкните значок MCP Servers на боковой панели Cline, затем "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Тот же формат, что и Claude Desktop. Перезапустите Windsurf для применения.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "markdownify",
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ]
    }
  ]
}

Continue использует массив объектов серверов, а не map.

~/.config/zed/settings.json
{
  "context_servers": {
    "markdownify": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "markdownify-mcp"
        ]
      }
    }
  }
}

Добавьте в context_servers. Zed перезагружается автоматически.

claude mcp add markdownify -- npx -y markdownify-mcp

Однострочная команда. Проверить: claude mcp list. Удалить: claude mcp remove.

Сценарии использования

Реальные сценарии: markdownify-mcp

How to ingest a folder of PDFs into a markdown knowledge base

👤 RAG builders, knowledge managers ⏱ ~30 min intermediate

Когда использовать: You have 50 PDF research papers and want clean text to embed.

Предварительные требования
  • pnpm — npm i -g pnpm
  • Install + run — git clone the repo, pnpm install, pnpm start
Поток
  1. Enumerate files
    List every .pdf under /library/papers/.✓ Скопировано
    → Path list
  2. Convert in batch
    For each, call pdf-to-markdown. Write the output to /library/markdown/<same-name>.md.✓ Скопировано
    → Markdown files appear
  3. Spot-check one
    Show me the first 500 chars of /library/markdown/attention-is-all-you-need.md.✓ Скопировано
    → Legible markdown, no PDF artifacts

Итог: A parallel /markdown/ tree ready to embed.

Подводные камни
  • Scanned PDFs (image-only) produce empty markdown — Pre-OCR scanned PDFs before conversion
  • Math-heavy PDFs lose equations — For math, try pairing with Mathpix or the nougat OCR model separately
Сочетать с: filesystem

How to turn a meeting recording into searchable notes

👤 Anyone recording meetings ⏱ ~10 min beginner

Когда использовать: Post-call, before memory fades.

Предварительные требования
  • OpenAI key for Whisper — platform.openai.com (or any Whisper-compatible endpoint)
Поток
  1. Transcribe
    audio-to-markdown on /recordings/2026-04-14-standup.m4a.✓ Скопировано
    → Markdown with timestamps
  2. Extract actions
    From the transcript, list action items with owners.✓ Скопировано
    → Action checklist

Итог: Searchable meeting notes + actions.

Подводные камни
  • Whisper mislabels speakers — For speaker diarization, use a specialized tool; markdownify gives you text only
Сочетать с: notion

How to summarize a YouTube video without watching it

👤 Researchers, learners ⏱ ~5 min beginner

Когда использовать: A 90-minute video in your feed when you have 5 minutes.

Поток
  1. Pull transcript
    youtube-to-markdown https://youtu.be/xyz123.✓ Скопировано
    → Transcript markdown
  2. Summarize
    Summarize in 5 bullets + key timestamps.✓ Скопировано
    → Bulleted summary with jump points

Итог: Decision on whether to actually watch the video.

Подводные камни
  • Some videos have captions disabled — The tool returns empty — fall back to audio-to-markdown if you have the file

Комбинации

Сочетайте с другими MCP — эффект x10

markdownify + filesystem

Batch-convert an inbox folder to a knowledge base folder

Convert every file in /inbox/ to markdown under /kb/ preserving the directory tree.✓ Скопировано
markdownify + notion

Drop converted docs straight into Notion

Convert the PDF /specs/rfq-2026.pdf and create a Notion page with the result.✓ Скопировано
markdownify + excel

Combine xlsx-to-markdown with excel MCP for round-tripping

Read /report.xlsx sheet 'Summary', convert to markdown, and save to /docs/report.md.✓ Скопировано

Инструменты

Что предоставляет этот MCP

ИнструментВходные данныеКогда вызыватьСтоимость
pdf-to-markdown path_or_url: str Convert PDFs free (local)
docx-to-markdown path_or_url: str Word docs free
xlsx-to-markdown path_or_url: str Spreadsheets as tables free
pptx-to-markdown path_or_url: str Slide decks free
image-to-markdown path_or_url: str Images free or 1 LLM call if OCR enabled
audio-to-markdown path: str Audio/voice memos 1 Whisper call ($0.006/min)
youtube-to-markdown url: str YouTube captions free
webpage-to-markdown url: str Readable web text free
bing-search-to-markdown query: str Quick web search free
get-markdown-file path: str Retrieve a prior conversion free

Стоимость и лимиты

Во что обходится

Квота API
None for local converters; Whisper/OpenAI for audio
Токенов на вызов
Depends on doc size
Деньги
Free except audio transcription (~$0.006/min via Whisper)
Совет
For large PDF batches, do conversion before pasting into the LLM — cheaper than asking Claude to parse PDFs directly.

Безопасность

Права, секреты, радиус поражения

Минимальные скоупы: Filesystem read on source files, write on output
Хранение учётных данных: OPENAI_API_KEY (for audio) in env
Исходящий трафик: Local converters stay local. Audio goes to your Whisper endpoint.
Никогда не давайте: Don't run untrusted URLs through webpage-to-markdown without sandboxing — SSRF risk

Устранение неполадок

Частые ошибки и исправления

pnpm install fails

Node version too old — requires Node 18+. nvm install 20.

Проверить: node -v
pdf-to-markdown returns empty string

Likely a scanned PDF (image-only). Run OCR first (ocrmypdf).

youtube-to-markdown 'no captions available'

Video owner disabled captions. Download audio and use audio-to-markdown instead.

audio-to-markdown 401

Missing or invalid OPENAI_API_KEY.

Проверить: echo $OPENAI_API_KEY

Альтернативы

markdownify-mcp в сравнении

АльтернативаКогда использоватьКомпромисс
markitdown (Microsoft)You want the underlying converter directly without MCPNo MCP interface; needs your own wrapping
unstructured.ioEnterprise-scale ingestion with layout awarenessPaid for advanced features

Ещё

Ресурсы

📖 Читать официальный README на GitHub

🐙 Открытые задачи

🔍 Все 400+ MCP-серверов и Skills