/ Annuaire / Playground / markdownify-mcp
● Communauté zcaceres ⚡ Instantané

markdownify-mcp

par zcaceres · zcaceres/markdownify-mcp

Convertissez des PDFs, des documents Word, des feuilles de calcul, des présentations, des pages web, des images, de l'audio et des vidéos YouTube en markdown propre depuis le chat.

zcaceres/markdownify-mcp est un MCP TypeScript qui enveloppe les outils de conversion (notamment markitdown de Microsoft et un extracteur de transcriptions YouTube) derrière une interface uniforme. Excellent pour alimenter les pipelines RAG et pour coller des documents hérités dans un flux de travail natif markdown.

Pourquoi l'utiliser

Fonctionnalités clés

Démo en direct

Aperçu en pratique

markdownify.replay ▶ prêt
0/0

Installer

Choisissez votre client

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Ouvrez Claude Desktop → Settings → Developer → Edit Config. Redémarrez après avoir enregistré.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Cursor utilise le même schéma mcpServers que Claude Desktop. La config projet l'emporte sur la globale.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Cliquez sur l'icône MCP Servers dans la barre latérale Cline, puis "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "markdownify": {
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ],
      "_inferred": true
    }
  }
}

Même format que Claude Desktop. Redémarrez Windsurf pour appliquer.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "markdownify",
      "command": "npx",
      "args": [
        "-y",
        "markdownify-mcp"
      ]
    }
  ]
}

Continue utilise un tableau d'objets serveur plutôt qu'une map.

~/.config/zed/settings.json
{
  "context_servers": {
    "markdownify": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "markdownify-mcp"
        ]
      }
    }
  }
}

Ajoutez dans context_servers. Zed recharge à chaud à la sauvegarde.

claude mcp add markdownify -- npx -y markdownify-mcp

Une seule ligne. Vérifiez avec claude mcp list. Supprimez avec claude mcp remove.

Cas d'usage

Usages concrets : markdownify-mcp

Comment ingérer un dossier de PDFs dans une base de connaissances markdown

👤 Créateurs de RAG, gestionnaires de connaissances ⏱ ~30 min intermediate

Quand l'utiliser : Vous avez 50 articles de recherche en PDF et souhaitez un texte propre à incorporer.

Prérequis
  • pnpm — npm i -g pnpm
  • Installer et exécuter — git clone le dépôt, pnpm install, pnpm start
Déroulement
  1. Énumérer les fichiers
    Répertoriez tous les .pdf sous /library/papers/.✓ Copié
    → Liste de chemins
  2. Convertir par lot
    Pour chacun, appelez pdf-to-markdown. Écrivez la sortie vers /library/markdown/<same-name>.md.✓ Copié
    → Les fichiers markdown apparaissent
  3. Vérifier rapidement un
    Montrez-moi les 500 premiers caractères de /library/markdown/attention-is-all-you-need.md.✓ Copié
    → Markdown lisible, sans artefacts PDF

Résultat : Un arbre /markdown/ parallèle prêt à être incorporé.

Pièges
  • Les PDFs numérisés (image uniquement) produisent du markdown vide — Pré-OCR des PDFs numérisés avant conversion
  • Les PDFs riches en mathématiques perdent les équations — Pour les mathématiques, essayez d'associer à Mathpix ou au modèle OCR nougat séparément
Combiner avec : filesystem

Comment transformer un enregistrement de réunion en notes consultables

👤 Toute personne qui enregistre des réunions ⏱ ~10 min beginner

Quand l'utiliser : Après l'appel, avant que la mémoire ne s'efface.

Prérequis
  • Clé OpenAI pour Whisper — platform.openai.com (ou tout point d'accès compatible Whisper)
Déroulement
  1. Transcrire
    audio-to-markdown sur /recordings/2026-04-14-standup.m4a.✓ Copié
    → Markdown avec horodatages
  2. Extraire les actions
    À partir de la transcription, listez les éléments d'action avec les propriétaires.✓ Copié
    → Liste de contrôle des actions

Résultat : Notes de réunion consultables + actions.

Pièges
  • Whisper étiquette mal les haut-parleurs — Pour la diarisation des locuteurs, utilisez un outil spécialisé ; markdownify vous donne uniquement du texte
Combiner avec : notion

Comment résumer une vidéo YouTube sans la regarder

👤 Chercheurs, apprenants ⏱ ~5 min beginner

Quand l'utiliser : Une vidéo de 90 minutes dans votre flux quand vous avez 5 minutes.

Déroulement
  1. Extraire la transcription
    youtube-to-markdown https://youtu.be/xyz123.✓ Copié
    → Markdown de transcription
  2. Résumer
    Résumez en 5 points + horodatages clés.✓ Copié
    → Résumé à puces avec points de saut

Résultat : Décision de savoir si vous allez vraiment regarder la vidéo.

Pièges
  • Certaines vidéos ont les sous-titres désactivés — L'outil retourne vide — utilisez audio-to-markdown comme secours si vous avez le fichier

Combinaisons

Associez-le à d'autres MCPs pour un effet X10

markdownify + filesystem

Conversion par lot d'un dossier d'arrivée en dossier de base de connaissances

Convertissez chaque fichier dans /inbox/ en markdown sous /kb/ en préservant l'arborescence des répertoires.✓ Copié
markdownify + notion

Déposer les documents convertis directement dans Notion

Convertissez le PDF /specs/rfq-2026.pdf et créez une page Notion avec le résultat.✓ Copié
markdownify + excel

Combinez xlsx-to-markdown avec MCP excel pour la conversion bidirectionnelle

Lisez la feuille 'Summary' de /report.xlsx, convertissez en markdown et enregistrez dans /docs/report.md.✓ Copié

Outils

Ce que ce MCP expose

OutilEntréesQuand appelerCoût
pdf-to-markdown path_or_url: str Convertir les PDFs gratuit (local)
docx-to-markdown path_or_url: str Documents Word gratuit
xlsx-to-markdown path_or_url: str Feuilles de calcul sous forme de tableaux gratuit
pptx-to-markdown path_or_url: str Présentations gratuit
image-to-markdown path_or_url: str Images gratuit ou 1 appel LLM si OCR activé
audio-to-markdown path: str Audio/mémos vocaux 1 appel Whisper ($0,006/min)
youtube-to-markdown url: str Sous-titres YouTube gratuit
webpage-to-markdown url: str Texte web lisible gratuit
bing-search-to-markdown query: str Recherche web rapide gratuit
get-markdown-file path: str Récupérer une conversion antérieure gratuit

Coût et limites

Coût d'exécution

Quota d'API
Aucune pour les convertisseurs locaux ; Whisper/OpenAI pour l'audio
Tokens par appel
Dépend de la taille du document
Monétaire
Gratuit sauf transcription audio (~0,006 $/min via Whisper)
Astuce
Pour les grands lots de PDF, effectuez la conversion avant de coller dans le LLM — moins cher que de demander à Claude d'analyser les PDFs directement.

Sécurité

Permissions, secrets, portée

Portées minimales : Lecture du système de fichiers sur les fichiers source, écriture sur la sortie
Stockage des identifiants : OPENAI_API_KEY (pour l'audio) dans env
Sortie de données : Les convertisseurs locaux restent locaux. L'audio va à votre point d'accès Whisper.
Ne jamais accorder : N'exécutez pas les URLs non fiables via webpage-to-markdown sans sandbox — risque SSRF

Dépannage

Erreurs courantes et correctifs

échec de pnpm install

Version de Node trop ancienne — nécessite Node 18+. nvm install 20.

Vérifier : node -v
pdf-to-markdown retourne une chaîne vide

Probablement un PDF numérisé (image uniquement). Exécutez d'abord l'OCR (ocrmypdf).

youtube-to-markdown 'aucun sous-titre disponible'

Le propriétaire de la vidéo a désactivé les sous-titres. Téléchargez l'audio et utilisez audio-to-markdown à la place.

audio-to-markdown 401

OPENAI_API_KEY manquante ou invalide.

Vérifier : echo $OPENAI_API_KEY

Alternatives

markdownify-mcp vs autres

AlternativeQuand l'utiliserCompromis
markitdown (Microsoft)Vous voulez le convertisseur sous-jacent directement sans MCPPas d'interface MCP ; nécessite votre propre encapsulation
unstructured.ioIngestion à l'échelle de l'entreprise avec connaissance de la mise en pagePayant pour les fonctionnalités avancées

Plus

Ressources

📖 Lire le README officiel sur GitHub

🐙 Voir les issues ouvertes

🔍 Parcourir les 400+ serveurs MCP et Skills