/ 디렉터리 / 플레이그라운드 / Jina AI
● 공식 jina-ai 🔑 본인 키 필요

Jina AI

제작: jina-ai · jina-ai/MCP

웹 읽기, 검색(웹, arXiv, SSRN, 이미지), 재순위 지정, 분류, PDF 추출을 위한 19개의 툴 — Jina의 AI 인프라를 MCP로 제공합니다.

Jina AI의 공식 MCP로 Reader, Search, 처리 API를 제공합니다. 모든 URL에서 깔끔한 마크다운 추출, arXiv 및 SSRN 학술 검색, 이미지/텍스트 중복 제거, 재순위 지정, PDF 그림/표 추출에 사용할 수 있습니다. 무료 계층 사용 가능하며, API 키를 통해 더 높은 속도 제한을 얻을 수 있습니다.

왜 쓰나요

핵심 기능

라이브 데모

실제 사용 모습

jina.replay ▶ 준비됨
0/0

설치

클라이언트 선택

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

Claude Desktop → Settings → Developer → Edit Config 열기. 저장 후 앱 재시작.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

Cursor는 Claude Desktop과 동일한 mcpServers 스키마 사용. 프로젝트 설정이 전역보다 우선.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

Cline 사이드바의 MCP Servers 아이콘 클릭 후 "Edit Configuration" 선택.

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "jina": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  }
}

Claude Desktop과 같은 형식. Windsurf 재시작 후 적용.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "jina",
      "command": "npx",
      "args": [
        "-y",
        "mcp-remote",
        "https://mcp.jina.ai/sse"
      ]
    }
  ]
}

Continue는 맵이 아닌 서버 오브젝트 배열 사용.

~/.config/zed/settings.json
{
  "context_servers": {
    "jina": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "mcp-remote",
          "https://mcp.jina.ai/sse"
        ]
      }
    }
  }
}

context_servers에 추가. 저장 시 Zed가 핫 리로드.

claude mcp add jina -- npx -y mcp-remote https://mcp.jina.ai/sse

한 줄 명령. claude mcp list로 확인, claude mcp remove로 제거.

사용 사례

실전 활용법: Jina AI

주제의 최신 arXiv 논문 요약

👤 최신 정보를 유지하려는 연구자, ML 엔지니어 ⏱ ~20 min intermediate

언제 쓸까: 50개의 초록을 읽지 않고 주제에 대해 arXiv에서 새로운 내용을 알고 싶을 때

사전 조건
  • 선택 사항인 Jina API 키 — jina.ai → dashboard → API 키(무료 계층은 가벼운 사용에 적합)
흐름
  1. arXiv 검색
    search_arxiv를 사용하여 지난 30일 동안의 '투기적 LLM 추론 디코딩' 관련 논문을 찾습니다. 상위 20개를 반환합니다.✓ 복사됨
    → 제목, 저자, 초록이 포함된 논문 목록
  2. 관련성별 재순위 지정
    sort_by_relevance를 사용하여 '순수 연구가 아닌 실제 프로덕션 추론의 성능 향상'에 대해 재순위를 지정합니다. 상위 8개를 유지합니다.✓ 복사됨
    → 재순위 지정된 목록
  3. 각각 요약하기
    상위 8개에 대해 extract_pdf로 논문을 추출하고, 3개의 글머리 기호로 요약합니다: 기여도, 방법, 보고된 성능 향상. 마크다운 표로 출력합니다.✓ 복사됨
    → 요약본으로 준비된 요약 표

결과: 주제의 주간 연구 요약본을 10분 안에 만들 수 있습니다.

함정
  • 모든 결과에 extract_pdf를 사용하면 비용이 많이 드록 크레딧이 쌓입니다 — 먼저 재순위를 지정하여 후보를 줄이고 상위 N개만 추출합니다
함께 쓰기: notion

URL 배치를 RAG용 깔끔한 마크다운으로 변환

👤 검색 시스템을 구축하는 AI 엔지니어 ⏱ ~15 min intermediate

언제 쓸까: 수집할 URL 목록이 있고 원본 HTML이나 파싱 파이프라인이 아닌 깔끔한 마크다운을 원할 때

흐름
  1. URL 병렬 읽기
    이 목록 [URL]에 parallel_read_url을 사용합니다. 원본 URL을 키로 하여 각각의 마크다운을 반환합니다.✓ 복사됨
    → URL당 마크다운
  2. 유사 중복 제거
    0.9 유사도에서 deduplicate_strings를 사용하여 유사 중복 페이지를 제거합니다(미러 문서에서 일반적).✓ 복사됨
    → 제거된 페이지의 ID가 포함된 중복 제거된 세트
  3. 디스크에 저장
    각각을 ./knowledge/<slug>.md에 저장합니다. 여기서 slug는 URL 경로에서 파생됩니다.✓ 복사됨
    → 임베딩 파이프라인에 준비된 마크다운 파일

결과: 스크래핑 코드를 작성하지 않고도 임베딩/인덱싱 단계를 위한 깔끔한 말뭉치를 만들 수 있습니다.

함정
  • 유료 결제 필수 페이지나 JS 인증 필요 페이지는 빈 내용이나 쓰레기 값을 반환합니다 — 몇 개의 URL을 샘플 확인하고, 컨텐츠가 부족하면 인증 플로우를 위해 playwright로 폴백합니다
함께 쓰기: filesystem · firecrawl

텍스트 배치를 사용자 정의 레이블로 분류

👤 데이터 분석가, 성장 팀 ⏱ ~15 min beginner

언제 쓸까: N개의 자유 텍스트 항목(티켓, 리뷰, 설문 응답)이 있고 이를 분류 체계에 따라 분류하려고 할 때

흐름
  1. 레이블 정의
    내 레이블: ['bug', 'feature_request', 'question', 'praise', 'other']. 처음 10개 항목을 샘플링하고 레이블이 적합한지 확인합니다.✓ 복사됨
    → 샘플에 대해 검증된 레이블
  2. 배치 분류
    해당 레이블로 모든 항목에 classify_text를 사용합니다. {id, text, label, confidence}를 반환합니다.✓ 복사됨
    → 레이블이 지정된 데이터셋
  3. 낮은 신뢰도 검토
    신뢰도 < 0.6인 항목을 수동 검토 플래그로 표시합니다. 분포, 이상값, 누락된 가능성이 있는 레이블을 요약합니다.✓ 복사됨
    → 검토 큐 + 분류 체계 피드백

결과: 분류기를 미세 조정하거나 항목당 프롬프트를 작성하지 않고도 레이블이 지정된 데이터셋을 만들 수 있습니다.

함정
  • 레이블이 모호하고 분류기가 거의 동점에서 일관성이 없습니다 — 레이블을 상호 배타적으로 만들거나, 항목이 여러 카테고리에 걸쳐 있으면 다중 레이블 출력을 허용합니다
함께 쓰기: filesystem

조합

다른 MCP와 조합해 10배 효율

jina + notion

Notion에 게시된 주간 연구 요약

이 주의 새로운 '에이전티 RAG' 논문을 arXiv에서 검색합니다. 각각을 요약하고 Research Digest 데이터베이스에 Notion 페이지를 생성합니다.✓ 복사됨
jina + firecrawl

단일 페이지는 Jina, 전체 크롤은 Firecrawl — 동일한 깔끔한 마크다운 출력

URL 목록에는 parallel_read_url(Jina)을 사용합니다. 3개의 전체 문서 사이트에는 Firecrawl 크롤을 사용합니다. 하나의 knowledge 디렉토리로 병합합니다.✓ 복사됨
jina + filesystem

읽기 목록에서 로컬 마크다운 기술 자료 구축

urls.txt의 각 URL을 읽고, 중복을 제거하고, ./knowledge/<hash>.md에 저장합니다. 컨텐츠가 변경된 경우에만 덮어쓰기합니다.✓ 복사됨

도구

이 MCP가 노출하는 것

도구입력언제 호출비용
search_web query, num_results? 일반 웹 검색 호출당 크레딧
search_arxiv / search_ssrn / search_bibtex / search_images / search_jina_blog query 대상 검색 호출당 크레딧
parallel_search_web / parallel_search_arxiv / parallel_search_ssrn query[] 한 번의 호출로 다중 쿼리 리서치 크레딧 × N개 쿼리
read_url url 모든 URL에서 깔끔한 컨텐츠 추출 페이지당 크레딧
parallel_read_url url[] 배치 웹페이지 수집 크레딧 × N개 페이지
capture_screenshot_url url 페이지의 시각적 스냅샷 크레딧
sort_by_relevance documents, query 품질을 위해 검색 후 재순위 지정 크레딧
classify_text texts, labels 제로샷 분류 텍스트당 크레딧
deduplicate_strings / deduplicate_images items, threshold 말뭉치에서 유사 중복 제거 크레딧
extract_pdf url or file PDF에서 구조화된 컨텐츠 추출 PDF당 크레딧
expand_query / primer / guess_datetime_url utility 검색 튜닝 관련 도우미 크레딧(소액)

비용 및 제한

운영 비용

API 쿼터
무료 계층 사용 가능하며 속도 제한이 있으며 유료 계층은 확장 가능합니다
호출당 토큰
출력이 더 큰 비용입니다 — PDF와 중복 제거는 10k+ 토큰을 반환할 수 있습니다
금액
Jina API 크레딧, 일반적으로 요청당 측정됩니다. jina.ai/pricing을 참조하세요.
추출하기 전에 재순위를 지정하세요 — extract_pdf는 비용이 많이 듭니다. read_url 출력을 로컬에 캐시하세요. 대부분의 페이지는 매일 변경되지 않습니다.

보안

권한, 시크릿, 파급범위

자격 증명 저장: JINA_API_KEY 환경 변수(많은 툴에 선택 사항이지만 고사용량에는 필수)
데이터 외부 송신: api.jina.ai / r.jina.ai / s.jina.ai의 모든 호출 — 쿼리 및 URL이 Jina에 표시됨

문제 해결

자주 발생하는 오류와 해결

429 Too Many Requests

무료 계층은 낮은 속도 제한이 있습니다. JINA_API_KEY 환경 변수를 추가하고 버스트 용량을 위해 jina.ai에서 업그레이드하세요.

read_url이 빈 마크다운을 반환합니다

페이지가 인증으로 차단되었거나 봇이 차단되었을 수 있습니다. 툴 옵션을 통해 다른 User-Agent를 사용해보거나 playwright/firecrawl로 폴백하세요.

classify_text가 모든 것을 'other'로 지정합니다

레이블이 너무 좁거나 유사할 수 있습니다. 더 나은 제로샷 정확도를 위해 레이블 설명('bug: 사용자가 무언가가 깨졌다고 보고')을 추가하세요.

search_arxiv가 최신 논문을 놓칩니다

arXiv 인덱스가 지연될 수 있습니다. arxiv.org 직접 검색으로 교차 검증하세요. expand_query를 사용하여 용어를 확장하세요.

대안

Jina AI 다른 것과 비교

대안언제 쓰나단점/장점
Firecrawl전체 사이트 크롤이나 JSON 스키마 추출이 필요할 때크롤 중심입니다. Jina의 강점은 읽기 이상의 처리 툴의 다양성입니다
Exa Search MCP의미론적/신경망 웹 검색을 주요 인터페이스로 원할 때의미론적 검색이 더 강합니다. Jina의 툴박스보다 좁습니다
Brave Search MCP독립적인 검색 인덱스 + 개인정보 보호를 원할 때검색만 가능하며 reader/재순위/분류 없음

더 보기

리소스

📖 GitHub에서 공식 README 읽기

🐙 열린 이슈 보기

🔍 400+ MCP 서버 및 Skills 전체 보기