/ Directorio / Playground / data-engineering-skills
● Comunidad AltimateAI ⚡ Instantáneo

data-engineering-skills

por AltimateAI · AltimateAI/data-engineering-skills

9 Skills de Claude Code para ingeniería analítica: 7 flujos de trabajo de dbt + 2 optimizadores de consultas de Snowflake. 53% de éxito en tareas reales de dbt, 84% en optimización de Snowflake.

Skills para el trabajo diario de la ingeniería analítica. Los Skills de dbt cubren crear, depurar, probar, documentar, migrar, refactorizar e implementar modelos incrementales. Los Skills de Snowflake encuentran consultas costosas y las optimizan por texto o por query_id. Filosofía: 'Lee antes de escribir. Construye después de escribir. Verifica tu salida.'

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

data-engineering-skill.replay ▶ listo
0/0

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "data-engineering-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AltimateAI/data-engineering-skills",
        "~/.claude/skills/data-engineering-skills"
      ],
      "_inferred": true
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "data-engineering-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AltimateAI/data-engineering-skills",
        "~/.claude/skills/data-engineering-skills"
      ],
      "_inferred": true
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "data-engineering-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AltimateAI/data-engineering-skills",
        "~/.claude/skills/data-engineering-skills"
      ],
      "_inferred": true
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "data-engineering-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AltimateAI/data-engineering-skills",
        "~/.claude/skills/data-engineering-skills"
      ],
      "_inferred": true
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "data-engineering-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/AltimateAI/data-engineering-skills",
        "~/.claude/skills/data-engineering-skills"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "data-engineering-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/AltimateAI/data-engineering-skills",
          "~/.claude/skills/data-engineering-skills"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add data-engineering-skill -- git clone https://github.com/AltimateAI/data-engineering-skills ~/.claude/skills/data-engineering-skills

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: data-engineering-skills

Depurar un modelo dbt que está fallando sin perder la calma

👤 Ingenieros analíticos enfrentando una ejecución de CI fallida ⏱ ~20 min intermediate

Cuándo usarlo: dbt run acaba de fallar con un error críptico y no sabes si es esquema, linaje o SQL.

Requisitos previos
  • Proyecto dbt accesible — Accede a tu repositorio dbt para que Claude pueda ver models/
  • Skill instalado — git clone https://github.com/AltimateAI/data-engineering-skills ~/.claude/skills/data-engineering-skills
Flujo
  1. Proporciona a Claude el error + modelo
    Usa debugging-dbt-errors. Aquí está el stderr y models/marts/fct_orders.sql. Diagnostica la causa raíz — no adivines.✓ Copiado
    → Claude lee las referencias ascendentes, diagnostica en orden: esquema → linaje → SQL
  2. Aplica la corrección y verifica
    Aplica la corrección y ejecuta dbt build --select fct_orders+. Muéstrame los recuentos de filas antes y después.✓ Copiado
    → Ejecución limpia + verificación de recuentos de filas

Resultado: CI en verde más una nota de la causa raíz para que no se repita.

Errores comunes
  • Corregir un síntoma aguas abajo cuando el error está aguas arriba — El Skill aplica un diagnóstico ascendente primero; no omitas el paso de linaje
Combinar con: bigquery-server · github

Encuentra y corrige tus consultas de Snowflake más costosas

👤 Líderes analíticos con una factura de Snowflake creciente ⏱ ~60 min intermediate

Cuándo usarlo: Finanzas marcó la factura de Snowflake y necesitas reducirla sin romper los paneles.

Requisitos previos
  • Rol de Snowflake con acceso a ACCOUNT_USAGE — Típicamente ACCOUNTADMIN, o un rol dedicado de costos
Flujo
  1. Identifica los peores infractores
    Usa finding-expensive-queries para listar las 20 principales consultas en los últimos 30 días por costo de crédito. Agrupa por app/usuario.✓ Copiado
    → Tabla clasificada con créditos, tiempo de ejecución, almacén
  2. Optimiza cada una de las principales
    Para la principal, usa optimizing-query-by-id <query_id>. Propón reescrituras con ahorros estimados.✓ Copiado
    → SQL reescrito + plan de explain antes/después
  3. Valida e implementa
    Ejecuta la reescritura en un almacén de prueba — confirma el mismo recuento de filas y forma antes de cambiar.✓ Copiado
    → Candidato seguro para intercambio

Resultado: Una lista priorizada de correcciones con ahorros medibles en $.

Errores comunes
  • Las reescrituras cambian el recuento de filas silenciosamente — Siempre haz diff antes de implementar — el Skill lo aplica
Combinar con: bigquery-server

Migra un montón de procedimientos almacenados a modelos dbt

👤 Equipos que se mueven de SQL heredado a dbt ⏱ ~90 min advanced

Cuándo usarlo: Has heredado un almacén de CTEs anidados y quieres que sean modelos dbt documentados y probados.

Flujo
  1. Apunta el Skill a la SQL de origen
    Usa migrating-sql-to-dbt. Aquí está proc_monthly_revenue.sql. Conviértelo a modelos dbt con refs, documentación, y al menos 2 pruebas por modelo.✓ Copiado
    → Uno o más archivos .sql, schema.yml con documentación y pruebas
  2. Construye y verifica
    dbt construye los nuevos modelos y compara los recuentos de filas con la salida heredada.✓ Copiado
    → Los recuentos de filas coinciden dentro de la tolerancia

Resultado: La lógica heredada vive como modelos dbt comprobables.

Errores comunes
  • Efectos secundarios ocultos en el procedimiento (UPDATEs) — El Skill marca los efectos secundarios — sepáralos, no los conviertas ciegamente
Combinar con: github

Convierte un modelo de actualización completa lento en incremental

👤 Ingenieros analíticos con ejecuciones de dbt de larga duración ⏱ ~45 min advanced

Cuándo usarlo: Un modelo diario ha crecido demasiado para actualización completa.

Flujo
  1. Analiza el modelo
    Usa developing-incremental-models en models/events.sql. Elige una estrategia (merge / insert_overwrite / delete+insert) y justifícala.✓ Copiado
    → Estrategia + unique_key + claves de partición / clúster recomendadas
  2. Implementa y rellena el historial
    Aplica la configuración incremental; describe un plan de relleno seguro.✓ Copiado
    → Modelo + pasos de relleno

Resultado: Ejecuciones diarias que terminan en minutos, no en horas.

Errores comunes
  • unique_key obtiene duplicados en datos tardíos — Usa merge y pruébalo

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

data-engineering-skill + bigquery-server

Aplica el mismo patrón optimize-by-id a consultas costosas de BigQuery

Adapta finding-expensive-queries para BigQuery INFORMATION_SCHEMA.JOBS y lista los 20 principales.✓ Copiado
data-engineering-skill + github

Abre una PR por modelo migrado para que cada uno sea revisable

Para cada modelo migrado, abre una PR de GitHub con la salida de prueba dbt adjunta.✓ Copiado

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
creating-dbt-models especificación de modelo Nuevo modelo 0
debugging-dbt-errors registro de error, modelo Ejecución de CI o local falló 0
testing-dbt-models modelo Modelo sin pruebas 0
documenting-dbt-models modelo Modelo sin documentar 0
migrating-sql-to-dbt SQL heredado Migración heredada 0
refactoring-dbt-models modelo Modelo difícil de leer 0
developing-incremental-models modelo de actualización completa Tiempo de ejecución demasiado largo 0
finding-expensive-queries ventana de búsqueda hacia atrás Búsqueda de costos consulta ACCOUNT_USAGE
optimizing-query-text texto SQL Conoces el SQL, no la id 0
optimizing-query-by-id query_id Tienes la id de la interfaz 1 explain

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
Las consultas de Snowflake cuestan créditos como cualquier otra — las lecturas de ACCOUNT_USAGE son baratas
Tokens por llamada
5–15k por invocación de Skill de dbt
Monetario
Skill gratuito
Consejo
Ejecuta finding-expensive-queries una vez a la semana, no en cada sesión

Seguridad

Permisos, secretos, alcance

Ámbitos mínimos: dbt: lectura + escritura en tu proyecto Snowflake: ACCOUNT_USAGE para Skills de costos
Almacenamiento de credenciales: dbt profiles.yml / par de claves de Snowflake en env; el Skill no almacena secretos
Salida de datos: Ninguno del Skill directamente
No conceder nunca: SYSADMIN a la sesión de Claude a menos que sea absolutamente necesario

Resolución de problemas

Errores comunes y soluciones

dbt compile tiene éxito, run falla con columna no encontrada

Linaje obsoleto — dbt deps + dbt clean + dbt build --select model+

finding-expensive-queries no devuelve nada

ACCOUNT_USAGE tiene ~45min de retraso; también confirma que el rol tiene SNOWFLAKE.ACCOUNT_USAGE

Verificar: SHOW GRANTS TO ROLE <role>

Alternativas

data-engineering-skills vs otros

AlternativaCuándo usarlaContrapartida
dbt Cloud IDEPrefieres interfaz administrada sobre terminalSin Claude en el ciclo
SQL query optimizers (Select.dev, etc.)Quieres planes de consulta visualesHerramienta separada, contexto separado

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills