Descripción del puesto
Diseñar, construir y operar pipelines de integración de datos que extraigan información de las plataformas core de negocio (Teamwork POS, Medallia, GA4/Meta, SAP Commerce Cloud) y la depositen de forma confiable, incremental y en batch hacia AWS S3, garantizando calidad, trazabilidad y disponibilidad para consumo analítico en Snowflake y Power BI.
Requisitos
Formación académica • Ingeniería en Sistemas, Computación, Mecatrónica, Matemáticas Aplicadas o carrera afín. • Deseable: certificaciones AWS (Cloud Practitioner, Solutions Architect, Data Analytics) o Snowflake (SnowPro Core). Experiencia • 3–5 años en roles de Data Engineering, ETL/ELT o integración de sistemas. • Experiencia comprobable consumiendo APIs REST con autenticación OAuth 2.0, manejo de tokens, paginación y throttling. • Al menos 2 años trabajando con servicios AWS (S3, Glue, Lambda, IAM). • Experiencia en retail, eCommerce o industrias con alto volumen transaccional (deseable). • Familiaridad con al menos una plataforma del stack: Teamwork Commerce, Medallia o SAP Commerce Cloud (deseable). Conocimientos técnicos indispensables • Python avanzado: requests, boto3, pandas, pyarrow, manejo de excepciones y logging estructurado. • Diseño de pipelines incrementales: CDC, watermark timestamps, idempotencia, deduplicación. • Arquitectura de Data Lake en S3: particionamiento, compactación, lifecycle policies, versionamiento de objetos. • SQL intermedio-avanzado para validaciones, reconciliaciones y troubleshooting en Snowflake.
Responsabilidades
Desarrollar y mantener conectores a las APIs REST/SOAP de Teamwork POS, Medallia, GA4/Meta y SAP Commerce Cloud (OCC), paginación y control de rate limits. • Implementar pipelines de ingesta incremental (CDC, delta loads basados en timestamps o cursores) y procesos batch programados, usando AWS Glue, Step Functions o frameworks equivalentes. • Depositar datos en AWS S3 siguiendo la arquitectura de zonas RAW → PRE → CON, en formatos Parquet y/o CSV, con particionamiento por fecha y fuente. • Colaborar con el equipo de Analytics para asegurar que los datos en S3 sean consumibles por Snowflake (External Stages / Snowpipe) y Power BI.
Beneficios
Inicia sesión para ver los beneficios de esta vacante
Oportunidades de crecimiento
RUTA DE CRECIMIENTO Este rol se posiciona como pieza clave en la estrategia de Datacloud 2026. La ruta de crecimiento natural incluye: 1. Corto plazo (0–6 meses): Dominio de las 3 APIs core y estabilización de pipelines RAW → S3. 2. Largo plazo (12–24 meses): Líder técnico de integración, arquitectura de streaming (Kinesis/Kafka) y real-time analytics.