Data Integration Engineer

Lima, Perú · Lima (Híbrido)

Inscribirme

Descripción

  • Diseñar, desarrollar y desplegar soluciones de datos de calidad, óptimos en costos (tiempo de procesamiento, uso del clúster y servicios Azure), seguras y escalables (batch y/o realtime) de acuerdo con la arquitectura unificada de datos (Cloud/On Premise) y estrategias de implementación (To be y transitorias).
  • Desarrollar soluciones utilizando las buenas prácticas, frameworks, componentes y herramientas estandarizadas por el COE de Data.
  • Dirigir el análisis de la causa raíz de problemas (RCA) y brindar soluciones.
  • Realizar el congelamiento y pase de producción de las soluciones de datos siendo participe del flujo de despliegue, desarrollando los entregables del proceso con calidad, manteniendo saludable los indicadores de rechazos y reversiones.
  • Desarrollar los entregables y documentación, definidos en el proceso de Data, correspondiente a la solución de datos.
  • Plantear estrategias de implementación eficientes y eficaces de las soluciones de acuerdo con la arquitectura unificada de datos.
  • Implementar automatizaciones y componentes reutilizables que permita estandarizar las prácticas de desarrollo y construcción de soluciones.
  • Analizar y optimizar procesos en producción que presenten un deterioro en su rendimiento y uso inadecuado de los recursos computacionales con el fin de mantener la estabilidad de la plataforma, y de esta manera recoger las lecciones aprendidas y compartir buenas prácticas al COE Data.
  • Co-crear lineamientos, buenas prácticas, estándares de desarrollo y asesoría técnica de las soluciones.
  • Demostrar liderazgo técnico y resolver temas complejos de ingeniería de datos, referidos a servicios en nube, la programación de las soluciones y procesamiento de datos, en el Lakehouse Cloud.
  • Realizar presentaciones sobre estado de avance del proyecto a nivel de jefaturas y a nivel gerencial.
  • Contribuir activamente a través de la aplicación de conocimientos y experiencias en la comunidad del COE de Data.


Requisitos

Experiencia de 5 a más años en implementación de soluciones en Nube (indistintamente de la nube) con las tecnologías requeridas, habiendo realizado las siguientes actividades:

  • Análisis y desarrollo de flujos de Ingesta y transformación de datos en Lake House mediante los servicios de Cloud.
  • Análisis y Desarrollo utilizando procesamiento distribuido en Spark usando PySpark/Spark en batch (mandatorio) y Realtime (deseable)
  • Tecnologías; Python, SQL, Oracle
  • Optimización de los procesos a desarrollar o existentes con un enfoque de reducción de costos (tiempo de procesamiento, uso del clúster y servicios Azure) en el consumo de los servicios en nube.
  • Análisis y schedulamiento de los procesos de acuerdo a las criterios definidas por los usuarios.
  • Despliegue soluciones en producción haciendo uso de herramientas de integración y despliegue continuo (DevSecOps).
  • Desarrollo de soluciones transversales para la mejora continua del framework de desarrollo y despliegue de soluciones.
  • Desarrollo de buenas practicas, frameworks y estándares de desarrollo en plataformas Cloud.
  • Consultoría y asesoría técnica en la estrategia de implementación de soluciones en plataformas Cloud.
  • Contar con las siguientes certificaciones de Azure (deseable) y/o certificaciones equivalentes en otras nubes:
  • Databricks: Databricks Certified Associate Developer for Apache Spark, Databricks Certified Data Engineer Associate (deseable)
  • Azure: Azure Data Engineer Associate y Data Engineer Professional(deseable)


Metodología ágil (en proyectos).


Experiencia de 5 a más años trabajando en al menos 3 de los siguientes Proyectos en Cloud:

  • Analizando y procesando grandes volúmenes de datos
  • Construyendo Pipelines de datos, ETL , ELT
  • Desplegando soluciones escalables en producción, de preferencia en entidades bancarias
  • Migración de procesos hacia plataformas Cloud (mandatorio)
  • Optimización de procesos utilizando procesamiento distribuido


Localización (Híbrido)