CGM Clinical es la compañía con más instalaciones en España de sistemas de información hospitalarios, de historia clínica electrónica y de ayuda a la decisión.
En todo el mundo, CGM implanta sistemas de información a más de 400.000 clientes de 40 países, incluidos 68 hospitales públicos en España.
Todos los días, 4.000 empleados de CGM en todo el mundo crean soluciones de Salud Digital innovadoras que ayudan a curar y cuidar a las personas.
Actualmente, estamos buscando un perfil de Data Architect para nuestro equipo de analytis.
Tipo de contrato / Jornada : Indefinido / tiempo completo
Titulación : Ingeniero en informática o área similar
Funciones
Brindar experiencia en la evaluación de requisitos y el desarrollo de arquitectura de datos y diseño de soluciones de Big Data.
Plantear la evolución de la arquitectura de las plataformas IBM CP4D y CDP juntamente con los expertos de cada una de las plataformas
Liderar el diseño de la infraestructura de almacenamiento de datos, fusionando datos de fuentes múltiples y dispares, y trabajando con el equipo de desarrollo en la implementación.
Identificar e implementar estrategias y tecnologías para los servicios responsabilidad de la oficina de Gobierno del Dato.
Impulsar de forma proactiva nuevos enfoques y técnicas para la plataforma Big Data. Proponer mejoras en las prácticas de desarrollo de procesos en Spark, procesos de evaluación de la calidad de datos, observability y procesos de publicación Gestión de Modelado de datos.
Evaluación de los Aceleradores de mercado para Sector Salud existentes en el mercado frente a alternativas de desarrollo propio.
Diseño de la estrategia de modelado a OMOP y FHIR a través de aceleradores y / o con desarrollos en Spark Analizar, diseñar y desarrollar y probar modelos de ingesta en tiempo real con herramientas como NiFi o Kafka Streams
Establecer arquitectura de seguridad de datos.
Establecer el uso de Apache Ranger para políticas de seguridad de manera uniforme en todos los componentes Hadoop Definir juntamente con la Oficina de Seguridad políticas de seguridad de datos y estándares de privacidad y confidencialidad de datos.
Definir controles de accesos de seguridad de datos Definir las clasificaciones de seguridad de datos Reportes de Auditoria de seguridad de datos
Definir la arquitectura de integración con Plataformas Semánticas y de Procesado Natural.
Requisitos
Predisposición, interés y motivación por la ciencia de datos en entorno sanitario.
Habilidades comunicativas Buena interlocución con diferentes niveles, desde dirección a técnico.
Buenas capacidades para liderar equipos y trabajar colaborativamente, presencial y en remoto.
Licenciatura o grado en Ingeniería Informática, Ingeniería de Telecomunicaciones o similar.
Experiencia mínima de 3 años en el diseño y gestión de arquitecturas de datos en entornos Cloudera, preferiblemente en entorno sanitario.
Conocimientos y experiencia en lenguajes de programación como Python, R, Java o Scala.
Conocimientos y experiencia en el diseño y optimización de modelos de datos relacionales y no relacionales.
Conocimientos y experiencia en el diseño e implementación de soluciones de almacenamiento y procesamiento distribuido, como Hadoop y Spark, Scala, Spark MLlib.
Conocimientos y experiencia en herramientas de ETL como Apache NiFi o Apache Kafka.
Conocimientos y experiencia con SQL, Hive.. y bases de datos relacionales como MySQL o PostgreSQL.
Conocimientos y experiencia en transformación, segmentación, análisis de datos y desarrollo de modelos de machine learning.
Conocimientos y experiencia en entornos Data Warehouse, procesos ETLs
Conocimientos y experiencia en Unix y Shell
Conocimientos y experiencia en control de versionado; experiencia con git
Deseable
Certificación Cloudera Certified Data Engineer o similar.
Experiencia en proyectos de Gobierno del Dato en el sector sanitario.
Conocimientos de herramientas de visualización de datos como Cloudera Data Visualization, Tableau o Power BI.
Experiencia en el diseño e implementación de soluciones de seguridad y privacidad de datos en entornos Cloudera.
Conocimientos de normativas y regulaciones del sector sanitario relacionadas con la protección de datos personales y la seguridad de la información.
Capacidad de trabajo en equipo, habilidades comunicativas y capacidad de gestión de proyectos.
Retos
Participación en Proyecto puntero de la Comunidad de Madrid (SERMAS)
Diseñar, implementar y mantener la arquitectura de datos en el entorno sanitario, garantizando la integridad, confidencialidad y disponibilidad de la información.
Desarrollar y gestionar los procesos de extracción, transformación y carga (ETL) de los datos provenientes de fuentes internas y externas.
Diseñar y optimizar los modelos de datos para asegurar un acceso eficiente y seguro a la información.
Colaborar con los diferentes equipos de desarrollo y análisis de datos para identificar y entender las necesidades y requisitos de cada proyecto.
Implementar y mantener soluciones de almacenamiento y procesamiento de datos en el entorno Cloudera.
Definir y establecer las políticas y normativas de gobierno del dato, asegurando el cumplimiento de los estándares y regulaciones del sector sanitario.
Realizar el monitoreo y control de la calidad de los datos, identificando y corrigiendo posibles errores o inconsistencias.
Participar en la identificación y resolución de problemas relacionados con el rendimiento y la escalabilidad de la infraestructura de datos.
Qué te ofrecemos?
- Empleo estable en un sector con un gran potencial de desarrollo.
- Beneficios sociales (seguro médico y cheque comida).
- Formación continua para tu desarrollo profesional.
- Flexibilidad laboral.
- Modelo híbrido de trabajo (con gran % de jornada en formato teletrabajo).