Gobernanza de Datos de IA
Importancia de la Gobernanza de Datos para la Industria de Ciencias de la Vida
Las empresas de Ciencias de la Vida, principalmente las biofarmacéuticas y los productos médicos, son altamente reguladas y deben demostrar que el producto y su proceso de fabricación y desarrollo son robustos. La seguridad del paciente se ve afectada por la integridad de los registros críticos, los datos y las decisiones, así como por aspectos relacionados con los atributos físicos de los productos.
Para garantizar la integridad de los datos críticos generados en la producción, es necesario mantener un registro completo, legible, contemporáneo, original, preciso y atribuible durante todo el ciclo de vida de los datos. En sectores como la industria de productos médicos, donde el ciclo de vida puede durar hasta 90 años (como la vida útil de un paciente), la preservación de la integridad de los datos es especialmente crucial.
La industria de los sistemas automatizados ha incorporado herramientas en sus sistemas para permitir que las industrias farmacéutica y de productos médicos cumplan con los requisitos regulatorios y puedan demostrar conformidad durante el proceso de validación del sistema.
El requisito de mantener todos los datos relevantes BPx (impacto en la calidad/seguridad del paciente o consumidor), ya sea en formato electrónico o en papel, almacenados durante todo el ciclo de vida del producto en la industria puede ser problemático, especialmente en el caso de datos en papel.
Para lograr y mantener este estado de conformidad, es necesaria la implementación y el mantenimiento de una política de Gobernanza de Datos eficiente que asegure el estado de Integridad de los Datos logrado por la empresa, lo que implica la sostenibilidad del dato desde su generación hasta el final de su ciclo de vida, sea en papel o electrónico.
Considerar estas necesidades ya en el proceso de Validación de Sistemas ayuda a implementar una Gobernanza de Datos continua.
Cómo Validar IA en Aplicaciones BPx para Empresas de Ciencias de la Vida.
Además, el uso cada vez más frecuente de tecnologías basadas en IA ha traído varios desafíos y oportunidades para la Gobernanza de Datos, lo que requiere un enfoque más amplio y estratégico para garantizar la eficacia en la gestión y protección de la información en las organizaciones.
Implementación de un Framework de Gobernanza de Datos de IA
La implementación de un framework robusto de Gobernanza de Datos de IA puede ayudar a las industrias farmacéuticas, dispositivos médicos y biotecnológicas a gestionar y salvaguardar los activos de datos, garantizar la conformidad y mantener altos estándares de integridad y calidad de los datos en todas las operaciones de la organización.
Los datos son uno de los activos más valiosos de una organización y su gobernanza es clave para desbloquear su verdadero valor.
La Gobernanza de Datos es uno de los principios, prácticas y herramientas que ayudan a gestionar el ciclo completo de vida de los datos.
Una estrategia de Gobernanza de Datos eficaz debe permitir que los equipos de gestión de datos tengan visibilidad y puedan realizar auditorías de la información. Además, implementar una Gobernanza de Datos eficaz permite proteger los accesos no autorizados.
Las guías de Integridad de Datos generalmente enfocan los esfuerzos en los datos que son relevantes para BPx, pero ¿qué pasa con los demás datos?
Es posible aplicar una metodología similar a los datos no BPx relevantes que pueden impactar en el negocio. A lo largo de este blog discutiremos la clasificación/categorización de los datos y los controles que pueden aplicarse a ambas relevancias.
Decisiones Clave para una Gobernanza de Datos de IA Eficaz
Aunque la Gobernanza de Datos es diferente en cada organización, hay algunas decisiones clave que deben considerarse:
Con todos los datos debidamente clasificados, las organizaciones obtienen una comprensión más clara y pueden asignar medidas de seguridad, controles de acceso y protocolos de manejo adecuados. Los activos de datos pueden ser archivos, tablas, paneles de control, modelos de ML/IA, entre otros.
En la Gobernanza de Datos y IA, las principales categorías incluyen: datos maestros, esenciales para la consistencia; metadatos, que describen el origen y la estructura de los datos; datos de referencia, utilizados para la estandarización; datos operativos y transaccionales, que capturan actividades diarias; datos no estructurados, como videos y textos; y datos sensibles, como la Información Personalmente Identificable (PII) y la Información de Salud Protegida (PHI).
Además, los datos de formación, seguridad, auditoría y gobernanza garantizan la conformidad, calidad y protección de los datos.
Estableciendo un Modelo de Gobernanza de Datos de IA
¿Quiénes son las partes interesadas, los responsables de la gobernanza y los administradores?
¿Qué datos serán recogidos, almacenados y procesados? ¿Cuáles son los objetivos y métricas que garantizarán el éxito?
¿Cuándo fluyen los datos de una parte interesada a otra (movimiento de datos y metadatos)?
¿Dónde se almacenan los datos? ¿Dónde se gestionan? ¿Cómo es la arquitectura de los datos (estructura y recursos)?
¿Por qué se está implementando la gobernanza? ¿Cuál es el propósito de recolectar los datos?
¿Cómo se modelarán los datos? ¿Cómo será el proceso de análisis, diseño, pruebas, mantenimiento y seguridad de los datos y la IA? ¿Cómo se almacenará la colección y los consentimientos?
Papel de la Cualificación de Infraestructura en la Gobernanza de Datos
Un componente importante que puede estar asociado a la Política de Gobernanza es la Cualificación de Infraestructura de TI y OT.
En resumen, la Cualificación de Infraestructura implica la evaluación y garantía de la adecuación y correcto funcionamiento de los sistemas que soportan aplicaciones BPx.
Por lo tanto, son aspectos interconectados y complementarios que contribuyen a garantizar la calidad y seguridad cibernética de productos para industrias de ciencias de la vida.
No abordaremos en este contenido la serie de actividades y documentación necesarias para la cualificación de la infraestructura. Sin embargo, es relevante destacar que una estrategia unificada de cualificación puede facilitar el mantenimiento y la eficacia de estos controles.
Componentes Clave para una Gobernanza de Datos Eficaz
La mayoría de los datos a menudo se consideran subproductos del procesamiento de aplicaciones finales, y no todas las organizaciones han desarrollado los métodos y procesos necesarios para gestionarlos.
Inicialmente, las iniciativas tienden a centrarse en cuestiones tácticas, como la precisión de los datos, las reglas de negocio y las tecnologías involucradas. Sin embargo, a medida que crece la conciencia y los riesgos de seguridad y uso indebido de datos se hacen más visibles, las iniciativas se expanden.
A continuación se enumeran los principales componentes para una gobernanza eficaz.
Encriptación versus Enmascaramiento de Datos
El enmascaramiento de datos y encriptación son técnicas diferentes, aunque ambas se utilizan para proteger información sensible. Las dos mejoran la seguridad de los datos, pero se aplican en contextos y con métodos diferentes.
Las principales diferencias:
Uso Típico: Se utiliza principalmente en entornos de prueba, desarrollo o análisis donde no se requieren los datos reales, pero es necesario mantener el formato para simulaciones realistas.
Reversibilidad: Normalmente no es posible revertir a los datos originales tras la aplicación del enmascaramiento (a menos que se utilice una técnica específica que lo permita).
Ejemplo: Sustituir el nombre real de un paciente (por ejemplo, Juan Pérez) por una versión enmascarada (por ejemplo, Paciente_001) para mantener la privacidad mientras los datos se utilizan en pruebas o análisis.
Uso Típico: Se utiliza para proteger datos sensibles durante el almacenamiento o la transmisión, asegurando que los datos sean ilegibles si son interceptados.
Reversibilidad: Encriptación es reversible, es decir, los datos pueden ser desencriptados utilizando la clave correcta.
Ejemplo: El nombre del paciente Juan Pérez puede cifrarse como algo como "gH93#jz98", que es completamente ilegible sin la clave adecuada.
Linage de Datos
El linaje de datos (o data lineage en inglés) es el rastreo detallado del origen, transformación y movimiento de los datos a lo largo de su ciclo de vida, desde su creación o entrada en el sistema hasta el punto en que son consumidos o utilizados para la toma de decisiones. El linaje de datos revela cómo los datos fluyen entre diferentes sistemas, procesos y usuarios, ayudando a identificar quién los ha alterado, cuándo, cómo y por qué.
Monitoreo
Los datos deben ser confiables, ya que los datos de mala calidad llevan a análisis imprecisos, una mala toma de decisiones y costos indirectos. Según una encuesta de Gartner, la mala calidad de los datos cuesta a las organizaciones una media de 12,9 millones de dólares al año.
Incluso con la implementación de medidas detalladas y controles rigurosos, es importante reconocer que ocasionalmente ocurrirán eventos imprevistos.
Por lo tanto, los equipos de datos deben asumir la tarea de monitorear la calidad de los datos a lo largo del tiempo. En el contexto de la innovación digital en ciencias de la vida, es esencial seleccionar KPIs que se alineen con los requisitos de BPx.
Los recursos de observabilidad permiten proporcionar visibilidad sobre las tareas en ejecución y notificación sobre problemas que requieren solución, como por ejemplo mecanismos automatizados de detección de abusos y posibles violaciones (actividades sospechosas).
No se puede proteger algo que no se conoce
La Gobernanza de Datos significa definir estándares internos (políticas de datos) que se aplican a la forma en que se colectan, almacenan, procesan y descartan los datos.
Controla quién puede acceder a qué tipos de datos y cuáles están bajo gobernanza.
La Gobernanza de Datos también implica cumplir con estándares externos definidos por asociaciones del sector, agencias gubernamentales y otras partes interesadas.
Cuando se introducen nuevos datos en el ecosistema, es fundamental garantizar que se cataloguen e incorporen al inventario. Por lo tanto, es necesario establecer un procedimiento sobre cómo se agregarán y mantendrán estos activos.
Mientras que el descubrimiento y la clasificación definen qué y dónde residen los activos de datos, los controles técnicos deben definir cómo la organización los gobierna.
Estos controles pueden calificarse dentro de una Cualificación de Infraestructura unificada para facilitar su mantenimiento. Se enumeran algunos controles que se pueden aplicar:
- Controles de acceso
- Linaje de datos
- Monitoreo
- Encriptación
- Enmascaramiento de datos
- Prevención de pérdida de datos
- Backup y recuperación
- Política de retención
- Registro de auditoría
- Controles de calidad
- Compartición de datos
¿Cómo podemos ayudarte?
Ofrecemos una solución completa para garantizar la conformidad en la gobernanza de datos y la validación de IA. Desde la implementación de un marco robusto hasta el uso de herramientas que aseguran la seguridad y la calidad de tus sistemas. Nuestro enfoque es impulsar la eficiencia utilizando tecnologías avanzadas que optimizan la gestión de datos.
Cuente con nuestra experiencia en los siguientes aspectos, como gobernanza de datos, validación de sistemas y cualificación de infraestructuras, para transformar su funcionamiento y garantizar la conformidad de las mejores prácticas
- Política de Gobernanza de Datos: soporte en la implementación de un framework robusto de Gobernanza de Datos de IA (con enfoque en calidad y seguridad).
- Validación de Sistemas de IA y tecnologías tradicionales: validación de sistemas para garantizar la integridad de los datos y la solidez en la aplicación BPx.
- Cualificación de Infraestructura de TI y OT: evaluación y garantía de la adecuación y correcto funcionamiento de los sistemas que soportan aplicaciones BPx y no BPx que impactan el negocio.
- Provisión del software GO!FIVE® para que tu propio equipo ejecute proyectos de validación/cualificación y mapee riesgos y verificaciones para la Gobernanza de Datos.
Conozca nuestros
modelos de servicio:
Conozca el software de validación/calificación digital:
Si desea programar con
uno de nuestros especialistas:
Conclusión
Un programa de gobernanza de seguridad de datos puede ayudar a las organizaciones a cumplir con los requisitos regulatorios, controlar el acceso a los datos y entender quién tiene acceso y qué datos son accedidos.
- Alcanzar los requisitos regulatorios y mantener la conformidad sobre el uso de datos.
- Proporcionar métodos para controlar el acceso a los datos.
- Proporcionar recursos para determinar quién tiene acceso a los datos.
- Proporcionar recursos para entender qué datos se están accediendo.