Governança de Dados de IA
Importância da Governança de Dados para Indústria de Ciências da Vida
Empresas de Ciências da Vida, principalmente as biofarmacêuticas e produtos médicos são altamente reguladas e precisam provar que o produto e seu processo de fabricação e desenvolvimento são robustos. A segurança do paciente é afetada pela integridade de registros críticos, dados, e decisões, assim como aspectos relacionados a atributos físicos de produtos.
Para garantir a integridade dos dados críticos gerados na produção, é necessário manter um registro completo, legível, contemporâneo, original, preciso e atribuível ao longo de todo o ciclo de vida dos dados. Em setores como a indústria de produtos médicos, onde o ciclo de vida pode durar até 90 anos (a vida útil de um paciente, por exemplo), a manutenção da integridade dos dados é especialmente crucial.
A indústria de sistemas automatizados tem incorporado ferramentas em seus sistemas para permitir que as indústrias farmacêuticas e de produtos médicos cumpram as exigências regulatórias e possam comprovar a conformidade durante o processo de validação do sistema.
A exigência de manter todos os dados BPx relevantes (impacto na qualidade/segurança do paciente ou consumidor), sejam eles em formato eletrônico ou em papel, armazenados durante todo o ciclo de vida do produto na indústria pode ser problemática, especialmente no caso de dados em papel.
Para se alcançar e manter este status de conformidade é necessária a implementação e manutenção de uma política de Governança de Dados, que seja eficiente em assegurar o status de Integridade dos Dados alcançado pela empresa, que envolve a sustentabilidade do dado, desde sua geração até o fim do seu ciclo de vida, seja ele em papel ou eletrônico.
Considerar essas necessidades já no processo de Validação de Sistemas auxilia na implementação de uma Governança de Dados contínua.
Como Validar IA em Aplicações BPx para Empresas de Ciências da Vida
Além disso, o uso mais frequente de tecnologias baseadas em IA tem trazido diversos desafios e oportunidades para a Governança de Dados, exigindo uma abordagem mais abrangente e estratégica para garantir a eficácia na gestão e proteção das informações nas organizações.
Implementação de um Framework de Governança de Dados de IA
A implementação de um framework robusto de Governança de Dados de IA pode ajudar a indústria farmacêuticas, dispositivos médicos e biotechs a gerir e salvaguardar os ativos de dados, garantir a conformidade e manter elevados padrões de integridade e qualidade de dados em todas as operações da organização. Os dados são um dos ativos mais valiosos de uma organização, e sua governança é a chave para desbloquear seu real valor.
Governança de Dados é um dos princípios, práticas e ferramentas que ajudam a gerenciar o ciclo completo de vida do seu dado.
Uma estratégia de Governança de Dados eficaz deve permitir que as equipes de gerenciamento de dados, tenham visibilidade e consigam realizar a auditoria das informações. Além disso, implementar uma Governança de Dados eficaz permite proteger acessos não autorizados.
Os guias de Integridade de Dados no geral focam os esforços nos dados que são BPx relevantes, mas e como ficam os demais dados?
É possível aplicar uma metodologia similar para os dados não BPx relevantes e que podem impactar o negócio.
Ao longo desse blog, iremos discutir classificação/categorização dos dados, e controles que podem ser aplicados para ambas as relevâncias.
Decisões Chaves para Governança de Dados de IA Eficaz
Embora a Governança de Dados seja diferente em cada organização, há algumas decisões chaves que devem ser consideradas:
Com todos os seus dados devidamente classificados, as organizações obtêm uma compreensão mais clara e podem atribuir medidas de segurança, controles de acesso e protocolos de manuseio adequados.
Os ativos de dados podem ser arquivos, tabelas, dashboards, modelos de ML/AI, entre outros.
Na Governança de Dados e AI, as principais categorias incluem: dados mestres, que são essenciais para consistência; metadados, que descrevem a origem e estrutura dos dados; dados de referência, usados para padronização; dados operacionais e transacionais, que capturam atividades diárias; dados não estruturados, como vídeos e textos; e dados sensíveis, como PII (Personally Identifiable Information) e PHI (Protected Health Information).
Além disso, dados de treinamento, segurança, auditoria e governança garantem conformidade, qualidade e proteção dos dados.
O processo de mapeamento de dados também ajuda a revelar registros desatualizados ou duplicados que devem ser excluídos ou arquivados.
Estabelecendo um modelo de Governança de Dados de IA
Quem são as partes interessadas, os responsáveis pela sua governança, e seus administradores
Quais dados serão coletados, armazenados e processados? Quais objetivos, e quais métricas serão utilizadas para garantir o sucesso?
Quando os dados fluem de uma parte interessada para outra (movimentação de dados e metadados)?
Onde os dados são armazenados? Onde está seu gerenciamento? Como é a arquitetura do dado (estrutura do dado e recursos)?
Por que está implantando a governança? Por que está coletando o dado (qual sua finalidade)?
Como o dado será modelado? Como será o processo de análise, desenho, teste, manutenção, e segurança dos dados e IA? Como será armazenado a coleta e consentimentos?
Papel da Qualificação de Infraestrutura na Governança de Dados
Um importante componente que pode estar associado a Política de Governança é a Qualificação de Infraestrutura de TI e OT.
Em resumo, a Qualificação de Infraestrutura envolve a avaliação e garantia da adequação e funcionamento correto dos sistemas que suportam aplicações BPx.
Portanto, são aspectos interconectados e complementares que contribuem para garantir a qualidade e segurança cibernética de produtos para indústrias de ciências da vida.
Não abordaremos neste conteúdo a série de atividades e documentação necessárias para a qualificação da infraestrutura. No entanto, é relevante ressaltar que uma estratégia unificada de qualificação pode facilitar a manutenção e eficácia desses controles.
Componentes Chaves para Governança de Dados Eficaz
Como a maioria dos dados é frequentemente considerada como um subproduto do processamento de aplicações finais, nem todas as organizações desenvolveram os métodos e processos necessários para gerenciá-los.
Inicialmente, as iniciativas costumam focar em questões táticas, como a precisão dos dados, as regras de negócio e as tecnologias envolvidas. No entanto, à medida que a conscientização cresce e os riscos de segurança e uso indevido de dados se tornam mais visíveis, as iniciativas se expandem.
Abaixo, estão listados os principais componentes para uma governança eficaz.
Criptografia versus Máscara de Dados
Máscara de dados e criptografia são técnicas diferentes, embora ambas sejam usadas para proteger informações sensíveis. As duas são técnicas que melhoram a segurança dos dados, no entanto são aplicadas em contextos e com métodos diferentes.
Veja as principais diferenças:
Uso Típico: usada principalmente em ambientes de teste, desenvolvimento ou análise, onde os dados reais não são necessários, mas o formato precisa ser mantido para simulações realistas.
Reversibilidade: Normalmente, não é possível reverter para os dados originais após a aplicação da máscara (a menos que uma técnica específica permita isso).
Exemplo: Substituir o nome real de um paciente (ex.: João Silva) por uma versão mascarada (ex.: Paciente_001) para manter a privacidade enquanto os dados são usados em testes ou análises.
Uso Típico: usada para proteger dados sensíveis durante o armazenamento ou transmissão, garantindo que os dados sejam ilegíveis se forem interceptados.
Reversibilidade: A criptografia é reversível, ou seja, os dados podem ser descriptografados usando a chave correta.
Exemplo: O nome do paciente, João Silva, pode ser criptografado como algo como "gH93#jz98", que é completamente ilegível sem a chave correta.
Linhagem dos dados
Linhagem de dados (ou data lineage, em inglês) é o rastreamento detalhado da origem, transformação e movimentação dos dados ao longo de seu ciclo de vida, desde a sua criação ou entrada no sistema até o ponto em que são consumidos ou utilizados para decisões. A linhagem de dados revela como os dados fluem entre diferentes sistemas, processos e usuários, ajudando a identificar quem os alterou, quando, como e por quê.
Monitoramento
Os dados precisam ser confiáveis, pois dados de má qualidade levam a análises imprecisas, má tomada de decisões, e custos indiretos. De acordo com uma pesquisa do Gartner a má qualidade dos dados custa às organizações uma média de 12,9 milhões de dólares por ano.
Mesmo com a implementação de medidas detalhadas e verificações rigorosas, é importante reconhecer que eventos imprevistos ocasionalmente ocorrerão.
Portanto, as equipes de dados devem abraçar a tarefa de monitorar a qualidade dos dados ao longo do tempo. No contexto da inovação digital em ciências da vida, é essencial selecionar KPIs que se alinhem com os requisitos BPx.
Recursos de observabilidade permitem trazer visibilidade das tarefas em execução, e notificação sobre problemas que exigem solução, como por exemplo mecanismos automatizados de detecção de abusos e possíveis violações (atividades suspeitas).
Não se pode proteger algo que não se conhece
Governança de Dados significa definir padrões internos (políticas de dados) que se aplicam a forma como os dados são coletados, armazenados, processados e descartados. Controla quem pode acessar quais tipos de dados e quais tipos de dados estão sob governança.
A Governança de Dados também envolve a conformidade com padrões externos definidos por associações do setor, agências governamentais e outras partes interessadas.
Quando novos dados são inseridos no ecossistema, é fundamental garantir que sejam catalogados e incorporados ao inventário. Portanto, é necessário estabelecer em procedimento como será realizada a adição e manutenção desses ativos.
Enquanto a descoberta e classificação definem o que e onde residem os seus ativos de dados, controles técnicos devem definir como a organização os governa.
Esses controles podem ser qualificados dentro de uma Qualificação de Infraestrutura unificada para facilitar sua manutenção. Veja alguns controles que podem ser aplicados:
- Controles de acesso
- Linhagem de dados
- Monitoramento
- Encriptação
- Máscara de dados
- Prevenção de perda de dados
- Backup e recuperação
- Política de retenção
- Trilha de auditoria
- Controles de qualidade
- Compartilhamento de dados
Como podemos ajudá-lo?
Oferecemos uma solução completa para garantir a conformidade na governança de dados e validação de IA. Desde a implementação de framework robusto até o uso de ferramenta que assegura a segurança e qualidade dos seus sistemas. Nosso foco é impulsionar a eficiência utilizando tecnologias avançadas que otimizam a gestão de dados.
Conte com nossa expertise nos seguintes aspectos, como governança de dados, validação de sistemas e qualificação de infraestrutura, para transformar sua operação e assegurar a conformidade com as melhores práticas
- Política de Governança de Dados – suporte na implementação de um framework robusto de Governança de Dados de IA (foco qualidade e segurança).
- Validação de Sistemas de IA e tecnologias tradicionais – validação de sistemas para garantir integridade dos dados, e robustez na aplicação BPx.
- Qualificação de Infraestrutura de TI e TO - avaliação e garantia da adequação e funcionamento correto dos sistemas que suportam aplicações BPx e não BPx que impactam o negócio.
- Fornecimento do software GO!FIVE® para que sua própria equipe execute projetos de validação/qualificação, e mapeie riscos e verificações para Governança de Dados.
Conheça nossos
modelos de serviço:
Conheça o software de validação/qualificação digital:
Caso queira agendar com
um de nossos especialistas:
Conclusão
Um programa de governança de segurança de dados pode ajudar as organizações a alcançar requisitos regulatórios, controlar o acesso aos dados e entender quem tem acesso e quais dados são acessados.
- Alcançar requisitos regulatórios e manter conformidade sobre o uso de dados;
- Fornecer métodos para controlar o acesso aos dados;
- Fornecer recursos para determinar quem tem acesso aos dados
- Fornecer recursos para entender quais dados são acessados