Qualificação de TI e OT para IA e tecnologias tradicionais
Framework de segurança
Nas empresas de Ciências da Vida, a IA está sendo usada para tarefas como automação de processos de fabricação, otimização de ensaios clínicos, análise de dados de pacientes e várias outras aplicações críticas para a indústria farmacêutica, biotecnologia e produtos médicos.
A infraestrutura de TI (Information Technology ou Tecnologia da Informação) e OT (Operation Technology ou Tecnologia de Operação ou ainda, Tecnologia de Automação) é algo muito amplo em termos de ciclo de vida de medicamentos ou dispositivos médicos. Basicamente são componentes e sistemas que suportam aplicações utilizadas em P&D, ensaios clínicos, fabricação, laboratório de controle de qualidade, cadeia de suprimentos e monitoramento pós-comercialização.
Assim como validações tradicionais, um importante componente para confiabilidade, segurança e aderência aos padrões de conformidade é a Qualificação de Infraestrutura de TI e OT em ambientes BPx (qualidade do produto, segurança do paciente e/ou integridade de dados).
Esse processo envolve uma série de atividades e documentação para validar que a infraestrutura de TI e OT atende aos requisitos normativos e padrões de qualidade definidos para sustentar aplicações críticas adequadamente em termos de desempenho e integridade de dados.
Em resumo, o escopo da qualificação da infraestrutura refere-se a hardware, software e serviços em nuvem que compõem a infraestrutura de TI ou OT da empresa.
A Conexão entre IA e a Qualificação de Infraestrutura: Garantindo Segurança para Inovações em TI e OT
Empresas que buscam inovar utilizando técnicas de inteligência artificial (IA) e machine learning geralmente começam estruturando seus dados, criando a base para a inovação. Como a maioria das técnicas de IA dependem da aprendizagem a partir de dados, é essencial organizá-los de forma adequada para, então, desenvolver as aplicações e modelos que exploram esses dados.
Sabemos que, hoje, os dados são comparados ao "novo petróleo". Então, como garantir que esses dados, armazenados na infraestrutura da empresa — seja física ou em nuvem — estejam seguros?
Esse é um dos principais objetivos da Qualificação de Infraestrutura: assegurar documentalmente que a infraestrutura é segura e capaz de suportar as aplicações que consomem esses serviços. O processo é direcionado pelo que realmente importa, com foco na gestão de riscos.
Uma qualificação, muitas implementações
Uma aplicação BPx final depende de uma boa infraestrutura para trabalhar apropriadamente.
Se a infraestrutura que suporta múltiplos sistemas de IA e tecnologias tradicionais não está qualificada de maneira unificada, cada vez que uma aplicação final precisa de validação, a sua infraestrutura relacionada deverá ser verificada. Ou seja, quando é realizada de maneira unificada esta poderá ser referenciada e não haverá a necessidade de ser repetida todas as verificações para cada sistema.
Cada vez mais indústrias estão utilizando seus dados como uma vantagem competitiva através do uso de aplicações com IA. No entanto, existe um risco de violações de segurança e privacidade se controles não forem implantados apropriadamente.
Além disso, uma infraestrutura não qualificada pode gerar perigos potenciais como perda de dados, confidencialidade de dados, roubo de modelos, no caso de utilização de AI/ML (Inteligência Artificial e Machine Learning), conformidade, cibersegurança, entre outros.
Abaixo listamos alguns exemplos de impactos/cenários críticos e que devem ser considerados.
Roubo de modelos, aplicados à AI/ML:
Imagine que diversos treinamentos em aprendizado de máquina, focados em modelos de linguagem, também conhecidos como LLMs (1), foram realizados, demandando um investimento significativo da empresa. Um dos principais riscos associados é o possível roubo de conhecimento desses sistemas, por meio da observação direta de suas entradas e saídas, similar ao processo de engenharia reversa. Isso pode acontecer por meio de acessos não autorizados, cópia ou extração de modelos proprietários, o que resultaria em perdas econômicas e a potencial exposição de informações sensíveis. Uma vez replicado, o modelo pode ser invertido, permitindo que invasores extraíam informações sobre os recursos ou os dados de treinamento. Em resumo, ataques que exponham seus dados de Machine Learning (ML) e GenAI(1) podem não só impactar o negócio, mas também acarretar o risco de divulgação de dados confidenciais, como informações de pacientes. Para mitigar esses riscos, é essencial implementar medidas como auditoria das alterações, criptografia de dados em repouso e em trânsito, além de controles de acesso rigorosos e implementação de máscara de dados (substituir os dados sensíveis por dados fictícios).
(1) Large Language Models (LLMs) como o GPT-4 do ChatGPT são exemplos de IA Generativa ou GenAI. IA Generativa é um termo que descreve qualquer tipo de modelo de Inteligência Artificial que gera conteúdo.
Exposição acidental dos dados:
No caso de dados sensíveis, uma boa prática é a utilização de máscara de dados, cujo objetivo é substituir os dados sensíveis por valores fictícios ou alterados, de forma que os dados ainda pareçam reais, mas sem revelar as informações originais. É importante que os dados em trânsito e em repouso também sejam criptografados. O objetivo da criptografia é codificar os dados em um formato ilegível, que só pode ser codificado por quem tem a chave de descriptografia. Esse processo garante que os dados sejam ilegíveis se forem interceptados.
Manipulação de dados:
Em quase todos os casos, os dados brutos requerem pré-processamento e transformação antes de serem usados para construir um modelo. A curadoria (2) e rotulagem dos dados (3) são essenciais para manter a confiabilidade e usabilidade dos dados. Portanto, como os dados são manipulados pode introduzir um risco de distorção dos resultados.
O invasor poderia por exemplo manipular os rótulos de uma fração de dados de treinamento. Isto pode comprometer a integridade e a precisão do modelo, e é uma preocupação para modelos usados para tomada de decisão em ambientes BPx (qualidade do produto e segurança do paciente/consumidor). Ações que poderiam mitigar esse risco incluem auditoria das alterações, encriptação de dados em repouso e em trânsito, e controles de acesso robustos.
(2) Curadoria: coleta, limpeza, organização e preservação de dados.
(3) Rotulagem: envolve tarefas como identificar dados brutos (imagens, arquivos de texto, vídeos, entre outros) e associar um ou mais rótulos informativos que forneçam contexto, permitindo que um modelo de aprendizado de máquina (ML) aprenda a partir desses dados.
Linhagem de dados:
Os dados podem vir de múltiplas fontes e passar por múltiplas transformações ao longo do seu ciclo de vida. A transparência dos dados e os requisitos de uso no treinamento de IA são importantes para o gerenciamento de riscos. Para atendimento a requisitos regulatórios, indústrias altamente reguladas devem garantir uma visão clara e rastreabilidade dos dados usados para IA. A linhagem automática (acompanhamento da jornada e rastreabilidade de dados), permite criar trilha de fluxo de dados automáticos por exemplo, para fins de auditoria. Imagine um cenário onde um dado sensível precisa ser excluído, e não é possível identificar quais aplicações consomem aquele dado.
Segurança dos Dados
Os dados são o aspecto mais importante dos sistemas de IA porque fornecem a base para que as aplicações de IA sejam construídas. A segurança dos dados é fundamental e igualmente importante para garantir a segurança dos algoritmos de aprendizado de máquina. Novas tecnologias incluindo infraestruturas em nuvem e modelos de serviços estão cada vez mais sendo utilizadas, e ampliando o portfólio e escopo.
Termos como Infrastructure as a Service (IaaS), Platform as a Service (PaaS), e Software as a Service (SaaS) são cada vez mais comuns no contexto empresarial. Esses modelos de serviço são referenciados coletivamente como XaaS, que é um acrônimo que significa qualquer (X) solução que será disponibilizada como serviço.
Há uma infinidade de outras soluções que podem ser utilizadas como suporte a aplicações de IA BPx relevantes, como por exemplo DBaaS (banco de dados como serviço), FaaS (função como serviço), FDaaS (modelos de fundação como serviço), STaaS (armazenamento como serviço).
A computação em nuvem introduz flexibilidade na capacidade de recursos, mas também introduz novos riscos para as empresas regulamentadas. Esses riscos incluem:
- Menos ou nenhum controle sobre o datacenter
- Vários fornecedores trabalhando juntos para fornecer a infraestrutura
- Menos controle sobre a infraestrutura
- Menos controle sobre os dados
- Menos controle sobre os serviços aplicados
- Dados e sistemas estão fora da rede das empresas
A necessidade de manter o produto e a segurança do paciente deve ser central no processo de seleção do fornecedor. Os riscos precisam ser avaliados e gerenciados, e essa avaliação pode variar amplamente entre os provedores de XaaS. O conhecimento de um provedor de XaaS sobre as regulamentações BPx deve ser considerado.
Caso queira saber mais sobre responsabilidades do fornecedor clique aqui
Controle de Infraestrutura de TI
Vários aspectos importantes devem ser verificados para a conformidade em relação à Qualificação de Infraestrutura de TI e OT:
- Gestão de Controle de Mudanças
- Gerenciamento de Configuração
- Gerenciamento de Segurança
- Gerenciamento de Servidores
- Gerenciamento de Redes
- Gestão de Incidentes e Problemas
- Help Desk (também conhecido como Service Desk em ITIL®)
- Backup, Restauração e Arquivamento
- Recuperação de desastres
- Monitoramento de Desempenho
- Gestão de Fornecedores
- Garantia da Qualidade
Quando um fornecedor externo hospeda ou gerencia alguns ou todos os aspectos de uma nuvem regulamentada ou infraestrutura de TI, vários componentes do Sistema de Gerenciamento da Qualidade (QMS) devem passar por avaliação. Estes incluem:
- Manual da Qualidade
- Avaliação do Risco
- Documento que esclarece como a empresa lida com privacidade de dados
- Gerenciamento e Monitoramento de Datacenter, caso aplicável
- Gerenciamento de Alterações e Configuração
- Plano de Recuperação de desastres
- Controle de Documentos
- Procedimento de Treinamento
- Procedimento de Auditoria Interna
- Resposta à Emergências
- Backup, Restauração e Arquivamento
Tópicos chaves que devem ser considerados em projetos de Qualificação de Infraestrutura de TI e OT para aplicações de IA BPx relevantes
A seguir, apresentamos um exemplo dos 10 principais cenários de risco que devem ser considerados em uma Análise de Riscos Funcional durante a Qualificação de Infraestrutura de TI e/ou OT. Naturalmente, outros riscos também precisam ser incluídos para garantir a robustez do processo de qualificação.
- Acesso de controle insuficiente;
- Classificação de dados ausentes;
- Má qualidade de dados;
- Armazenamento ineficaz;
- Monitoramento de dados ausente;
- Criptografia ineficaz;
- Falta de versionamento de dados;
- Linhagem de dados insuficiente;
- Falta de confiabilidade dos dados;
- Dados legais – necessidade e capacidade de ML “deletar” dados específicos devido a LGPD.
Esse e outros cenários, incluindo todo o ciclo de vida de infraestrutura e aplicações de AI, estão contemplados dentro do software de validação GO!FIVE®.
GO!FIVE® é uma plataforma de software especializada, projetada para a validação de sistemas, infraestrutura, utilidades, limpeza, equipamentos e processos, apoiando diversas atividades de validação e qualificação por meio de métodos ágeis e digitais.
Oferecendo um conteúdo extenso e funcionalidades avançadas, permite a validação integrada de sistema de IA e tecnologias tradicionais, assim como a qualificação de infraestrutura de maneira perfeita.
Ciclo de Qualificação de Infraestrutura de TI e OT
O intuito deste artigo é consolidar os principais entregáveis que devem ser previstos em um projeto de Qualificação de Infraestrutura de TI e OT.
A categorização do sistema de acordo com o ISPE GAMP®5 pode suportar a elaboração da estratégia de qualificação de forma apropriada.
Nota.: A ISPE® (International Society of Pharmaceutical Engineering) desenvolveu o Guia GAMP (Good Automated Manufacturing Practice) para orientar a comunidade de Ciências da Vida a desenvolver validações/qualificações robustas.
Este conteúdo não tem a intenção de definir a estratégia, porém segue um resumo que pode ajudar orientar seus passos rumo à uma boa qualificação de infraestrutura:
¹ clientes provem aos usuários acesso a recursos e serviços compartilhados (por exemplo: servidores de arquivos, impressoras).
Aproveite de nossa experiência
Através da experiência de diversos projetos executados, a FIVE criou uma base de dados de conhecimento que é atualizada de forma constante.
Fornecemos solução completa com especialistas e software para apoiar projetos em qualquer lugar do mundo.
Software SaaS para todas as disciplinas de validação e qualificação (digital e Agile), incluindo projeto de Qualificação de Infraestrutura de TI ou OT
- Especialistas
Validação de Sistema Computadorizados | Qualificação de Equipamentos de Produção Qualificação de Utilidades |Qualificação da Infraestrutura de TI ou OT | Qualificação de Fornecedores | ou |Integridade e Governança de Dados
Caso queira conhecer mais sobre nossos serviços: clique aqui
Referências:
ISPE GAMP® Good Practice Guide: IT Infrastructure Control and Compliance (Second Edition).
GAMP® é um conjunto de guias que tem seus direitos intelectuais reservados à ISPE®. Disponível para aquisição no site https://ispe.org/.