Evidências clínicas e recalls da FDA de dispositivos médicos com inteligência artificial

A ideia de que a inteligência artificial em saúde deve ser avaliada apenas antes de entrar no mercado está ficando ultrapassada. O artigo “Clinical Evidence and FDA Recalls of Artificial Intelligence–Enabled Medical Devices”, publicado no JAMA Network Open, traz uma mensagem incômoda, mas necessária. Autorizar um dispositivo médico com IA não é o mesmo que demonstrar que ele funcionará com segurança, consistência e generalização no mundo real.

O estudo analisou 903 dispositivos médicos habilitados por IA autorizados pela FDA e identificou que 43 foram objeto de recall. À primeira vista, o número pode parecer pequeno. Mas a relevância do achado não está apenas na frequência absoluta dos recalls, mas no padrão que emerge quando se observa quais características aumentam a vulnerabilidade desses dispositivos no pós-mercado. A ausência de informações públicas sobre estudos clínicos de performance aparece como um dos fatores mais importantes associados ao risco de recall.

Esse ponto precisa ser levado a sério por hospitais, reguladores, médicos e empresas. A saúde não pode tratar evidência clínica como uma etapa decorativa do processo de inovação. Em dispositivos médicos tradicionais, falhas podem estar relacionadas a problemas materiais, mecânicos, elétricos ou de fabricação.

Em dispositivos baseados em IA, o desempenho depende dos dados, do contexto, do fluxo assistencial, da população atendida e da forma como a ferramenta é usada na prática.

Uma IA validada em um ambiente pode não se comportar da mesma forma em outro. Um algoritmo treinado ou testado em determinada população, com determinado padrão de imagem, prontuário, equipamento, equipe e prevalência de doença, pode perder desempenho quando implantado em um hospital com realidade distinta. Esse é o ponto central da generalização clínica. Na medicina, não basta funcionar em média, é preciso funcionar de forma confiável onde a decisão real acontece.

O estudo também mostra que problemas relacionados ao uso foram particularmente relevantes entre os fatores associados a recall. Isso é muito importante. Muitas vezes, quando se fala em segurança de IA, a discussão fica concentrada no algoritmo, como se o risco estivesse apenas no código. Mas o risco real aparece na interação entre tecnologia, profissional, paciente, fluxo de trabalho e instituição.

Uma IA pode falhar porque foi mal desenhada, mas também porque foi mal implementada, mal compreendida ou usada em uma situação diferente daquela para a qual foi validada.

Esse achado desloca a discussão da inovação para a governança. Não estamos mais falando apenas de aprovar softwares ou comprar soluções digitais. Estamos falando de criar sistemas institucionais capazes de monitorar desempenho, detectar desvios, registrar eventos adversos, revisar fluxos e decidir quando uma ferramenta deve ser ajustada, suspensa ou retirada de uso. A IA em saúde exige uma nova camada de vigilância clínica contínua.

Há também uma mensagem importante para startups e empresas de tecnologia médica. A velocidade regulatória não pode ser confundida com maturidade clínica. A autorização de mercado pode abrir a porta, mas não encerra a responsabilidade científica. Pelo contrário, em IA, a entrada no mercado deveria inaugurar uma fase ainda mais rigorosa de acompanhamento, porque é no uso real que surgem variações de população, vieses operacionais, mudanças de comportamento profissional e efeitos não previstos.

A discussão é ainda mais relevante porque muitos dispositivos de IA em saúde chegam ao mercado por caminhos regulatórios que nem sempre exigem o mesmo grau de evidência prospectiva que esperaríamos para tecnologias capazes de influenciar decisões clínicas. O estudo não afirma que todo dispositivo sem evidência pública robusta é inseguro. Essa seria uma leitura simplista. Mas sugere que a ausência de transparência sobre validação clínica deve ser tratada como um sinal de alerta, especialmente em tecnologias que podem impactar diagnóstico, triagem, priorização, prognóstico ou conduta.

Outro ponto forte do artigo do JAMA é o uso de múltiplas fontes de vigilância pós-mercado, incluindo a base MAUDE da FDA e dados de notificações de segurança de campo capturados pelo CORE-MD. Isso reforça uma tese essencial, que nenhum sistema isolado de notificação é suficiente para acompanhar o risco de dispositivos médicos baseados em IA. Eventos adversos, falhas de desempenho, problemas de uso e alertas emitidos por fabricantes precisam ser integrados em uma arquitetura mais ampla de vigilância.

Para hospitais, isso significa que a compra de uma solução de IA não pode ser tratada como aquisição comum de software. Deve haver comitês de avaliação, critérios mínimos de evidência, análise de representatividade dos estudos, revisão de performance local, plano de implantação, treinamento das equipes, indicadores de segurança e mecanismos de auditoria. Sem isso, o hospital terceiriza uma parte da decisão clínica para uma tecnologia que talvez não tenha sido suficientemente testada para a sua realidade.

Para médicos, a mensagem é igualmente clara. A IA não elimina a responsabilidade profissional, ela muda sua natureza. O médico precisará compreender quando pode confiar em uma recomendação algorítmica, quando deve questioná-la e quais limitações estão associadas àquele dispositivo. A alfabetização em IA deixa de ser uma competência opcional e passa a ser parte da segurança do paciente.

Para reguladores, o estudo aponta para a necessidade de uma vigilância mais dinâmica. Modelos tradicionais de aprovação foram desenhados para tecnologias relativamente estáveis. A IA, especialmente quando integrada a softwares, bases de dados, atualizações e fluxos digitais, pode ter comportamento mais dependente do contexto. Isso exige uma regulação que combine avaliação pré-mercado, transparência de evidência, monitoramento pós-mercado e capacidade de resposta rápida a sinais de risco.

No Brasil, essa discussão é urgente. À medida que hospitais, operadoras, healthtechs e fornecedores incorporam soluções de IA, não podemos importar apenas o entusiasmo tecnológico. Precisamos importar também a disciplina regulatória, a cultura de validação e a vigilância pós-implantação. A pergunta correta não é apenas se a IA foi aprovada em algum lugar, mas se ela foi validada para o contexto em que será usada, com quais dados, quais desfechos, quais limitações e qual plano de monitoramento.

O artigo do JAMA não deve ser lido como um freio à inovação. Deve ser lido como um convite à inovação responsável. A pior resposta possível seria concluir que a IA médica é perigosa demais para avançar. A melhor resposta é reconhecer que tecnologias poderosas exigem instituições mais maduras, reguladores mais preparados, empresas mais transparentes e profissionais mais críticos.

Um dispositivo pode apresentar excelente desempenho em estudo retrospectivo, parecer promissor em ambiente controlado e ainda assim enfrentar dificuldades quando exposto à complexidade do cuidado real. É por isso que evidência clínica, generalização e monitoramento não são burocracias. São os novos pilares da segurança digital em saúde. A autorização regulatória é apenas o começo. A verdadeira validação acontece quando a tecnologia encontra pacientes reais, profissionais reais, hospitais reais e consequências reais.

Evidências clínicas e recalls da FDA de dispositivos médicos com inteligência artificial

Leia outros artigos

RUAIH: A nova acreditação da Joint Commission para Inteligência Artificial na saúde

Harvard T.H. Chan School of Public Health - Engenharia de IA para o futuro da saúde

OpenEvidence: Quando a IA deixa de buscar respostas e passa a reorganizar a medicina baseada em evidências

Vamos construiralgo juntos?