Estudo divulgado na revista Scientific Reports aponta que modelos baseados em inteligência artificial (IA) são capazes de predizer com quase 80% de exatidão as taxas de morte e sobrevida de pacientes com câncer colorretal. Segundo os autores, os resultados indicam que essas ferramentas podem ser úteis para o planejamento e a avaliação dos serviços de saúde, bem como para orientar protocolos de encaminhamento.
Os tumores colorretais são um dos tipos de câncer mais incidentes no mundo, com quase 2 milhões de novos casos ao ano e tendência de aumento nesse número. No Brasil, dados do Instituto Nacional de Câncer (Inca) indicam o surgimento de 44 mil novos casos anuais, sendo 70% nas regiões Sudeste e Sul.
Técnicas de aprendizado de máquina baseadas em inteligência artificial vêm sendo cada vez mais utilizadas para prever taxas de mortalidade e sobrevivência por sua capacidade de se aprimorar automaticamente, sem a necessidade de programações constantes – diferentemente dos modelos estatísticos utilizados em estudos epidemiológicos que, à medida que a realidade se transforma, vão se tornando obsoletos e menos precisos.
O estudo, apoiado pela FAPESP no âmbito do projeto “Controle do Câncer no Estado de São Paulo (ConeCta-SP): do conhecimento à ação”, que projeta estratégias para controlar a doença em curto espaço de tempo, foi um dos primeiros a realizar a predição da sobrevida de pacientes com câncer com base em um grande banco de dados usando IA e a verificar a validade desses modelos no Brasil. O trabalho envolveu grupos da Fundação Oncocentro do Estado de São Paulo (Fosp), da Faculdade de Saúde Pública da Universidade de São Paulo (FSP-USP), do Hospital A.C. Camargo e do Instituto Mauá de Tecnologia (IMT).
As informações não identificadas sobre condição socioeconômica, características clínicas e de atendimento e sobrevida de 31.916 pacientes de câncer colorretal atendidos em mais de 70 hospitais do Estado de São Paulo entre 2000 e 2021 pertencem ao Registro Hospitalar de Câncer do Estado de São Paulo (RHC-SP), gerido pela Fosp.
Os pesquisadores avaliaram e compararam a validade na predição de três algoritmos de IA: Random Forest, Naive Bayes e XGBoost. Este último apresentou o melhor resultado, predizendo corretamente 77% das mortes e 77% da sobrevida (em um, três e cinco anos a partir do diagnóstico do tumor).
“O desempenho dos três modelos mostrou uma taxa de acertos entre 76% e 77%”, diz Lucas Buk Cardoso, pesquisador do Núcleo de Sistemas Eletrônicos Embarcados (NSEE) do Instituto Mauá de Tecnologia e primeiro autor do estudo. “Além disso, foi possível obter os dados dos pacientes mais importantes para as previsões – colocados como entradas para a IA –, permitindo um melhor entendimento do tamanho do impacto dessas informações e a validação com o conhecimento já difundido na área.”
A entrada mais importante em todos os modelos foi o estadiamento clínico do câncer, que contém a informação sobre o grau da doença – quanto mais avançada, mais decisiva para a predição de óbito. Outras informações importantes foram as relacionadas ao tratamento realizado, como cirurgia, radioterapia e quimioterapia, além da presença de recidiva, indicando se o câncer voltou ou não, idade do paciente e ano do diagnóstico da doença.
Já as variáveis que melhor predisseram a sobrevida no XGBoost foram estágio clínico, cirurgia realizada, tratamento hospitalar, idade e ano de diagnóstico.
Avanços práticos e metodológicos
De acordo com os autores, o estudo tem potencial para ser o primeiro de muitos que permitirão a simulação de cenários e impactos na sobrevida de pacientes de câncer. Com as informações obtidas, melhores decisões clínicas e de gestão em saúde pública poderão ser tomadas.
“Esse tipo de avaliação pode indicar modelos que servirão como instrumentos para a tomada de decisão dos gestores em momentos de potencial disrupção nos serviços de saúde, como acontece em pandemias, por exemplo”, explica Tatiana Toporcov, professora da FSP-USP e coautora do artigo.
Vanderlei Cunha Parro, professor do Instituto Mauá de Tecnologia, destaca ainda o caráter de avaliação das fronteiras entre os métodos estatísticos e os que utilizam aprendizado de máquina. “Tal investigação pode dar origem também a uma revisão metodológica, com novos dados a serem incluídos e outros a serem excluídos.”