IA classifica agudez de dor lombar a partir de anotações médicas em texto corrido

A dor lombar pode se apresentar de forma aguda ou crônica, tendo cada uma diferentes causas e tratamento. Entretanto, ambas as condições são registradas com o mesmo código internacional de doenças, CID-10, de forma que a identificação só pode ser feita pela revisão das anotações dos médicos, que apesar de conterem as informações relevantes, não são estruturados ou padronizados. Além disso, essa etapa é trabalhosa, o que dificulta a criação de um roteiro baseado em dados para recomendação de terapia.

Entretanto, pesquisadores da Escola Icahn de Medicina do Hospital Monte Sinai, em Nova York, desenvolveram um método baseado em inteligência artificial para fazer a classificação da enfermidade analisando as anotações médicas na forma de texto livre. Eles partiram de um dataset contendo 17409 notas clínicas obtidas de diferentes especialidades de cuidado primário; 891 documentos foram anotados manualmente como representantes de dor aguda, e 2973 foram associados a dor lombar pelo código CID-10 contido no documento. Então, os autores testaram vários métodos supervisionados e não-supervisionados para a classificação automática dos documentos, como busca por palavras-chave, modelagem de tópicos, regressão logística com bag of n-grams (que discrimina a frequência com que n palavras consecutivas aparecem nos textos), e deep learning, onde usaram uma arquitetura convolucional chamada ConvNet. O melhor método treinado com as anotações manuais foi a rede convolucional, atingindo uma AUROC de 0,98 – muito próxima do valor máximo de 1. Este método também se mostrou robusto quando a quantidade de documentos para treinamento foi reduzido. As anotações baseadas no código CID-10 não mostraram resultados satisfatórios para identificar a agudez da condição. Entre os métodos não-supervisionados, os melhores resultados foram obtidos através da modelagem de tópicos.

Diante dos resultados, os autores sugerem que, na ausência de rótulos, a modelagem de tópicos pode facilitar o processo de anotação, gerando um processo iterativo onde essas predições iniciais são validadas e usadas para melhorar o modelo final. O algoritmo pode originar um método automatizado de geração de relatórios estruturados a partir das anotações do médico durante o atendimento, acelerando e gerando maior consistência no direcionamento do paciente. O estudo, publicado no final de fevereiro, pode ser usado como base para desenvolver métodos para outras condições musculoesqueléticas, já que os códigos médicos também não distinguem o nível de dor e a agudez da doença.

Seja o primeiro a comentar

    Deixe uma resposta

    O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *