Identificando soldados da Guerra Civil americana com machine learning

A Guerra Civil americana, que ocorreu entre 1861 e 1865 nos Estados Unidos e contrapôs os estados do Norte, leais ao ideal de integração do país, e os estados do Sul, que queriam a separação, foi um dos primeiros conflitos em que soldados foram sistematicamente fotografados, iniciando uma nova era do fotojornalismo. Entretanto, as identidades da maioria dos soldados, assim como suas histórias de vida, acabaram se perdendo no caminho. Pelo menos até recentemente, quando o site Civil War Photo Sleuth (Investigação Fotográfica da Guerra Civil, em tradução livre) entrou no ar. Este site passou a ser um catálogo de fotos do período, mas seu objetivo foi além daquele de concentrar as imagens em um único portal online. Usando inteligência artificial, ele tenta identificar as pessoas fotografadas, e assim recuperar a história das pessoas envolvidas.

A ideia básica por trás do projeto é simples. Pessoas cadastradas podem submeter o upload das imagens e também qualquer informação sobre a identidade das pessoas retratadas, desde a cor ou o tom das roupas, que serve pra distinguir a qual exército o soldado estava afiliado, até padrões no uniforme que denotam sua posição na hierarquia militar. Informações de cunho mais pessoal, obtidas por descendentes ou descrições no verso das fotografias, também podem ser incluídas. Assim, aos poucos é construído o banco de dados dos soldados. Então, um algoritmo de reconhecimento facial busca encontrar fotos similares para que o cruzamento das informações permita a identificação das pessoas nas fotos de origem desconhecida. O algoritmo usa 27 características do rosto, como os cantos da boca, a ponta do nariz ou a distância entre os olhos, para analisar as fotografias. Comparando as diferenças entre essas proporções, é possível encontrar pessoas similares presentes no catálogo.

Desde que começou suas operações em 2018, o site já recebeu 30 mil fotografias, e foi capaz de identificar 3.300 pessoas. Quando uma correspondência é encontra, a precisão é estimada entre 75 e 80%. Os idealizadores almejam que o site ofereça um novo ponto de vista sobre aquele período, já que os episódios com repercussão política geralmente ficam registrados nos livros de história, mas o lado humano das guerras acaba se perdendo.

No ano que vem, o site pretende adicionar um novo recurso, chamado de Second Opinion, possibilitando que os usuários tenham acesso a uma “segunda opinião” sobre as fotos que sejam potenciais correspondências a uma pesquisa. Essa etapa usará especialistas e usuários cadastrados num programada de crowd-sourcing para aprimorar os resultados entregues pelo algoritmo, eliminando cerca de 75% dos falsos positivos.

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.