Visão de máquina vê as coisas mais do jeito que fazemos para ser mais fácil de entendermos

Um novo algoritmo de reconhecimento de imagem usa a maneira como os humanos veem as coisas como inspiração.

O contexto: quando os humanos olham para uma nova imagem de algo, identificamos o que é baseado em uma coleção de recursos reconhecíveis. Podemos identificar as espécies de um pássaro, por exemplo, pelo contorno do bico, pelas cores da pluma e pela forma dos pés. Uma rede neural, no entanto, simplesmente procura padrões de pixels em toda a imagem sem discriminar entre o pássaro real e seu fundo. Isso torna a rede neural mais vulnerável a erros e dificulta o diagnóstico dos humanos.


Como funciona: em vez de treinar a rede neural em imagens completas de pássaros, pesquisadores da Duke University e do MIT Lincoln Laboratory treinaram-na para reconhecer as diferentes características: o formato do bico e da cabeça de todas as espécies e a coloração de suas penas. Apresentado com uma nova imagem de um pássaro, o algoritmo pesquisa esses recursos reconhecíveis e faz previsões sobre a quais espécies eles pertencem. Ele usa a evidência cumulativa para tomar uma decisão final.

Um exemplo: para uma imagem de um pica-pau-de-barriga-vermelha, o algoritmo pode encontrar dois recursos reconhecíveis nos quais ele foi treinado: o padrão em preto e branco de suas penas e a coloração vermelha de sua cabeça. A primeira característica poderia combinar com duas espécies possíveis de aves: o pica-pau de barriga vermelha ou de barba vermelha. Mas o segundo recurso combinaria melhor com o primeiro.

A partir das duas evidências, o algoritmo argumenta que a imagem é mais provável da primeira. Em seguida, exibe as imagens dos recursos encontrados para explicar a um ser humano como chegou a sua decisão.

Por que é importante: para que os algoritmos de reconhecimento de imagem sejam mais úteis em ambientes de alto risco, como hospitais, onde podem ajudar um médico a classificar um tumor, eles precisam ser capazes de explicar como chegaram à sua conclusão em um ambiente humano. maneira compreensível. Não só é importante que os humanos confiem neles, mas também ajuda os seres humanos a identificar mais facilmente quando a lógica está errada.

Através de testes, os pesquisadores também demonstraram que a incorporação dessa interpretabilidade em seu algoritmo não prejudicou sua precisão. Tanto na tarefa de identificação de espécies de aves quanto na de modelo de carro, eles descobriram que seu método se aproximava – e em alguns casos excedia – dos resultados mais avançados alcançados por algoritmos não interpretáveis.

Deixe seu comentário!