Distâncias – 3 mais usadas em IA

Entre para nossa lista e receba conteúdos exclusivos!

Distâncias

Em inteligência artificial, é comum usarmos vários tipos de métricas de proximidade.Cada caso, um tipo de distância é mais adequada. Todos os algoritmos de de aprendizagem, precisamos ter uma ideia de distância pois precisamos identificar o grau de proximidade entre elementos.

Aproveite para ler um guia rápido da biblioteca numpy para IA e aplique os conhecimentos adquiridos por aqui. Com essa biblioteca, é bem simples de fazer as operações matemáticas em python.

Distâncias: Distância Manhattan

A distância manhattan é uma distância bastante comum de ser utilizada. Seu nome deriva da geometria das ruas de Nova Iorque. Uma vez que a distância manhattan, é calculada em degraus, como se estivéssemos querendo ir de um quarteirão a outro e começamos a andar em “zig zag”.   

Fonte: https://pt.wikipedia.org/wiki/Geometria_do_t%C3%A1xi

Esse tipo de distância é muito utilizada em situações em que os valores são discretos. A fórmula para o cálculo da distância manhattan entre dois pontos no plano cartesiano é:

Onde (x1,y1) é um ponto e (x2,y2) é outro ponto.

Distâncias: Distância Euclidiana

Essa é a distância que estamos mais habituados em usar. Quando falamos que o caminho mais curto entre dois pontos é uma reta, estamos falando diretamente da distância euclidiana, pois em outros tipos de distâncias isso não é necessariamente verdade.

O cálculo da distância euclidiana no plano cartesiano é através do teorema de Pitágoras. No caso, a hipotenusa do triângulo retângulo é a distância entre dois vértices C e B, onde ficam os pontos de interesse.

Fonte:https://www.todamateria.com.br/teorema-de-pitagoras/

A fórmula da distância euclidiana é:

Similar a distância manhattan, porém, com as diferenças ao quadrado e em raíz. Uma aplicação direta do teorema de pitágoras. Também, vale notar que os catetos juntos formam a distância manhattan.

Distâncias: Distância de Mahalanobis

A distância de Mahalanobis é bem diferente das outras. Se trata de uma visão estatística de distância, e leva em consideração a correlação entre os pontos. O que não ocorre com a euclidiana e manhattan. 

Podemos imaginar a distância mahalanobis como uma região em que é mais provável encontrar os pontos. Ou seja, ela vai depender muito da distribuição dos pontos. Um ponto que é próximo a outro na distância euclidiana podem não ser próximos na distância de mahalanobis.

Fonte: https://adenilsongiovanini.com.br/

Vemos que a distância de mahalanobis pode assumir essa característica elíptica, já a distância euclidiana tem um caráter circular.

A fórmula da distância de mahalanobis é:

Onde as diferenças vetoriais são as matrizes linhas e colunas com as diferenças de todos os pontos  de x e y. Já S^(-1) é a inversa da matriz de covariância. Em posts futuros iremos aprender a calculá-la com python.

Conclusão

Conhecemos algumas das distâncias bastante utilizadas em IA. Essas distâncias estão por trás da grande parte de algoritmos de aprendizagem de máquina por aí. Em breve estaremos vendo na prática o funcionamento de cada uma delas.

Referências

https://pt.wikipedia.org/wiki/Dist%C3%A2ncia_de_Mahalanobis

http://www.augustobaffa.pro.br/wiki/Dist%C3%A2ncia_Euclidiana

Distância ícones criados por Good Ware – Flaticon

Outros Artigos

Reprodução-das-Plantas
Biológicas

Reprodução das Plantas

Você sabe como funciona o processo de reprodução das plantas? Qual a sua importância e o porquê de acontecer? Clique aqui e saiba mais.

Legal

® 2021-2024 Meu Guru | 42.269.770/0001-84 • Todos os direitos reservados

Entre para nossa lista e receba conteúdos exclusivos!