·
Ciência da Computação ·
Outros
Send your question to AI and receive an answer instantly
Preview text
Ideia Fundamentos Algoritmo padrão Epílogo 1030731 Inteligência Artificial Métodos Baseados em Similaridade CIÊNCIA DA COMPUTAÇÃO Prof Dr Giancarlo D Salton 6 de outubro de 2022 Ideia Fundamentos Algoritmo padrão Epílogo Ideia Fundamentos feature space Medidas de distância Algoritmo padrão Algoritmo Nearest Neighbour Exemplo Epílogo Ideia Fundamentos Algoritmo padrão Epílogo Ideia Ideia Fundamentos Algoritmo padrão Epílogo O ano é 1798 e você é o TenenteCoronel David Collins do navio HMS Calcutta explorando a região da Nova Gales do Sul Austrália Após uma expedição os seus soldados reportam que encontraram um animal estranho próximo de um rio Você pede uma descrição do animal e os soldados respondem que não conseguiram ver o animal com clareza mas eles repararam que ele possuía bico e pés de pato e que ele rosnou para reles Para preparar a expedição do dia seguinte você precisa determinar se aquele animal é uma ameaça ou não para os seus soldados Ideia Fundamentos Algoritmo padrão Epílogo Grrrh Score 1 1 2 Alguns animais que condizem com a descrição do animal desconhecido descrito pelo marinheiro Ideia Fundamentos Algoritmo padrão Epílogo Ideia 1 Este tipo de raciocínio em que se verificam features de um animal em comparação com features de outros animais encapsula a ideia principal envolvida em métodos baseados em similaridade se você está tentando classificar algo então você deve pesquisar em sua memória para encontrar coisas que sejam semelhantes e atribuir a mesma classe da coisa mais semelhante encontrada em sua memória Um dos algoritmos mais simples e bem estudados do machine learning que implementa este estilo de raciocínio é chamado de algoritmo Nearest Neighbour Ideia Fundamentos Algoritmo padrão Epílogo Fundamentos Ideia Fundamentos Algoritmo padrão Epílogo São dois conceitos fundamentais Espaço de features ou feature space Medida de distância Ideia Fundamentos Algoritmo padrão Epílogo feature space Tabela Scores atribuídos para velocidade speed e agilidade agility para 20 atletas universitários e o resultado se foram ou não selecionados draft para jogar na NBA ID Speed Agility Draft 1 250 600 No 2 375 800 No 3 225 550 No 4 325 825 No 5 275 750 No 6 450 500 No 7 350 525 No 8 300 325 No 9 400 400 No 10 425 375 No ID Speed Agility Draft 11 200 200 No 12 500 250 No 13 825 850 No 14 575 875 Yes 15 475 625 Yes 16 550 675 Yes 17 525 950 Yes 18 700 425 Yes 19 750 800 Yes 20 725 575 Yes Ideia Fundamentos Algoritmo padrão Epílogo feature space 2 3 4 5 6 7 8 2 4 6 8 Speed Agility Gráfico do feature space representando os dados contidos na tabela de drafts do slide anterior Os triângulos representam o target nodraft e as cruzes representam o target draft Ideia Fundamentos Algoritmo padrão Epílogo feature space O feature space é um espaço ndimensional abstrato criado a partir das features contidas em uma ABT onde cada feature corresponde a uma das n dimensões cada exemplo na ABT é mapeado para um ponto neste espaço baseado nos valores das features descritivas Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Uma medida de distância ou medida de similaridade entre dois exemplos datapoints no feature space Matematicamente a medida precisa obedecer 4 regras 1 Nãonegatividade metrica b ě 0 2 Identidade metrica b 0 ðñ a b 3 Simetria metrica b metricb a 4 Desigualdade Triangular metrica b ď metrica c metricb c onde metrica b e uma função que retorna a distância entre dois datapoints a e b em umfeature space Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Uma das medidas mais utilizadas é a distância Euclideana ou Euclidean distance que computa o comprimento de uma linha reta entre 2 pontos A distância Euclideana entre dois pontos a e b em um espaço mdimensional é definida como Euclideana b g f f e m ÿ i1 ai bi2 1 Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Euclideana entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Euclideana entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Euclidean500 250 275 750 b 500 2752 250 7502 300625 54829 Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Outra distância menos utilizada é a distância Manhattan também chamada de taxicab distance A distância Manhattan entre dois pontos a e b em um espaço mdimensional é definida como Manhattana b m ÿ i1 absai bi 2 A função abs indica que utilizamos o valor absoluto da subtração ievalores nãonegativos pois as distâncias não podem ser negativas Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Manhattan entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Manhattan entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Manhattan500 250 275 750 abs500 275 abs25 75 225 5 725 Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Euclidean Manhattan Representação geométrica das distâncias Manhattan e Euclideana entre dois pontos Ideia Fundamentos Algoritmo padrao Epilogo Medidas de distancia As distancias Euclideana e Manhattan sdo casos especiais da distancia Minkowski Minkowski distance Adistancia Minkowski entre dois pontos a e b em um espacgo mdimensional é definida como 1 m p Minkowskia b 5 absai bi 3 i1 onde diferentes valores do pardametro p resultam em diferentes medidas de distancia Adistancia Minkowski com p 1 a distancia Manhattan e com p 2éa distancia Euclideana Valores mais altos para p colocam mais ênfase em diferenças maiores entre as features pois estas diferenças são elevadas a potência p Exemplo Manhattan Euclideana ID ID Minkowski p1 Minkowski p2 12 5 725 54829 12 17 725 825 2 3 4 5 6 7 8 2 4 6 8 Speed Agility Manhattan Euclidean 12 5 17 Distâncias Manhattan e Euclideana entre os pontos d12 Speed 500 Agility 25 e d5 Speed 275 Agility 75 e também entre os pontos d12 e d17 Speed 525 Agility 95 Ideia Fundamentos Algoritmo padrão Epílogo Algoritmo padrão Algoritmo Nearest Neighbour Ideia Fundamentos Algoritmo padrão Epílogo Algoritmo Nearest Neighbour Require conjunto de exemplos dataset Require uma query para ser classificada 1 Iterar sobre todas os exemplos em memória e encontrar aquele exemplo com a menor distância no feature space até a query 2 Retornar como predição para a query o mesmo valor do target daquele exemplo com a menor distância Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Tabela Scores atribuídos para velocidade speed e agilidade agility para 20 atletas universitários e o resultado se foram ou não selecionados draft para jogar na NBA ID Speed Agility Draft 1 250 600 No 2 375 800 No 3 225 550 No 4 325 825 No 5 275 750 No 6 450 500 No 7 350 525 No 8 300 325 No 9 400 400 No 10 425 375 No ID Speed Agility Draft 11 200 200 No 12 500 250 No 13 825 850 No 14 575 875 Yes 15 475 625 Yes 16 550 675 Yes 17 525 950 Yes 18 700 425 Yes 19 750 800 Yes 20 725 575 Yes Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Exemplo Devemos selecionar draft um atleta com as seguintes características Speed 675 Agility 3 Ideia Fundamentos Algoritmo padrão Epílogo Exemplo 2 3 4 5 6 7 8 2 4 6 8 Speed Agility Gráfico do feature space representando os dados contidos na tabela de drafts do slide anterior Os triângulos representam o target nodraft e as cruzes representam o target draft Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Tabela Distâncias entre a query com Speed 675 e Agility 300 e cada um dos exemplos do dataset de drafts da NBA ID Speed Agility Draft Dist 18 700 425 yes 127 12 500 250 no 182 10 425 375 no 261 20 725 575 yes 280 9 400 400 no 293 6 450 500 no 301 8 300 325 no 376 15 475 625 yes 382 7 350 525 no 395 16 550 675 yes 395 ID Speed Agility Draft Dist 11 200 200 no 485 19 750 800 yes 506 3 225 550 no 515 1 250 600 no 520 13 825 850 no 570 2 375 800 no 583 14 575 875 yes 584 5 275 750 no 602 4 325 825 no 631 17 525 950 yes 667 Ideia Fundamentos Algoritmo padrão Epílogo Exemplo a Diagrama de Voronoi b Fronteira de decisão k 1 a Diagrama de Voronoi gerado utilizando as distâncias no feature space para o dataset de drafts b fronteira de decisão criada ao agregarmos as regiões vizinhas com mesmo valor para o target Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Uma das grandes vantagens do algoritmo Nearest Neighbour é que para atualizar o modelo basta adicionar mais exemplos no dataset e carregálos para a memória Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Tabela Versão estendida do dataset contendo scores atribuídos para velocidade speed e agilidade agility para atletas universitários e o resultado se foram ou não selecionados draft para jogar na NBA ID Speed Agility Draft 1 250 600 No 2 375 800 No 3 225 550 No 4 325 825 No 5 275 750 No 6 450 500 No 7 350 525 No 8 300 325 No 9 400 400 No 10 425 375 No 11 200 200 No ID Speed Agility Draft 12 500 250 No 13 825 850 No 14 575 875 Yes 15 475 625 Yes 16 550 675 Yes 17 525 950 Yes 18 700 425 Yes 19 750 800 Yes 20 725 575 Yes 21 675 300 yes Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Ideia Fundamentos Algoritmo padrão Epílogo Epílogo Ideia Fundamentos Algoritmo padrão Epílogo Retornando ao ano de 1798 e ao HMS Calcutta no dia seguinte você resolve acompanhar os soldados na expedição para observar o animal Desta vez você se dá conta que realmente não é um pato Acontece que você e seus soldados foram as primeiras pessoas a terem tido contato com um ornitorrinco História vagamente baseada em fatos reais Imagem criada por Jan Gillbank para o website Australian Curriculum httpwwwe4aceduau e utilizada sob a licença Create Commons Attribution 30 Unported licence httpcreativecommonsorglicensesby30 Imagem obtida via Wikimedia Commons Ideia Fundamentos Algoritmo padrão Epílogo Retornando ao ano de 1798 e ao HMS Calcutta no dia seguinte você resolve acompanhar os soldados na expedição para observar o animal Desta vez você se dá conta que realmente não é um pato Acontece que você e seus soldados foram as primeiras pessoas a terem tido contato com um ornitorrinco História vagamente baseada em fatos reais Imagem criada por Jan Gillbank para o website Australian Curriculum httpwwwe4aceduau e utilizada sob a licença Create Commons Attribution 30 Unported licence httpcreativecommonsorglicensesby30 Imagem obtida via Wikimedia Commons Ideia Fundamentos Algoritmo padrão Epílogo O epílogo demonstra dois aspectos importantes do aprendizado com supervisão 1 machine learning supervisionado baseiase na suposição de estacionaridade que diz que os valores de cada exemplo contido no dataset treino não mudam ieeles se mantém estacionários iguais com o tempo 2 no contexto de classificação machine learning supervisionado cria modelos que distinguem entre as classes ieos tipos de target presentes no dataset utilizado para indução 3 desta forma se o modelo é treinado para distinguir entre leões sapos e patos o modelo irá classificar uma query como leão sapo ou pato mesmo que a query seja um ornitorrinco Ideia Fundamentos Algoritmo padrão Epílogo Ideia Fundamentos feature space Medidas de distância Algoritmo padrão Algoritmo Nearest Neighbour Exemplo Epílogo
Send your question to AI and receive an answer instantly
Preview text
Ideia Fundamentos Algoritmo padrão Epílogo 1030731 Inteligência Artificial Métodos Baseados em Similaridade CIÊNCIA DA COMPUTAÇÃO Prof Dr Giancarlo D Salton 6 de outubro de 2022 Ideia Fundamentos Algoritmo padrão Epílogo Ideia Fundamentos feature space Medidas de distância Algoritmo padrão Algoritmo Nearest Neighbour Exemplo Epílogo Ideia Fundamentos Algoritmo padrão Epílogo Ideia Ideia Fundamentos Algoritmo padrão Epílogo O ano é 1798 e você é o TenenteCoronel David Collins do navio HMS Calcutta explorando a região da Nova Gales do Sul Austrália Após uma expedição os seus soldados reportam que encontraram um animal estranho próximo de um rio Você pede uma descrição do animal e os soldados respondem que não conseguiram ver o animal com clareza mas eles repararam que ele possuía bico e pés de pato e que ele rosnou para reles Para preparar a expedição do dia seguinte você precisa determinar se aquele animal é uma ameaça ou não para os seus soldados Ideia Fundamentos Algoritmo padrão Epílogo Grrrh Score 1 1 2 Alguns animais que condizem com a descrição do animal desconhecido descrito pelo marinheiro Ideia Fundamentos Algoritmo padrão Epílogo Ideia 1 Este tipo de raciocínio em que se verificam features de um animal em comparação com features de outros animais encapsula a ideia principal envolvida em métodos baseados em similaridade se você está tentando classificar algo então você deve pesquisar em sua memória para encontrar coisas que sejam semelhantes e atribuir a mesma classe da coisa mais semelhante encontrada em sua memória Um dos algoritmos mais simples e bem estudados do machine learning que implementa este estilo de raciocínio é chamado de algoritmo Nearest Neighbour Ideia Fundamentos Algoritmo padrão Epílogo Fundamentos Ideia Fundamentos Algoritmo padrão Epílogo São dois conceitos fundamentais Espaço de features ou feature space Medida de distância Ideia Fundamentos Algoritmo padrão Epílogo feature space Tabela Scores atribuídos para velocidade speed e agilidade agility para 20 atletas universitários e o resultado se foram ou não selecionados draft para jogar na NBA ID Speed Agility Draft 1 250 600 No 2 375 800 No 3 225 550 No 4 325 825 No 5 275 750 No 6 450 500 No 7 350 525 No 8 300 325 No 9 400 400 No 10 425 375 No ID Speed Agility Draft 11 200 200 No 12 500 250 No 13 825 850 No 14 575 875 Yes 15 475 625 Yes 16 550 675 Yes 17 525 950 Yes 18 700 425 Yes 19 750 800 Yes 20 725 575 Yes Ideia Fundamentos Algoritmo padrão Epílogo feature space 2 3 4 5 6 7 8 2 4 6 8 Speed Agility Gráfico do feature space representando os dados contidos na tabela de drafts do slide anterior Os triângulos representam o target nodraft e as cruzes representam o target draft Ideia Fundamentos Algoritmo padrão Epílogo feature space O feature space é um espaço ndimensional abstrato criado a partir das features contidas em uma ABT onde cada feature corresponde a uma das n dimensões cada exemplo na ABT é mapeado para um ponto neste espaço baseado nos valores das features descritivas Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Uma medida de distância ou medida de similaridade entre dois exemplos datapoints no feature space Matematicamente a medida precisa obedecer 4 regras 1 Nãonegatividade metrica b ě 0 2 Identidade metrica b 0 ðñ a b 3 Simetria metrica b metricb a 4 Desigualdade Triangular metrica b ď metrica c metricb c onde metrica b e uma função que retorna a distância entre dois datapoints a e b em umfeature space Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Uma das medidas mais utilizadas é a distância Euclideana ou Euclidean distance que computa o comprimento de uma linha reta entre 2 pontos A distância Euclideana entre dois pontos a e b em um espaço mdimensional é definida como Euclideana b g f f e m ÿ i1 ai bi2 1 Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Euclideana entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Euclideana entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Euclidean500 250 275 750 b 500 2752 250 7502 300625 54829 Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Outra distância menos utilizada é a distância Manhattan também chamada de taxicab distance A distância Manhattan entre dois pontos a e b em um espaço mdimensional é definida como Manhattana b m ÿ i1 absai bi 2 A função abs indica que utilizamos o valor absoluto da subtração ievalores nãonegativos pois as distâncias não podem ser negativas Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Manhattan entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Exemplo A distância Manhattan entre as instâncias d12 Speed 500 Agility 25 e d5 Speed 275Agility 75 do dataset de drafts é Manhattan500 250 275 750 abs500 275 abs25 75 225 5 725 Ideia Fundamentos Algoritmo padrão Epílogo Medidas de distância Euclidean Manhattan Representação geométrica das distâncias Manhattan e Euclideana entre dois pontos Ideia Fundamentos Algoritmo padrao Epilogo Medidas de distancia As distancias Euclideana e Manhattan sdo casos especiais da distancia Minkowski Minkowski distance Adistancia Minkowski entre dois pontos a e b em um espacgo mdimensional é definida como 1 m p Minkowskia b 5 absai bi 3 i1 onde diferentes valores do pardametro p resultam em diferentes medidas de distancia Adistancia Minkowski com p 1 a distancia Manhattan e com p 2éa distancia Euclideana Valores mais altos para p colocam mais ênfase em diferenças maiores entre as features pois estas diferenças são elevadas a potência p Exemplo Manhattan Euclideana ID ID Minkowski p1 Minkowski p2 12 5 725 54829 12 17 725 825 2 3 4 5 6 7 8 2 4 6 8 Speed Agility Manhattan Euclidean 12 5 17 Distâncias Manhattan e Euclideana entre os pontos d12 Speed 500 Agility 25 e d5 Speed 275 Agility 75 e também entre os pontos d12 e d17 Speed 525 Agility 95 Ideia Fundamentos Algoritmo padrão Epílogo Algoritmo padrão Algoritmo Nearest Neighbour Ideia Fundamentos Algoritmo padrão Epílogo Algoritmo Nearest Neighbour Require conjunto de exemplos dataset Require uma query para ser classificada 1 Iterar sobre todas os exemplos em memória e encontrar aquele exemplo com a menor distância no feature space até a query 2 Retornar como predição para a query o mesmo valor do target daquele exemplo com a menor distância Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Tabela Scores atribuídos para velocidade speed e agilidade agility para 20 atletas universitários e o resultado se foram ou não selecionados draft para jogar na NBA ID Speed Agility Draft 1 250 600 No 2 375 800 No 3 225 550 No 4 325 825 No 5 275 750 No 6 450 500 No 7 350 525 No 8 300 325 No 9 400 400 No 10 425 375 No ID Speed Agility Draft 11 200 200 No 12 500 250 No 13 825 850 No 14 575 875 Yes 15 475 625 Yes 16 550 675 Yes 17 525 950 Yes 18 700 425 Yes 19 750 800 Yes 20 725 575 Yes Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Exemplo Devemos selecionar draft um atleta com as seguintes características Speed 675 Agility 3 Ideia Fundamentos Algoritmo padrão Epílogo Exemplo 2 3 4 5 6 7 8 2 4 6 8 Speed Agility Gráfico do feature space representando os dados contidos na tabela de drafts do slide anterior Os triângulos representam o target nodraft e as cruzes representam o target draft Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Tabela Distâncias entre a query com Speed 675 e Agility 300 e cada um dos exemplos do dataset de drafts da NBA ID Speed Agility Draft Dist 18 700 425 yes 127 12 500 250 no 182 10 425 375 no 261 20 725 575 yes 280 9 400 400 no 293 6 450 500 no 301 8 300 325 no 376 15 475 625 yes 382 7 350 525 no 395 16 550 675 yes 395 ID Speed Agility Draft Dist 11 200 200 no 485 19 750 800 yes 506 3 225 550 no 515 1 250 600 no 520 13 825 850 no 570 2 375 800 no 583 14 575 875 yes 584 5 275 750 no 602 4 325 825 no 631 17 525 950 yes 667 Ideia Fundamentos Algoritmo padrão Epílogo Exemplo a Diagrama de Voronoi b Fronteira de decisão k 1 a Diagrama de Voronoi gerado utilizando as distâncias no feature space para o dataset de drafts b fronteira de decisão criada ao agregarmos as regiões vizinhas com mesmo valor para o target Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Uma das grandes vantagens do algoritmo Nearest Neighbour é que para atualizar o modelo basta adicionar mais exemplos no dataset e carregálos para a memória Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Tabela Versão estendida do dataset contendo scores atribuídos para velocidade speed e agilidade agility para atletas universitários e o resultado se foram ou não selecionados draft para jogar na NBA ID Speed Agility Draft 1 250 600 No 2 375 800 No 3 225 550 No 4 325 825 No 5 275 750 No 6 450 500 No 7 350 525 No 8 300 325 No 9 400 400 No 10 425 375 No 11 200 200 No ID Speed Agility Draft 12 500 250 No 13 825 850 No 14 575 875 Yes 15 475 625 Yes 16 550 675 Yes 17 525 950 Yes 18 700 425 Yes 19 750 800 Yes 20 725 575 Yes 21 675 300 yes Ideia Fundamentos Algoritmo padrão Epílogo Exemplo Ideia Fundamentos Algoritmo padrão Epílogo Epílogo Ideia Fundamentos Algoritmo padrão Epílogo Retornando ao ano de 1798 e ao HMS Calcutta no dia seguinte você resolve acompanhar os soldados na expedição para observar o animal Desta vez você se dá conta que realmente não é um pato Acontece que você e seus soldados foram as primeiras pessoas a terem tido contato com um ornitorrinco História vagamente baseada em fatos reais Imagem criada por Jan Gillbank para o website Australian Curriculum httpwwwe4aceduau e utilizada sob a licença Create Commons Attribution 30 Unported licence httpcreativecommonsorglicensesby30 Imagem obtida via Wikimedia Commons Ideia Fundamentos Algoritmo padrão Epílogo Retornando ao ano de 1798 e ao HMS Calcutta no dia seguinte você resolve acompanhar os soldados na expedição para observar o animal Desta vez você se dá conta que realmente não é um pato Acontece que você e seus soldados foram as primeiras pessoas a terem tido contato com um ornitorrinco História vagamente baseada em fatos reais Imagem criada por Jan Gillbank para o website Australian Curriculum httpwwwe4aceduau e utilizada sob a licença Create Commons Attribution 30 Unported licence httpcreativecommonsorglicensesby30 Imagem obtida via Wikimedia Commons Ideia Fundamentos Algoritmo padrão Epílogo O epílogo demonstra dois aspectos importantes do aprendizado com supervisão 1 machine learning supervisionado baseiase na suposição de estacionaridade que diz que os valores de cada exemplo contido no dataset treino não mudam ieeles se mantém estacionários iguais com o tempo 2 no contexto de classificação machine learning supervisionado cria modelos que distinguem entre as classes ieos tipos de target presentes no dataset utilizado para indução 3 desta forma se o modelo é treinado para distinguir entre leões sapos e patos o modelo irá classificar uma query como leão sapo ou pato mesmo que a query seja um ornitorrinco Ideia Fundamentos Algoritmo padrão Epílogo Ideia Fundamentos feature space Medidas de distância Algoritmo padrão Algoritmo Nearest Neighbour Exemplo Epílogo