·

Engenharia Naval e Oceânica ·

Outros

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Machine Learning Aula 3Técnicas de divisão de conjuntos de dados e escalonamento de características 1 Sumário 1Hold out 2Kfold 3Kfold com repetição 4 Escalonamento de características 2 Hold out Divisão disjunta sem reamostragem Usado para datasets com grande cardinalidade Aplicado para obtenção de resultados preliminares em datasets de tamanho reduzido Fonte Scaccia 2020 3 Hold out Com partição de validação Sintonização fina de hiperparâmetros Analogia com exercícios Fonte Scaccia 2020 Adaptada Exercício Simulado Prova 4 Valores típicos usados Os valores típicos de divisão dos conjunto de dados são 80 para treinamento e 20 para teste 70 para treinamento e 30 para teste 60 para treinamento e 40 para teste 5 Separação estratificada de acordo com as classes 1 Separação aleatória Conjunto de dados 2 Separação estratificada de acordo com as classes Normal Desbalanceamento Desalinhamento 6 Variações de Holdout Separação levando em consideração as velocidades de rotação da máquina 7 Variações de Hold out Considerando períodos distintos de medição 8 KFold Com treinamento e teste 9 KFold com repetição Para uma maior confiabilidade nos resultados Executase o Kfold repetidas vezes Recomendado para datasets pequenos Exemplos típicos Repetição de 5x5fold 25 rodadas Repetição de de 10x5fold 50 rodadas 10 KFold com repetição Com treinamento e teste X 11 KFold Resposta do modelo Fonte Scaccia 2020 Adaptada Com treinamento validação e teste 12 Separando a base de dados usando o Classification Learner 13 Carregando as características 14 Abrindo o classification learner 15 Iniciando a criação do modelo 16 Escolhendo a forma de separação dos dados 17 Códigos no Matlab 18 Exemplo Kfold treinamentoteste 19 20 21 Exemplo Kfold treinamento validação teste 22 Exemplo Kfold treinamento validação teste 23 Exemplo Kfold treinamento validação teste 24 Exemplo Kfold treinamento validação teste 25 Escalonamento de características 26 É uma forma de padronizar a faixa de valores das características Não deve ser aplicada sem antes realizar separação dos conjuntos de treinamento e teste Escalonamento de características 27 Técnicas Minmax scaling zscore normalization 28 Exemplo da influência da normalização de características KNN sem normalização de características KNN com normalização de características 29 Escalonamento de dados no Classification Learner 30 Exemplo no Matlab 31 NAKATSU Robbie T An evaluation of four resampling methods used in machine learning classification IEEE Intelligent Systems v 36 n 3 p 5157 2020 Scaccia Kevin Validação Cruzada Aninhada com Scikitlearn 2020 Disponível em httpsdatamlcombrvalidacaocruzadaaninhadacomscikitlearn Referências bibliográficas