Treinamento para aprendizagem de máquina
Uma técnica de amostragem para a validação de algoritmos é o método holdout. Nessa estratégia, divide-se o conjunto de dados em diferentes proporções para o treinamento e para o teste. Um problema comum com esse tipo de estratégia é a possível dependência da partição adotada para o treino e/ou teste.
Escolha a resposta:
A) Para que os resultados apresentem menor dependência da partição, pode-se utilizar a seleção adequada para os objetos que irão para o conjunto de teste, de modo a avaliarmos o algoritmo com precisão para esses objetos.
B) Para que os resultados apresentem menor dependência da partição, pode-se utilizar o método de random subsampling, no qual as partições são formadas aleatoriamente a partir dos dados disponíveis.
C) Para que os resultados apresentem menor dependência da partição, pode-se utilizar uma proporção de 50% para o treino e 50% para o teste, garantindo, assim, maior relação entre as amostras.
D) Para que os resultados apresentem menor dependência da partição, pode-se utilizar uma seleção dos objetos da base, de modo a treinar o algoritmo para os dados mais representativos.
E) Para que os resultados apresentem menor dependência da partição, pode-se utilizar todos os objetos da base para o treinamento e a avaliação do algoritmo.