·

Cursos Gerais ·

Estatísticas Aplicadas

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Usuário\nEBERSON COSTA\nCurso\nGRA1561 ESTATÍSTICA APLICADA AO DATA SCIENCE GR08090-212-3 - 2021210.ead-12276.04\nTeste\nATIVIDADE 4(4)\nTítulo\nATIVIDADE 4\nData\n29/11/21 20:05\nEnviado\n02/12/21 19:10\nStatus\nCompletada\nResultado da tentativa\n9 em 10 pontos\nTempo decorrido\n71 horas, 4 minutos\nRespostas exibidas\nRespostas enviadas, Respostas corretas, Comentários\nPergunta 1 1 em 1 pontos\nEm uma análise de agrupamento examinamos os dados observados (as linhas da tabela com os dados) e procuramos identificar, através de similaridade, aqueles que estão mais próximos entre si, e formamos grupos com observações similares. Quando são apenas 2 variáveis e pois pequenas (tamanho da amostra pequeno), por exemplo 10, podemos tentar fazer o agrupamento visualmente.\nA figura a seguir é a alternativa que indica a menor quantidade de grupos que você naturalmente formaria para este caso:\nFigura - Massa corporal (kg)\nFonte: Elaborada pelo autor\nResposta Selecionada: Dois grupos, um com 6 indivíduos e outro com 4 indivíduos.\nResposta Correta: Dois grupos, com 6 indivíduos e outro com 4 indivíduos.\nComentário da resposta:\nResposta correta. A questão solicita a alternativa com o menor número de grupos que você naturalmente formaria. Há alternativas que indicam a maior quantidade (e que parecem ser mais natural e é aqui que 4 indivíduos do lado esquerdo e 6 do direito são, pois as alternativas com dois grupos não são tão naturais quanto essa opção.\nPergunta 2 1 em 1 pontos\nA escolha de grupos formados por um algoritmo de agrupamento hierárquico pode ser feita por meio da leitura do dendrograma resultante. Escolha-se a altura (Height) desejada, e se traça uma linha horizontal a partir dessa altura, que cruzará com as linhas verticais dos grupos formados nesta. O cientista de dados decide se esses grupos são adequados para a sua análise.\nVeja, por exemplo, a figura abaixo.\nFigura - Dendrograma do agrupamento de oito estados\nFonte: Elaborada pelo autor\n Com respeito da leitura deste dendrograma, analise as afirmativas a seguir e assinale V para as(ais) Verdadeira(s) e F para as(ais) Falsas).\n(I) A altura 4 cruza com duas linhas verticais, que indicam dois grupos, o primeiro deles formado pelos estados (Connecticut, Delaware), e o segundo formado pelos estados (Colorado, Arizona, Califórnia, Alasca, Alabama, Arkansas).\n(II) A altura 4 cruza com três linhas verticais, que indicam três grupos, o primeiro deles formado pelos estados (Connecticut, Delaware), o segundo formado pelos estados (Colorado, Arizona, Califórnia), e o terceiro formado pelos estados (Alasca, Alabama, Arkansas).\n(III) A altura 4 cruza com quatro linhas verticais, que indicam quatro grupos, o primeiro deles formado pelos estados (Connecticut, Delaware), o segundo formado pelos estados (Colorado, Arizona, Califórnia), o terceiro formado pelos estados (Alasca, Alabama, Arkansas).\nResposta Selecionada: V, F, V, F, F.\nResposta Correta: V, F, V, F, F.\nComentário da resposta:\nResposta correta. A afirmação está correta. A altura 4 cruza com duas linhas verticais, que indicam dois grupos, o primeiro deles formado pelos estados (Connecticut, Delaware), e o segundo formado pelos estados (Colorado, Arizona, Califórnia). \n Pergunta 3\nLeia o excerto a seguir:\n\"A ciência dos dados é uma fusão de múltiplas disciplinas, incluindo estatística, ciência da computação, tecnologia da informação e campos de negócios. Isso significa que não existe uma abordagem única para se referir a um dado conceito.\"\nPois\n\"A estatística, ao seu modo profundo, a matemática como pilar do seu desenvolvimento. É considerada a ciência mais sutil, e a mais ampla, quanto o assunto são dados. É usada por todas áreas científicas.\"\nResposta Selecionada:\nAs asserções I e II são proposições verdadeiras, e II é uma justificativa correta da I.\nResposta Correta:\nAs asserções I e II são proposições verdadeiras, e II é uma justificativa correta da I.\nComentário da resposta:\nSua resposta está incorreta, pois embora as afirmações sejam sobre métodos de aprendizado supervisionado, na realidade são métodos não supervisionados. Os métodos de concurso podem ser usados em diversos problemas propostos. \n Pergunta 8:\nLeia o excerto a seguir:\n\"Normalização: É comum normalizar [padorizar] variáveis contínuas através da subtração da média e divisão pelo desvio-padrão, eu então as variáveis em grande escala dominarão o processo de agrupamento (veja Padronização (Normalização, Escoros 2), no Capítulo 6).\"\n\nBRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p. 265.\nA partir do exato, analise as assertivas a seguir e a relação proposta entre elas.\n\nI. Sabemos que, na estatística ou na ciência dos dados, é comum normalizar [padorizar] variáveis quantitativas, ou variáveis contínuas, antes da realização da análise de agrupamento.\nII. No conjunto de dados observados (a amostra de dados), podem existir variáveis que estão em uma escala maior que as outras, e a medida de distância entre observações dessas variáveis dominarão o resultado da análise de agregação, na formação dos grupos de observações semelhantes entre si.\n\nResposta Selecionada:\nI. As assertivas I e II são proposições verdadeiras, e II é uma justificativa correta da I.\n\nResposta Correta:\nResposta correta. A alternativa está correta. Na estatística dos dados, é comum normalizar [padorizar] variáveis quantitativas, ou variáveis contínuas, proporcionando equilíbrio entre as variáveis para que nenhuma domine o resultado da análise de agrupamento.\n\nPergunta 9:\nQuando os dados se referem a múltiplas variáveis quantitativas, é possível exibir múltiplos gráficos de dispersão entre pares dessas variáveis, usando R. No software estatístico R, isto pode ser feito com a função gráfico pairs(). Abaixo apresentamos um output típico de função pairs() quando aplicada a quatro variáveis quantitativas de um determinado conjunto de dados.\n\n(Figura 4: Múltiplos gráficos de dispersão entre as variáveis de USArest)\nFonte: Elaborada pelo autor.\n\nA respeito deste output típico da função gráficos pairs() do software estatístico R, para a exibição de múltiplos gráficos de dispersão entre variáveis quantitativas, analise as afirmativas a seguir e assinale V para as (Verdadeiras) e F para as (Falsas).\n\nI. ( ) O gráfico de e = Murder versus x = Assault mostra uma tendência de aumento de Murder para um aumento de Assault.\nII. ( ) O gráfico de e = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma tendência clara de subida ou descida.\nIII. ( ) O gráfico de e = Murder versus x = Rape mostra uma tendência de aumento de Murder para um aumento de Rape, apresentando um ponto maior que para o caso de e = Murder versus x = Assault.\nIV. ( ) Como são quatro variáveis (Murder, Assault, UrbanPop e Rape), existem ao total 12 gráficos de dispersão, se contarmos todos os gráficos entre as quatro variáveis.\n\nResposta Selecionada: V, V, V, F.\nResposta Correta: V, V, V, V.\n\nComentário:\nResposta correta. A alternativa está correta. O gráfico de e = Murder versus x = Assault de fato mostra uma tendência de aumento de Murder para um aumento de Assault, assim como gráfico de e = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma tendência clara de subida ou descida. O gráfico de e = Murder versus x = Rape mostra uma tendência de aumento de Murder para um aumento de Rape apresentando um ponto maior que para o caso de e = Murder versus x = Assault, é como outras variáveis quantitativas, esta também terá 12 gráficos de dispersão, se contarmos todas as combinações entre essas três. Pergunta 10:\nLeia o excerto a seguir sobre as ideias-chave para agrupamento hierárquico:\n\"Começa como todos os registros. Progresivamente, os grupos são unidos aos grupos próximos até que todos os registros pertençam a um único grupo. O histórico de agrupamento é retido o plotado, e o usuário pode visualizar a estrutura dos grupos diferentes. As distâncias inseguras são calculadas de diferentes formas, todas baseadas no conjunto de distância inter-registros.\"\n\nBRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p. 278.\nA partir do apresentado, analise as assertivas a seguir e a relação proposta entre elas.\n\nI. O algoritmo começa com grupos formados por registros individuais e, progressivamente, os grupos são unidos aos grupos mais próximos, até que todos os registros formam um único grupo.\n\nResposta Selecionada:\nA assertiva I a seguir é a relação proposta verdadeira.\n\nResposta Correta:\nA assertiva I é uma proposição falsa, e II é uma proposição verdadeira.\n\nComentário:\nResposta correta. A alternativa está correta, pois no agrupamento hierárquico, deve-se requerer ao agrupamento k-médias, ou similar, conforme a quantidade de grupos a serem formados. A assertiva I está incorreta, pois os registros não devem formar vários grupos semelhantes entre si, mas sim formar um único cluster, onde todos formam uma totalidade e não se justapaem ou se assemelham entre si. Um agrupamento hierárquico precisa examinar as distâncias, a estratégia de distância se faz em um grupo, não há como delas contar os outros.\n Pergunta 7\nDe forma agrupamos grupos de observações de um conjunto de dados (amostra), por meio de um algoritmo de agrupamento, podemos dar nomes aos mesmos, e cada indivíduo de cada grupo será classificado de acordo como esse nome. O erro terá isso como naturalidade.\nPermitir agrupar e, dependendo de grupos, os grupos são formados na natureza, como animais vertebrados ou invertebrados, carros ou aviões, homens ou mulheres.\nAo analisarem a assertiva, analise as a seguir e a relação proposta entre elas, e assinale a alternativa correta:\n(I) Ao usarmos de algoritmos de agrupamento, depois de formados e nomeados (classificados) os grupos de observações resultantes do algoritmo, não é possível usar esses classes como variáveis resposta e, a partir deste ponto, executar tarefas preditivas com algoritmos de classificação.\n(II) Algoritmos de agrupamento fazem parte dos métodos da chamada aprendizado não supervisionado. Não são modelos preditivos.\nResposta Selecionada: A asserção I é verdadeira, e II é uma proposição verdadeira.\nResposta Correta:\nA asserção I é uma proposição falsa, e II é uma proposição verdadeira.\nComentário da resposta:\nResposta correta. A alternativa está correta, pois a asserção I, de fato, deve ser reanalisada ao asseverar.Inicialmente. Os grupos de observações are classification, as respostas a partir desses elementos são modelos preditivos de algoritmos de classificação.