·
Ciências Contábeis ·
Métodos Quantitativos Aplicados
Send your question to AI and receive an answer instantly
Recommended for you
14
Testes de Hipótese em Regressão Linear e Análise de Correlação
Métodos Quantitativos Aplicados
UMG
1
Teste de Hipótese - Cálculo da Estatística e Análise de Rejeição
Métodos Quantitativos Aplicados
UMG
1
Análise de Correspondência e Cluster: Questões e Alternativas
Métodos Quantitativos Aplicados
UMG
13
Métodos Quantitativos: Introdução à Regressão Linear Simples
Métodos Quantitativos Aplicados
UMG
14
Métodos Quantitativos: Testes Não Paramétricos - Parte 1
Métodos Quantitativos Aplicados
UMG
14
Testes Não Paramétricos: Mann-Whitney e Kruskal-Wallis
Métodos Quantitativos Aplicados
UMG
19
Métodos Quantitativos: Testes Paramétricos e Objetivos de Aprendizagem
Métodos Quantitativos Aplicados
UMG
7
Avaliação Métodos Quantitativos - Testes de Hipóteses e Intervalo de Confiança
Métodos Quantitativos Aplicados
UMG
3
Analise Estatistica e Regressao - Dados de Pilotos da NASCAR 2011
Métodos Quantitativos Aplicados
UMG
10
Avaliacao Metodos Quantitativos - Testes de Hipoteses e Intervalo de Confianca
Métodos Quantitativos Aplicados
UMG
Preview text
MÉTODOS QUANTITATIVOS Profª Fabiana Lopes da Silva 2 ANÁLISE DE CONGLOMERADOS CLUSTER 3 OBJETIVOS DE APRENDIZAGEM Introduzir a técnica de Análise de Conglomerados Clusters 4 SUMÁRIO 1 Introdução 2 Etapas para elaboração da técnica 21 Padronização de variáveis 22 Medidas de Similaridade ou Distância Dissimilaridade 23 Método de Agrupamento 5 1 INTRODUÇÃO De acordo com Hair et al 2009 a análise de agrupamentos ou conglomerados é um grupo de técnicas multivariadas cuja finalidade principal é agregar objetos com base nas características que eles possuem Especificamente a ideia principal é agrupar objetos com base em suas próprias características buscando assim sua estrutura natural FÁVERO et al 2009 Ou seja é uma técnica que permite segmentar elementos em grupos homogêneos internamente heterogêneos entre si segundo algum critério e a partir de um grupo de informações FÁVERO et al 2009 A técnica classifica objetos por exemplo respondentes produtos ou outras entidades de modo que cada um é semelhante aos outros no agrupamento com base em um conjunto de características selecionadas Hair et al 2009 Assim Agrupamentos resultantes de objetos devem então exibir elevada homogeneidade interna dentro dos agrupamentos e elevada heterogeneidade externa entre agrupamentos Assim se a classificação for bemsucedida os objetos dentro dos agrupamentos estarão próximos quando representados graficamente e diferentes agrupamentos estarão distantes Segundo Fávero et al 2009 a técnica pode ser utilizada por exemplo nas seguintes áreas Contabilidade divisão de empresas em grupos em função de indicadores de liquidez margens e características de governança Economia segmentação de países por semelhança de índices de desemprego distribuição de renda taxas de juros cargas tributárias etc Administração agregar escolas por semelhança de indicadores educacionais taxas de evasão índices de alunos em reavaliação etc 6 2 ETAPAS PARA ELABORAÇÃO DA TÉCNICA Basicamente a análise de conglomerados pode ser dividida nas seguintes etapas Fávero et al 2009 a Análise das variáveis e dos objetos a serem agrupados seleção de variáveis identificação de outliers e padronização b Seleção da medida de distância ou semelhança entre cada par de objetos c Seleção do algoritmo de agrupamento método hierárquico ou nãohierárquico d Escolha da quantidade de agrupamentos formados e Interpretação e validação dos agrupamentos A seguir vamos explorar aspectos relacionados à padronização de variáveis medidas de distância e métodos de agrupamento 21 Padronização de variáveis Em relação à padronização da variável a forma mais utilizada para padronização dos dados consiste em transformar cada variável em escore padrão Z escore permitindo que seja eliminado o viés decorrente das diferenças de escalas O método de Z escore padroniza cada variável x de maneira a apresentar média zero e desvio padrão 1 sendo calculado da seguinte maneira Devese também observar que a seleção das variáveis deve ser feita com cuidado pois os grupos refletirão a estrutura inerente das variáveis escolhidas Assim devese analisar se há possíveis dados muito discrepantes outliers que poderão influenciar no resultado 22 Medidas de Similaridade ou Distância Dissimilaridade Na análise de conglomerados as observações são agrupadas segundo algum tipo de métrica de distância e as variáveis são agrupadas conforme medidas de correlação ou associação FÁVERO et al 2009 Assim as medidas de distância são consideradas medidas de dissimilaridade pois quanto maiores os valores menor será a semelhança entre os objetos Dentre as medidas destacamos a 7 Distância Quadrática Euclidiana A Distância Quadrática Euclidiana representa a distância entre duas observações x e y e corresponde a soma dos quadrados das diferenças entre x e y para todas as p variáveis Assim quanto menor a distância mais próximos estarão os elementos 23 Método de Agrupamento É necessário determinar o algoritmo que fará o processo de agrupamento Ou seja a formação dos grupos decorre do critério de distância entre os vetores de dados e em função do método de agregação escolhido Análise de conglomerados hierárquicos Análise de conglomerados kmédias Na análise de conglomerados hierárquicos no início cada elemento é isolado em um conglomerado cluster em seguida há agregações de clusters chegando no final a 1 cluster apenas com todos os elementos Dentre os algoritmos temos Fávero et al 2009 Menor Distância ou Ligação Individual Single Linkage ou Nearest Neighbor baseiase na distância mínima entre dois grupos de elementos buscando agrupar inicialmente os objetos separados pela menor distância Maior Distância ou Ligação Completa Complete Linkage ou Furthest Neighbor baseiase na distância máxima ao contrário do método de ligação individual Distância Média ou Ligação Média Average Linkage ou Between Groups trata a distância entre dois grupos como sendo a distância média entre todos os pares de indivíduos dos dois grupos buscando agrupar os agregados cuja distância média é a menor Centroide Centroid baseiase na distância entre os centroides priorizando a menor distância entre eles Já a análise de conglomerados não hierárquico kmédias é utilizada para um volume grande de dados amostra grande eou número grande de variáveis Neste método é preciso definir a priori o número de conglomerados Em geral usase uma subamostra e o método 8 hierárquico para se obter uma estimativa deste número Fávero et al 2009 Veja um exemplo prático da aplicação da técnica de análise de conglomerados no material da aulachat INDICAÇÃO DE LEITURA OBRIGATÓRIA HAIR et al Análise Multivariada de Dados 6a ed Porto Alegre Bookman 2009 Capítulo 8 9 FIPECAFI Todos os direitos reservados A FIPECAFI assegura a proteção das informações contidas nesse material pelas leis e normas que regulamentam os direitos autorais marcas registradas e patentes Todos os textos imagens sons vídeos eou aplicativos exibidos nesse volume são protegidos pelos direitos autorais não sendo permitidas modificações reproduções transmissões cópias distribuições ou quaisquer outras formas de utilização para fins comerciais ou educacionais sem o consentimento prévio e formal da FIPECAFI CRÉDITOS Autoria Fabiana Lopes da Silva Coordenação de Operações Juliana Nascimento Design Instrucional Patricia Brasil Design Gráfico e Diagramação Dejailson Markes Captação e Produção de Mídias Erika Alves Gabriel Rodrigues Gabriel dos Santos e Mauricio Leme Revisão de Texto Patricia Brasil REFERÊNCIAS HAIR et al Análise Multivariada de Dados 6 Ed Porto Alegre Bookman 2009 FÁVERO Luiz Paulo BELFIORE Patrícia SILVA Fabiana Lopes da CHAN Betty Lilian Análise de Dados Modelagem Multivariada para Tomada de Decisões Rio de Janeiro Elsevier 2009
Send your question to AI and receive an answer instantly
Recommended for you
14
Testes de Hipótese em Regressão Linear e Análise de Correlação
Métodos Quantitativos Aplicados
UMG
1
Teste de Hipótese - Cálculo da Estatística e Análise de Rejeição
Métodos Quantitativos Aplicados
UMG
1
Análise de Correspondência e Cluster: Questões e Alternativas
Métodos Quantitativos Aplicados
UMG
13
Métodos Quantitativos: Introdução à Regressão Linear Simples
Métodos Quantitativos Aplicados
UMG
14
Métodos Quantitativos: Testes Não Paramétricos - Parte 1
Métodos Quantitativos Aplicados
UMG
14
Testes Não Paramétricos: Mann-Whitney e Kruskal-Wallis
Métodos Quantitativos Aplicados
UMG
19
Métodos Quantitativos: Testes Paramétricos e Objetivos de Aprendizagem
Métodos Quantitativos Aplicados
UMG
7
Avaliação Métodos Quantitativos - Testes de Hipóteses e Intervalo de Confiança
Métodos Quantitativos Aplicados
UMG
3
Analise Estatistica e Regressao - Dados de Pilotos da NASCAR 2011
Métodos Quantitativos Aplicados
UMG
10
Avaliacao Metodos Quantitativos - Testes de Hipoteses e Intervalo de Confianca
Métodos Quantitativos Aplicados
UMG
Preview text
MÉTODOS QUANTITATIVOS Profª Fabiana Lopes da Silva 2 ANÁLISE DE CONGLOMERADOS CLUSTER 3 OBJETIVOS DE APRENDIZAGEM Introduzir a técnica de Análise de Conglomerados Clusters 4 SUMÁRIO 1 Introdução 2 Etapas para elaboração da técnica 21 Padronização de variáveis 22 Medidas de Similaridade ou Distância Dissimilaridade 23 Método de Agrupamento 5 1 INTRODUÇÃO De acordo com Hair et al 2009 a análise de agrupamentos ou conglomerados é um grupo de técnicas multivariadas cuja finalidade principal é agregar objetos com base nas características que eles possuem Especificamente a ideia principal é agrupar objetos com base em suas próprias características buscando assim sua estrutura natural FÁVERO et al 2009 Ou seja é uma técnica que permite segmentar elementos em grupos homogêneos internamente heterogêneos entre si segundo algum critério e a partir de um grupo de informações FÁVERO et al 2009 A técnica classifica objetos por exemplo respondentes produtos ou outras entidades de modo que cada um é semelhante aos outros no agrupamento com base em um conjunto de características selecionadas Hair et al 2009 Assim Agrupamentos resultantes de objetos devem então exibir elevada homogeneidade interna dentro dos agrupamentos e elevada heterogeneidade externa entre agrupamentos Assim se a classificação for bemsucedida os objetos dentro dos agrupamentos estarão próximos quando representados graficamente e diferentes agrupamentos estarão distantes Segundo Fávero et al 2009 a técnica pode ser utilizada por exemplo nas seguintes áreas Contabilidade divisão de empresas em grupos em função de indicadores de liquidez margens e características de governança Economia segmentação de países por semelhança de índices de desemprego distribuição de renda taxas de juros cargas tributárias etc Administração agregar escolas por semelhança de indicadores educacionais taxas de evasão índices de alunos em reavaliação etc 6 2 ETAPAS PARA ELABORAÇÃO DA TÉCNICA Basicamente a análise de conglomerados pode ser dividida nas seguintes etapas Fávero et al 2009 a Análise das variáveis e dos objetos a serem agrupados seleção de variáveis identificação de outliers e padronização b Seleção da medida de distância ou semelhança entre cada par de objetos c Seleção do algoritmo de agrupamento método hierárquico ou nãohierárquico d Escolha da quantidade de agrupamentos formados e Interpretação e validação dos agrupamentos A seguir vamos explorar aspectos relacionados à padronização de variáveis medidas de distância e métodos de agrupamento 21 Padronização de variáveis Em relação à padronização da variável a forma mais utilizada para padronização dos dados consiste em transformar cada variável em escore padrão Z escore permitindo que seja eliminado o viés decorrente das diferenças de escalas O método de Z escore padroniza cada variável x de maneira a apresentar média zero e desvio padrão 1 sendo calculado da seguinte maneira Devese também observar que a seleção das variáveis deve ser feita com cuidado pois os grupos refletirão a estrutura inerente das variáveis escolhidas Assim devese analisar se há possíveis dados muito discrepantes outliers que poderão influenciar no resultado 22 Medidas de Similaridade ou Distância Dissimilaridade Na análise de conglomerados as observações são agrupadas segundo algum tipo de métrica de distância e as variáveis são agrupadas conforme medidas de correlação ou associação FÁVERO et al 2009 Assim as medidas de distância são consideradas medidas de dissimilaridade pois quanto maiores os valores menor será a semelhança entre os objetos Dentre as medidas destacamos a 7 Distância Quadrática Euclidiana A Distância Quadrática Euclidiana representa a distância entre duas observações x e y e corresponde a soma dos quadrados das diferenças entre x e y para todas as p variáveis Assim quanto menor a distância mais próximos estarão os elementos 23 Método de Agrupamento É necessário determinar o algoritmo que fará o processo de agrupamento Ou seja a formação dos grupos decorre do critério de distância entre os vetores de dados e em função do método de agregação escolhido Análise de conglomerados hierárquicos Análise de conglomerados kmédias Na análise de conglomerados hierárquicos no início cada elemento é isolado em um conglomerado cluster em seguida há agregações de clusters chegando no final a 1 cluster apenas com todos os elementos Dentre os algoritmos temos Fávero et al 2009 Menor Distância ou Ligação Individual Single Linkage ou Nearest Neighbor baseiase na distância mínima entre dois grupos de elementos buscando agrupar inicialmente os objetos separados pela menor distância Maior Distância ou Ligação Completa Complete Linkage ou Furthest Neighbor baseiase na distância máxima ao contrário do método de ligação individual Distância Média ou Ligação Média Average Linkage ou Between Groups trata a distância entre dois grupos como sendo a distância média entre todos os pares de indivíduos dos dois grupos buscando agrupar os agregados cuja distância média é a menor Centroide Centroid baseiase na distância entre os centroides priorizando a menor distância entre eles Já a análise de conglomerados não hierárquico kmédias é utilizada para um volume grande de dados amostra grande eou número grande de variáveis Neste método é preciso definir a priori o número de conglomerados Em geral usase uma subamostra e o método 8 hierárquico para se obter uma estimativa deste número Fávero et al 2009 Veja um exemplo prático da aplicação da técnica de análise de conglomerados no material da aulachat INDICAÇÃO DE LEITURA OBRIGATÓRIA HAIR et al Análise Multivariada de Dados 6a ed Porto Alegre Bookman 2009 Capítulo 8 9 FIPECAFI Todos os direitos reservados A FIPECAFI assegura a proteção das informações contidas nesse material pelas leis e normas que regulamentam os direitos autorais marcas registradas e patentes Todos os textos imagens sons vídeos eou aplicativos exibidos nesse volume são protegidos pelos direitos autorais não sendo permitidas modificações reproduções transmissões cópias distribuições ou quaisquer outras formas de utilização para fins comerciais ou educacionais sem o consentimento prévio e formal da FIPECAFI CRÉDITOS Autoria Fabiana Lopes da Silva Coordenação de Operações Juliana Nascimento Design Instrucional Patricia Brasil Design Gráfico e Diagramação Dejailson Markes Captação e Produção de Mídias Erika Alves Gabriel Rodrigues Gabriel dos Santos e Mauricio Leme Revisão de Texto Patricia Brasil REFERÊNCIAS HAIR et al Análise Multivariada de Dados 6 Ed Porto Alegre Bookman 2009 FÁVERO Luiz Paulo BELFIORE Patrícia SILVA Fabiana Lopes da CHAN Betty Lilian Análise de Dados Modelagem Multivariada para Tomada de Decisões Rio de Janeiro Elsevier 2009