36
Métodos Quantitativos Aplicados
MACKENZIE
21
Métodos Quantitativos Aplicados
MACKENZIE
2
Métodos Quantitativos Aplicados
MACKENZIE
56
Métodos Quantitativos Aplicados
MACKENZIE
29
Métodos Quantitativos Aplicados
MACKENZIE
44
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
3
Métodos Quantitativos Aplicados
MACKENZIE
45
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
Texto de pré-visualização
Métodos Quantitativos em Processos Decisórios Transformação de variáveis e Distribuição Normal Profa Anna Célia Affonso dos Santos Transformação de variáveis Processo de criação de indicadores a partir de outras variáveis da base de dados Para cada observação ou objeto da base de dados posso criar uma novo atributo coluna baseado nos atributos existentes Maior agilidade no uso do dado já formatado melhoria na performance dos dashboards EXEMPLO 1 2 3 4 5 6 Enter Calculando IMC no Jamovi Abrir aquivo Atividades Físicas no Jamovi Em Dados opção Calcular escrever a fórmula do IMC peso altura1002 Análise descritiva da variável IMC 1 2 3 Padronização de Variáveis Tratase de um procedimento para possibilitar a comparação de variáveis que apresentam Medidas extraídas em diferentes situações Medidas em diferentes ordens de grandeza eou Padronização Medidas extraídas em diferentes situação Exemplo Desempenho de um aluno em duas disciplinas A e B nas quais as notas máximas foram 6 e 9 Em qual disciplina o aluno foi melhor 𝑋 𝑚á𝑥𝑖𝑚𝑜 ALUNO DISCIPLINA A DISCIPLINA B 1 6 5 2 5 6 3 45 65 4 45 9 Padronização Medidas retiradas em diferentes situação Aluno Transformação Máximo Disciplina A Transformação Máximo Disciplina B 1 1 057 2 083 067 3 075 072 4 075 1 Os alunos 123 foram melhores na disciplina A e o aluno 4 na disciplina B ALUNO DISCIPLINA A DISCIPLINA B 1 6 5 2 5 6 3 45 65 4 45 9 Exemplo Desempenho de funcionários em dois treinamentos com as seguintes médias e desviospadrão Treinamento A Média65 e dp 12 Treinamento B Média55 e dp08 Em qual desses treinamentos um funcionário com notas 7 e 6 em A e B respectivamente obteve melhor desempenho 𝑥 𝑚é𝑑𝑖𝑎 desvio padrão Padronização Medidas retiradas em diferentes situação Exemplo Desempenho de funcionários em dois treinamentos com as seguintes médias e desviospadrão Treinamento A Média65 e dp 12 Treinamento B Média55 e dp08 A 765 12 0417 B 655 08 0625 Padronização Medidas retiradas em diferentes situação O desempenho do funcionário foi melhor em B Padronização Medidas retiradas em diferentes ordens de grandeza EXEMPLO Ambiente Bancário Variáveis Volume médio de mensal de empréstimos Bilhões Número de agências Dezenas Investimento percentual em marketing investimentoreceita Decimal Quais bancos possuem indicadores superiores em todas as variáveis 𝑥 𝑚é𝑑𝑖𝑎 desvio padrão VAMOS RESOLVER JUNTOS ABRA NO EXCEL O ARQUIVO Padronização Bancosxls Transformações possíveis para padronização da variável A variável padronizada terá média 0 e desviopadrão 1 Z Score A variável padronizada terá amplitude 1 Range 1 A variável padronizada terá amplitude 1 Range 1 A variável padronizada terá máximo igual a 1 Máxima magnitude A variável padronizada terá media 1 Média A variável padronizada terá desviopadrão 1 Desvio Padrão 𝑋 𝑚é𝑑𝑖𝑎 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑋 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑡𝑜𝑡𝑎𝑙 𝑋 𝑚í𝑛𝑖𝑚𝑜 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑋 𝑚á𝑥𝑖𝑚𝑜 𝑋 𝑀é𝑑𝑖𝑎 𝑋 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 Escorez O escorez muitas vezes é denominado valor padronizado Pode ser interpretado como o número de desvios padrão que xi está afastado da média Se z1 1 indica que x1 é 1 desvio padrão maior que média amostral Se z2 05 indica que x2 é 05 desvio padrão menor que a média amostral Um escorez igual a zero indica que o valor da observação é igual à média Regra empírica Para dados que têm uma distribuição em formato de sino quase todos os valores estarão contidos entre três desvios padrão da média Regra de Ouro Detecção de valores atípicos outliers Um conjunto de dados às vezes possui uma ou mais observações com valores muito grandes ou pequenos Estes valores são chamados outliers Um outlier pode ser um valor que foi incorretamente registrado e deve ser corrigido ou retirado da amostra Valores padronizados escoresz podem ser utilizados para identificar outliers Qualquer valor com um escorez menor que 3 ou maior que 3 deve ser considerado um outlier Variável padronizada por EscoreZ Então o que quer dizer que uma variável foi padronizada A média da variável é zero e o desvio padão é 1 CURVA NORMAL PADRÃO 10 20 30 40 50 60 70 80 Idade em anos 0 10 20 30 40 50 60 70 Frequency Mean 4142 Std Dev 12209 N 1000 Histogram Média 4142 anos Desvio padrão 12209 anos Unidade de media anos 3000 2000 1000 000 1000 2000 3000 4000 padronidademedia 0 10 20 30 40 50 60 70 Frequency Mean 21858E15 Std Dev 1220863 N 1000 Histogram Padronizando pela média centralizar a distribuição na média zero Basta subtrair a média de cada observação Não altera o formato da distribuição 200000 100000 000000 100000 200000 300000 Zscore Idade em anos 0 10 20 30 40 50 60 70 Frequency Mean 23292999E15 Std Dev 100000 N 1000 Histogram Mantém o formato da distribuição após a padronização dos dados pelo Z xi xbar s Média zero Desvio padrão 1 Unidade de medida desvios padrões Valores acima de 3 desvios poderiam ser considerados outliers Exercitando httpscloudjamoviorg Exemplo IMC Data idade 22 24 14 Setup Compute Transform TRANSFORMED VARIABLE Zidade Source variable idade using transform None Create New Transform Exemplo IMC Transform 1 PadronizaZ Add recode condition source Functions MIN RANK SCALE STDEV SUM VMAX SCALE variable groupby0 Returns the normalized values of a set of numbers SCALEsource Coluna nova Podemos usar essa transformação para outras variáveis Exemplo IMC atividadesfisicassav padronize IMC altura Há outliers z 3 1 2 A transformação já está pronta basta usála Exemplo IMC Medidas de Forma Além das medidas de variabilidade amplitude variância desvio padrão as medidas de forma ajudam a compreender a natureza da distribuição ASSIMETRIA CURTOSE Mede a simetria da distribuição em relação à média Medida do achatamento relativo da curva definida pela distribuição de frequência Assimetria Skewness Assimetria alongada à direita assimetria positiva Curtose kurtosis Achatamento Platicúrtica Mesocúrtica normal Leptocúrtica Tipos de curva Assimétrica à direita ou assimetria positiva Simétrica Assimétrica à esquerda ou assimetria negativa Leptocúrtica Mesocúrtica Platicúrtica Bimodal Unimodal Multimodal Variável aleatória Uma variável aleatória é uma descrição numérica do resultado de um experimento Pode ser classificada como discreta ou contínua DISCRETA CONTÍNUA Assume um valor finito entre os 0 1 2 3 Ex Número de carros que chegam a um pedágio Número de clientes que realizam um pedido de compra Gênero do cliente Assume um valor numérico em um intervalo Ex Tempo na fila de atendimento Distância percorrida em um dia Quantidade em ml Porcentagem de conclusão do projeto depois de seis meses Temperatura quando ocorre a reação desejada Distribuição de probabilidade Descreve como as probabilidade estão distribuídas sobre os valores da variável aleatória Quando eu conheço o tipo de distribuição de probabilidade da variável posso determinar a probabilidade de uma série de eventos ocorrer que sejam do interesse do tomador de decisão DISCRETA CONTÍNUA Tipos de distribuição de probabilidade Uniforme discreta Binomial Poisson Tipos de distribuição de probabilidade Uniforme Normal Exponencial Distribuição Normal A mais importante distribuição de probabilidade para descrever uma variável aleatória contínua Descreve uma ampla variedade de conceitos como altura e peso das pessoas notas de exames medições científicas Caraterísticas da distribuição normal É diferenciada por dois parâmetros sua média µ e seu desvio padrão σ O ponto máximo da normal está na média que é também a mediana e a moda da distribuição A média pode ser qualquer valor numérico negativo zero ou positivo A distribuição normal é simétrica Caraterísticas da distribuição normal O desvio padrão determina quanto uma curva é achatada ou larga As probabilidades da variável aleatória normal são dadas por áreas sob a curva A área total sob a curva é 1 As porcentagens de valores de alguns intervalos bastante usados 683 para mais ou menos 1 desvipadrão 954 para mais ou menos 2 desvios padrão 997 para mais ou menos 3 desvios padrão Como determinar se os dados seguem uma distribuição normal 1000 2000 3000 4000 5000 6000 simulaIDADE 0 20 40 60 80 100 Frequency Mean 401665 Std Dev 962186 N 1000 1 2 3 4 5 Você está satisfeito no trabalho 0 50 100 150 200 250 300 Frequency Mean 305 Std Dev 1348 N 1000 Esse é um dos problemas quando trabalhamos com dados ordinais Através da visualização dos dados 000 20000 40000 60000 80000 100000 Renda familiar em milhares de dólares 0 100 200 300 400 500 Frequency Mean 72911 Std Dev 9341354 N 1000 Visualmente já percebemos a assimetria Inserir curva Normalna visualização É normal Selecionar Histograma e densidade Praticando no Jamovi Normalidade e outlier Média 000000000172 dp 100 Medida em desvios padrões Outliers Normal Arquivo VestibularIES Variável Nota em Matemática População Mesmo que a população tenha distribuição normal De amostra para amostra teremos resultados diferentes Abrir o conjunto de dados vestibulares Dados Calcular 1 2 3 Demonstrando no Jamovi Abrir o conjunto de dados vestibulares Dados Colcular 3 Enter Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N1162 Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N100 Próxima aula Inferência Estatística Uso de testes estatísticos para determiner a partir da amostra a característica da população Obrigada annasantosmackenziebr
36
Métodos Quantitativos Aplicados
MACKENZIE
21
Métodos Quantitativos Aplicados
MACKENZIE
2
Métodos Quantitativos Aplicados
MACKENZIE
56
Métodos Quantitativos Aplicados
MACKENZIE
29
Métodos Quantitativos Aplicados
MACKENZIE
44
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
3
Métodos Quantitativos Aplicados
MACKENZIE
45
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
Texto de pré-visualização
Métodos Quantitativos em Processos Decisórios Transformação de variáveis e Distribuição Normal Profa Anna Célia Affonso dos Santos Transformação de variáveis Processo de criação de indicadores a partir de outras variáveis da base de dados Para cada observação ou objeto da base de dados posso criar uma novo atributo coluna baseado nos atributos existentes Maior agilidade no uso do dado já formatado melhoria na performance dos dashboards EXEMPLO 1 2 3 4 5 6 Enter Calculando IMC no Jamovi Abrir aquivo Atividades Físicas no Jamovi Em Dados opção Calcular escrever a fórmula do IMC peso altura1002 Análise descritiva da variável IMC 1 2 3 Padronização de Variáveis Tratase de um procedimento para possibilitar a comparação de variáveis que apresentam Medidas extraídas em diferentes situações Medidas em diferentes ordens de grandeza eou Padronização Medidas extraídas em diferentes situação Exemplo Desempenho de um aluno em duas disciplinas A e B nas quais as notas máximas foram 6 e 9 Em qual disciplina o aluno foi melhor 𝑋 𝑚á𝑥𝑖𝑚𝑜 ALUNO DISCIPLINA A DISCIPLINA B 1 6 5 2 5 6 3 45 65 4 45 9 Padronização Medidas retiradas em diferentes situação Aluno Transformação Máximo Disciplina A Transformação Máximo Disciplina B 1 1 057 2 083 067 3 075 072 4 075 1 Os alunos 123 foram melhores na disciplina A e o aluno 4 na disciplina B ALUNO DISCIPLINA A DISCIPLINA B 1 6 5 2 5 6 3 45 65 4 45 9 Exemplo Desempenho de funcionários em dois treinamentos com as seguintes médias e desviospadrão Treinamento A Média65 e dp 12 Treinamento B Média55 e dp08 Em qual desses treinamentos um funcionário com notas 7 e 6 em A e B respectivamente obteve melhor desempenho 𝑥 𝑚é𝑑𝑖𝑎 desvio padrão Padronização Medidas retiradas em diferentes situação Exemplo Desempenho de funcionários em dois treinamentos com as seguintes médias e desviospadrão Treinamento A Média65 e dp 12 Treinamento B Média55 e dp08 A 765 12 0417 B 655 08 0625 Padronização Medidas retiradas em diferentes situação O desempenho do funcionário foi melhor em B Padronização Medidas retiradas em diferentes ordens de grandeza EXEMPLO Ambiente Bancário Variáveis Volume médio de mensal de empréstimos Bilhões Número de agências Dezenas Investimento percentual em marketing investimentoreceita Decimal Quais bancos possuem indicadores superiores em todas as variáveis 𝑥 𝑚é𝑑𝑖𝑎 desvio padrão VAMOS RESOLVER JUNTOS ABRA NO EXCEL O ARQUIVO Padronização Bancosxls Transformações possíveis para padronização da variável A variável padronizada terá média 0 e desviopadrão 1 Z Score A variável padronizada terá amplitude 1 Range 1 A variável padronizada terá amplitude 1 Range 1 A variável padronizada terá máximo igual a 1 Máxima magnitude A variável padronizada terá media 1 Média A variável padronizada terá desviopadrão 1 Desvio Padrão 𝑋 𝑚é𝑑𝑖𝑎 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑋 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑡𝑜𝑡𝑎𝑙 𝑋 𝑚í𝑛𝑖𝑚𝑜 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑋 𝑚á𝑥𝑖𝑚𝑜 𝑋 𝑀é𝑑𝑖𝑎 𝑋 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 Escorez O escorez muitas vezes é denominado valor padronizado Pode ser interpretado como o número de desvios padrão que xi está afastado da média Se z1 1 indica que x1 é 1 desvio padrão maior que média amostral Se z2 05 indica que x2 é 05 desvio padrão menor que a média amostral Um escorez igual a zero indica que o valor da observação é igual à média Regra empírica Para dados que têm uma distribuição em formato de sino quase todos os valores estarão contidos entre três desvios padrão da média Regra de Ouro Detecção de valores atípicos outliers Um conjunto de dados às vezes possui uma ou mais observações com valores muito grandes ou pequenos Estes valores são chamados outliers Um outlier pode ser um valor que foi incorretamente registrado e deve ser corrigido ou retirado da amostra Valores padronizados escoresz podem ser utilizados para identificar outliers Qualquer valor com um escorez menor que 3 ou maior que 3 deve ser considerado um outlier Variável padronizada por EscoreZ Então o que quer dizer que uma variável foi padronizada A média da variável é zero e o desvio padão é 1 CURVA NORMAL PADRÃO 10 20 30 40 50 60 70 80 Idade em anos 0 10 20 30 40 50 60 70 Frequency Mean 4142 Std Dev 12209 N 1000 Histogram Média 4142 anos Desvio padrão 12209 anos Unidade de media anos 3000 2000 1000 000 1000 2000 3000 4000 padronidademedia 0 10 20 30 40 50 60 70 Frequency Mean 21858E15 Std Dev 1220863 N 1000 Histogram Padronizando pela média centralizar a distribuição na média zero Basta subtrair a média de cada observação Não altera o formato da distribuição 200000 100000 000000 100000 200000 300000 Zscore Idade em anos 0 10 20 30 40 50 60 70 Frequency Mean 23292999E15 Std Dev 100000 N 1000 Histogram Mantém o formato da distribuição após a padronização dos dados pelo Z xi xbar s Média zero Desvio padrão 1 Unidade de medida desvios padrões Valores acima de 3 desvios poderiam ser considerados outliers Exercitando httpscloudjamoviorg Exemplo IMC Data idade 22 24 14 Setup Compute Transform TRANSFORMED VARIABLE Zidade Source variable idade using transform None Create New Transform Exemplo IMC Transform 1 PadronizaZ Add recode condition source Functions MIN RANK SCALE STDEV SUM VMAX SCALE variable groupby0 Returns the normalized values of a set of numbers SCALEsource Coluna nova Podemos usar essa transformação para outras variáveis Exemplo IMC atividadesfisicassav padronize IMC altura Há outliers z 3 1 2 A transformação já está pronta basta usála Exemplo IMC Medidas de Forma Além das medidas de variabilidade amplitude variância desvio padrão as medidas de forma ajudam a compreender a natureza da distribuição ASSIMETRIA CURTOSE Mede a simetria da distribuição em relação à média Medida do achatamento relativo da curva definida pela distribuição de frequência Assimetria Skewness Assimetria alongada à direita assimetria positiva Curtose kurtosis Achatamento Platicúrtica Mesocúrtica normal Leptocúrtica Tipos de curva Assimétrica à direita ou assimetria positiva Simétrica Assimétrica à esquerda ou assimetria negativa Leptocúrtica Mesocúrtica Platicúrtica Bimodal Unimodal Multimodal Variável aleatória Uma variável aleatória é uma descrição numérica do resultado de um experimento Pode ser classificada como discreta ou contínua DISCRETA CONTÍNUA Assume um valor finito entre os 0 1 2 3 Ex Número de carros que chegam a um pedágio Número de clientes que realizam um pedido de compra Gênero do cliente Assume um valor numérico em um intervalo Ex Tempo na fila de atendimento Distância percorrida em um dia Quantidade em ml Porcentagem de conclusão do projeto depois de seis meses Temperatura quando ocorre a reação desejada Distribuição de probabilidade Descreve como as probabilidade estão distribuídas sobre os valores da variável aleatória Quando eu conheço o tipo de distribuição de probabilidade da variável posso determinar a probabilidade de uma série de eventos ocorrer que sejam do interesse do tomador de decisão DISCRETA CONTÍNUA Tipos de distribuição de probabilidade Uniforme discreta Binomial Poisson Tipos de distribuição de probabilidade Uniforme Normal Exponencial Distribuição Normal A mais importante distribuição de probabilidade para descrever uma variável aleatória contínua Descreve uma ampla variedade de conceitos como altura e peso das pessoas notas de exames medições científicas Caraterísticas da distribuição normal É diferenciada por dois parâmetros sua média µ e seu desvio padrão σ O ponto máximo da normal está na média que é também a mediana e a moda da distribuição A média pode ser qualquer valor numérico negativo zero ou positivo A distribuição normal é simétrica Caraterísticas da distribuição normal O desvio padrão determina quanto uma curva é achatada ou larga As probabilidades da variável aleatória normal são dadas por áreas sob a curva A área total sob a curva é 1 As porcentagens de valores de alguns intervalos bastante usados 683 para mais ou menos 1 desvipadrão 954 para mais ou menos 2 desvios padrão 997 para mais ou menos 3 desvios padrão Como determinar se os dados seguem uma distribuição normal 1000 2000 3000 4000 5000 6000 simulaIDADE 0 20 40 60 80 100 Frequency Mean 401665 Std Dev 962186 N 1000 1 2 3 4 5 Você está satisfeito no trabalho 0 50 100 150 200 250 300 Frequency Mean 305 Std Dev 1348 N 1000 Esse é um dos problemas quando trabalhamos com dados ordinais Através da visualização dos dados 000 20000 40000 60000 80000 100000 Renda familiar em milhares de dólares 0 100 200 300 400 500 Frequency Mean 72911 Std Dev 9341354 N 1000 Visualmente já percebemos a assimetria Inserir curva Normalna visualização É normal Selecionar Histograma e densidade Praticando no Jamovi Normalidade e outlier Média 000000000172 dp 100 Medida em desvios padrões Outliers Normal Arquivo VestibularIES Variável Nota em Matemática População Mesmo que a população tenha distribuição normal De amostra para amostra teremos resultados diferentes Abrir o conjunto de dados vestibulares Dados Calcular 1 2 3 Demonstrando no Jamovi Abrir o conjunto de dados vestibulares Dados Colcular 3 Enter Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N1162 Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N100 Próxima aula Inferência Estatística Uso de testes estatísticos para determiner a partir da amostra a característica da população Obrigada annasantosmackenziebr