·
Administração ·
Métodos Quantitativos Aplicados
Send your question to AI and receive an answer instantly
Recommended for you
36
Métodos Quantitativos em Processos Decisórios: Regressão e Análises Avançadas
Métodos Quantitativos Aplicados
MACKENZIE
35
Métodos Quantitativos em Processos Decisórios - Testes de Hipóteses
Métodos Quantitativos Aplicados
MACKENZIE
4
Lista de Exercícios de Métodos Quantitativos: Testes de Hipóteses
Métodos Quantitativos Aplicados
MACKENZIE
45
Métodos Quantitativos em Processos Decisórios - Aula 2: Intervalos de Confiança e Tamanho de Amostra
Métodos Quantitativos Aplicados
MACKENZIE
16
Hipóteses Nula e Alternativa em Inferência Estatística
Métodos Quantitativos Aplicados
MACKENZIE
1
Análise da Correlação na Trajetória
Métodos Quantitativos Aplicados
MACKENZIE
45
Exercícios Resolvidos: Testes de Hipóteses com Distribuição Normal e t-Student
Métodos Quantitativos Aplicados
MACKENZIE
1
Analise Fatorial: Tecnica Multivariada para Reducao de Dados
Métodos Quantitativos Aplicados
MACKENZIE
13
Regressao Linear Multipla e Simples - Analise de Predicao de Lucro de Filmes
Métodos Quantitativos Aplicados
MACKENZIE
1
Analise Fatorial de Beneficios de Cremes Dentais Saude e Apelo Social
Métodos Quantitativos Aplicados
MACKENZIE
Preview text
Métodos Quantitativos em Processos Decisórios Teste de Hipótese com Distribuição Normal Profa Anna Célia Affonso dos Santos População Mesmo que a população tenha distribuição normal De amostra para amostra teremos resultados diferentes Abrir o conjunto de dados vestibulares Dados Calcular 1 2 3 Demonstrando no Jamovi Abrir o conjunto de dados vestibulares Dados Colcular 3 Enter Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N1162 Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N100 Inferência Estatística A partir da amostra busco identificar o parâmetro da população Teste de Hipótese A análise de dados envolve o teste de alguma hipótese Exemplos Uma loja de departamento tem a preferência de mais de 10 das residências Os usuários frequentes e os usuários eventuais de determinado produto diferem em termos de características psicográficas Um hotel tem melhor imagem do que seu concorrente mais próximo As notas dos alunos possuem distribuição normal A hipótese referese à algum parâmetro da população Teste de hipótese Uma hipótese estatística é uma suposição sobre determinado parâmetro da população como média desviopadrão coeficiente de correlação etc Um teste de hipótese é um procedimento para decisão sobre a veracidade ou falsidade de determinada hipótese Para que a hipótese estatística seja validade ou rejeitada com certeza seria necessário examinarmos toda a população o que na prática é inviável Como alternativa extraímos um amostra aleatória da população de interesse Formulação da hipótese Hipótese Nula H0 Uma afirmação em que não se espera qualquer diferença ou efeito Ex A variável possui distribuição normal Hipótese Alternativa H1 Uma afirmação de que se espera alguma diferença ou efeito A aceitação da hipótese alternativa conduz à modificação de opiniões ou atitudes Ex A variável não possui distribuição normal População De amostra para amostra teremos resultados diferentes Mas será que essa diferença é pequena Ou será que a diferença é tão grande que não dá para aceitarmos a hipótese nula de que a distribuição seja normal na população O teste de hipótese vai nos ajudar a avaliar isso E quando não conhecemos a distribuição populacional População 𝐻0 𝐴 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑛𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 é 𝑛𝑜𝑟𝑚𝑎𝑙 Dados observados Amostra Teoria normal Mas será que essa diferença é pequena Ou será que a diferença é tão grande que não dá para aceitarmos a hipótese nula de que a distribuição seja normal na população Sempre haverá alguma diferença entre nosso histograma e a curva normal De amostra para amostra a diferença muda histogramas diferentes Será que essa diferença é pequena e podemos aceitar que seja zero na população isto é podemos aceitar que a distribuição é normal Ou a diferença é grande e devemos rejeitar a hipótese nula Ho Lógica dos testes de hipótese 0 Diferença pequena menor que 2 desvios padrões Diferença grande maior que 2 desvios padrões O gráfico muda dependendo do teste mas a lógica é a mesma 1 Definimos a priori a Hipótese nula Região de aceitação diferença pequena 95 2 Calculamos a diferença em uma escala padronizada se o valor for grande 2 neste exemplo rejeitamos a hipótese nula H0 Nula zero não há diferença Normal histograma zero Calculamos a diferença padronizada 0 Região de aceitação da Ho diferenças pequenas Ao longo do semestre usaremos vários testes de hipóteses Na hipótese nula ou H zero assumimos que não há diferença não há relação não há efeito ou efeito é nulo α 5 bicaudal Dependendo do teste que fazemos testet testez testeF etc a curva muda mas a lógica é a mesma Quanto maior a diferença maior nossa tendência de rejeitar a Ho 0 Quanto maior a diferença entre a distribuição analisada e uma normal mais entramos na área de rejeição Região de aceitação da Ho diferenças pequenas α 5 bicaudal 0 α 5 bicaudal Se a área calculada for menor que 5 bicaudal estaremos na região de rejeição Sig 005 p 005 Testes estatísticos de normalidade SHAPIROWILK O teste de ShapiroWilk SW é baseado em Shapiro e Wilk 1965 e pode ser aplicado para amostras de tamanho 4n2000 sendo uma alternativa ao teste de normalidade de KolmogorovSmirnovKS no caso de pequenas amostras n30 KOLMOGOROVSMIRNOV O teste de KolmogorovSmirnov KS testa se os valores amostrais são oriundos de uma população com distribuição normal H0 A amostra provém de uma população com distribuição N µσ H1 A amostra não provém de uma população com distribuição N µσ Sig 005 Rejeita Ho Sig 005 Não rejeita Ho p 005 Rejeita Ho p 005 Não rejeita Ho Output dos softwares Artigos de um modo geral usam valorp Ao longo do semestre usaremos vários testes de hipóteses Na hipótese nula ou H zero assumimos que não há diferença não há relação não há efeito ou efeito é nulo Probabilidade de significância Dado que a distribuição é normal na população qual a probabilidade de obtermos uma amostra como essa Se valorp for muito baixo p005 rejeitamos a H0 Nível descritivo ou Valorp Exercitando httpscloudjamoviorg Análises Exploração Selecionar a variável Estatísticas Selecionar ShapiroWilk teste Simuladas p 005 Idade p 005 Veja os histogramas Exercício Avalie a normalidade por meio do histograma e teste SW para as variáveis numéricas Nota de matemática Média nota Português Redação e Inglês Dica DadosCalcular fx MEAN Teste de hipótese utilizando Distribuição Normal Importância da distribuição normal Retrata com boa aproximação as distribuições de frequência de muitos fenômenos naturais e físicos Serve como aproximação das probabilidades binomiais sim ou não quando n é grande Representa a distribuição das médias e proporções em grandes amostras o que tem relevante implicação na amostragem a mais importante Comparação de médias Testes paramétricos Normal Testes não paramétricos sim não Tipos de testes Testes paramétricos São usados quando a variável dependente é uma variável intervalarrazão e segue alguns requisitos DISTRIBUIÇÃO CONHECIDA Testes não paramétricos Contém resultados estatísticos provenientes de uso de ordenação São usados para variáveis dependentes do tipo intervalarrazão ou ordinal e para dados distorcidos não normais ou que contém outliers DISTRIBUIÇÃO NÃO CONHECIDALIVRE Prérequisitos para os testes paramétricos Teste Paramétrico Dados por intervalos Variável dependente intervalarrazao Normalidade Testes KolmogorovSmirnov ShapiroWilk AndersonDarling Homogeneidade da Variância Dados variam de forma similar Teste de Levene Independência dos dados amostrais Dado de um indivíduo não pode interferir no resultado de outro Teste de Hipótese Formulação da hipótese Hipótese Nula H0 Uma afirmação em que não se espera qualquer diferença ou efeito Hipótese Alternativa H1 Uma afirmação de que se espera alguma diferença ou efeito A aceitação da hipótese alternativa conduz à modificação de opiniões ou atitudes EXEMPLO O peso na embalagem é 500g Qual a probabilidade de ter se alterado H0 Peso da embalagem é igual a 500 g H1 Peso da embalagem é diferente de 500g Formulação das Hipóteses Normalmente são formuladas duas hipóteses H0 hipótese nula É uma afirmação do status quo É aquela em que as coisas estão acontecendo como esperadas Não há diferença com frequência tem o sinal de igualdade O parâmetro populacional é assumido como o esperado H1 hipótese alternativa que será aceita se não for possível provar que H0 é verdadeira Exemplo H0 mulheres vivem o mesmo ou mais que os homens H1 mulheres vivem menos que os homens Criação de hipóteses As hipóteses podem ter várias formas Onde µ0 é o valor numérico específico que está sendo considerado nas hipóteses nula e alternativa As hipóteses alternativas sempre são o complemento da hipótese nula Teste 1 Bilateral 2 Unilateral 21 À direita 22 À esquerda H0 µ µ0 Ha µ µ0 H0 µ µ0 Ha µ µ0 H0 µ µ0 Ha µ µ0 Tipos de erro na inferência estatística Erro tipo I rejeitar H0 quando está verdadeira Erro tipo II não rejeitar H0 quando está falsa A probabilidade de cometer erro tipo I é denominada nível de significância e é denotada por α A probabilidade de cometer erro tipo II é denotada por β Decisão H0 é verdadeira H0 é falsa Não rejeitar H0 Decisão Correta 1 α Erro tipo II β Rejeitar H0 Erro tipo I α Decisão Correta 1β REALIDADE DECISÃO ESTATÍSTICA Type I error false positive Youre pregnant Type II error false negative Youre not pregnant Erros de decisão Na prática é especificado a probabilidade máxima permissível de se cometer o erro tipo I chamado nível de significância Escolhas comuns para o nível de significância são 005 5 e 001 1 Assim se a probabilidade de se cometer um erro Tipo I é controlada por selecionar um pequeno valor para o nível de significância temos um alto grau de confiança que a conclusão para rejeitar H0 está correta Em tais casos temos o suporte estatístico para concluir que H0 é falso e Ha é verdadeiro Qualquer hipótese sugerida para Ha é aceita Erros de decisão Como na prática não se atenta para a probabilidade de se cometer o erro tipo II se decidimos aceitar H0 não podemos determinar quão confiantes podemos estar com aquela decisão Assim recomendase que seja usado a declaração não rejeitar H0 em vez de aceitar H0 Nível de significância O nível de significância α de um teste representa a probabilidade de rejeitar a hipótese nula quando ela for verdadeira A região crítica RC de um teste bilateral é representada por duas caudas de tamanhos iguais A região crítica RC de um teste unilaterial ou unicaudal pode ser à esquerda ou à direita Cálculos utilizando a distribuição Normal A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos µ a b P a x b área hachurada sob a curva Distribuição Normal e escoreZ A distância entre a média e um ponto qualquer é dado em número de desvios padrões z Normal padronizada Normal não padronizada z x µ µ x 0 z P P Escala efetiva x Escala padronizada 70 80 90 100 110 120 130 3 2 1 0 1 2 3 µ 1000 100 escala efetiva escala padronizada Como calcular o valor z 22 4 22 0 0 18 3 135 45 15 Como calcular Z µ x x µ x µ z média desvio padrão valor considerado diferença diferença relativa 40 1 42 2 2 30 25 375 75 3 37 38 39 40 41 42 43 escala efetiva 3 2 1 0 1 2 3 42 401 2 S 1 25 2 23 2 1 Score Z Tabela 0 z Tabela 51 Áreas para a Distribuição Normal Padronizada z 000 001 002 003 004 005 006 007 008 009 00 00000 00040 00080 00120 00160 00199 00239 00279 00319 00359 01 00398 00438 00478 00517 00557 00596 00636 00675 00714 00753 02 00793 00832 00871 00910 00948 00987 01026 01064 01103 01141 03 01179 01217 01255 01293 01331 01368 01406 01443 01480 01517 04 01554 01591 01628 01664 01700 01736 01772 01808 01844 01879 05 01915 01950 01985 02019 02054 02088 02123 02157 02190 02224 06 02257 02291 02324 02357 02389 02422 02454 02486 02518 02549 07 02580 02612 02642 02673 02704 02734 02764 02794 02823 02852 08 02881 02910 02939 02967 02995 03023 03051 03078 03106 03133 09 03159 03186 03212 03238 03264 03289 03315 03340 03365 03389 10 03413 03438 03461 03485 03508 03531 03554 03577 03599 03621 11 03643 03665 03686 03708 03729 03749 03770 03790 03810 03830 12 03849 03869 03888 03907 03925 03944 03962 03980 03997 04015 13 04032 04049 04066 04082 04099 04115 04131 04147 04162 04177 14 04192 04207 04222 04236 04251 04265 04279 04292 04306 04319 15 04332 04345 04357 04370 04382 04394 04406 04418 04429 04441 16 04452 04463 04474 04484 04495 04505 04515 04525 04535 04545 17 04554 04564 04573 04582 04591 04599 04608 04616 04625 04633 18 04641 04649 04656 04664 04671 04678 04686 04693 04699 04706 19 04713 04719 04726 04732 04738 04744 04750 04756 04761 04767 20 04772 04778 04783 04788 04793 04798 04803 04808 04812 04817 21 04821 04826 04830 04834 04838 04842 04846 04850 04854 04857 22 04861 04864 04868 04871 04875 04878 04881 04884 04887 04890 23 04893 04896 04898 04901 04904 04906 04909 04911 04913 04916 24 04918 04920 04922 04925 04927 04929 04931 04932 04934 04936 25 04938 04940 04941 04943 04945 04946 04948 04949 04951 04952 26 04953 04955 04956 04957 04959 04960 04961 04962 04963 04964 27 04965 04966 04967 04968 04969 04970 04971 04972 04973 04974 28 04974 04975 04976 04977 04977 04978 04978 04979 04979 04980 29 04981 04982 04982 04983 04984 04984 04985 04985 04986 04986 30 04986 04987 04987 04988 04988 04989 04989 04989 04990 04990 40 049997 Universidade Presbiteriana Mackenzie Distribuição Normal Consultando a tabela 11 10 00 01 02 03 04 05 06 12 125 03944 olhando a tabela Distribuição Normal Consultando a tabela Probabilidade de uma variável aleatória normal tomar um valor z entre a média e o ponto situado a z desvios padrões z área entre a média e z 100 03413 150 04332 213 04834 277 04972 área tabelada área desejada 0 z Escore Z Consultando a tabela z P0 x z Px z 05 P0 x z 0 z área desejada 05 área tabelada área tabelada Distribuição Normal Cálculo de Probabilidade Determinando a área entre dois pontos quaisquer Exemplos Determinando a área probabilidade sob a curva entre dois pontos entorno da média 01359 0 1 2 03413 04772 1 0 1 03413 03413 Estimação usando distribuição normal A tabela de probabilidades da distribuição normal padrão pode ser utilizada para encontrar probabilidades associadas a valores da variável aleatória normal padrão z Dois tipos de questão podem ser efetuadas 1º Especifico um valor ou valores para z e determino as áreas de probabilidade 2º A questão fornece uma área ou probabilidade e identifico o valor de z correspondente 1º Especifico um valor ou valores para z e determino as áreas de probabilidade Após 28 dias de curagem o cimento de uma certa marca tem uma resistência compressiva média de 4000psi Suponha que a resistência tem uma distribuição normal com desviopadrão de 120psi Qual a probabilidade de se comprar um pacote de cimento com resistência compressiva de 28 dias menor que 3850psi Caso Resistência de cimento Situação atual Hipótese que eu quero testar Unilateral à esquerda A resistência é menor que 3850 psi Após 28 dias de cura o cimento de uma certa marca tem uma resistência compressiva média de 4000psi Suponha que a resistência tem uma distribuição normal com desviopadrão de 120psi Qual a probabilidade de se comprar um pacote de cimento com resistência compressiva de 28 dias menor que 3850psi 1056 01056 1 25 Z P 3850 4000 Escala efetiva Área em vermelho z 125 03944 Área desejada 050 03944 01056 1056 1 25 120 4000 3850 X z Caso Resistência de cimento Unilateral à esquerda Média 4000 psi Desvio Padrão 120 psi Ponto X 3850 psi Pz 125 125 0 Escala padronizada Universidade Presbiteriana Mackenzie Obrigada annasantosmackenziebr
Send your question to AI and receive an answer instantly
Recommended for you
36
Métodos Quantitativos em Processos Decisórios: Regressão e Análises Avançadas
Métodos Quantitativos Aplicados
MACKENZIE
35
Métodos Quantitativos em Processos Decisórios - Testes de Hipóteses
Métodos Quantitativos Aplicados
MACKENZIE
4
Lista de Exercícios de Métodos Quantitativos: Testes de Hipóteses
Métodos Quantitativos Aplicados
MACKENZIE
45
Métodos Quantitativos em Processos Decisórios - Aula 2: Intervalos de Confiança e Tamanho de Amostra
Métodos Quantitativos Aplicados
MACKENZIE
16
Hipóteses Nula e Alternativa em Inferência Estatística
Métodos Quantitativos Aplicados
MACKENZIE
1
Análise da Correlação na Trajetória
Métodos Quantitativos Aplicados
MACKENZIE
45
Exercícios Resolvidos: Testes de Hipóteses com Distribuição Normal e t-Student
Métodos Quantitativos Aplicados
MACKENZIE
1
Analise Fatorial: Tecnica Multivariada para Reducao de Dados
Métodos Quantitativos Aplicados
MACKENZIE
13
Regressao Linear Multipla e Simples - Analise de Predicao de Lucro de Filmes
Métodos Quantitativos Aplicados
MACKENZIE
1
Analise Fatorial de Beneficios de Cremes Dentais Saude e Apelo Social
Métodos Quantitativos Aplicados
MACKENZIE
Preview text
Métodos Quantitativos em Processos Decisórios Teste de Hipótese com Distribuição Normal Profa Anna Célia Affonso dos Santos População Mesmo que a população tenha distribuição normal De amostra para amostra teremos resultados diferentes Abrir o conjunto de dados vestibulares Dados Calcular 1 2 3 Demonstrando no Jamovi Abrir o conjunto de dados vestibulares Dados Colcular 3 Enter Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N1162 Análises Exploração Selecionar a variável Gráfico histograma 3 amostras geradas por simulação normal média 10 dp1 Análise visual De amostra para amostra teremos resultados diferentes N100 Inferência Estatística A partir da amostra busco identificar o parâmetro da população Teste de Hipótese A análise de dados envolve o teste de alguma hipótese Exemplos Uma loja de departamento tem a preferência de mais de 10 das residências Os usuários frequentes e os usuários eventuais de determinado produto diferem em termos de características psicográficas Um hotel tem melhor imagem do que seu concorrente mais próximo As notas dos alunos possuem distribuição normal A hipótese referese à algum parâmetro da população Teste de hipótese Uma hipótese estatística é uma suposição sobre determinado parâmetro da população como média desviopadrão coeficiente de correlação etc Um teste de hipótese é um procedimento para decisão sobre a veracidade ou falsidade de determinada hipótese Para que a hipótese estatística seja validade ou rejeitada com certeza seria necessário examinarmos toda a população o que na prática é inviável Como alternativa extraímos um amostra aleatória da população de interesse Formulação da hipótese Hipótese Nula H0 Uma afirmação em que não se espera qualquer diferença ou efeito Ex A variável possui distribuição normal Hipótese Alternativa H1 Uma afirmação de que se espera alguma diferença ou efeito A aceitação da hipótese alternativa conduz à modificação de opiniões ou atitudes Ex A variável não possui distribuição normal População De amostra para amostra teremos resultados diferentes Mas será que essa diferença é pequena Ou será que a diferença é tão grande que não dá para aceitarmos a hipótese nula de que a distribuição seja normal na população O teste de hipótese vai nos ajudar a avaliar isso E quando não conhecemos a distribuição populacional População 𝐻0 𝐴 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑛𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 é 𝑛𝑜𝑟𝑚𝑎𝑙 Dados observados Amostra Teoria normal Mas será que essa diferença é pequena Ou será que a diferença é tão grande que não dá para aceitarmos a hipótese nula de que a distribuição seja normal na população Sempre haverá alguma diferença entre nosso histograma e a curva normal De amostra para amostra a diferença muda histogramas diferentes Será que essa diferença é pequena e podemos aceitar que seja zero na população isto é podemos aceitar que a distribuição é normal Ou a diferença é grande e devemos rejeitar a hipótese nula Ho Lógica dos testes de hipótese 0 Diferença pequena menor que 2 desvios padrões Diferença grande maior que 2 desvios padrões O gráfico muda dependendo do teste mas a lógica é a mesma 1 Definimos a priori a Hipótese nula Região de aceitação diferença pequena 95 2 Calculamos a diferença em uma escala padronizada se o valor for grande 2 neste exemplo rejeitamos a hipótese nula H0 Nula zero não há diferença Normal histograma zero Calculamos a diferença padronizada 0 Região de aceitação da Ho diferenças pequenas Ao longo do semestre usaremos vários testes de hipóteses Na hipótese nula ou H zero assumimos que não há diferença não há relação não há efeito ou efeito é nulo α 5 bicaudal Dependendo do teste que fazemos testet testez testeF etc a curva muda mas a lógica é a mesma Quanto maior a diferença maior nossa tendência de rejeitar a Ho 0 Quanto maior a diferença entre a distribuição analisada e uma normal mais entramos na área de rejeição Região de aceitação da Ho diferenças pequenas α 5 bicaudal 0 α 5 bicaudal Se a área calculada for menor que 5 bicaudal estaremos na região de rejeição Sig 005 p 005 Testes estatísticos de normalidade SHAPIROWILK O teste de ShapiroWilk SW é baseado em Shapiro e Wilk 1965 e pode ser aplicado para amostras de tamanho 4n2000 sendo uma alternativa ao teste de normalidade de KolmogorovSmirnovKS no caso de pequenas amostras n30 KOLMOGOROVSMIRNOV O teste de KolmogorovSmirnov KS testa se os valores amostrais são oriundos de uma população com distribuição normal H0 A amostra provém de uma população com distribuição N µσ H1 A amostra não provém de uma população com distribuição N µσ Sig 005 Rejeita Ho Sig 005 Não rejeita Ho p 005 Rejeita Ho p 005 Não rejeita Ho Output dos softwares Artigos de um modo geral usam valorp Ao longo do semestre usaremos vários testes de hipóteses Na hipótese nula ou H zero assumimos que não há diferença não há relação não há efeito ou efeito é nulo Probabilidade de significância Dado que a distribuição é normal na população qual a probabilidade de obtermos uma amostra como essa Se valorp for muito baixo p005 rejeitamos a H0 Nível descritivo ou Valorp Exercitando httpscloudjamoviorg Análises Exploração Selecionar a variável Estatísticas Selecionar ShapiroWilk teste Simuladas p 005 Idade p 005 Veja os histogramas Exercício Avalie a normalidade por meio do histograma e teste SW para as variáveis numéricas Nota de matemática Média nota Português Redação e Inglês Dica DadosCalcular fx MEAN Teste de hipótese utilizando Distribuição Normal Importância da distribuição normal Retrata com boa aproximação as distribuições de frequência de muitos fenômenos naturais e físicos Serve como aproximação das probabilidades binomiais sim ou não quando n é grande Representa a distribuição das médias e proporções em grandes amostras o que tem relevante implicação na amostragem a mais importante Comparação de médias Testes paramétricos Normal Testes não paramétricos sim não Tipos de testes Testes paramétricos São usados quando a variável dependente é uma variável intervalarrazão e segue alguns requisitos DISTRIBUIÇÃO CONHECIDA Testes não paramétricos Contém resultados estatísticos provenientes de uso de ordenação São usados para variáveis dependentes do tipo intervalarrazão ou ordinal e para dados distorcidos não normais ou que contém outliers DISTRIBUIÇÃO NÃO CONHECIDALIVRE Prérequisitos para os testes paramétricos Teste Paramétrico Dados por intervalos Variável dependente intervalarrazao Normalidade Testes KolmogorovSmirnov ShapiroWilk AndersonDarling Homogeneidade da Variância Dados variam de forma similar Teste de Levene Independência dos dados amostrais Dado de um indivíduo não pode interferir no resultado de outro Teste de Hipótese Formulação da hipótese Hipótese Nula H0 Uma afirmação em que não se espera qualquer diferença ou efeito Hipótese Alternativa H1 Uma afirmação de que se espera alguma diferença ou efeito A aceitação da hipótese alternativa conduz à modificação de opiniões ou atitudes EXEMPLO O peso na embalagem é 500g Qual a probabilidade de ter se alterado H0 Peso da embalagem é igual a 500 g H1 Peso da embalagem é diferente de 500g Formulação das Hipóteses Normalmente são formuladas duas hipóteses H0 hipótese nula É uma afirmação do status quo É aquela em que as coisas estão acontecendo como esperadas Não há diferença com frequência tem o sinal de igualdade O parâmetro populacional é assumido como o esperado H1 hipótese alternativa que será aceita se não for possível provar que H0 é verdadeira Exemplo H0 mulheres vivem o mesmo ou mais que os homens H1 mulheres vivem menos que os homens Criação de hipóteses As hipóteses podem ter várias formas Onde µ0 é o valor numérico específico que está sendo considerado nas hipóteses nula e alternativa As hipóteses alternativas sempre são o complemento da hipótese nula Teste 1 Bilateral 2 Unilateral 21 À direita 22 À esquerda H0 µ µ0 Ha µ µ0 H0 µ µ0 Ha µ µ0 H0 µ µ0 Ha µ µ0 Tipos de erro na inferência estatística Erro tipo I rejeitar H0 quando está verdadeira Erro tipo II não rejeitar H0 quando está falsa A probabilidade de cometer erro tipo I é denominada nível de significância e é denotada por α A probabilidade de cometer erro tipo II é denotada por β Decisão H0 é verdadeira H0 é falsa Não rejeitar H0 Decisão Correta 1 α Erro tipo II β Rejeitar H0 Erro tipo I α Decisão Correta 1β REALIDADE DECISÃO ESTATÍSTICA Type I error false positive Youre pregnant Type II error false negative Youre not pregnant Erros de decisão Na prática é especificado a probabilidade máxima permissível de se cometer o erro tipo I chamado nível de significância Escolhas comuns para o nível de significância são 005 5 e 001 1 Assim se a probabilidade de se cometer um erro Tipo I é controlada por selecionar um pequeno valor para o nível de significância temos um alto grau de confiança que a conclusão para rejeitar H0 está correta Em tais casos temos o suporte estatístico para concluir que H0 é falso e Ha é verdadeiro Qualquer hipótese sugerida para Ha é aceita Erros de decisão Como na prática não se atenta para a probabilidade de se cometer o erro tipo II se decidimos aceitar H0 não podemos determinar quão confiantes podemos estar com aquela decisão Assim recomendase que seja usado a declaração não rejeitar H0 em vez de aceitar H0 Nível de significância O nível de significância α de um teste representa a probabilidade de rejeitar a hipótese nula quando ela for verdadeira A região crítica RC de um teste bilateral é representada por duas caudas de tamanhos iguais A região crítica RC de um teste unilaterial ou unicaudal pode ser à esquerda ou à direita Cálculos utilizando a distribuição Normal A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos µ a b P a x b área hachurada sob a curva Distribuição Normal e escoreZ A distância entre a média e um ponto qualquer é dado em número de desvios padrões z Normal padronizada Normal não padronizada z x µ µ x 0 z P P Escala efetiva x Escala padronizada 70 80 90 100 110 120 130 3 2 1 0 1 2 3 µ 1000 100 escala efetiva escala padronizada Como calcular o valor z 22 4 22 0 0 18 3 135 45 15 Como calcular Z µ x x µ x µ z média desvio padrão valor considerado diferença diferença relativa 40 1 42 2 2 30 25 375 75 3 37 38 39 40 41 42 43 escala efetiva 3 2 1 0 1 2 3 42 401 2 S 1 25 2 23 2 1 Score Z Tabela 0 z Tabela 51 Áreas para a Distribuição Normal Padronizada z 000 001 002 003 004 005 006 007 008 009 00 00000 00040 00080 00120 00160 00199 00239 00279 00319 00359 01 00398 00438 00478 00517 00557 00596 00636 00675 00714 00753 02 00793 00832 00871 00910 00948 00987 01026 01064 01103 01141 03 01179 01217 01255 01293 01331 01368 01406 01443 01480 01517 04 01554 01591 01628 01664 01700 01736 01772 01808 01844 01879 05 01915 01950 01985 02019 02054 02088 02123 02157 02190 02224 06 02257 02291 02324 02357 02389 02422 02454 02486 02518 02549 07 02580 02612 02642 02673 02704 02734 02764 02794 02823 02852 08 02881 02910 02939 02967 02995 03023 03051 03078 03106 03133 09 03159 03186 03212 03238 03264 03289 03315 03340 03365 03389 10 03413 03438 03461 03485 03508 03531 03554 03577 03599 03621 11 03643 03665 03686 03708 03729 03749 03770 03790 03810 03830 12 03849 03869 03888 03907 03925 03944 03962 03980 03997 04015 13 04032 04049 04066 04082 04099 04115 04131 04147 04162 04177 14 04192 04207 04222 04236 04251 04265 04279 04292 04306 04319 15 04332 04345 04357 04370 04382 04394 04406 04418 04429 04441 16 04452 04463 04474 04484 04495 04505 04515 04525 04535 04545 17 04554 04564 04573 04582 04591 04599 04608 04616 04625 04633 18 04641 04649 04656 04664 04671 04678 04686 04693 04699 04706 19 04713 04719 04726 04732 04738 04744 04750 04756 04761 04767 20 04772 04778 04783 04788 04793 04798 04803 04808 04812 04817 21 04821 04826 04830 04834 04838 04842 04846 04850 04854 04857 22 04861 04864 04868 04871 04875 04878 04881 04884 04887 04890 23 04893 04896 04898 04901 04904 04906 04909 04911 04913 04916 24 04918 04920 04922 04925 04927 04929 04931 04932 04934 04936 25 04938 04940 04941 04943 04945 04946 04948 04949 04951 04952 26 04953 04955 04956 04957 04959 04960 04961 04962 04963 04964 27 04965 04966 04967 04968 04969 04970 04971 04972 04973 04974 28 04974 04975 04976 04977 04977 04978 04978 04979 04979 04980 29 04981 04982 04982 04983 04984 04984 04985 04985 04986 04986 30 04986 04987 04987 04988 04988 04989 04989 04989 04990 04990 40 049997 Universidade Presbiteriana Mackenzie Distribuição Normal Consultando a tabela 11 10 00 01 02 03 04 05 06 12 125 03944 olhando a tabela Distribuição Normal Consultando a tabela Probabilidade de uma variável aleatória normal tomar um valor z entre a média e o ponto situado a z desvios padrões z área entre a média e z 100 03413 150 04332 213 04834 277 04972 área tabelada área desejada 0 z Escore Z Consultando a tabela z P0 x z Px z 05 P0 x z 0 z área desejada 05 área tabelada área tabelada Distribuição Normal Cálculo de Probabilidade Determinando a área entre dois pontos quaisquer Exemplos Determinando a área probabilidade sob a curva entre dois pontos entorno da média 01359 0 1 2 03413 04772 1 0 1 03413 03413 Estimação usando distribuição normal A tabela de probabilidades da distribuição normal padrão pode ser utilizada para encontrar probabilidades associadas a valores da variável aleatória normal padrão z Dois tipos de questão podem ser efetuadas 1º Especifico um valor ou valores para z e determino as áreas de probabilidade 2º A questão fornece uma área ou probabilidade e identifico o valor de z correspondente 1º Especifico um valor ou valores para z e determino as áreas de probabilidade Após 28 dias de curagem o cimento de uma certa marca tem uma resistência compressiva média de 4000psi Suponha que a resistência tem uma distribuição normal com desviopadrão de 120psi Qual a probabilidade de se comprar um pacote de cimento com resistência compressiva de 28 dias menor que 3850psi Caso Resistência de cimento Situação atual Hipótese que eu quero testar Unilateral à esquerda A resistência é menor que 3850 psi Após 28 dias de cura o cimento de uma certa marca tem uma resistência compressiva média de 4000psi Suponha que a resistência tem uma distribuição normal com desviopadrão de 120psi Qual a probabilidade de se comprar um pacote de cimento com resistência compressiva de 28 dias menor que 3850psi 1056 01056 1 25 Z P 3850 4000 Escala efetiva Área em vermelho z 125 03944 Área desejada 050 03944 01056 1056 1 25 120 4000 3850 X z Caso Resistência de cimento Unilateral à esquerda Média 4000 psi Desvio Padrão 120 psi Ponto X 3850 psi Pz 125 125 0 Escala padronizada Universidade Presbiteriana Mackenzie Obrigada annasantosmackenziebr