·

Psicologia ·

Estatística 2

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Universidade Estadual de Londrina CENTRO DE CIÊNCIAS EXATAS CCE DEPARTAMENTO DE ESTATÍSTICA DSTA Graduação em Psicologia 2 Ano 6STA010 ESTATÍSTICA material em construção Prof Dr Vanderli Marino Melem Departamento de Estatística DSTACCE vanderliuelbr 43 3371 4346 LondrinaPr 2023 Prof Dra Vanderli Marino Melem 2023 Graduação Psicologia UEL ÍNDICE 3 1 SEMANA DE RECEPÇÃO AOS INGRESSANTES DO CURSO DE GRADUAÇÃO EM PSICOLOGIA 6 2 APRESENTAÇÃO DA DISCIPLINA E INTRODUÇÃO À ESTATÍSTICA 6 3 MEDIDAS DE POSIÇÃO E DISPERSÃO 11 31 MEDIDAS DE TENDÊNCIA CENTRAL 11 32 MEDIDAS DE DISpersão 14 33 SEPARATIVAS Quartos Decis e Percents 18 MEDIDA LISTA DE EXERCÍCIOS 20 4 REPRESENTAÇÃO TABULAR E GRÁFICA 21 41 REPRESENTAÇÃO TABULAR 21 42 REPRESENTAÇÃO GRÁFICA 22 SEGUNDA LISTA DE EXERCÍCIOS 30 5 NOÇÕES DE PROBABILIDADE E APLICAÇÕES 30 51 PROBABILIDADE CONDICIONAL 35 52 RISCO RELATIVO 36 53 CORRETA Kappa 39 LISTA EXTRAT DE EXERCÍCIOS PROBABILIDADES E APLICAÇÕES 40 6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADE 42 61 DISTRIBUIÇÃO NORMAL PADRONIZADA LISTA DE EXERCÍCIOS DISTRIBUIÇÃO NORMAL 45 TABELA 611 DISTRIBUIÇÃO NORMAL PADRONIZADA 47 7 AMOSTRAGEM 48 71 AMOSTRAGEM PROBABILÍSTICA 48 72 AMOSTRAGEM NÃOPROBABILÍSTICA 49 73 TAMANHO DA AMOSTRA 50 LISTAS DE EXERCÍCIOS DE AMOSTRAGEM 51 8 INTERVALOS DE CONFIANÇA E TESTES DE HIPÓTESES DE UMA AMOSTRA 52 81 INTERVALO DE CONFIANÇA PARA A MÉDIA VARIÁNCIA POPULACIONAL CONHECIDA 53 82 INTERVALO DE CONFIANÇA PARA A MÉDIA COM VARIÁNCIA POPULACIONAL DESCONHECIDA 55 83 TABELA DE HIPÓTESES PARA A MÉDIA VARIÂNCIA POPULACIONAL CONHECIDA 57 84 TESTE DE HIPÓTESES PARA A MÉDIA VARIÂNCIA POPULACIONAL DESCONHECIDA 58 85 TABELA 2 TESTE PARA UMA AMOSTRA UNILATERAL 59 86 LISTA DE EXERCÍCIOS COM RESOLUÇÕES DE TESTES DE HIPÓTESES DE UMA AMOSTRA 60 9 ENSAIS PARA A PRIMEIRA AVALIAÇÃO 60 10 TESTES DE HIPÓTESES PARAMÉTRICOS DE 2 AMOSTRAS INDEPENDENTES 63 101 TESTES DE HIPÓTESES PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS CON VARIÁVEIS POPULACIONAIS 63 102 TESTES DE HIPÓTESES PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS DE DISTRIBUIÇÕES NORMAIS 66 103 LISTA DE EXERCÍCIOS DE TESTES PARA 2 AMOSTRAS INDEPENDENTES 69 11 TESTES DE HIPÓTESES PARAMÉTRICOS DE 2 AMOSTRAS DEPENDENTES 71 12 TESTES DE HIPÓTESES NÃOPARAMÉTRICOS DE 2 AMOSTRAS DEPENDENTES 71 LISTA DE EXERCÍCIOS DE TESTES DE HIPÓTESES NÃOPARAMÉTRICO PARA 2 AMOSTRAS DEPENDENTES 73 6STA010 ESTATÍSTICA 60 Horas 30 Teóricas e 30 Práticas Turmas 1000 e 2000 Emenda Amostragem Estatística descritiva Noções de probabilidades Testes de hipóteses paramétricos e não paramétricos Análise de correlações e regressão linear Aplicações de análises de dados em psicologia com o uso de estatísticas livres CRONOGRAMA EM 18 SEMANAS CONTEÚDO ESTATÍSTICO TURMAS 20001000 0708 0708 0708 08 1 Semana de recepção aos ingressantes do Psicologia 6 2 Entreg do plano de aula e representação da disciplina Introdução à estatística na área de psicologia Proposta e objetivos Tipo variável na estatística 14 14 14 17 08 3 Medidas de posição e dispersão média mediana e moda 21 21 21 24 08 Representação tabular e gráfica 28 28 28 31 12 5 Noções de probabilidade Probabilidade condicional Risco relativo CREDIBILIDADE Kappa 04 09 01 14 09 6 Distribuição de probabilidade normal e suas propriedades 11 09 11 09 15 09 7 Amostragem Dimensões e populacional 18 09 18 19 21 08 8 Interv de confiança para amostra populacional Testes de hipóteses de uma amostra hipóteses teste e procedimento 25 25 25 28 25 09 9 ENTREGA DO TRABALHO A MANHÃ SINAL FEIRA REVISÃO E PRIMEIRA AVALIAÇÃO 02 10 02 10 15 10 10 Testes de hipóteses que igualem entre duas médias populacionais populacionais amostras independentes teste e procedimento 09 10 19 19 10 11 Análise e correlações linear sistemas coeficientes de Pearson e Spearman 16 16 16 10 12 Testes NãoParâmetros para duas amostras independentes Teste de Wilcoxon 30 30 30 09 11 14 Análise e correlações Linear Estimativa dos coeficientes através da relação 06 11 06 16 16 11 Regressão linear simples estimativa dos coeficientes da reta e previsão de dados da interpretação do coeficiente ampliado Coeficiente C 13 11 13 11 23 11 16 Aplicações de Testes de Hipóteses e Aplicações de Correlação e Regressão Linear 27 11 27 11 30 11 17 REVISÃO E SEGUNDA AVALIAÇÃO 12 94 12 17 11 Exame Turnos 1000 e 2000 DIA 12 DE 2023 6ª feira AS 08H10 NA SALA 02 TÉRREO DSTA Nas aulas práticas de laboratório usaremos o programa BioStat 53 que se desejar você poderá obtêlo gratuitamente no endereço httpwwwmanuairaorgbrpbfbrdownloadsprogramasbiostatversao63 A informação de estatística é apresentada constantemente em nosso meio como exemplo a coleta dos dados de nascimentos mortes e doenças patológicas A avaliação e a eficiência de produtos comerciais e a previsão de determinados perfis de comportamentos por meio de testesdiagnósticos Atividade Análise e Tabela 22 classifique as variáveis como Variável qualitativa nominal Variável qualitativa ordinal Variável quantitativa discreta Variável quantitativa contínua Tabela 23 Pesos dos estudantes em certa classe em quilogramas 580 580 595 595 602 602 602 602 625 625 625 625 650 650 650 650 664 664 664 664 664 664 670 670 670 701 701 719 719 Como a média é influenciada por valores extremos da distribuição ela só deve ser utilizada em distribuições simétricas ou levemente assimétricas e em distribuições não heterogêneas Sua aplicação em distribuições mais assimétricas ou heterogêneas é precária e de pouca utilidade prática pois pode ser sujeito a prejuízo e capacidade de representar a distribuição que a originou Variância Sejam x1 x2 xn valores que a variável X assume Se estes valores têm média x as diferenças x1x x2x xnx são chamadas de desvios a contar da média o que gera que podemos tornar a média desses desvios como medida de variação Média dos Desvios n i1xix0 O coeficiente de variação é uma medida relativa de dispersão utilizada para comparar em termos relativos o grau de concentração em torno da média Já os percentis ou quantis permitem dividir o conjunto de dados em 100 partes sendo 1 em cada parte Atividade Calcule a média e desvio padrão do teor de gordura destas 43 crianças e interprete os resultados Determine e explique os valores a 1º quartil a mediana a moda e o 90º percentil 20 do total de vagas para estudantes que estudaram em escola pública as últimas quatro séries do Ensino Fundamental e todas as séries do Ensino Médio 20 do total de vagas para estudantes autodeclarados negros e que estudaram em escola pública as últimas quatro séries do Ensino Fundamental e todas as séries do Ensino Médio 5 do total de vagas para estudantes autodeclarados negros de forma irrestrita independente do percurso de formação O gráfico de setores Figura 44 destinase a representar a composição usualmente em porcentagem de partes de um todo Figura 44 Distribuição de cotas para reserva de vagas em cada curso de Graduação da UEL vigente a partir de 2018 Tabela 44 Médias de anos de estudo no Brasil e nas Regiões Sudeste e Nordeste no período de 2002 a 2008 Fonte IBGE Pesquisa Nacional por Amostra de Domicílio 2008 Figura 48 Esquema para construção do box plot Observações atípicas outliers é muito comum aparecerem entre os dados coletados observações atípicas outliers isto é valores muito grandes ou muito pequenos em relação aos demais Um conjunto de dados pode apresentar apenas um ou vários outliers 3 Construa os gráficos no BioEstat usando as informações das tabelas a seguir Em A e B os dados foram arranjados de forma diferente da seguinte tabela original tirada do livro Análise de Dados na Investigação em Psicologia da autora Gabrielle Poschei Editora Almedina 2006 p 256 Ficha 5 Perguntese a um grupo de mulheres se perdora uma infidelidade do marido Depois convidouse estas mulheres para participar em discussões sobre o assunto e finalmente a responder ou não a questão Os resultados figuram no quadro abaixo A Digate estas duas colunas menos a linha total no BioEstat depois vê em GRÁFICOS COLUNAS SIMPLES escolha as duas colunas e executar PJ 6 PNP 1 PNP 5 NNP 8 Total 20 B Digate a tabela como abaixo em três colunas Título das colunas do perderia e não perderia é colocado dando uma T2 na coluna correspondente GRÁFICOS COLUNAS JUSTAPOSTAS escolher as três colunas e executar PERDIA NÃO PERDIA ANTES 11 9 DEPOIS 17 9 4 Verificação da incidência de dengue de acordo com a escolaridade Digite a tabela abaixo com as três colunas lembrse de não digitar a coluna total no BioEstat Fazer colunas justapostas e superpostas Verifiqueos gráficos ESCOLARIDADE SEM DENGUE COM DENGUE Totais Analfabeto 67 Fundamental 90 Médio 70 Superior 85 5 Preferência nas áreas de estudo classificadas por gênero HUMANAS EXATAS BIOLÓGICAS Totais FEMININO 88 MASCULINO 53 2023 Graduação Psicologia UEL Profa Dra Vanderli Marinho Melin 8 Uma boa leitura sobre uma parte da formação de Psicologia está no artigo de Cruz 2009 uma inserção do objetivo de Psicologia nas políticas públicas de assistência social Na pesquisa cujo objetivo foi investigar a inserção do psicólogo na política de assistência enfatizando sua atuação no Centro de Referência da Assistência Social CRAS fizeram a amostragem com 32 psicólogos de várias idades de Sergepe A pergunta tem carácter descritivo e exploratório e o instrumento do questionário que servir para coletar dados referentes aos dados possíveis formação e atuação caracterização do trabalho modo de atuação autovalidativas CRUZ 2009 Verifique a tabela abaixo e construa no mínimo 3 gráficos apropriados Tabela exa Tempo de formação e atuação dos Psicólogos entrevistados CRUZ 2009 p26 Tempo de Formação Tempo de Atuação em CRAS 1 ano ou menos 12 2 a 3 anos 6 4 a 6 anos 16 7 a 9 anos 2 Mais de 15 anos 1 NR 1 TOTAL 32 2023 Graduação Psicologia UEL Profa Dra Vanderli Marinho Melin 5 NOÇÕES DE PROBABILIDADE E APLICAÇÕES Espaços Amostrais Finitos Equiprováveis Quando associamos cada possibilidade ou elemento do espaço amostral a mesma probabilidade o espaço amostral chamase equiprovável ou uniforme Se S contém n elementos então a probabilidade de cada elemento ser é 1n Assim se há n elementos igualmente prováveis no espaço amostral S e r elementos no evento A então a probabilidade do evento A é PA rnúmerodecasosfavoráveisnúmerodecasospossíveis Atividade 51 A turma do 1º ano de psicologia comprou todos os números formados por três algarismos de uma rifa contendo números de 1 a 1000 Qual a probabilidade do número sorteado ser dessa turma Atividade 52 Se organize grupo dos possíveis estornos 5 rapazes com mais de 21 anos 4 rapazes com menos de 21 anos 6 garotas com mais de 21 anos e 3 garotas com menos de 21 anos Uma pessoa é escolhida ao acaso dentre as 18 Os seguintes eventos são definidos A a pessoa tem mais de 21 anos B a pessoa tem menos de 21 anos C a pessoa é um rapaz D a pessoa é uma moça Determinar a PB D b PA C a A probabilidade de ser uma moça 51 PROBABILIDADE CONDICIONAL Seja A e B dois eventos quaisquer associados ao experimento Denotese por PBA a probabilidade do evento B dada a título ocorrido Isso conduz a seguinte definição PBA PA BPA Atividade 53 Considerese 250 alunos que cursam o primeiro ciclo de uma faculdade Destes alunos 100 alunos são homens H e 150 são mulheres M 110 cursam Psicologia na turma 1 P1 e 140 cursam Psicologia na turma 2 P2 A distribuição dos alunos é mostrada no quadro abaixo Curso P1 P2 Total H 60 100 M 50 80 Totais 110 180 Um aluno é sorteado ao acaso Qual a probabilidade de que esteja cursando Psicologia na turma 1 dado que é mulher Teorema do Produto A partir da definição de probabilidade condicional podese enunciar o teorema do produto Se A e B são dois eventos do espaço amostral E de modo que o espaço amostral de A pode ser considerado como um deles pela probabilidade condicionada do outro dado o primeiro PA B PA PBA 2023 Graduação Psicologia UEL Profa Dra Vanderli Marinho Melin Per exemplo um RR2 indicando que os indivíduos do grupo exposto tiveram o dobro de risco de doencas que aqueles do grupo nãoexposto Arango 2012 observa que é importante notar que normalmente o fator de risco é maior que um RR1 pois supostamente o exposto ao fator de risco deve aumentar a frequência da condição Portanto quando o risco relativo resulta menor que um RR1 o fator passa a ser denominado fator de prevenção ou proteção Como exemplo de fator de prevenção mencionase a comprimentodecalça no ostropose em mulheres com mais de quarenta anos de idade Vejamos um exemplo teórico adaptado de Arango 2012 pg 155 que considera dois eventos associados a um conjunto de indivíduos O evento A alcoólatra e o evento C cirrose como dispostos na tabela a seguir Eventos A Não C A Não C A C Não Total T Geral De acordo com a probabilidade condicional podemos estimar a probabilidade de um indivíduo ter cirrose C dado que é alcoólatra A que escreveremos como PCA PANC PA e também a probabilidade de um indivíduo ter cirrose C dado que não é alcoólatra nãoA que escreveremos como PCnãoA PAnãoC PnãoA O risco adicional de estar um determinado condição ter cirrose devido ao fato de apresentar uma característica particular ser alcoólatra é chamado de risco relativo RR logo como especificado em Arango 2012 o risco relativo de um alcoólatra em relação à cirrose representa a probabilidade adicional que um alcoólatra desenvolve cirrose em relação ao indivíduo nãoalcoólatra RR PAC PAnãoA Obs Arango 2012 pg 156 alerta que o risco relativo somente deve ser empregado em estudos de coortes prospectivas e retrospetivas nos quais as proporções calculadas devem ser vistas como estimativas generalizadas Um coorte é um grupo de indivíduos que desempenham ou representam da população para a qual os resultados serão generalizados Segundo Pardo e Sépulveda 2007 pg 33 um estudo de coorte torna um grupo de indivíduos e portanto se organizam retrospectivamente tendo como meta estabelecer o que está relacionado a um determinado fator etiológico atrás da incidência da Residência de uma doença no futuro Cita ainda como exemplo dos estudos de coortes que investigam a relação entre diferentes fatores e doenças Como exemplo um estudo em 80 pacientes dados em Arango 2012 pg 157 Acolhimento Cirrose doença Sim 9 26 35 Não 2 11 13 Risco de doença em alcoólatras PCA 935 02571 Risco de doença entre nãoexpostos PCnãoA 245 00444 Kappa Pobs Pespera 075 06 015 Kappa 1 Pespera 1 06 04 logo existe uma leve concordância entre as avaliações dos dois psicólogos Atividade 513 Arango 2012 pg 178 ex 24 O quadro mostra resultados do trabalho de Sépuldan 1996 Neste caso os dados se referem a reprodutibilidade dos sinais físicos de anemia Sinal Clínico Presente II Presente III Ausente I Ausente II Palidez cutânea 21 15 26 82 Conjuntivite descorçada 23 14 10 86 Lábio língua descolorados 31 19 10 86 Palmas das mãos descoradas 17 6 15 105 Presente I sinal clínico presente segundo o exame I Presente II sinal clínico ausente segundo o exame II Considerando estas informações diferentes a Coeficiente Kappa seria a medida de residentes para os sinais físicos de anemia b Comente os resultados do item a justificando os motivos da maior e da menor concordância encontradas Atividade 514 A professora de análise do comportamento trouxe os resultados das avaliações de 150 pacientes feitos para ele por seu estatístico de forma independente Verifique em quantos casos concordam Interprete o resultado Professora Sim AVC Não houve Total A 783 717 1500 B 373 1281 1654 A Qual é a probabilidade de que o menor número de emblema seja cinco 00833 B Qual é a probabilidade de que o maior número de emblema seja cinco 005 11 Um apostador tem três opções para participar de certa modalidade de jogo que consiste no sorteio aleatório de um número entre três opções 1º opção comparar dois números para um único sorteio 2º opção comparar dois números em uma única sorteio num terceiro 3º opção comparar um número para cada sorteio num total de três sorteios Se X e Y Z representam as probabilidades do apostador ganhar algum prêmio escolha a X Y Z b XZ Y e Z Y Z b Z Y X é igual a escolha 2º opção a probabilidade do apostador não ganhar em qualquer dos sorteios é igual a 29 b 81 c 72 d 70 e 65 Distribuição Normal os espaços amostrais contínuos e as variáveis aleatórias contínuas ocorrem quando se trabalha com grandes que são medidas em escala continua Por exemplo a pressão arterial de uma pessoa o peso líquido de um pouco de alimento congelado etc Na prática interessamnos probabilidades associadas a intervalos ou regiões de um espaço amostral quando trabalhamos com distribuições contínuas e não probabilidades associadas a pontos individuais que é o caso quando trabalhamos com distribuições discretas DISTRIBUIÇÃO NORMAL Figura evidenciada é área sombreada ou seja PQZ1 TABELA 611 DISTRIBUIÇÃO NORMAL PADRONIZADA 72 AMOSTRAGEM NÃOPROBABILÍSTICA São opções que não permitem a retirada de uma amostra de forma aleatória pois em algumas situações a amostragem se torna arbitrária por exemplo ensaios de drogas vacinas técnicas cirúrgicas pesquisas de opinião Destaquemse as amostragens por Conveniência e por Quota Amostragem por Conveniência Nãoprobabilística Neste caso o pesquisador seleciona os membros da população dos quais é mais fácil obter informações Esse tipo de amostragem embora não aleatória é bastante utilizada na área de marketing grandemente nos amostras obtidas em teatros cinemas etc Neste caso é importante o senso crítico do pesquisador para evitar que por exemplo não selecionar sempre pessoas de mesmo sexo de mesma faixa etária etc Amostragem por Quotas Nãoprobabilística Esse tipo de amostragem assembleiase numa primeira fase com a amostragem estratificada proporcional A população é dividida em grupos e selecionase para fazer parte amostr Amostra O pesquisador pode dividir a população por grande número de grupos Este tipo de amostragem é muito usado em prévias eleitorais Observação a amostragem nãoprobabilística geralmente é influenciada por tendências preferências e fatores subjetivos pessoais diversos Cuidados com a amostragem Para que não haja erro na amostragem convém observar o seguinte a Definição do Universo que será amostrado face aos objetivos e definição do problema de pesquisa b Definição da unidade amostral que se fará a base de processo de seleção Exemplo em uma pesquisa poderia utilizarse como unidade amostral o domicílio ou a família definido operacionalmente ou quem será a família por exemplo só entrevistaremos aqueles que realmente são residentes e republicanos devem decidir o que consumo não existe gar Confiabilidade Se aplicarmos o estudo em metodologia semelhante devemos reconhecer resultados similares Entretanto Além disso ao extrair uma amostra de tamanho n 80 de uma população de tamanho N 2000 que consiste de quatro situações de tamanho N 500 N 1200 N 200 e N 100 Se a alocação deve ser proporcional qual a amostra 3 Suponha que a variável escolhida em estudo seja o peso de crianças recémnascidas e que a população seja infinita Pelas especificações do exercício anterior o desvio padrão σ é 045 Admitindo um nível de confiança de 95 e um erro amostral de 007 kg encontre n 4 Com os mesmos dados do exercício anterior 3 e que a população seja finita de crianças calcule o tamanho da amostra Vantagens da Amostragem Essas vantagens surgem quando a população é grande 1 Custo mais reduzido tomandose uma pequena fração da população os custos serão bem menores do que se procedesse ao censo 2 Maior rapidez devido ao fato de trabalhar com parte da população tomase menos rápido e coleta dos dados 3 Maior profundidade precisão em razão de se trabalhar com fração da população podese utilizar pessoas de alto nível e bem treinadas o que não seria possível com o censo devido ao tempo trabalho e custo 73 TAMANHO DA AMOSTRA É muito comum ao pesquisador indagar sobre o número de elementos para uma amostra quando pretende realizar uma pesquisa de campo laboratório ou uma simples investigação A determinação do tamanho da amostra depende de 3 fatores a Nível de confiança comumente são adotados 2 níveis o de 95 de probabilidade que emprega constante Z 196 ou de 99 de probabilidade cuja constante Z 258 É o nível de confiança que é depois da amostra O pesquisador poderá usar a confiança que deseja para os cálculos e valores se consultar à tabela distribuição Normal b Precisão em toda experimentação que pesquisa a utilização da amostra está condicionada a um erro amostral que nada mais é do que a diferença entre as estimativas amostrais e os parâmetros populacionais média e porcentagens A maior precisão que desejamos alcançar em nossos trabalhos implica no aumento da amostra selecionada c Variância ou percentagem em alguns estudos como esperadas características que apresentam determinados variabilidade Em outros estudos observamos a porcentagem de certos características em um conjunto Dependendo do tipo de investigação ou seja a variância ora usese a porcentagem Tamanho da amostra para média Quando se dispõe de variáveis quantitativas utilizamos as seguintes fórmulas n0 Z² σ² E² onde Z é o valor tabelado da distribuição normal Para α 5 bilateral o valor de z é 196 é p a estimativa da proporção q 1 p E é o erro amostral número de amostra para população finita N é o tamanho da população e n o tamanho da amostra Quando se trata de trabalho original e não dispõe de nenhum valor usase p 50 ou seja p0 q0 05 Em populações finitas são utilizadas as duas fórmulas e para populações infinitas e para as que N apresentam valor elevado usase a mesma primeira fórmula LISTA DE EXERCÍCIOS DE AMOSTRAGEM 1 Identifique o tipo de amostragem utilizada aleatória simples sistemática estratificada por conveniência e por quota a Um assessor de um candidato deseja reavaliar uma amostra aleatória de 20 das 7964 residências familiares de um município Para isto cria uma estrutura amostral atribuindolhes os números 0001 0002 7964 b Um administrador hospitalar faz uma pesquisa com as pessoas que estão na fila de espera para serem atendidas nos sistemas SUS centralizados o a cada 10 pessoas da fila c A empresa Samsung seleciona a cada 100º equipamento em sua linha de produção e faz um teste de qualidade d Um cálculo eleitoral escreveu o nome de cada senador do Brasil em cartões separados misturou e fez o sorteio e O programa de planejamento Familiar possuiu 300 homens sobre seus pontos de vista sobre o uso de anticoncepcionais f Em centros especializados de pesquisas hidráulicas pretende incluir 12 dos 67 municípios de uma região do Paraná em uma pesquisa de procura de água de subsolo Para tanto cria uma estrutura de divisão em várias amostras probabilísticas g Geramse mulheres determinadas para selecionarem números de série de carros a serem utilizados numa amostra de teste h Ao fazer uma pesquisa para o noticiário vespertino um repórter da TV entrevistou 20 pessoas que saiam do auditório do Teatro Cultura i Dentre 240 pessoas selecionadas para um sorteio de julho 60 são homens acima de 50 anos 70 são mulheres acima de 50 anos 55 são mulheres menores de 25 e 40 anos 82 INTERVALO DE CONFIANÇA PARA MÉDIA COM VARIANÇA POPULACIONAL DESCONHECIDA O procedimento anterior pode ser usado nesse caso desde que o tamanho da amostra seja maior ou igual a trinta n30 Estes procedimentos são aproximadamente válidos independentemente de a população ser ou não Normal isso se deve ao teorema central do limite TCL Entretanto quando a amostra for pequena e σ² for desconhecida teremos de fazer uma suposição sobre a forma da distribuição em estudo de que as populações das quais estamos extraindo amostras tenham aproximadamente a forma de distribuições normais Montgomery Runger 2003 pg 157 Quando esta suposição não foi realizada uma alternativa será usar procedimentos não paramétricos Quando σ² for desconhecida um procedimento lógico será trocar n na equação anterior por S desvio padrão da amostra A estatística de teste será t X μ S n graus de liberdade Mais especificamente chamadas de distribuição t de Student ou distribuição Student porque foi estabelecida originalmente por um estatístico WS Gosset que publicava trabalhos sob o pseudônimo de Student Para encontrar os valores de t2 consulte tabela da distribuição tStudent bilateral a seguir Atividade Sabese que o peso dos recémnascidos segue uma distribuição normal Se uma mostra aleatória simples de 25 deles obtém uma média de 3 kg e um desvio padrão de 05 kg calcule o intervalo de confiança para a média populacional que apresenta uma confiança de 95 TESTES DE HIPÓTESES DE UMA AMOSTRA O objetivo dos testes de hipóteses é verificar se suas verdades são verdadeiras as afirmações sobre os parâmetros de uma população e esta verificação é realizada com base nas informações das amostras 83 TESTE DE HIPÓTESES PARA A MÉDIA COM VARIANÇA POPULACIONAL CONHECIDA Na realização de um teste de hipóteses o primeiro é definir as hipóteses a serem testadas Primeiro chamamos de hipótese nula H0 a hipótese que será testada e de hipótese alternativa H1 a hipótese que aceitaremos caso a hipótese nula seja rejeitada H0 μ μ0 ou seja o parâmetro da população valor numérico H1 μ μ0 ou seja o parâmetro da população valor numérico Este é um teste bilateral e a região de aceitação da hipótese nula é dada como 1001α de confiança A hipótese alternativa pode ser unilateral quando nos interessa testar se o valor do parâmetro é maior ou menor que um determinado valor Tipos de erros em testes de hipóteses Acierto H0 Erro tipo I α alfa H0 falsa Decisão correta 1 β poder do teste A probabilidade de cometer o erro tipo I é α alfa A probabilidade de cometer o erro tipo II é beta esta probabilidade depende do tamanho da amostra e do valor do verdadeiro valor para H0 A aparência do um teste estatístico é a probabilidade de rejeitar a hipótese nula H0 quando a hipótese alternativa for verdadeira É calculada como 1β e interpretada como a probabilidade de rejeitar corretamente uma hipótese nula verdadeira Segundo analisar o teste comparando o estatístico do teste zcal com os valores tabelados de z no nível de significância α n graus de liberdade As regiões críticas regiões de rejeição da hipótese nula encontramse marcadas nos desenhos abaixo Quartos Conclusão Para os testes de hipóteses bilaterais encontrar os valores de t2 na TABELA 81 da distribuição tStudent bilateral Para os testes de hipóteses unilaterais encontrar o valor de t na TABELA 82 da distribuição tStudent unilateral TABELA 82 DISTRIBUIÇÃO t DE STUDENT UNILATERAL α 5 250 2 150 1 050 cv 0025 002 001 0005 1 63138 127067 158945 213205 328205 636567 2 23020 43027 48487 56128 69646 99248 3 31824 31824 44819 65447 80407 105943 4 27764 44936 70469 87877 96453 127060 5 25600 51612 73529 88379 10436 13284 6 24478 55853 76145 92976 126361 160935 7 23653 58921 79918 101044 14448 18525 8 23060 63967 83322 104234 14215 18887 9 22620 67433 85157 107621 14891 19290 10 22281 69301 88705 112052 15556 19685 11 22020 70247 90781 116913 16232 20015 12 21791 72323 92049 120867 16911 20217 13 21604 741 9385 125074 17601 20628 14 21445 73219 96561 128862 183052 21016 15 21309 74413 97349 135294 198125 22046 16 21209 75261 99353 144442 20421 22122 17 21100 76898 101247 147791 20769 22339 18 29990 77795 103556 15477 21177 22577 19 28780 78497 108403 161322 21659 23977 20 28125 80393 102022 167596 22040 24050 21 27491 80938 103742 176845 22438 24565 22 27113 81978 10734 182758 22720 25083 4 Os colaboradores 2002 realizaram estudo de genética do comportamento em uma amostra de 143 pessoas de dois sexos em Porto Alegre Uma das variáveis estudadas foi índice de rendimento de palavras devido ao ideal IPI estes problemas eram relativos à saúde e ao relacionamento com a família Na amostra estudada a média para a variável IPI foi de 1635 e o desvio padrão 83 Exemplo dado no livro CatellagJacques 2003 pg 66 Supondo que a amostra tenha divulgado que esta média de 35 anos use uma amostra para analisar se esta afirmação cumpre um nível de significância de 5 6 Uma associação de defesa do consumidor desconfiou que embalagens de 450 gramas de um certo tipo de biscoito estavam abaixo do peso Para verificar tal afirmação foram coletados ao menos 80 pacotes de vários supermercados obtendose uma média de peso de 447 gramas Admitindose que os dois pacotes seguiram mesmo modelo Normal com desvio padrão de 10 gramas que conclusão pode se tirar TRIOLA 2005 pg319 10 Para verificar a afirmação de que num serviço de ambulância 87 das chamadas recebidas referemse a casos de emergência de acidentes de trânsito envolvendo motocicletas Uma amostra relacionada de seus arquivos constase que em 500 chamadas 490 eram de emergências envolvendo motocicletas Se o α002 2 o que se pode concluir quanto a afirmação do serviço de ambulância 9 Uma pesquisa com 436 trabalhadores mostrou que 192 deles disseram considerar seriamente não ético o monitoramento dos emails dos empregados Quando 121 chefes do nível sênior foram pesquisados 40 disseram considerar seriamente não ético o monitoramento dos emails dos empregados com base em uma pesquisa da Gallup Use nível de significância α005 para testar a afirmativa de que para aqueles que disseram ser seriamente não ético o monitoramento dos emails dos empregados a proporção de empregados é menor do que a chefe TRIOLA 2005 p842 11 TESTES DE HIPÓTESES PARAMÉTRICOS DE 2 AMOSTRAS DEPENDENTES Neste teste cada elemento na amostra ou unidade amostral homogênea recebe ambas as condições das populações assim cada unidade produzirá um par de observações O íesimo par consiste na medição D X1i X2i onde i 1 2 n Se duas observações são retiradas de uma mesma unidade amostral elas também são independentes e neste caso podemos trabalhar com as amostras Podemos usar teste em par onde emparelhamento natural das observações nas amostras como no caso em que um grupo é testado duas vezes antes e depois de um tratamento Hipóteses nula H0 D1D2 Hipóteses alternativas H1 D1D2 ou H1 D1 D2 ou H1 D1 D2 Estatística de teste tcalc Σdiferencas² n1 onde Σdiferencas é a média amostral das diferenças e S² é o desvio padrão amostral das diferenças 12 TESTE DE HIPÓTESE NÃOPARAMÉTRICO DE 2 AMOSTRAS DEPENDENTES Nos casos em que os testes paramétricos por exemplo o teste t de duas amostras dependentes não puderam ser aplicado pela característica da variável ou por falta de normalidade por exemplo os testes nãoparamétricos são uma opção TESTE DE POSTOS SINAIS DE WILCOXON DUAS AMOSTRAS DEPENDENTES 1 CONSTRUIR AS HIPÓTESES DO TESTE As hipóteses são escritas da forma H0 As duas amostras provêm de populações com a mesma distribuição H1 As duas amostras provêm de populações com distribuições diferentes 2 ENCONTRAR A ESTATÍSTICA DO TESTE Observe que as duas amostras dependentes pareadas e sigas os passos de a a f a seguir a Determinar para as diferenças d x1 x2 m e n de cis dos casos b Aqui também será reduzido o total de elementos por pares iguais com diferença zero assim n é não ignorado da soma dos pares para cuja diferença não é zero c Ignore os sinais das diferenças e organize os números crescentemente substituindo cada valor pelo seu posto correspondente OBS As diferenças de modo numérico associa e as de dois postos equivale d Identificar cada posto sinal mais ou menos ignorando anteriormente Exemplo e Encontre a soma dos postos de sinais positivos T e a soma dos postos correspondentes ao grupo de sinais negativos T No exemplo valores absolutos dos postos positivos e dos postos negativos são T 71 59 6 1 3 34 3 12 2 1 T 21 5 f Considere a ESTATÍSTICA DO TESTE T menor das somas de postos de mesmo sinal OBS Da matemática interna que soma dos números inteiros de 1 na d código por mn1 13 TESTES DE HIPÓTESES NÃOPARAMÉTRICOS DE 2 AMOSTRAS INDEPENDENTES Nos casos em que se testam paramétricos por exemplo o teste t de duas amostras independentes não puder ser aplicado pela característica da variável ou por falta de normalidade por exemplo os testes nãoparamétricos são uma opção TESTE DE MANNWHITNEY DUAS AMOSTRAS INDEPENDENTES As amostras devem ser independentes e o nível de mensuração para as variáveis estudadas deve ser pelo menos ordinal A hipótese é de que as populações de onde as amostras foram extraídas têm a mesma distribuição O teste da soma de postos de Wilcoxon para duas amostras independentes é equivalente ao teste U de MannWhitney este teste pode ser encontrado em TRIOLA 2005 p63 506 e 507 SIEGEL e CASTELLAN JR 2006 pág 153 e em WALPOLE et al 2009 seção 163 pág 439 O teste da soma de postos de Wilcoxon ou teste de MannWhitney é um dos testes nãoparamétricos mais poderosos e é uma alternativa para o teste t no caso de duas amostras independentes Alguns nominaste teste de WilcoxonMannWhitney 1 CONSTRUIR AS HIPÓTESES DO TESTE Para o teste de WilcoxonMannWhitney as hipóteses podem ser escritas como H0 As duas amostras provêm de populações com a mesma distribuição Hi As duas amostras provêm de populações com distribuições diferentes As hipóteses podem ser estabelecidas em termos de mediana também como H0 H1 H2 H3 μA μB μA μB μA μB μA μB 2 ENCONTRAR A ESTATÍSTICA DO TESTE Observe que as amostras independentes são n e o número de observações da amostra 1 e e o número de observações da amostra 2 e siga os passos de a e às Aqui Junte as observações da amostra 2 e das amostras de forma que depois a n coloqueas em ordem crescente Atribua aos postos correspondentes seguindo o critério para empates na ocorrência de empates atribua a média dos postos correspondentes aos valores empatados e todos que participaram de mesma empatia Cuidado para não perder a referência de quem pertence a amostra A e quem pertence a amostra B Exemplo Unidades amostrais Amostra A 1 3 5 6 7 8 9 10 11 12 13 14 15 20 31 23 56 19 26 15 43 51 39 46 34 21 29 Postos A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Postos B 34 36 37 40 59 60 61 66 71 73 80 87 90 91 97 99 101 104 107 109 119 121 122 125 126 132 138 145 147 152 154 172 178 180 182 183 184 196 Exemplo Soma dos postos de A133 S Soma dos postos correspondentes a B2725 OBS Da matemática resulta que a soma dos movimentos ímpares de 1 a n e é dada por Soma A Soma B 2n²n2n1 149 51 11 20 9 3012 406 CÁLCULO DO PVALOR PELA APROXIMAÇÃO NORMAL Usando a estatística do teste colunmos e teste de acordo com o pvalor correspondente dado por Se Zcal é positivo o pvalor bilateral é dado por pvalor 2PZ Zcal Se Zcal é negativo o pvalor bilateral é dado por pvalor 2PZ Zcal Caso o teste t parâmetro seja adequado e mesmo assim se ele for o teste de Wilcoxon o podereficiência aproximase de 3 955 quando o número de elementos cresce e está próximo de 95 mesmo para amostras com tamanho moderado Portanto é uma excelente alternativa ao teste t parâmetro Siegel e Castellan Jr 2006 4 CONCLUIR O TESTE LISTA DE EXERCÍCIOS DE TESTES DE HIPÓTESES NÃOPARAMÉTRICOS PARA 2 AMOSTRAS INDEPENDENTES 1 adaptado de TRIOLA 2005 p511 Dados os índices de massa corporal IMC de Homens e Mulheres acima o nível de significância de 005 teste a afirmativa de que as duas amostras de IMC provêm de populações com a mesma distribuição IMC dos Homens IMC das Mulheres 238 216 249 224 263 244 241 252 264 239 244 251 272 281 318 320 319 326 321 382 307 232 328 290 281 296 238 275 295 199 285 340 229 313 209 328 259 264 252 231 314 7 4 6 12 14 11 16 18 22 23 26 32 29 26 30 35 31 369 38 30 32 38 39 40 50 1 Adaptado de Dancey e Reidy 2013 Os autores apresentam um exemplo onde avaliações foram feitas por participantes obtendo para alguns do bom humor 5 mulheres avaliadas neste grupo ou o teste existe diferença significativa entre as avaliações dadas pelos participantes na condição de BOM HUMOR e a condição de MAU HUMOR 7 4 6 14 11 17 8 9 3 Atividade TRIOLA 2005 p503 Os pares combinados de tempos em segundos obtidos de uma amostra aleatória de crianças às quais foram dados blocos com a instrução de construírem a torre mais alta possível com base em dados de cursos de Tower Building de Johnson e Courtney Child Development Vol 3 Esse procedimento é usado para medir a inteligência de crianças Testar a afirmativa de que não há diferença entre os tempos da primeira e segunda tentativas Criança A B C D E F G H I J K L M N O Primeira tentativa 30 19 29 72 78 42 100 12 17 31 52 Segunda tentativa 30 16 14 18 14 12 27 11 30 14 17 15 LISTA DE EXERCÍCIOS DE TESTES DE HIPÓTESES NÃOPARAMÉTRICOS PARA 2 AMOSTRAS DEPENDENTES 1 Dancey e Reidy 2013 apresentam o seguinte exercício Seis alunos que tinham fobia de caminhões avaliaram os seus medos 1 sem medo 5 medo extremo antes e depois de participarem de um programa comportamental criado para superar o medo A hipótese foi unilateral medo seria reduzido depois do programa Use Wilcoxon Participante Antes 1 5 3 4 2 4 Depois 1 4 2 5 4 4 4 17 20 105 31 8 14 17 1 4 3 3 5 Exercise SÔNIA VIEIRA 2003 p36 Imagine que para decidir pela compra de um dos tomógrafos fabricados por empresas diferentes o diretor de um instituto separou 20 crianças e fez duas tomas tomográficas de cada um usando primeiro um tomógrafo A e depois outro tomógrafo B Pediu então a um técnico que examinasse os tomógrafos e confirmasse a cada uma delas uma nota de 0 pessima a 5 excelente Os resultados estão na tabela a seguir Você está lidando com amostras dependentes porque foram feitas duas tomografias do mesmo criança Crianças 1 2 3 4 5 6 7 8 9 A 5 5 2 4 5 5 4 4 2 B 3 2 3 4 5 2 4 2 1 5 4 1 5 22 2 1 4 7 8 1 5 6 14 15 1 2 3 25 4 36 5 8 7 1 2 2 Exercise Para testar o efeito de um ansiolítico foi feito um ensaio clínico em oito pacientes que iriam se submeter a exodontias múltiplas Os níveis de ansiedade dos pacientes antes e depois de medicação foram registrados usando uma escala padrão Paciente 1 2 3 4 5 6 7 8 Antes 23 26 28 29 37 26 27 32 Depois 14 14 19 25 31 18 30 30 14 CORRELAÇÃO LINEAR SIMPLES Quando duas variáveis estão associadas por uma relação estatística dizemos que existe correlação entre elas O objetivo do coeficiente de correlação linear r é medir a intensidade da relação linear entre os valores quantitativos emparelhados de x e y em uma amostra Em algumas referências é comum encontrar este coeficiente nomeado como coeficiente de correlação de produto momento de Pearson em homenagem a Karl Pearson 18571936 que o desenvolveu originalmente Veja os diagramas de dispersão entre duas variáveis X e Y a seguir Não há Correlação linear Existe Correlação linear O coeficiente de correlação linear amostral é calculado pela fórmula CovXY r Sxy Sx Sy onde 1 r 1 se r 1 a correlação linear é positiva perfeita se r 1 a correlação linear é negativa perfeita se r 0 a correlação linear é nula Para facilitar os cálculos das somas dispõe os dados em colunas Sisticólica X Diastólica Y X² Y² XY 138 82 19044 6724 11316 130 91 16900 8281 11380 135 100 18225 10000 13500 140 19600 19600 14000 125 80 15625 6400 10000 120 70 14400 4900 8400 130 80 16900 6400 10400 130 80 16900 6400 10400 143 105 20449 11025 15015 129 85 16641 7225 10965 130 70 16900 4900 9100 150 100 22500 10000 15000 1875 1241 252 179 111459 567023 Profª Dra Vandreli Maria Melens 2023 Graduação Psicologia UEL 141 TESTE DE HIPÓTESE PARA O COEFICIENTE DE CORRELAÇÃO LINEAR POPULACIONAL ρ Para testar se existe correlação linear significativa usamos o TESTE DE HIPÓTESE onde as hipóteses são H₀ ρ 0 Não há correlação linear H₁ ρ 0 Há uma correlação linear A estatística do teste é tcal n 2 1 r² onde n é o número de pares de informações Conclusão OBS Os testes unilaterais onde a hipótese alternativa é H₁ ρ 0 ou H₁ ρ 0 também podem ser feitos Ficaremos aqui apenas com a hipótese bilateral para sabermos se a correlação é significativa ou não A direção de correlação pode ser observada no sinal do coeficiente de correlação Neste exemplo dos métodos de pressão sanguínea teste se a correlação é significativa LISTA DE EXERCÍCIOS DE CORRELAÇÃO 1 Quando a nicotina é absorvido pelo corpo produzse cotinina Uma medida de cotinina no corpo é portanto um bom indicador do quanto uma pessoa fuma Abaixo existem listados os números informados de cigarros fumados por dia e as quantidades medidas de cotinina em ngml Os valores são os sujeitos selecionados aleatoriamente na Pesquisa do Exame de Saúde Nacional americana Há diretrizes internas significativas Explicite o resultado Modelo Altura cm Peso kg X² Y² XY Niki Taylor 71 125 Claudia Schiffer 74 60 Elle MacPherson 72 128 Christy Turlington 71 57 Bridget Hall 76 56 Kate Moss 65 48 Valérie Mazza 72 67 Kristy Hume 71 115 Profª Dra Vandreli Maria Melens 2023 Graduação Psicologia UEL 15 REGRESSÃO LINEAR SIMPLES No estudo da correlação entre duas variáveis quantitativas o coeficiente de correlação linear é o mesmo não importando quem chamamos de X ou de Y Para estudar melhor o comportamento dessas variáveis uma em função da outra é de fundamental importância sabemos qual variável é independente X e qual é a variável dependente Y Por exemplo A quantidade de coitina é a variável que depende da quantidade de cigarros fumados logo cigarros fumados X é a variável independente e cotinina Y é a variável dependente Variável dependente Y Variável independente X Encontramos então uma equação de regressão que expressa uma relação entre X variável independente também chamada de variável preditora e Y estimada pela equação de regressão variável dependente também chamada de variável resposta Quando fazemos um estudo de uma determinada variável em função de uma outra fazemos uma análise de regressão que tem por objetivo descrever através de um modelo matemático a relação entre essas variáveis partindo de pares de observações x y Assim fazemos estudos para prever as vendas futuras de um produto em função de seu preço não é de colocar em função de seu IMC ou como podemos esperar certos alimentos em função de seu valor nutritivo ou em função do gasto propagado na TV etc Naturalmente dentro da regra pudéssemos prever uma quantidade exatamente em termos de outro mas isso permanecerá de possível Na maioria dos casos devemos contentarnos com a previsão de médias ou valores esperados Por exemplo devemos entender que a estimativa de quantidade continua que representa um sangue de fuminantes em função da quantidade de cigarros que ela fuma A previsão do valor médio de uma variável em termos do valor e valor es conhecidos e de outras variávelis constitui o problema da regressão Profª Dra Vandreli Maria Melens 2023 Graduação Psicologia UEL Nos dois gráficos anteriores verificase que a média de Y é uma função linear de x enquanto que o valor realmente observado de y não cai exatamente na linha reta Assim para um valor fixo de x um valor de Y é determinado em função do valor médio mais um termo de erro aleatório O modelo de regressão linear proposto é então Yi α bₓ₁ εi i 1 2 n onde α é o intercepto e β o coeficiente angular ambos parâmetros desconhecidos Para estimar estes coeficientes populacionais utilizamos o método dos mínimos quadrados e encontramos suas respectivas estimações amostrais Intercepto a α ỹ bẋ onde ỹ yn e x xn Coeficiente angular b b fracSxySxx onde Sxx x² x²n e Sxy xy xyn são somatórios que você já sabe calcular Ao invés de otimizar os erros εi ou seja ao ajuste de mínimos quadrados para os pares amostrais observados x₁y₁ x₂y₂ xnyn encontramos uma reta que passa o mais próximo possível de todos os pontos ao mesmo tempo ou seja obtemos a reta determinada pela ŷ a bₓ Atividade Nos exemplos vamos encontrar a equação de regressão ou seja as estimativas a e b dos parâmetros α e β respectivamente INTERPRETE OS RESULTADOS Também estimo o nível de confiança e o indivíduo lunar 15 cigarrosdia 2023 Graduação Psicologia UEL INTERVALOS DE CONFIANÇA PARA OS PARÂMETROS DA REGRESSÃO Os estimadores α e β são combinações lineares de y1 y2 yn logo também têm distribuição normal α b e um estimador não tendencioso da inclinação verdadeira β Eb β Vb σ² n2 SX² e epb g² sx² α a e um estimador não tendencioso da interseção verdadeira α Ea α Va σ² 1 fracsx²sx² epa σ² 1 fracsx²sx² De onde podemos definir os INTERVALOS DE CONFIANÇA 1 α100 para os parâmetros α e β respectivamente por α tn21α σ² frac1n fracsx²sx² α a tepa b tn21α σ² frac1sx² b b tepb Onde σ² fraci1n yi ŷ²n 2 5y bSxy 2023 Graduação Psicologia UEL TESTES DE HIPÓTESES PARA OS PARÂMETROS DA REGRESSÃO Suponha que desejamos testar a hipótese da inclinação ser igual a uma constante como β0 As hipóteses apropriadas são H₀ β β₀ H₁ β β₀ hipótese alternativa bilateral mas pode ser unilateral A estatística do teste t igual fracb β₀epb fracb β₀g² sx² de liberdade sujeito a H₀ β β₀ Um caso especial importante é quando testamos H₀ β 0 vs H₁ β 0 que se relacionam à significância da regressão Para testar a hipótese sobre a interseção ser igual a uma constante como α₀ As hipóteses apropriadas são H₀ α α₀ H₁ α α₀ hipótese alternativa bilateral mas pode ser unilateral A estatística do teste t é igual fraca α₀epα fraca α₀sqrt1 sx²sx² grau de liberdade sujeito a H₀ α α₀ Intervalo de Confiança para a Média Com o modelo de regressão ajustado ŷₐ α bₓ podemos prever estimar um valor de Y para um dado valor de x₀ este seria ŷₒ α bₓ₀ o intervalo de confiança para a média dos valores de Y para um dado valor de x ℝ é Pμx ŷₐ fractn 2 1 α2σ²n fracx₀ x²sx² Para o Exemplo de continuidade em questão o Intervalo de Confiança de 95 para a média fixando x18 cigarros por dia fica entre confira no gráfico a seguir 2023 Graduação Psicologia UEL 4 POESCHL G 2006 p257 e p167 Ficha 9 Um psicólogo de trabalho está interessado na relação entre Integração Visual Motor IVM coordenação olhomão e avaliação do trabalho dos empregados da divisão de produção de uma fábrica de instrumentos ópticos O investigador administra um teste do IVM a 20 empregados cujo trabalho é avaliado numa escala de 0 a 10 por um verificador O quadro abaixo apresenta os resultados obtidos 17 TESTES DE QUIQUADRADO e TESTE DE McNEMAR No capítulo 15 pe 129 do livro Bioestatística princípios e aplicações de autora Sidia M CallegariJacques temos que quando um número grande de variáveis qualitativas variáveis poliatômicas examinase a situação de um paciente dos sintomas melhora piora sem alteração ii os conceitos acima são avaliados A B C D E em tipos de estimativa ABO Nestes casos os variávels qualitativos podem dus aos dois categorias devemos trabalhar com o teste de quiquadrado desenvolvido por Karl Pearson em 1899 173 TESTE DE McNEMAR PARA SIGNIFICÂNCIA DE MUDANÇA Casos em que temos uma amostra e observamos duas características nos mesmos elementos da amostra As respostas a estas características são dicotômicas Ou nos casos em que observamos uma variável resposta ANTES e DEPOIS nos mesmos elementos da amostra onde cada elemento é utilizado como seu próprio controle e medido à ênfase na escala nominal ou ordinal TABELA 171 DISTRIBUIÇÃO DE χ² QUIQUADRADO 2 A tabela de contingência abaixo dá a quantidade de estudantes de Psicologia do ano de 2017 que fizeram ou não curso e estudaram anteriormente em escola pública ou particular Verifique se estas variáveis consideradas são dependentes e faça suas interpretações Fez curso Manteve o cursinho 34 31 14 79 Não fez cursinho 17 6 9 32 TOTAIS 51 37 23 111 3 Foi entrevistado 116 adultos e suas respostas classificadas pela escolaridade e por ter ou não consultado um psicólogo até o momento de entrevista A tabela de contingência abaixo dos resultados Verifique se estas variáveis consideradas são dependentes e faça suas interpretações Consultou 1 22 20 9 52 Não consultou 7 12 35 10 64 TOTAIS 8 34 55 19 116 4 Em uma Faculdade o desempenho esportivo dos alunos está sendo estudado para dois cursos diferentes Os cursos de Pedagogia e Psicologia ofereceram amostras que estão representadas abaixo Você acertou que os alunos desses dois cursos têm o mesmo desempenho ao nível de significância de 25 Desempenho Cursos BOM REGULAR RUIM TOTAIS PEDAGOGIA 65 70 45 180 PSICOLOGIA 27 103 20 150 TOTAIS 92 173 65 400 5 Estamos interessados em saber se a preferência por certo tipo de filme se altera com o estado civil Selecionamos pessoas em cada uma das subpopulações solteiro casado divorciado e viúvo Os resultados estão na tabela a seguir Faça uma análise com nível de significância de 005 α5 e conclua Filme Estado Civil Policial Comédia Romance Tamanho da amostra Solteiro 45 25 30 100 Casado 36 61 43 140 Divorciado 39 36 35 110 Viúvo 14 19 17 50 TOTAIS 400 6 Em estudo investiga a precisão dos atestados de óbito em hospitais Nos hospitais os resultados de 575 atestados foram comparados com as causas mais internas listadas nos hospitais Um dos hospitais que participaram do estudo era comunitário A e outro era universitário B Os dados são exibidos na tabela da pesquisa 23 Dentre os hospitais análise dos dados sugerem partes diferentes nos preenchimentos dos atestados de óbito nos hospitais Hospital 1 2 3 4 5 6 7 8 9 10 11 Precisão confirmada sem mudança 157 198 234 268 44 34 346 Total 425 64 91 580 7 Sonia Vieira Para estudar os efeitos de um fármaco indicado para casos de hipertensão Os 104 pacientes com mesmo perfil responderam questões antes e 12 semanas depois do tratamento No início 32 pacientes queixaramse de cefaleia e 72 não o fizeram No final do tratamento 19 dos 32 que se queixavam antes não tinham mais queixa de cefaleia um paciente queixouse Use nível de significância de 6 Complete a tabela e teste a hipótese de que o tratamento não tem efeito sobre as queixas de cefaleia QUEIXA ANTES DO TRATAMENTO Cefaleia sim 19 Cefaleia não 1 71 QUEIXA DEPOIS Cefaleia sim 1 19 Cefaleia não 16 71 8 O estudo tem amostras emparelhadas pareadas de dados dichotômicos Foram examinadas as mudanças no status de fumantes no período de dois anos com adultos maiores de 18 anos Em 1980 uma amostra de 2110 adultos foi solicitada para se identificar como fumantes Em 1982 esses mesmos indivíduos foram reentrevistados Dos 720 que fumavam em 1980 a fazer o 100 haviam parado Dos 1390 não fumantes 137 permaneceram em fume 73 começaram a fumar Existe associação de uma tendência do status de fumantes ao longo de dois anos estudos em 18 anos ou mais Em 1980 Antes 670 70 Não fumante Total 73 1317 1390 9 Para verificar a eficácia do tratamento contra peste negra 26 pacientes infectados foram analisados Apresentaram o seguinte resultado 15 pioram 10 melhoram 4 em situação estável permaneceram e 6 em situação crítica continuaram neste estado Teste de tratamento é eficaz com nível de significância de 6 Tabela Tratamento contra peste negra 26 pacientes infectados Antes Bem Mal Total 1 1 6 7 2 5 21