·

Cursos Gerais ·

Estatística 2

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Universidade Estadual de Londrina Lista de Exercícios Curso Ciências Sociais Disciplina 6STA002003 1 EMA702 Estatística Professora Ma Meiri Cardoso Data 2024 Valor 100 pts Nota atribuída Alunoa OBS A LISTA DEVERÁ SER ENTREGUE NO DIA DA AVALIAÇÃO 0410 Orientações Apresentar todo o raciocínio do exercício Nos testes de hipóteses e quiquadrado devem constar as hipóteses valor tabelado valor calculado e a conclusão detalhada Ex Rejeito há evidências suficientes para ao nível de 1 Um pesquisador está estudando a renda média das famílias de uma determinada cidade Ele seleciona aleatoriamente uma amostra de 50 famílias e ecotra uma média de renda mensal de R 5 00000 e desvio padrão populacional de R 1 00000 Calcule um intervalo de confiança de 95 para a média de renda mensal das famílias da cidade 2 Um sociólogo deseja estimar a proporção de indivíduos que estão insatisfeitos com um serviço público em uma determinada comunidade Ele coletou uma amostra aleatória de 200 residentes e descobriu que 40 deles estavam insatisfeitos O sociólogo deseja calcular um intervalo de confiança para essa proporção com um nível de confiança de 90 Qual é o intervalo de confiança para a proporção de indivíduos insatisfeitos com o serviço público 3 Um pesquisador deseja verificar se a média de salários de uma empresa é maior do que R 3 000 00 Para isso ele selecionou uma amostra de 25 funcionários e obteve uma média salarial de R 3 20000 com um desvio padrão de R 50000 Com um nível de significância de 5 o pesquisador pode afirmar que a média salarial é maior do que R 300000 4 Suponha que você é responsável por avaliar se a proporção de clientes satisfeitos em uma determinada loja é maior do que 80 Para isso coletou uma amostra aleatória de 200 clientes e encontrou que 170 deles estão satisfeitos O que podemos concluir ao nível de significância de 5 5 Uma oceanógrafa com base em uma amostra de tamanho n35 e ao nível de significância de 1 quer testar se a profundidade média do oceano em uma determinada área é de 724 metros conforme registrado O que ela decidirá se obtiver uma média de 732 metros e σ21 metros 6 Para estudar a efetividade de um determinado remédio alívio da dor após o tratamento de canal um cirurgiãodentista fez um experimento Antes do procedimento clínico administrou dois comprimidos de placebo para 50 pacientes grupo controle e dois comprimidos da droga para 150 pacientes grupo tratado Os comprimidos foram acondicionados em envelopes codificados para que o paciente não soubesse se estava recebendo o remédio em teste para o alívio da dor ou se estava recebendo placebo Distribuição dos pacientes segundo o grupo e o relato sobre dor Relato de dor Percentual de Grupo Sim Não Total pacientes com dor Controle 10 40 50 200 Tratado 15 135 150 100 Total 25 175 200 A probabilidade de relatar dor após o tratamento depende de o paciente ter recebido ou não o remédio Teste essa hipótese ao nível de significância de 5 7 Um pesquisador deseja verificar se a distribuição de opiniões sobre a eficácia de uma campanha de conscientização é a mesma entre dois grupos diferentes moradores da cidade e moradores da zona rural Ele entrevistou 200 pessoas sendo 100 da cidade e 100 da zona rural perguntando se achavam a campanha eficaz respostas Sim ou Não Os dados coletados estão na tabela a seguir Grupo Sim Não Total Cidade 60 40 100 Zona Rural 50 50 100 Total 110 90 200 Baseandose nos dados coletados o pesquisador quer saber se há evidências de que a distribuição de opiniões sobre a campanha de conscientização é homogênea entre os moradores da cidade e da zona rural Utilize um nível de significância de 5 para testar essa hipótese 8 Um psicólogo está investigando se existe uma relação entre o tempo dedicado ao estudo e a ansiedade préprova entre estudantes universitários Ele coletou dados de uma amostra de 10 estudantes registrando o número de horas dedicadas ao estudo na semana anterior à prova e a pontuação obtida em uma escala de ansiedade quanto maior a pontuação maior a ansiedade Os dados coletados estão apresentados na tabela a seguir Estudante Horas de Estudo X Pontuação de Ansiedade Y 1 5 7 2 8 6 3 3 9 4 6 5 5 4 8 6 7 4 7 2 10 8 9 3 9 10 2 10 1 10 Com base nesses dados a Calcule o coeficiente de correlação de Pearson r para avaliar a relação entre o número de horas de estudo e a pontuação de ansiedade b Interprete o valor do coeficiente de correlação no contexto da pesquisa Exercício 1 x z a2 σm x 50 5000 196 100050 5000 196 14142 a1 005 a2 196 σ 100000 5000 27778 5000 27778 527778 m 50 5000 27778 472222 Isso significa que com o intervalo de 95 de confiança podemos dizer que a média de renda das famílias das cidades está entre 472222 e R 527778 Exercício No 2 p z p1pm 02 x 08200 016 00008 p x 40 p 02 200 02 1645 x 00283 z 90 1645 m 200 02 00465 p 40 02 200 Assim o intervalo fica entre 01535 e 02465 ou seja aproximadamente 154 e 247 Por tanto o intervalo de confiança para a proporção de indivíduos insatisfeitos com o serviço público e entre aproximadamente Exercício 6 a325 Q005 F 196 A x 325 315 Massa específica a 1 atmosfera numa massa evidente suficiente para se calcular a media aritmética e desviovariamente referente da media hipotética de 724 A hipótese nula é rejeitada pois que a massa hipotética Exercício 4 H0 p 080 Alternativa H1 p 080 a 005 5 Z p p0 pqn05 085 080 050510005 100 D005 1645 Rejeitase H0 porque Z é maior que D005 O valor p 0003 é menor do que o nível de significância de 005 Ou seja a hipótese nula é rejeitada a 5 e conclui se que ha evidencias suficiente para rejeitar a hipótese de que a proporção de clientes satisfeitos do Banco P banco é maior que 80 008 Faixa clientes a hipótese nula e alternativa ruim de nao população targetana o banco segundo pesquisas feitas pela Exercício 5 a 001 1 Beta erro tipo II 01 Z P 233 Para níveis para conclusão se seja a margem de erro para dizer que a proporção da amostra que e maior ou igual que 08 80 tem que realizar o teste de hipotese para Z ZB O valor calculado Z P amostral P0raiz de P0Q0n 215 00024 21 AL 331215 208 225 E 0356 0355 D 0356 a 005 a 001 1 a 005 5 e 001 1 2335 245 Com esta razões a proporção de clientes satisfeitos para conclusão a uma margem x coded Xcelodde 39 ry 36 Qulcle Ho 34 31 25 031 04501034 118 25 2 St815 2518 2 50x 13 105 50x125 1335 2 25 635 E2 50 125 13 1815 15h 45 2 45 13 25 2 1o 6 38 voot 5 2 25 2 50 135 250 145 E1 2 490 1 15 050 145 09 7 15 150 050 40 25 14 06 70 m HUD 12 hel aate 130 71 1 ESTIMAÇÃO POR PONTO E POR INTERVALO Estimação É uma das maneiras utilizadas para fazer inferências sobre parâmetros a partir da amostra Estimador são estatísticas amostrais denotadas por uma função dos dados amostrais de um parâmetro sendo uma variável aleatória com uma distribuição de probabilidade Estimativa é o valor particular que o estimador assume para estimar um parâmetro populacional desconhecido Assim cada parâmetro possui estimadores pontuais calculados pelos estimadores Há dois tipos fundamentais de estimação por ponto pontual e por intervalo Estimação pontual É uma estimativa de um único valor para um parâmetro populacional Exemplo Um estudo foi realizado para entender os padrões de recuperação de indivíduos que participam de programas de reabilitação social Um grupo aleatório de 54 participantes que estavam envolvidos em atividades de reintegração social devido a problemas de adaptação em ambientes de trabalho foi questionado sobre o número de sessões de aconselhamento necessárias para se sentirem aptos a retornar ao ambiente profissional Com base nas respostas desses indivíduos devese calcular a estimativa pontual do número médio de sessões necessárias para a recuperação Portanto a estimativa pontual para as sessões realizadas para promover sua recuperação é de 12 4 sessões Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 2 Estimação Intervalar ou por intervalo A principal restrição da estimação pontual é que quando estimamos um parâmetro através de um único valor numérico toda a informação presente nos dados é resumida através deste número É importante encontrar também um intervalo de valores plausíveis para o parâmetro A ideia é construir um intervalo em torno da estimativa pontual de modo que ele tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro Ex Utilizando a estimativa pontual do exemplo anterior média12 4 Para formar a estimativa intervalar use a estimativa pontual como centro de intervalo Depois adicione ou subtraia desse valor a margem de erro margem de erro 21 Erro Padrão É uma medida de variação de uma média amostral em relação à média da população Sendo assim é uma medida que ajuda a verificar a confiabilidade da média amostral calculada Para obter uma estimativa do erro padrão basta dividir o desvio padrão pela raiz quadrada do tamanho amostral Intervalo de Confiança IC É uma estimativa que mostra o intervalo no qual o parâmetro se encontra com determinado nível de probabilidade Nível de Confiança Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 3 Probabilidade de um parâmetro populacional estar dentro do intervalo Representado por 1 α onde α é a probabilidade do parâmetro não estar no intervalo Valores de z mais comuns para 1α 99 95 e 90 Intervalos e níveis de Confiança Intervalo de Confiança IC para a média σ2conhecida 1 Condições Variância da população é conhecida A população é normalmente distribuída Amostras grandes n 30 2 Intervalo de confiança Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 4 Exemplo Em uma amostra de 100 pessoas foi encontrada uma média de 24 anos Sabendo que a variância das idades é de 16 anos construa um intervalo de 95 de confiança para a média Intervalo de Confiança IC para a média σ2 desconhecida 1 Condições Variância populacional é desconhecida Tamanho da amostra n30 A população é normalmente distribuída 2 Usar a distribuição t de Student Distribuição t de Student Obs Quando o número de graus de liberdade cresce a distribuição tende para a distribuição normal Após 30 gl a distribuição t está muito próxima da distribuição normal padrão z Determinar o valor crítico t para 95 de confiança quando o tamanho da amostra for 15 Solução gl n 1 15 1 14 Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 5 Exemplo Construa um intervalo com 95 de confiança para a média dos gastos mensais com alimentação e moradia considerando uma amostra com 25 dados média amostral de R 1 00000 e desvio padrão de R 40000 Intervalo de confiança para Proporção Em uma pesquisa eleitoral entre 2 800 eleitores 1316 decidiram que pretendem votar no candidato A Construa um intervalo de confiança de 95 para as intenções de voto para este candidato O intervalo de confiança da proporção pode ser representado da seguinte forma A estimativa pontual para p a proporção populacional de sucessos é dada pela proporção de sucessos em uma amostra e definida por onde x é o número de sucessos na amostra e n é o tamanho da amostra TESTES DE HIPÓTESES O planejamento da pesquisa deve permitir que o pesquisador teste suas conjecturas sobre o comportamento de uma variável ou a associação entre variáveis na população em estudo A população é considerada o mundo real e as conjecturas são as hipóteses de Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 6 pesquisa que podem ser verificadas por meio de técnicas estatísticas como testes de hipóteses ou de significância Exemplos a Na problemática de verificar se existe relação entre tabagismo e sexo em certa região podese lançar a seguinte hipótese Na região em estudo a propensão de fumar nos homens é diferente da que ocorre nas mulheres b Para se verificar o efeito de uma propaganda nas vendas de certo produto temse interesse em verificar a veracidade da hipótese A propaganda produz um efeito positivo nas vendas c Na condução de uma política educacional podese ter interesse em comparar dois métodos de ensino Hipótese Os métodos de ensino tendem a produzir resultados diferentes de aprendizagem Para verificar estatisticamente a veracidade de uma hipótese precisamos de um conjunto de dados observados adequadamente na população em estudo Antes de executar a coleta dos dados tornase fundamental fixar claramente a população a ser estudada bem como a maneira pela qual se vai observar as variáveis descritas nas hipóteses Por exemplo numa hipótese de associação entre sexo e tabagismo devemos definir a região de abrangência da pesquisa ou mais precisamente a população a ser estudada Também devemos estabelecer uma forma de medir a variável tabagismo Uma maneira razoavelmente simples de mensurar tabagismo é a partir de critérios previamente estabelecidos classificar os indivíduos em fumantes e não fumantes gerando dados categorizados Tabela 1 Distribuição de 300 pessoas classificadas segundo o sexo e tabagismo Na amostra a percentagem de homens fumantes 46 é diferente da percentagem de mulheres fumantes 38 os dados parecem comprovar a hipótese de que existe diferença entre homens e mulheres quanto à variável tabagismo Contudo não devemos nos esquecer de que estamos examinando uma amostra e consequentemente as diferenças observadas podem ter ocorrido por fatores casuais de tal forma que se tomássemos outras amostras da mesma população sob as mesmas condições as conclusões poderiam ser diferentes Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 7 A aplicação de um teste estatístico ou teste de significância serve para verificar se os dados fornecem evidência suficiente para que se possa aceitar como verdadeira a hipótese de pesquisa precavendose com certa segurança de que as diferenças observadas nos dados não são meramente casuais As hipóteses de um teste estatístico Dado um problema de pesquisa o pesquisador precisa saber escrever a chamada hipótese de trabalho ou hipótese nula H0 Essa hipótese é descrita em termos de parâmetros populacionais e é basicamente uma negação daquilo que o pesquisador deseja provar Exemplo Podemos ter as seguintes hipóteses nulas para os problemas descritos anteriormente H0 A proporção de homens fumantes é igual à proporção de mulheres fumantes na população em estudo H0 Em média as vendas não aumentam com a introdução da propaganda H0 Em média os dois métodos de ensino produzem os mesmos resultados Quando os dados mostrarem evidência suficiente de que a hipótese nula é falsa o teste a rejeita aceitando em seu lugar a chamada hipótese alternativa A hipótese alternativa é em geral aquilo que o pesquisador quer provar ou seja a própria hipótese de pesquisa considerando a forma do planejamento da pesquisa Exemplo As hipóteses alternativas H1 A proporção de homens fumantes é diferente da proporção de mulheres fumantes na população em estudo H1 Em média as vendas aumentam com a introdução da propaganda H1 Em média os dois métodos de ensino produzem resultados diferentes É comum H0 ser apresentada em termos de igualdade de parâmetros populacionais enquanto H1 em forma de desigualdade maior menor ou diferente Exemplo Suponha que se suspeite que uma certa moeda usada num jogo de azar é viciada isto é há uma tendência de ocorrerem mais caras do que coroas ou mais coroas do que caras Entendendose como moeda honesta aquela que tem a mesma probabilidade de dar cara e coroa podemos formular as hipóteses da seguinte maneira Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 8 H0a moeda é honesta H0 µ 05 H1a moeda é viciada H1 µ 05 pvalor O pvalor é uma medida estatística que ajuda a determinar a significância dos resultados de um teste de hipótese Em termos simples ele quantifica a probabilidade de observarmos um resultado tão extremo quanto ou mais extremo que o resultado obtido nos dados amostrais sob a suposição de que a hipótese nula H0 é verdadeira Por convenção se o pvalor for menor do que 005 p 005 concluise que a hipótese da nulidade deve ser rejeitada Exemplo Suponha que estamos testando se uma moeda é justa isto é a probabilidade de dar cara ou coroa é 50 A hipótese nula seria que a moeda é justa 1º lançamento coroa 50 2º lançamento coroa 25 3º lançamento coroa 125 4º lançamento coroa 625 5º lançamento coroa 3125 é uma probabilidade pequena mas poderia concluir que a moeda é viciada Essa probabilidade é o pvalor Nível de significância Representado pela letra grega α Em pesquisa social é comum adotar nível de significância de 5 isto é α 005 Conhecido por Erro Tipo I que é a probabilidade de se rejeitar a hipótese nula quando ela é verdadeira Esse valor não é calculado mas escolhido de acordo com quanto de erro estamos dispostos a cometer geralmente 1 5 e 10 Tipos de Erros Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 9 Erro tipo I rejeito H0quando H0 é verdadeira probabilidade α Por exemplo O médico diz ao paciente masculino que está grávido H0 paciente não está grávido H1 paciente está grávido Conclusão Médico concluiu que o paciente está grávido Os pesquisadores consideram grave o erro de rejeitar a hipótese da nulidade quando ela é verdadeira Isso significa mudar padrões e comportamentos sem necessidade Erro tipo II não rejeito H0 quando H0 é falso probabilidade β Por exemplo O médico diz a paciente feminino que ela não está grávida sendo que ela está grávida H0 paciente não está grávida H1 paciente está grávida Conclusão Médico concluiu que a paciente não está grávida Passos para a construção do teste de hipóteses Passo 1 Fixe qual a hipótese H0 a ser testada e qual a hipótese alternativa H1 Passo 2 Use a teoria estatística e as informações disponíveis para decidir qual estatística estimador será usada para testar a hipótese H0 Obter as propriedades dessa estatística distribuição média desvio padrão Passo 3 Fixe a probabilidade α de cometer o erro de tipo I e use este valor para construir a região crítica regra de decisão Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 10 Passo 4 Use as observações da amostra para calcular o valor da estatística do teste Passo 5 Se o valor da estatística calculado com os dados da amostra não pertencer à região crítica não rejeite H0 caso contrário rejeite H0 Quando usamos o teste Z ou o teste t Lateralidade Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 11 Teste para a proporção Onde p proporção de sucesso na população q proporção de fracasso na população q 1 p p chapéu sucesso da amostra Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 1 TESTES DE QUIQUADRADO χ2 Tabela de contingência 2x2 Para que serve Uma tabela de contingência 2x2 é uma matriz que organiza dados categóricos para duas variáveis cada uma com duas categorias possíveis É amplamente utilizada para examinar a associação entre essas duas variáveis Imagine que estamos investigando a relação entre dois aspectos em uma pesquisa Por exemplo a relação entre gênero masculino feminino e preferência por um tipo de mídia televisão internet Onde a Número de homens que preferem televisão b Número de homens que preferem internet c Número de mulheres que preferem televisão d Número de mulheres que preferem internet N Total de pessoas na pesquisa a b c d Testes em Tabelas de Contingência 2x2 Quando utilizamos uma tabela de contingência 2x2 muitas vezes queremos saber se a associação entre as duas variáveis é significativa ou seja se a relação observada na tabela é realmente real ou apenas fruto do acaso Teste QuiQuadrado χ2 Objetivo O teste QuiQuadrado verifica se existe uma associação significativa entre as duas variáveis categóricas Teste χ2 de independência que objetiva verificar se existe associação dependência entre duas variáveis qualitativas Teste χ2 de homogeneidade entre populações que objetiva comparar duas ou mais populações com relação a uma variável categórica Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 2 Teste QuiQuadrado χ2 de independência Os testes de independência envolvem duas variáveis e o que se testa é a hipótese de que as duas variáveis são estatisticamente independentes A independência implica que o conhecimento da categoria na qual se classifica uma observação com respeito a uma variável não afeta a probabilidade de estar em uma das diversas categorias da outra variável Este teste chamado de teste quiquadrado χ2 de independência se baseia na comparação entre as frequências observadas e esperadas As frequências observadas são colocadas numa tabela de dupla entrada chamada de Tabela de Contingência LxC onde as frequências observadas Fo ij ocupam L linhas e C colunas As hipóteses para este teste são H0 As duas variáveis são independentes H1 As duas variáveis não são independentes são dependentes A estatística do teste compara a frequência observada coletada na amostra com a frequência esperada de cada célula na tabela conjunta das duas variáveis Onde as frequências esperadas são calculadas com base na hipótese nula como Passos para o cálculo 1 Frequências Esperadas Calcule a frequência esperada em cada célula supondo que não existe associação A fórmula para calcular a frequência esperada para cada célula é Cálculo do QuiQuadrado Com as frequências esperadas podemos calcular o valor do QuiQuadrado usando a fórmula Onde O são as frequências observadas e E as frequências esperadas Para decidir se a hipótese nula pode ser rejeitada ou não verificamos se χ2 calculado está ou não na região crítica com nível alfa α de significância Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 3 O valor q que separa a região crítica alfa α é encontrado na tabela de QuiQuadrado com L1C1 graus de liberdade φ Grau de liberdades Nas tabelas 2 x 2 o valor de χ2 esta associado a 1 grau de liberdade porque tem duas variáveis que X e Y cada variável tem duas categorias tem 1 grau de liberdade para cada variável o valor de χ2 está então associado a 1 x 1 1 grau de liberdade Exemplo 1 Vamos supor que em uma pesquisa com 100 pessoas os resultados foram os seguintes H0 Não há associação entre gênero e preferência por tipo de mídia as variáveis são independentes H1 Há uma associação entre gênero e preferência por tipo de mídia as variáveis não são independentes Teste quiquadrado de Homogeneidade Este teste consiste em verificar se uma variável aleatória se comporta de modo similar ou homogêneo em várias subpopulações Os cálculos deste teste são realizados da mesma forma que os testes de independência A diferença entre eles está na forma com que as Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 4 amostras são coletadas nos testes de homogeneidade os totais das subpopulações são fixados antes da coleta dos dados As hipóteses para o teste de homogeneidade também são diferentes aqui se testa as hipóteses H0 A variável se comporta de forma homogênea em várias subpopulações H1 A variável se comporta de forma heterogênea em várias subpopulações O cálculo da estatística do teste é feito da mesma forma que no teste de independência A conclusão também é feita com o mesmo critério se χ2 calculado q a hipótese nula pode ser rejeitada e dizemos que a variável NÃO se comporta de forma homogênea nas várias subpopulações Exemplo 2 Imagine que você quer verificar se a preferência por café ou chá é a mesma em dois diferentes escritórios Escritório A e Escritório B Para isso você coleta dados de uma amostra de 200 funcionários 100 de cada escritório e obtém as seguintes informações Escritório A 70 preferem café e 30 preferem chá Escritório B 60 preferem café e 40 preferem chá Pergunta A preferência por café ou chá é homogênea entre os dois escritórios α5 H0 A distribuição da preferência por café e chá é homogênea entre os dois escritórios H1 A distribuição da preferência por café e chá não é homogênea entre os dois escritórios Correlação linear de Pearson A correlação linear de Pearson é uma medida estatística que quantifica a força e a direção da relação linear entre duas variáveis quantitativas O coeficiente de correlação de Pearson denotado por r varia entre 1 e 1 onde r1 Indica uma relação linear positiva perfeita ou seja conforme uma variável aumenta a outra também aumenta de forma proporcional r1 Indica uma relação linear negativa perfeita ou seja conforme uma variável aumenta a outra diminui de forma proporcional r0 Indica que não há uma relação linear entre as duas variáveis Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 5 Para qualquer conjunto de dados o valor do coeficiente de correlação de Pearson r estará no intervalo de 1 a 1 Será tão mais próximo de 1 ou 1 quanto mais forte for a correlação nos dados observados Teremos 1 se os pontos estiverem exatamente sobre uma reta ascendente correlação positiva perfeita Por outro lado teremos r 1 se os pontos estiverem exatamente sobre uma reta descendente correlação negativa perfeita Quando não houver correlação nos dados r acusará um valor próximo de O zero Cálculo de r Exemplo 1 Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 6 Esses dados indicam que há uma forte correlação linear positiva Exemplo 2 Imagine que estamos estudando a relação entre anos de escolaridade X e renda mensal Y de um grupo de pessoas Suponha que os dados coletados sejam Pessoa 1 8 anos de escolaridade Renda 2 mil reais Pessoa 2 10 anos de escolaridade Renda 3 mil reais Pessoa 3 12 anos de escolaridade Renda 35 mil reais Pessoa 4 14 anos de escolaridade Renda 4 mil reais Pessoa 5 16 anos de escolaridade Renda 5 mil reais Esses dados indicam que conforme os anos de escolaridade aumentam a renda mensal também tende a aumentar Podemos suspeitar que exista uma relação linear positiva entre as duas variáveis Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL 7 Profa Ma Meiri Cardoso 2024 Graduação Ciências Sociais UEL continarmção 2 134 c 247 isso sinal que parsomos qui entre esses valores está a verdadeira percpctagilo de tatsfiados na população EXERCICIO 3 X 320000 NR N4 32003000 2000 S 4 50000 Ep 5 V 500 25 500 100 m 25 t 100 2 I m1 25 4 valor crítico de 005 c 275 27 t 2 valor crítico 27 1 t 27 que 27 Pode fornos a resolução perfeita a hipótese nula existem evidencias suficientes para afirma que a média salarial da empresa é maior que 300 t 1 O nível de confiança de 95 corresponde a um nível de significância α de 5 Como o intervalo é bicaudal α2 0025 O valor crítico de z correspondente para α2 0025 é 196 EPM σ n 1000 50 1000 7071 14142 IC x z EPM Substituindo os valores IC 5000 196 14142 IC 5000 27718 O intervalo de confiança de 95 para a renda média mensal das famílias da cidade é IC 5000 27718 5000 27718 IC 472282 527718 Portanto o intervalo de confiança de 95 para a média da renda mensal das famílias está entre R 472282 e R 527718 2 p 40 200 020 O nível de confiança de 90 corresponde a um nível de significância α de 10 Como o intervalo é bicaudal α2 005 O valor crítico de z correspondente para α2 005 é 1645 EPp p1p n 020 1020 200 016 200 00008 00283 IC p z EPp 1 Substituindo os valores IC 0 20 1 645 0 0283 IC 0 20 0 0465 O intervalo de confiança para a proporção de indivíduos insatisfeitos é IC 0 20 0 0465 0 20 0 0465 IC 0 1535 0 2465 Resposta O intervalo de confiança de 90 para a proporção de indivíduos insatisfeitos com o serviço público está entre 1535 e 2465 3 Hipóteses H0 hipótese nula µ 3000 A média salarial não é maior que R 300000 H1 hipótese alternativa µ 3000 A média salarial é maior que R 300000 t x µ0 s n Substituindo os valores t 3200 3000 500 25 200 500 5 200 100 2 0 Como o teste é unilateral e o nível de significância é de 5 o valor crítico de tα para n 1 24 graus de liberdade gl e α 0 05 é obtido da tabela t de Student O valor crítico para t24005 é aproximadamente 1711 Como t 2 0 é maior que tα 1 711 rejeitamos a hipótese nula 2 Como tcalculado tcrtico rejeitamos H0 Portanto há evidências suficientes para afirmar que a média salarial da empresa é maior que R 300000 ao nível de significância de 5 4 Hipóteses H0 hipótese nula p 080 A proporção de clientes satisfeitos não é maior que 80 H1 hipótese alternativa p 080 A proporção de clientes satisfeitos é maior que 80 z pp0 sqrtp01p0n Substituindo os valores z 085080 sqrt0801080200 z 005 sqrt080020200 005 sqrt00008 005 002828 1768 Como o teste é unilateral e o nível de significância é de 5 o valor crítico de zα para α005 é aproximadamente 1645 Como z 1768 é maior que zα 1645 rejeitamos a hipótese nula Como zcalculado zcrtico rejeitamos H0 Portanto há evidências suficientes para afirmar que a proporção de clientes satisfeitos é maior que 80 ao nível de significância de 5 5 Hipóteses H0 hipótese nula μ 724 A profundidade média é igual a 724 metros H1 hipótese alternativa µ 72 4 A profundidade média é diferente de 724 metros z x µ0 σ n Substituindo os valores z 73 2 72 4 21 35 0 8 21 5916 0 8 0 3549 2 254 Como o teste é bicaudal e o nível de significância é de 1 α2 0 005 O valor crítico de zα2 para α2 0 005 é aproximadamente 2576 Como z 2 254 é menor que zα2 2 576 não rejeitamos a hipótese nula Como zcalculado zcrtico não rejeitamos H0 Portanto não há evi dências suficientes para afirmar que a profundidade média do oceano nessa área é diferente de 724 metros ao nível de significância de 1 6 H0 hipótese nula A probabilidade de relatar dor não depende do paciente ter recebido o remédio as variáveis são independentes H1 hipótese alternativa A probabilidade de relatar dor depende do paciente ter recebido o remédio as variáveis não são independentes Eij Total da linha Total da coluna Total geral Para E11 controle sim 5025 200 6 25 Para E12 controle não 50175 200 43 75 Para E21 tratado sim 15025 200 18 75 Para E22 tratado não 150175 200 131 25 4 Grupo Sim Dor Não Sem Dor Total Controle 625 4375 50 Tratado 1875 13125 150 Total 25 175 200 χ2OijEij2Eij Calculando para cada célula χ2106252625404375243751518752187513513125213125 χ237526253752437537521875375213125 χ214066251406437514061875140613125 χ2225032075011343 Para um nível de significância de 5 α005 e com 1 grau de liberdade 21211 o valor crítico de quiquadrado é aproximadamente 3841 Como χ2343 é menor que o valor crítico de 3841 não rejeitamos a hipótese nula Conclusão Não há evidências suficientes para concluir que a probabilidade de relatar dor após o tratamento depende de o paciente ter recebido ou não o remédio ao nível de significância de 5 H1 hipótese alternativa A distribuição de opiniões não é homogênea entre os dois grupos as variáveis não são independentes EijTotal da linhaTotal da colunaTotal geral Para E11 Cidade Sim 10011020055 Para E12 Cidade Não 1009020045 Para E21 Zona Rural Sim 10011020055 Para E22 Zona Rural Não 1009020045 Grupo Sim Não Total Cidade 55 45 100 Zona Rural 55 45 100 Total 110 90 200 χ2OijEij2Eij Calculando para cada célula χ26055255404524550552555045245 χ25255524552555245 χ22555254525552545 χ204545055560454505556202 Para um nível de significância de 5 α005 e com 1 grau de liberdade 21211 o valor crítico de quiquadrado é aproximadamente 3841 Como χ2202 é menor que o valor crítico de 3841 não rejeitamos a hipótese nula Conclusão Não há evidências suficientes para concluir que a distribuição de opiniões sobre a eficácia da campanha de conscientização difere entre os moradores da cidade e da zona rural ao nível de significância de 5 8 a X 5 8 3 6 4 7 2 9 10 1 55 Y 7 6 9 5 8 4 10 3 2 10 64 XY 5786396548742109 3102110 35482730322820272010 277 X² 5²8²3²6²4²7²2²9²10²1² 25 64 9 36 16 49 4 81 100 1 385 Y² 7²6²9²5²8²4²10²3²2²10² 49 36 81 25 64 16 100 9 4 100 484 r n XY X Y n X² X²n Y² Y² Substituindo os valores r 10 277 55 64 10 385 55²10 484 64² Numerador 10 277 2770 55 64 3520 Numerador 2770 3520 750 Denominador 10 385 3850 55² 3025 10 484 4840 64² 4096 Denominador 3850 30254840 4096 825 744 613800 78343 r 750 78343 0957 b O valor do coeficiente de correlação de Pearson r 0957 indica uma correlação negativa muito forte entre o número de horas de estudo e a pontuação de ansiedade Isso significa que conforme o número de horas de estudo aumenta a pontuação de ansiedade tende a diminuir de forma significativa Em outras palavras quanto mais tempo os estudantes dedicam ao estudo menor é a ansiedade antes da prova