·

Cursos Gerais ·

Cálculo 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Distribuição de Probabilidade Quiquadrado Introdução É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis categóricas nominais e avaliar a associação existente entre variáveis qualitativas TESTE NÃO PARAMÉTRICO não depende de parâmetros populacionais média e variância O princípio básico deste teste é comparar proporções ou seja possíveis divergências entre as frequências observadas e esperadas para um certo evento Aplicações do teste O teste é utilizado para Verificar se a frequência com que um determinado acontecimento observado em uma amostra se desvia significativamente ou não da frequência com que ele é esperado Condições Os grupos devem ser independentes Os itens de cada grupo são selecionados aleatoriamente As observações devem ser frequências ou contagens Cada observação pertence a uma e somente uma categoria A amostra deve ser relativamente grande pelo menos 5 observações em cada célula e no caso de poucos grupos pelo menos 10 Exemplo em tabelas 2x 2 A estatística quiquadrado é dada por Valores de X² menores que 3841 têm 95 de probabilidade de ocorrência Valores de X² menores que 6635 têm 99 de probabilidade de ocorrência TESTE DE HIPÓTESES Hipótese nula H0 frequências observadas frequências esperadas Não há associação entre os grupos casualidade Hipótese alternativa H1 as frequências observadas frequências esperadas Os grupos estão associados Nível de significância 𝛼 significa o risco de se rejeitar uma hipótese verdadeira Deverá ser estabelecido antes da análise de dados e é usualmente fixado em 5 P005 O valor de X² ao nível de significância 𝛼 é denominado qui quadrado crítico ou tabelado 𝜒 2 c Graus de Liberdade GL é a diferença entre o numero de classes de resultados e o número de informações da amostra que são necessários ao cálculo dos valores esperados nessas classes TESTE DE ADERÊNCIA CONCORDÂNCIA Testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados Exemplo 1 Na população branca a proporção de indivíduos sensíveis insensíveis à feniltiocarbamida PTC é 7 3 Em uma amostra de 240 pessoas brancas com problemas de tireóide foram encontradas 144 sensíveis Considerando que o fenótipo sensível é dominante sobre o insensível análise os dados obtidos e tire uma conclusão α 005 Ho em pessoas brancas com problemas de tireóide o fenótipo sensível à feniltiocarbamida PTC é dominante sobre o fenótipo insensível OE H1 em pessoas brancas com problemas de tireóide o fenótipo sensível à feniltiocarbamida PTC não é dominante OE Determinação do x² tabela α 005 Graus de liberdade categorias 1 2 1 1 categorias 2 sensível e insensível X² 0051 384 Distribuição Quiquadrado Determinação do x² calculado OBSERVADO sensíveis insensíveis 7 3 total proporção 10 ESPERADO Sensível 144 240 710 168 Insensível 96 240 310 72 Total 240 240 X² calc Σ O E² E X² calc 144 168² 168 96 72² 72 3248 8 11428 Decisão X² calc X² tab rejeitase Ho 11428 384 Conclusão Entre as pessoas brancas com problemas de tireóide o fenótipo sensível à feniltiocarbamida PTC não é dominante sobre o fenótipo insensível ou seja entre as pessoas brancas com problema de tireóide a proporção de pessoas sensíveis à PTC é menor do que na população branca em geral Como determinar o número de graus de mero de graus de liberdade liberdade Contar o número de linhas da tabela original de dados Subtrair 1 desse número Então GLIB L1 Exemplo 𝛂 005 gl11 Distribuição QuiQuadrado Nível de Significância Graus de Liberdade 995 0995 99 099 975 0975 95 095 90 090 10 010 5 005 25 0025 1 001 05 0005 1 0001 0004 0016 2706 3841 5024 6635 7879 2 0010 0020 0051 0103 0211 4605 5991 7378 9210 10597 3 0072 0115 0216 0352 0584 6251 7815 9348 11345 12838 4 0207 0297 0484 0711 1064 7779 9488 11143 13277 14860 5 0412 0554 0831 1145 1610 9236 11071 12833 15086 16750 6 0676 0872 1237 1635 2204 10645 12592 14449 16812 18548 7 0989 1239 1690 2167 2833 12017 14067 16013 18475 20278 8 1344 1646 2180 2733 3490 13362 15507 17535 20090 21955 9 1735 2088 2700 3325 4168 14684 16919 19023 21666 23589 10 2156 2558 3247 3940 4865 15987 18307 20483 23209 25188 11 2603 3053 3816 4575 5578 17275 19675 21920 24725 26757 12 3074 3571 4404 5226 6304 18549 21026 23337 26217 28299 13 3565 4107 5009 5892 7042 19812 22362 24736 27688 29819 14 4075 4660 5629 6571 7790 21064 23685 26119 29141 31319 15 4601 5229 6262 7261 8547 22307 24996 27488 30578 32801 16 5142 5812 6908 7962 9312 23542 26296 28845 32000 34267 17 5697 6408 7564 8672 10085 24769 27587 30191 33409 35718 18 6265 7015 8231 9390 10865 25989 28869 31526 34805 37156 10 Como consultar a tábua QQ Localizar o α Determinar o número de Graus de Liberdade GLIB Cruzar α com GLIB e ler o valor de Xc² 17 Na população branca a proporção de indivíduos sensíveis e insensíveis à uma determinada doença é de 73 Em uma amostra de 200 pessoas brancas com problemas de tireóide foram encontradas 120 sensíveis Observe a figura dada e determine o valor de χ²tabelado e χ²calculado a um nível de significância α 005 Observado Sensíveis Insensíveis 73 Total proporção10 Esperado sensível 120 200 x 7 10140 140 Insensível 80 200 x 3 1060 60 Total 200 200 χ²calculado Σ oe² e 120140² 140 8060² 60 400 140 400 60 2857 6666 9524 Referências DAROIT Luciane Utilização de Ferramentas Computacionais visando a uma Aprendizagem Significativa em Bioestatística Lajeado 2009 Q quadrado e Distribuição de Probabilidade T Student Profª Berenice de Oliveira Bona 1 Dada a distribuição quiquadrado com n14 graus de liberdade calcule a média a variância e o desvio padrão Média X Xn n ou seja a média de uma distribuição quiquadrado é igual ao grau de liberdade Variância S² S² 2n ou seja a variância é igual ao dobro do grau de liberdade𝜒 Desvio padrão S Basta tirar a raiz quadrada da variância Respostas Média Xn14 Variância S² 21228 Desvio padrão S Raiz quadrada de 28 2 Qual o valor de 𝝌² quiquadrado tabelado com graus de liberdade 12 e nível de significância 𝜶 005 𝛂 005 gl12 21026 O valor de χ² quiquadrado tabelado com graus de liberdade 2 e nível de significância α 005 Solução α 005 gl2 5991 χ²calculado 954 maior que χ²tabelado 5991 4 Uma moeda é lançada 200 vezes e verificase 110 caras e 90 coroas Testar a honestidade da moeda utilizando o teste quiquadrado sendo alfa α010 5 Numa competição esportiva cinco atletas estão disputando as três primeiras colocações da prova de salto em distância A classificação será pela ordem decrescente da média aritmética de pontos obtidos por eles após três saltos consecutivos na prova Em caso de empate o critério adotado será a ordem crescente do valor da variância A pontuação de cada atleta está apresentada na tabela a seguir Solução Vamos começar calculando a média aritmética de cada atleta Como todos estão empatados iremos calcular a variância Como a classificação é feita pela ordem decrescente da variância então o primeiro colocado será o atleta A seguido do atleta C e E Alternativa e A C E 6Sabemos que a vida útil de determinado componente elétrico segue uma distribuição normal com média λ 2000 horas e desvio padrão S 200 horas Qual é a probabilidade de que um componente elétrico aleatoriamente selecionado dure entre 2000 e 2400 horas Observe a área sob a curva correspondente ao intervalo de 2000 a 2400 HORAS A fronteira inferior do intervalo está na média da distribuição e portanto está no valor z 0 A fronteira superior do intervalo em termos de valor de z é z XλS 2400 2000200 20 De acordo com a Tabela 35 verificamos que P0 z 20 04772 Portanto P2000 X 2400 04772 ou 4772 Expectativa de vida útil do componente 7 Uma pesquisa com 100 pessoas mediu o tempo de reação para frear um carro em milissegundos O valor médio obtido foi de 180ms com desvio padrão de 50ms Considerando que o tempo de reação é normalmente distribuído qual é a probabilidade de encontrar entre as 100 pessoas uma que tenha tempo de reação menor que 100ms 6 Uma moeda é lançada 5 vezes e independentes Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas binomial Distribuição T Student Profª Berenice de Oliveira Bona TESTE TSTUDENT PARA UMA AMOSTRA Na estatística os testest são um tipo de teste de hipóteses que permite comparar médias Eles são chamados de testest porque cada um deles resume seus dados amostrais em um número o valort Usamos a seguinte fórmula para o cálculo da estatística t Os dados sobre as calorias ingeridas por dia para um grupo de 15 jovens teve média x 2207466 e desvio padrão s 297566 Aplique o teste t para averiguar se eles pertencem à população cuja média de calorias ingeridas por dia é 2100 Kcal Onde x 2207466 μ 2100 Kcal S 297566 n 15 t x μ s n 2207466 2100 297566 15 107466 76831 1398 Graus de Liberdade gl n 1 14 e α 005 Tabela t 2145 Como 1398 2145 tcalculado ttabelado ACEITA A HO A ingestão calórica diária destes jovens está dentro do esperado para esta população glq 0995 0990 0980 0975 0950 0900 0100 0050 1 0008 0016 0031 0039 0079 0158 6314 12706 2 0007 0014 0028 0035 0071 0142 2920 4303 3 0007 0014 0027 0034 0058 0137 2353 3182 4 0007 0013 0027 0033 0057 0134 2132 2776 5 0007 0013 0026 0033 0066 0132 2015 2571 6 0007 0013 0026 0033 0065 0131 1943 2447 7 0006 0013 0026 0032 0065 0130 1895 2365 8 0006 0013 0026 0032 0065 0130 1860 2306 9 0006 0013 0026 0032 0064 0129 1833 2262 10 0006 0013 0026 0032 0064 0129 1812 2228 11 0006 0013 0026 0032 0064 0129 1796 2201 12 0006 0013 0026 0032 0064 0128 1782 2179 13 0006 0013 0026 0032 0064 0128 1771 2160 14 0006 0013 0026 0032 0064 0128 1761 2145 15 0006 0013 0025 0032 0064 0128 1753 2131 Os dados sobre 12 pessoas sobre determinada doença teve média x 244 e desvio padrão s10 Aplique o teste t para μ 180 Dados x 244 μ 180 S 10 n 12 t 2441801012 64 10346 64289 22145 calculado t x μ0 sn ttabelado α005 e gl12111 2201 tabela Distribuição Normal z Z x x s x variável aleatória X média s desvio padrão Distribuição Qui quadrado Σ o e2 e o frequência observada para cada classe e frequência esperada para aquela classe Distribuição T Student t x μ0 sn z Média da amostra μ0 Valor fixo usado para comparação com a média da amostra s Desvio padrão amostral n Tamanho da amostra É uma distribuição de probabilidade contínua A representação gráfica é uma curva em forma de sino simétrica em torno da média X que recebe o nome de curva normal ou de Gauss A área total limitada pela curva e pelo eixo das abscissas é igual 1 A curva é simétrica em torno de Xmédia isto é PxXPxX05 Encontra um valor para a dispersão de duas variáveis nominais TESTE NÃO PARAMÉTRICO não depende de parâmetros populacionais média e variância O princípio básico deste teste é comparar proporções ou seja possíveis divergências entre as frequências observadas e esperadas para um certo evento Teste t de Student É um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de teste t segue uma distribuição t de Student O Teste t pode ser conduzido para Comparar uma amostra com uma população Comparar duas amostras pareadas Comparar duas amostras independentes Referências CASTANHEIRA Nelson Pereira Estatística Aplicada a todos os níveis Ed IBPEX 5ª edição2010 c é o erro do Intervalo de confiança IC da forma X barra c PX barra c μ X barra c Em que Erro amostral c z σ raiz de n para populações infinitas O erro amostral é a máxima diferença que o investigador admite suportar entre μ média populacional e X barra média amostral Inferência estatísticaIntervalo de confiança Estimação Profª Berenice de Oliveira Bona Inferência estatística Para realizarmos a inferência estatística devemos trabalhar com conhecimentos que envolvem Amostragem Estimação Intervalo de confiança Amostragem Para a seleção de uma amostra que seja representativa de certa população é necessário conhecer as técnicas utilizadas para essa seleção Para a obtenção dos dados amostrais os levantamentos podem ser totalmente controlados pelo pesquisador Tais levantamentos podem ser classificados Amostragem aleatória Simples Todos os elementos da população tem igual probabilidade de serem selecionados Amostragem aleatória sistemática é a variação da amostragem aleatória simples em que os elementos da população são retirados a intervalos regulares até compor o total da amostra sendo o sorteio realizado apenas no ponto de partida Amostragem aleatória estratificada é a amostragem probabilística usada quando a população for heterogênea em relação aos objetivos da pesquisa as opiniões tendem a variar muito de subgrupo para subgrupo e a amostra precisa conter elementos de cada subgrupo da população para representála adequadamente Estimação Distribuição Binomial permitenos calcular a probabilidade de evento acontecer se conhecemos a probabilidade p de sucesso e o valor N de tentativas Distribuição Normal podemos realizar qualquer cálculo se conhecemos a média e o desvio padrão ESTIMADOR é uma grandeza baseada em observações feitas em uma amostra e que é considerada como indicador de um parâmetro populacional desconhecido UMA ESTIMATIVA É O VALOR ATRIBUIDO AO ESTIMADOR Estimativa por ponto e por intervalo A estimativa por ponto é um valor obtido a partir de cálculos efetuados com os dados da amostra que serve como uma aproximação do parâmetro estimado Assim um estimador que apresenta um único valor é um estimador pontual A estimativa por intervalo para um parâmetro é uma faixa de valores possíveis e aceitos como verdadeiros dentro da qual se estima que se encontre parâmetro A estimativa por intervalo apresenta uma maior vantagem pois ela nos permite diminuir a magnitude do erro que estamos cometendo Quanto menor o comprimento do intervalo maior a precisão dos nossos cálculos Intervalo de confiança É um intervalo de valores obtidos a partir de observações de uma amostra e determinado de tal maneira que haja uma probabilidade de esse intervalo conter o valor desconhecido de um parâmetro que desejamos determinar Em geral calculamos intervalos de confiança que tenham uma chance de 95 de conter o verdadeiro valor NÍVEL DE CONFIANÇA É um número que exprime o grau de confiançaou porcentagem associado ao intervalo de confiança Cálculo do tamanho da amostra quando a população é infinita Ver banco Exemplo O desvio padrão das durações de uma amostra de 200 lâmpadas elétricas é 100 horas Determinar os limites de confiança de 99 para o desvio padrão de todas as lâmpadas elétricas S 100 N200 99 S Z c σ raiz de 2N 100 258 100 raiz de 400 100 129 Podese estar 99 confiante de que o desviopadrão da população está compreendido entre 871 e 1129 PX barra c μ X barra c 871 μ 1129 100 129 871 100 129 1129 Fórmula do erro amostral conforme o nível de confiança solicitado Intervalo de confiança para o Desvio padrão Exemplo 1 Determinar o intervalo de confiança para as pessoas de uma localidade as quais possuem em uma amostra de 40 pessoas o peso médio de 60 kg com desvio padrão de 3 kg Supor nível de confiança igual a 95 Queremos determinar P𝑋c 𝜇 𝑋c 95 Divide por 2 porque a tabela mostra metade da área Z 952 0952 04750 que corresponde a Z 196 então c z σ n C 196 3 40 093 P𝑋c 𝜇 𝑋c 95 P60093 𝜇 60 093 95 O intervalo de confiança é IC 5907 𝜇 609395 Isto significa que há 95 de chance de 𝜇 estar entre 5907 e 6093 kg 2 Determinar o intervalo de confiança para as pessoas de uma localidade as quais possuem em uma amostra de 40 pessoas o peso médio de 60 kg com desvio padrão de 3 kg Supor nível de confiança igual a 99 Queremos determinar P𝑋c 𝜇 𝑋c 99 Divide por 2 porque a tabela mostra metade da área Z 992 0992 04950 que corresponde a Z 258 então c z σ n C 258 3 40 122 P𝑋c 𝜇 𝑋c 99 P60122 𝜇 60 122 99 O intervalo de confiança é IC 5878 𝜇 612299 Isto significa que há 99 de chance de 𝜇 estar entre 5878 e 6122 kg 3 Determinar o intervalo de confiança para as pessoas de uma localidade das quais possuem altura média de 168 centímetros com desvio padrão de 20 cm Supor uma amostra de 272 pessoas e nível de significância igual a 90 Queremos determinar P𝑋c 𝜇 𝑋c 90 Divide por 2 porque a tabela mostra metade da área Z 902 0902 045 que corresponde a Z 165 então c z σ n C 165 20 272 2 P𝑋c 𝜇 𝑋c 90 P168 2 𝜇 168 2 90 O intervalo de confiança é IC 166 𝜇 17090 Isto significa que há 90 de chance de 𝜇 estar entre 166 e 170 ANEXO II ÁREA SUBTENDIDA PELA CURVA NORMAL REDUZIDA DE 0 A Z z 0 1 2 3 4 5 6 7 8 9 00 00000 00040 00080 00120 00160 00199 00239 00279 00319 00359 01 00398 00438 00478 00517 00557 00596 00636 00675 00714 00754 02 00793 00832 00871 00910 00948 00987 01026 01064 01103 01141 03 01179 01217 01255 01293 01331 01368 01406 01443 01480 01517 04 01554 01591 01628 01664 01700 01736 01772 01808 01844 01879 05 01915 01950 01985 02019 02054 02088 02123 02157 02190 02224 06 02258 02291 02324 02357 02389 02422 02454 02486 02518 02549 07 02580 02612 02642 02673 02704 02734 02764 02794 02823 02852 08 02881 02910 02939 02967 02996 03023 03051 03078 03106 03133 09 03159 03186 03212 03238 03264 03289 03315 03340 03365 03389 10 03413 03438 03461 03485 03508 03531 03554 03577 03599 03621 11 03643 03665 03686 03708 03729 03749 03770 03790 03810 03830 12 03849 03869 03888 03907 03925 03944 03962 03980 03997 04015 13 04032 04049 04066 04082 04099 04115 04131 04147 04162 04177 14 04192 04207 04222 04236 04251 04265 04280 04292 04306 04319 15 04332 04345 04357 04370 04382 04394 04406 04418 04429 04441 16 04452 04463 04474 04484 04495 04505 04515 04525 04535 04545 17 04554 04564 04573 04582 04591 04599 04608 04616 04625 04633 18 04641 04649 04656 04664 04671 04678 04686 04693 04699 04706 19 04713 04719 04726 04732 04738 04744 04750 04756 04761 04767 20 04772 04778 04783 04788 04793 04798 04803 04808 04812 04817 21 04821 04826 04830 04834 04838 04842 04846 04850 04854 04857 22 04861 04864 04868 04871 04875 04878 04881 04884 04887 04890 23 04893 04896 04898 04901 04904 04906 04909 04911 04913 04916 24 04918 04920 04922 04925 04927 04929 04931 04932 04934 04936 25 04938 04940 04941 04943 04945 04946 04948 04949 04951 04952 26 04953 04955 04956 04957 04959 04960 04961 04962 04963 04964 27 04965 04966 04967 04968 04969 04970 04971 04972 04973 04974 28 04974 04975 04976 04977 04977 04978 04979 04980 04980 04981 29 04981 04982 04982 04983 04984 04984 04985 04985 04986 04986 30 04987 04987 04987 04988 04988 04989 04989 04989 04990 04990 3 1 04990 04991 04991 04991 04992 04992 04992 04992 04993 04993 32 04993 04993 04994 04994 04994 04994 04995 04995 04995 04995 33 04995 04995 04995 04996 04996 04996 04996 04996 04997 04997 34 04997 04997 04997 04997 04997 04997 04997 04997 04997 04998 35 04998 04998 04998 04998 04998 04998 04998 04998 04998 04998 36 04998 04998 04998 04998 04998 04998 04998 04998 04998 04998 37 04999 04999 04999 04999 04999 04999 04999 04999 04999 04999 38 04999 04999 04999 04999 04999 04999 04999 04999 04999 04999 39 05000 05000 05000 05000 05000 05000 05000 05000 05000 05000 4 Um exportador de papel higiênico está preocupado com a metragem do seu produto Sabemos que tal metragem tem distribuição normal com desvio padrão 1 metro σ1m Faça um teste em um lote de 100 rolos de papel higiênico cuja a média é de 50 m por rolo X 50 Determine o intervalo de confiança para um nível de confiança igual a 9544 9544 2 04772 Na tabela Z2 Erro amostral c z σ n C 2 1 100 02 PX c μ X c 9544 P50 02 μ 5002 9544 IC498 μ 502 9544 5 Um exportador de papel higiênico está preocupado com a metragem do seu produto Sabemos que tal metragem tem distribuição normal com desvio padrão 1 metro σ1m Faça um teste em um lote de 100 rolos de papel higiênico cuja a média é de 50 m por rolo X 50 Qual o tamanho da amostra se deve ter para que com uma probabilidade de 98 sua estimativa não esteja errada em mais de 015 metros Z 98 2 04900 na tabela Z 233 Então o valor de n amostra deve ser igual 233 desvios padrão para que X 015 233 S 015 com S σ n e σ1 Temos 233 1 n 015 n233 015 n 15533² 241 rolos de papel 6 Suponha que no exercício anterior estivéssemos preocupados com um nível de confiança de apenas 70 Nesse caso qual o tamanho da amostra 702 03500 na Tabela Z 104 c z σn 104 1n 015 n 104015² 48 rolos de papel higiênico 7 Considerando ainda o mesmo exercício qual o intervalo de confiança para nível de confiança igual a 97 e uma amostra de 100 rolos de papel Para nível de confiança igual 97 o valor de z é 227 tabela 972485 04850 c z σn 227 1100 0217 PX c μ X c 97 P50 0217 μ 50 0217 IC 49783 μ 50217 8 Uma população com desvio padrão igual a 2 retirouse uma amostra aleatória de 16 elementos A média desta amostra foi igual a 8 pontos Construa um intervalo de confiança ao nível de 5 de significância para a média populacional a σ 2 desvio populacional conhecido b n 16 tamanho da amostra c x 8 média amostral d α 005 nível de significância logo α2 0025 Z0025 196 c 196 σn 196 216 196 24 098 IC 8 098 μ 8 098 IC 702 μ 898 9 As medidas dos diâmetros de uma amostra aleatória de 200 rolamentos esféricos produzidos por uma certa máquina durante uma semana apresentaram média 0824 polegadas e o desvio padrão de 0042 polegadas Determinar os limites de confiança de 95 para o diâmetro médio de todos os rolamentos esféricos ver tabela de distribuição normal disponibilizada no material para realização da avaliação Solução N200 X 0824 σ 0042 a95 X 196σN X 196sN 0824 196 0042200 0824 00058 ou 0824 0006 pol Referências CASTANHEIRA Nelson Pereira Estatística Aplicada a todos os níveis Ed IBPEX 5ª edição2010