·
Engenharia Civil ·
Outros
Send your question to AI and receive an answer instantly
Preview text
Professora Rafaela Dourado 1º semestre de 2023 ENEC50318 Estatística I Amostragem e Intervalos de Confiança Estatística básica População Amostra Estatística Descritiva Inferência Estatística Estatística básica População Amostra Inferência Estatística População é o conjunto de todos os elementospessoasmáquinas sobre os quais estamos interessados em estudar Amostra é qualquer subconjunto da população Por que fazer uma amostra Entendimento inicial Acesso a toda a população é difícil ou impossível Alto custo Tempo de pesquisa excessivo Destruição do elemento pesquisado População Amostra Inferência Estatística 𝜃 𝜇 𝜎2 𝜎 𝑝 መ𝜃 ҧ𝑥 𝑆2 𝑆 Ƹ𝑝 Parâmetros Estimadores Inferência Estatística Parâmetros estimadores e estimativas Estimativas Inferência Estatística Parâmetros estimadores e estimativas Parâmetro É uma medida que descreve determinada característica da população em geral desconhecidas e sobre as quais temos interesse Notação Em geral uso de letras gregas Estimador É a medida que é construída com a finalidade de representar ou estimar um parâmetro de interesse na população Notação Em geral uso das letras gregas com acento circunflexo Estimativa É o valor que atribuímos a um parâmetro de uma população baseado em um estimador da amostra Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 Inferência Estatística Estimação de parâmetros Estimativa de um único valor para um parâmetro populacional Exemplo o salário anual médio das mulheres formadas em Engenharia é de R 12000000 Estimativa por ponto Considera a distribuições das amostras da estimativa pontual Intervalo de valores usado para estimar um parâmetro populacional Incorpora à estimativa por ponto informações a respeito de sua variabilidade Exemplo com 90 de confiança o salário anual médio das mulheres formadas em Engenharia está entre R 11000000 e R 13000000 Estimativa por intervalo Inferência Estatística Estimativa por intervalo Entendimento inicial Os segmentos horizontais representam os 10 intervalos e a reta vertical representa a localização do parâmetro Notase que o parâmetro é fixo e que a localização do intervalo varia de amostra para amostra Por conseguinte podemos falar em termos da probabilidade de o intervalo incluir o parâmetro e não em termos da probabilidade do parâmetro pertencer ao intervalo já que é fixo O intervalo é aleatório Na prática somente um intervalo é construído por meio da amostra aleatória obtida Como utilizamos uma confiança igual a 90 perceba que apenas 9 dos 10 intervalos construídos contém o verdadeiro parâmetro Se obtivermos várias amostras de mesmo tamanho e para cada uma calcularmos os correspondentes intervalos de confiança com coeficiente ou nível de confiança esperamos que a proporção de intervalos que contenham o valor do parâmetro seja igual a 90 Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 O intervalo de confiança para 𝜇 com confiança 𝛾 é dado por População infinita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 População finita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 𝑁 𝑛 𝑁 1 ത𝑋 𝑧 𝜎 𝑛 𝑁 𝑛 𝑁 1 𝑁 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑒 𝑛 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Em outras palavras temos 𝛾 de confiança que esse intervalo contém o valor de 𝜇 IC para média com desvio padrão populacional conhecido Definições 𝛾 95 𝑧 19600 𝛾 90 𝑧 16449 O valor de 𝑧 pode ser obtido da tabela inversa da Normal Padrão considerando o nível de confiança Exemplos 5 5 25 25 𝛾 90 𝑧 25758 99 05 05 25758 25758 16449 16449 IC para média com desvio padrão populacional conhecido Definições inteiro 1ª e 2ª decimais de p 0 1 2 3 4 5 6 7 8 9 000 30902 28782 27478 26521 25758 25121 24573 24089 23656 001 23263 22904 22571 22262 21973 21701 21444 21201 20969 20748 002 20537 20335 20141 19954 19774 19600 19431 19268 19110 18957 003 18808 18663 18522 18384 18250 18119 17991 17866 17744 17624 004 17507 17392 17279 17169 17060 16954 16849 16747 16646 16546 005 16449 16352 16258 16164 16072 15982 15893 15805 15718 15632 006 15548 15464 15382 15301 15220 15141 15063 14985 14909 14833 007 14758 14684 14611 14538 14466 14395 14325 14255 14187 14118 008 14051 13984 13917 13852 13787 13722 13658 13595 13532 13469 009 13408 13346 13285 13225 13165 13106 13047 12988 12930 12873 010 12816 12759 12702 12646 12591 12536 12481 12426 12372 12319 011 12265 12212 12160 12107 12055 12004 11952 11901 11850 11800 012 11750 11700 11650 11601 11552 11503 11455 11407 11359 11311 013 11264 11217 11170 11123 11077 11031 10985 10939 10893 10848 014 10803 10758 10714 10669 10625 10581 10537 10494 10451 10407 015 10364 10322 10279 10237 10194 10152 10110 10069 10027 09986 016 09945 09904 09863 09822 09782 09741 09701 09661 09621 09581 017 09542 09502 09463 09424 09385 09346 09307 09269 09230 09192 018 09154 09116 09078 09040 09002 08965 08927 08890 08853 08816 019 08779 08742 08706 08669 08632 08596 08560 08524 08488 08452 020 08416 08381 08345 08310 08274 08239 08204 08169 08134 08099 021 08064 08030 07995 07961 07926 07892 07858 07824 07790 07756 022 07722 07688 07655 07621 07588 07554 07521 07488 07454 07421 023 07388 07356 07323 07290 07257 07225 07192 07160 07128 07095 024 07063 07031 06999 06967 06935 06903 06871 06840 06808 06776 025 06745 06713 06682 06651 06620 06588 06557 06526 06495 06464 026 06433 06403 06372 06341 06311 06280 06250 06219 06189 06158 027 06128 06098 06068 06038 06008 05978 05948 05918 05888 05858 028 05828 05799 05769 05740 05710 05681 05651 05622 05592 05563 029 05534 05505 05476 05446 05417 05388 05359 05330 05302 05273 030 05244 05215 05187 05158 05129 05101 05072 05044 05015 04987 031 04958 04930 04902 04874 04845 04817 04789 04761 04733 04705 032 04677 04649 04621 04593 04565 04538 04510 04482 04454 04427 033 04399 04372 04344 04316 04289 04261 04234 04207 04179 04152 034 04125 04097 04070 04043 04016 03989 03961 03934 03907 03880 035 03853 03826 03799 03772 03745 03719 03692 03665 03638 03611 036 03585 03558 03531 03505 03478 03451 03425 03398 03372 03345 037 03319 03292 03266 03239 03213 03186 03160 03134 03107 03081 038 03055 03029 03002 02976 02950 02924 02898 02871 02845 02819 039 02793 02767 02741 02715 02689 02663 02637 02611 02585 02559 040 02533 02508 02482 02456 02430 02404 02378 02353 02327 02301 041 02275 02250 02224 02198 02173 02147 02121 02096 02070 02045 042 02019 01993 01968 01942 01917 01891 01866 01840 01815 01789 043 01764 01738 01713 01687 01662 01637 01611 01586 01560 01535 044 01510 01484 01459 01434 01408 01383 01358 01332 01307 01282 045 01257 01231 01206 01181 01156 01130 01105 01080 01055 01030 046 01004 00979 00954 00929 00904 00878 00853 00828 00803 00778 047 00753 00728 00702 00677 00652 00627 00602 00577 00552 00527 048 00502 00476 00451 00426 00401 00376 00351 00326 00301 00276 049 00251 00226 00201 00175 00150 00125 00100 00075 00050 00025 3ª decimal de p inteiro 1ª e 2ª decimais de p 0 1 2 3 4 5 6 7 8 9 050 00000 00025 00050 00075 00100 00125 00150 00175 00201 00226 051 00251 00276 00301 00326 00351 00376 00401 00426 00451 00476 052 00502 00527 00552 00577 00602 00627 00652 00677 00702 00728 053 00753 00778 00803 00828 00853 00878 00904 00929 00954 00979 054 01004 01030 01055 01080 01105 01130 01156 01181 01206 01231 055 01257 01282 01307 01332 01358 01383 01408 01434 01459 01484 056 01510 01535 01560 01586 01611 01637 01662 01687 01713 01738 057 01764 01789 01815 01840 01866 01891 01917 01942 01968 01993 058 02019 02045 02070 02096 02121 02147 02173 02198 02224 02250 059 02275 02301 02327 02353 02378 02404 02430 02456 02482 02508 060 02533 02559 02585 02611 02637 02663 02689 02715 02741 02767 061 02793 02819 02845 02871 02898 02924 02950 02976 03002 03029 062 03055 03081 03107 03134 03160 03186 03213 03239 03266 03292 063 03319 03345 03372 03398 03425 03451 03478 03505 03531 03558 064 03585 03611 03638 03665 03692 03719 03745 03772 03799 03826 065 03853 03880 03907 03934 03961 03989 04016 04043 04070 04097 066 04125 04152 04179 04207 04234 04261 04289 04316 04344 04372 067 04399 04427 04454 04482 04510 04538 04565 04593 04621 04649 068 04677 04705 04733 04761 04789 04817 04845 04874 04902 04930 069 04958 04987 05015 05044 05072 05101 05129 05158 05187 05215 070 05244 05273 05302 05330 05359 05388 05417 05446 05476 05505 071 05534 05563 05592 05622 05651 05681 05710 05740 05769 05799 072 05828 05858 05888 05918 05948 05978 06008 06038 06068 06098 073 06128 06158 06189 06219 06250 06280 06311 06341 06372 06403 074 06433 06464 06495 06526 06557 06588 06620 06651 06682 06713 075 06745 06776 06808 06840 06871 06903 06935 06967 06999 07031 076 07063 07095 07128 07160 07192 07225 07257 07290 07323 07356 077 07388 07421 07454 07488 07521 07554 07588 07621 07655 07688 078 07722 07756 07790 07824 07858 07892 07926 07961 07995 08030 079 08064 08099 08134 08169 08204 08239 08274 08310 08345 08381 080 08416 08452 08488 08524 08560 08596 08632 08669 08706 08742 081 08779 08816 08853 08890 08927 08965 09002 09040 09078 09116 082 09154 09192 09230 09269 09307 09346 09385 09424 09463 09502 083 09542 09581 09621 09661 09701 09741 09782 09822 09863 09904 084 09945 09986 10027 10069 10110 10152 10194 10237 10279 10322 085 10364 10407 10451 10494 10537 10581 10625 10669 10714 10758 086 10803 10848 10893 10939 10985 11031 11077 11123 11170 11217 087 11264 11311 11359 11407 11455 11503 11552 11601 11650 11700 088 11750 11800 11850 11901 11952 12004 12055 12107 12160 12212 089 12265 12319 12372 12426 12481 12536 12591 12646 12702 12759 090 12816 12873 12930 12988 13047 13106 13165 13225 13285 13346 091 13408 13469 13532 13595 13658 13722 13787 13852 13917 13984 092 14051 14118 14187 14255 14325 14395 14466 14538 14611 14684 093 14758 14833 14909 14985 15063 15141 15220 15301 15382 15464 094 15548 15632 15718 15805 15893 15982 16072 16164 16258 16352 095 16449 16546 16646 16747 16849 16954 17060 17169 17279 17392 096 17507 17624 17744 17866 17991 18119 18250 18384 18522 18663 097 18808 18957 19110 19268 19431 19600 19774 19954 20141 20335 098 20537 20748 20969 21201 21444 21701 21973 22262 22571 22904 099 23263 23656 24089 24573 25121 25758 26521 27478 28782 30902 3ª decimal de p Tabela Inversa da Normal Padrão P 𝑧 𝑃𝑍𝑧 Um provedor de acesso à Internet está monitorando a duração do tempo das conexões de seus clientes com o objetivo de dimensionar seus equipamentos São desconhecidas a média e a distribuição de probabilidade desse tempo mas o desvio padrão por analogia a outros serviços é considerado igual a 50 minutos Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos O que dizer da verdadeira média com confiança de 92 MAGALHÃES LIMA 2009 p 247 IC para média com desvio padrão populacional conhecido Exemplo População infinita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 População finita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑧 𝜎 𝑛 𝑁𝑛 𝑁1 Considerando um nível de confiança 𝛾 92 pela tabela inversa da Normal Padrão temos que 𝑧 17507 Do enunciado temos σ 50 𝑛 500 e ത𝑋 25 Utilizando a fórmula da população infinita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 25 17507 50 500 25 17507 50 500 2445 2555 92 4 4 17507 17507 IC para média com desvio padrão populacional conhecido Exemplo Um engenheiro civil está analisando a resistência à compressão do concreto A resistência à compressão é distribuída normalmente com 𝜎2 1000 𝑝𝑠𝑖2 Uma amostra aleatória de 12 corpos de prova tem uma resistência média à compressão de ത𝑋 3250 𝑝𝑠𝑖 a Construa um intervalo de confiança de 95 para a resistência média à compressão b Construa um intervalo de confiança de 99 para a resistência média à compressão Compare a largura desse intervalo de confiança com aquela calculada no item a MONTGOMERY RUNGER 2018 p 222 IC para média com desvio padrão populacional conhecido Exercício IC para média com desvio padrão populacional conhecido Exercício a Considerando um nível de confiança 𝛾 95 pela tabela inversa da Normal Padrão temos que 𝑧 196 Do enunciado temos σ 1000 𝑛 12 e ത𝑋 3250 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 3250 196 1000 12 3250 196 1000 12 32321077 32678923 b Considerando um nível de confiança 𝛾 99 pela tabela inversa da Normal Padrão temos que 𝑧 25758 Do enunciado temos σ 1000 𝑛 12 e ത𝑋 3250 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 3250 25758 1000 12 3250 25758 1000 12 32264863 32735137 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Definições O tamanho da amostra para estimarmos 𝜇 com 𝜎 conhecido é dado por População infinita 𝑛 𝑧𝜎 𝐸 2 População finita 𝑛 𝑧2𝜎2𝑁 𝐸2 𝑁 1 𝑧2𝜎2 𝑠𝑒𝑛𝑑𝑜 𝐸 𝑒𝑟𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 Representa a diferença entre a média amostral ത𝑋 e a verdadeira média populacional 𝜇 Aproximar 𝑛 sempre para cima Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exemplo Para os dados do provedor de acesso à Internet se este quer que sua estimativa do tempo médio das conexões tenha um erro de no máximo 05 qual deveria ser o tamanho da amostra utilizandose a mesma confiança 92 MAGALHÃES LIMA 2009 p 247 População infinita 𝑛 𝑧𝜎 𝐸 2 População finita 𝑛 𝑧2𝜎2𝑁 𝐸2 𝑁1 𝑧2𝜎2 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exemplo Considerando um nível de confiança 𝛾 92 pela tabela inversa da Normal Padrão temos que 𝑧 17507 Do enunciado temos σ 50 𝐸 05 Utilizando a fórmula da população infinita 𝑛 𝑧𝜎 𝐸 2 17507 50 05 2 2475862 61298883 613 92 4 4 17507 17507 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exercício Desejase obter uma estimativa de intervalo de confiança para o ganho em um circuito de um dispositivo semicondutor normalmente distribuído com desvio padrão 𝜎 20 a Quão grande 𝑛 tem que ser se o comprimento do IC de 95 deve ser 40 b Quão grande 𝑛 tem que ser se o comprimento do IC de 99 deve ser 40 MONTGOMERY RUNGER 2018 p 222 População infinita 𝑛 𝑧𝜎 𝐸 2 População finita 𝑛 𝑧2𝜎2𝑁 𝐸2 𝑁1 𝑧2𝜎2 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exercício a Considerando um nível de confiança 𝛾 95 pela tabela inversa da Normal Padrão temos que 𝑧 196 Para que o intervalo de confiança seja de tamanho 40 o Erro 𝐸 20 pois teremos ത𝑋 20 𝑛 𝑧𝜎 𝐸 2 196 20 20 2 38416 4 b Considerando um nível de confiança 𝛾 99 pela tabela inversa da Normal Padrão temos que 𝑧 25758 Para que o intervalo de confiança seja de tamanho 40 o Erro 𝐸 20 pois teremos ത𝑋 20 𝑛 𝑧𝜎 𝐸 2 25758 20 20 2 66347 7 Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 O intervalo de confiança para 𝜇 com confiança 𝛾 é dado por População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 𝑁 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑒 𝑛 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Estimar 𝑆 usando amostra piloto ou pesquisa semelhante já realizada IC para média com desvio padrão populacional desconhecido Definições A resistência à ruptura em cabos de aço é considerada uma variável Normal com média e variância dependendo de outros fatores Uma amostra de 12 cabos produzidos por uma empresa são levados a teste para indicar se eles podem ser usados na construção de uma ponte Cada cabo para ser usado precisa ter carga média de ruptura de no mínimo 2500 kgf Os resultados foram 2518 2492 2450 2535 2547 2486 2455 2499 2522 2505 2469 2440 a Determine um intervalo com 95 de confiança para a resistência média à ruptura b Baseado no intervalo acima você concordaria que a carga média de ruptura é superior a 2500 kgf MAGALHÃES LIMA 2009 p 301 adaptado IC para média com desvio padrão populacional desconhecido Exemplo1 População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 a Foram informados dados da amostra Precisamos calcular a média e o desvio padrão amostral ത𝑋 σ𝑖1 𝑛 𝑥𝑖 𝑛 2518 2492 2450 2440 12 29918 12 249317 𝑆2 𝑖1 𝑘 𝑋𝑖 ത𝑋 2 𝑛 1 2518 249317 2 2440 249317 2 12 1 118670 𝑆 118670 344485 𝑡𝑛1 𝑡121 𝑡11 2201 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 249317 2201 344485 12 249317 2189 24713 25151 b Não pois há valores menores ou iguais a 2500 no IC IC para média com desvio padrão populacional desconhecido Exemplo1 95 2201 𝑡11 𝟓 𝟐 𝟎 𝟎𝟐𝟓 De um lote contendo 50 sacos de açúcar amostrouse 8 sacos O peso médio dos sacos na amostra foi de 9907 gramas com um desvio padrão amostral de 70 gramas Supondo que o peso dos sacos de açúcar tem distribuição aproximadamente normal construa um intervalo de confiança com 95 de confiança para o peso médio dos sacos de açúcar IC para média com desvio padrão populacional desconhecido Exemplo2 População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 9907 𝑆 7𝑔 𝑁 50 𝑛 8 𝛾 95 𝑡𝑛1 𝑡81 𝑡7 2365 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 9907 2365 7 8 508 501 9907 2365 7 8 508 501 98528 99612 IC para média com desvio padrão populacional desconhecido Exemplo2 95 2365 𝑡7 𝟓 𝟐 𝟎 𝟎𝟐𝟓 Um engenheiro do setor de pesquisa de um fabricante de pneu está investigando a vida do pneu em relação a um novo componente da borracha Ele fabricou 16 pneus e testouos até o final da vida em um teste na estrada A média e o desvio padrão da amostra são 601397 e 364594 km Encontre um intervalo de confiança de 96 para a vida média do pneu MONTGOMERY RUNGER 2018 p 225 adaptado IC para média com desvio padrão populacional desconhecido Exercício População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 IC para média com desvio padrão populacional desconhecido Exercício ത𝑋 601397 𝑆 364594 𝑛 16 𝛾 96 𝑡𝑛1 𝑡161 𝑡15 2249 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 601397 2249 364594 16 601397 2249 364594 16 580897702 621896298 𝟒 𝟐 𝟎 𝟎𝟐 96 2249 𝑡15 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 desconhecido Definições O tamanho da amostra para estimarmos 𝜇 com 𝜎 desconhecido é dado por População infinita 𝑛 𝑧𝑆 𝐸 2 População finita 𝑛 𝑧2𝑆2𝑁 𝐸2 𝑁 1 𝑧2𝑆2 𝑠𝑒𝑛𝑑𝑜 𝐸 𝑒𝑟𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 Representa a diferença entre a média amostral ത𝑋 e a verdadeira média populacional 𝜇 Estimar 𝑆 usando amostra piloto ou pesquisa semelhante já realizada Para os dados do exemplo de resistência à ruptura se é desejado que a estimativa não se afaste do verdadeiro valor da resistência média de ruptura por mais de 15 kgf com confiança de 95 quantos cabos adicionais deverão ser testados MAGALHÃES LIMA 2009 p 301 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 desconhecido Exemplo População infinita 𝑛 𝑧𝑆 𝐸 2 População finita 𝑛 𝑧2𝑆2𝑁 𝐸2 𝑁1 𝑧2𝑆2 Lembrete Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 caso 𝑛 30 utilizar a distribuição t de student Pelo enunciado o erro não deve ser maior que 15 kgf Devemos testar valores de 𝑛 para calcular o erro 𝐸 enquanto ele for menor que 15kgf do exemplo anterior 𝑆 344485 e 𝑛 12 cabos Para 𝑛 25 temos 𝑡24 2064 𝐸 𝑡𝑛1 𝑆 𝑛 2064 344485 25 142203 15 Para 𝑛 23 temos 𝑡22 2074 𝐸 𝑡𝑛1 𝑆 𝑛 2074 344485 23 148976 15 Para 𝑛 22 temos 𝑡21 2080 𝐸 𝑡𝑛1 𝑆 𝑛 2080 344485 22 152765 15 Logo 𝑛 23 logo devese adicionar 11 cabos a mais dos 12 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 desconhecido Exemplo 𝜶𝟐 52 95 𝑡𝑛1 Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 O intervalo de confiança para a proporção 𝑝 é dado por População infinita 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 Ƹ𝑝1 Ƹ𝑝 𝑛 População finita 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 𝑁 𝑛 𝑁 1 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 𝑁 𝑛 𝑁 1 𝑁 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑒 𝑛 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 IC para proporção Definições Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi sujeita a um teste de impacto sendo observado algum dano em 18 desses capacetes a Encontre um intervalo de confiança com 95 de confiança para a proporção verdadeira de capacetes desse tipo que mostraria algum dano proveniente desse teste MONTGOMERY RUNGER 2009 p 170 População infinita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 Ƹ𝑝 𝑧 𝑝1 𝑝 𝑛 População finita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 IC para proporção Exemplo a Do enunciado temos que 𝑛 50 Ƹ𝑝 18 50 036 𝑒 𝛾 95 Logo 𝑧 196 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 Ƹ𝑝1 Ƹ𝑝 𝑛 036 196 036 1036 50 036 196 036 1036 50 02270 04930 IC para proporção Exemplo 25 25 Os correios americano usam o reconhecimento óptico de caracteres desde a metade dos anos 60 Em 1983 os correios começaram a implantar a tecnologia nas principais agências de todo o país wwwbritannicacom Suponha que em uma amostra aleatória de 500 dígitos dos CEPs escritos a mão 466 sejam lidos corretamente a Construa um intervalo de confiança de 94 para a proporção verdadeira de dígitos corretos que podem ser lidos corretamente MONTGOMERY RUNGER 2009 p 232 adaptado População infinita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 Ƹ𝑝 𝑧 𝑝1 𝑝 𝑛 População finita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 IC para proporção Exercício a Do enunciado temos que 𝑛 500 Ƹ𝑝 466 500 0932 𝑒 𝛾 94 Logo 𝑧 18808 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 Ƹ𝑝1 Ƹ𝑝 𝑛 0932 18808 0932 10932 500 0932 18808 0932 10932 500 09108 09532 IC para proporção Exercício 94 3 3 18808 18808 Dimensionamento da amostra para estimarmos 𝑝 Definições O tamanho da amostra para estimarmos 𝑝 é dado por População infinita 𝑛 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝐸2 População finita 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝑁 𝐸2 𝑁 1 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝑠𝑒𝑛𝑑𝑜 𝐸 𝑒𝑟𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 Representa a diferença entre a média amostral ത𝑋 e a verdadeira média populacional 𝜇 Estimar p usando amostra piloto pesquisa semelhante já realizada ou utilizar Ƹ𝑝 05 Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi sujeita a um teste de impacto sendo observado algum dano em 18 desses capacetes b Usando a estimativa de p obtida a partir da amostra preliminar de 50 capacetes quantos capacetes devem ser testados para estarmos 95 confiantes de que o erro na estimação do valor verdadeiro de p seja menor ou igual a 002 c Quão grande terá de ser a amostra se desejarmos estar no mínimo 95 confiantes de que o erro na estimação de p seja menor ou igual a 002 independente do valor verdadeiro de p MONTGOMERY RUNGER 2009 p 170 Dimensionamento da amostra para estimarmos 𝑝 Exemplo o mesmo População infinita 𝑛 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝐸2 População finita 𝑛 𝑧2 𝑝 1 𝑝 𝑁 𝐸2 𝑁1 𝑧2 𝑝1 𝑝 b Do enunciado temos que Ƹ𝑝 18 50 036 𝑒 𝛾 95 Logo 𝑧 196 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝐸2 1962 036 1 036 0022 22127616 2213 𝑐𝑎𝑝𝑎𝑐𝑒𝑡𝑒𝑠 c Como não temos uma estimativa para p utilizamos Ƹ𝑝 05 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝐸2 1962 05 1 05 0022 2401 𝑐𝑎𝑝𝑎𝑐𝑒𝑡𝑒𝑠 Dimensionamento da amostra para estimarmos 𝑝 Exemplo o mesmo 25 25 Os correios americano usam o reconhecimento óptico de caracteres desde a metade dos anos 60 Em 1983 os correios começaram a implantar a tecnologia nas principais agências de todo o país wwwbritannicacom Suponha que em uma amostra aleatória de 500 dígitos dos CEPs escritos a mão 466 sejam lidos corretamente b Qual o tamanho da amostra necessário para que o erro na estimação seja menor que 01 supondo que a distribuição seja Normal MONTGOMERY RUNGER 2009 p 232 adaptado Dimensionamento da amostra para estimarmos 𝑝 Exercício o mesmo População infinita 𝑛 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝐸2 População finita 𝑛 𝑧2 𝑝 1 𝑝 𝑁 𝐸2 𝑁1 𝑧2 𝑝1 𝑝 b Do enunciado temos que Ƹ𝑝 466 500 0932 𝐸 01 𝛾 94 Logo 𝑧 18808 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝐸2 188082 0932 1 0932 012 224187 23 94 3 3 18808 18808 Dimensionamento da amostra para estimarmos 𝑝 Exercício o mesmo Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 Vimos que se 𝑋𝑁 temos que a variância amostral se aproxima de uma distribuição quiquadrado dessa relação temos 𝐼𝐶 𝑛 1𝑆2 𝜒𝑛1𝛼 2 2 𝑛 1𝑆2 𝜒 𝑛1 1𝛼 2 2 Sendo 𝛼 1 𝛾 IC para variância Definições O conteúdo de açúcar na calda de pêssegos em lata é normalmente distribuído Uma amostra aleatória de n 10 latas resultou com um desvio padrão S 48 mg Encontre um intervalo com 95 de confiança para o desvio padrão do conteúdo de açúcar na calda 𝐼𝐶 𝑛1𝑆2 𝜒𝑛1𝛼 2 2 𝑛1𝑆2 𝜒 𝑛1 1𝛼 2 2 MONTGOMERY RUNGER 2018 p 228 IC para variância Exemplo Do enunciado temos que 𝑛 10 𝑆 48 𝑚𝑔 e 𝛾 95 𝛼 1 𝛾 5 𝜒 𝑛1 𝛼 2 2 𝜒9 0025 2 19023 𝜒 𝑛1 1𝛼 2 2 𝜒9 0975 2 2700 𝐼𝐶 𝑛 1𝑆2 𝜒𝑛1𝛼 2 2 𝑛 1𝑆2 𝜒 𝑛1 1𝛼 2 2 10 1 482 19023 10 1 482 2700 109005 768000 Logo 𝐼𝐶 𝑝𝑎𝑟𝑎 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 109005 768000 33016 87636 IC para variância Exemplo 𝜶 𝟐 𝟐 𝟓 𝟎 𝟎𝟐𝟓 19023 A percentagem de titânio em uma liga usada na fundição de aeronaves é medida em 51 peças selecionadas aleatoriamente O desvio padrão amostral é 037 Construa um intervalo de confiança de 99 para a variância 𝐼𝐶 𝑛1𝑆2 𝜒𝑛1𝛼 2 2 𝑛1𝑆2 𝜒 𝑛1 1𝛼 2 2 MONTGOMERY RUNGER 2018 p 228 adaptado IC para variância Exercício Do enunciado temos que 𝑛 51 𝑆 037 e 𝛾 99 𝛼 1 𝛾 1 𝜒 𝑛1 𝛼 2 2 𝜒50 005 2 79490 𝜒 𝑛1 1𝛼 2 2 𝜒50 0995 2 27991 𝐼𝐶 𝑛 1𝑆2 𝜒𝑛1𝛼 2 2 𝑛 1𝑆2 𝜒 𝑛1 1𝛼 2 2 51 1 0372 79490 51 1 0372 34764 00861 01969 IC para variância Exercício 𝜶 𝟐 𝟎 𝟓 𝟎 𝟎𝟎𝟓 79490 Estatística básica População Amostra Inferência Estatística População é o conjunto de todos os elementospessoasmáquinas sobre os quais estamos interessados em estudar Amostra é qualquer subconjunto da população Por que fazer uma amostra Entendimento inicial Acesso a toda a população é difícil ou impossível Alto custo Tempo de pesquisa excessivo Destruição do elemento pesquisado É aquela em que a escolha dos elementos da amostra é feita de forma nãoaleatória justificadamente ou não Amostragem por conveniência É aquela em que todos os elementos da população têm probabilidade conhecida diferente de zero de ser incluídos na amostra Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerado Amostragem probabilística Amostragem não probabilística Técnicas de Amostragem Algumas técnicas mais utilizadas É aquela em que a escolha dos elementos da amostra é feita de forma nãoaleatória justificadamente ou não Amostragem por conveniência É aquela em que todos os elementos da população têm probabilidade conhecida diferente de zero de ser incluídos na amostra Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerado Amostragem probabilística Amostragem não probabilística Técnicas de Amostragem Algumas técnicas mais utilizadas Exemplo Queremos escolher 10 alunos de 100 alunos de uma sala Numeramos os alunos e escrevemos números de 1 a 100 em um papel e sorteamos 10 números Seria o mesmo princípio do bingo sortear 10 número a partir de um globo com bolinhas numeradas de 1 a 100 Amostragem aleatória simples Exemplo Amostragem aleatória simples Definição É o processo de amostragem mais utilizado Todos os elementos da população tem a mesma probabilidade de ser escolhido como elemento da amostra Tende a produzir amostras representativas e permite o uso da estatística inferencial na análise dos dados coletados Normalmente utilizase uma tabela de números aleatórios e nomeiamse os indivíduos sorteandose um por um até completar a amostra calculada Amostragem aleatória simples No Excel Aba Dados opção Análise de Dados Item Amostragem Método de amostragem Aleatório Amostragem sistemática Exemplo Exemplo Queremos escolher 4 professores de 12 professores de Engenharia de Produção Ordenamos os professores e escrevemos números de 1 a 12 em um papel e sorteamos um número A partir do professor sorteado por exemplo número 2 selecionamos o professor contamos 3 12 dividido por 4 selecionamos o próximo contamos 3 selecionamos o próximo contamos 3até completar a amostra Amostragem sistemática Definição Os elementos da amostra são escolhidos conforme um fator de repetição um intervalo fixo Sua aplicação requer que a população esteja ordenada segundo um critério qualquer de modo que cada um de seus elementos possa ser unicamente identificado pela sua posição O fator de repetição é determinado dividindose o tamanho da população N pelo tamanho da amostra n O primeiro elemento é escolhido por sorteio dentre os elementos da população que ocupam a posição igual ou inferior a Nn fator de repetição em seguida selecionamse os elementos a cada intervalo Nn Amostragem sistemática No Excel Aba Dados opção Análise de Dados Item Amostragem Método de amostragem Periódico Exemplo Queremos fazer uma amostragem estratificada dos estudantes da Universidade Presbiteriana Mackenzie que moram na cidade de São Paulo por zona A população dos estudantes que moram em São Paulo é 1000 e queremos uma amostra de 100 as quantidades que devemos selecionar em cada estrato estão no gráfico abaixo População 1000 Amostra 100 Amostragem estratificada Exemplo Amostragem estratificada Definição Nessa técnica de amostragem a população é dividida em estratos e os elementos da amostra são retirados de cada estrato O tamanho dos estratos na amostra deve ser proporcional ao tamanho dos estratos correspondentes na população População 1 milhão Amostra 1000 casos Amostragem por conglomerado ou cluster Exemplo Exemplo Queremos estudar o nível de satisfação dos trabalhadores têxteis das empresas do Sul do país Não dispondo de uma lista com todos os trabalhadores considerase uma lista de todas as empresas têxteis do Sul clusters admitindose que o conjunto de trabalhadores de cada empresa caracteriza convenientemente a população que se pretende estudar A partir dessa lista selecionamse aleatoriamente algumas empresas e considerase a amostra constituída por todos os trabalhadores das empresas selecionadas Clusters Amostragem por conglomerado ou cluster Definição A população é dividida em conglomerados onde cada conglomerado é representativo da população Selecionamos aleatoriamente um conjunto de conglomerados e a amostra é constituída por todos os elementos dos conglomerados selecionados Diferentemente da amostragem estratificada na amostragem por conglomerado não é necessário possuir uma lista contendo todos os nomes dos elementos da população É aquela em que a escolha dos elementos da amostra é feita de forma nãoaleatória justificadamente ou não Amostragem por conveniência É aquela em que todos os elementos da população têm probabilidade conhecida diferente de zero de ser incluídos na amostra Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerado Amostragem probabilística Amostragem não probabilística Técnicas de Amostragem Algumas técnicas mais utilizadas Amostragem por conveniência Exemplo Exemplo Queremos estudar a opinião política de estudantes paulistanos Para realizar uma amostra probabilística seria necessário ter acesso a todos os estudantes universitários paulistanos selecionar um grupo aleatório e realizar a pesquisa Já para realizar uma amostra por conveniência poderíamos abordar três universidades próximas simplesmente porque representam o local onde a população da pesquisa reside e perguntar a alguns estudantes do período matutino que concordam em participar Amostragem por conveniência Exemplo Outros exemplos Entrevistas em centros comerciais Entrevistas em parques Entrevistas em mercados Entrevistas com pessoas na rua Questionários disseminados pela internet ou por meio impresso Amostragem por conveniência Definição Selecionamos uma amostra da população que seja acessível isto é os indivíduos são selecionados porque é conveniente para o pesquisador não porque eles foram selecionados por meio de um critério estatístico Por ser conveniente normalmente o custo é baixo e consome menos tempo Na amostragem não probabilística os elementos da população não tem a mesma probabilidade de serem selecionados portanto não há garantias da representatividade da população logo não podemos generalizar os resultados obtidos na amostra para a população Amostragem Exercício Uma indústria produziu 30000 peças plásticas para uso no ramo de eletro eletrônicos em um dia de trabalho sendo 7500 peças produzidas em cada uma das quatro máquinas injetoras de polímeros existentes na indústria Cada situação abaixo corresponde a um tipo de amostragem a saber amostragem aleatória simples AAS amostragem sistemática AS amostragem estratificada AE e amostragem por conglomerado AC Identifique cada amostragem e diga qual é a mais conveniente Sortear 25 peças provenientes de cada máquina injetora para serem avaliadas quanto às dimensões especificadas pelo cliente Sortear 100 peças de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente Sortear por exemplo a 30ª 60ª 90ª peça de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente Sortear duas das máquinas injetoras e então considerar as 7500 peças de cada uma delas para serem avaliadas quanto às dimensões especificadas pelo cliente Amostragem Exercício A Amostragem estratificada é a mais conveniente pois fará com que a produção de cada máquina esteja representada de forma proporcional AE Sortear 25 peças provenientes de cada máquina injetora para serem avaliadas quanto às dimensões especificadas pelo cliente AAS Sortear 100 peças de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente AS Sortear por exemplo a 30ª 60ª 90ª peça de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente AC Sortear duas das máquinas injetoras e então considerar as 7500 peças de cada uma delas para serem avaliadas quanto às dimensões especificadas pelo cliente Amostragem Como funciona uma pesquisa eleitoral Datafolha httpswwwyoutubecomwatchvqII03g997rU Nexo Jornal httpswwwyoutubecomwatchvigi7E1OY7gs
Send your question to AI and receive an answer instantly
Preview text
Professora Rafaela Dourado 1º semestre de 2023 ENEC50318 Estatística I Amostragem e Intervalos de Confiança Estatística básica População Amostra Estatística Descritiva Inferência Estatística Estatística básica População Amostra Inferência Estatística População é o conjunto de todos os elementospessoasmáquinas sobre os quais estamos interessados em estudar Amostra é qualquer subconjunto da população Por que fazer uma amostra Entendimento inicial Acesso a toda a população é difícil ou impossível Alto custo Tempo de pesquisa excessivo Destruição do elemento pesquisado População Amostra Inferência Estatística 𝜃 𝜇 𝜎2 𝜎 𝑝 መ𝜃 ҧ𝑥 𝑆2 𝑆 Ƹ𝑝 Parâmetros Estimadores Inferência Estatística Parâmetros estimadores e estimativas Estimativas Inferência Estatística Parâmetros estimadores e estimativas Parâmetro É uma medida que descreve determinada característica da população em geral desconhecidas e sobre as quais temos interesse Notação Em geral uso de letras gregas Estimador É a medida que é construída com a finalidade de representar ou estimar um parâmetro de interesse na população Notação Em geral uso das letras gregas com acento circunflexo Estimativa É o valor que atribuímos a um parâmetro de uma população baseado em um estimador da amostra Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 Inferência Estatística Estimação de parâmetros Estimativa de um único valor para um parâmetro populacional Exemplo o salário anual médio das mulheres formadas em Engenharia é de R 12000000 Estimativa por ponto Considera a distribuições das amostras da estimativa pontual Intervalo de valores usado para estimar um parâmetro populacional Incorpora à estimativa por ponto informações a respeito de sua variabilidade Exemplo com 90 de confiança o salário anual médio das mulheres formadas em Engenharia está entre R 11000000 e R 13000000 Estimativa por intervalo Inferência Estatística Estimativa por intervalo Entendimento inicial Os segmentos horizontais representam os 10 intervalos e a reta vertical representa a localização do parâmetro Notase que o parâmetro é fixo e que a localização do intervalo varia de amostra para amostra Por conseguinte podemos falar em termos da probabilidade de o intervalo incluir o parâmetro e não em termos da probabilidade do parâmetro pertencer ao intervalo já que é fixo O intervalo é aleatório Na prática somente um intervalo é construído por meio da amostra aleatória obtida Como utilizamos uma confiança igual a 90 perceba que apenas 9 dos 10 intervalos construídos contém o verdadeiro parâmetro Se obtivermos várias amostras de mesmo tamanho e para cada uma calcularmos os correspondentes intervalos de confiança com coeficiente ou nível de confiança esperamos que a proporção de intervalos que contenham o valor do parâmetro seja igual a 90 Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 O intervalo de confiança para 𝜇 com confiança 𝛾 é dado por População infinita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 População finita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 𝑁 𝑛 𝑁 1 ത𝑋 𝑧 𝜎 𝑛 𝑁 𝑛 𝑁 1 𝑁 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑒 𝑛 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Em outras palavras temos 𝛾 de confiança que esse intervalo contém o valor de 𝜇 IC para média com desvio padrão populacional conhecido Definições 𝛾 95 𝑧 19600 𝛾 90 𝑧 16449 O valor de 𝑧 pode ser obtido da tabela inversa da Normal Padrão considerando o nível de confiança Exemplos 5 5 25 25 𝛾 90 𝑧 25758 99 05 05 25758 25758 16449 16449 IC para média com desvio padrão populacional conhecido Definições inteiro 1ª e 2ª decimais de p 0 1 2 3 4 5 6 7 8 9 000 30902 28782 27478 26521 25758 25121 24573 24089 23656 001 23263 22904 22571 22262 21973 21701 21444 21201 20969 20748 002 20537 20335 20141 19954 19774 19600 19431 19268 19110 18957 003 18808 18663 18522 18384 18250 18119 17991 17866 17744 17624 004 17507 17392 17279 17169 17060 16954 16849 16747 16646 16546 005 16449 16352 16258 16164 16072 15982 15893 15805 15718 15632 006 15548 15464 15382 15301 15220 15141 15063 14985 14909 14833 007 14758 14684 14611 14538 14466 14395 14325 14255 14187 14118 008 14051 13984 13917 13852 13787 13722 13658 13595 13532 13469 009 13408 13346 13285 13225 13165 13106 13047 12988 12930 12873 010 12816 12759 12702 12646 12591 12536 12481 12426 12372 12319 011 12265 12212 12160 12107 12055 12004 11952 11901 11850 11800 012 11750 11700 11650 11601 11552 11503 11455 11407 11359 11311 013 11264 11217 11170 11123 11077 11031 10985 10939 10893 10848 014 10803 10758 10714 10669 10625 10581 10537 10494 10451 10407 015 10364 10322 10279 10237 10194 10152 10110 10069 10027 09986 016 09945 09904 09863 09822 09782 09741 09701 09661 09621 09581 017 09542 09502 09463 09424 09385 09346 09307 09269 09230 09192 018 09154 09116 09078 09040 09002 08965 08927 08890 08853 08816 019 08779 08742 08706 08669 08632 08596 08560 08524 08488 08452 020 08416 08381 08345 08310 08274 08239 08204 08169 08134 08099 021 08064 08030 07995 07961 07926 07892 07858 07824 07790 07756 022 07722 07688 07655 07621 07588 07554 07521 07488 07454 07421 023 07388 07356 07323 07290 07257 07225 07192 07160 07128 07095 024 07063 07031 06999 06967 06935 06903 06871 06840 06808 06776 025 06745 06713 06682 06651 06620 06588 06557 06526 06495 06464 026 06433 06403 06372 06341 06311 06280 06250 06219 06189 06158 027 06128 06098 06068 06038 06008 05978 05948 05918 05888 05858 028 05828 05799 05769 05740 05710 05681 05651 05622 05592 05563 029 05534 05505 05476 05446 05417 05388 05359 05330 05302 05273 030 05244 05215 05187 05158 05129 05101 05072 05044 05015 04987 031 04958 04930 04902 04874 04845 04817 04789 04761 04733 04705 032 04677 04649 04621 04593 04565 04538 04510 04482 04454 04427 033 04399 04372 04344 04316 04289 04261 04234 04207 04179 04152 034 04125 04097 04070 04043 04016 03989 03961 03934 03907 03880 035 03853 03826 03799 03772 03745 03719 03692 03665 03638 03611 036 03585 03558 03531 03505 03478 03451 03425 03398 03372 03345 037 03319 03292 03266 03239 03213 03186 03160 03134 03107 03081 038 03055 03029 03002 02976 02950 02924 02898 02871 02845 02819 039 02793 02767 02741 02715 02689 02663 02637 02611 02585 02559 040 02533 02508 02482 02456 02430 02404 02378 02353 02327 02301 041 02275 02250 02224 02198 02173 02147 02121 02096 02070 02045 042 02019 01993 01968 01942 01917 01891 01866 01840 01815 01789 043 01764 01738 01713 01687 01662 01637 01611 01586 01560 01535 044 01510 01484 01459 01434 01408 01383 01358 01332 01307 01282 045 01257 01231 01206 01181 01156 01130 01105 01080 01055 01030 046 01004 00979 00954 00929 00904 00878 00853 00828 00803 00778 047 00753 00728 00702 00677 00652 00627 00602 00577 00552 00527 048 00502 00476 00451 00426 00401 00376 00351 00326 00301 00276 049 00251 00226 00201 00175 00150 00125 00100 00075 00050 00025 3ª decimal de p inteiro 1ª e 2ª decimais de p 0 1 2 3 4 5 6 7 8 9 050 00000 00025 00050 00075 00100 00125 00150 00175 00201 00226 051 00251 00276 00301 00326 00351 00376 00401 00426 00451 00476 052 00502 00527 00552 00577 00602 00627 00652 00677 00702 00728 053 00753 00778 00803 00828 00853 00878 00904 00929 00954 00979 054 01004 01030 01055 01080 01105 01130 01156 01181 01206 01231 055 01257 01282 01307 01332 01358 01383 01408 01434 01459 01484 056 01510 01535 01560 01586 01611 01637 01662 01687 01713 01738 057 01764 01789 01815 01840 01866 01891 01917 01942 01968 01993 058 02019 02045 02070 02096 02121 02147 02173 02198 02224 02250 059 02275 02301 02327 02353 02378 02404 02430 02456 02482 02508 060 02533 02559 02585 02611 02637 02663 02689 02715 02741 02767 061 02793 02819 02845 02871 02898 02924 02950 02976 03002 03029 062 03055 03081 03107 03134 03160 03186 03213 03239 03266 03292 063 03319 03345 03372 03398 03425 03451 03478 03505 03531 03558 064 03585 03611 03638 03665 03692 03719 03745 03772 03799 03826 065 03853 03880 03907 03934 03961 03989 04016 04043 04070 04097 066 04125 04152 04179 04207 04234 04261 04289 04316 04344 04372 067 04399 04427 04454 04482 04510 04538 04565 04593 04621 04649 068 04677 04705 04733 04761 04789 04817 04845 04874 04902 04930 069 04958 04987 05015 05044 05072 05101 05129 05158 05187 05215 070 05244 05273 05302 05330 05359 05388 05417 05446 05476 05505 071 05534 05563 05592 05622 05651 05681 05710 05740 05769 05799 072 05828 05858 05888 05918 05948 05978 06008 06038 06068 06098 073 06128 06158 06189 06219 06250 06280 06311 06341 06372 06403 074 06433 06464 06495 06526 06557 06588 06620 06651 06682 06713 075 06745 06776 06808 06840 06871 06903 06935 06967 06999 07031 076 07063 07095 07128 07160 07192 07225 07257 07290 07323 07356 077 07388 07421 07454 07488 07521 07554 07588 07621 07655 07688 078 07722 07756 07790 07824 07858 07892 07926 07961 07995 08030 079 08064 08099 08134 08169 08204 08239 08274 08310 08345 08381 080 08416 08452 08488 08524 08560 08596 08632 08669 08706 08742 081 08779 08816 08853 08890 08927 08965 09002 09040 09078 09116 082 09154 09192 09230 09269 09307 09346 09385 09424 09463 09502 083 09542 09581 09621 09661 09701 09741 09782 09822 09863 09904 084 09945 09986 10027 10069 10110 10152 10194 10237 10279 10322 085 10364 10407 10451 10494 10537 10581 10625 10669 10714 10758 086 10803 10848 10893 10939 10985 11031 11077 11123 11170 11217 087 11264 11311 11359 11407 11455 11503 11552 11601 11650 11700 088 11750 11800 11850 11901 11952 12004 12055 12107 12160 12212 089 12265 12319 12372 12426 12481 12536 12591 12646 12702 12759 090 12816 12873 12930 12988 13047 13106 13165 13225 13285 13346 091 13408 13469 13532 13595 13658 13722 13787 13852 13917 13984 092 14051 14118 14187 14255 14325 14395 14466 14538 14611 14684 093 14758 14833 14909 14985 15063 15141 15220 15301 15382 15464 094 15548 15632 15718 15805 15893 15982 16072 16164 16258 16352 095 16449 16546 16646 16747 16849 16954 17060 17169 17279 17392 096 17507 17624 17744 17866 17991 18119 18250 18384 18522 18663 097 18808 18957 19110 19268 19431 19600 19774 19954 20141 20335 098 20537 20748 20969 21201 21444 21701 21973 22262 22571 22904 099 23263 23656 24089 24573 25121 25758 26521 27478 28782 30902 3ª decimal de p Tabela Inversa da Normal Padrão P 𝑧 𝑃𝑍𝑧 Um provedor de acesso à Internet está monitorando a duração do tempo das conexões de seus clientes com o objetivo de dimensionar seus equipamentos São desconhecidas a média e a distribuição de probabilidade desse tempo mas o desvio padrão por analogia a outros serviços é considerado igual a 50 minutos Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos O que dizer da verdadeira média com confiança de 92 MAGALHÃES LIMA 2009 p 247 IC para média com desvio padrão populacional conhecido Exemplo População infinita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 População finita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑧 𝜎 𝑛 𝑁𝑛 𝑁1 Considerando um nível de confiança 𝛾 92 pela tabela inversa da Normal Padrão temos que 𝑧 17507 Do enunciado temos σ 50 𝑛 500 e ത𝑋 25 Utilizando a fórmula da população infinita 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 25 17507 50 500 25 17507 50 500 2445 2555 92 4 4 17507 17507 IC para média com desvio padrão populacional conhecido Exemplo Um engenheiro civil está analisando a resistência à compressão do concreto A resistência à compressão é distribuída normalmente com 𝜎2 1000 𝑝𝑠𝑖2 Uma amostra aleatória de 12 corpos de prova tem uma resistência média à compressão de ത𝑋 3250 𝑝𝑠𝑖 a Construa um intervalo de confiança de 95 para a resistência média à compressão b Construa um intervalo de confiança de 99 para a resistência média à compressão Compare a largura desse intervalo de confiança com aquela calculada no item a MONTGOMERY RUNGER 2018 p 222 IC para média com desvio padrão populacional conhecido Exercício IC para média com desvio padrão populacional conhecido Exercício a Considerando um nível de confiança 𝛾 95 pela tabela inversa da Normal Padrão temos que 𝑧 196 Do enunciado temos σ 1000 𝑛 12 e ത𝑋 3250 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 3250 196 1000 12 3250 196 1000 12 32321077 32678923 b Considerando um nível de confiança 𝛾 99 pela tabela inversa da Normal Padrão temos que 𝑧 25758 Do enunciado temos σ 1000 𝑛 12 e ത𝑋 3250 𝐼𝐶 ത𝑋 𝑧 𝜎 𝑛 ത𝑋 𝑧 𝜎 𝑛 3250 25758 1000 12 3250 25758 1000 12 32264863 32735137 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Definições O tamanho da amostra para estimarmos 𝜇 com 𝜎 conhecido é dado por População infinita 𝑛 𝑧𝜎 𝐸 2 População finita 𝑛 𝑧2𝜎2𝑁 𝐸2 𝑁 1 𝑧2𝜎2 𝑠𝑒𝑛𝑑𝑜 𝐸 𝑒𝑟𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 Representa a diferença entre a média amostral ത𝑋 e a verdadeira média populacional 𝜇 Aproximar 𝑛 sempre para cima Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exemplo Para os dados do provedor de acesso à Internet se este quer que sua estimativa do tempo médio das conexões tenha um erro de no máximo 05 qual deveria ser o tamanho da amostra utilizandose a mesma confiança 92 MAGALHÃES LIMA 2009 p 247 População infinita 𝑛 𝑧𝜎 𝐸 2 População finita 𝑛 𝑧2𝜎2𝑁 𝐸2 𝑁1 𝑧2𝜎2 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exemplo Considerando um nível de confiança 𝛾 92 pela tabela inversa da Normal Padrão temos que 𝑧 17507 Do enunciado temos σ 50 𝐸 05 Utilizando a fórmula da população infinita 𝑛 𝑧𝜎 𝐸 2 17507 50 05 2 2475862 61298883 613 92 4 4 17507 17507 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exercício Desejase obter uma estimativa de intervalo de confiança para o ganho em um circuito de um dispositivo semicondutor normalmente distribuído com desvio padrão 𝜎 20 a Quão grande 𝑛 tem que ser se o comprimento do IC de 95 deve ser 40 b Quão grande 𝑛 tem que ser se o comprimento do IC de 99 deve ser 40 MONTGOMERY RUNGER 2018 p 222 População infinita 𝑛 𝑧𝜎 𝐸 2 População finita 𝑛 𝑧2𝜎2𝑁 𝐸2 𝑁1 𝑧2𝜎2 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 conhecido Exercício a Considerando um nível de confiança 𝛾 95 pela tabela inversa da Normal Padrão temos que 𝑧 196 Para que o intervalo de confiança seja de tamanho 40 o Erro 𝐸 20 pois teremos ത𝑋 20 𝑛 𝑧𝜎 𝐸 2 196 20 20 2 38416 4 b Considerando um nível de confiança 𝛾 99 pela tabela inversa da Normal Padrão temos que 𝑧 25758 Para que o intervalo de confiança seja de tamanho 40 o Erro 𝐸 20 pois teremos ത𝑋 20 𝑛 𝑧𝜎 𝐸 2 25758 20 20 2 66347 7 Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 O intervalo de confiança para 𝜇 com confiança 𝛾 é dado por População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 𝑁 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑒 𝑛 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Estimar 𝑆 usando amostra piloto ou pesquisa semelhante já realizada IC para média com desvio padrão populacional desconhecido Definições A resistência à ruptura em cabos de aço é considerada uma variável Normal com média e variância dependendo de outros fatores Uma amostra de 12 cabos produzidos por uma empresa são levados a teste para indicar se eles podem ser usados na construção de uma ponte Cada cabo para ser usado precisa ter carga média de ruptura de no mínimo 2500 kgf Os resultados foram 2518 2492 2450 2535 2547 2486 2455 2499 2522 2505 2469 2440 a Determine um intervalo com 95 de confiança para a resistência média à ruptura b Baseado no intervalo acima você concordaria que a carga média de ruptura é superior a 2500 kgf MAGALHÃES LIMA 2009 p 301 adaptado IC para média com desvio padrão populacional desconhecido Exemplo1 População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 a Foram informados dados da amostra Precisamos calcular a média e o desvio padrão amostral ത𝑋 σ𝑖1 𝑛 𝑥𝑖 𝑛 2518 2492 2450 2440 12 29918 12 249317 𝑆2 𝑖1 𝑘 𝑋𝑖 ത𝑋 2 𝑛 1 2518 249317 2 2440 249317 2 12 1 118670 𝑆 118670 344485 𝑡𝑛1 𝑡121 𝑡11 2201 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 249317 2201 344485 12 249317 2189 24713 25151 b Não pois há valores menores ou iguais a 2500 no IC IC para média com desvio padrão populacional desconhecido Exemplo1 95 2201 𝑡11 𝟓 𝟐 𝟎 𝟎𝟐𝟓 De um lote contendo 50 sacos de açúcar amostrouse 8 sacos O peso médio dos sacos na amostra foi de 9907 gramas com um desvio padrão amostral de 70 gramas Supondo que o peso dos sacos de açúcar tem distribuição aproximadamente normal construa um intervalo de confiança com 95 de confiança para o peso médio dos sacos de açúcar IC para média com desvio padrão populacional desconhecido Exemplo2 População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 9907 𝑆 7𝑔 𝑁 50 𝑛 8 𝛾 95 𝑡𝑛1 𝑡81 𝑡7 2365 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁 𝑛 𝑁 1 9907 2365 7 8 508 501 9907 2365 7 8 508 501 98528 99612 IC para média com desvio padrão populacional desconhecido Exemplo2 95 2365 𝑡7 𝟓 𝟐 𝟎 𝟎𝟐𝟓 Um engenheiro do setor de pesquisa de um fabricante de pneu está investigando a vida do pneu em relação a um novo componente da borracha Ele fabricou 16 pneus e testouos até o final da vida em um teste na estrada A média e o desvio padrão da amostra são 601397 e 364594 km Encontre um intervalo de confiança de 96 para a vida média do pneu MONTGOMERY RUNGER 2018 p 225 adaptado IC para média com desvio padrão populacional desconhecido Exercício População infinita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 População finita 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 ത𝑋 𝑡𝑛1 𝑆 𝑛 𝑁𝑛 𝑁1 IC para média com desvio padrão populacional desconhecido Exercício ത𝑋 601397 𝑆 364594 𝑛 16 𝛾 96 𝑡𝑛1 𝑡161 𝑡15 2249 𝐼𝐶 ത𝑋 𝑡𝑛1 𝑆 𝑛 ത𝑋 𝑡𝑛1 𝑆 𝑛 601397 2249 364594 16 601397 2249 364594 16 580897702 621896298 𝟒 𝟐 𝟎 𝟎𝟐 96 2249 𝑡15 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 desconhecido Definições O tamanho da amostra para estimarmos 𝜇 com 𝜎 desconhecido é dado por População infinita 𝑛 𝑧𝑆 𝐸 2 População finita 𝑛 𝑧2𝑆2𝑁 𝐸2 𝑁 1 𝑧2𝑆2 𝑠𝑒𝑛𝑑𝑜 𝐸 𝑒𝑟𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 Representa a diferença entre a média amostral ത𝑋 e a verdadeira média populacional 𝜇 Estimar 𝑆 usando amostra piloto ou pesquisa semelhante já realizada Para os dados do exemplo de resistência à ruptura se é desejado que a estimativa não se afaste do verdadeiro valor da resistência média de ruptura por mais de 15 kgf com confiança de 95 quantos cabos adicionais deverão ser testados MAGALHÃES LIMA 2009 p 301 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 desconhecido Exemplo População infinita 𝑛 𝑧𝑆 𝐸 2 População finita 𝑛 𝑧2𝑆2𝑁 𝐸2 𝑁1 𝑧2𝑆2 Lembrete Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 caso 𝑛 30 utilizar a distribuição t de student Pelo enunciado o erro não deve ser maior que 15 kgf Devemos testar valores de 𝑛 para calcular o erro 𝐸 enquanto ele for menor que 15kgf do exemplo anterior 𝑆 344485 e 𝑛 12 cabos Para 𝑛 25 temos 𝑡24 2064 𝐸 𝑡𝑛1 𝑆 𝑛 2064 344485 25 142203 15 Para 𝑛 23 temos 𝑡22 2074 𝐸 𝑡𝑛1 𝑆 𝑛 2074 344485 23 148976 15 Para 𝑛 22 temos 𝑡21 2080 𝐸 𝑡𝑛1 𝑆 𝑛 2080 344485 22 152765 15 Logo 𝑛 23 logo devese adicionar 11 cabos a mais dos 12 Dimensionamento da amostra para estimarmos 𝜇 com 𝜎 desconhecido Exemplo 𝜶𝟐 52 95 𝑡𝑛1 Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 O intervalo de confiança para a proporção 𝑝 é dado por População infinita 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 Ƹ𝑝1 Ƹ𝑝 𝑛 População finita 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 𝑁 𝑛 𝑁 1 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 𝑁 𝑛 𝑁 1 𝑁 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑒 𝑛 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 IC para proporção Definições Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi sujeita a um teste de impacto sendo observado algum dano em 18 desses capacetes a Encontre um intervalo de confiança com 95 de confiança para a proporção verdadeira de capacetes desse tipo que mostraria algum dano proveniente desse teste MONTGOMERY RUNGER 2009 p 170 População infinita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 Ƹ𝑝 𝑧 𝑝1 𝑝 𝑛 População finita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 IC para proporção Exemplo a Do enunciado temos que 𝑛 50 Ƹ𝑝 18 50 036 𝑒 𝛾 95 Logo 𝑧 196 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 Ƹ𝑝1 Ƹ𝑝 𝑛 036 196 036 1036 50 036 196 036 1036 50 02270 04930 IC para proporção Exemplo 25 25 Os correios americano usam o reconhecimento óptico de caracteres desde a metade dos anos 60 Em 1983 os correios começaram a implantar a tecnologia nas principais agências de todo o país wwwbritannicacom Suponha que em uma amostra aleatória de 500 dígitos dos CEPs escritos a mão 466 sejam lidos corretamente a Construa um intervalo de confiança de 94 para a proporção verdadeira de dígitos corretos que podem ser lidos corretamente MONTGOMERY RUNGER 2009 p 232 adaptado População infinita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 Ƹ𝑝 𝑧 𝑝1 𝑝 𝑛 População finita 𝐼𝐶 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 Ƹ𝑝 𝑧 𝑝 1 𝑝 𝑛 𝑁𝑛 𝑁1 IC para proporção Exercício a Do enunciado temos que 𝑛 500 Ƹ𝑝 466 500 0932 𝑒 𝛾 94 Logo 𝑧 18808 𝐼𝐶 Ƹ𝑝 𝑧 Ƹ𝑝 1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 Ƹ𝑝1 Ƹ𝑝 𝑛 0932 18808 0932 10932 500 0932 18808 0932 10932 500 09108 09532 IC para proporção Exercício 94 3 3 18808 18808 Dimensionamento da amostra para estimarmos 𝑝 Definições O tamanho da amostra para estimarmos 𝑝 é dado por População infinita 𝑛 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝐸2 População finita 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝑁 𝐸2 𝑁 1 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝑠𝑒𝑛𝑑𝑜 𝐸 𝑒𝑟𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 Representa a diferença entre a média amostral ത𝑋 e a verdadeira média populacional 𝜇 Estimar p usando amostra piloto pesquisa semelhante já realizada ou utilizar Ƹ𝑝 05 Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi sujeita a um teste de impacto sendo observado algum dano em 18 desses capacetes b Usando a estimativa de p obtida a partir da amostra preliminar de 50 capacetes quantos capacetes devem ser testados para estarmos 95 confiantes de que o erro na estimação do valor verdadeiro de p seja menor ou igual a 002 c Quão grande terá de ser a amostra se desejarmos estar no mínimo 95 confiantes de que o erro na estimação de p seja menor ou igual a 002 independente do valor verdadeiro de p MONTGOMERY RUNGER 2009 p 170 Dimensionamento da amostra para estimarmos 𝑝 Exemplo o mesmo População infinita 𝑛 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝐸2 População finita 𝑛 𝑧2 𝑝 1 𝑝 𝑁 𝐸2 𝑁1 𝑧2 𝑝1 𝑝 b Do enunciado temos que Ƹ𝑝 18 50 036 𝑒 𝛾 95 Logo 𝑧 196 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝐸2 1962 036 1 036 0022 22127616 2213 𝑐𝑎𝑝𝑎𝑐𝑒𝑡𝑒𝑠 c Como não temos uma estimativa para p utilizamos Ƹ𝑝 05 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝐸2 1962 05 1 05 0022 2401 𝑐𝑎𝑝𝑎𝑐𝑒𝑡𝑒𝑠 Dimensionamento da amostra para estimarmos 𝑝 Exemplo o mesmo 25 25 Os correios americano usam o reconhecimento óptico de caracteres desde a metade dos anos 60 Em 1983 os correios começaram a implantar a tecnologia nas principais agências de todo o país wwwbritannicacom Suponha que em uma amostra aleatória de 500 dígitos dos CEPs escritos a mão 466 sejam lidos corretamente b Qual o tamanho da amostra necessário para que o erro na estimação seja menor que 01 supondo que a distribuição seja Normal MONTGOMERY RUNGER 2009 p 232 adaptado Dimensionamento da amostra para estimarmos 𝑝 Exercício o mesmo População infinita 𝑛 𝑧2 Ƹ𝑝1 Ƹ𝑝 𝐸2 População finita 𝑛 𝑧2 𝑝 1 𝑝 𝑁 𝐸2 𝑁1 𝑧2 𝑝1 𝑝 b Do enunciado temos que Ƹ𝑝 466 500 0932 𝐸 01 𝛾 94 Logo 𝑧 18808 𝑛 𝑧2 Ƹ𝑝 1 Ƹ𝑝 𝐸2 188082 0932 1 0932 012 224187 23 94 3 3 18808 18808 Dimensionamento da amostra para estimarmos 𝑝 Exercício o mesmo Inferência Estatística Estimação de parâmetros Estimativa por ponto Estimativa por intervalo e dimensionamento de amostra Intervalo de Confiança para média 𝜇 com desvio padrão populacional 𝜎 conhecido Intervalo de Confiança para média𝜇 com desvio padrão populacional 𝜎 desconhecido Intervalo de Confiança para proporção Intervalo de Confiança para variância Estimação de parâmetros Fórmulas válidas para uma variável com distribuição Normal ou para grandes amostras 𝑛 30 Vimos que se 𝑋𝑁 temos que a variância amostral se aproxima de uma distribuição quiquadrado dessa relação temos 𝐼𝐶 𝑛 1𝑆2 𝜒𝑛1𝛼 2 2 𝑛 1𝑆2 𝜒 𝑛1 1𝛼 2 2 Sendo 𝛼 1 𝛾 IC para variância Definições O conteúdo de açúcar na calda de pêssegos em lata é normalmente distribuído Uma amostra aleatória de n 10 latas resultou com um desvio padrão S 48 mg Encontre um intervalo com 95 de confiança para o desvio padrão do conteúdo de açúcar na calda 𝐼𝐶 𝑛1𝑆2 𝜒𝑛1𝛼 2 2 𝑛1𝑆2 𝜒 𝑛1 1𝛼 2 2 MONTGOMERY RUNGER 2018 p 228 IC para variância Exemplo Do enunciado temos que 𝑛 10 𝑆 48 𝑚𝑔 e 𝛾 95 𝛼 1 𝛾 5 𝜒 𝑛1 𝛼 2 2 𝜒9 0025 2 19023 𝜒 𝑛1 1𝛼 2 2 𝜒9 0975 2 2700 𝐼𝐶 𝑛 1𝑆2 𝜒𝑛1𝛼 2 2 𝑛 1𝑆2 𝜒 𝑛1 1𝛼 2 2 10 1 482 19023 10 1 482 2700 109005 768000 Logo 𝐼𝐶 𝑝𝑎𝑟𝑎 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 109005 768000 33016 87636 IC para variância Exemplo 𝜶 𝟐 𝟐 𝟓 𝟎 𝟎𝟐𝟓 19023 A percentagem de titânio em uma liga usada na fundição de aeronaves é medida em 51 peças selecionadas aleatoriamente O desvio padrão amostral é 037 Construa um intervalo de confiança de 99 para a variância 𝐼𝐶 𝑛1𝑆2 𝜒𝑛1𝛼 2 2 𝑛1𝑆2 𝜒 𝑛1 1𝛼 2 2 MONTGOMERY RUNGER 2018 p 228 adaptado IC para variância Exercício Do enunciado temos que 𝑛 51 𝑆 037 e 𝛾 99 𝛼 1 𝛾 1 𝜒 𝑛1 𝛼 2 2 𝜒50 005 2 79490 𝜒 𝑛1 1𝛼 2 2 𝜒50 0995 2 27991 𝐼𝐶 𝑛 1𝑆2 𝜒𝑛1𝛼 2 2 𝑛 1𝑆2 𝜒 𝑛1 1𝛼 2 2 51 1 0372 79490 51 1 0372 34764 00861 01969 IC para variância Exercício 𝜶 𝟐 𝟎 𝟓 𝟎 𝟎𝟎𝟓 79490 Estatística básica População Amostra Inferência Estatística População é o conjunto de todos os elementospessoasmáquinas sobre os quais estamos interessados em estudar Amostra é qualquer subconjunto da população Por que fazer uma amostra Entendimento inicial Acesso a toda a população é difícil ou impossível Alto custo Tempo de pesquisa excessivo Destruição do elemento pesquisado É aquela em que a escolha dos elementos da amostra é feita de forma nãoaleatória justificadamente ou não Amostragem por conveniência É aquela em que todos os elementos da população têm probabilidade conhecida diferente de zero de ser incluídos na amostra Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerado Amostragem probabilística Amostragem não probabilística Técnicas de Amostragem Algumas técnicas mais utilizadas É aquela em que a escolha dos elementos da amostra é feita de forma nãoaleatória justificadamente ou não Amostragem por conveniência É aquela em que todos os elementos da população têm probabilidade conhecida diferente de zero de ser incluídos na amostra Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerado Amostragem probabilística Amostragem não probabilística Técnicas de Amostragem Algumas técnicas mais utilizadas Exemplo Queremos escolher 10 alunos de 100 alunos de uma sala Numeramos os alunos e escrevemos números de 1 a 100 em um papel e sorteamos 10 números Seria o mesmo princípio do bingo sortear 10 número a partir de um globo com bolinhas numeradas de 1 a 100 Amostragem aleatória simples Exemplo Amostragem aleatória simples Definição É o processo de amostragem mais utilizado Todos os elementos da população tem a mesma probabilidade de ser escolhido como elemento da amostra Tende a produzir amostras representativas e permite o uso da estatística inferencial na análise dos dados coletados Normalmente utilizase uma tabela de números aleatórios e nomeiamse os indivíduos sorteandose um por um até completar a amostra calculada Amostragem aleatória simples No Excel Aba Dados opção Análise de Dados Item Amostragem Método de amostragem Aleatório Amostragem sistemática Exemplo Exemplo Queremos escolher 4 professores de 12 professores de Engenharia de Produção Ordenamos os professores e escrevemos números de 1 a 12 em um papel e sorteamos um número A partir do professor sorteado por exemplo número 2 selecionamos o professor contamos 3 12 dividido por 4 selecionamos o próximo contamos 3 selecionamos o próximo contamos 3até completar a amostra Amostragem sistemática Definição Os elementos da amostra são escolhidos conforme um fator de repetição um intervalo fixo Sua aplicação requer que a população esteja ordenada segundo um critério qualquer de modo que cada um de seus elementos possa ser unicamente identificado pela sua posição O fator de repetição é determinado dividindose o tamanho da população N pelo tamanho da amostra n O primeiro elemento é escolhido por sorteio dentre os elementos da população que ocupam a posição igual ou inferior a Nn fator de repetição em seguida selecionamse os elementos a cada intervalo Nn Amostragem sistemática No Excel Aba Dados opção Análise de Dados Item Amostragem Método de amostragem Periódico Exemplo Queremos fazer uma amostragem estratificada dos estudantes da Universidade Presbiteriana Mackenzie que moram na cidade de São Paulo por zona A população dos estudantes que moram em São Paulo é 1000 e queremos uma amostra de 100 as quantidades que devemos selecionar em cada estrato estão no gráfico abaixo População 1000 Amostra 100 Amostragem estratificada Exemplo Amostragem estratificada Definição Nessa técnica de amostragem a população é dividida em estratos e os elementos da amostra são retirados de cada estrato O tamanho dos estratos na amostra deve ser proporcional ao tamanho dos estratos correspondentes na população População 1 milhão Amostra 1000 casos Amostragem por conglomerado ou cluster Exemplo Exemplo Queremos estudar o nível de satisfação dos trabalhadores têxteis das empresas do Sul do país Não dispondo de uma lista com todos os trabalhadores considerase uma lista de todas as empresas têxteis do Sul clusters admitindose que o conjunto de trabalhadores de cada empresa caracteriza convenientemente a população que se pretende estudar A partir dessa lista selecionamse aleatoriamente algumas empresas e considerase a amostra constituída por todos os trabalhadores das empresas selecionadas Clusters Amostragem por conglomerado ou cluster Definição A população é dividida em conglomerados onde cada conglomerado é representativo da população Selecionamos aleatoriamente um conjunto de conglomerados e a amostra é constituída por todos os elementos dos conglomerados selecionados Diferentemente da amostragem estratificada na amostragem por conglomerado não é necessário possuir uma lista contendo todos os nomes dos elementos da população É aquela em que a escolha dos elementos da amostra é feita de forma nãoaleatória justificadamente ou não Amostragem por conveniência É aquela em que todos os elementos da população têm probabilidade conhecida diferente de zero de ser incluídos na amostra Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerado Amostragem probabilística Amostragem não probabilística Técnicas de Amostragem Algumas técnicas mais utilizadas Amostragem por conveniência Exemplo Exemplo Queremos estudar a opinião política de estudantes paulistanos Para realizar uma amostra probabilística seria necessário ter acesso a todos os estudantes universitários paulistanos selecionar um grupo aleatório e realizar a pesquisa Já para realizar uma amostra por conveniência poderíamos abordar três universidades próximas simplesmente porque representam o local onde a população da pesquisa reside e perguntar a alguns estudantes do período matutino que concordam em participar Amostragem por conveniência Exemplo Outros exemplos Entrevistas em centros comerciais Entrevistas em parques Entrevistas em mercados Entrevistas com pessoas na rua Questionários disseminados pela internet ou por meio impresso Amostragem por conveniência Definição Selecionamos uma amostra da população que seja acessível isto é os indivíduos são selecionados porque é conveniente para o pesquisador não porque eles foram selecionados por meio de um critério estatístico Por ser conveniente normalmente o custo é baixo e consome menos tempo Na amostragem não probabilística os elementos da população não tem a mesma probabilidade de serem selecionados portanto não há garantias da representatividade da população logo não podemos generalizar os resultados obtidos na amostra para a população Amostragem Exercício Uma indústria produziu 30000 peças plásticas para uso no ramo de eletro eletrônicos em um dia de trabalho sendo 7500 peças produzidas em cada uma das quatro máquinas injetoras de polímeros existentes na indústria Cada situação abaixo corresponde a um tipo de amostragem a saber amostragem aleatória simples AAS amostragem sistemática AS amostragem estratificada AE e amostragem por conglomerado AC Identifique cada amostragem e diga qual é a mais conveniente Sortear 25 peças provenientes de cada máquina injetora para serem avaliadas quanto às dimensões especificadas pelo cliente Sortear 100 peças de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente Sortear por exemplo a 30ª 60ª 90ª peça de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente Sortear duas das máquinas injetoras e então considerar as 7500 peças de cada uma delas para serem avaliadas quanto às dimensões especificadas pelo cliente Amostragem Exercício A Amostragem estratificada é a mais conveniente pois fará com que a produção de cada máquina esteja representada de forma proporcional AE Sortear 25 peças provenientes de cada máquina injetora para serem avaliadas quanto às dimensões especificadas pelo cliente AAS Sortear 100 peças de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente AS Sortear por exemplo a 30ª 60ª 90ª peça de uma lista de 30000 peças para serem avaliadas quanto às dimensões especificadas pelo cliente AC Sortear duas das máquinas injetoras e então considerar as 7500 peças de cada uma delas para serem avaliadas quanto às dimensões especificadas pelo cliente Amostragem Como funciona uma pesquisa eleitoral Datafolha httpswwwyoutubecomwatchvqII03g997rU Nexo Jornal httpswwwyoutubecomwatchvigi7E1OY7gs