·

Engenharia de Produção ·

Probabilidade e Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Probabilidade e Estatistica J e ntervalo de confianca rw rw regressdo e correlacdo 25 25 25 Nesta aula vamos estudar 0 Intervalo de Confianca que consiste em um intervalo estimado de um intervalo estimado de um parametro de interesse de uma populacao Em vez de estimar o parametro por um unico valor considera se um intervalo de estimativas provaveis Apresentaremos também a anilise de regressio que estuda 0 relacionamento entre uma vatidvel dependente e outras variaveis que sao ditas independentes ambas quantitativas E a correlacao linear que permite verificar se duas variaveis independentes estado associadas entre si ou seja o coeficiente de correlagao indica o grau de intensidade da correlacdo entre duas variaveis e se o sentido é positivo ou negativo No decorrer da aula serio apresentados exemplos praticos relacionados aos conteudos apresentados Entao vamos a nossa aula Comecemos entio analisando os objetivos e verificando as segdes que serao desenvolvidas ao longo desta aula Bom trabalho a Bons estudos PO SS ESS SSS SSS SSS SSS SSS SSS SS SSS SSSI 4 Objetivos de aprendizagem Ao término desta aula vocés serao capazes de compreender como a estatistica podera o auxiliar na realizacdo de pesquisa calcular intervalo de confianga para as pesquisas calcular o coeficiente de correlacao e a reta de regressao entre duas variaveis 39 213 amostral desse estimador Secoes de estudo Para facilitar a compreensio das formulas que serao apresentadas temos que X corresponde a média amostral No exemplo da sopa X sera a média de todas as amostras 1 Intervalo de confianca extraidas por outro lado y sera a média da populacao no 2 Regressio e correlacao exemplo seta a média de toda a sopa a verdadeira media de nutrientes Nessa mesma linha S sera a variancia Amostral e Intervalo de confianga o a variancia populacional Nessa mesma linha de raciocinio Fonseca e Martins WIciai 2011 p 169170 nos apresentam quatro teoremas sobre a 11 Conceitos iniciais distribuigao amostral das médias quais sejam Nesta secdo vamos estudar um pouco sobre o intervalo Teorema 1 a de confianga e como ele pode auxiliar os profissionais de Afirma que a média das médias amostrais igual a média diversas areas na realizacao de seus trabalhos diarios Uma populacional ou seja pp definigao de intervalo de confianga é apresentada por Fonseca e Martins 2011 p 186 como sendo uma técnica para se Teorema 2 oo ae fazer inferéncia estatistica Ou seja a partir de um intervalo de A Variancia da distribuicao das médias s x é igual a confiana construido com os elementos amostrais podese variancia da populacao 0 dividida pelo tamanho da amostra inferir sobre um parametro populacional n Isto valido pata populagoes finitas ou para amostragem Para melhor entender como a técnica é aplicada vamos com reposiao ou seja s 2 comecar com um exemplo pratico Digamos que se realizem uma pesquisa com um grupo de 1000 brasileiros para saber Teorema 3 di 4 i Edi A variancia da distribuigao das médias para populacdes qual sua idade média chegando a um resultado de 45 G cas para populag anos esta idade conhecida como uma estimativa pontual finitas Ou pata amostragem sem reposicao sera determinada representada por 45 anos E pontual pois se baseia pela formula sz a onde N representa o tamanho nos dados coletados desde grupo pesquisado Podemos da populacao considerar que é uma estimativa pontual da verdadeira idade da populacao A esta verdadeira idade média da populacao Teorema 4 vamos chamar de Este teorema afirma que ainda que a populacao nao tenha Por intervalo de confianga podemos entao encontrar um uma distribuicao normal sendo a média populacional p a intervalo de idades de forma que a verdadeira idade média da Vatiancia populacional o a distribuicao das médias amostrals populacio 1 esteja incluida neste intervalo digamos que um seta normalmente distribuida e sua média sera também py e a intervalo entre 42 anos e 48 anos podemos ainda fazer esta variancia amostral x estimativa com um nivel de confianga digamos de 98 ou fj seja com uma margem de erro de 2 ve di Interva 0 de a ld NCa patS Antes de partirmos para os calculos dos intervalos de dq edla populaciona H suane O confianga precisamos entender um pouco mais 0 processo dq Variancia populaciona o7 Or de pesquisa assim vamos usar um exemplo apresentado conhecida Para populagdo infinita OU por Silva 2011 p 8788 no qual apresenta o caso de um COM repOSICaO da amostra nutricionista que deseja saber se o valor nutricional da sopa servida em um refeitdrio esta de acordo com os padrées de Nesse caso desejase encontrar um intervalo de confianca qualidade exigidos para tanto ela precisa fazer a andlise desta para a média populacional no entanto Ja femos alguma sopa Levando em considetacao o grande volume de sopa a informagao desta populacao pois a variancia fornecida analisar nao sera viavel fazer a andlise de todo o produto mas Nesse caso usatemos a formula 5 sim realizar amostra se ela mexer bem a sopa e pegar um Pz 16 usk 207 1la 2 pouco conseguird uma amostra que representa bem o valor 7 nutricional da sopa mas pode ocorrer de ela nao misturar Para facilitar a aplicagao dessa formula vamos tentar adequadamente e entao pegat uma amostta que apresente esclarecer 0 significado de cada termo baseado em um i i exemplo pratico resultado diferente do verdadeiro a plo p Para resolver o problema da nuttricionista ha algumas Vamos entao considerar que vocé é gerente do setor quest6es que ela pode considerar ela pode por exemplo de produgao de lampadas de led de uma grande empresa pegar uma amostta grande o que tente a oferecer resultados deseja realizar um teste de durabilidade dos produtos que esta mais proximos do resultado médio de toda a sopa pode ainda fabticando Voce tem a informagao de que o desvio padrao pegar diversas amostras de forma a obter diversos resultados da duragao das lampadas produzidas por esta maquina o cuja média tende a ser mais proxima do verdadeiro valor 50 pores Vocé oo oor uma mee tog empades Do exemplo apresentado da nutricionista se Obtem uma media ae curacao de oras Com esses considerarmos todas as amostras possiveis de tamanho n que dados vocé deseja criar um intervalo de confianga que fornecga ela possa extrair desta sopa e para ela calcular um estimador a verdadeira duragao média destas lampadas e deseja ainda por exemplo a média podese construir uma distribuicio que este intervalo tenha um nivel de confianga de 95 Probabilidade e Estattstica 40 Comparando o exemplo apresentado com a formula de Silva 2011 p109 afirma que se o tamanho da amostta for calculo temos as seguintes informac6es menor que 5 do tamanho da populacgao nao interferira nos x 5000 horas Nada mais é do que a média amostral resultados mas caso contrario devese aplicar um fator de Nesse caso a média de duraciéo que vocé obteve das 1000 corregao na formula que ficara da seguinte forma lampadas que testou Z 0 valor que devera ser obtido na tabela padronizada p o x Nn 0 lw J Coo fa Sf 2 Za S 1 de distribuigio normal Para melhor entendimento veja a zVn JN1 z2Vn JN1 explicacao do proximo item tem relaciéo com o nivel de confianga que desejamos Esta formula pode ser usada também para populacoes finitas para nosso intervalo neste caso desejamos um nivel de Exemplo uma empresa tem 500 funcionarios que trabalham confianca de 95 para encontrar o valor de consideramos na linha de produgdo e vocé deseja calcular um intervalo de entao a formula 1 100 95 1 a 1 aw confianga para os salarios destes funcionarios sabendo que eles 095 a005 ou seja 25 como a tabela Z é faixa tém uma distribuicao normal e apresentam um o R 5000 central e foi dividido por dois 25 conforme no grafico Vocé entao coleta uma amostra de 50 funcionarios sem reposiio abaixo no entanto como desejamos encontrar o intervalo de e obtém um salétio médio de R 200000 Nessas condiées confianga vamos precisar da regiao central do grafico que é encontre o intervalo de confianca com nivel de confianga de 90 limitado pelos valores de Z 196 que foi obtido na tabela Z Neste caso temos uma populacao finita A amostra ainda considerando o percentual de 475 952 pois so duas ocorreu sem reposicao sendo que o tamanho da amostra caldas corresponde a 10 do tamanho da populagao Logo temos que aplicar a formula com o fator de corregao 25 ES 25 Temos a 475 eons é N 500 tamanho da populacio X R 200000 196 196 o R 5000 FONTE0 autor 2018 n 50 Método pratico Para encontrar o valor de Z considere ws ions o ium o nivel confianga que deseja trabalhar ex 90 dividimos 2 F iT 001 24 S 2000 164 90 por 2 pois sto duas caldas temos 45 que na tabela Z piyo9 164 70716 094963 u 2000 164 70716 094963 90 corresponde a 04495 procurar na tabela normal Z o valor P2000 1101 w 2000 1101 90 que fornece 0450 vamos encontrar z 164 P198899 w 201101 90 ao 50 horas pois o desvio padrao populacional foi FONTE 0 autor 2018 fornecido n 1000 lampadas tamanho da amostra realizada Poresse intervalo possivel saber comum grau de confianga yMédia populacional a qual desejamos estimar um de 90 que o verdadeiro salario médio dos funcionatios dessa intervalo empresa esta entre R 198899 e R 201101 Vamos agora fazer as substituicdes na formula e obter 0 14 Intervalo de confia nga para a intervalo media quando avariancia édesconhecida 50 50 oe P 5000 196 p 5000 196 95 Nao serao em todas as situagGes que formos realizar uma v1000 v100 pesquisa que teremos a informagdes do o desvio padrio da P5000 310 p 5000 310 95 populacao ou da o variancia populacional Nessas situagdes teremos que trabalhar com o S desviopadrao amostral P499690 pw 500310 95 pois para conseguilo é simples bastar calculalo sobre os elementos da amostra que obtivemos na pesquisa No entanto FONTE 0 autor 2018 essa mudanca nos obriga a utilizar a distribuicdo t ou também Ou seja para cada lampada construida nesta linha de conhecida como distribuicao t de Stdent Cabe informar que produgao em 95 dos casos a duracgao média dessa lampada estamos considerando que a distribuigao populacional é normal sera entre 499610horas e 500310 horas Para utilizar a distribuicdo t vamos considerar o grau de liberdade simbolizado por y como sendo n1 sendo n o 13 Intervalo de confia NCA Pala numero de elementos da amostra a Media populacional H quando Com estas adequacdes a formula a ser utilizada sera a Variancia populacional 0 for S s conhecida para populacao finita OU p z te Zhe ee ta 4 seM repOsiCaoO Ada amostfa 2 vn 2 Vn Em algumas situagdes nao é possivel retornar a amostra Vamos trabalhar com um exemplo para que deixe tudo pata a populacao antes de coletar uma nova amostra pode mais simples de entender Supomos entao que vocé esteja ocorrer de no momento que eu coleto amostta o elemento trabalhando no IBGE e deseja saber qual altura média dos seja destruido ou ha um custo alto para repor este produto homens de uma determinada cidade Sabese que essa variavel apresenta distribuicéo normal no entanto nao ha recursos necessarios para fazermos um censo de todos os homens x pg 3 Pg e entio usando as técnicas adequadas de amostragem sao P pZ pprtz 1a n n coletados dados de 121 homens dos quais se obtém uma altura media de 170 cm com um desvio padrio de 10 cm Dessa forma queremos determinar o intervalo de confianga Caso a populacao pesquisada seja finita devera ser usado com um nivel de confianca de 95 para a verdadeira média fator de correcao e entao teremos populacional pq Nn pq Nn Observem que Nesse caso desvio padrao fornecido pl prz ee p ptz pa 1a nao é o da populacao pois nao é conhecido 0 que temos n JN1 nJN1 é o desvio padrao amostral dos 121 homens que foram pesquisados ou seja ox 10 cm média amostral 170 Exemplo cm e n 121 numero de pessoas pesquisadas Somente nos falta uma informagao para aplicarmos a una pesquisa realizada om 200 pessoas de uma formula que 0 valor de t para isso utilizaremos a tabela de determinada regido revelou que 32 eram do sexo masculino distribuicao t de Stdent como n 121 logo p 120 gn1 Com base nessa pesquisa determine o intervalo de confianca Logo na tabela observamos na primeira coluna onde esta o para a verdadeira Proporgao de homens desta populagao 120 e na primeira linha observamos o valor de 005 ou considerando um nivel de confianga de 95 A 5 seja 5 pois como queremos um nivel de confianga de 95 Aqui femos ave considerar se a proporao de p 32 5 corresponde ao erro 032 logo 7 68 068 Devemos entao tragat um linha horizontal partindo 032068 032068 do 120 e uma linha vertical partindo do 005 encontrando P 032 196 Too p 032 196 95 valor para t 19799 Agora basta fazemos as substituigdes a p02553 p 03847 95 necessatias pata encontrar o intervalo de confianga Ou seja a verdadeira proporcio de homens nessa cidade 10 10 P 170 19799 p 170 19799 95 cstd entre 2553 3847 Vi21 v121 P17018 17018 95 2vamos considerar que a pesquisa realizada no exemplo P1682 u 1718 95 1 se refira a uma cidade com 20000 habitantes Dessa forma terfamos FONTE O autor 2018 0 oa 20000 200 032068 pare aa one Ou seja com 95 de nivel de confianca a verdadeira r2s90 ae ee et ee gn média de altura dos homens desta cidade esta entre 1682 cm snes jon 20000 200 032068 20000 200 e 1718 cm r22s96 aa a owe As condig6es pata 0 uso do fator de correcdo também se 02557 p 03843 95 aplica a este tipo de intervalo de confianga lo d fj Neste caso a verdadeira proporciéo de homens estara 15 Intervalo de confianga para gyicg 35574 3843 Droporcao Para que possamos entender um pouco melhor os 2 Regressio e correlagdao conceitos envolvidos na determinacao de intervalo de confianca pata proporcao vamos nos basear no estudo de 21 breve conceito Silva 2011 p 125130 Ele nos ensina que se considerarmos uma populacao com N elementos e entao tomarmos como Independente da area de atuagéo de um profissional parametros uma propriedade dessa populagao digamos ou pesquisador é possivel haver situagdes nas quais precisa intengao de votos teremos um conjunto de pessoas que verificar se ha associagao entre duas variaveis Digamos votaram no candidato x e os que nao votaram em x N 0 pesquisador da area médica ao estudar os efeitos de um x A proporao daqueles que votam em x é determinada novo medicamento sobre o corpo humano precisa avaliar se por p e a proporcao daqueles que nao votam em x a mudanga na dosagem do produto esta alterando os efeitos sera encontrada por qg S Nem sempre podemos obter sobre o tratamento O investidor da bolsa de valores precisa informagoes de toda a populacao e entao fazemos uso de saber se a alteracao no valor do dolar influi na cotaao da bolsa amostras com n elementos de forma que nas amosttas de valores de sao Paulo um professor de lingua portuguesa também teremos a proporcao daqueles que votam em x pode querer saber se ha relagao entre o numero de faltas dos cujo a proporcio é definida por p a proporcao dos alunos na sua disciplina e a nota final atingida que nao votam em x encontrada por g Baseado Pata questOes como as que sao propostas acima ha na nas proporgdes amosttais podemos calcular o intervalo estatistica o estudo de regressio e correlacgdo que nas palavras de confianga onde se encontra a verdadeira proporao de Viali sem data p 2 A analise de correlagao fornece um populacional Para isso podemos usar a formula a seguir numero que resume o grau de relacionamento linear entre as deste que a amostra seja maior do que 30 duas variaveis Ja a analise de regressao fornece uma equacao Probabilidade e Estattstica 42 we que descreve comportamento de uma clas varidveis em 34Re eressdo linear fungao do comportamento da outta variavel ce Vamos aqui tratar de forma bem simplificada 0 conceito 22 Grafico de d ISPErSaO da regresséo linear que cortesponderia a encontrar um ns Vamos suport uma telacio entre duas variaveis Nesse modelo matematico que represente a relacio entre as duas caso vamos considerar a tabela a seguir onde demonstra a vatiaveis em estudo Nesse caso como estamos tratando de quantidade de horas de trabalho de uma linha de produgio e TStess4o linear simples esse modelo é formado pela reta y c er a producao em toneladas embora seja uma telagéo uma tanto a bx por meio da qual se pode fazer estimativas de valores que obvia mas servira para nortear nossos estudos j Para x para y oo Ao lado da tabela sera apresentado um grafico de 1 wo caso x y so as varidveis e a e b podem ser dispersio No eixo x constarao as horas de trabalho pois ela CUO POF é a varidvel independente Sobre ela temos 0 controle e no eixo y a variavel dependente pois a depender da variacao de x ptovocara vatiacio em y b NE XiViExidyi ea LVia EX nx Xx n x Horas de Producéo em GRAFICO DE DISPERSSAO Trabalho Toneladas 3 a Baseado no exemplo apresentado teremos 2 10 pos 8 51501541 135 q b 2 b 27 412715 i a01 FONTE O autor 2018 Ao grafico foi inserida uma linha de tendéncia mas pode L ad xo li ti h q 3 ogo a teta de regresséo linear entre as horas de se obsetvar que os pontos estao dispostos em torno de uma 5 aa reta demonstrando ter uma forte correlacio entre a varidvel trabalho x a producao em toneladas y sera y 01 27 hora de trabalho e produgao em toneladas substituindo valores em x podemos calcular y sendo o inverso também possivel 23 Coeficiente de co rrelagdo linear Estes calculos podem ser feitos com auxilio de calculadora de Pearson cientifica e planilhas eletronicas sendo importante que vocés pesquisem estas e outras forma de resolucao Embora tenha ficado visivel no grafico a correlagao entre as varidveis ha um coeficiente que pode demonstrar essa cortelacao e este pode ser calculado por Retomando a aula m mn n 1 Yims Xie Vi Lins Xi Din Vi n 2 mn o mn 2 nm 2 1 Ty 5 ND 4 Xj 4 Ai s 24 Vi 7 Ji Mian Xi Qian Xi Misi Dia Yd I Chegamos ao final de nossa sexta aula Esperase ia que tenham conseguido assimilar os conteUdos E Para compreender melhor esta formula vamos calcular apresentados Vamos entdo recordar o que 4 coeficiente de correlagao linear de Pearson na tabela que estudamos bee aptesentamos acima ney ey ee 1 Intervalo de confianga fp conseguirmos determinar um intervalo de confianga de uma populagao esteja presente nesse intervalo considerando i f Os valores de r podem variar de 1 a 1 Quanto mais determinado nivel de confianca Lo a ptoximos a esses extremos indica existir uma cottelacao forte 2 Regressio e correlacio Quando a correlagao for positiva a relagio entre as vatiaveis sio diretamente proporcionais ou seja se uma Nessa secao estudamos a forma de calculat 0 coeficiente aumenta a outra também aumenta caso contrario a correlacao de correlacdo visando verificar se ha uma correlacaéo entre sendo negativa a relacao inversamente proporcional se uma duas variaveis e existindo podera ser definido a reta de aumenta a outra diminui tegressdo entre as variaveis 43 FONSECA J S da MARTINS G de A CURSO DE ESTATÍSTICA 6 Ed São Paulo Atlas 2011 GOMES F P CURSO DE ESTATÍSTICA EXPERIMENTAL 15 ed PiracicabaFEALQ2009 SILVA EM da et al ESTATÍSTICA Para os cursos de economia administração e ciências contábeis 3 ed São Paulo Atlas 2011 VIALI L Estatística Básica Correlação e Regressão PURS sd apostila Disponível em http wwwpucrsbrcienciasvialigraduacaoengenharias materialapostilasApostila5pdf Acesso em 31 de janeiro de 2018 Vale a pena ler O que é um intervalo de confiança Disponível em httpssupportminitabcomptbrminitab18help andhowtostatisticsbasicstatisticssupportingtopics basicswhatisaconfidenceinterval Acesso em 31 de janeiro de 2018 Capítulo 7 Intervalos de confiança Disponível em httpwwwdpiufvbrpeternelliinf162 www16032004materiaisCAPITULO7pdf Acesso em 31 de janeiro de 2018 Vale a pena acessar Me Salva EPA20 Intervalos de Confiança para a Média Probabilidade e Estatística Disponível em httpswwwyoutubecomwatchv26CkHyfOYq0 Acesso em 30 de janeiro de 2018 Intervalo de Confiança conceitos Nível de Confiança e Inferência Estatística Disponível em httpswwwyoutubecomwatchvsWle26vNbI Acesso em 29 de janeiro de 2018 Vale a pena assistir Vale a pena Minhas anotações 217