·

Cursos Gerais ·

Probabilidade e Estatística 2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Estatística Probabilidade aplicadas às Engenharias e Ciências Ben Dêvide de Oliveira Batista ESTATÍSTICA PROBABILIDADE BEN DÊIVIDE DE OLIVEIRA BATISTA ESTATÍSTICA PROBABILIDADE BEN DÊIVIDE DE OLIVEIRA BATISTA Ouro Branco MG 26 de abril de 2022 2021 by Ben Dêivide de Oliveira Batista Esse material está licenciado com uma Licença Creative Commons Atribuição Não Comercial 40 Internacional Usamos também a filosofia de trabalho com o Selo Democratizando Conhecimento DC O leitor é livre para compartilhar redistribuir transformar ou adaptar essa obra desde que não venha a utilizála em nenhuma atividade de propósito comercial Por fim a única exigência é a atribuição dos dos créditos aos autores dessa obra Direitos de publicação reservados ao seu conhecimento Impresso no Brasil ISBN Digital Impresso no Brasil ISBN Impresso Projeto Gráfico Ben Dêivide de Oliveira Batista Revisão técnica e textual Daniel Furtado Ferreira Revisão de Referências Bibliográficas Editoração Eletrônica Ben Dêivide de Oliveira Batista Capa Ben Dêivide de Oliveira Batista Como citar essa obra BATISTA B D O Estatística e Probabilidade aplicadas às Engenharias e Ciências 1ed Ouro Branco MGsn 2022 Disponível em httpsbendeividegithubiobookepaec Autor correspondente e mantenedor da obra Ben Dêivide de Oliveira Batista Contato bendeivideufsjedubr Site pessoal httpbendeividegithubio Licença Todos os direitos autorais contidos nesse livro são reservados ao seu conhecimento usufrao pois é totalmente de graça Useo com responsabilidade e saiba valorizar Este trabalho está licenciado com uma Licença Creative Commons Atribuição Não Comercial 40 Internacional Usamos também a filosofia de trabalho com o Selo Democratizando Conhecimento DC i Epígrafe O pulsar de minha existência está intensa e totalmente no presente da vida Ben Dêivide iii Sumário Licença i Epígrafe iii Prefácio vii 1 Definições gerais da Estatística e técnicas de somatório 1 11 Introdução 1 12 Definições gerais da Estatística 2 121 Estatística na pesquisa científica 5 13 Definições básicas 7 14 Técnicas de Somatório 11 Exercícios propostos 16 2 Coleta organização e apresentação dos dados 19 21 Introdução 19 22 Representação tabular 20 23 Representação gráfica 29 Exercícios propostos 30 3 Medidas de Posição 32 31 Introdução 32 32 Média 32 33 Mediana 36 34 Moda 44 Exercícios propostos 48 4 Medidas de dispersão 49 41 Introdução 49 42 Amplitude total ou Amplitude 50 43 Variância 53 44 Desvio padrão 58 45 Coeficiente de Variação 60 46 Erro padrão da média 62 Exercícios propostos 64 5 Probabilidades 66 51 Introdução à teoria de conjuntos no contexto probabilístico 66 52 Definições de probabilidades 76 53 Propriedades 78 531 Regra de adição de probabilidades 78 iv Sumário 532 Probabilidade de um evento complementar 79 54 Eventos independentes e probabilidade condicional 79 55 Teorema de Bayes 85 56 Variável Aleatória 89 57 Distribuição de X 91 58 Função de probabilidade FP 91 59 Função densidade de probabilidade FDP 91 510 Função de distribuição acumulada 93 5101 FDA para X discreta 93 5102 FDA para X contínua 94 511 Medidas resumo 96 512 Exercícios 99 6 Distribuições de probabilidades 104 61 Introdução 104 62 Distribuições discretas de probabilidades 104 63 Distribuições contínuas de probabilidades 122 64 Exercícios 135 7 Amostragem Em desenvolvimento 138 71 Introdução 138 72 Amostragem nãoprobabilística e probabilística 142 73 Técnicas de amostragem probabilística 142 8 Distribuição de amostragem 143 81 Introdução 143 82 Distribuição de amostragem da média 143 83 Distribuição de amostragem de proporções 143 84 Distribuição de amostragem de diferença entre médias 143 85 Distribuições amostrais quiquadrado t e F 143 9 Teoria da estimação 144 91 Introdução 144 92 Conceitos básicos 144 93 Estimação pontual 145 931 Métodos para obtenção de estimadores pontuais 146 932 Propriedades de um estimador pontual 154 94 Estimação por intervalo 154 941 Intervalo de confiança para a média 155 942 Intervalo de confiança para a variância 157 943 Intervalo de confiança para a diferença entre médias 158 95 Dimensionamento de amostras 158 96 Exercícios 159 10 Teoria da decisão 161 101 Introdução 161 102 Testes de hipóteses 162 103 Erros tipo I e II 163 104 Teste unilateral e bilateral 166 105 Passos para a construção de um teste de hipótese 166 106 Teste de hipóteses para a média 166 107 Testes de hipóteses para a proporção 166 108 Testes de hipóteses para a variância 166 v Sumário 109 Testes de hipóteses para a diferença entre médias 166 1010Exercícios 167 11 Correlação e regressão linear simples 169 111 Introdução 169 112 Correlação linear 170 1121 Coeficiente de correlação linear 170 1122 Teste de hipóteses acerca do coeficiente de correlação linear 170 113 Regressão linear simples 170 1131 Modelo 171 1132 Estimação dos parâmetros do modelo 171 1133 Somas de quadrados 173 1134 Teste de hipóteses para o modelo de regressão 174 1135 Medidas de adequação do modelo 177 114 Exercícios 179 12 Apêndice A Introdução ao R 180 13 Apêndice B Tabelas 181 14 Apêndice C Coordenadas polares 203 15 Gabarito dos Exercícios 206 Referências Bibliográficas 239 Índice Remissivo 240 vi Prefácio Esse é um livro digital da 1ª edição do Estatística Probabilidade aplicado às Engenharias e Ci ências um livro com o selo Democratizando Conhecimento DC O Livro é voltado para quem deseja iniciar no estudo sobre a estatística Daremos as bases e fundamentos de modo aplicado a problemas na área das Engenharias e Ciências de assuntos desde o que é uma população amostra até estudos sobre a teoria de decisão estudo de regressão dentre outros assuntos básicos para que assim a partir desse material o leitor tenha base para ler assuntos mais aprofundados na área da estatística vii Capítulo 1 Definições gerais da Estatística e téc nicas de somatório 11 Introdução Em pleno século XXI passamos por um processo de transformação na era digital Uma grande massa de informações surge instantaneamente a cada momento sobre os mais diversos temas possí veis Por exemplo nas redes sociais quando percebemos o número de curtidas de uma determinada declaração número de downloads de um determinado vídeo a repercussão que determinada decla ração proporciona nas redes sociais o número de propagandas etc tudo isso cria um grande banco de dados sobre os usuários que hoje se torna mais valiosa do que a própria moeda local Isso é a nova revolução chamada Big Data Por meio de grande banco de dados podemos por exem plo traçar um perfil dos usuários como eles se comportam quais as suas preferências escolhas diversão etc Contudo o entendimento dessas informações podem não ser tão claras ou devido a complexidade do problema ou pela quantidade de informações recebidas rapidamente ou outros fatores Diversos outros exemplos poderiam ser citados tudo isso para mostrar a necessidade de entender o que está por trás desses dados cuja compreensão é o grande objetivo nessa era global Nesse enfoque temos a Estatística como Ciência que fornece métodos para coleta organização descrição análise e interpretação de dados observacionais ou experimentais e para a utilização dos mesmos na tomada de decisões Os dados são informações retiradas de um conjunto de elementos de interesse Podemos estar interessados na Produção anual de Gás Natural não associado com o petróleo GASN de um determinado país e ao longo dos anos coletarmos informações para ao final por exemplo termos informações que nos indique o potencial energético desse recurso natural em um local ou consequências dessa fonte energética na economia do país por exemplo Assim por meio da utilização de técnicas estatísticas tentamos entender as informações contidas nos dados Devido a complexidade dessas informações em algumas situações o estudo sobre essas técnicas têm aumentado fazendo parte do nosso cotidiano Na era digital a grande quantidade de informações é gigantesca e valiosa e as empresas tentam entender o que está por trás desses dados ou você acha que o Facebook foi criado simplesmente para gerar entreterimento às pessoas Ou você também acha que o Google criou uma plataforma de pesquisa simplesmente para facilitar a vida das pessoas Algo muito nobre está por trás de tudo isso os dados No passado tratar uma grande massa de dados era uma tarefa custosa e cansativa que exigia ho ras de trabalho tedioso Porém hoje esse volume de informações pode ser analisado rapidamente por meio de um computador pessoal e programas adequados O computador contribui positiva mente na difusão e uso dos métodos estatísticos Já se perguntou como é que lojas virtuais lhe ofertam produtos sendo que nunca acessou aquele site antes Já percebeu que a Netflix quando lhe oferece uma série a tela de entrada às vezes se altera Tudo isso é fruto das técnicas de máquinas de aprendizagem do inglês Machine Learning uma área da inteligência artificial Juntamente com a estatística essas ferramentas estão presentes em várias das tecnologias que utilizamos hoje Por outro lado o computador possibilita uma automação que pode levar um indivíduo sem preparo específico a utilizar técnicas inadequadas para resolver um dado problema Assim é neces sário a compreensão dos conceitos básicos de Estatística bem como as suposições necessárias para o seu uso de forma criteriosa Com base nisso tentaremos expor ao longo desse livro as principais técnicas da Estatística desde o seu fundamento teórico às aplicações 1 Capítulo 1 Definições gerais da Estatística e técnicas de somatório 12 Definições gerais da Estatística Inicialmente podemos dividir a Estatística em três ramos Estatística Descritiva Probabilidade Estatística Inferencial Definimos cada uma dessas áreas a seguir A primeira delas é a Estatística Descritiva apresen tada na Definição 11 Definição 11 Estatística Descritiva ou Estatística Dedutiva Um conjunto de técnicas estatísticas destinadas a coleta descrição e sintetização dos dados a fim de podermos entender características de interesse da populaçãoa é chamada de Estatística Descritiva ou Estatística Dedutiva aVer Definição 16 As técnicas mencionadas na Definição 11 são coleta organização tabulação representação grá fica bem como medidas que sintetizam todas as informações contidas nos dados As quatro primeiras técnicas serão abordadas no Capítulo 2 As medidas serão estudadas nos Capítulos 3 e 4 Essa fase é de grande relevância pois com base na Estatística Descritiva podemos sintetizar as informações contidas nos dados e tornálas mais compreensíveis que de outro modo seriam complexas de serem entendidas No Capítulo 7 daremos uma maior ênfase sobre a definição de uma população De modo sim ples podemos definir como um conjunto de elementos com uma característica em comum Uma vez definida a característica que delimita essa população Ver Subseção 121 e também a caracte rística de interesse chamada de variável da pesquisa faremos a coleta dos valores observados da variável em cada elemento da população ou de um subconjunto amostra Os valores observados são chamados de dados Definição 12 Dado ou valor observado A característica de interesse observada em cada elemento da população é definida como valor observado ou dado Todas as técnicas mencionadas anteriormente auxiliam na descrição dos dados uma não neces sariamente sobrepõe a outra Vejamos a Company 2018 lançou o relatório técnico de 2018 sobre os diversos tipos de produção de energias dos países e na Figura 11 é mostrado um gráfico que sintetiza a produção e o consumo de petróleo do Brasil em milhões de barris por dia MMbbld nos períodos de 2007 a 2017 O gráfico nos revela que o Brasil produz petróleo abaixo do que necessitaria para o consumo de tal modo que a produção é 2771 a menos do que o consumo Isso explica o porquê do Brasil como grande produtor de petróleo ainda assim necessita importar essa fonte de energia Contudo o gráfico não apresenta um resumo perfeito Por exemplo mesmo a produção de petróleo sendo mais baixa do que o consumo o coeficiente de variação assunto abordado no Capítulo 4 dessas dessas duas variáveis são 1299 e 1093 respectivamente calculados de acordo com a Tabela 11 Isso implica que as variações da produção de petróleo são maiores do que as do consumo no Brasil Observe que essas últimas informações não podem ser vistas facilmente na Figura 11 mas juntamente com o auxílio das medidas numéricas medidas de posição e dispersão e as medidas gráficas podemos complementar as informações e assim obter uma melhor descrição sobre essas informações Para tentar refazer o gráfico da Figura 11 usamos o Código R 11 apresentado em seguida 2 12 Definições gerais da Estatística Figura 11 Produção e consumo de petróleo do Brasil nos períodos de 2007 a 2017 Tabela 11 Produção e consumo de petróleo do Brasil nos períodos de 2007 a 2017 Ano 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Produção 1831 1897 2029 2137 2179 2145 2110 2341 2525 2608 2734 Consumo 2308 2481 2498 2716 2839 2915 3124 3242 3181 3013 3017 Código R 11 Script 1 BP Statistical Review 2018 2 3 Producao e consumo de petroleo no brasil Milhares de barris por dia 4 ano asfactorc20072017 20072017 5 prodcons c1831 1897 2029 2137 2179 2145 2110 2341 2525 2608 2734 2308 2481 2498 2716 2839 2915 3124 3242 3181 3013 3017 6 id crepProdução 11 repConsumo11 7 8 Objeto que armazena as informações 9 dados dataframeano Legenda id prodcons 10 11 Pacote utilizado 12 installpackagesggplot2 13 libraryggplot2 14 15 Funcao para criacao do grafico de barras 16 ggplotdados aesxano yprodcons fillLegenda 17 geombarpositiondodge statidentity 18 xlabAno ylabPetróleo Milhões de barris por dia Quando precisamos extender as informações contidas em um subconjunto amostra de dados para todo o conjunto população necessitamos de técnicas específicas dentro da estatística para garantir que estas informações sejam o mais verossímil possível Técnicas estas são chamadas de 3 Capítulo 1 Definições gerais da Estatística e técnicas de somatório Estatística Inferencial definida a seguir Definição 13 Estatística Inferencial ou Estatística Indutiva O estudo de técnicas que visam extender extrapolar a informação contida na amostra à po pulação chamamos de Estatística Inferencial ou Estatística Indutiva As técnicas abordadas na Estatística Inferencial estão relacionadas a determinar características parâmetros populacionais desconhecidas ou até mesmo fazer afirmações sobre esses parâmetros A determinação de parâmetros por meio de características amostrais estimadores que chamamos de Estimação será abordado no Capítulo 9 As afirmações realizadas sobre estes parâmetros cha madas de hipóteses serão estudadas no Capítulo 10 A Definição 13 nos mostra que por meio da Estatística podemos tomar decisões sobre uma população através da amostra Isso se faz necessário muitas vezes em uma pesquisa devido a duas coisas preciosas tempo e dinheiro Muito embora se tivermos acesso a todos os elementos de uma população não se faz necessário o uso de técnicas da inferência estatística e daí realizamos o que chamamos de Censo A forma de como se obter uma amostra é um dos passos mais importante em todo o processo da análise uma vez que não adianta está com todo o aparato técnico se as informações contidas nessas amostra não são representativas da população Para isso temos uma área na estatística chamada Amostragem que será responsável pelo desenvolvimento de métodos de como selecionar os ele mentos populacionais para compor a amostra de modo que as principais características contidas na população sejam preservadas na amostra Esse assunto será estudado no Capítulo 7 Contudo sabemos que entender uma população por um subconjunto desta gerase uma incer teza ou erro A estatística tenta minimizar esse erro o máximo possível isto é reduzir as incertezas das informações contidas na amostra e extrapolar essas informações para a população Para isso usamos a probabilidade como suporte assunto estudado nos Capítulos 5 6 e 8 Definição 14 Probabilidade A teoria matemática que estuda a incerteza de fenômenos aleatórios é chamada de probabili dade Os fenômenos aleatórios estão relacionados a situações que dificilmente saberemos com certeza do que pode acontecer Por exemplo se arremessarmos um dado de seis faces de tamanhos iguais e desejarmos saber a face superior desse dado antes do arremesso não temos como afirmar com certeza qual o valor se considerarmos as faces numerados de 1 a 6 Observe que mesmo sabendo quais os valores das faces não podemos afirmar com exatidão qual o valor da face superior antes do arremesso Mas por meio da probabilidade podemos minimizar essa incerteza e dizer que há aproximadamete 17 de chance de um número escolhido ocorrer Em nosso cotidiano a probabilidade auxilia na decisão de um fabricante de cola de empreender uma grande publicidade no seu produto visando aumentar sua participação no mercado ou na deci são de parar de imunizar pessoas com menos de vinte anos contra determinada doença ou ainda na decisão de arriscarse a atravessar uma rua no meio do quarteirão Esses pequenos exemplos mos tram a relação que a probabilidade tem com a inferência estatística pois ela nos auxiliará a tomar decisões em procedimento inferencias tentando traduzir para a nossa linguagem do diaadia Ao final dessas definições gerais podemos mostrar uma ilustração Figura 12 que facilitará a compreensão do que abordamos nessa seção Por fim um último assunto estudado nesse livro Capítulo 11 será o estudo da correlação e regressão linear quando estamos interessado em estudar a forma e o grau relação entre duas ou mais variáveis Todos esses assuntos estudaremos nos capítulos seguintes com um certo detalhamento dando ênfase a exemplos práticos estudados em nosso campo de trabalho Alguns Capítulos poderão con ter uma seção chamada Aprofundamento com o intuito de apresentar uma maior profundidade sobre o tema estudado Alguns apêndices serão criados nesse livro para dar suporte ao conteúdo 4 12 Definições gerais da Estatística Figura 12 Ilustração animada sobre as disposições gerais da Estatística 121 Estatística na pesquisa científica O trabalho estatístico é parte integrante do método científico Segundo Silva 2007 definimos Definição 15 Método científico Um conjunto de regras e procedimentos para a obtenção de resultados isto é uma conclu são sobre um determinado problema de uma pesquisa científica é denominado de Método científico A pesquisa científica por sua vez desenvolve conhecimentos para um saber mínimo de um de terminado fenômeno estudado A pesquisa científica se inicia a partir de um problema dentro da população em estudo Por meio desse problema surgem diversas indagações Exemplo 11 No Estado de Minas Gerais houveram dois acidentes de grandes proporções nos últimos anos envolvendo barragens que armazenam rejeitos de mineração Os acidentes ocorreram na cidade de Mariana e Brumadinho vitimando centenas de pessoas e um impacto ambiental imenso com o arrombamentos dessas barragens Indagamos Quem são os responsáveis por essas duas tragédias Quanto será o custo o impacto dessas tragédias Quando começou esse problema trágico Que medidas poderiam ter sido tomadas para que isso não acontecesse Onde estão os órgãos de fiscalização para coibir esses acontecimentos uma vez que no inter valo de três anos ocorreram duas catástrofes dessas Com essas indagações lançadas para o estudo do problema e definido a questão inicial dentre as citadas ou outras que possam surgir o método científico se encarregará de estruturar a pesquisa de modo preciso e sistemático A resposta a essas indagações resultam em um plano de pesquisa que consiste em 1 Identificar o problema e o objetivo da pesquisa A identificação do problema é o norte da pesquisa Por meio das perguntas iniciais procuraremos en tender as possíveis causas e efeitos da situação formulando assim o problema Nessa fase devemos identificar a população e os elementos que a compõe como também os demais procedimentos da pes quisa inclusive o objetivo do trabalho no qual se estipula a finalidade do presente estudo Esse passo é o combustível que impulsiona a pesquisa científica 5 2 Formular a hipótese A hipótese é uma afirmação atribuída pelo pesquisador sobre a população com o intuito de responder as indagaçãoões do problema atingindo o objetivo da pesquisa Essa afirmação pode ser sugerida pela literatura ou até mesmo construída pelo próprio pesquisador De toda forma a elaboração dessa hipótese deve ser bem formulada para que sua não rejeição ou rejeição consiga responder a indagação inicial e o objetivo seja atingido ou desencadeie novas dúvidas e outras pesquisas possam surgir Exemplo 12 Tentando inspecionar como controle de qualidade uma remessa de peças enviadas por um fornecedor de uma determinada fábrica de peças para indústria automotivas garante que essa remessa não há mais de 8 de peças com defeito Dessa forma o problema foi lançado com a seguinte indagação será que essa remessa não há mais de 8 de peças com defeito Lançamos a hipótese e será testada H0 A porcentagem de peças com defeito é igual ou superior a 8 Perguntamos aos leitores essa indagação elucida a indagação do problema A avaliação dessa hipótese será realizada na análise e interpretação de dados do qual aplicaremos técnicas específicas para refutar ou não a hipótese estudada H0 Supondo que não tenhamos evidências estatísticas para a rejeição dessa hipótese e decidimos não rejeitála a dúvida que fica é será que a hipótese estudada foi não rejeitada porque a quantidade de peças é igual ou superior a 8 Observe se foi 8 a afirmação inicial do fornecedor das peças está correta Entretanto só o número de peças foi superior a 8 o que o fornecedor afirmou está equivocado Concluímos que a hipótese não foi bem elaborada para responder a indagação inicial no problema levantado A forma correta deveria ser H0 A porcentagem de peças com defeito é menor ou igual a 8 A importância do desenvolvimento das hipóteses é muito importante uma vez que podemos tomar decisões totalmente equivocadas e assim todo o trabalho estudado poderá ser desperdiçado em vão 13 Definições básicas 7 Análise e interpretação dos resultados Após a apresentação dos dados devemos calcular as medidas típicas convenientes para fazermos uma análise dos resultados obtidos através de métodos estatísticos Estatística inferencial ou indutiva e tirarmos desses resultados conclusões e previsões 8 Conclusão e derivação da conclusão que poderá rejeitar ou não a hipótese estudada gerando assim uma confirmação ou indagações para outros problemas É de responsabilidade de um especialista no assunto que está sendo pesquisado que não é necessaria mente um estatístico relatar as conclusões de maneira que sejam facilmente entendidas por quem as for usar na tomada de decisões 9 Apresentação dos resultados por meio de trabalhos científicos para a propagação do conheci mento sobre o problema estudado Esses pontos do plano de pesquisa podem sofrer alterações em algumas metodologias científicas Contudo elas estão envolvidas direta ou indiretamente nas metodologias estudadas sendo que não necessariamente elas ocorrem em todas as pesquisas nessa ordem e que podem ser ilustrados na Figura 13 Figura 13 Fases do plano da pesquisa científica 13 Definições básicas Ao ser discutido na seção anterior sobre as definições gerais da Estatística iniciaremos agora ao que chamamos de definições básicas que consiste em definir formalmente alguns termos tais como população e amostra como também os termos variável dado ou valor observado Essas definições serão importantes para o desenvolvimento do conteúdo do livro O conjunto de todos os elementos dos quais temos o interesse de suas informações chamamos esse conjunto de população A palavra população em nosso cotidiano está sempre relacionado a um conjunto de pessoas que habitam um determinado local país cidade etc Contudo na estatística ampliamos a definição de população da seguinte forma 7 Capítulo 1 Definições gerais da Estatística e técnicas de somatório Definição 16 População O conjunto finito ou infinito de todos os elementos com pelo menos uma característica co mum dos quais é de interesse para a pesquisa denominamos de População O número de elementos é denominado tamanho da população denotado por N Percebemos pela Definição 16 que a idéia sobre população é mais geral Podemos dizer que o conjunto de peças com defeitos fabricados por uma determinada empresa constitui uma população Um outro exemplo é a concentração de metais pesados no Rio sendo que o rio constitui a população No primeiro caso a população constitui a empresa que fabrica essas peças com defeitos que por sua vez essas peças representam os elementos dos quais a característica em comum a todas as peças é que foi fabricada por essa empresa e apresenta defeito No segundo caso a especificação dos elementos poderá não ser muito claro pois é um caso de população infinita Daremos mais detalhes sobre isso no Capítulo 7 Essas características comums devem delimitar inequivocamente quais elementos que per tencem ou não à população A notação usual para o número de elementos da população é N A população pode ser Finita quando pode ser enumerada ou Infinita quando não pode ser enume rada Definição 17 Amostra Um subconjunto de elementos da população é denominado amostra O número de elementos da amostra é chamado de tamanho da amostra sendo denotado por n A amostra é necessariamente finita pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado Esse estudo está baseado em características de interesse da população para tentar responder as indagações iniciais do problema da pesquisa Ver Seção 121 Definimos essa característica como variável Definição 18 Variável A característica pela qual desejamos que a população seja descrita é denominada de variável A variável representa o mecanismo pelo qual podemos atingir o objetivo da pesquisa Será por meio dos dados observados isto é do valor observado dessa variável assumido por cada elemento da população ou da amostra que faremos as análises específicas para se chegar a uma conclusão Muitas vezes não trabalhamos apenas com uma única variável dependendo da complexidade da pesquisa poderemos estudar diversas variáveis ao mesmo tempo A variável pode assumir diferentes valores de elemento para elemento chamado de dado ou valor observado como foi apresentado na Definição 12 A notação usual para a variável é X Y Z ou Xi Yi Zi para um particular elemento amostral em que i 1 2 n Definimos a natureza das variáveis a seguir Definição 19 Natureza de uma variável Definimos o tipo de variável pela sua natureza isto é pelo valor assumido em cada elemento da população ou amostra como 1 Variável qualitativa é a variável cujo valor observado assume um valor com natureza de atributo ou categoria Esta ainda se subdivide a Nominal Quando os valores não são possíveis de ordenação b Ordinal Quando os valores são possíveis de ordenação segundo um critério quanti tativo 8 13 Definições básicas 2 Variável quantitativa é a variável cujo valor observado assume um valor com natureza numérica enumerável ou não Ainda podem ser divididas a Discreta Quando os valores são dados de contagem isto é descrevem uma quanti dade contável cujos potenciais valores dessa variável podem ser enumerados em um conjunto de valores b Contínua Quando os valores resultam de uma medida ou mensuração podendo assumir qualquer valor real entre dois extremos e dessa forma não podemos enume rar seus valores Vejamos o Exemplo 13 para elucidar todas essas definições mencionadas anteriormente Exemplo 13 Desmatamento da Amazônia Legal O Brasil vem passando por um processo de desmatamento na Amazônia legal que o mundo vem acompanhando nesses últimos anos O Instituto Nacional de Pesquisas Espaciais INPE de senvolveu o PRODES1 Programa de Monitoramento do Desmatamento da Amazônia que vem acompanhando desde 1988 as taxas de desmatamento na região Apresentamos a seguir a Tabela 12 que apresenta algumas informações sobre esse tema em cada estado do qual compreende a Amazônia Legal em que os dados da taxa acumulada de desmatamento por estado estão dispo níveis na página do INPE em httpterrabrasilisdpiinpebrappdashboarddeforestation biomeslegalamazonrates Podemos verificar que apresentamos diversas variáveis para um melhor detalhamento da taxa de desmatamento na Amazônia legal em relação a algumas informações sobre os estados que compõe essa região Observemos que quanto a natureza das variáveis Região UF e Classifica ção são variáveis qualitativas pois os valores observados representam uma categoria Apesar de representar uma qualidade percebamos que classificação apresenta um ordenamento referente a quantidade de desmatamento acumulado de cada estado em que o estado do Pará está em pri meiro lugar por ter sido o estado que mais desmatou desde 1988 No caso as variáveis Região e UF representam apenas categorias que não apresentam qualquer forma de ordenamento Muito embora os valores de Classificação estejam representados por números a natureza é qualitativa Portanto Região e UF são variáveis qualitativas nominais e Classificação variável qualitativa ordinal As demais variáveis são Número de cidades Desmatamento acumulado Área total e Popula ção estimada Conseguimos observar que Número de cidades e População estimada apresentam dados de contagem logo essas variáveis são quantitativas discretas Isso significa que entre dois valores consecutivos há uma discretização ou seja o estado do Amapá está dentro da região da Amazônia legal e tem 14 município Já o estado de Roraima apresenta 15 municípios dentro da Amazônia Legal Dessa forma não há um potencial valor para a variável Número de Cidades en tre esses dois valores isto é 145 De outro modo podemos ordenar em um conjunto enumerável todos os valores de uma variável quantitativa discreta Agora para o caso das variáveis Desmatamento e Área total percebemos que os valores as sumidos por essas variáveis não são dados de contagem mas de medição isto significa que não contamos área ou taxa de Desmatamento acumulado mas sim medimos De outro modo te oricamente nós não conseguimos identificar os potenciais valores de uma variável quantitativa contínua em certo certo conjunto enumerável porque observe o valor da área total do estado do Pará 1245870 00 km2 se tivéssemos instrumentos de medidas mais precisos esse valor não seria exatamente esse poderia ter sido 1245870 001 km2 1245870 0001 km2 1245870 00001 km2 e assim por diante Dessa forma em uma determinada ordem nós não conseguiríamos saber qual o próximo valor ordenado para a área após observarmos a área do estado do Pará 9 Capítulo 1 Definições gerais da Estatística e técnicas de somatório Tabela 12 Taxa de desmatamento acumulado por estado na Amazônia Legal compreendido desde 1988 a 07122020 Região UF Nº de cidades 2 Desmat acum km2 Área total km2 Clas3 Pop estimada4 Norte Pará 144 15766700 124587000 1º 8690745 CentroOeste Mato Grosso 141 14792600 90320702 2º 3526220 Norte Rondônia 52 6293600 23776520 3º 1796460 Norte Amazonas 62 2849300 155916789 4º 4207714 Nordeste Maranhão 181 2570700 27641984 5º 7114598 Norte Acre 22 1572500 16412396 6º 894470 Norte Tocantins 139 872700 27746676 7º 1590248 Norte Roraima 15 859700 22364453 8º 631181 Norte Amapá 14 169600 14247076 9º 861773 Pensando sobre uma variável PARE Uma variável originalmente quantitativa pode ser coletada de forma qualitativa Por exemplo a variável idade medida em anos com pletos é quantitativa discreta Porém se considerarmos uma nova variável como faixa etária do qual os valores possíveis são criança 0 a 12 anos adolescente 12 a 18 anos adulto 18 a 60 anos e idoso acima de 60 anos cujos valores foram originais da variável idade estão entre parênteses a variável faixa etária passa é consi derada uma variável qualitativa ordinal Outro exemplo é o peso dos lutadores de boxe uma variável quantitativa contínua se traba lhamos com o valor obtido na balança mas qualitativa ordinal se o classificarmos nas categorias do boxe pesopena pesoleve peso pesado etc Outro ponto importante é que nem sempre uma variável represen tada por números é quantitativa O número do telefone de uma pes soa o número da casa o número de sua identidade Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea por exemplo Isto não significa que a variável sexo passou a ser quantitativa É fato que a rigor as variáveis quantitativas seriam todas discreti zadas devido a limitação dos nossos instrumentos de medidas Ob serve que o tamanho de uma pessoa não está limitado às escalas de metros centímetros milímetros etc Porém os instrumentos de me dida que obtém essa informação estão limitados a essas escalas De toda forma precisamos dessa limitação para que as análises sejam possíveis e possamos tomar decisões a partir dos dados 1Para quem desejar entender com detalhes a metodologia baseada para o programa acesse httpwwwobtinpe brOBTassuntosprogramasamazoniaprodes 2Dados coletados da página do IBGE edição 2019 httpsgeoftpibgegovbrorganizacaodoterritorio estruturaterritorialamazonialegal2019listademunicipiosdaamazonialegal2019ods 3Essa variável se refere a classificação do estado que obteve maior taxa de desmatamento acumulado desde 1988 a 2020 4Essa variável se refere a população estimada de cada estado e os dados foram retirados do IBGE disponível em httpswwwibgegovbrcidadeseestados 10 Uma técnica muito utilizada na Estatística é o estudo da Regressão linear que estuda a relação entre duas ou mais variáveis e será abordado no Capítulo 11 Assim uma das operações utilizadas é a soma do produto entre duas variáveis por exemplo X e Y do qual podemos representar esta soma para um conjunto de pares Xi Yi de tamanho n da seguinte forma sumi1n Xi Yi X1 Y1 X2 Y2 ldots Xn Yn 14 Técnicas de Somatório soma no resultado da expressão 11 dada da seguinte forma X1 X2 Xn2 X1 X2 Xn X1 X2 Xn X1X1 X1X2 X1Xn X2X1 X2X2 X2Xn XnX1 XnX2 XnXn n i1 X2 i 2 n ji1 XiXj 16 Nesse caso impomos também uma outra restrição no somatório do segundo termo após a igual dade que foi somar todos os produtos Xi Xjs exceto aqueles com ele mesmo Assim observamos que situações do tipo X1 X2 X2 X1 e desse modo podemos representar X1 X2 X2 X1 2X1X2 que o resultado será o mesmo e simplifica a notação Generalizando a soma para os demais casos temos 2 n ji1 XiXj como verificado na expressão 16 Por fim queremos enfatizar uma última situação que é usar um indexador não como a identi ficação da variável para um determinado elemento da população ou amostra mas como valor ob servado Essas situações serão muito utilizadas em notações no Capítulo 5 e 6 do qual somaremos as probabilidades da variável assumir valores em um determinado conjunto A ideia de variável nesses capítulos será entendida como uma função mas isso é assunto mais para frente Nesse caso vamos entender que P é uma função que mede a chance de determinado X assumir um deter minado valor isto é P assume um valor entre 0 e 1 Essa função será chamada mais a frente de probabilidade Assuma também que os valores possíveis de X assumam valores em um conjunto A 1 2 3 4 5 e estamos interessados em representar a chance de X assumir valor 3 Nesse caso usamos PX 3 Agora desejarmos representar a chance de X assumir valores no mínimo igual a 3 Dessa forma representamos essa chance da seguinte forma PX 3 5 x3 PX x PX 3 PX 4 PX 5 17 Observamos que o indexador no somatório agora é o valor assumido pela variável e não a identifi cação da variável a um deteminado elemento da amostra ou população Se desejarmos somar todas as chances que X assume podemos apresentar duas notações diferentes apresentadas na sequência 5 x1 PX x xA PX x 18 O índice no somatório indica agora que iremos somar as chances de X assumir todos os valores pertencentes ao conjunto A Claro que muitas outras formas de apresentar as técnicas de somatório podem ocorrer ao longo do texto uma vez que outras formas podem ser abordadas dependendo do assunto como também da área estudada De todo modo tentamos passar parte da notação que será utilizada ao longo do livro para que o leitor possa se ambientar nesse tipo de representação matemática Para complementar essas informações o Teorema 11 apresenta algumas propriedades sobre téc nicas de somatório que serão importantes para os próximos capítulos 13 Teorema 11 Propriedades de somatório Considere a b e k constantes e que X e Y são variáveis quantitativas então as seguintes propriedades envolvendo somatório são válidas I sumi1n aXi a sumi1n Xi II sumi1n Xi Yi le sumi1n Xi sumi1n Yi III sumi1n aXi pm bYi a sumi1n Xi pm b sumi1n Yi IV sumi1n k nk V sumi1n Xi barX 0 em que barX frac1n sumi1n Xi VI sumi1n Xi2 ge left sumi1n Xi right2 VII nbarX2 left fracsumi1n xin right2 VIII sumi1n Xi barX2 frac1n sumi1n Xi2 IX sumi1n Yi Xi barX sumi1n Yi barY Xi barX v Segue i1n Xi barX sumi1n Xi sumi1n barX sumi1n Xi n left frac1n sumi1n Xi right sumi1n Xi sumi1n Xi 0 vi Verificando a expressão 16 percebemos claramente que sumi1n Xi2 left sumi1n Xi right2 A única condição de igualdade acontece se n 1 e em termos práticos para uso estatístico usamos a mesma justificativa dada na propriedade I vii n X2 n left fracsumi1n Xin right2 fracsumi1n Xi2n viii Vejamos a seguinte dedução sumi1n Xi barX2 sumi1n Xi2 2XibarX barX2 sumi1n Xi2 2barX sumi1n Xi n barX2 sumi1n Xi2 2 fracsumi1n Xin left fracsumi1n Xin right2 n left fracsumi1n Xin right2 sumi1n Xi2 2 leftfracsumi1n Xinright2 leftfracsumi1n Xinright2 ix Antes de mostrarmos a prova da propriedade IX vejamos que sumi1n barYXi barX barY sumi1n Xi barX 0 Propriedade V Portanto temos que sumi1n YiXi barX sumi1n YiXi barX sumi1n YXi barX 0 Propriedade VIII logo sumi1n YiXi barX sumi1n Yi barY Xi barX Capítulo 1 Definições gerais da Estatística e técnicas de somatório Exercícios propostos Exercício 11 Baseado no Exemplo 11 identifique um problema para essa pesquisa bem como um objetivo e desenvolva hipóteses a serem estudadas de modo que estas possam responder as indagações do problema e atinja o objetivo proposto Solução na página 206 Exercício 12 Usando os resultados do Teorema 11 mostre em quais aplicações na estatís tica poderemos utilizar esses resultados Solução na página 206 Exercício 13 Baseado em Devore 2006 um famoso experimento executado em 1882 Mi chelson e Newcomb fizeram 66 observações do tempo levado pela luz para percorrer a distân cia entre dois locais em Washington DC Algumas das medidas codificadas de certa forma foram 31 23 32 36 2 26 27 e 31 Por que essas medidas não são idênticas Solução na página 206 Exercício 14 Sejam as amostras de tamanho n 5 de duas variáveis dadas por X 2 4 5 1 2 Y 1 2 3 5 8 Obtenha a 4 i1 Xi b 5 i1 4 X2 i c n i2 Xi d n i1 Xi Yi e n i13Xi 2Yi f n i1 XiYi n i1 Y2 i g n i1 Xi h n i1 Yi i n i1 X2 i j n i1 Y2 i k n i1YiXi l n i1 Yi2 m n i1 Xi2 n n i1Xi n i1 Xi n 2 o n i1Yi n i1 Yi n 2 p n i1 X2 i n i1 Xi2 n q n i1 Y2 i n i1 Yi2 n r Qual conclusão se pode chegar sobre os itens n e p bem como o e q Solução na página 207 Exercício 15 Forneça uma amostra possível de tamanho 5 de cada uma das populações a seguir a todos os jornais publicados no Brasil b todas as empresas na área de telecomunicações c todos os alunos da Universidade Federal de São João delRei d todas as notas pontuados de 0 a 100 dos alunos da disciplina de Estatística e Probabili dade Solução na página 207 16 14 Técnicas de Somatório Exercício 16 Observouse o tempo em minutos que 10 atendimentos de clientes da em presa telefônica A demoraram para serem atendidos que seguem 5 10 2 13 7 15 8 12 6 e 5 O objetivo do estudo foi verificar se o tempo médio em minutos do atendimento era superior a 10 minutos Perguntase a Qual a população em estudo b Qual o problema indagado c Qualis as variávelis em estudo do trabalho como também a natureza dessas variá velis d Podemos identificar o tamanho da população e da amostra com essas informações Solução na página 207 Exercício 17 Como podemos relacionar os ramos da Estatística com os ítens do plano de pesquisa científica presentes nesse capítulo Solução na página 208 Exercício 18 Os dados retirados de Tavares e Anjos 1999 representam a distribuição per centual do estado nutricional em homens idosos brasileiros idade 60 anos segundo Índice de Massa Corporal IMCa por macrorregião e situação de domicílio Pesquisa Nacional sobre Saúde e Nutrição 1989 que seguem Regiões Número Estado Nutricional b Magreza Adequado Sobrepeso I Sobrepeso II e III Norte 223 44 606 294 56 Nordeste 586 88 683 198 31 Urbano 267 71 623 266 40 Rural 319 107 746 125 22 Sudeste 463 79 590 267 64 Urbano 197 56 564 302 78 Rural 232 64 664 220 52 Sul 429 51 565 292 92 Urbano 197 45 512 330 113 Rural 232 64 664 220 52 CentroOeste 327 107 606 228 59 Urbano 154 106 552 273 69 Rural 173 110 714 137 39 Brasil 2028 78 618 247 57 Urbano 1038 60 572 295 73 Rural 990 117 717 142 24 Como poderíamos em notação usando as técnicas de somatório representar a soma de todos os valores de IMC do Brasil levando em consideração as demais variáveis Se desejássemos calcular o total dos valores observados de IMC dos homens do nordeste considerando as 17 Capítulo 1 Definições gerais da Estatística e técnicas de somatório demais condições E se fosse do nordeste e da zona urbana como representaríamos esse somatório Solução na página 208 aA unidade de IMC em kgm2 bA classificação do estado nutricional em relação ao IMC foi Magreza todas as formas IMC 18 5 ade quado 18 IMC 25 0 sobrepeso I 25 IMC 30 0 sobrepeso I e II IMC 30 0 Exercício 19 Considere a expressão n i1 Xi A2 Qual o valor de A para que essa expressão seja minizada Solução na página 209 18 Capítulo 2 Coleta organização e apresentação dos dados 21 Introdução Após selecionado a população de interesse definindo os elementos que a compõe bem como as variáveis que serão estudadas fazemos o processo de coleta dos dados Os dados são os valo res assumidos de uma variável em um determinado elemento da população que pode está sendo estudado por meio de uma amostra ou coletado diretamente da população Neste último caso a pesquisa realizada é um Censo Ao termos um primeiro contato com os dados percebemos que algumas informações prévias podem não ser facilmente obtidas devido a desorganização dessas observações Isso ocorre princi palmente quando temos um grande número de dados Definição 21 Dados brutos Os dados coletados numa forma sem ordenação e sem nenhum tipo de arranjo sistemático são chamados dados brutos Os dados da Tabela 21 retirado de Montgomery e Runger 2016 p 188 representam o número de erros em um conjunto de caracteres strings de 1000 bits que foram monitorados por um canal de comunicação No total foram coletados dados de 20 conjuntos de caracteres Tabela 21 Dados brutos sobre o número de erros encontrados em 20 conjuntos de caracteres moni torado em um canal de comunicação 3 1 0 1 3 2 4 1 3 1 1 1 2 3 3 2 0 2 0 1 Podemos observar pela Tabela 21 que estes representam um tipo de dados brutos pois não há qualquer ordenamento sobre os seus valores e que a interpretação desses dados poderá se compli car à medida que o tamanho da amostra aumenta Quando ordenamos os dados brutos podemos obter algumas informações mais facilmente como por exemplo valores mínimos e máximos desses conjunto de dados Definição 22 Dados em rol ou elaborados Os dados brutos Definição 21 ordenados de modo crescente ou decrescente alfanumerica mente são chamados de dados em rol ou elaborados Agora podemos transformar os dados brutos da Tabela 21 em dados elaborados em Rol apresentados na Tabela 22 Em termos de notação iremos representar um conjunto de variáveis ordenadas dessa forma X1 X2 Xn de tamanho n Com o ordenamento usaremos um parêntese no índice X1 X2 Xn de modo que X1 miniXi e Xn maxiXi para i 1 2 n Da mesma forma vale para a representação dos valores observados dessas respectivas variáveis isto é valores observados sem ordenação denotados por x1 x2 xn e valores observados ordenados x1 minixi e xn maxixi Este último é a representação em notação dos dados elaborados Percebemos com os dados elaborados que os valores extremos representam respectivamente os valores mínimo e máximo do conjunto de dados independente do número de elementos Isso 19 Capítulo 2 Coleta organização e apresentação dos dados Tabela 22 Dados elaborados sobre o número de erros encontrados em 20 conjunto de caracteres monitorado em um canal de comunicação 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 facilita a percepção de algumas informações porém ainda limitado uma vez que a quantidade de valores pode ser simplicada sem perda de informações por meio de tabulações agrupadas em distribuição de frequências Além de simplificar podemos obter mais informações do que se estes dados tivessem expressos sem tabulação do qual trataremos na próxima seção 22 Representação tabular A frequência simples ou frequência absoluta representa o número de vezes que determinado valor foi observado que em notação denotaremos por Fi iésima frequência de determinada variável em que a frequência observada será denotada por fi Vejamos o agrupamento dos dados da Tabela 23 em distribuição de frequência a seguir Tabela 23 Distribuição de frequência do número de erros encontrados em 20 conjunto de caracteres monitorado em um canal de comunicação Número de erros xi Frequência simples fi 0 3 1 7 2 4 3 5 4 1 Total 20 De forma mais fácil podemos por meio da Tabela 23 saber quantas vezes um determinado valor foi observado sem grandes esforços bastando apenas olhar para a coluna de frequências absolu tas Se desejarmos apresentar uma forma relativa dessa frequência em relação ao número total de observações podemos utilizar a frequência relativa denotada por Fr em que fr representa o seu respectivo valor observado e que essa frequência será um valor entre 0 e 1 Calculamos a frequência relativa de acordo com a expressão 21 Fri Fi k i1 Fi i 1 2 k 21 sendo k o número de grupos ou classes No caso o cálculo da frequência relativa baseado na Tabela 23 a representação de k se refere ao número de grupos uma vez que os dados são discretizados Portanto esse tipo de agrupamento é válido tanto para as variáveis qualitativas quanto para a va riável quantitativa discreta No caso da variável quantitativa contínua agrupamos os seus valores em classes uma vez que sua natureza não é discretizada O modo de como criar essas classes aprenderemos mais a frente Desse modo a Tabela 24 apresenta o agrupamento dos dados do nú mero de erros encontrados em 20 conjunto de caracteres monitorado em um canal de comunicação juntamente com a frequência relativa de seus valores Percebemos que k i1 fi n uma vez que os dados são amostrais A frequência relativa passa a ter sentido prático quando usamos o resultado em porcentagem surgindo então a frequência percentual denotada por F cujo valor observado é dado por f de modo que essa frequência é calculada pela expressão 22 Fi Fri 100 i 1 2 k 22 20 22 Representação tabular Tabela 24 Frequência relativa do número de erros encontrados em 20 conjunto de caracteres moni torado em um canal de comunicação Número de erros xi Frequência simples fi Frequência relativa fri 0 3 320 0 15 1 7 720 0 35 2 4 420 0 20 3 5 520 0 25 4 1 120 0 05 Total 20 1 em que Fri é dado pela expressão 21 e k é igual ao número de grupos ou classes Assim podemos acrescentar a frequência percentual aos dados da Tabela 24 que pode ser apre sentado na Tabela 25 Tabela 25 Frequência percentual do número de erros encontrados em 20 conjunto de caracteres monitorado em um canal de comunicação Número de erros xi Frequência simples fi Frequência relativa fri Frequência percentual fi 0 3 0 15 0 15 100 15 1 7 0 35 0 35 100 35 2 4 0 20 0 20 100 20 3 5 0 25 0 25 100 25 4 1 0 05 0 05 100 5 Total 20 1 100 Podemos observar que 35 do grupo de caracteres apresentava apenas 1 erro 15 dos grupos não apresentaram erros Porém se perguntássemos no mínimo quantos grupos apresentaram 2 erros Em quantos grupos tivemos no máximo 3 erros A primeira pergunta seria respondida somando as frequências simples ou absolutas 4 5 1 10 grupos Para a segunda pergunta responderíamos 3 7 4 5 1 19 grupos Isso poderia tornar mais oneroso à medida que o nome de grupos fosse aumentando Ao invés usaremos as frequências acumuladas para auxiliar indagações desse tipo aos dados Temos dois tipos de frequências acumuladas a frequência acumulada abaixo de denotada por Fac cujo valor calculado é denotado por fac dado pela expressão 23 Faci i j1 Fj i 1 2 k 23 sendo k o número de grupos ou classes e Fj representando jésima frequência absoluta A outra é a frequência acumulada acima de denotada por Fac cujo valor calculado é denotado por fac dado pela expressão 24 Faci k ji Fj i 1 2 k 24 sendo k o número de grupos ou classes e Fj representando jésima frequência absoluta Na Tabela 26 complementamos as informações com as frequências acumuladas os dados apresentados da Tabela 25 É importante notar que sempre o último valor da coluna da frequência acumulada abaixo de é o número total de elementos e que o último valor da frequência acumulada acima de coincide com o seu respectivo valor da frequência simples fi como pode ser observado na Tabela 26 Uma outra coisa interessante é que podemos ter uma forma alternativa de calcular a frequência acumulada acima de dado pela expressão 25 21 Tabela 26 Frequência percentual do número de erros encontrados em 20 conjunto de caracteres monitorado em um canal de comunicação Número de erros xi fi fn fs Frequência acumulada fac 0 3 015 15 3 20 3 7 10 1 7 035 35 10 17 050 085 33 85 2 4 020 35 14 10 070 050 47 50 3 5 025 25 19 6 095 020 095 20 1 005 5 20 1 1 005 100 5 Total 20 1 100 Facti left sumk1i Fi quad i 1 Facti1 Fi1 quad extdemais casos 25 sendo k o número de grupos ou classes Vamos tentar entender as equivalências entre as expressões 24 e 25 Indagamos quantos grupos apresentam no mínimo 1 erro Observe que x 2 isto é os valores observados iguais a 1 estão no segundo grupo Assim pela expressão 24 temos fact2 sumj25 fj 7 4 4 5 1 17 Da mesma forma podemos utilizar a expressão 25 e de modo equivalente temos fact2 fact1 f21 fact1 f1 20 3 17 A expressão 25 pode parecer no primeiro momento mais trabalhoso o cálculo Porém perceberemos com a prática de exercícios que esse processo é mais rápido do que calcular usando a expressão 24 Por fim podemos apresentar a forma relativa e percentual das frequências acumuladas usando de modo similar quando calculamos as frequências relativas e percentuais dadas nas expressões 21 e 22 respectivamente Denotaremos a frequência relativa acumulada acima de por Frac e a frequência relativa acumulada acima de por Fract As expressões dessas frequências são dadas respectivamente por Fracl fracFaclsumi1k Fi i 1 2 ldots k e Fract fracFactsumi1k Fi i 1 2 ldots k em que k é o número de grupos ou classes Voltando ao conjunto de dados iniciado na Tabela 21 podemos finalizar a sua tabulação com todas as frequências mencionadas anteriormente em um quadro resumo na Tabela 27 Tabela 27 Distribuição de frequências do número de erros encontrados em 20 conjunto de caracteres monitorado em um canal de comunicação Número de erros xi fi fn fi fs fact facti fact fact facl 0 3 015 15 3 20 01 100 1 7 035 35 10 17 050 085 33 85 2 4 020 35 14 10 070 050 47 50 3 5 025 25 19 6 095 020 095 20 1 005 5 20 1 1 005 100 5 Total 20 1 100 Essa representação tabular como falado anteriormente pode ser usada para todas as variáveis discretizadas como as variáveis qualitativas quanto a variável quantitativa discreta Porém para o caso da variável qualitativa nominal não faz sentido o uso da frequência acumulada uma vez que esse tipo de variável não tem ordenamento no sentido quantitativo Para o caso da variável quantitativa contínua precisamos agrupar os valores observados em intervalos de classe isto porque a discretização de seus valores se devem aos instrumentos de medida e não a natureza da variável Por exemplo quando medimos uma altura 178m de fato a altura real não está limitada a segunda casa decimal Então a melhor forma será criar regiões intervalos de modo que possamos contemplar determinados valores Existem diversas formas de como agrupar as variáveis quantitativas contínuas isto é métodos ligados como desenvolver a criação de classes Contudo iremos nos restringir a um critério empírico que se baseia no número de elementos seja na amostra ou população A primeira indagação que surge é qual o número de classes para agrupar esses dados Denotaremos por k o número de classes em que sua expressão por k approx begincases sqrtnúmero de elementos Caso o tamanho seja igual ou inferior a 100 5 log10número de elementos Caso o tamanho seja superior a 100 endcases 210 Nesse caso o cálculo de k é uma aproximação e devemos aproximar a um número inteiro mais próximo Pode ocorrer situações em que o número de classes resulta em um agrupamento em que temos classes com frequência 0 isto é com nenhum elemento dentro dessa classe Não faz sentido criar uma classe sem elementos Dessa forma ao final do processo da criação de tabelas com intervalos de classes e verificado classes sem elementos o processo deve ser reiniciado e alterado o valor de k ou um número inteiro para baixo ou para cima Após isso todo o processo que será apresentado na sequência deverá seguir Caso esse problema se repita novamente voltaremos a fase de determinação de k até encontrar um inteiro do qual sob a determinação de dados com intervalo de classes com frequência em suas classes superior a 0 Em todo esses processos devemos evitar que o número de classes seja inferior a 3 uma vez que para k 3 não será necessário um agrupamento de dados em tabela para uma quantidade tão pequena de valores Dando sequência após a determinação do número de classes denotada por At sendo definida pela expressão 211 At maxi Xi mini Xi para i in mathbbN Posteriormente devemos determinar a amplitude da classe denotada por c e expressa como c A1 A0 k Amostra A2 A1 k População em A1 é expresso em 211 e k dada pela expressão 210 O fato de o denominado ter o valor de k subtraído de 1 ao invés de k para o caso dos dados amostrais é devido a uma correção realizada no cálculo do limite inferior de primeira classe que será apresentada a seguir Segundo Ferreira 2009 p 13 a justificativa se deve a suposição de que uma amostra de tamanho n tem grande chance de não conter o valor mínimo da população isto é à medida que o tamanho da amostra aumenta temse uma maior chance de obter elementos menores que o valor mínimo que foi encontrado para uma amostra de tamanho menor Por fim apresentamos o cálculo para se obter o limite inferior da primeira denominado por Li1a sendo dado pela expressão 213 Li1a X1 c2 Amostra X1 População Realizando esses quatro passos iremos criar as classes iniciando pelo limite inferior da primeira classe e para essa mesma classe o seu limite superior será denotado por Ls1a cujo cálculo é dado por Ls1a Li1a c Representaremos em notação a primeira classe da seguinte forma Classe Li1a Ls1a Em termos de conjunto diremos que Classe 1 x R Li1a x Ls1a isto é os valores observados pertencerão a essa classe se forem iguais ou superiores a Li1a e inferiores a Ls1a Como o valor do limite superior não pertence a essa classe será contabilizado para a próxima classe Nesse caso o limite inferior da segunda classe será dado por Li2a Ls1a e seu limite superior Ls2a Li1a c em que c é a amplitude da classe Inserindo agora a segunda classe na tabela temos Classe Li1a Ls1a Li2a Ls2a Mais uma vez o valor do limite superior dessa classe não pertence mas pertencerá a próxima classe Esse processo continua até chegar a késima classe que ao final teremos uma tabela da seguinte forma Classe Li1a Ls1a Li2a Ls2a Lika LSk No caso da última classe não contemplamos os valores dos limites a essas classes caso existam no banco de dados Assim a frequência absoluta é calculada verificando os valores que estão dentro da amplitude dos intervalos e as demais frequências seguem o mesmo raciocínio falado anteriormente Algumas notações vistas na literatura não contemplam o limite superior da última classe e assim essa classe pode ser também representada da forma Lika LSk Um problema surge com os dados porque ao serem agrupados nas classes nós perdemos essa informação Vejamos a representação de uma classe com sua frequência absoluta 22 Representação tabular Classe Fi Li1a Ls1a f1 Li2a Ls2a f2 Lika Lska fk Observe que sabemos quantos valores existem em cada classe mas sem a informação dos dados brutos ou elaborados nós não sabemos quais são os valores pertencentes a cada classe Assim uma alternativa de valor para representar as fi para i 1 2 k em cada classe é usa o ponto médio Esse critério é chamado hipótese tabular básica Essa hipótese sugere que assumir o ponto médio como um potencial representante dos valores de uma determinada classe assume um menor erro do que escolher qualquer outro valor dentro desse intervalo para representar essas observações O ponto médio denotado por Xi será dado por Xi Liia Lsia 2 i 1 2 k 214 Percebemos que ocorre uma perda de precisão nos dados quando agrupamos em intervalo de classes uma vez que o ponto médio passa a representar esses valores em cada classe De todo modo se observa que essa perda de informação é pequena para o ganho que se obtém ao representar esses dados em tabulação com intervalo de classe no sentido não só de organização mas de entendimento das informações Em resumo podemos dizer que o algoritmo para criar um agrupamento de dados em intervalo de classes pode ser dados em sete passos 1 Calcular k 2 Calcular At 3 Calcular c 4 Calcular Li1a 5 Determinar as classes 6 Calcular o ponto médio e 7 Calcular as frequências como apresentadas no início dessa seção Os dados do Exemplo 21 foram retirados de Presidential Comission 1986 p 129131 e apre sentados a seguir Exemplo 21 Os dados representam a temperatura ºF do anel de vedação de cada teste de acionamento ou lançamento real do motor do foguete Challenger isso porque em 1986 houve nos Estados Unidos um dos maiores acidentes com ônibus espaciais vitimando em 8 astronautas que estavam na tripulação Foram realizados diversos estudos pela NASA para identificar as causas da falha A primeira atenção se voltou para a temperatura do anel de vedação que é apresentado a seguir 84 49 61 40 83 67 45 66 70 69 80 58 68 60 67 72 73 70 57 63 70 78 52 67 53 67 75 61 70 81 76 79 75 76 58 31 Diante dessas informações para melhor apresentar essas informações vamos agrupar esses dados em uma tabela com intervalo de classes uma vez que a temperatura do anel de vedação é uma variável quantitativa contínua Inicialmente vamos calcular o número de classes k 36 6 classes Observando os valores percebemos que x1 31oF e x36 84oF logo a amplitude total é At 53oF Na sequência calculamos amplitude da classe c 536 1 10 6oF por 25 Capítulo 2 Coleta organização e apresentação dos dados fim o limite inferior da primeira classe Li1a 31 10 62 25 7oF Assim começaremos pela primeira classe em que já temos o limite inferior dela e seu limite superior será Li1a 25 7 10 6 36 3oF As demais classes segue o procedimento descrito anteriormente Por fim verificaremos quais o valores pertencentes em cada classe para computar a frequência absoluta o cálculo do ponto médio de acordo com a expressão 214 e as demais frequências calculadas como descritas no início dessa seção Assim temos o quadro geral de uma tabela com intervalo de classes para esses dados apresentados a seguir Classe fi xi fri faci faci fi fac fac 1 257 363 100 3100 003 100 3600 300 278 10000 2 363 469 200 4160 006 300 3500 600 833 9722 3 469 575 400 5220 011 700 3300 1100 1944 9167 4 575 681 1200 6280 033 1900 2900 3300 5278 8056 5 681 787 1200 7340 033 3100 1700 3300 8611 4722 6 787 893 500 8400 014 3600 500 1400 10000 1389 Criamos o Código R 21 para que seja possível calcular de forma otimizada o agrumento de dados em intervalos de classe para variáveis quantitativas contínuas 26 22 Representação tabular Código R 21 Script 1 Tabela em distribuicao de frequencias 2 tabfreq functiondados k NULL 3 Dados em Rol Elaborados 4 sortdados 5 tamanho da amostra 6 n lengthdados n 7 if isnullk 8 Numero de classes 9 if n 100 10 k roundsqrtn 11 OBS O valor de k nao necessariamente precisa ser 12 sqrtn Esse eh um valor base 13 14 if n 100 15 k 5 log10n 16 17 else 18 ifisnumerick stopOargumentodevesernumérico 19 20 Amplitude total 21 At diffrangedados 22 Valor minimo 23 x1 mindados 24 Amplitude da classe 25 c roundAtk 1 2 26 Limite inferior da primeira classe 27 LI1 x1 c2 LI1 28 vi cLI1 rep0 k 1 29 vs cLI1 c rep0 k 1 30 Calculando os limites inferior e superior 31 for i in 2k 32 vii vii 1 c 33 vsi vsi 1 c 34 35 vi roundvi 2 36 vs roundvs 2 27 Capítulo 2 Coleta organização e apresentação dos dados Script 32 Continuacao 33 Funcao para calculo das frequencias das classes 34 freq functionx vi vs k 35 freq rep0 k 36 for i in 1k 1 37 freqi lengthxx vii x vsi 38 39 freqk lengthxx vik x vsk 40 returnfreq 41 42 Frequencia absoluta 43 fi freqdados vi vs k 44 Construindo as classes 45 classe pasteroundvi 2 roundvs 2 46 classek pasteroundvik 2 roundvsk 2 47 classe 48 Ponto medio 49 pm vi vs2 50 Frequencia relativa 51 fr roundfin 2 52 Frequencia acumulada abaixo de 53 fac1 cumsumfi 54 Frequencia acumulada acima de 55 x representa as frequencias absolutas 56 fac2 functionx 57 f1 sumx 58 n lengthx 59 vet cf1 rep0n 1 60 for j in 2n 61 vetj vetj 1 xj 1 62 63 returnvet 64 65 fac22 fac2fi 66 Frequencia percentual 67 fp roundfr100 2 68 Fac abaixo de percentual 69 fac1p roundfac1n100 2 70 Fac acima de percentual 71 fac22p roundfac22n100 2 72 Estatisticas 73 estat list 74 Númerodeclasses k 75 Amplitudetotal At 76 Valormínimo x1 77 Amplitudedaclasse c 78 LIda1ªClasse LI1 79 80 Tabela de frequencias 81 tabela dataframeClasse classe Fi fi 82 PM pm Fr fr 83 Fac1 fac1 Fac2 fac22 84 Fp fp Fac1p fac1p 85 Fac2p fac22p 28 23 Representação gráfica Script 86 Continuacao 87 Fi Frequencia absoluta PM Ponto medio da classe 88 Fr Frequencia relativa Fac1 Frequencia acumulada abaixo de 89 Fac2 Frequencia acumulada acima de 90 Fp Frequencia percentual 91 Fac1p Fac1 percentual Fac2p Fac2 percentual 92 listres listtabela tabela estat estat 93 returnlistres 94 23 Representação gráfica Por fim nesta última seção mostraremos mais uma forma de apresentar os dados usando gráficos 29 Capítulo 2 Coleta organização e apresentação dos dados Exercícios propostos Exercício 21 Observamos nas expressões 23 e 24 a forma de se calcular as frequên cias acumuladas acima de e abaixo de quando indagamos questões que envolvem situações do tipo quantas vezes observamos no máximo X x Para isso usamos a expressão 23 Em outra situação indagamos quantas vezes observamos no mínimo X x Para isso usamos a expressão 24 Percebemos que a condição limiar está inclusa na situação Por exemplo na Tabela 24 podemos estar interessados em saber quantos grupos de caracteres monitora dosa em um canal de comunicação foram encontrados no mínimo 2 erros Isto significa que desejamos saber todos os grupos tais que X 2 Ou seja o grupo que continha dois erros estava incluso na contagem Para isso usamos a expressão 24 Porém podemos estar inte ressados na situação em que a condição limiar não esteja inclusa na contagem de elementos Por exemplo refazendo a indagação anterior quantos grupos de caracteres apresentam acima de 2 erros Observe que os grupos apresentam dois erros não entram na contagem Isso vale também para a outra situação Logo não será possível utilizar as expressões das frequências acumuladas 23 e 24 Desenvolva as expressões para essas últimas situações de modo similar ao apresentado para as expressões 23 e 24 fazendo as adaptações devidas Solução na página 210 aEntenda nessa situação que grupo de caracteres é um elemento da amostra Exercício 22 Os dados retirados de Tavares e Anjos 1999 p 763 representam a distri buição percentual do estado nutricional em homens idosos brasileiros idade 60 anos se gundo Índice de Massa Corporal IMCa por macrorregião e situação de domicílio Pesquisa Nacional sobre Saúde e Nutrição 1989 que seguem Regiões Número Estado Nutricional b Magreza Adequado Sobrepeso I Sobrepeso II e III Norte 223 44 606 294 56 Nordeste 586 88 683 198 31 Urbano 267 71 623 266 40 Rural 319 107 746 125 22 Sudeste 463 79 590 267 64 Urbano 197 56 564 302 78 Rural 266 173 695 124 08 Sul 429 51 565 292 92 Urbano 197 45 512 330 113 Rural 232 64 664 220 52 CentroOeste 327 107 606 228 59 Urbano 154 106 552 273 69 Rural 173 110 714 137 39 Brasil 2028 78 618 247 57 Urbano 1038 60 572 295 73 Rural 990 117 717 142 24 Considere a variável estado nutricional como estudo então como seria desenvolvido a distri 30 23 Representação gráfica buição de frequência baseado nas informações da tabela Apresenteas Solução na página 210 aA unidade de IMC em kgm2 bA classificação do estado nutricional em relação ao IMC foi Magreza todas as formas IMC 18 5 ade quado 18 IMC 25 0 sobrepeso I 25 IMC 30 0 sobrepeso I e II IMC 30 0 Exercício 23 Considerando os dados do Exercício 22 como poderíamos representálos graficamente con siderando apenas um gráfico Solução na página 210 Exercício 24 Dados retirados de Montgomery e Runger 2016 mostram os dados retirados planta de fabricação de semicondutores Nessa planta o semicondutor é um fio colado a uma estrutura A variável em estudo representa a resistência à tração lb f pol2 isto é uma força requerida para romper a cola Os dados são apresentados a seguir 995 2445 3175 3500 2502 1686 1438 960 2435 2750 1708 3700 4195 1166 2165 1789 6900 1030 3493 4659 4488 5412 5663 2213 2115 Apresente uma tabela de distribuição de frequências para esses dados informando as frequências absoluta relativa acumulada abaixo de acumulada acima de percentual per centual acumulada abaixo de e percentual acumulada acima de Solução na página 211 31 Capítulo 3 Medidas de Posição 31 Introdução Após tabularmos os dados ou apresentarmos graficamente percebemos que ainda assim a quan tidade de informações pode ser muito grande para descrevêlos Desse modo surgem algumas medidas que podem resumir tudo isso de modo a preservar as principais características contidas nessas observações são as denominadas medidas de posição ou tendência central e as medidas de dispersão ou de variabilidade que tem a propriedade de localizar a distribuição dos dados e também caracterizar sua variabilidade respectivamente Nesse capítulo trataremos das medidas de posição e no Capítulo 4 as medidas de dispersão As medidas de posição representam o ponto central da massa de dados de modo que o seu valor indica que as observações estão em torno dele mas que não necessariamente o valor dessa medida central exista no conjunto de dados A escolha das medidas de posição apresentadas dependerá da natureza das variáveis bem como algumas peculiaridades existentes nos dados como por exemplo a existência de dados discrepantes Vamos apresentar na sequência a primeira medida de tendência central e a mais conhecida e utilizada na estatística a média aritmética 32 Média Quando iniciamos uma conversa e percebemos que alguém está no meio termo em um determinado posicionamento dizemos que a pessoa está fazendo média vulgarmente dizemos que está em cima do muro Nesse mesmo raciocínio é a média aritmética uma medida em que o seu valor re presenta o valor central das observações Podemos comparar a média como um ponto de equilíbrio em um sistema de pesos do qual se cada observação pode ser representada com uma certa massa no ponto no eixo X de um plano cartesiano então o ponto que representa a média equilibrará esse sistema de pesos Definimos Definição 31 Média aritmética Seja uma amostra X1 X2 Xn de uma população X1 X2 XN de tamanhos n e N respectivamente definimos a média aritmética por µ N i1 Xi N População 31 e X n i1 Xi n Amostra 32 Em notação dizemos que µ é uma característica amostral isto é representa a média populacio nal e chamamos de parâmetro Na prática essa informação é desconhecida e a representamos por uma medida amostral que chamamos de estimador uma função que depende apenas dos dados 32 32 Média amostrais Um estimador para µ representa a média aritmética X O valor observado de X pode ser representado por x em termos de notação Vejamos um exemplo a seguir Exemplo 31 Considerando os dados da Tabela 21 podemos calcular a média amostral da seguinte forma X 3 1 1 20 34 20 1 7 erros Portanto o número de erros encontrados em um conjunto de caracteres podem ser represen tados por uma única medida que é a média amostral A interpretação é que em média ocorreram 1 7 erros nos caracteres monitorados em um meio de comunicação e significa que os 20 conjuntos de caracteres apresentam um número de erros em torno desse valor A Definição 31 é utilizada para dados sem agrupamento isto é dados brutos ou dados elabora dos Para o caso de dados agrupados em distribuição de frequência definimos Definição 32 Média aritmética em dados agrupados Seja uma amostra X1 X2 Xn de tamanho n agrupados em k grupos com variáveis Xi e frequência Fi ou k classes com pontos médios Xi e Fi frequências para i 1 2 k e k i1 Fi n então a média aritmética de uma amostra é definida por X k i1 XiFi k i1 Fi agrupados sem intervalo de classe k i1 XiFi k i1 Fi agrupados com intervalo de classe 33 sendo Xi o ponto médio das classes Podemos representar a Definição 32 em termos populacionais substituindo o tamanho n por N como também representar a expressão em termos de valor observado Porém em termos de notação preferimos usar dessa forma Vejamos mais um exemplo a seguir Exemplo 32 X 0 3 1 7 4 1 20 34 20 1 7 erros Notamos que o resultado para a média amostral é o mesmo obtido no Exemplo 31 porque mesmo agrupando os dados o cálculo da média para esse tipo de dado se baseia nos próprios valores observados Porém para o caso da variáveis quantitativas contínuas isso não ocorre porque usamos o ponto médio para representar as observações de cada classe Vejamos o próximo exemplo a seguir Exemplo 33 Consideremos agora os dados agrupados do Exemplo 21 Tratase de uma variável quantitativa contínua e portanto a média é baseada de acordo com a expressão 33 para o caso de dados agrupados com intervalo de classe que segue X k i1 XiFi k i1 Fi 31 1 41 60 2 84 00 5 1 2 5 66 04ºF 34 Se calculássemos a média sem agrupamento o valor seria X 65 86ºF Observamos uma perda de 33 Capítulo 3 Medidas de Posição precisão com os dados quando agrupados com intervalo de classe Mas isso pode ser justificado por exemplo se nesse experimento a diferença em 0 18ºF não altera os resultados da pesquisa e assim podemos apresentar os dados de forma mais organizada Nos exemplos anteriores observamos que a média leva em consideração a todas as observações em seu cálculo Apesar dessa ideia ser interessante uma vez que conseguimos captar as informações de cada elemento da amostra ou população qualquer alteração que houver em alguma observação pode alterar completamente o resultado da média aritmética É caso dos dados discrepantes isto é observações muito distante da grande parte dos dados Isso pode ocorrer por diversas situações como erro humano ao digitar errado em uma planilha elementos mal amostrados de modo que determinado elemento selecionado para a amostra não pertencia a população de interesse ou até mesmo uma condição atípica na realização da coleta dos dados Vejamos mais algumas caracterís ticas da média aritmética a unidade da média está na mesma escala da variável em estudo a média é uma das medidas mais conhecidas e utilizadas devido as suas propriedades estatís ticas que serão vistas nos capítulos seguintes é única para cada conjunto de dados usada apenas para variáveis quantitativas não pode ser calculada para dados agrupados que apresentam classes extremas abertas é influenciada por dados discrepantes Uma saída para contornar o problema dos dados discrepantes pode ser abordado no exemplo a seguir Exemplo 34 Considere um conjunto de dados n 17 fictícios que apresentam a maior e a menor observação como suspeitos de serem atípicos quanto as suas ocorrências 1 5 5 6 7 7 7 8 8 8 8 8 9 9 10 10 40 Para representar esse conjunto de dados usamos a média aritmética para representálos X 1 5 40 17 9 67 und Observamos que as observações x1 1 unid e x17 40 und podem ter influenciado o resul tado e como suspeitamos desses valores vamos usar uma medida mais robusta a essa violação isto é que não será influenciado por esses valores Chamamos de média aparada denotada por Xap que para uma amostra de tamanho n temos Xap n1 i2 Xi n 2 35 em que Xi é a iésima variável em ordem crescente de magnitude tal que X1 min i Xi e Xn max i Xi Usando a expressão 35 apresentamos a média aparada Xap 5 5 10 15 7 65 unid Observamos pelo resultado que os valores extremos acabam não influenciando no resultado da média aparada e portanto pode ser uma alternativa de medida de posição para representar o conjunto de dados 34 32 Média Complementando as características da média apresentamos algumas propriedades pelo Teo rema 31 a seguir do qual iremos usar a Definição 31 como base e as demais seguem de forma similar Teorema 31 Propriedades da Média aritmética Baseado na Definição 31 e considerando c uma constante então I Se para uma amostra X1 X2 Xn a média aritmética é dada por X n i1 Xi n então para uma transformação de Yi Xi c para i 1 2 n a nova média aritmética é dada por Y X c II Se para uma amostra X1 X2 Xn a média aritmética é dada por X n i1 Xi n então para uma transformação de Yi Xi c para i 1 2 n a nova média aritmética é dada por Y X c Esse resultado vale também para a transformação Yi Xim sendo m também uma constante Basta usar c 1m e o resultado é o mesmo III A soma de quadrado de desvios dos dados em relação a uma constante c é minimizada se c X Prova I Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a média aritmética de Yi é dado por Y n i1 Yi n n i1 Xi c n n i1 Xi n n i1 c n n i1 Xi n n c n X c cqd II Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a amplitude de Yi é dado por Y n i1 Yi n n i1 Xi c n X1 c X2 c Xn c n c X1 X2 Xn n c X cqd III Fazendo D n i1 Xi c2 Expandindo o somatório e derivando D em relação a c temos que 35 Capítulo 3 Medidas de Posição D n i1 Xi c2 n i1 X2 i 2cXi c2 n i1 X2 i n i1 2cXi n i1 c2 e que dD dc 2 n i1 Xi 2nc Igualando a derivada a zero e resolvendo em A temos dD dc 2 n i1 Xi 2nc 0 2nc 2 n i1 Xi c n i1 Xi n X Certificando se o ponto é de máximo ou de mínimo d2D d2c 2n 0 Como a segunda derivada é maior que zero fica provado que o ponto é de mínimo 33 Mediana Uma outra alternativa para contornarmos os problemas de dados discrepantes encontrados na mé dia aritmética pode ser apresentada por meio da medida de posição chamada de mediana do qual leva em consideração a posição ordenada dos dados ao invés de usar or próprios valores observa dos Mas especificamente o valor da mediana é o ponto central dos dados em que abaixo desse valor representa as 50 menores observação ao passo que os valores acima da mediana represen tam as 50 maiores observações De outro modo dizemos que a mediana representa um ponto central no conjunto de dados em que a quantidade de elementos abaixo ou acima desse valor não supera 50 Essa última definição representa melhor o que significa a mediana pois podemos ter valores centrais repetidos e dessa forma isso ocorrendo a primeira afirmação não será válida para a definição da mediana Formalmente definimos Definição 33 Mediana Seja uma amostra X1 X2 Xn de uma população X1 X2 XN de tamanhos n e N respectivamente definimos a mediana por µdX X N 2 X N 2 1 2 se N for um número par X N1 2 se N for um número ímpar População 36 36 33 Mediana sendo µdX a mediana populacional e que Xi é a iésima variável em ordem crescente de magnitude tal que X1 min i Xi e Xn max i Xi De modo similar MdX X n 2 X n 2 1 2 se n for um número par X n1 2 se n for um número ímpar Amostra 37 sendo MdX a mediana amostral e que Xi é a iésima variável em ordem crescente de magnitude tal que X1 min i Xi e Xn max i Xi A mediana amostral é o melhor estimador para a mediana populacional e pode ser considerado também como um estimador para a média populacional µ Detalhes sobre a escolha de um melhor estimador para um determinado parâmetro será estudado no Capítulo 9 Como a mediana leva em consideração a posição das observações a condição do tamanho amostral ou populacional acaba sendo importante para essa medida de modo que se o tamanho for um número par ou ímpar teremos condições diferentes para o cálculo Uma outra informação importante para o cálculo da mediana é que será necessário ordenar as observações de modo crescente Em notação para o caso de uma amostra de tamanho n dizemos que X1 X2 Xn representa uma amostra em ordem crescente de magnitude isto é X1 mini Xi e Xn maxi Xi e precisaremos desse ordenamento para obter o valor da mediana baseados na expressões da Definição 33 Se utilizarmos o Exemplo 34 perceberemos que não é necessário eliminar as observações extremas em ordem de magnitude como foi realizado com a média aparada Isso demonstra que a mediana é uma outra alternativa de medida robusta para a escolha de uma medida de posição de modo a representar um conjunto de dados Vejamos o exemplo a seguir Exemplo 35 Considerando o Exemplo 34 como n 17 é ímpar a mediana amostral desse conjunto de dados fictícios é dado por MdX X 171 2 X9 8 unid Esse valor representa uma medida central do qual os 50 menores valores dos dados estão abaixo de 8 unid e que os 50 maiores valores dos dados estão acima de 8 unid Porém percebemos que os valores x1 1 e x17 40 não influenciaram nesse resultado Isso mostra a robustez da mediana quanto a esse aspecto Para o caso de variáveis quantitativas contínuas sem agrupamento o procedimento é o mesmo realizado no Exemplo 36 Para os dados da Tabela 23 isto é dados agrupados sem intervalo de classe variáveis quantitativas discretas podemos calcular a mediana usando a Definição 33 Preci saremos apenas complementar as informações com o acréscimo da frequência acumulada abaixo de faci que foi apresentada na Tabela 26 Vejamos o próximo exemplo Exemplo 36 Vejamos os dados do número de erros de caracteres em 20 conjuntos descritos na Tabela 26 em que simplificamos os resultados que segue 37 Capítulo 3 Medidas de Posição Número de erros Xi Fi Frequência acumulada Faci 0 3 3 1 7 10 2 4 14 3 5 19 4 1 20 Total 20 O valor da mediana será dado da seguinte forma MdX X 20 2 X 20 2 1 2 X10 X11 2 Para sabermos qual o valor observado para a variável X10 e X11 marcamos os grupos 2 linhas 2 de vermelho e 3 linha 3 de amarelo No grupo 2 temos sete elementos que correspondem as variáveis X4 X5 X10 uma vez que os três menores valores estão no grupo 1 Assim o X10 1 erros No grupo 3 nós temos quatro elementos que correspondem as variáveis X11 X12 X14 uma vez que abaixo desse grupo nós temos as dez primeiras observações As sim o X11 2 erros Usamos as frequências simples Fi e acumulada Faci para obter essas informações Retornando ao cálculo da mediana temos MdX X10 X11 2 1 2 2 1 5 erros Caso os dados estivessem em rol o resultado seria o mesmo No caso de dados agrupados com intervalo de classe variáveis quantitativas contínuas vamos definir um estimador para a mediana populacional usando uma dedução geométrica por meio do histograma de frequências e as ogivas Para isso vamos usar os dados do Exemplo 21 para facilitar a explicação em que apresentamos na Figura 31 o histograma e as ogivas desses dados agrupados Figura 31 Histograma de frequência e ogivas para a dedução do cálculo da mediana 38 33 Mediana Para estimar a mediana a partir dos dados arranjados em uma tabela de distribuição de frequên cia com intervalo de classe é necessário definir a classe mediana e em seguida encontrar a mediana interpolando os resultados A posição da mediana é obtida acumulandose frequências das classes 1 2 etc até se encontrar o valor que seja igual ou imediatamente superior a n2 Apresentamos algumas notações importantes para o entendimento da dedução do estimador de µdX que segue LIMd Limite inferior da classe da mediana LSMd Limite superior da classe da mediana fMd Frequência absoluta da classe da Mediana fant Frequência acumulada abaixo de anterior à classe da Mediana fpost Frequência acumulada acima de posterior à classe da Mediana c Amplitude da classe da Mediana Com essa notação apresentamos a Figura 32 para facilitar a compreensão da dedução Iremos apresentar dois métodos o primeiro baseado no limite inferior da classe da mediana e o segundo baseado no limite superior da classe da mediana Nesse tipo de natureza de dados desprezaremos se o número de elementos é par ou ímpar Entenderemos que a classe da mediana é aquela que contempla o valor observado para a variável Xn2 Para isso podemos observar esse valor na coluna da frequência acumulada abaixo de faci Nos dados do Exemplo 21 a classe da mediana é 57 5 68 1 porque fac4 19 isto é abaixo de 68 1 ºF temos as primeiras 19 observações e nessa classe contemplamos as observações ordenadas x8 x9 x19 que contém xn2 x362 x19 Temos essas observações na classe 4 classe da mediana porque a frequência acumulada abaixo de anterior a classe da mediana fac3 7 Isso significa que a partir do oitavo elemento ordenado até o décimo nono temos elementos pertencentes a classe da mediana Feito essas considerações apresentamos o primeiro método de dedução da expressão da medi ana a seguir Figura 32 Histograma de frequência e ogivas para a dedução do cálculo da mediana com as nota ções 1 Método 39 Uma vez que sabemos a classe da mediana pela Figura 33 podemos determinar o valor da mediana por MdX LiMd x sendo necessário encontrar o valor x Assim faremos uma regra de três simples pela semelhança de triângulos triângulo verde e vermelho que pode ser observado pela Figura 34 Assim temos Variação Frequência c fMd x n2 fant Determinando x x n2 fantfMd c Como MdX LiMd x então MdX LiMd n2 fantfMd x c Figura 34 Semelhança de triângulos para a dedução do cálculo da mediana com as notações Assim faremos uma regra de três simples usando a semelhança de triângulos triângulo verde e amarelo Assim Variação Frequência c fMd y n2 fpost Determinando y y n2 fpostfMd c e a mediana amostral pode ser expressa como MdX LSMd n2 fpostfMd x c Formalizando essas ideias definimos um estimador da mediana amostral para dados agrupados com intervalo de classe da seguinte forma Definição 34 Mediana em dados agrupados com intervalo de classe Seja uma amostra X1 X2 Xn em ordem crescente de magnitude de tamanho n agrupados em k classes com pontos médios Xi e Fi frequências para i 1 2 k e Σki1Fi n então a mediana amostral é definida por MdX LI1Md n2 fantfMd x c em que LI1Md é o limite inferior da classe da mediana fant é a frequência acumulada abaixo de anterior à classe da mediana fMd frequência absoluta da classe da mediana c a amplitude da classe da mediana ou de forma similar MdX LSMd n2 fpostfMd x c em que LS Md é o limite superior da classe da mediana e f post é a frequência acumulada acima de posterior a classe da mediana Vamos apresentar o resultado da mediana para os dados do Exemplo 21 a seguir Prova I Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a mediana de Yi é dada por MdY Y n12 c MdX c cqd Definição 35 Moda para natureza de dados discretizados Seja uma amostra X1 X2 Xn de uma população X1 X2 XN de tamanhos n e N respectivamente cuja natureza da variável é discretizada Então a moda representa o valor que mais se repete em um conjunto de dados Denotamos μ0 a moda populacional e M0X a moda amostral figura 35 Histograma de frequência para a dedução do cálculo da moda Observando a tabela de frequência dos dados de temperatura do anel de vedação do foguete Challenger no Exemplo 21 percebemos que há duas classes de maior frequência porém classes vizinhas 34 Moda então MoY cMoX Por fim apresentamos o Exemplo 310 de Magalhães e Lima 2015 para termos uma noção sobre essas três medidas de posição a seguir Exemplo 310 Retirado de Magalhães e Lima 2015 Um estudante está procurando um estágio para o próximo ano As companhias A e B têm pro gramas de estágios e oferecem uma remuneração por 20 horas semanais com as seguintes carac terísticas em salários mínimos Companhia A B Média 25 20 Mediana 17 19 Moda 15 19 Qual a companhia mais adequada Inicialmente vamos discutir as informações fornecidas supondo que o estudante terá seu salá rio escolhido de acordo com uma política salarial cuja tabela acima é um resumo A companhia A tem 50 dos seus estagiários recebendo até 17 salários mínimos e o valor com mais chance de ocorrência é 15 Como a média é 25 devem haver alguns poucos estagiários com salário bem mais alto A companhia B tem as três medidas bem próximas indicando uma razoável simetria entre salários altos e baixos A opção do estudante dependerá de sua qualificação Se ele for bem qualificado deve preferir a companhia A pois terá maior chance de obter um dos altos salários se tiver qualificação próxima ou abaixo dos outros estudantes deve preferir B que parece ter uma política mais homogênea de salários 47 Capítulo 3 Medidas de Posição Exercícios propostos Exercício 31 A tabela abaixo apresenta a distribuição de frequências das notas em pontos obtidas num teste de matemática realizado por 50 estudantes Notas Fi 0 2 4 2 4 12 4 6 15 6 8 13 8 10 6 Apresente o cálculo para todas as medidas de posição estudadas e as interprete Solução na página 213 Exercício 32 Observando as expressões n i1Xi X2 e n i1Xi µ2 em que X n i1 Xin e µ N i1 XiN representam a média amostral e a média populacional respecti vamente qual das duas somas de quadrados representa o menor valor para soma Solução na página 213 Exercício 33 Considere uma amostra X1 X2 Xn de tamanho n do qual conseguimos computar as medidas de posição X MdX e MoX isto é a média mediana e moda res pectivamente bem como a variância S2 X Considere também as transformações Yi Xi X e Zi Xi XS para i 1 2 n sendo S S2 Apresente as medidas de posição para essas transformações Y e Z Solução na página 213 Exercício 34 Uma empresa de telecomunicações concedeu 10 de aumento de salário a todos os seus funcionários A média salarial foi de 1500 reais antes do reajuste Qual será a nova média salarial após o reajuste Solução na página 214 Exercício 35 Uma prova de estatística foi aplicada com pontuação de 0 a 10 pontos sendo que a média das notas de todos os alunos de uma turma foi de 58 pontos Se a média das mulheres é 63 pontos e a dos rapazes é 43 pontos então qual a porcentagem de mulheres na turma Solução na página 214 Exercício 36 Uma prova de estatística foi aplicada com pontuação de 0 a 10 pontos numa turma com 30 alunos sendo uma média de 70 pontos Nenhum dos alunos obteve nota infe rior a 60 pontos Dessa forma qual o número máximo de alunos que podem ter obtido nota igual a 90 pontos Solução na página 215 48 Capítulo 4 Medidas de dispersão 41 Introdução Iniciamos esse capítulo motivados por três conjuntos de dados que resultaram em mesma média aritmética propositalmente Vejamos o Código R 41 a seguir Esse código apresenta uma simula ção de três grupos com 10 observações cada um Os grupos formados foram gA gB e gC com suas respectivas médias XgA 9 018686 unid XgB 9 018686 unid e XgC 9 018686 unid respectiva mente Dessa forma poderíamos concluir que os grupos de dados são iguais A resposta é não Isso significa que essa medida de posição apenas não consegue caracterizar completamente os grupos de dados Código R 41 Script 1 Semente de simulação 2 setseed10 3 4 Dados dos grupos gerados 5 setseed10 gA rnorm10 mean 10 sd 2 6 setseed10 gB rnorm9 mean 10 sd 4 7 setseed10 gC rnorm9 mean 10 sd 6 8 9 Media do grupo gA 10 mediagA meangA 11 12 gerando gB10 e media de gB 13 gB10 gB10 lengthgA mediagA sumgB 14 mediagB meangB 15 16 17 gerando gC10 e media de gC 18 gC10 gc10 lengthgA mediagA sumgC 19 mediagC meangC 20 21 Apresentando os dados 22 gA gB gC Os dados para os três grupos são apresentados na Tabela 41 Ao observarmos com mais detalhes os valores observados nos grupos percebemos que estes não são iguais Logo poderíamos errone amente afirmar que estes grupos eram semelhantes simplemente olhando para as suas médias O que ocorre é uma variabilidade nos dados diferenciada em cada grupo e que a medida de dispersão não consegue caracterizála Dizemos que variabilidade é a dispersão com que ocorre nos dados e as medidas responsáveis em expressar essa variabilidade chamamos na estatística descritiva de medidas de dispersão Geralmente usamos a representação dessa dispersão em torno de um va lor central nos dados que em nosso caso será a média aritmética devido a algumas propriedades matemáticas e estatísticas que essa medida tem e que será vista ao longo de todo o livro A seguir mostraremos algumas medidas de dispersão que auxiliarão na caracterização dos da 49 Capítulo 4 Medidas de dispersão Tabela 41 Dados dos três grupos simulados pelo Código R 41 gA gB gC 10 037492 10 074985 10 1124770 9 631495 9 262990 8 8944847 7 257339 4 514678 1 7720167 8 801665 7 603329 6 4049937 10 589090 11 178181 11 7672708 10 779589 11 559177 12 3387658 7 583848 5 167695 2 7515429 9 272648 8 545296 7 8179439 6 746655 3 493309 0 2399639 9 487043 18 787223 28 0874035 XgA 9 018686 XgB 9 018686 XgC 9 018686 dos bem como no auxílio a fundamentação de temas tão importantes como a inferência estatística e teoria de decisão abordado em capítulos posteriores 42 Amplitude total ou Amplitude A primeira medida de dispersão que definiremos é a amplitude ou amplitude total denotada por A ou At Iremos apresentar três definições sobre a amplitude baseadas nos valores observados da população da amostra e em dados agrupados sem e com intervalo de classe Vejamos o primeiro caso pensando em uma população apresentada na Definição 41 Definição 41 Amplitude em uma população Seja uma população X1 X2 XN de tamanhoN e em ordem crescente de magnitude temos X1 min i Xi X2 XN max i Xi para i 1 2 N Então a amplitude de uma população denotada por Ap é definida por Ap XN X1 41 Se desejarmos representar essa notação em termos de valor observado temos at xN x1 Já usamos uma referência sobre a amplitude total ou amplitude expressão 211 quando agrupamos os dados em intervalo de classes para o caso das variáveis quantitativas contínuas Vejamos o Exemplo 41 sobre os dados da taxa de desmatamento na Amazônia legal compreendido entre 1988 a 07122020 Exemplo 41 Desmatamento da Amazônia Legal Já mencionamos anteriormente na Tabela 12 os dados de desmatamento da Amazônia legal Se considerarmos que os elementos da população sejam os estados portanto temos as informações de todos os elementos e assim estamos diante de dados populacionais Vamos assim calcular a amplitude para a variável desmatamento acumulado em km2 de acordo com a expressão 211 isto é A 157667 00 1696 00 155971 km2 Isso representa uma variação de 155971 km2 Observe que essa medida está na mesma escala da variável e que se houve um outro conjunto de dados em mesma unidade poderíamos comparar qual a que apresentou maior dispersão 50 Podemos representar a amplitude em termos amostrais como será apresentado na Definição 42 a seguir Capítulo 4 Medidas de dispersão dos em 20 conjunto de caracteres usando a expressão 43 da seguinte forma A 4 1 3 erros Para os dados agrupados com intervalo de classe apresentados no Exemplo 21 podemos calcular a amplitude da temperatura do anel de vedação de cada teste de acionamento do motor do foguete Challenger da seguinte forma A 84 31 52 ºF No primeiro caso usamos as próprias observações para o cálculo da amplitude No segundo caso usamos os pontos médios Podemos ainda apresentar algumas características sobre a amplitude dos quais temos o resultado da amplitude é dado na mesma unidade da variável em estudo uma medida de dispersão facilmente calculada limitada apenas as variáveis quantitativas essa medida é muito utilizada em comparações múltiplas cartas de controle em estatística de qualidade dentre outras áreas a amplitude pode ser utilizada como medida de dispersão para comparar a variabilidade de dados de dois ou mais grupos diferentes a amplitude é sensível a dados discrepantes1 a amplitude é limitada por levar em consideração apenas os valores extremos e nada sobre as demais observações Nesse caso podem ocorrer situações como os apresentados no Exemplo 42 em que poderíamos erroneamente concluir que os grupos de dados gB e gC são iguais uma vez que apresentam amplitude e média aritmética iguais segundo Ferreira 2009 p 36 a amplitude amostral expressão 42 substima a amplitude populacional expressão 41 uma vez que é pouco provável que uma amostra contenha os valores mínimo e máximo da população portanto a amplitude amostral é um estimador2 viesado3 e ineficiente Complementando as características da amplitude apresentamos algumas propriedades pelo Te orema 41 a seguir do qual iremos usar a Definição 42 como base e as demais seguem de forma similar 1Entendemos por dados discrepantes as observações que estão distantes da massa de dados maior parte dos dados Esses dados quando influenciam as análises estatísticas dizemos que estes dados são influentes 2Entendemos por estimador uma função que depende apenas dos dados amostrais e que irá representar um parâmetro característica populacional desconhecida 3Dizemos que um estimador é viesado se a esperança matemática desse estimador é diferente do parâmetro de inte resse 52 43 Variância Teorema 41 Propriedades da Amplitude Baseado na Definição 42 e considerando c uma constante então I Se para uma amostra X1 X2 Xn a amplitude é dada por AX Xn X1 então para uma transformação de Yi Xi c para i 1 2 n a nova amplitude não se altera isto é AY AX II Se para uma amostra X1 X2 Xn a amplitude é dada por AX Xn X1 então para uma transformação de Yi Xi c para i 1 2 n a nova amplitude é dada por AY AX c Esse resultado vale também para a transformação Yi Xim sendo m também uma constante Basta usar c 1m e o resultado é o mesmo Prova I Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a amplitude de Yi é dado por AY Yn Y1 Xn c X1 c Xn X1 AX cqd II Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a amplitude de Yi é dado por AY Yn Y1 Xn c X1 c Xn X1 c AX c cqd Devido ao problema encontrado no Exemplo 42 vamos apresentar algumas outras medidas que levem em consideração as demais variáveis bem como uma referência da posição central dos dados que em nosso caso será a média aritmética 43 Variância Diante do Exemplo 42 percebemos que complementar a caracterização dos dados com a amplitude se torna uma medida muito simples Observamos que os grupos gB e gC apresentam mesmas médias e amplitudes Assim poderíamos dizer que os grupos são semelhantes Mas quando observamos a Tabela 41 percebemos que estes são diferentes Assim vamos apresentar mais algumas medidas que englobem as demais variáveis e o valor central desses dados em seu cálculo para apresentarmos medidas mais explicativas para dispersão de dados Considerando uma população X1 X2 XN e sua respectiva amostra X1 X2 Xn podemos considerar inicialmente o desvio médio como outra medida de dispersão dada por DMp N i1 Xi µ Populacional 44 53 Capítulo 4 Medidas de dispersão em que µ N i1 XiN e seu respectivo estimador é dado por DM n i1 Xi X Amostral 45 em que X n i1 Xin Observamos agora que diferentemente da amplitude essa medida leva em consideração todos os elementos seja da amostra ou da população em relação a uma medida central como preconizamos inicialmente a definição de uma medida de dispersão no início desse capítulo O problema é que a expressão 45 como mostrado no Teorema 11 propriedade V sempre resulta em valor nulo para qualquer grupo amostral De modo similar a expressão 44 também N i1 Xi µ 0 Isso significa que essa medida não traz ganho algum a descrição dos dados porque os desvios positivos anulamse com os desvios negativos no somatório sendo pois uma questão de problema algébrico Para isso podemos contornar essa situação inserindo uma função modular nessa medida anterior e criar o módulo do desvio dada por Sµ N i1 Xi µ Populacional 46 e S X n i1 Xi X Amostral 47 Desse modo sabemos que n i1 Xi X 0 e agora temos uma medida que represente a dispersão com o qual os dados estão em torno da média Quanto maior o módulo do desvio mais disperso é o conjunto de dados A questão do uso do módulo para resolver o problema da medida do desvio médio nos gera uma outra dificuldade que poderemos ter mais a frente quando formos estudar infe rência estatística Tem situações que iremos precisar integrar derivar etc dentre outras ferramentas matemáticas que se torna mais fácil ao invés de usar o módulo usarmos uma função quadrática na medida Daí surge uma outra medida de variabilidade que é a soma de quadrados dada por SQp N i1 Xi µ2 Populacional 48 e SQ n i1 Xi X2 Amostral 49 Percebemos que a soma de quadrados amostral pode ser também expressa por SQ n i1 X2 i 1 n n i1 X2 i 410 como pode ser provado no Teorema 11 Nesse último caso podemos trabalhar sem o uso da in formação da média mas sim apenas com as informações das observações Essa medida apresenta uma outra informação interessante que é penalizar as observações quanto mais estiver distante do valor central Observe que quando elevamos ao quadrado um alto desvio esse valor se torna maior ainda mas quando elevamos ao quadrado um desvio pequeno esse valor não cresce tanto Assim conseguimos compreender quais os dados que estão mais dispersos em torno da média Baseado nessas informações surge a variância populacional que é a média da soma de quadra dos denotada por σ2 definida a seguir 54 43 Variância Definição 44 Variância de uma população Seja uma população X1 X2 XN de tamanho N com parâmetro conhecido µ N i1 XiN então a variância populacional denotada por σ2 é definida por σ2 SQp N 411 em que SQp é dado pela expressão 48 ou de forma similar σ2 N i1 X2 i 1 N N i1 X2 i N 412 Podemos de forma intuitiva pensar no estimador para σ2 simplesmente substituindo N por n e SQp por SQ usando as mesmas expressões do que foram usados na Definição 44 isto é ˆσ2 SQ n 413 Porém existe uma propriedade nos estimadores vista mais a frente que é o seu viés Dizemos que estimadores são viesados quando a sua esperança matemática não é igual ao parâmetro de interesse Significa dizer em termos práticas que mesmo se nós retirássemos todas as k amostras possíveis de uma população e para cada uma dessas amostras calculássemos a variância amostral expressão 413 e posteriormente a média dessas variâncias ou seja ˆσ2 1 ˆσ2 2 ˆσ2 k k esse valor não seria igual a σ2 Logo ˆσ2 é um estimador viesado De outro modo é um estimador defeituoso Para contornar esse problema usamos a seguinte definição para uma variância amostral não viesada denotada por S2 e apresentada na Definição 45 Definição 45 Variância de uma amostra Seja uma população X1 X2 Xn de tamanho n com X n i1 Xin então a variância amostral denotada por S2 é definida como S2 SQ n 1 414 em que SQ é dado pela expressão 49 ou de forma similar S2 n i1 X2 i 1 n n i1 X2 i n 1 415 Para elucidar essas informações vejamos o Exemplo 45 Exemplo 44 Retornando aos dados amostrais simulados na Tabela 41 podemos calcular a variância amostral para cada um dos grupos Vamos usar a expressão 415 para isso que segue Variância amostral para o grupo gA S2 gA 10 0374922 9 4870432 19 10 037492 9 4870432 9 1 831 0017 8133679 8 1 959404 und2 55 Capítulo 4 Medidas de dispersão Variância amostral para o grupo gB S2 gB 10 0749852 18 7872232 19 10 074985 18 7872232 9 1 988 9577 8133679 8 19 51007 und2 Variância amostral para o grupo gC S2 gC 10 11247702 28 08740352 19 10 1124770 28 08740352 9 1 1373 903 8133679 8 62 28176 und2 Podemos perceber que de fato os grupos gB e gC não são iguais como podem verificar pelas suas variâncias amostrais uma vez que isso poderia ter ocorrido pelo resultado do Exemplo 42 A dispersão das informações se torna mais detalhado porque agora a medida leva em consideração a todas as observações Para o caso de dados agrupados apresentamos a seguir a notação para o cálculo da variância pela Definição 46 Definição 46 Variância em dados agrupados Seja uma amostra X1 X2 Xn de tamanho n agrupados em k grupos com variáveis Xi e frequência Fi ou k classes com pontos médios Xi e Fi frequências para i 1 2 k e k i1 Fi n então a variância de uma amostra denotada por S2 é definida por S2 k i1Xi X2Fi k i1 Fi1 agrupados sem intervalo de classe k i1 Xi X2Fi k i1 Fi1 agrupados com intervalo de classe 416 sendo Xi o ponto médio das classes X k i1 XiFi k i1 Fi e X k i1 XiFi k i1 Fi ou se forma similar S2 k i1 X2 i Fi 1 k i1 Fi k i1 XiFi2 k i1 Fi1 agrupados sem intervalo de classe k i1 X2 i Fi 1 k i1 Fi k i1 XiFi2 k i1 Fi1 agrupados com intervalo de classe 417 Podemos representar a Definição 46 em termos populacionais substituindo o tamanho n por N e considerando o denominador apenas como k i1 Fi 1 ao invés de k i1 Fi 1 tal que k i1 Fi N Podemos também representar a expressão em termos de valor observado como mencionado na definições anteriores Vejamos algumas características da variância a unidade da variância está na escala ao quadrado da unidade da variável limitada apenas as variáveis quantitativas 56 43 Variância a variância é sempre uma medida positiva exceto quando todos os valores são iguais que resultam em uma variância nula quanto mais próximo de zero a variância for mas concentrado os dados estão em torno da média ao passo que à medida que a variância se distancia de zero mas disperso os dados estão em torno da média devido as suas propriedades matemáticas algumas mencionadas anteriormente bem como a quantidade de técnicas estatísticas que empregam essa medida a torna como a mais conhecida dentre as medidas de dispersão uma vez que a média é sensível aos dados a variância também é sensível uma vez que esta depende da média Pelo Teorema 42 apresentamos algumas propriedades da variância a seguir do qual iremos usar a Definição 45 como base e as demais seguem de forma similar Teorema 42 Propriedades da Variância Baseado na Definição 45 e considerando c uma constante então I Se para uma amostra X1 X2 Xn a variância é dada por S2 X expressão 414 então para uma transformação de Yi Xi c para i 1 2 n então a nova variância não se altera isto é S2 Y S2 X II Se para uma amostra X1 X2 Xn a variância é dada por S2 X expressão 414 então para uma transformação de Yi Xi c para i 1 2 n então a nova variância é dada por S2 Y c2 S2 X Esse resultado vale também para a transformação Yi Xim sendo m também uma constante Basta usar c 1m e o resultado é o mesmo Prova I Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a variância de Yi é dado por S2 Y n i1Yi Y2 n 1 n i1Xi c X c2 n 1 n i1Xi X2 n 1 S2 X cqd II Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a variância de Yi é dado por S2 Y n i1Yi Y2 n 1 n i1Xi c X c2 n 1 n i1 c2Xi X2 n 1 c2 n i1Xi X2 n 1 Teorema 11 I c2 S2 X cqd 57 Capítulo 4 Medidas de dispersão 44 Desvio padrão A variância apesar de ter resolvido alguns dos problemas mencionados anteriormente para uma medida de dispersão apresenta sua unidade ao quadrado da unidade da variável em estudo isso significa que se tivermos usando uma variável na escala de metros a dispersão dada pela variância estará na escala de área isto é em metros ao quadrado Isso se torna difícil a percepção de dispersão quando observamos os dados Dessa forma surge a medida do desvio padrão definida a seguir Definição 47 Desvio padrão Seja uma amostra X1 X2 Xn de uma população X1 X2 XN de tamanhos n e N respectivamente com parâmetro µ N i1 XiN e seu estimador X n i1 Xin então o desvio padrão é definido por σ σ2 População 418 em que σ é apresentado na Definição 44 S S2 Amostra 419 em que S é apresentado na Definição 45 Com o desvio padrão podemos verificar a medida de variabilidade na mesma unidade da variá vel Cabe destacar que a expressão 418 mede a variabilidade das observações em torno da média populacional Porém na prática não conhecemos o parâmetro µ nem muito menos temos informa ções de todas as observações Com isso usamos como estimador de σ o desvio padrão amostral dado na expressão 419 que se baseia em apenas uma amostra Vejamos o exemplo a seguir Exemplo 45 Retornando ao Exemplo 42 podemos então calcular os desvios padrões dos grupos que segue Desvio padrão amostral para o grupo gA SgA 1 959404 1 399787 unid Desvio padrão amostral para o grupo gB SgB 19 51007 4 41702 und Desvio padrão amostral para o grupo gC SgC 62 28176 7 89188 und Considerando que as unidades dos grupos são iguais bem como as suas médias podemos con cluir que o grupo gA apresenta menor dispersão Claro que esse resultado poderia ter sido ob servado pela variância A diferença é que conseguimos entender na unidade da variável essa dispersão Contudo quando iremos comparar grupos de dados e verificar qual grupo apresenta maior va riabilidade devemos ter muito cuidado ao usar o desvio padrão ou a variância sob dois aspectos 1 Os grupos de observações devem estar na mesma unidade de mensuração 2 A média desses grupos devem ser iguais 58 44 Desvio padrão O primeiro aspecto está muito claro uma vez que não temos por exemplo como comparar uma unidade em gramas e saber se a dispersão desses dados é maior ou menor quando se compara com outro conjunto de dados cuja unidade esteja na escala de comprimento O segundo aspecto está limitado devido a forma de como foram calculados o desvio padrão e a variância A soma de seus desvios levam em consideração a média Assim quando comparamos dois desvios padrões de duas amostras de uma população em que temos o desvio padrão S2 1 10 unid para a amostra 1 e S2 2 20 unid para a amostra 2 Não podemos afirmar que a amostra 2 apresenta maior dispersão que a amostra 1 isso porque não sabemos o quanto esse valor representa em relação a média Supomos que a média da amostra 1 seja X1 100 unid e para a amostra 2 seja X1 50 unid Desse modo observemos que para a amostra 1 o desvio padrão representa apenas 10 do valor da média Já na amostra 2 o desvio padrão representa 40 da média uma variação muito mais considerável isto é os dados na amostra 2 são muito mais dispersos em torno da média Isso justifica então a criação de uma medida de dispersão relativa à média que será definida na próxima seção Vejamos algumas características do desvio padrão que segue a unidade do desvio padrão está na mesma escala da unidade da variável em estudo limitada apenas as variáveis quantitativas uma vez que a média é sensível aos dados o desvio padrão também é sensível uma vez que esta depende da média embora a variância amostral S2 seja um estimador não viesado para a variância populacional σ2 o desvio padrão amostral S que é derivado de S2 é um estimador viesado do desvio padrão populacional σ assim como a variância o desvio padrão é sempre uma medida positiva exceto quando todos os valores são iguais que resultam em uma variância nula assim como na variância quanto mais próximo de zero o desvio padrão for mas concentrado os dados estão em torno da média ao passo que à medida que o desvio padrão se distancia de zero mas disperso os dados estão em torno da média Complementando as características do desvio padrão apresentamos algumas propriedades no Teorema 41 do qual iremos usar a Definição 42 como base e as demais seguem de forma similar Teorema 43 Propriedades do Desvio Padrão Baseado na Definição 42 e considerando c uma constante então I Se para uma amostra X1 X2 Xn a amplitude é dada por AX Xn X1 então para uma transformação de Yi Xi c para i 1 2 n então o novo desvio padrão não se altera isto é SY SX II Se para uma amostra X1 X2 Xn a amplitude é dada por AX Xn X1 então para uma transformação de Yi Xi c para i 1 2 n então a nova amplitude é dada por AY AX c Esse resultado vale também para a transformação Yi Xim sendo m também uma constante Basta usar c 1m e o resultado é o mesmo Prova I Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 59 1 2 3 n então o desvio padrão de Yi é dado por SY i1n Yi Ŷ2 n 1 i1n Xi c2 n 1 i1n Xi X2 n 1 SX cqd II Considerando uma amostra X1 X2 Xn e c uma constante e que Yi Xi c para i 1 2 n então a variância de Yi é dado por SY i1n Yi Ŷ2 n 1 i1n Xi c X c2 n 1 i1n c²Xi X2 n 1 c² i1n Xi X² n 1 c S²Y c SX cqd 45 Coeficiente de Variação As medidas de variabilidade tais como a variância e desvio padrão são conhecidas como medidas de dispersão absoluta Diante do que foi exposto no fim da seção anterior sobre alguns problemas do desvio padrão apresentamos mais uma medida de dispersão Definição 48 agora uma medida relativa chamada de Coeficiente de Variação CV do qual pode ser usada para comparar a variabilidade entre quaisquer grupo de dados Essa medida permite que possamos comparar a dispersão com dois ou mais grupos com características completamente diferentes e com médias diferentes Vejamos o Exemplo 46 para ilustrar essa característica Essa medida permite que possamos comparar a dispersão com dois ou mais grupos com características completamente diferentes e com médias diferentes Vejamos o seguinte exemplo a seguir Exemplo 46 Com a medida do coeficiente de variação podemos comparar a dispersão dos dados do Exemplo 21 com a dispersão do grupo gA da Tabela 41 Para o primeiro conjunto de dados podemos calcular a média e o desvio padrão do número de erros encontrados em 20 conjuntos de caracteres dados por Xe 3 1 1 20 1 7 erros e Se 32 12 12 120 3 1 1² 19 1 174286 erros respectivamente No caso dos dados do grupo gA nós já temos os resultados da média e desvio padrão dados na Tabela 41 no Exemplo 45 respectivamente Desse modo comparando a dispersão dos dois grupos pelo coeficiente de variação temos Dados Coeficiente de Variação CV gA CVgA 1398757 9101686 100 1552 Número de erros CVe 1174286 17 100 6908 Nesse caso percebemos que os dados de gA têm menor variabilidade do que os dados do número de erros e com isso esses dados são melhor representados pela sua média amostral quando se comparado com o outro grupo de dados Capítulo 4 Medidas de dispersão As propriedades do CV levam em consideração as propriedade de X e S que já foram demons tradas Assim ficam para estudo no Exercício proposto 41 a demonstração para as propriedades do CV 46 Erro padrão da média Para iniciarmos uma última ideia sobre medidas de dispersão dentre as medidas básicas vamos iniciar como motivação a Definição 49 Definição 49 Erro da média amostral Seja uma amostra X1 X2 Xn de uma população com parâmetro µ que representa a média populacional e seu estimador X n i1 Xin então definimos o erro da média amostral denotado por EA X da seguinte forma EA X X µ 422 A medida expressa em 422 representa o erro de assumirmos a média amostral como um re presentante da média populacional O desvio padrão de EA X é o que chamamos de erro padrão da média definido a seguir Definição 410 Erro padrão da média Populacional Seja uma amostra X1 X2 Xn de uma população cujos parâmetros µ e σ representam a média e o desvio padrão populacional respectivamente então o erro padrão da média denotada por σ X é definido como σ X σ n 423 em que n representa o tamanho da amostra Quando fazemos um comparativo entre o desvio padrão amostral e o erro padrão da média entendemos que a primeira medida reflete a variabilidade de cada observação em torno da média amostral Já o erro padrão da média representa a variabilidade de cada média amostral de todas amostra possíveis em relação a média populacional Dessa forma surgem alguns problemas para determinar a variabilidade da média amostral em torno da média populacional usando a expressão 424 Primeiro é praticamente impossível reali zar todas as amostras possíveis de uma população para computar a sua média Se isso é possível não precisaremos de amostra uma vez que temos todas as informações da população e então es tamos diante de um censo Os outros fatores podemos destacar que na prática realizamos apenas uma amostra para análise das informação e que o desvio padrão populacional geralemente é des conhecido e assim tornase inviável o cálculo de σ X Uma alternativa é usar o estimador S ao invés de σ surgindo então um estimador para o erro padrão da média populacional definido a seguir Definição 411 Erro padrão da média Amostral Seja uma amostra X1 X2 Xn de uma população cujos parâmetros µ e σ representam a média e o desvio padrão populacional respectivamente então o erro padrão da média denotada por σ X é definido como S X S n 424 em que n representa o tamanho da amostra e S é o desvio padrão da Definição 525 62 46 Erro padrão da média É fácil observar que à medida que n N isto é à medida que n aumenta a média amostral tende a µ logo o EA X 0 Isso significa que a média amostral é mais precisa porque se apro xima cada vez mais da média populacional Assim com apenas uma amostra poderemos ter uma estimativa do erro padrão da média em que veremos um exemplo a seguir Exemplo 47 Retornando ao Exemplo 42 podemos então calcular os erros padrões da média para as três amos tras que segue Erro padrão da média amostral para o grupo gA S XgA 1 399787 9 0 4665957 unid Erro padrão da média amostral para o grupo gB S XgB 4 41702 9 1 47234 und Erro padrão da média amostral para o grupo gC S XgC 7 89188 9 2 630627 und Percebemos que a média de gA estima melhor o parâmetro µ uma vez que o erro padrão da média foi o menor dentre os demais Desse modo observamos que o erro padrão da média representa uma precisão com que a média amostral estimou o parâmetro µ Além do erro padrão da média há diversos outros erros padrões para outros estimadores de parâmetros diversos sendo abordado mais a frente Além do mais essa medida será largamente usada na teoria de estimação e de decisão tanto para a construção de intervalos de confiança como também no desenvolvimento de testes de hipóteses sendo também abordado nos próximos capítulos 63 Capítulo 4 Medidas de dispersão Exercícios propostos Exercício 41 Com relação as propriedades do Coeficiente de Variação CV prove que I Se para uma amostra X1 X2 Xn o coeficiente de variação Definição 48 então para uma transformação de Yi Xi c para i 1 2 n e c uma constante então o novo coeficiente de variação é igual a CVY SX X c 100 em que X e SX são a média e o desvio padrão de Xi i 1 2 n II Se para uma amostra X1 X2 Xn o coeficiente de variação Definição 48 então para uma transformação de Yi Xi c para i 1 2 n e c uma constante então o novo coeficiente de variação não se altera isto é CVY CVX Esse resultado vale também para a transformação Yi Xim sendo m também uma constante Basta usar c 1m e o resultado é o mesmo Solução na página 216 Exercício 42 A tabela abaixo apresenta a distribuição de frequências das notas em pontos obtidas num teste de matemática realizado por 50 estudantes Notas Fi 0 2 4 2 4 12 4 6 15 6 8 13 8 10 6 Apresente o cálculo para todas as medidas de dispersão estudadas e as interprete Solução na página 216 Exercício 43 Para uma amostra X1 X2 Xn de tamanho n Desejamos usar a transfor mação Yi β0 β1Xi para i 1 2 n considerando β0 e β1 constantes Então apresente as relação entre as médias e os desvios padrões de X e Y Solução na página 216 Exercício 44 Sabemos que a conversão da temperatura de graus Celsius ºC para a escala de Fahrenheit ºF é dada por F 95 C 32 considerando a variável F a temperatura em Fahrenheit e C a temperatura em graus Celsius Se medíssemos a temperatura de um peça no momento de fabricação e verificássemos que em média a peça é fabricada com tempe ratura de 70ºC e variância de 2oC2 como poderíamos representar essas medidas na escala Fahrenheit Solução na página 216 Exercício 45 Se tivéssemos estudando a variável temperatura em três escalas graus Cel sius Fahrenheit e Kelvin poderíamos calcular o coeficiente de variação para as três escalas Explique Solução na página 216 64 46 Erro padrão da média Exercício 46 Considere uma amostra X1 X2 Xn de tamanho n do qual conseguimos computar a média aritmética e variância amostral sendo representadas por Xn e S2 n respec tivamente e que esses índices representam que estas medidas foram calculadas baseadas em um tamanho de amostra n Por alguma situação precisamos adicionar mais uma variável a esta amostra isto é a variável Xn1 Como poderíamos calcular as medidas Xn1 e S2 n1 partindo do pressuposto que só sabemos das informações Xn S2 n e Xn1 Em um segundo momento considere o Exemplo 21 os dados sem agrupamento de classes de modo que foi realizado uma nova medição da temperatura do anel de vedação no acionamento do foguete Challenger sendo aferido o valor x37 63ºF use os resultados obtidos e determine xn1 e s2 n1 após desse novo dado as observações Solução na página 216 Exercício 47 Considere uma amostra X1 X2 Xn de tamanho n do qual conseguimos computar as medidas de posição X MdX e MoX isto é a média mediana e moda res pectivamente bem como a variância S2 X Considere também as transformações Yi Xi X e Zi Xi XS para i 1 2 n sendo S S2 Apresente as medidas de dispersão desvio padrão e variância para essas transformações Y e Z Solução na página 216 65 Capítulo 5 Probabilidades Após finalizarmos as principais ideias sobre a Estatística Descritiva Capítulos 1 a 4 iniciamos por meio da probabilidade os passos iniciais para a tomada de decisão por meio dos dados Para isso usaremos a Estatística Inferencial Teoria da Estimação e Teoria da decisão assuntos vistos nos Capítulos 9 e 10 Contudo é imprescindível uma fundamentação teórica sobre a probabilidade que é a base para a tomada de decisão A probabilidade vem aparecer como ramo da matemática no século XV embora tenha surgido antes desse período Entretanto somente no século XVI é que a teoria da probabilidade passa a ser estudada com profundidade quando Jerónimo Cardano 15011576 passa a estudar problemas com os jogos de azar cartas dados etc Os jogadores de cassinos tentavam encontrar meios de obter chances maiores de por exemplo ganhar um jogo acertar um número ou uma carta Daí surge a probabilidade para resolver esses problemas por meio dos matemáticos Já a estatística inicialmente tentava identificar determinados problemas do Estado como o nú mero de nascidos e de mortos determinação do número de pessoas do sexo masculino e feminino etc Entretanto apenas no início do século XX é que a probabilidade e a estatística passam a ser interligadas isto é a estatística agora necessita de técnicas probabilísticas para o estudo de dados Hoje a estatística tem como um dos objetivos entender características atribuíveis a população de estudo Por meio de um subconjunto amostra da população a estatística tenta se aproximar dessas características parâmetros por meio da inferência através dos estimadores características atribuíveis a amostra Entretanto se basear numa amostra para entender a população gera uma incerteza E essa incerteza é medida por meio da teoria da probabilidade pela qual toda a estatística é desenvolvida Inicialmente faremos uma revisão sobre Teoria de conjuntos já usando termos específicos dentro da probabilidade como por exemplo a definição de um Experimento aleatório dentre outras Isso porque se faz necessário o entendimento sobre o agrupamento de elementos e a chance com que esses elementos podem ocorrer em um experimento 51 Introdução à teoria de conjuntos no contexto probabilístico Quando desejamos compreender algum fenômeno da natureza tentamos estudálo por meio de um processo de observação chamado experimento Para isso definimos um experimento aleatório Definição 51 a seguir Definição 51 Experimento Aleatório Todo experimento cujo resultado não pode ser previsto antes de sua execução é chamado de experimento aleatório Vejamos os Exemplos 51 52 e 53 todos esses para exemplificar um experimento aleatório Exemplo 51 Lançar um dado equilibrado e observar o resultado obtido na face superior do dado 66 51 Introdução à teoria de conjuntos no contexto probabilístico Exemplo 52 Observar o número de chamadas telefônicas que chegam a uma central telefônica em um deter minado intervalo de tempo Exemplo 53 Para a escolha ao acaso de uma lâmpada que acabou de sair do processo de fabricação verificar o tempo de duração da lâmpada em funcionamento Em um contexto aplicado podemos estar interessados em estudar a resistência de um fio de co bre a uma determinada corrente Para isso replicamos diversas vezes esse fenômeno para medirmos a resistência e assim temos o que chamamos de experimento Para que esse experimento não tenha resultados inconsistentes usamos muitas vezes um laboratório para tentar controlar outras variá veis que possam perturbar o experimento isto é medimos a resistência do fio de modo que a maior influência dessa variável para o experimento seja devida a corrente aplicada ao final Por mais que controlemos as condições possíveis do experimento surgem sempre variáveis não controláveis ao sistema que foge do controle do pesquisador nesses casos que são as variáveis não controláveis Figura 51 Isso mostra que por mais que repliquemos o experimento em mesmas condições ve remos que a medida da resistência do fio não será igual devido a essas variáveis não controláveis e que isso reflete em um componente aleatório que por consequência dizemos que estes tipos de experimentos são chamados de experimentos aleatórios Figura 51 Componente aleatória de um experimento aleatório Baseado nos exemplos anteriores percebemos pelo Exemplo 51 que não sabemos de fato qual o número da face superior que ocorrerá após o lançamento do dado Mas sabemos quais os resultados possíveis que são 1 2 3 4 5 e 6 O conjunto de todos esses resultados chamaremos de Espaço amostral apresentado na Definição 52 a seguir Definição 52 Espaço amostral O conjunto de todos os resultados possíveis de um experimento denotado por Ω é chamado de espaço amostral Cada um dos elementos do espaço amostral é representado por ω Na Definição 55 apresenta remos o significado de evento Contudo podemos antecipar como um subconjunto de Ω Assim diremos que um determinado evento ocorrerá se o resultado do experimento estiver nesse evento Existem duas relações entre eventos que usaremos constantemente ao longo do conteúdo que são 67 Capítulo 5 Probabilidades Continência A B ω A ω B Equivalência A B A B e B A E que fique claro também que a relação de elemento para conjunto é uma de pertinência isto é ω A que significa que ω é um elemento pertencente ou membro de A e que a relação entre conjuntos é uma relação de continência isto é A B significa que todo elemento de A é também elemento de B Retornando a Definição 52 podemos apresentar um outro espaço amostral para o experimento dado no Exemplo 54 a seguir Exemplo 54 Um experimento lança três moedas honestas e desejase verificar a face superior dessas moedas Sabese que cada moeda apresenta duas faces cara H e coroa T Dessa forma o espaço amostral é dado por Ω H H H H H T H T H H T T T H H T H T T T H T T T Contudo assim como definimos a natureza das variáveis no Capítulo 1 definimos também a natureza dos espaços amostrais de acordo os seus resultados do qual podemos apresentála na Definição 53 Definição 53 Espaços amostrais discretos e contínuos Um espaço amostral é discreto se o conjunto dos possíveis resultados são finito ou infinito contável ou enumerável Um espaço amostral é dito contínuo se o conjunto dos possíveis resultados são infinitos não contável ou não enumerável Vejamos o Exemplo 55 retirado de Montgomery e Runger 2016 para distinguir espaços amos trais discretos e contínuos apresentado a seguir Exemplo 55 Câmera Flash Considere um experimento em que você seleciona uma câmera de telefone celular e registra o tempo de recarga de um flash Os resultados possíveis para o tempo dependem da resolução do temporizador e dos tempos máximo e mínimo de recarga Entretanto podemos definir inicial mente o espaço amostral em termos da reta real positiva R isto é Ω R x x 0 Se soubermos que os tempos de recarga estão entre 1 5 e 5 segundos podemos definir o espaço amostral da seguinte forma Ω x 1 5 x 5 Caso consideremos o tempo de recarga como baixo médio ou alto reescrevemos o espaço amostral como Ω baixo médio alto Por fim podemos considerar apenas o fato da câmera satisfazer ou não as especificações do tempo de recarga mínimo e assim podemos assumir como resultados para esse espaço amostral sim ou não isto é Ω sim não Para as duas primeiras situações temos exemplos de espaços amostrais contínuos e nos dois últimos exemplos de espaços amostrais discretos 68 Entretanto também podemos ter um conjunto qualquer A que contém parte dos elementos de Ω isto é A Ω e que A passa a ser chamado de subconjunto de Ω apresentado na Definição 54 Definição 54 Subconjunto Se todo elemento do conjunto A é também elemento do conjunto B então A é definido como um subconjunto de B sendo representado A B ou B A A está contido em B ou B contém A em notação dizemos que A B A B A B Essa definição pode ser aplicada também a subconjuntos de Ω como apresentado no Exemplo 56 a seguir Exemplo 56 Sejam os subconjuntos de Ω do experimento aleatório apresentado no Exemplo 51 dos quais temos B 1 2 3 4 e A 1 2 3 então A é um subconjunto de B pois os elementos que contém em A também contém em B Definição 55 Evento Todo subconjunto do espaço amostral Ω representado por letras latinas em maiúsculo A B é chamado de evento Vejamos o Exemplo 57 para um entendimento inicial sobre um evento apresentado a seguir Exemplo 57 Um evento retirado do espaço amostral do Exemplo 54 seria A HHH HHT HTT ou seja o evento em que dos três arremessos de moedas tenha saído cara na primeira moeda Um outro exemplo abordado em James 2004 pode exemplificar um evento dentro do círculo unitário apresentado no Exemplo 58 a seguir Exemplo 58 Escolher ao acaso um ponto no círculo de raio 1 centrado na origem Então Ω círculo unitário xy ℝ² x² y² 1 Vejamos alguns eventos para esse exemplo A distância entre o ponto escolhido e a origem 12 B distância entre o ponto escolhido e a origem 15 C 1ª Coordenada do ponto escolhido é maior que a 2a Definição 56 Evento certo impossível e elementar Seja Ω o espaço amostral do experimento Então dizemos que Ω é o evento certo é o evento impossível e o evento ω é dito elementar 51 Introdução à teoria de conjuntos no contexto probabilístico Prova Suponha que exista dois conjuntos vazios 1 e 2 Pelo Teorema 51 sabemos que 1 2 uma vez que 1 é um conjunto vazio Mas também sabemos que 2 1 uma vez que 2 é um conjunto vazio Logo pela equivalência de conjuntos eventos Definição 512 1 2 o que conclui a prova Em algumas situações podemos apresentar alguns eventos a partir da combinação de outros eventos Dessa forma se faz necessário apresentar algumas operações elementares de conjuntos e suas consequências tais como a união interseção complemento dentre outras definições abordadas a seguir Inicialmente apresentamos na Definição 58 a união de dois eventos Definição 58 União de dois eventos Sejam A e B dois eventos quaisquer de Ω então o conjunto de todos os elementos que estão em A ou B ou em ambos é definido como o conjunto união de A e B denotado por A B tal que A B ω Ω ω A ou ω B 52 Vejamos o Exemplo 59 sobre a união de dois eventos a seguir Exemplo 59 Sejam os conjuntos A 1 2 3 e B 3 4 5 6 então A B 1 2 3 4 5 6 A Definição 59 apresenta a próxima propriedade de conjuntos que é a interseção de de eventos apresentada a seguir Definição 59 Interseção de dois eventos Sejam A e B dois eventos quaisquer de Ω então o conjunto que contém todos os elementos que estão em A e B é definido como a interseção de A e B denotado por A B ou AB tal que A B ω Ω ω A e ω B 53 Do Exemplo 59 temos que a intersecção de AB 3 Definição 510 Eventos Disjuntos ou multuamente exclusivos Sejam A e B dois eventos quaisquer de Ω então estes são disjuntos ou mutuamente exclusivos quando não existir elementos em comum entre A e B isto é A B Vejamos o Exemplo 510 para entendermos sobre eventos disjuntos apresentado a seguir Exemplo 510 Sejam os eventos A 1 2 3 4 e B 5 6 então A B Em seguida apresentamos mais duas definições interessantes que são os eventos coletivamente exaustivos Definição 511 e eventos equivalentes Definição 512 apresentados na sequência 71 Capítulo 5 Probabilidades Definição 511 Eventos coletivamente exaustivos Considere um conjunto de eventos em Ω se ao menos um evento ocorrer durante um dado experimento dizemos que esses eventos são coletivamente exaustivos Na sequência segue a definição sobre eventos equivalentes Definição 512 Eventos equivalentes Dois eventos A e B são definidos equivalentes ou iguais se A B e B A Exemplo 511 Sejam os conjuntos B 1 2 3 e A 1 2 3 então A é igual a B pois A B e B A Uma relação de eventos que será muito importante para o estudo da teoria da probabilidade é a definição de complemento abordado a seguir Definição 513 Evento Complementar Seja A um evento de Ω Então o complemento do evento A com respeito a Ω denotado por A Ac ou Ω A é o subconjunto dos elementos de Ω exceto os elementos do evento A isto é Ac ω Ω ω A 54 Exemplo 512 Seja o espaço amostral Ω do experimento que consiste em arremessar três moedas honestas Di remos que H consiste na face superior da moeda ser cara e T coroa Assim Ω H H H H H T H T H H T T T H H T H T T T H T T T e um subconjunto de Ω cujo evento será aparecer cara na primeira moeda dado por A H H H H H T H T H H T T Então o complemento de A será A T H H T H T T T H T T T Definição 514 Diferença de dois eventos Sejam A e B dois eventos de Ω O conjunto de todos os elementos de A que não estão em B serão denotados por A B ou A B sendo definido por conjunto diferença isto é A B ω Ω ω A e ω B 55 A Definição 515 pode ser confundida com a Definição 512 porém a segunda definição se remete ao espaço amostral e a diferença entre dois eventos se refere apenas a existência dos elementos de um evento que não estão no outro evento Vejamos o Exemplo 513 e depois compare com o Exemplo 512 para elucidar essas duas definições 72 Exemplo 513 Sejam os conjuntos A 1234 e B 34 então A B 12 Capítulo 5 Probabilidades ω A B e ω A C Logo ω A B A C Agora assumimos que ω A B A C portanto ω A B ou ω A C Se ω A B então ω está em A e B Como ω B então ω B C Se ω A C então ω está em A e C Como ω C então ω B C Logo ω A B C o que finaliza a prova da Lei distributiva IV Supomos que ω A Bc então ω A B isto é ω A ou ω B Como ω A ou ω B então ω Ac e ω Bc Logo ω Ac Bc Agora assumimos que ω Ac Bc Isso implica que ω Ac e ω Bc de modo que ou ω A ou ω B Assim ω A B e pela definição de evento complementar concluímos que ω A Bc De forma resumida podemos expressar essa prova da seguinte forma ω A Bc ω A ou ω B ω Ac e ω Bc ω Ac Bc Na segunda parte assumimos que ω A Bc então ω A B Assim ω A e nem ω B Como consequência ω Ac ou ω Bc logo ω Ac Bc Da mesma forma assumimos que ω Ac Bc isto é ω Ac ou ω Bc Isso implica que ω A B Usando a definição de evento complementar logo ω A Bc o que conclui a prova para a Lei DeMorgan De forma resumida podemos expressar essa prova da seguinte forma ω A Bc ω A B ω A e ω B ω Ac ou ω Bc ω Ac Bc Para finalizar apresentamos pelo Teorema 53 algumas identidades que serão importantes na teoria de conjuntos para o estudo sobre a probabildade Teorema 53 Sejam os eventos A e B definidos no espaço amostral Ω não vazio Então apresentamos as seguintes identidades I A Ac II A Ac Ω III Ωc IV c Ω V ACC A A em outras palavras o complemento de A é igual a A VI AΩ A Elemento neutro VII A Ω Ω VIII A A A Idempotência IX A Elemento absorvente X A A XI A B A A B A Bc XII B B A B Ac XIII B A B Ac XIV A B A B Ac XV A B Ac B A B A Bc 74 Prova Para provar que dois conjuntos são iguais devemos demonstrar que todo elemento que está em um conjunto também está no outro e viceversa Capítulo 5 Probabilidades 52 Definições de probabilidades Após um contexto sobre a teoria de conjuntos iniciamos o contexto probabilístico com o interesse de saber a chance de determinado elemento de um evento ocorrer como resultado de um experimento ao invés de estar interessado nesse resultado Isso tem total importância prática pois é dessa forma por exemplo que prevemos determinados resultados de um determinado fenômeno de interesse Consideremos um evento A contido no espaço amostral Ω e desejamos associar ao evento A uma medida que assume valores entre 0 e 1 que chamamos de medida de probabilidade de A denotada por PA Assim diremos que PA é a probabilidade de que o evento A ocorra no espaço amostral Ω De outro modo a probabilidade do evento A representa a chance de ao menos um de seus elementos ocorrerem como resultado de um experimento Voltando ao Exemplo 51 retirado de James 2004 considerando que esse dado é equilibrado e o evento A Ω então poderemos atribuir uma probabilidade para A da seguinte forma PA A 6 número de resultados favoráveis a A número de resultados possíveis Esta é a definição clássica de probabilidade quando Ω é finito Entretanto a probabilidade que o evento A ocorra no espaço amostral nem sempre é possível devido a complexidade desses eventos Retornando ao Exemplo 58 podemos interpretar a probabilidade de A Ω como PA área A área Ω área A π sendo a área de A bem definida Segundo um teorema profundo da teoria da medida não se pode definir PA para A Ω de modo que a área de A não esteja bem definida A prova disso de pende do Axioma da escolha Um exemplo clássico desses eventos são os conjuntos de Vitali de R os quais não podemos atribuir nenhuma medida quando ela generaliza o comprimento de inter valos de R De fato é impossível atribuir comprimento a todos subconjuntos de R preservando a aditividade e invariância por translação Dessa forma estaremos apenas interessados em eventos cuja área está bem definida apresentada na Definição 516 a seguir Definição 516 Evento Aleatório Todo evento de Ω que podemos atribuir uma probabilidade chamamos de evento aleatório Dessa forma definimos a medida de probabilidade apresentada na Definição 517 a seguir Definição 517 Medida de Probabilidade Seja Ω o espaço amostral então uma função P tal que P Ω R é chamada de medida de probabilidade ou probabilidade aos eventos do espaço amostral satisfazendo os seguintes axiomas de Kolmogorov i PΩ 1 ii 0 PA 1 A Ω iii PA1 A2 PA1 PA2 com A1 A2 para A1 A2 Ω Assim como mencionado por Montgomery e Runger 2016 os axiomas não determinam pro babilidades mas capacitam a calcular facilmente as probabilidade de alguns eventos a partir do conhecimento de outras probabilidades Na realidade a probabilidade se baseia no conhecimento do sistema em estudo Vejamos o Exemplo 514 para elucidar essas definições a seguir 76 52 Definições de probabilidades Exemplo 514 Retirado de Montgomery e Runger 2016 Uma peça moldada de injeção é igualmente provável de ser obtida a partir de qualquer uma das oito cavidades de um molde a Qual é o espaço amostral b Qual é a probabilidade de a peça ser proveniente da cavidade 1 ou 2 c Qual é a probabilidade de a peça não ser proveniente nem da cavidade 3 nem da 4 Nesse caso a o espaço amostral é Ω 1 2 3 4 5 6 7 8 Como a peça moldada de injeção é igualmente provável então b a probabilidade de a peça ser proveniente da cavidade 1 ou 2 é dada por P1 2 P1 P2 Eventos disjuntos 18 18 28 Por fim c a probabilidade de a peça não ser proveniente nem da cavidade 3 nem da 4 é dada por P3c 4c P3 4c Lei DeMorgan Teorema 52 prop III 1 P3 4 Evento complementar 1 P3 P4 Eventos disjuntos 1 18 18 1 28 68 O ítem c do Exemplo 514 exigiria um conhecimento sobre algumas propriedades da medida de probabilidade como consequência das propriedades da teoria de conjuntos abordadas na seção anterior mas que serão abordadas a seguir Apesar da definição formal sobre a probabilidade há duas formas para atribuir probabilidades aos elementos do espaço amostral que em algumas situações são aplicáveis que seguem 1 A primeira delas consiste na atribuição de probabilidades baseandose em características teó ricas da realização do fenômeno chamado de probabilidade clássica ou a priori formalmente se um experimento aleatório obtiver resultados multuamente exclusivos e igualmente prováveis e se nA desses resultados têm um atributo A então a probabilidade de acontecer A é a fra ção nAn Mais ainda Laplace define a probabilidade de um acontecimento como sendo o quociente entre o número de casos favoráveis e o número de casos possíveis supondo todos equiprováveis A principal limitação é que os eventos tenham que ser igualmente possíveis 2 uma outra maneira de obter probabilidades é através das frequências de ocorrências também conhecido como probabilidade frequentista ou a posteriori em que a probabilidade de um dado acontecimento pode ser medida observando a frequência relativa do mesmo acontecimento numa sucessão numerosa de provas ou experiências idênticas e independentes A principal limitação é que os eventos possam repetirse indefinidamente nas mesmas circunstâncias Exemplo 515 Um lançamento de um dado temos o espaço amostral Ω 1 2 3 4 5 6 Considere também que o dado foi construído de forma homogênea e com medidas rigorosamente simétricas não havendo qualquer razão para privilegiar essa ou aquela face Logo podemos considerar PX 1 PX 2 PX 3 PX 6 16 fato que se enquadra na probabilidade 77 Capítulo 5 Probabilidades clássica ou a priori Exemplo 516 Suponha que seja conhecida a frequência de cada possível elemento do espaço amostral Ω Se sor teamos aleatoriamente um elemento dessa população a probabilidade de sortear esse ou aquele elemento será a sua respectiva frequência relativa fato que se enquadra no tipo de probabilidade frequentista ou a posteriori 53 Propriedades Vejamos algumas propriedades da medida de probabilidade consequências dos Teoremas 52 e 53 porém sem a apresentação das devidas provas 531 Regra de adição de probabilidades Considere um espaço amostral e dois eventos não vazios A e B então a probabilidade de ocorrência do evento A ou do evento B é igual a PA B PA PB PA B 56 Caso os eventos A e B sejam mutuamente exclusivos isto é PA B 0 então PA B PA PB 57 Essa regra pode ser estendida para n eventos mutuamente exclusivos A1 A2 An isto é PA1 A2 An PA1 PA2 PAn 58 Vejamos o Exemplo 517 a seguir Exemplo 517 Retirado de Devore 2006 Uma empresa de eletricidade oferece uma taxa vitalícia de energia a qualquer lar cuja utilização de energia esteja abaixo de 240 kWh durante um determinado mês Represente por A o evento de um lar selecionado aleatoriamente em um comunidade que não excede a utilização da taxa vitalícia em janeiro e por B o evento análogo para o mês de julho A e B se referem ao mesmo lar Suponha que PA 0 8 PB 0 7 e PA B 0 9 Calcule a PA B b A probabilidade de a quantia da taxa vitalícia ser excedida em exatamente um dos dois meses Descreva esse evento em termos de A e B Considere A ω Ω ω lar X que não excede 240kWh em janeiro B ω Ω ω lar X que não excede 240kWh em julho Então para o primeiro ítem a temos que PA B PA PB PA B equação 56 59 78 54 Eventos independentes e probabilidade condicional Isso ocorre porque os eventos não são disjuntos uma vez que os dois eventos consistem no mesmo lar X em ser selecionado Assim pela expressão 510 podemos obter PA B dado por PA B PA PB PA B 0 8 0 7 0 9 0 6 510 No caso do ítem b o evento que representa o lar X de a quantia vitalícia ser excedida em exatamente um dos dois meses por ser representado por Ac B A Bc uma vez que Ac ω Ω ω lar X que exceder 240kWh em janeiro Bc ω Ω ω lar X que exceder 240kWh em julho Podemos ainda observar pelo Teorema 53prop XV que A B Ac B A B A Bc e que cada um dos eventos dentro do parêntese são disjuntos dois a dois logo PA B PAc B A B A Bc PAc B A Bc PA B Desse modo percebemos que PAc B A Bc PA B PA B logo PAc B A Bc 0 9 0 6 0 3 532 Probabilidade de um evento complementar Considere um espaço amostral e o evento não vazio A então a probabilidade do evento comple mentar Ac ocorrer é dado por PAC 1 PA 511 Essa situação é consequência da regra da adição para A Ω na expressão 57 substituindo B por AC temos PA AC PA PAC PA AC PΩ PA PAC 0 1 PA PAC logo segue a expressão 511 Exemplo 518 Retirado de Devore 2006 Usando os resultados do Exemplo 517 podemos calcular a probabilidade de Ac como PAc 1 0 8 0 2 Isso representa a chance do lar X exceder a energia acima de 240kWh em janeiro 54 Eventos independentes e probabilidade condicional Nessa seção iremos apresentar iniciar com uma motivação por meio do Exemplo 519 uma aborda gem sobre dois assuntos muito interessantes na probabilidade que são a independência de eventos 79 Capítulo 5 Probabilidades e a modificação do espaço amostral dada uma informação antecipada e qual a implicância dessas informações para a probabilidade de um evento ocorrer Exemplo 519 Paulo é um jovem empreendedor e quer abrir seu próprio negócio Ele observou que o mercado de sandálias era lucrativo Então resolveu abrir uma fábrica de sandálias Devido a dificuldade financeira resolveu comprar três máquinas de sandálias usadas As informações anteriores sobre estas máquinas dadas pelo proprietário foram Máquina Produto Total da produção Produto com defeito M1 Pantufas 50 1 M2 Sandálias baixas 40 2 M3 Sandálias de couro 10 3 Surgiu as seguintes indagações Do total de sandálias produzidas qual a probabilidade de Paulo produzir uma sandália com defeito Pensando em aumentar o lucro da fábrica Paulo pensa e substituir uma das máquinas qual seria sua decisão Será que a máquina M1 que produz mais sandálias e consequentemente tem maior desgaste deve ser trocada primeiro Ou será que apesar da máquina M3 ter menor produção é a que gera mais defeito por sandália deve ser trocada primeiro Muitas vezes nos deparamos com situações em que antes da realização de algum experimento temos alguma informação adicional Queremos saber o quanto que essa informação pode afetar a medida de probabilidade Assim apresentamos a Definição 518 que define a probabilidade condi cional a seguir Definição 518 Probabilidade condicional Dados dois eventos A e B definidos em Ω então a probabilidade condicional do evento A dado que ocorreu o evento B denotado por PAB é definida por PAB PA B PB 512 para PB 0 Baseado no problema de Paulo denotemos o evento D as sandálias produzidas com defeitos pela empresa M1 o evento que representa as sandálias produzidas pela máquina M1 M2 o evento que representa as sandálias produzidas pela máquina M2 e M3 o evento que representa as sandálias produzidas pela máquina M3 Assim percebemos que a probabilidade do evento D não pode ser observada facilmente pois o defeito dos produtos produzidos pelas máquinas está condicionado a cada máquina Desse modo podemos representar a probabilidade desses defeitos da seguinte forma PDM1 0 01 PDM2 0 02 e PDM3 0 03 Essas probabilidades apresentam uma alteração no espaço amostral para cada evento porque esses resultados mostram a chance de defeito do produto dado o conhecimento de que máquina foi produzido é o que chamamos de restrição do espaço amostral Essa restrição do espaço amostral pode nos questionar se de fato a probabilidade condicional de fato é uma medida de probabilidade Para isso apresentamos o Teorema 54 na sequência 80 Teorema 54 PAB é uma medida de probabilidade Sejam A e B eventos aleatórios tal que PB 0 e considera Q Ω 0 1 definida por QA PAB PA B PB que é a probabilidade condicional de A dado B Então Q é também uma medida de probabilidade Prova Para verificarmos se Q é uma medida de probabilidade devemos assumir que Q satisfaça os axiomas de Kolmogorov isto é Axioma 1 QΩ PΩ B PB PB PB 1 Axioma 2 Como P é uma medida de probabilidade então A Ω QA 0 Axioma 3 Sejam dois eventos A1 e A2 disjuntos então QA1 A2 PA1 A2 B PB 2 i1 PA1 B A2 B PB Lei distributiva QA1 QA2 o que conclui a prova Teorema 55 Regra do produto de probabilidade Seja os eventos não vazios A1 A2 An em Ω com Pni1 Ai 0 então a probabilidade do produto desses eventos é dada por PA1 A2 An PA1PA2A1 PAnA1 A2 An1 Capítulo 5 Probabilidades iii i Se PBA PB então PAB PBAPA PBPA para PA 0 A intuição para independência na Definição 520 fica justificada pelo fato de que A é indepen dente de B tanto na ocorrência quanto a não ocorrência de B e isso não muda em nada a proba bilidade da ocorrência de A isto é PAB PA e PABc PA Essas duas expressões significam que PA B PBPAB PBPA PA Bc PBcPAB PBcPA Entretanto a independência entre dois eventos não implica em independência coletiva Vejamos o Exemplo 521 a seguir Exemplo 521 Sejam os resultados possíveis de um dado honesto cujo espaço amostral é Ω 1 2 3 4 5 6 Considere um evento que representa o conjunto dos números ímpares desse espaço amostral A 1 3 5 e outro evento que consite nos múltiplos de 3 B 3 6 A probabilidade de A é PA 12 a probabilidade de B é PB 13 e a probabilidade da interseção entre A e B é PA B 16 Veja que dado que o evento B ocorra ou não ocorra Bc 1 2 4 5 a probabilidade do evento A é a mesma veja PAB 16 13 12 PABc 26 46 12 Que é o mesmo que entender que PA PB 16 PA B Logo A e B são eventos independentes Exemplo 522 Seja um experimento cujo objetivo é verificar a face superior de um tetraedro isto é Ω 1 2 3 4 Sejam os eventos em Ω A 1 4 B 2 4 e C 3 4 Considerando o tetraedro honesto e que cada valor é equiprovável assim PA PB PC 12 Observamos que estes eventos são independentes dois a dois isto é PA B 14 PAPB PA C 14 PAPC e PB C 14 PBPC Porém PA B C 14 PAPBPC Logo os eventos A B e C não são independentes três a três Para uma definição mais geral sobre a independência de eventos apresentamos a Definição 521 a seguir Definição 521 Independência de eventos Considere o espaço amostral Ω Uma sequência de eventos A1 A2 An de Ω são indepen dentes se e somente se PAi Aj PAiPAj para i j PAi Aj Ak PAiPAjPAk para i j k Pn i1Ai n i1 PAi 514 84 Paulo poderia indagar se os eventos Mi e D são independentes ou dependentes Contudo pela Definição 520 temos que PDMi PD D e Mi para i 123 logo não são independentes A grande questão agora é qual a máquina que Paulo deveria substituir com o propósito de aumentar seu lucro na empresa A ideia será calcular PMiD isto é dado um defeito na sandália qual a probabilidade de vinda da máquina i A maior probabilidade será a máquina substituída Entretanto ainda não temos ferramenta para resolver essa resposta Para isso apresentamos o seguinte Teorema 57 a seguir Teorema 57 Teorema de Bayes Considere o espaço amostral Ω Considere uma sequência de eventos A1 A2 An de Ω disjuntos tal que ni1Ai Ω e B um evento do F então a probabilidade de Ak para k 1 2 n dado que ocorreu o evento B denotado por PAkB é dado por PAkB PBAkPAkn i1 PBAiPAi k 1 2 n para PAk 0 e PAi 0 sendo i 1 2 n Prova Para um i qualquer temos PAiB PAi B PB ou PBAi PB Ai PAi Isto implica que PAi B PBPAiB PAiPBAi Pela lei da probabilidade total a probabilidade de B pode ser dada por PB i1 PAi Portanto PAiB PAiPBAi i1 PAiPBAi prova concluída Tal é a sua importância que um dos ramos de estudo da inferência estatística é baseado nesse teorema O Teorema de Bayes fornece uma atualização do conhecimento já existente PAk conhecido como a priori por meio da ocorrência do evento B Essa atualização é a probabilidade a posteriori PAkB Capítulo 5 Probabilidades cada uma das máquinas PM1D 0 01 0 50 0 016 0 3125 PM2D 0 02 0 40 0 016 0 5000 PM3D 0 03 0 10 0 016 0 1875 A tomada de decisão será substituir a máquina M2 Poderíamos ter tomado uma decisão equivocada se não fosse o teorema de Bayes Devemos abrir uma discussão que ocorre muito frequente entre as Definições 510 e 520 isto é eventos disjuntos e independência Nas próprias definições percebemos a distinção clara entre as características A primeira se remete a eventos conjuntos e a segunda é uma condição pro babilística dos eventos Contudo em determinados problemas ainda há muita confusão ao tentar resolvêlos Assim apresentemos o Teorema 58 a seguir Teorema 58 Eventos disjuntos e independentes Considere A e B dois eventos Ω Se A B eventos disjuntos então A e B são indepen dentes apenas se e somente se um dos eventos tiver probabilidade 0 Prova Considerando que o evento A tenha probabilidade 0 isto é PA 0 implica que A Assim PA B P B P 0 A condição de independência entre os dois eventos existe se PAPB PA B e isso ocorre de fato PAPB PPB 0 PB 0 PA B o que completa a prova Caso esses eventos não tenham probabilidade 0 a condição A B implica que estes são dependentes Vejamos o Exemplo 523 adaptado de Morettin 2010 para elucidar essas definições Exemplo 523 Adaptado de Morettin 2010 A tabela abaixo dá a distribuição das probabilidade dos quatro tipos sanguíneos numa certa comunidade Tipo sanguíneo A B AB O Probabilidade de ter o tipo especificado 02 Probabilidade de não ter o tipo especificado 09 095 Calcular a probabilidade de que a um indivíduo sorteado ao acaso nessa comunidade tenha o tipo O b um indivíduo sorteado ao acaso nessa comunidade tenha o tipo A e tipo B ao mesmo tempo Podemos afirmar que estes são independentes c dois indivíduos sorteados ao acaso nessa comunidade tenham tipo A e tipo B nessa ordem d um indivíduo sorteado ao acaso nessa comunidade não tenha o tipo B ou não tenha o tipo AB Vejamos que os tipos sanguíneos são multuamente exclusivos e formam a partição do espaço amostral uma vez que não existe outro tipo sanguineo além dos informados e que não há indiví duo com dois tipos sanguíneos Assim 86 a Consideremos o evento A os indivíduos da comunidade especificado do tipo sanguíneo A tal que A ωA Ω ωA A1 o evento B os indivíduos da comunidade especificado do tipo sanguíneo B tal que B ωB Ω ωB B o evento AB os indivíduos da comunidade especificado do tipo sanguíneo AB tal que AB ωAB Ω ωAB A1 o evento O os indivíduos da comunidade especificado do tipo sanguíneo O tal que O ωO Ω ωO O Desse modo o espaço amostral é dado por Ω ωA ωB ωAB ωO cujos elementos de ω devem estar apenas em um dos eventos anteriores e que a união de todos os elementos desses formam o espaço amostral logo esses eventos formam uma partição do espaço amostral Definição 519 Observe também que esses elementos não são equiprováveis como mostrado na tabela de probabilidades na própria questão Assim PΩ PA PB PAB PO 1 02000 05000 PO PO 06500 b Este tema merece uma atenção Como os eventos A e B são multitentamente exclusivos logo PA B 0 e estes não são independentes pois nenhum tem probabilidade 0 Teorema 58 logo A e B são eventos dependentes c Diferentemente do espaço amostral anterior neste temos uma combinação de 16 possibilidades da cardinalidade de Ω uma vez que temos 4 possibilidades para o primeiro indivíduo e mais 4 possibilidades para o segundo indivíduo isto é Ω ωAωA ωAωB ωAωAB ωAωO ωBωA ωBωB ωBωAB ωBωO ωABωA ωABωB ωABωAB ωABωO ωOωA ωOωB ωOωAB ωOωO Uma vez determinada as probabilidades de especificação em indivíduos diferentes a probabilidade de especificar o tipo sanguíneo A em um indivíduo na comunidade não interfere em nada na probabilidade de especificar o tipo sanguíneo de um outro indivíduo dessa mesma comunidade Uma ressalva é válida no entanto isto também que estamos desconsiderando indivíduos consanguíneos isto é com grau de parentesco Assim a probabilidade de especificar o tipo sanguíneo A em simultaneamente é PA PB 02000 01000 00200 De outro modo temos que PA B PωA ωB PωA A e ωB B PωA A PωB B PA PB 02000 00100 00200 d Agora os eventos não ter o tipo sanguíneo especificado não implica que os eventos sejam mutuamente exclusivos pelo fato dos eventos ter o tipo sanguíneo especificado terem sido disjuntos Veja o evento não ter o tipo sanguíneo AB e o evento não ter o tipo sanguíneo B pode existir indivíduos como a estes dois eventos por exemplo um indivíduo do tipo sanguíneo A ou O e a probabilidade destes não é zero logo os eventos não ter o tipo sanguíneo AB também não são disjuntos Entretanto esses eventos são independentes pois a probabilidade de um evento não influencia na probabilidade do outro Assim PABc Bc PABc PBc PABc Bc 09500 09000 PABc Bc 516 Vejamos o evento ABc A B O e o evento Bc A AB O A interseção entre estes é ABc Bc A O em que A e O são disjuntos assim PABc Bc PA O PA PO 020 065 085 517 Substituindo 517 em 516 segue que PABc Bc 095 090 085 1 Capítulo 5 Probabilidades Ao final temos a tabela completada da seguinte forma Tipo Sanguíneo A B AB O Prob tipo esp 020 010 005 065 Prob não tipo esp 080 090 095 035 Vale a pena discutirmos sobre a independência nessa situação Quando falamos na especificação do tipo sanguínio é fato que um mesmo elemento não pode ser especificado em dois ou mais tipos sanguíneo Fica claro que os eventos A AB B e O são disjuntos Agora será que a probabilidade de especificar por exemplo o tipo sanguíneo A não interfere na probabilidade do tipo sanguíneo B ou qualquer um outro tipo sanguíneo Observe que uma vez especificado a probabilidade de um determinado tipo sanguíneo por exemplo tipo A não haverá mais chances de ele ter o tipo sanguíneo B logo a probabilidade de B ocorrer é 0 Assim a condição de ter especificado o tipo sanguíneo A alterou a probabilidade de especificar o tipo sanguíneo B Logo estes eventos são dependentes Podemos ainda expressar mais dois teoremas para complementar as afirmações feitas no Exem plo 523 e suas implicâncias com relação aos eventos serem independentes e eventos disjuntos Inicialmente apresentamos o Teorema 59 como uma implicância da independência de eventos a seguir Teorema 59 Se A e B são eventos independentes não vazio definidos em Ω então a A e Bc também são independentes b Ac e B também são independentes c Ac e Bc também são independentes Prova Usando as seguintes equivalências PA PA B PA Bc 518 PAc PAc B PAc Bc 519 PB PB A PB Ac e 520 PBc PBc A PBc Ac 521 e a condição de que PA B PAPB independentes então usando 518 temos PA Bc PA PAPB Independência PA1 PB PAPBc o que prova o ítem a Usando 520 pelo mesmo raciocínio provamos o ítem b Usando o resultado do ítem a já provado e a condição de independência na expressão 521 temos PAc Bc PBc PBcPA PBc1 PA PBcPAc o que prova o ítem c concluindo assim a prova do teorema Por fim o Teorema 510 apresenta uma implicância sobre eventos disjuntos a seguir 88 Teorema 510 Sejam dois eventos A e B em Ω Se A B então Ac Bc a menos que A e B sejam partição do espaço amostral Prova Considere A B e que A B A Bc A B Ac B Ac Bc A B Ω Pelo fato de A e B não serem partição do espaço amostral 522 Usando a Lei de Morgan Ac Bc A Bc logo percebemos pela expressão 522 que Ac Bc o que completa a prova 56 Variável Aleatória Em estatística avaliamos um experimento não pelos eventos em si mas por uma função definida no espaço amostral que associa o evento a um número real Essa função chamamos de variável aleatória denotada por uma letra maiúscula X ou X Alguns autores criticam o termo variável aleatória já que a mesma é uma função Como essa definição ficou conhecida com esse nome seria um equívoco tentar renomeála do qual é apresentada na Definição 522 a seguir Definição 522 Variável Aleatória Seja o espaço amostral Ω de um experimento então uma função X Ω R é chamada de variável aleatória isto é considerando ω Ω então a variável aleatória Xω é uma função com domínio em Ω e imagem no conjunto dos reais B tal que B x R Xω x ω Ω Consideramos X uma variável aleatória discreta quando B representa um conjunto contável ou enumerável de valores finito ou infinito Por outro lado se B for um conjunto não contável ou não enumerável X será denominada de variável aleatória contínua O fato é que independente da natureza da variável aleatória ela induz a um novo espaço amostral na reta real Exemplo 524 Para explicar a definição de uma variável aleatória será considerado o exemplo no qual duas variedades de uma espécie A A1 A2 e três de outra espécie E E1 E2 E3 são disponibilizados para uma pesquisa Uma amostra de duas variedades n 2 é extraída O espaço amostral dos resultados desse experimento segue Ω A1 A2 A1 E1 A1 E2 A1 E3 A2 E1 A2 E3 A2 E2 Capítulo 5 Probabilidades No exemplo 524 criamos uma partição do espaço amostral Ω e associamos com um outro espaço amostral induzido ΩX por meio da variável aleatória X como pode ser apresentado na Figura 53 Figura 53 Espaço amostral e espaço amostral induzido pela variável aleatória X Para o exemplo do experimento do sorteio das duas variedades definindose X como sendo a variável aleatória relativa a contagem de variedades da espécie A na amostra verificamos que podem ser assumidos pela variável X isto é x 0 1 2 É comum representar a variável por X maiúsculo e os seus valores por x minúsculo Considerando ainda que para esse exemplo os pontos de Ω são equiprováveis então a probabilidade de X assumir um dados valor x será denotado por PX x pXx ou pi com i 1 2 sendo denominada também de função de probabilidade de X para o caso da variável discreta Supondo que desejamos calcular a probabilidade de C3 ocorrer temos PC3 Pω Ω ω C3 PA1 A2 A1 A2 Ω 1 10 523 Vamos observar que de modo equivalente iremos calcular a probabilidade do evento C3 agora olhando para a variável X tal que PC3 pX2 PX 2 que segue pX2 PX 2 PXB ΩX B 2 Figura 53 PXx ΩX Xω B ω Ω PX12 Pω Ω Xω 2 Pω Ω ω C3 PA1 A2 PC3 1 10 resultado 523 524 Portanto a partir de agora em diante iremos calcular as probabilidades dos eventos a partir da variável aleatória Para um mesmo espaço amostral é possível associar outras variáveis aleató rias No exemplo que estava sendo considerado poderíamos pensar em uma variável aleatória Y 90 que representa o número de espécies da variedade E A função de probabilidade de X define a distribuição de probabilidade dessa variável aleatória Dessa forma a distribuição de probabilidade pode ser vista como uma correspondência que associa as probabilidades aos valores de uma variável aleatória que é função do espaço amostral Portanto como PX x 0 em se tratando de variáveis aleatórias contínuas as probabilidades calculadas sobre os intervalos a b a b a b e a b serão sempre as mesmas para quaisquer valores de a e b Vamos verificar se um fX pode ser considerada uma função densidade de probabilidade pelo Exemplo 526 Na seção anterior afirmamos que a distribuição de X é dada por PXω B em que B R Existe um caso especial em que B x em que x R Assim dizemos que PXω x representa a função de distribuição ou função de distribuição acumulada FD ou FDA e em notação temos FXx PXω x A seguir apresentamos a função de distribuição para as variáveis aleatórias discretas e contínuas Considerando uma pessoa dessa comunidade sorteada ao acaso poderíamos estar interessados em saber qual a probabilidade dela ter recebido 2 doses usando a ideia da probabilidade frequente a probabilidade desejada é de 2701000027 Podemos assim obter a função de probabilidade para a variável aleatória número de doses recebidas que também pode ser observado pela Figura 54 Figura 54 Gráfico da função de probabilidade Figura 56 Gráfico da função de distribuição EX k EX k EXY EXEY se X e Y forem independentes Uma outra medida resumo é a mediana denotada por μd que é o valor que satisfaz PX μd PX μd 050 isto é a probabilidade X ser maior ou menor que μd é igual Em algumas situações a igualdade é satisfeita considerando um valor em um certo intervalo tal que μd seja o ponto médio de intervalo Por fim apresentamos a moda como sendo o valor ou valores da variável aleatória que apresenta maior probabilidade de ocorrência A moda é denotada por μo do qual pode ser definida como PX μo maxp1 p2 pn Seja X uma variável aleatória e sua esperança matemática dada por EX μ então a variância de X denotada por σ²X ou VarX é definida i se X for discreta por σ²X i xi μ²PXi para um conjunto de pontos x1 x2 xi ii se X for contínua por σ²X xi μ²fXxdx sendo fXx uma função densidade de probabilidade Assim como observamos em estatística descritiva a variância apresenta um problema que é a unidade ao quadrado da unidade da variável e isso acaba dificultando a interpretação prática de seu resultado Como solução usamos a Definição 525 para apresentar o desvio padrão de X 512 Exercícios 512 Exercícios Exercício 51 Defina o que é um experimento aleatório e exemplifique Solução na página 217 Exercício 52 Defina o que é um espaço amostral e exemplifique Solução na página 217 Exercício 53 Para cada um dos casos abaixo escreva o espaço amostral correspondente e conte seus elementos a Uma moeda é lançada duas vezes e observamse as faces obtidas b Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observado c Dois dados são lançados simultaneamente e estamos interessados na soma das faces ob servadas d Em uma cidade famílias com 3 crianças são selecionadas ao acaso anotandose o sexo de cada uma Solução na página 217 Exercício 54 Duas pessoas A e B lançam três moedas de modo independente e nessa ordem primeiro a pessoa A depois a pessoa B alternadamente Nesse jogo ganha quem conseguir três faces iguais sendo finalizado com a vitória de um dos competidores Assim perguntamos a Qual a probabilidade de A ganhar b Qual a probabilidade de B ganhar Solução na página 217 Exercício 55 Uma Universidade tem 10 mil alunos dos quais 4 mil são considerados espor tistas Temos ainda que 500 alunos são do curso de Administração noturno 700 de Ciências contábeis noturno 100 são esportistas e da Administração noturno e 200 são esportistas e da Ciências contábeis noturno Qual a probabilidade de a Ser esportista b Ser esportista e aluno da Administração c Ser esportista ou aluno da Ciências contábeis d Não ser esportista nem aluno da Administração Solução na página 218 Exercício 56 Sejam A e B dois eventos em um dado espaço amostral tais que PA 0 2 PB p PA B 0 5 e PA B 0 1 Determine o valor de p Solução na página 218 99 Capítulo 5 Probabilidades Exercício 57 Se PA 1 2 PB 1 4 e A e B são multuamente exclusivos calcular a PAc b PBc c PA B d PA B e PAc Bc Solução na página 219 Exercício 58 Se PA 1 2 PB 1 3 e PA B 1 3 Calcule a PA B b PAc B c PAc Bc Solução na página 219 Exercício 59 Dois dados são lançados simultaneamente Qual a probabilidade de a a soma ser menor que 4 b a soma ser 9 c o primeiro resultado ser maior que o segundo Solução na página 219 Exercício 510 Qual a probabilidade de sair um rei ou uma carta de copas quando retiramos uma carta de um baralho Solução na página 219 Exercício 511 As probabilidades de três jogadores marcarem um pênalti são respectiva mente 2 3 4 5 e 7 10 Se cada um cobrar uma única vez qual a probabilidade de a todos acertarem b apenas um acertar c todos errarem Solução na página 219 Exercício 512 Dois armários guardam as bolas de voleibol e basquete O armário 1 tem três bolas de voleibol e 1 de basquete enquanto o armário 2 tem 3 de voleibol e 2 de basquete Escolhendose ao acaso um armário e em seguida uma de suas bolas calcule a probabilidade dela ser 100 512 Exercícios 1 De voleibol sabendose que o armário 1 foi escolhido 2 De basquete sabendose que o armário 2 foi escolhido 3 De basquete Solução na página 220 Exercício 513 Em certo colégio 5 dos homens 2 das mulheres têm mais do que 180m Por outro lado 60 dos estudantes são homens Se um estudante é selecionado aleatoria mente e tem mais de 180m de altura qual a probabilidade de que o estudante seja mulher Solução na página 220 Exercício 514 A probabilidade de uma mulher está viva daqui a 30 anos é 3 4 e a de seu marido 3 5 Calcular a probabilidade de a apenas o homem está vivo b somente a mulher está c ambos estarem vivos Solução na página 221 Exercício 515 Se PA B 0 8 PA 0 5 e PB x determine o valor de x no caso de 1 A e B serem multuamente exclusivos 2 A e B serem independentes Solução na página 221 Exercício 516 Se PB 04 PA 07 e PA B 0 3 calcule PABc Solução na página 221 Exercício 517 O São Paulo Futebol Clube ganha com probabilidade 07 se chove e 08 se não chove Em Dezembro a probabilidade de chuva é de 03 O São Paulo ganhou uma partida em Dezembro qual a probabilidade de ter chovido nesse dia Solução na página 221 Exercício 518 Três máquinas A B e C produzem respectivamente 30 50 e 20 do total de peças de uma fábrica As porcentagens e peças defeituosas nas respectivas máqui nas são 3 5 e 2 Uma peça é sorteada ao acaso e verificase que é defeituosa Qual a probabilidade de que a peça tenha vindo da máquina B Solução na página 222 Exercício 519 Numa certa população a probabilidade de gostar de teatro é de 13 en quanto que a de gostar de cinema é 12 Determine a probabilidade de gostar de teatro e não de cinema nos seguintes casos 101 Capítulo 5 Probabilidades a Gostar de teatro e gostar de cinema são eventos disjuntos b Gostar de teatro e gostar de cinema são eventos independentes c Todos que gostam de teatro gostam de cinema d A probabilidade de gostar de teatro e de cinema é de 18 e Dentre os que não gostam de cinema a probabilidade de não gostar de teatro é de 34 Solução na página 222 Exercício 520 A probabilidade de fechamento de cada relé do circuito apresentado a seguir é dada por p Se todos os relés funcionarem independentemente qual será a probabilidade de que haja corrente entre os terminais L e R Solução na página 222 Exercício 521 A probabilidade de fechamento de cada relé do circuito apresentado a seguir é dada por p Se todos os relés funcionarem independentemente qual será a probabilidade de que haja corrente entre os terminais L e R Solução na página 223 Exercício 522 Considerando a população brasileira vacinada de covid19 até o dia 13062021 de acordo com o Ministério da Saúde de uma população vacinável de 160044909 milhões de pessoas observouse que 826158 mil pessoas tomaram apenas a pri meira dose da vacina 1950914 milhões de pessoas tomaram a primeira e a segunda dose sendo que 157267837 milhões de pessoas ainda não tomaram vacina Considerando essas informações apresente a função de distribuição de X sendo X o número de doses aplicadas na população vacinável Solução na página 223 102 512 Exercícios Exercício 523 Considere X uma variável aleatória discreta cuja sua função de distribuição é dada por FXx 0 se x 5 0 2 se 5 x 7 0 5 se 7 x 8 0 9 se 8 x 20 1 se x 20 Determine a a função de probabilidade de X b PX 7 c PX 7 d P8 X 18 e PX 15 f qual é o valor da esperança matemática E a mediana E a moda Solução na página 223 Exercício 524 Sejam dois eventos não vazios A e B de Ω e que ω C A Bc Ac B representam os elementos que estão exatamente em um dos dois eventos isto é não há elementos em comum entre esses dois eventos Assim prove que PC PA PA 2PA B Solução na página 224 103 O estudo das distribuições especiais abrange as principais distribuições discretas Bernoulli Binomial e Poisson e contínuas Normal Essas distribuições são de tal importância pois grande parte das variáveis podem ser modeladas ou derivadas por meio delas Considere um experimento cujo resultado apresenta apenas duas possibilidades sucesso ou fracasso Por exemplo uma peça produzida em uma indústria automobilística pode ter sido fabricada com duas possibilidades defeituosa ou não assim como um bit transmitido por um canal digital pode ter sido realizado com erro ou não Prova Para mostrarmos que a pXx da expressão 61 devemos demonstrar que i Mostrar que PX x 0 Prova Como os valores de x 0 ou 1 e 0 p 1 então px1p1x 0 ii Mostrar que Σx01 PX x 1 Prova Σx01 PX x PX 0 PX 1 1p p 1 Graficamente apresentamos na Figura 61 a distribuição de X modelado por uma distribuição Bernoulli Teorema 62 Esperança Variância e Desvio padrão da distribuição de Bernoulli Se a variável aleatória X possui distribuição Bernoulli cuja função de probabilidade é expressa em 61 a esperança de X é dada por μX p a variância é dada por σ²X p1p e o desvio padrão é dado por σX p1p Prova Sendo a esperança definida por μX EX Σx0n xPX x e considerando o experimento de uma variável aleatória X com distribuição Bernoulli em que x 1 sucesso para o experimento com probabilidade p e x 0 fracasso com probabilidade 1 p então a esperança é dada por EX 1 p 0 1p p Definição 62 Distribuição Binomial Uma variável aleatória X discreta tem distribuição Binomial se sua função de probabilidade é dada por PX x n x px 1pnx para x 0 1 2 n 0 caso contrário em que n x nxnx p é o parâmetro que indica o número de sucessos do evento ocorrer sendo 0 p 1 Em notação X Binomialn p representa que X tem distribuição Binomial com parâmetros n e p Capítulo 6 Distribuições de probabilidades Figura 62 Distribuição de X Binomial10 000 109366 Código R 61 Script 1 Valores 2 n 10000 x 0n p 0459394 3 Probabilidade 4 px dbinomx size n prob p 5 Gráfico 6 plotx px type h xlab X ylab expressionPXx panelfirst gridcolgray ylim c0 0008 xlim c4400 4800 lwd 3 Observamos que a expressão 65 reduzse a expressão 61 quando n 1 Isso reforça que a distribuição Binomial é uma generalização para a distribuição Bernoulli Vamos demonstrar pelo Teorema 65 que a distribuição Binomial também é uma função de probabilidade a seguir Teorema 63 Função de probabilidade Binomial A distribuição Binomial expressa em 65 é uma função de probabilidade Prova Para mostrarmos que a distribuição Binomial é uma função de probabilidade devemos mos trar as seguintes propriedades i Mostrar que PX x 0 ii Mostrar que n x0 PX x 1 i Como n 0 x 0 n x e 0 p 1 então n x 0 px 0 e 1 pnx 0 108 Portanto PX x n x px1 pn x 0 Capítulo 6 Distribuições de probabilidades Código R 62 Script 1 2 Consideramos a alteracao do valor do parametro p 3 4 Grafico da distribuicao binomial para n 30 e p 05 5 x 030 n 30 p 05 6 px dbinomx size n prob p 7 plotx px type h xlab X ylab expressionPXx panelfirst gridcolgray ylim c0 05 lwd 2 8 n 30 e p 01 9 x 030 n 30 p 01 10 px dbinomx size n prob p 11 linesx px col red type h lwd 2 12 n 30 e p 09 13 x 030 n 30 p 09 14 px dbinomx size n prob p 15 linesx px col green type h lwd 2 16 Legendas 17 legend20 05 legend cn30p05 18 n30p01 19 n30p09 20 col cblack red green 21 bg antiquewhite1 lty 1 cex 08 lwd 2 Figura 63 Gráfico da função de probabilidade da distribuição binomial de parâmetros n 30 e diferentes valores de p Para finalizar podemos obter pelo Teorema 64 a esperança variância e desvio padrão da distri buição Binomial 110 Teorema 64 Esperança Variância e Desvio padrão da distribuição de Binomial Se a variável aleatória X possui distribuição Bernoulli cuja função de probabilidade é expressa em 61 a esperança de X é dada por EX np a variância é dada por σ2X np1 p e o desvio padrão é dado por σX np1 p Prova Vamos apresentar duas provas Na primeira usaremos as propriedades da esperança e variância e da independência de variáveis aleatórias abordados no Capítulo 5 seção 511 Na segunda prova iremos apresentar os resultados por meio da definição de esperança e variância Dessa forma temos I Sabemos que se X1 X2 Xn são variáveis aleatórias independentes e identicamente distribuídas iid com distribuição de Bernoulli de parâmetro p então Y i1n Xi Binomialn p Logo μY EY Ei1n Xi i1n EXi nEX np considerando EX em 62 A variância pode ser obtida pelo mesmo raciocínio feito para obter a esperança isto é σY VarY Vari1n Xi i1n VarXi nVarX np1 p considerando VarX em 63 O desvio é a raiz da variância logo σY np1 p o que concluí a primeira prova Usando a transformação y x 1 então EX² np y0n1 fracyyn1y py 1pn1y np n1p 1 np np² np² n p1 p como queríamos demonstrar Por fim desse resultado obtemos o desvio padrão dado por σX sqrtnp1p o que concluímos toda a prova do teorema O termo independente está relacionado a chance de uma variável aleatória assumir um determinado valor não interfere em nada na chance de outra variável aleatória assumir um determinado valor Já o termo identicamente distribuído se refere as variáveis aleatórias que são modeladas por uma mesma distribuição e mesmos parâmetros Vejamos o Exemplo para o cálculo da esperança variância e desvio padrão de uma distribuição Poisson Exemplo 64 Considere o Exemplo 63 e apresenta a esperança e o desvio padrão de X que representa o número de êxitos da coincidência da senha selecionada com dois usuários do banco Inicialmente calculamos a esperança matemática média EX np 10000 x frac109366 4593 937 êxitos Para o cálculo da variância temos VarX 10000 imes frac109366 imes 1 frac109366 2483511 êxitos² em que o desvio padrão segue σX sqrt2483511 4983484 êxitos Uma distribuição discreta amplamente aplicada em diversos tipos de experimentos é a distribuição Poisson Eventos do tipo fenômenos que esperamos dado um tempo ou um espaço como o número de telefonemas de uma atendente em uma hora ou o número de acidentes por 15 km em uma rodovia dentre outros podem ser modelados por essa distribuição Capítulo 6 Distribuições de probabilidades Figura 64 Gráfico da função de probabilidade da distribuição binomial de parâmetros diferentes de n e p 01 ocorrência de uma determinada ocorrência é proporcional ao tempoespaço de espera isto é po demos assumir que quanto mais longo for a espera ou o espaço mais provável é a ocorrência De outro modo suponha que X seja uma variável aleatória que corresponde o número de ocorrências sucesso em um determinado tempoespaço T e suponha que o número médio de ocorrências seja dado por λ Assumimos também que a esperança de X é EX λ Ainda considere ainda que o tempoespaço pode ser subdividido em n subintervalos suficientemente pequenos t Tn de modo que a existência de mais de uma ocorrência em t é desprezível e a probabilidade p será a mesma em cada subintervalo de modo independente da probabilidade de ocorrência em outros subintervalos 114 Código R 63 Script Consideramos a alteração do valor do parâmetro n Gráfico da distribuicao binomial para n 30 e p 01 n 30 x 0n p 01 px dbinomx size n prob p plotx px type h xlab X ylab expressionPXx panelfirst gridcol gray ylim c0 04 xlim c0 40 lwd 2 n 30 e p 01 n 50 x 0n p 01 px dbinomx size n prob p linesx 02 px col red type h lwd 2 n 100 x 0n p 01 px dbinomx size n prob p linesx 03 px col blue type h lwd 2 n 200 x 0n p 01 px dbinomx size n prob p linesx 04 px col purple type h lwd 2 Legendas legendx 04 legend cn30p01 n50p01 n100p01 n200p01 col cblack red blue purple bg antiquewhite lty 1 cex 07 lwd 2 Assim a distribuição de X tem distribuição Poisson derivada de uma distribuição Binomial assintoticamente isto é para n e p 0 mantendose np constante Para isso temos PX x binomnx px 1pnx fracnxnx px 1pnx sendo nxnx nxx tal que nx nn1nx1 e definido λ np temos PX x fracnxx lambdan x 1 lambdannx Observando que 1 lambdannx o elambda em então PX x fraclambdax elambdax Considerando agora que a probabilidade p 0 com n λ passa a ser considerado como aproximadamente constante Na aplicação do limite observe que limn o infty left1 fraclambdanrightx 1 e limn o infty fracnxnx 1 e por um resultado clássico de limite segue também que limn o infty left1 fraclambdanrightn elambda Desse modo concluímos que limn o infty PX x sim fraclambdax elambdax do qual essa distribuição é a função de probabilidade Poisson Vejamos o Exemplo 65 para mostrar essa aproximação Exemplo 65 Considere uma revisão tipográfica de um livro e foi observado que existe um erro a cada 500 palavras impressas Uma página apresenta 250 palavras Desse modo qual é a probabilidade de que não ocorreram mais do que 1 erro a cada quatro páginas revisadas Se consideramos que as palavras impressas são experimentos de Bernoulli com probabilidade p 1500 Então X representa o número de erros que ocorre em quatro páginas X Binomial250 imes 4 1500 Desse modo PX 1 frac1000x leftfrac1500rightx left1 frac1500right1000x Ao invés podemos aproximar essa probabilidade usando a distribuição Poisson com λ np 1000 x 1500 2 erros a cada quatro páginas que segue PX 1 frac2x e2x 06766764 Observamos que a diferença ocorreu na sétima casa decimal sendo uma aproximação muito boa levando em consideração que o cálculo da última probabilidade foi relativamente mais simples Vejamos na Figura 65 a representação gráfica dessas duas distribuições mostrando praticamente equivalência entre elas Lembrando que esse resultado se torna tão melhor quanto mais n e p 0 Figura 65 Relação entre as distribuições Poisson e Binomial para n 1000 p 1500 e lambda np Exemplo 66 O número de falhas em parafusos de máquinas da indústria de papéis segue uma distribuição Poisson em que ocorre 02 falhas por metro quadrado da produção a Qual a probabilidade de não ocorrer falha em um metro quadrado de papel b Qual a probabilidade de ocorrer no mínimo 1 erro por metro quadrado de papel c Qual a probabilidade de ocorrer 1 erro por 15 m² Para o primeiro caso a temos PX 0 λxeλ x 020e02 0 e02 081873 Usando o R calculamos essa probabilidade usando dpois0 02 Para o segundo caso b temos PX 1 1 PX 0 Evento complementar 1 081873 018127 em que usando o R calculamos essa probabilidade pelo código 1 dpois0 02 lowertail FALSE Por fim o último item c tem uma peculiaridade porque a área com a qual se pergunta não é a mesma para o parâmetro λ Assim devemos fazer uma atualização dessa média espacial isto é λ 15 02 1 λ 03 falhas por 15 m² 62 Distribuições discretas de probabilidades Figura 66 Comportamento da distribuição Poisson com relação ao parâmetro λ Código R 64 Script 1 2 Consideramos a alteracao do valor do parametro lambda 3 4 Grafico da distribuicao poisson para lambda5 5 x 050 lambda 5 6 px dpoisx lambda lambda 7 plotx px type h xlab X ylab expressionPXx panelfirst gridcolgray ylim c0 02 xlim c0 50 lwd 2 8 n 30 e lambda 10 9 x 050 lambda 10 10 px dpoisx lambda lambda 11 linesx02 px col red type h lwd 2 12 n 30 e lambda 20 13 x 050 lambda 20 14 px dpoisx lambda lambda 15 linesx04 px col green type h lwd 2 16 n 30 e lambda 30 17 x 050 lambda 30 18 px dpoisx lambda lambda 19 linesx06 px col purple type h lwd 2 20 Legendas 21 legend40 02 legend cexpressionlambda5 22 expressionlambda10 23 expressionlambda20 24 expressionlambda30 25 col cblack red green 26 bg antiquewhite1 lty 1 cex 07 lwd 2 Para completarmos a caracterização dessa distribuição apresentamos o Teorema 66 para a espe 119 Teorema 66 Esperança Variância e Desvio padrão da distribuição Poisson Se a variável aleatória X possui distribuição Poisson expressa em 614 então a esperança de X é dada por μX EX λ a variância é dada por σX² VarX λ e o desvio padrão é dado por σX λ Prova A dedução da esperança matemática pode ser apresentada da seguinte forma EX x0 até eλλx x 0 eλλ0 0 x1 até eλλx x Fazendo y x 1 então EX y0 até eλλy1 y 1 y0 até eλλy1 y 1 λ y0 até eλλy y λ A variância pode ser desenvolvida da forma a seguir EX² x0 até x² eλλx x 0² eλλ0 0 x1 até x² eλλx x x1 até x² eλλx x Como VarX EX² EX² então VarX x1 até x² eλλx x λ² fazendo y x 1 então VarX y0 to y 1eλλy1y 1 λ2 y0 to y 1eλλy1y λ2 y0 to eλy 1y y0 to yeλλyy y0 to eλλyy λy0 to eλλyy y0 to eλλyy 1 λA 1 A λ o desvio padrão é dado por σX λ em que concluímos a prova Exemplo 67 Considerando o Exemplo 66 podemos observar que EX 02 falhasm² a variância σ²X 02falhasm²² e desvio padrão σX 02 044721 falhasm² Para o item c desse mesmo exemplo como houve uma alteração espacial do valor médio de falhas então a ideia do cálculo das medidas resumo será a mesma assumindo apenas as medidas com o novo parâmetro isto é λ 03 falhasm² O número de falhas em parágrafos de máquinas da indústria de papéis segue uma distribuição Poisson em que ocorre 02 falhas por metro quadrado da produção a Qual a probabilidade de não ocorrer falha em um metro quadrado de papel b Qual a probabilidade de ocorrer no mínimo 1 erro por metro quadrado de papel c Qual a probabilidade de ocorrer 1 erro por 15 m² Para o primeiro caso a temos PX 0 λeλx 02e020 e02 081873 Usando o R calculamos essa probabilidade usando pois0 02 Para o segundo caso b temos PX 1 1 PX 0 Evento complementar 1 081873 018127 63 Distribuições contínuas de probabilidades Código R 65 Script 1 Triangulo pascal 2 3 Codigo para linhas acumuladas Por exemplo linhas 10 4 imprime as linhas de 1 a 10 do trianbulo de Pascal 5 tpacum functionlinhas 6 lapply0linhas functioni choosei 0i 7 8 9 Codigo para imprimir uma determinada linha do triangulo 10 de Pascal Por exemplo linha 10 imprime apenas a 11 linha 10 12 tpind functionlinha 13 chooselinha 0linha 14 15 16 Gerando os graficos das linhas do triangulo de pascal 17 como barras do gráfico de barras Vamos gerar os graficos 18 n c10 25 50 100 500 1000 19 parmfrow c3 2 20 fori in n 21 x tpindi 22 plotx type h xlab pasteOrdemdoscoeficientesda 23 linha i ylab Valordocoeficiente panelfirst 24 gridcolgray lwd 3 25 Algumas propriedade da densidade da normal podem ser facilmente observadas na Figura 68 que segue i fXx é simétrica em relação a µ ii fXx 0 quando x iii o valor máximo de x se dar para x µ Com relação aos parâmetros percebemos que µ é um parâmetro de escala à medida que se altera esse parâmetro a distribuição se translada em torno do eixo X Figura 69 Já a alteração do parâmetro σ2 proporciona uma alteração na forma da distribuição Figura 610 Por isso que dizemos que σ2 é um parâmetro de forma Uma outra característica interessante na distribuição normal apresenta alguns resultados úteis tais como Pµ σ X µ σ 0 6827 Pµ 2σ X µ 2σ 0 9545 Pµ 3σ X µ 3σ 0 9973 e que podem ser verificados na Figura 611 Para complementar essas características precisamos demonstração que a distribuição normal é uma função densidade de probabilidade pelo Teorema 67 a seguir Teorema 67 Função densidade de probabilidade Normal A distribuição Normal expressa em 618 é uma função densidade de probabilidade 123 Capítulo 6 Distribuições de probabilidades Figura 67 Gráfico de barras dos coeficientes para determinadas linhas do triângulo Pascal Figura 68 Função densidade da distribuição normal tal que X N100 4 124 63 Distribuições contínuas de probabilidades Figura 69 Função densidade da distribuição normal para três variações do parâmetro µ Figura 610 Função densidade da distribuição normal para três variações do parâmetro σ2 125 Conclusões que PX 1 λeλx 03e031 03e03 022224 Usando o R calculamos essa probabilidade dessa forma pois1 03 Usando a técnica do cálculo da integral de coordenadas polares Ver Apêndice C temos y r sin θ w w cos θ Fazendo y² w² r² sin² θ r² cos² θ r²sin² θ cos² θ r² considerando dA r dr dθ e que os intervalos das variáveis r sendo 0 e θ sendo 02π então A² pode ser expresso da seguinte forma A² 0 02π 12π e12 r² dθ dr 0 12π e12 r² dθ dr 12π 0 e12 r θ02π dr 12π e12r2π 12π 0 e12r0dr 0 e12 r dr Faremos um artifício de multiplicar 1 1 1 na expressão que não alterará o resultado ou seja A² 1 0 e12r dr 1 1 0 e12r dr 1 0 1e12r dr Usando mais uma mudança de variável u 12r² e du r dr podemos concluir A² 1 0 eu du eu0 01 1 Se A² 1 então A 1 Assim fica concluído que a distribuição normal é uma função densidade de probabilidade Percebemos que analiticamente o cálculo da probabilidade de X tendo X uma distribuição normal está em uma região da distribuição não é nada fácil Para isso usamos valores tabelados da probabilidade da distribuição normal padrão que é um caso particular da distribuição normal apresentados no Apêndice B e a definição dessa distribuição é apresentada na Definição 65 Definição 65 Distribuição Normal Padrão Uma variável aleatória X contínua tem distribuição normal padrão se sua função densidade de probabilidade é dada por fXx φXx 12π e12x² para x 0 caso contrário Em notação X N01 representa que X tem distribuição Normal Padrão Como consequência se provamos que uma distribuição normal é uma função densidade de probabilidade para qualquer valor assumidos pelos parâmetros pelo Teorema 67 segue que a distribuição normal padrão também é uma função densidade de probabilidade A função de distribuição de uma normal padrão denotamos por ΦXx tal que ΦXx x φXtdt Para realizar a transformação de uma variável com distribuição normal para uma variável aleatória com distribuição normal padrão apresentamos o Teorema 68 Teorema 68 Transformação de X Nμσ² para Z N01 Considerando X Nμσ² então a transformação Z X μσ tem distribuição normal padrão isto é segue Z N01 Para a prova do Teorema 68 precisamos de algumas informações adicionais como o Jacobiano da transformação que para esse momento se torna um assunto mais complexo Contudo iremos abordar assuntos como esse na seção Aprofundamento do presente capítulo Para tanto vamos tomar como verdade que a transformação Z terá distribuição normal e que a esperança e variância são respectivamente μZ EZ E X μσ 1σ EX μ EX μσ 0 e σ²Z VarZ Var X μσ VarXσ² VarX σ²σ² 1 Esses resultados são consequências das propriedades da expectativa e variância apresentadas na seção 511 do Capítulo 5 bem como o seguinte Teorema 69 apresentado a seguir Teorema 69 Esperança Variância e Desvio padrão da distribuição Normal Se a variável aleatória X possui distribuição Normal expressa em 618 então a expectativa de X é dada por μX EX μ a variância é dada por σ²X VarX σ² e o desvio padrão é dado por σX σ Prova A esperança pode ser deduzida da seguinte forma EX x fxdx x 1σ2π e12xσ² dx fazendo uma mudança de variável y xμμ x yσ μ e du 1σdx dx σdy então EX yσ μσ2π e12y² dy yσ μ2π e12y² dy yσ2π e12y² dy μ2π e12y² dy σ2π y e12y² dy μ 12π e12y² dy σ2π y e12y² dy μ A y e12y² dy Algo interessante acontece com a integral y e12y² dy Observe graficamente a seguir Como A B a integral se anula por simetria Assim EX σ2π 1 e12y² dy μ μ A variância será deduzida a seguir EX² x² 1σ2π e²¹2 xµσ² dx usando a mudança de variável y x µσ x µ σy e dy 1σdx dx σdy então EX² µ σy² e²¹2y² 2π dy µ² 2µσy σ²y² e²¹2 2π dy µ²2π e²¹2y² dy 2µσy2π e²¹2y² dy σ²y²2π e²¹2y² dy µ² 12π e¹2y² dy 2µσ y2π e¹2y² dy σ²y²2π e¹2y² dy A primeira integral da expressão de EX² é igual a 1 como provado pela expressão 619 uma distribuição normal com parâmetros µ 0 e σ 1 A segunda integral foi mostrado pela figura anterior que a integral se anula por simetria Agora a terceira integral pode ser observado o gráfico abaixo mostrando que é uma função par simétrica no eixo y A B ou seja Área A B A A 2A e portanto y²e²¹2y² dy 2 ₀ y²e²¹2y² dy Assim EX² µ² 2 ₀ σ²2π y²e²¹2y² dy fazendo uma mudança de variável z y²2 y 2 e dz dy dy dzy temos EX² µ² 2σ² ₀ 2σ²e²¹22π e²¹2dz2 EX² µ² 2σ²2π ₀ z¹²e²¹2dz sabendo que 2 2 2 e z 2 z então EX² µ² 2σ²2π ₀ 22 z e²¹2dz2 z µ² 2σ²π ₀ zπ e²¹2dz A função gama é definida por Γt ₀ xt1exdx t 0 Reescrevendo 12 32 1 então EX² µ² 2σ²π ₀ z³²ezdz µ² 2σ²π Γ32 Como a VarX EX² E²X então VarX µ² σ² µ² σ² O desvio padrão é dado por σX σ² σ o que conclui a prova PX 102 P Xµσ 1021002 PZ 1 Pelo Apêndice B usando a tabela devida podemos chegar ao resultado PX 102 PZ 1 0158653 como pode ser complementado pela Figura 612 Figura 612 Gráfico da equivalência do cálculo das probabilidades entre a distribuição normal e normal padrão Dissemos anteriormente que devemos usar as tabelas devidas da distribuição normal padrão uma vez que apresentamos três tipos de tabelas no Apêndice B a primeira tabela desse apêndice representa o cálculo das probabilidades para PZ z a segunda tabela para P0 Z z e a terceira tabela para PZ z Antes de apresentarmos como determinar as probabilidades na tabela normal padrão devemos observar que o fato da distribuição normal ser simétrica em torno de µ então PX µ PZ 0 12 PX µ PZ 0 Outra coisa interessante é que PZ z PZ 0 P0 Z z 05000 P0 Z z Desse modo podemos determinar a probabilidade PX 102 PZ 1 usando a tabela da probabilidade devida como Tabela para PZ z Z 015 10 012507 Capítulo 6 Distribuições de probabilidades Por fim para obter o mesmo resultado podemos utilizar a tabela da normal padrão para PZ z da seguinte forma Tabela para PZ z Z 004 14 092507 Logo PZ 1 44 1 PZ 1 44 1 0 92507 0 07493 como pode ser observado no gráfico abaixo 134 64 Exercícios 64 Exercícios Exercício 61 Defina variável aleatória VA variável aleatória discreta VAD variável aleatória contínua VAC e descreva diversos exemplos na sua área de estudo Solução na página 225 Exercício 62 Suponha que 2 dos itens produzidos por uma fábrica sejam defeituosos Encontre a probabilidade P de existirem 3 defeituosos em uma amostra de 100 Solução na página 225 Exercício 63 Usando a curva normal padronizada determinar as áreas subtendidas entre os valores abaixo com representação gráfica 1 035 e 00 2 00 e 152 3 034 e 19 4 à direita de 191 5 à esquerda de 113 6 à esquerda de 213 Solução na página 225 Exercício 64 Dada uma distribuição normal com µ 40 e σ 6 calcular 1 PX 33 2 PX 29 3 P39 X 45 4 Ponto que tem 58 de área acima dele 5 Ponto que tem 5 de área acima 6 PZ 0 Solução na página 226 Exercício 65 Em um exame vestibular de matemática as notas distribuíramse normal mente com média 6 o desvio padrão 15 Calcular o número de aprovados entre os 120 candi datos sabendose que a nota mínima de aprovação é 5 Solução na página 227 Exercício 66 Uma máquina de empacotar determinado produto apresenta variação de peso com desvio padrão de 20g Em quanto deve ser regulado o peso médio do pacote para que apenas 10 tenham menos de 400g Super distribuição normal dos pesos dos pacotes Solução na página 227 135 Capítulo 6 Distribuições de probabilidades Exercício 67 Na 1ª prova de Estatística a média foi 45 e o desvio padrão 23 Considerando o método científico de aprovação Conceito A nota média µ σ Conceito B µ média µ σ Conceito C µ σ média µ Conceito D média µ σ a Quantos alunos receberam cada um dos conceitos b Quantos alunos foram aprovados Conceito A B e C c Quantos alunos foram aprovados com distinção média µ 2σ d Considere o método comum de aprovação X 5 0 quantos foram reprovados OBSERVAÇÃO 100 alunos fizeram essa prova Solução na página 227 Exercício 68 Ao investir num determinado negócio um cidadão pode ter um lucro anual de US 60000 com probabilidade 03 ou tomar um prejuízo de US 20000 com probabilidade 07 Qual é a sua esperança matemática Solução na página 228 Exercício 69 Considere que existem defeitos aleatórios na superfície de um chip semicon dutor e o fabricante informa que 5 de sua produção apresenta defeito Desse modo em uma amostra de 35 chips qual a probabilidade de encontrarmos a nenhum defeito b apenas um defeito c não mais que um defeito d acima de dois defeitos Solução na página 228 Exercício 610 Considere uma avaliação de câmeras de uma determinada marca de celular e que 85 dessas câmeras passaram no teste de avaliação de modo que os celulares foram avaliados de modos independente Qual o tamanho da amostra necessário para que a proba bilidade de no mínimo uma câmera não tenha passado no teste seja no mínimo de 90 Solução na página 228 Exercício 611 Considere que o número de alterações em uma página web de entretenimen tos seja modelada por uma distribuição de Poisson e que ocorre em média 030 alterações por dia a Qual a probabilidade de que não haja alterações em um dia b Qual a probabilidade de ocorra mais do que uma alteração em 8 horas 136 64 Exercícios c Qual a probabilidade de ocorrer no máximo duas alterações em 2 dias d Qual o valor esperado dessas alterações por dia E a variabilidade dessas alterações em torno de 030 alterações por dia Solução na página 229 Exercício 612 A probabilidade de um consumidor responder ao questionário de grau de satisfação em um site de compras após a finalização da compra é de 5 Considerando que 100 consumidores apresentam comportamentos independentes quanto ao interesse pe las compras nesse site determine a nenhum consumidor responder ao questionário b mais de cinco consumidores responderem ao questionário c exatamente 15 pessoas responderem o questionário d a esperança de X e a variância e o desvio padrão de X Solução na página 230 Exercício 613 Considere o sistema de segurança de acesso a conta de usuários de um de terminado banco por meio de uma senha de 6 dígitos com 26 caracteres az ou números 09 Um hacker tentou invadir o sistema e com informações previlegiadas percebeu algumas informações sobre as senhas de clientes I Alguns clientes da carteira do banco apresentavam senhas com cinco letras e um nú mero II Alguns clientes da carteira do banco apresentavam senhas com quatro letras seguidas por dois números Com isso indagamos a foi selecionado ao acaso 10 clientes qual a probabilidade de 2 clientes apresentarem senhas do tipo I b foi selecionado ao acaso 15 clientes qual a probabilidade de nenhum cliente apresentar senha do tipo II Solução na página 230 137 Capítulo 7 Amostragem Em desenvolvimento 71 Introdução A amostragem já é utilizada no nosso dia a dia inconscientemente Quando preparamos uma refei ção e vamos provála antes de servila estamos na realidade fazendo uma amostragem ao passo que a refeição representa o todo população e a parte retirada para provar se a refeição estava pronta para servila é a amostra Dessa forma queremos por meio de uma amostra saber algumas carac terísticas parâmetro sobre a população As medidas obtidas da amostra com as quais nos indicam alguma característica da população chamamos de estimador Com base nisso para obtermos bons estimadores precisamos garantir antecipadamente que a amostra coletada da população represente a população de modo a preservar as características relevantes Porém o uso inadequado dos métodos de amostragem podem nos levar a equívocos como os encontrados por Lohr 2019 no livro de Hite 1987 do qual ela apresentou os seguintes resultados 84 das mulheres não estão satisfeitas emocionalmente com seus relacionamentos 70 de todas as mulheres casadas há cinco ou mais anos fazem sexo fora de seus casamentos 95 das mulheres relatam formas de assédio emocional e psicológico de homens com quem mantêm relacionamentos amorosos 84 das mulheres relatam formas de condescendência dos homens em seus relacionamentos amorosos Dessa forma para que não cometamos viéses nos resultados como os encontrados por Hite 1987 precisamos entender os princípios básicos da Teoria de Amostragem Algo interessante ocorre nos livros de Estatística básica que apresentam de forma muito introdutória essa teoria Nos livros sobre inferência toda a teoria se baseia nas informações sobre uma amostra Entretanto em muitos desses livros em nada se discute como essa amostra é obtida apenas é assumido que as observações foram obtidas de forma independente e com igual probabilidade de uma determinada população Com essa motivação nos materiais didáticos presentes na literatura pretendemos nesse capítulo apresentar a Teoria de Amostragem dando um maior detalhamento teórico e prático Definição 71 População ou População alvo O conjunto de elementos ou unidade de observação para os quais desejamos que as con clusões de uma pesquisa sejam válidas com a restrição de que esses elementos possam ser observados ou mensurados sob as mesmas condições é chamado de população universo ou população alvo O número total de elementos representa o tamanho da população denotado por N A população pode ser formada por pessoa famílias estabelecimentos industriais ou qualquer tipo de elementos dependendo basicamente dos objetivos da pesquisa Podemos dizer ainda que uma população pode ser finita ou infinita Uma população é finita quando se consegue enumerar todos os elementos que a formam Referese a um universo limitado em uma dada unidade de tempo Como exemplo podemos dizer que a quantidade de automóveis produzidos em um mês a população de uma cidade o número de alunos de uma sala de aula são exemplos de população finita Uma população é dita infinita quando não podemos enumerar todos os elementos Referese 138 71 Introdução a um universo não delimitado Os resultados cara ou coroa obtidos em sucessivos lances de uma moeda o conjunto dos números inteiros reais ou naturais são exemplos de população infinita Na realidade a identificação de uma população depende dos objetivos de uma pesquisa ver Subseção 121 E isso é algo crucial e um processo extremamente oneroso Para isso precisamos de algumas outras definições Considerando uma primeira definição sobre uma amostra apresentada na Definição 17 Definição 72 População amostral O conjunto de unidades de observação Uma outra característica interessante da população é que as unidades de observação nem sempre são individualizados Exemplo 71 Problema prático para população Definição 73 Elemento unidade ou unidade elementar Indivíduo ou objeto a ser medido ou observado na pesquisa do qual é a entidade portadora de informações que pretendese coletar é chamado de unidade elementar UE Um outro tipo de elemento da população é a unidade amostral Definição 74 Unidade amostral Um conjunto formado por uma unidade elementar ou várias unidades elementares do qual seja de interesse para pesquisa é chamada de unidade amostral UA Exemplo 72 Uma unidade amostral pode ser os conclomerados pelo método de amostragem por conglomera dos Exemplos de conglomerados são quarterões ruas departamentos prateleiras caixas lotes de produtos etc O interesse na pesquisa está em determinar características da população relevantes para o es tudo Definimos Definição 75 Parâmetro Qualquer característica atribuída a população é chamada de parâmetro Exemplo 73 Numa pesquisa epidemiológica a população pode ser definida como todas as pessoas unidade elementar da região em estudo no momento da pesquisa Um parâmetro de interesse pode ser a porcentagem de pessoas contaminadas Como nem sempre é possível coletar informações de todas as unidades elementares da popula ção fazse necessário retirarmos informações sobre uma parte da população acessível e assim por meio destas informações consigamos obter informações sobre o parâmetro de interesse na pesquisa Definição 76 Amostragem O mecanismo técnica que consistem em selecionar parte de uma população para observar de modo que seja possível preservar as principais informações sobre toda a população 139 Capítulo 7 Amostragem Em desenvolvimento A parte da população chamamos de amostra Definição 77 Amostra Qualquer subconjunto da população obtido por meio de um processo de seleção adequado é chamado de amostra O tamanho da amostra será representado por n Dizemos que quando uma amostra preserva as principais características de uma população diz se que esta é uma amostra representativa Quão mais próximo n estiver de N mais representativo será esta amostra de tamanho n As informações obtidas por meio de uma amostra são chamadas de estatísticas Quando uma estatística estima um parâmetro da população temos um estimador Definição 78 Estimador Um estimador é uma medida função da amostra estatística que representará o parâmetro desconhecido da população Exemplo 74 Uma pesquisa deseja saber a altura dos estudantes de uma determinada universidade Se usarmos uma medida de tendência central para representar a altura dos estudantes poderíamos escolher a média Logo um parâmetro para a população é µ a média populacional Geralmente µ ou qualquer outro parâmetro é desconhecido então como estimador para µ podemos considerar X a média amostral Observe que este estimador é função da amostra Dizemos que o resultado de um estimador é a estimativa A estimação nada mais é do que criarmos mecanismos para estrapolar as medidas amostrais para que estas possam representar os parâmetros desconhecidos Como o estimador é função da amostra se esta não é representativa com certeza estaremos comentendo algum erro em afirmar que esse estimador poderia representar o parâmetro desconhecido Daí a importância de obtermos metodologias para coletar amostras representativas da população Definição 79 Erro amostral O erro amostral é a diferença entre a estimativa e o parâmetro que se quer estimar Esse erro reflete a tendência da amostra Querendo ou não o fato de já tomarmos decisão com base em uma amostra já estamos cometendo erro Contudo o que a estatística tenta mostrar por meio da amostragem é que podemos tomar conclusões com base em uma amostra sobre a população de modo a cometer o mínimo de erro amostral possível Assim dizemos que o objetivo da pesquisa amostral será conhecer características sobre a população pesquisando estudando a amostra de modo a cometer o mínimo de erro amostral possível Se a pesquisa envolve a observação de todas as unidades da população o método de pesquisa é denominado censo ou pesquisa exaustiva Se é conduzida sobre uma amostra da população o método de pesquisa é denominado levantamento por amostragem O censo somente é aplicável na situação que a população seja finita e suas unidades sejam identificáveis e disponíveis para a coleta da amostra Por essa razão o levantamento por amostragem é muito mais frequentemente utilizado Por que fazer amostragem ao invés de um censo Vantagens Pesquisa por amostragem em relação ao censo É mais barata É mais rápida É mais fácil de ser controlada por envolver operações menores 140 71 Introdução Desvantagens Pesquisa por amostragem em relação ao censo O censo pode ser mais vantajoso quando a população é pequena eou as informações são de fácil obtenção Os resultados da pesquisa por amostragem contém erros amostrais Se a população for muito heterogênea o erro pode ser muito grande dependendo do método de amostragem que seja utilizado Numa fase inicial dos levantamentos amostrais é necessário formular o problema e aventar hi póteses sobre o objeto de estudo ou expectativas sobre os possíveis resultados Ainda nessa fase inicial o investigador deve definir a população de estudo parte identificável e acessível da popula ção objeto os objetivos e as variáveis observadas Numa segunda etapa é realizado o planejamento elaborado o plano de amostragem ou determinando o caminho a ser percorrido para atingir os ob jetivos propostos O plano de amostragem devem ter bem definidos 1 Unidade amostral indivíduos ou grupos de indivíduos conglomerados 2 Sistema de referência lista completa das unidades amostrais 3 Tamanho da população N é definido pelo número de indivíduos da população objetivo 4 Tamanho da amostra n definido pelo número de indivíduos selecionados na amostra tal que n N Os planos ou métodos de amostragem podem ser classificados em amostragem probabilística e amostragem não probabilística Dizemos que se um método de amostragem é objetivo e estabe lece uma probabilidade conhecida a cada unidade da população objetivo ser incluída na amostra esse é denominado amostragem probabilística ou amostragem aleatória caso contrário é denomi nado não probabilística ou amostragem não aleatória Os principais esquemas amostrais podem ser observados na Figura 71 Figura 71 Métodos de amostragem probabilística e nãoprobabilística 141 Capítulo 7 Amostragem Em desenvolvimento 72 Amostragem nãoprobabilística e probabilística Nas aulas em sala explanamos sobre os métodos de amostragem probabilística Iremos falar sobre os métodos de amostragem nãoprobabilística O primeiro método é a amostragem a esmo Imagine uma caixa com 1000 parafusos A enume ração destes parafusos ficaria muito difícil e a amostragem aleatória simples se tornaria inviável Então em situações deste tipo supondo que a população de parafusos seja homogênea escolhemos a esmo a quantidade relativa ao tamanho a amostra Quanto mais homogênea for a população mais podemos supor a equivalência com uma amostragem simples ao acaso Desta forma os parafusos escolhidos para compor a amostra de um determinado tamanho sem nenhuma norma ou a esmo Por isso do nome ao método de amostragem Outro método é a amostragem intencional que corresponde àquela em que o amostrador de liberadamente escolhe certos elementos para pertencer à amostra por julgar tais elementos bem representativos da população Um exemplo deste tipo de amostragem corresponde à situação em que deseja saber a aceitação em relação a uma nova marca de um determinado produto a ser inse rida no mercado de uma cidade Somente entrarão para compor a amostra pessoas que façam uso do produto e que tenham condições financeiras de comprar esta nova marca classe social de maior poder aquisitivo O último método falado é a amostragem por cotas Nesse tipo de amostragem a população é dividida em grupos e selecionase uma cota proporcional ao tamanho de cada grupo Entretanto dentro de cada grupo não é feito sorteioe sim os elementos são procurados até que a cota de cada grupo seja cumprida Em pesquisas eleitorais a divisão de uma população em grupos conside rando por exemplo o sexo o nível de escolaridade a faixa etária e a renda pode servir de base para a definição dos grupos partindo da suposição de que estas variáveis definem grupos com comportamentos diferenciados no processo eleitoral 73 Técnicas de amostragem probabilística Em sala de aula 142 Capítulo 8 Distribuição de amostragem 81 Introdução 82 Distribuição de amostragem da média 83 Distribuição de amostragem de proporções 84 Distribuição de amostragem de diferença entre médias 85 Distribuições amostrais quiquadrado t e F 143 Capítulo 9 Teoria da estimação 91 Introdução Chegamos em um dos momentos mais importantes do nosso estudo que consiste em uma tomada de decisão sobre a população a partir dos dados Isso é que falamos anteriormente na extrapolação da informações contida nos dados amostrais para a população em estudo Para isso identificamos inicialmente o modelo estatísticoprobabilístico que caracteriza as variávelis em estudo Con tudo sabemos que esses modelos dependem de características populacionais parâmetro que na maioria dos casos é desconhecida Desse modo se considerarmos que um ruído de um sinal di gital segue uma distribuição normal tal que um ruído ocorre quando a voltagem da transmissão não excede 0 92 volts estamos limitados na chance de um determinado sinal digital não ter envi ado nada porque apesar de sabermos a distribuição do ruído não temos informações sobre os seus parâmetros Uma saída será encontramos características funções da amostra e que estas possam representar os parâmetros desconhecidos A forma de encontrarmos as funções amostrais estima dores é a área da inferência estatística ou estatística inferencial 92 Conceitos básicos Assumimos X1 X2 Xn uma amostra aleatória com função densidade de probabilidade fdp ou função de probabilidade fp fXx θ em que a forma de fXx θ é conhecida mas o parâmetro θ é desconhecido Até agora usamos a notação pX para denotar a função de probabilidade e fXx para denotar a função densidade de probabilidade Por questão de simplificação podemos usar apenas a notação fXx ou fXx θ para representar qualquer uma das funções Esta última ainda acrescemos a dependência que essas funções têm de seus parâmetros e que representa o objetivo de estudo do presente capítulo Considere o termo amostra aleatória como um conjunto de variáveis aleatórias independentes e identicamente distribuídas iid e que em notação temos X iid fXx θ Ainda podemos assumir que θ pode ser um vetor de parâmetros θ θ1 θ2 θk Considere Θ o espaço paramétrico denotando o conjunto dos possíveis valores que o parâmetro θ pode assumir O objetivo é encontrar funções da amostra X1 X2 Xn para serem usadas como estimadores de θj j 1 2 k Ou mais geral nosso objetivo será tentar encontrar estimadores de certas funções ditas τ1θ τ2θ τrθ de θ θ1 θ2 θk O ramo da estatística do qual buscamos essas funções da amostra é a inferência estatística Definição 91 Inferência estatística Seja uma amostra aleatória X1 X2 Xn com função densidade de probabilidade fdp ou função de probabilidade fp fXx θ em que o parâmetro θ Θ é desconhecido Chamamos de inferência estatística o problema que consiste em especificar um ou mais valores para θ baseado em um conjunto de valores observados x1 x2 xn de X1 X2 Xn 144 93 Estimação pontual Definição 92 Estatística Seja uma amostra aleatória X1 X2 Xn com fdp ou fp fXx θ com θ Θ em que Θ é o espaço paramétrico Então qualquer função do tipo T tX1 X2 Xn que não depende de θ é chamado de estatística Entendemos que o espaço paramétrico é o conjunto de todos os possíveis valores assumidos a um determinado parâmetro Algumas estatísticas conhecidas são X S2 X1 Xn Xn X1 XS2 Então a afirmação não depender de θ significa que θ X não é uma estatística Entretanto as estatísticas têm distribuições que podem depender do parâmetro θ desconhecido do qual pode ser observado no Exemplo 91 Exemplo 91 Estatística e sua distribuição Consideremos uma população com distribuição normal de parâmetros µ e σ2 tal que a variável aleatória de interesse pode ser representada em notação X Nµ σ2 Então dada uma amostra aleatória X1 X2 Xn e uma estatística X n i1 Xin pois X depende apenas da amostra mas a sua distribuição tal que X Nµ σ2n depende de parâmetros A seguir iremos apresentar dois tipos de estimadores para representar parâmetros desconheci dos dos quais apresentam aplicações das mais diversas possíveis 93 Estimação pontual A necessidade de encontrarmos estimadores para determinados parâmetros se deve a diversas apli cações Por exemplo os estimadores apresentados até agora nos informam um ponto amostral es timador que representará um ponto populacional parâmetro A este denominamos de estimador pontual formalizado na Definição 93 Definição 93 Estimador pontual Qualquer estatística cujos valores são usados para estimar τθ em que τ é alguma função do parâmetro θ é definida ser um estimador pontual de τθ Fazemos a distinção entre estatística e estimador para chamar a atenção que um estimador deve ser alguma função que esteja relacionado ao parâmetro de interesse Por exemplo se desejamos encontrar um estimador para a média populacional µ em uma amostra dessa população podemos obter diversas estatísticas X S2 S dentre outras Porém é intuitivo percebermos um estimador para µ dentre esses citados é a média amostral X uma vez que a característica de interesse popula cional é uma medida de posição Um estimador é sempre uma estatística que é uma função de uma amostra aleatória e que por tanto também é uma variável aleatória Porém uma estatística nem sempre é um estimador para um parâmetro de interesse Usaremos como notação ˆθ para representar um estimador de θ ou mais geral ˆθ1 ˆθ2 ˆθk é um vetor de estimadores de θ1 θ2 θk Diremos também que o valor do estimador é chamado de estimativa pontual Exemplo 92 Considere o tempo de vida útil de uma certa bateria automotiva de uma determinada marca do qual retirouse uma amostra de três baterias cujos valores foram X1 1 ano X2 1 6 anos e X3 1 4 anos Então em busca de saber a média µ do tempo de vida útil da bateria dessa marca é intuitivo pensar na média amostral X 1 33 anos como um valor plausível para representar o parâmetro µ desconhecido com base nas informações disponíveis na amostra Assim o estimador para µ é X e 1 33 anos é sua estimativa 145 Capítulo 9 Teoria da estimação Como observado no Exemplo 92 a estimativa representa o valor observado do estimador X Muito embora as funções de parâmetros são funções identidades desses parâmetros em algumas situações podemos estar interessados em estimadores pontuais de funções de parâmetros como apresentado no Exemplo 93 Exemplo 93 Considere uma amostra aleatória X1 X2 Xn de uma população Bernoulli de parâmetro p Considerando que τp p1 p que representa a variância de X e que é uma função do parâmetro p então um estimador poderia ser τ ˆp ˆp1 ˆp em que ˆp X Apesar de intuitivo pensarmos na média amostral como um estimador para a média populacio nal existem métodos de como obter estimadores pontuais abordados a seguir 931 Métodos para obtenção de estimadores pontuais Apesar de existir diversos métodos de obtenção de estimadores pontuais iremos apresentar três métodos largamente utilizados na teoria da Estimação que são método dos momentos método da máxima verossimilhança e método dos mínimos quadrados Inicialmente iremos apresentar como obter um estimador pontual por meio do método dos momentos Para isso definimos pela Definição 94 o que é um momento amostral a seguir Definição 94 Momentos amostrais Seja uma amostra aleatória X1 X2 Xn com fdp ou fp fXx θ com θ θ1 θ2 θk Θ em que Θ é o espaço paramétrico O késimo momento amostral denotado por Mk é definido por Mk 1 n n i1 Xk i 91 e o késimo momento amostral em torno da média amostral X denotado por M k é definido por M k 1 n n i1 X Xk 92 Também para entendermos o método dos momentos precisamos definir um momento popula cional apresentado na Definição 95 na sequência Definição 95 Momentos populacionais Seja uma amostra aleatória X1 X2 Xn com fdp ou fp fXx θ com θ θ1 θ2 θk Θ em que Θ é o espaço paramétrico O késimo momento populacional denotado por µk é definido por µk EXk 93 e o késimo momento populacional em torno da média populacional µ EX denotado por µ k é definido por µ k EX µk 94 Geralmente µk ou µ k é uma função conhecida e função dos k parâmetros θ1 θ2 θk Portanto poderíamos reescrever µk µkθ1 θ2 θk e µ k µkθ1 θ2 θk 146 93 Estimação pontual Definição 96 Método dos momentos O método dos momentos consiste em igualar 91 e 93 ou 92 e 94 isto é Mj µj ˆθ1 ˆθ2 ˆθk para j 1 2 k 95 ou M j µ j ˆθ1 ˆθ2 ˆθk para j 1 2 k 96 e obter a solução para as k equações Diremos que ˆθ1 ˆθ2 ˆθk são os estimadores EMM de θ1 θ2 θk pelo método dos momentos Por fim para complementar o método dos momentos apresentamos uma sequência de exemplos de como se obter um estimador pontual Exemplo 94 Seja uma amostra aleatória X1 X2 Xn de uma normal com média µ e variância σ2 Denote θ1 θ2 µ σ2 Estimando os parâmetros µ e σ2 pelo método dos momentos igualamos M1 1 n n i1 Xi X µ1 EX µ X µ Igualando o segundo momento usando 92 e 94 temos M 2 1 n n i1 Xi X2 µ 2 EX µ2 ˆσ2 Assim os estimadores de µ e σ2 pelo método dos momentos são ˆµ X e ˆσ2 1 n n i1Xi X2 Exemplo 95 Seja uma amostra aleatória X1 X2 Xn de uma distribuição Poisson com parâmetro λ Há somente um parâmetro então há somente uma equação que é M1 1 n n i1 Xi X µ1 EX λ X λ Então o estimador de λ pelo método dos momentos é ˆλ X Exemplo 96 Seja uma amostra aleatória X1 X2 Xn de uma distribuição exponencial com densidade fXx θ θeθxI0x O estimador pelo método dos momentos é M1 1 n n i1 Xi X µ1 EX 1 θ X 1 θ Assim ˆθ 1 X 147 Capítulo 9 Teoria da estimação O outro método apresentado é o da máxima verossimilhança Inicialmente definimos uma fun ção de verossimilhança apresentada na Definição 97 Definição 97 Função de Verossimilhança Seja uma amostra aleatória X1 X2 Xn com fdp ou fp conjunta fXx θ com θ Θ em que Θ é o espaço paramétrico Considere ainda x1 x2 xn a realização da amostra aleatória X1 X2 Xn então a função de verossimilhança é definida por Lθ x1 x2 xn Lθ x fXx θ n i1 fXxi θ 97 Na sequência Definição 98 apresentamos o método da máxima verossimilhança Definição 98 Método da máxima Verossimilhança Seja uma função de verossimilhança Lθ x1 x2 xn Definição 97 para uma amostra ale atória X1 X2 Xn Então o método da máxima verossimilhança é a forma de encontrar um ˆθ ϑx1 x2 xn uma função das observações x1 x2 xn que é o valor estimado de θ Θ que maximiza Lθ x1 x2 xn Dizemos que ˆθ ϑX1 X2 Xn é o estimador de máxima verossimilhança EMV de θ Para maximizar Lθ x1 x2 xn tomamos a sua derivada em relação a θ igualamos a zero e resolvemos o sistema para obtenção de ˆθ ϑX1 X2 Xn Posteriormente devemos identificar se a segunda derivada de Lθ x1 x2 xn é negativa para saber se ˆθ é um ponto de máximo Mui tas vezes esse processo tornase complicado Uma solução é usar a função de Logverossimilhança apresentada na Definição 99 Definição 99 Função de Logverossimilhança Se Lθ x1 x2 xn expressão 97 é a função de verossimilhança então lθ x lθ x log Lθ x 98 é a função de logverossimilhança para x x1 x2 xn Como a função logaritmo é monótona crescente então lθ x e Lθ x levam ao mesmo máximo de θ Se denotarmos hθ Lθ x e gy logy temos 0 d dθ g hθ ghθhθ hθ hθ logo as raízes dessa expressão são as mesmas que hθ 0 Assim como é mais fácil fazer mani pulações algébricas com a função logaritmo o problema antes intratável agora pode ser resolvido Exemplo 97 EMV de µ de uma normal Seja uma amostra aleatória X1 X2 Xn de uma normal com média µ e variância 1 Vamos determinar o estimador do parâmetro µ pelo método de máxima verossimilhança A função de 148 lμ x logi1n 1 2π ey μ² 2σ² log 1 2πn 2 ei1n xi μ² 2 n 2 log1 2π i1n xi μ² 2 lp x logi1n pxi 1 p1 xi pΣi1n xi 1 pΣi1n 1 xi pΣi1n xi 1 pn Σi1n xi segue lp y log n y k pΣkj1 yj 1 pnk Σkj1 yj k log n y log p Σkj1 yj nk Σkj1 yj log1 p 910 Derivando 910 em relação a p e igualando a zero temos 0 Σkj1 yj p nk p Σkj1 yj 1 p 1 p Σkj1 yj p nk p p Σkj1 yj p 1 p 1 p Σkj1 yj nk p p Σkj1 yj Σkj1 yj nk p Logo p gn Verificando se p é um ponto de máximo calculamos a segunda derivada da função de logverossimilhança com relação a p isto é d2lpy dp2 Σkj1 yj p2 nk Σkj1 yj 1 p2 0 uma vez que 0 p 1 0 Σkj1 yj nk Considerando que p é um ponto de máximo logo p Ŷn é um estimador de máxima verossimilhança Sendo p Xj Σmi1 Xij n Yj ni j 1 2 k para jésima amostra de uma população Bernoulli de parâmetro p Logo temos que o estimador de máxima verossimilhança de p de uma população Binomial encontrado nesse exercício pode ser reescrito como p Ŷn 1nk Σkj1 Yj 1k Σnj1 Xji 1nk Σkj1 n Σni1 Xij 1k Σni1 Xji em que o estimador de máxima verossimilhança de p de uma Binomial é a média dos estimadores das k amostras de tamanho n de uma distribuição Bernoulli Capítulo 9 Teoria da estimação Definição 910 Modelo de Regressão Linear Simples MRLS Seja uma variável aleatória Y e X1 X2 Xn um conjunto de variáveis regressoras então a relação Yi β0 β1Xi εi i 1 2 n 911 é chamada de Modelo de Regressão Linear Simples MRLS sendo βj R para j 0 1 com p p 1 parâmetros desconhecidos do MRLS e ε é o erro aleatório não observável Observamos que a relação entre X e Y não é uma reta perfeita devido a adição de ϵ que repre senta a variável erro Isso porque ao coletarmos os dados sempre incorremos em erros de mensu ração seja pela natureza da própria variável seja pelos instrumentos de medida Desse modo surge o método dos mínimos quadrados dos erros como forma de determinar os es timadores dos parâmetros de modelos lineares de tal modo que os estimadores desses parâmetros representam a solução do sistema de equações normais Dito isso o que desejamos pelo método dos mínimos quadrados é determinar estimadores para β0 e β1 sendo apresentado por meio do Teorema 91 a seguir Teorema 91 Estimador de mínimos quadrados de MRLS Seja o modelo expresso em 114 apresentado na Definição 114 então os valores ˆβ0 e ˆβ1 que minimizam n i1 ε2 i n i1Yi β0 β1Xi2 é igual a ˆβ0 Y ˆβ1X 912 e ˆβ1 n i1 YiXi n i1 Yi n i1 Xi n n i1 X2 i n i1 Xi2 n 913 respectivamente Então ˆβ0 e ˆβ1 são os estimadores de mínimos quadrados de β0 e β1 respec tivamente Prova Seja εi Yi β0 β1Xi a partir da expressão 114 então para minimizar a soma de quadra dos dos erros ao longo de todos os n pares Xi Yi temos Q n i1 ε2 i n i1 Yi β0 β1Xi2 Derivando Q em relação aos parâmetros β0 e β1 e igualando a zero as funções resultantes obtemos assim os estimadores de mínimos quadrados Assim Q β0 2 n i1 Yi β0 β1Xi Q β1 2 n i1 Yi β0 β1XiXi 152 Igualando a zero teremos o que chamamos de sistema de equações normais SEN Assim 2 Σni1 Yi β0 β1 Xi Xi 0 2 Σni1 Σni1 Yi nβ0 β1 Σni1 Xi 0 Σni1 Yi nβ0 nβ1 Σni1 Xi n Σni1 Xi e 2 Σni1 Yi β0 β1 Xi Xi 0 n Σni1 Yi Xi β0 Σni1 Xi β1 Σni1 X2i n Σni1 Yi Xi As equações 116 e 117 forma o SEN nβ0 β1 Σni1 Xi Σni1 Yi β0 Σmi1 Xi β1 Σni1 X2i Σni1 Yi Xi Isolando β0 na primeira equação do SEN temos nβ0 β1 Σni1 Xi n Σni1 Yi nβ0 Σni1 Yi β1 Σni1 Xi β0 Σni1 Yi n β1 Σni1 Xi n β0 Ŷ β1 X Substituindo esse resultado na segunda equação do SEN temos Ŷ β1 X Σni1 Xi β1 Σni1 X2i n Σni1 Yi Xi Σni1 Yi Σni1 Xi n β1 Σmj1 Xj Σni1 Xi Σni1 Yi Xi Σni1 Yi Xi portanto o modelo estimado é dado por Ŷ β0 β1 X 916 Capítulo 9 Teoria da estimação Desse modo por meio do Teorema 91 obtemos o modelo estimado da relação entre X e Y dado por ˆYi ˆβ0 ˆβ1Xi 932 Propriedades de um estimador pontual Após apresentar alguns métodos de estimação pontual de parâmetros nos perguntamos qual dos estimadores de θ é o melhor Sabemos que muitos desses métodos apresentam os mesmos esti madores para um determinado parâmetro ver Exemplos 94 e 97 Outros apresentam resultados completamente diferentes Assim precisamos de algum critério que possa nos informar qual dos estimadores é o que melhor estima θ Para uma amostra aleatória X1 X2 Xn com fdp ou fp fXx θ fXx θ com θ Θ em que Θ é o espaço paramétrico poderíamos obter uma escolha inicial do melhor estimador T tX1 X2 Xn de τθ com base na Definição 911 apresentada a seguir Definição 911 Estimador nãoviesado Um estimador T tX1 X2 Xn é definido um estimador nãoviesado de τθ se e so mente se EθT EtX1 X2 Xn τθ θ Θ 917 94 Estimação por intervalo Na estimação pontual não temos a ideia da margem do erro que é cometido ao estimarmos o parâ metro A estimação intervalar visa preencher esta lacuna criando um intervalo de possíveis valores para o parâmetro θ com margem de erro conhecido Definição 912 Intervalo de Confiança Seja uma amostra aleatória X1 X2 Xn de uma população com fXx θ parametrizada por θ Considere ainda duas estatísticas T1 t1X1 X2 Xn e T2 t2X1 X2 Xn satisfazendo T1 T2 tal que PθT1 θ T2 γ em que γ não depende de θ Então o intervalo aleatório T1 T2 é o estimador intervalar de confiança 100γ ou o intervalo de confiança de θ sendo γ o coeficiente de confiança e T1 e T2 são os limites inferior e superior respectivamente Exemplo 910 Estimador intervalar Para uma amostra X1 X2 X3 X4 de uma população normal com média µ e variância 1 isto é X Nµ 1 Um estimador intervalar possível de µ é X 1 X 1 Isto significa que o intervalo contém o valor do parâmetro µ com uma certa confiança Qual a vantagem de ter usado um estimador com menor precisão do que um estimador pontual Pontualmente estimamos µ por X E agora estimamos por X 1 X 1 Apesar de abrirmos mão de uma certa precisão ganhamos alguma confiança isto é uma garantia de que nossa asserção está correta Outra importante observação é que o intervalo T1 T2 Definição 912 é a quantidade aleatória e não o parâmetro θ Assim não podemos afirmar que θ está dentro do intervalo T1 T2 com uma confiança 100γ e sim que o intervalo T1 T2 contém o parâmetro θ com uma confiança 100γ Diversos métodos são encontrados na literatura para obter um intervalo de confiança tais como inverter uma estatística de teste intervalos bayesianos método da quantidade pivotal dentre ou tros Nos restringiremos ao último método cuja Definição 913 é apresentada a seguir 154 94 Estimação por intervalo Definição 913 Quantidade pivotal Seja uma amostra aleatória X1 X2 Xn de uma população com fXx θ parametrizada por θ Considere ainda uma medida Q qX1 X2 Xn θ uma função de X1 X2 Xn e θ Se Q tem distribuição independente de θ então Q é chamado de quantidade pivotal Exemplo 911 Seja uma amostra aleatória X1 X2 Xn de uma população X Nθ 9 Assim podemos afir mar que Q X θ é uma quantidade pivotal pois sua distribuição é normal tal que Q1 N0 9n Agora Q2 Xθ não é uma quantidade pivotal pois Q2 N0 9nθ2 que de pende de θ Definição 914 Método da quantidade pivotal Seja uma amostra aleatória X1 X2 Xn de uma população com fXx θ parametrizada por θ Considere ainda uma quantidade pivotal Q qX1 X2 Xn θ com fp ou fdp fQx que não depende de θ Fixado 0 γ 1 existem q1 e q2 que dependem de γ tal que Pq1 Q q2 γ Se para cada amostra observada x1 x2 xn q1 qx1 x2 xn θ q2 pode ser pivotado em t1x1 x2 xn τθ t2x1 x2 xn para t1 e t2 que não dependem de θ então T1 T2 é o intervalo de confiança 100γ para τθ sendo τ uma função de θ em que Ti tiX1 X2 Xn i 1 2 Dessa definição devemos fazer algumas observações sobre esse método i q1 e q2 são independentes de θ uma vez que a distribuição de Q também é ii Para um valor fixado de γ há muitos valores possíveis para q1 e q2 tal que Pq1 Q q2 γ iii Diferentes pares de q1 e q2 produzem diferentes pares de t1 e t2 Dessa forma precisamos de algum critério para escolher q1 e q2 Definição 915 Tamanho do intervalo eja uma amostra aleatória X1 X2 Xn de uma população com fXx θ parametrizada por θ Se T1 T2 é o intervalo de confiança 100γ de θ Definição 912 então o tamanho do intervalo denotado por C é definido por CT1T2 T2 T1 918 em que T2 T1 Dessa forma devemos escolher o par q1 e q2 que resulte em menor comprimento CT1T2 941 Intervalo de confiança para a média Considerando agora uma amostra aleatória X1 X2 Xn de tamanho n de uma população tenha distribuição normal tal que X Nµ σ2 então apresentamos o seguinte Teorema 155 Teorema 92 Se X Nμ σ2 então i X e S2 são independentes ii nX μ σ N0 1 para σ2 conhecido iii nX μ σ tn1 iv n 1 S2 σ2 χ2n1 sendo X Σmi1 Xi n S2 Σni1 Xi X2 n 1 χ2n1 é a variável aleatória de uma distribuição de quiquadrado com n 1 graus de liberdade e tn1 é a variável aleatória de uma distribuição de t de Student com n 1 graus de liberdade Observamos que os itens ii iii e iv são todas quantidades pivotais já que suas distribuições não dependem dos parâmetros de interesse Dessa forma podemos construir intervalo de confiança para essas quantidades Teorema 93 Intervalo de confiança para μ Considerando o Teorema 92 o intervalo de confiança 1001 α para μ é dado por I P X tn11 α2 σ n μ X tn11 α2 σ n 1 α considerando a quantidade pivotal do item iii Teorema 92 sendo σ o desvio padrão amostral O quantil superior 100α2 tn1 tem distribuição t de Student com n 1 graus de liberdade Prova Seja Z nX μ σ N0 1 uma quantidade pivotal Vamos agora pivotar isto é q1 nX μ q2 q1 σ n nX μ q2 σ n X μ X q1 σ n μ X q2 σ n X q1 μ X q2 σ n O tamanho do intervalo é CT1T2 left barX q1 fracsigmasqrtn right left barX q2 fracsigmasqrtn right q2 q1 fracsigmasqrtn que é o mesmo que 1 alpha intq1q2 fZkdk FZq2 FZq1 em que fZz é a função densidade da normal padrão Diferenciando 19 em relação a q1 temos fracddq1 FZq2 FZq1 fracd q2d q1 fZq2 fZq1 0 Isto implica em fracd q2d q1 fracfZq1fZq2 Para minimizar CT1T2 portanto fazemos dCT1T2dq1 isto é fracddq1 q2 q1 fracsigmasqrtn left fracd q1d q1 1 right fracsigmasqrtn 0 Substituindo 21 em 22 temos left fracfZq1fZq2 1 right fracsigmasqrtn 0 Isso só ocorrerá se q2 q1 Entretanto intq1q1 fZkdk eq 1 alpha Ou pode ser q1 q2 já que fZq1 fZq1 pela distribuição ser simétrica daí podermos obter intq1q1 fZkdk 1 alpha Portanto para minimizar CT1T2 q1 q2 z1 e segue o resultado do item I O resultado do item II segue nos mesmos moldes substituindo apenas r por S 942 Intervalo de confiança para a variância Teorema 94 Intervalo de confiança para sigma2 Considerando o Teorema 92 o intervalo de confiança 1001 alpha para sigma2 é dado por P left fracn 1S2chi22n1 leq sigma2 leq fracn 1S2chi21 alpha2n1 right 1 alpha sendo chi21 alpha2 o quantil superior 1001 alpha2 e chi2alpha2 o quantil superior 100α2 da distribuição quiquadrado com n 1 graus de liberdade Prova Capítulo 9 Teoria da estimação 943 Intervalo de confiança para a diferença entre médias 95 Dimensionamento de amostras 158 Capítulo 9 Teoria da estimação Considere que a resistência à tensão apresenta distribuição normal e que as variâncias po pulacionais são desconhecidas para os dados obtidos pelas duas máquinas porém iguais encontre um estimador intervalar para a diferença das médias dos dois grupos com um nível de confiança de 99 de probabilidade Solução na página 233 Exercício 96 Verifique se o estimador de máxima verossimilhança de ˆp Yk de uma amostra aleatória Y1 Y2 Yk de uma distribuição Binomial de parâmetros n conhecido e p é um estimador não viesado de p Verifique também se esse estimador é consistente Solução na página 233 160 103 Erros tipo I e II Assim α PX 8 p 12 10 x8 05x1 0510x 0 055 Essa probabilidade é chamada de nível de significância ou erro tipo I denotada por α Fica claro que o valor de α depende da regra de decisão por exemplo se a região crítica fosse X 7 teríamos α 0 171875 103 Erros tipo I e II Dessa forma percebemos que a tomada de decisão do pesquisador sobre θ não está livre de erros Definição 106 Erro tipo I Seja um teste Υ que avalia uma hipótese verdadeira H0 A decisão de rejeitar a hipótese H0 dado que ela é verdadeira é chamada de erro tipo I O tamanho do erro tipo I é a probabili dade com que o erro é cometido denotado por α Veremos como usar α para construir uma regra de decisão Definição 107 Erro tipo II Seja um teste Υ que avalia uma hipótese falsa H0 A decisão de aceitar a hipótese H0 dado que ela é falsa é chamada de erro tipo II O tamanho do erro tipo II é a probabilidade com que o erro é cometido denotado por β Em situações reais esses dois erros podem ocorrer porém o que se deseja é minimizálos uma vez que o valor de α é inversamente proporcional ao valor de β Assim fixado um tamanho da amostra n a baixa probabilidade de se incorrer no erro tipo I implica numa alta probabilidade de se incorrer no erro tipo II e o único modo de se causar redução simultânea de ambos é aumentar o tamanho da amostra n No desenvolvimento de um teste de hipóteses o que se faz é fixar o valor de α e daí tentar minimizar o valor do erro tipo II Do ponto de vista teórico o erro tipo II pode ser minimizado com uma série de ações escolha apropriada do teste e da avaliação do atendimento das pressuposições da utilização do teste Se o teste é adequado e as pressuposições para sua aplicação estão satisfeitas existe uma garantia de um maior poder determinação de um tamanho de amostra para que o teste tenha um maior poder possível e que não aumente em demasia o custo da pesquisa a ser realizada exemplo Casella port p 334 a fixação de α entre 010 e 001 é sempre que possível uma boa medida por causa da relação inversa entre as taxas do erro tipo I e do erro tipo II Se por um lado a probabilidade de se cometer o erro tipo I é conhecida e fixada pelo investigador por outro a probabilidade do erro tipo II não é conhecida e nem pode ser especificada uma vez que a hipótese alternativa não tem o seu parâmetro especificado a menos que estejamos diante de hipóteses simples algo muito raro nas situações práticas A forma de mensurar o tamanho desses erros é avaliado pela função poder Definição 108 Função Poder Seja um teste Υ com região de rejeição CΥ então a função poder denotada por πΥθ é a probabilidade πΥθ PθX1 X2 Xn CΥ parametrizado por θ 163 Capítulo 10 Teoria da decisão zero Esta última afirmação probabilística sequer faz sentido na inferência clássica embora seja exatamente isto que gostaríamos de calcular Para que esta interpretação fosse válida teríamos que usar a abordagem Bayesiana Basicamente teríamos que atribuir uma probabildiade a priori isto é antes de observar os dados para a hipótese H0 Após a observação dos dados amostrais esta probabilidade seria atualizada segundo regras da inferência Bayesiana e teríamos uma probabilidade a posteriori para a hipótese H0 104 Teste unilateral e bilateral 105 Passos para a construção de um teste de hipótese 106 Teste de hipóteses para a média 107 Testes de hipóteses para a proporção 108 Testes de hipóteses para a variância 109 Testes de hipóteses para a diferença entre médias 166 1010 Exercícios 1010 Exercícios Exercício 101 Um professor aplica um teste do tipo certoerrado com 12 questões Quere mos testar a hipótese de que o aluno está advinhando A hipótese nula é que o aluno acerta ao acaso as questões A hipótese alternativa é que o aluno tem algum conhecimento Sendo p a probabilidade desconhecida do aluno acertar cada questão então a hipótese estatística de interesse pode ser dada como H0 p 12 Como hipótese alternativa H1 p 12 isto é o aluno tem algum conhecimento para resolver as questões Determine a A probabilidade do erro tipo I supondo que adotamos a seguinte regra de decisão o aluno não está advinhando se acertar 8 ou mais questões b Qual seria a regra de decisão se assumíssimos um nível de significância α 0 08 Solução na página 234 Exercício 102 Considere um experimento do qual se observa o desempenho de um sis tema operacional implantado em uma determinada indústria de robótica Foi verificado que o tempo de resposta em milissegundos de um comando do operador a uma determinada atividade usando esse sistema operacional tem distribuição normal com desvio padrão de 20 milissegundos Retirado uma amostra de tamanho n 100 com média de 52 05 ms O fabricante nos informou que o tempo médio de resposta da máquina devido ao sistema operacional não ultrapassa 50 ms Diante disso use um teste de hipótese para verificar a informação do fabricante ao nível de significância de 5 de probabilidade Solução na página 234 Exercício 103 Considere duas máquinas que produzem peças dos quais estamos avali ando a resistência à tensão dessas máquinas MPa Retirouse uma amostra de 8 peças de cada máquina e obtendo as seguintes resistências Máquina 1 161 147 162 161 154 136 142 147 Máquina 2 140 162 147 133 130 137 137 136 Considere que a resistência à tensão apresenta distribuição normal e que as variâncias po pulacionais são desconhecidas para os dados obtidos pelas duas máquinas porém iguais Verifique por meio de um teste de hipóteses se a resistência à tensão média da máquina 1 é superior a da máquina 2 ao nível de significância de 10 de probabilidade Solução na página 234 Exercício 104 Um estudo realizado sobre dois tipos de concreto para verificar a taxa de infiltração de água em sua estrutura foi realizado Os dois tipos de concreto C1 e C2 di feriam na porcentagem de material retido na peneira de abertura no processo de fabricação desses concretos em que para fabricação de C1 os agregados retidos na peneira foram 100 de 63mm ao passo que C2 os agregados retidos na peneira foram de 63mm 50 e 475mm 50 Um experimento ensaio com carga variável avaliou 40 corpos de provas desses dois tipos de concreto e mediu a condutividade hidráulica taxa de infiltração de água em cms dos quais os dados são obtidos na tabela abaixo Concreto Amostra Média amostral cms Desvio padrão amostral cms C1 40 0523 0054 C2 40 0641 0061 167 Capítulo 10 Teoria da decisão Considerando que a condutividade hidráulica tem distribuição normal verifique se há dife renças estatísticas entre as médias populacionais das condutividades hidráulicas desses dois tipos de concreto ao nível de significância de 10 de probabilidade Considere que as vari âncias populacionais são homocedásticas Solução na página 234 Exercício 105 Um estudo realizado por Seker et al 2002 avaliaram os efeitos da energia eletromagnética de celulares no cérebro de ratos O experimento foi conduzido in vivo sob dois grupos de ratos um primeiro grupo controle sem exposição da energia eletromagética provindo dos celulares e outro grupo teste apresentando essa exposição Algumas variáveis foram analisada dentre as quais a pressão sanguínea arterial desses ratos mmHg coletadas durante o experimento Os resultados são apresentado na tabela abaixo Grupo Amostra Média amostral mmHg Desvio padrão amostral mmHg Teste Grupo 1 9 115 10 Controle Grupo 2 8 90 5 Dessa forma indagamos a Podemos afirmar que os efeitos da energia eletromagnética expostos aos ratos proveni ente de celulares podem ter elevado a pressão sanguínea arterial dos ratos Considere a realização do testes usando os níveis de significância a 1 e 5 de probabilidade e que a variável mensurada para ambos os grupos apresentam distribuição normal com variâncias desconhecidas e diferentes heterocedasticidade b Determine o valor p para o teste realidade no ítem anterior c Por meio de um intervalo de confiança responda a indagação do ítem a d Podemos afirmar que em média a pressão sanguínea do grupo teste é no mínimo 16 mmHg maior do que a média do grupo controle ao nível de significância de 5 de probabilidade baseado nas mesmas suposições do ítem a e Como poderíamos responder responder o ítem d por meio de um intervalo de confiança Solução na página 234 Exercício 106 Baseado nos ítens d e e do Exercício Proposto 105 justifique o que levou a formular as hipóteses complementares desse problema Solução na página 234 168 Capítulo 11 Correlação e regressão linear sim ples 111 Introdução Um problema comum na estatística é tentar verificar a associação entre duas variáveis X e Y Após isto estamos interessados na forma como ocorre esta associação Procuramos então uma relação funcional entre essas variáveis tal que X Y Y f X 111 A relação em 111 não é perfeita Os pontos não se situam perfeitamente sobre a função que rela ciona as duas variáveis Mesmo se existisse uma relação exata entre as variáveis como temperatura e pressão flutuações em torno da curva aparecerão devido a erros de medidas Frequentemente o tipo de curva a ser ajustada é sugerido por evidência empírica ou por argumentos teóricos O mo delo a ser adotado depende de vários fatores por exemplo natureza das variáveis relação linear ou não homogeneidade de variâncias ou não tipos de erros independência dos erros etc Diremos que a variável Y é aleatória sendo chamada de variável resposta ou dependente A variável X é fixa sendo chamada de variável explicativa regressora ou independente Os valores da variável X são selecionados pelo pesquisador não havendo variação aleatória associada A seleção dos Xs pode envolver um conjunto específico de valores ou valores que estão simplesmente dentro de uma amplitude de variação Portanto na estatística é a Teoria de Regressão que tenta encontrar a relação funcional em 111 que chamaremos modelo de regressão Essa teoria teve origem no século XIX com Francis Galton Em um de seus trabalhos Galton estudou a relação da altura dos pais Xi e dos filhos Yi procu rando saber como a altura dos pais influenciava a altura dos filhos Ele notou que se o pai fosse muito alto ou muito baixo o filho teria uma altura tendendo à média isto é existia uma tendências dos dados regredirem à média Por isso do nome regressão Os objetivos desse modelo são Predição Esperamos que a maior variação ocorrida na variável Y seja explicada por X Assim por meio do modelo de regressão podemos obter valores de Y correspondente aos valores de X que não estavam entre os dados Em geral sempre se seleciona valores de X dentro do intervalo das observações de X utilizadas para ajustar o modelo Muito embora possa ser possível utilizar valores de X fora desse intervalo dizemos pois que ocorreu uma extrapolação nos dados A extrapolação deve ser utilizada com muito cuidado pois o modelo adotado não garante um valor correto para Y fora do intervalo estudado para X A predição talvez seja o uso mais comum para o estudo dos modelos de regressão Seleção de variáveis Muitas vezes a variável Y pode ser explicada por mais de uma variá vel X e a relação funcional 111 pode ser expressa por Y f X1 X2 Xp Ou seja Y é explicada por p variáveis explicativas Entretanto nem sempre essas p variáveis apresen tam tanta influência na explicação dos valores para Y Dessa forma a análise de regressão poderá auxiliar no processo de seleção das p variáveis X eliminando aquelas que não sejam importantes Estimação de parâmetros Em 111 f é dependente de parâmetros e estes são desconheci dos Então dada uma amostra e um modelo a estimação pontual tenta encontrar por meio de algum método estimativas que possam representar os parâmetros desconhecidos Após substituílos temos um modelo ajustado 169 Capítulo 11 Correlação e regressão linear simples Inferência Após realizarmos a estimação pontual as estimativas mudam para cada amos tra realizada Por isso precisamos de uma confiança sobre estas estimativas Daí fazemos a inferência sobre os parâmetros por meio dessas estimativas realizando testes de hipóteses e intervalos de confiança 112 Correlação linear Inicialmente estamos interessados em estudar a relação que existe entre as variáveis X eY Para isso caracterizaremos essa relação por meio da correlação linear Definição XX 1121 Coeficiente de correlação linear 1122 Teste de hipóteses acerca do coeficiente de correlação linear 113 Regressão linear simples Após estudarmos a relação entre X e Y podemos também estar interessados em saber a forma dessa relação funcional que resulta no modelo de regressão Definição 111 apresento a seguir Definição 111 Modelo de Regressão Seja uma variável aleatória Y e X1 X2 Xp um conjunto de variáveis regressoras então a relação Y f X1 X2 Xp β0 β1 βp ε 112 é chamada de Modelo de Regressão sendo βj R para j 0 1 2 p os p p 1 parâmetros desconhecidos da função f e ε é o erro aleatório não observável Definição 112 Modelo de Regressão Linear Um modelo de regressão expresso em 112 tal que f βj hX1 X2 Xp para j 0 1 2 p e h uma função qualquer que dependa apenas das variáveis regresso ras é chamado de modelo de regressão linear Se pelo menos uma das derivadas parciais f βj depender de algum dos parâmetros então f é dita função ou modelo de regressão nãolinear Esse ponto não fará parte desse estudo Exemplo 111 Regressão linear e nãolinear Exemplos de modelos de regressão linear f X β0 β0 pois d f dβ0 1 Y f X β0 β1 β0 β1X pois f β0 1 e f β1 X Exemplos de modelo de regressão nãolinear f X β0 β1 β2 β0β1X 1β2X pois f β0 1 1β2 f β1 X 1β2 e f β2 β0β1XX 1β22 f X β0 β1 β2 β0 β1eβ2X pois f β0 1 f β1 eβ2X e f β2 β1Xeβ2X 170 113 Regressão linear simples Definição 113 Modelo de Regressão Linear Múltipla MRLM Considerando as Definições 111 e 112 um modelo de regressão linear múltipla para n obser vações independentes de Y associados com os Xs pode ser definido por Yi β0 β1Xi1 β2Xi2 βpXip εi 113 sendo i 1 2 n supondo Eεi 0 varεi σ2 e covεi εj 0 para todo i j Esse modelo descreve um hiperplano no espaço pdimensional de variáveis regressoras Pode mos interpretar βj para j 1 2 p como a mudança esperada em Yi devido ao aumento de uma unidade em Xj estando as outras variáveis regressoras constantes Por consequência de Eεi 0 e varεi σ2 temos que EYi β0 β1Xi1 β2Xi2 βpXip e varYi σ2 1131 Modelo Quando temos apenas uma variável regressão como forma de explicar a variável resposta estamos diante de um modelo de regressão linear simples apresentado na Definição 114 a seguir Definição 114 Modelo de Regressão Linear Simples MRLS Considerando a Definição 113 para p 1 o modelo expresso em 113 reduzse a Yi β0 β1Xi εi i 1 2 n 114 também conhecido como modelo de regressão linear simples Para a expressão 114 o parâmetro β0 representa o coeficiente linear e o β1 o coeficiente angular para o modelo Percebemos que a Definição 114 é um caso particular da Definição 113 Assim quando falarmos sobre regressão linear sempre estaremos nos referindo ao caso geral Definição 113 que englobará todos os outros modelos de regressão linear Inicialmente pensemos num conjunto de pares Xi Yi i 1 2 n de duas variáveis e plo temos um gráfico de dispersão para que possamos obter alguma ideia sobre a forma de associação entre X e Y Figura 111 Esse gráfico também ajuda a detectar pontos discrepantes Outliers Con tudo o gráfico de dispersão deve ser olhado com muito cuidado uma vez que este não leva em consideração a correlação entre duas ou mais variáveis regressoras caso exista Após averiguar essas informações iniciais sabemos que mesmo tendo indicativos de um modelo preliminar a equação 113 constitui uma família de funções de parâmetros βjs Assim o objetivo é encontrar aquele que melhor descreva o comportamento de Y 1132 Estimação dos parâmetros do modelo Definindo εi Yi β0 β1Xi a partir do modelo 114 então um critério interessante para deter minar esses estimadores seria minimizar a soma de quadrados desses resíduos ao longo de todos os n pares Xi Yi Essa soma de quadrados é dada por n i1 ε2 i n i1 Yi β0 β1Xi2 115 Esse método é chamado de mínimos quadrados e é facilmente obtido derivando esse último relação aos parâmetros β0 e β1 igualando esses derivadas a zero Considerando Q n i1 ε2 i n i1 Yi β0 β1Xi2 171 113 Regressão linear simples Figura 112 Representação gráfica dos diversos desvios envolvidos em uma análise de Regressão linear simples Eεi 0 Varεi σ2 Covεi εj 0 i j i j 1 2 n Os estimadores dos parâmetros β0 e β1 são dados nas equações 118 e 119 respectivamente Considerando o modelo de regressão linear simples dado na equação 114 então a distribuição de probabilidade Y correspondente ao valor préfixado x de X é dada por Y Nβ0 β1x σ2 ou seja EYx Eβ0 β1x ε Eβ0 β1x Eε β0 β1x 0 β0 β1x e VarY Varβ0 β1x ε Varβ0 β1x Varε 0 σ2 σ2 Assim fica provado a distribuição de Yx Dessa forma podemos afirmar que a expressão 1115 também tem distribuição normal Yi Nβ0 β1xi σ2 175 Capítulo 11 Correlação e regressão linear simples dependentes Y que é explicada pelo modelo Assim R2 SQreg SQtot SPXY2 SQX SQY 1121 1 SQres SQtot 1122 Uma outra medida que é apresentada com o objetivo de propiciar comparações de qualidade do ajuste do modelo linear simples com o ajuste de outro modelo linear com um número maior de parâmetros é o coeficiente de determinação ajustado R2 aj dado por R2 aj 1 n In k1 R2 1123 em que n é o número de observações I é uma variável indicador que é igual a 1 se o modelo possui intercepto e 0 caso contrário e k o número de parâmetros Características de R2 aj R2 aj R2 pode ser negativo não tem a interpretação prática de R2 é mais justo para a comparação de modelos isto é quão mais próximo de 1 melhor o modelo 178 114 Exercícios 114 Exercícios Exercício 111 Considere os dados de consumo de combustível kml ao longo do tempo mês de um veículo após uma regulagem eletrônica apresentados a seguir Tempo X 1 2 3 4 5 6 7 8 9 10 Consumo Y 106 102 96 92 86 90 80 79 73 76 Considerando que podemos explicar o consumo ao longo do tempo apresente o modelo de regressão linear simples estimado para essas duas variáveis Solução na página 235 Exercício 112 Tentando verificar se existe uma relação linear entre a umidade relativa do ar de secagem de semente e a porcentagem de germinação um estudo foi realizado do qual se obteve uma amostra de 4 pares de observações que segue Umidade relativa X 25 35 45 55 Germinação Y 91 95 93 97 Verifique a se é possível verificar a existência de relação entre a umidade relativa de secagem com a porcentagem de germinação de sementes ao nível de significância de 5 de probabilidade b qual seria o valor da porcentagem de germinação esperado considerando uma umidade relativa de 30 c apresente o modelo de regressão linear simples entre essas duas variáveis Solução na página 235 Exercício 113 Tentando verificar se existe uma relação linear entre a umidade relativa do ar de secagem de semente e a porcentagem de germinação um estudo foi realizado do qual se obteve uma amostra de 4 pares de observações que segue Umidade relativa X 25 35 45 55 Germinação Y 91 95 93 97 Verifique a se é possível verificar a existência de relação entre a umidade relativa de secagem com a porcentagem de germinação de sementes ao nível de significância de 5 de probabilidade b qual seria o valor da porcentagem de germinação esperado considerando uma umidade relativa de 30 c apresente o modelo de regressão linear simples entre essas duas variáveis Solução na página 235 179 Apêndice A Introdução ao R 180 Apêndice B Tabelas Esse apêndice apresenta as tabelas das principais distribuições amostrais que serão utilizadas ao longo do curso Há também outros tipos de tabelas que poderão ser apresentados tais como a tabelas de números aleatórios dentre outras 181 continua α ν 04 025 01 005 0025 001 0005 360 0255 0681 1306 1688 2028 2434 2719 370 0255 0681 1305 1687 2026 2431 2715 380 0255 0681 1304 1686 2024 2429 2712 390 0255 0681 1304 1685 2023 2426 2708 400 0255 0681 1303 1684 2021 2423 2704 410 0255 0681 1303 1683 2020 2421 2701 420 0255 0680 1302 1682 2018 2418 2698 430 0255 0680 1302 1681 2017 2416 2695 440 0255 0680 1301 1680 2015 2414 2692 450 0255 0680 1301 1679 2014 2412 2690 460 0255 0680 1300 1679 2013 2410 2687 470 0255 0680 1300 1678 2012 2408 2685 480 0255 0680 1299 1677 2011 2407 2682 490 0255 0680 1299 1677 2010 2405 2680 500 0255 0679 1299 1676 2009 2403 2678 510 0255 0679 1298 1675 2008 2402 2676 520 0255 0679 1298 1675 2007 2400 2674 530 0255 0679 1298 1674 2006 2399 2672 540 0255 0679 1297 1674 2005 2397 2670 550 0255 0679 1297 1673 2004 2396 2668 560 0255 0679 1297 1673 2003 2395 2667 570 0255 0679 1297 1672 2002 2394 2665 580 0255 0679 1296 1672 2002 2392 2663 590 0254 0679 1296 1671 2001 2391 2662 600 0254 0679 1296 1671 2000 2390 2660 610 0254 0679 1296 1670 2000 2389 2659 620 0254 0678 1295 1670 1999 2388 2657 630 0254 0678 1295 1669 1998 2387 2656 640 0254 0678 1295 1669 1998 2386 2655 650 0254 0678 1295 1669 1997 2385 2654 660 0254 0678 1295 1668 1997 2384 2652 670 0254 0678 1294 1668 1996 2383 2651 680 0254 0678 1294 1668 1995 2382 2650 690 0254 0678 1294 1667 1995 2382 2649 700 0254 0678 1294 1667 1994 2381 2648 710 0254 0678 1294 1667 1994 2380 2647 720 0254 0678 1293 1666 1993 2379 2646 730 0254 0678 1293 1666 1993 2379 2645 740 0254 0678 1293 1666 1993 2378 2644 750 0254 0678 1293 1665 1992 2377 2643 760 0254 0678 1293 1665 1992 2376 2642 770 0254 0678 1293 1665 1991 2376 2641 780 0254 0678 1292 1665 1991 2375 2640 790 0254 0678 1292 1664 1990 2374 2640 800 0254 0678 1292 1664 1990 2374 2639 810 0254 0678 1292 1664 1990 2373 2638 820 0254 0677 1292 1664 1989 2373 2637 830 0254 0677 1292 1663 1989 2372 2636 187 Capítulo 13 Apêndice B Tabelas continua α ν 04 025 01 005 0025 001 0005 840 0254 0677 1292 1663 1989 2372 2636 850 0254 0677 1292 1663 1988 2371 2635 860 0254 0677 1291 1663 1988 2370 2634 870 0254 0677 1291 1663 1988 2370 2634 880 0254 0677 1291 1662 1987 2369 2633 890 0254 0677 1291 1662 1987 2369 2632 900 0254 0677 1291 1662 1987 2368 2632 910 0254 0677 1291 1662 1986 2368 2631 920 0254 0677 1291 1662 1986 2368 2630 930 0254 0677 1291 1661 1986 2367 2630 940 0254 0677 1291 1661 1986 2367 2629 950 0254 0677 1291 1661 1985 2366 2629 960 0254 0677 1290 1661 1985 2366 2628 970 0254 0677 1290 1661 1985 2365 2627 980 0254 0677 1290 1661 1984 2365 2627 990 0254 0677 1290 1660 1984 2365 2626 1000 0254 0677 1290 1660 1984 2364 2626 1200 0254 0677 1289 1658 1980 2358 2617 1010 0254 0677 1290 1660 1984 2364 2625 1020 0254 0677 1290 1660 1983 2363 2625 1030 0254 0677 1290 1660 1983 2363 2624 1040 0254 0677 1290 1660 1983 2363 2624 1050 0254 0677 1290 1659 1983 2362 2623 1060 0254 0677 1290 1659 1983 2362 2623 1070 0254 0677 1290 1659 1982 2362 2623 1080 0254 0677 1289 1659 1982 2361 2622 1090 0254 0677 1289 1659 1982 2361 2622 1100 0254 0677 1289 1659 1982 2361 2621 1110 0254 0677 1289 1659 1982 2360 2621 1120 0254 0677 1289 1659 1981 2360 2620 1130 0254 0677 1289 1658 1981 2360 2620 1140 0254 0677 1289 1658 1981 2360 2620 1150 0254 0677 1289 1658 1981 2359 2619 1160 0254 0677 1289 1658 1981 2359 2619 1170 0254 0677 1289 1658 1980 2359 2619 1180 0254 0677 1289 1658 1980 2358 2618 1190 0254 0677 1289 1658 1980 2358 2618 1200 0254 0677 1289 1658 1980 2358 2617 1210 0254 0677 1289 1658 1980 2358 2617 1220 0254 0677 1289 1657 1980 2357 2617 1230 0254 0676 1288 1657 1979 2357 2616 1240 0254 0676 1288 1657 1979 2357 2616 1250 0254 0676 1288 1657 1979 2357 2616 1260 0254 0676 1288 1657 1979 2356 2615 1270 0254 0676 1288 1657 1979 2356 2615 1280 0254 0676 1288 1657 1979 2356 2615 1290 0254 0676 1288 1657 1979 2356 2614 188 continua α ν 04 025 01 005 0025 001 0005 1300 0254 0676 1288 1657 1978 2355 2614 1400 0254 0676 1288 1656 1977 2353 2611 1500 0254 0676 1287 1655 1976 2351 2609 1600 0254 0676 1287 1654 1975 2350 2607 1700 0254 0676 1287 1654 1974 2348 2605 1800 0254 0676 1286 1653 1973 2347 2603 1900 0254 0676 1286 1653 1973 2346 2602 2000 0254 0676 1286 1653 1972 2345 2601 2400 0254 0676 1285 1651 1970 2342 2596 2500 0254 0675 1285 1651 1969 2341 2596 3000 0254 0675 1284 1650 1968 2339 2592 0253 0674 1282 1645 1960 2326 2576 189 continua α ν 0995 0990 0975 0950 0900 0400 0250 0100 0050 0025 0010 0005 310 14458 15655 17539 19281 21434 32349 35887 41422 44985 48232 52191 55003 320 15134 16362 18291 20072 22271 33381 36973 42585 46194 49480 53486 56328 330 15815 17074 19047 20867 23110 34413 38058 43745 47400 50725 54776 57648 340 16501 17789 19806 21664 23952 35444 39141 44903 48602 51966 56061 58964 350 17192 18509 20569 22465 24797 36475 40223 46059 49802 53203 57342 60275 360 17887 19233 21336 23269 25643 37505 41304 47212 50998 54437 58619 61581 370 18586 19960 22106 24075 26492 38535 42383 48363 52192 55668 59893 62883 380 19289 20691 22878 24884 27343 39564 43462 49513 53384 56896 61162 64181 390 19996 21426 23654 25695 28196 40593 44539 50660 54572 58120 62428 65476 400 20707 22164 24433 26509 29051 41622 45616 51805 55758 59342 63691 66766 410 21421 22906 25215 27326 29907 42651 46692 52949 56942 60561 64950 68053 420 22138 23650 25999 28144 30765 43679 47766 54090 58124 61777 66206 69336 430 22859 24398 26785 28965 31625 44706 48840 55230 59304 62990 67459 70616 440 23584 25148 27575 29787 32487 45734 49913 56369 60481 64201 68710 71893 450 24311 25901 28366 30612 33350 46761 50985 57505 61656 65410 69957 73166 460 25041 26657 29160 31439 34215 47787 52056 58641 62830 66617 71201 74437 470 25775 27416 29956 32268 35081 48814 53127 59774 64001 67821 72443 75704 480 26511 28177 30755 33098 35949 49840 54196 60907 65171 69023 73683 76969 490 27249 28941 31555 33930 36818 50866 55265 62038 66339 70222 74919 78231 500 27991 29707 32357 34764 37689 51892 56334 63167 67505 71420 76154 79490 510 28735 30475 33162 35600 38560 52917 57401 64295 68669 72616 77386 80747 520 29481 31246 33968 36437 39433 53942 58468 65422 69832 73810 78616 82001 530 30230 32018 34776 37276 40308 54967 59534 66548 70993 75002 79843 83253 540 30981 32793 35586 38116 41183 55992 60600 67673 72153 76192 81069 84502 550 31735 33570 36398 38958 42060 57016 61665 68796 73311 77380 82292 85749 560 32490 34350 37212 39801 42937 58040 62729 69919 74468 78567 83513 86994 570 33248 35131 38027 40646 43816 59064 63793 71040 75624 79752 84733 88236 580 34008 35913 38844 41492 44696 60088 64857 72160 76778 80936 85950 89477 590 34770 36698 39662 42339 45577 61111 65919 73279 77931 82117 87166 90715 600 35534 37485 40482 43188 46459 62135 66981 74397 79082 83298 88379 91952 610 36301 38273 41303 44038 47342 63158 68043 75514 80232 84476 89591 93186 620 37068 39063 42126 44889 48226 64181 69104 76630 81381 85654 90802 94419 630 37838 39855 42950 45741 49111 65204 70165 77745 82529 86830 92010 95649 640 38610 40649 43776 46595 49996 66226 71225 78860 83675 88004 93217 96878 650 39383 41444 44603 47450 50883 67249 72285 79973 84821 89177 94422 98105 660 40158 42240 45431 48305 51770 68271 73344 81085 85965 90349 95626 99330 670 40935 43038 46261 49162 52659 69293 74403 82197 87108 91519 96828 100554 680 41713 43838 47092 50020 53548 70315 75461 83308 88250 92689 98028 101776 690 42494 44639 47924 50879 54438 71337 76519 84418 89391 93856 99228 102996 700 43275 45442 48758 51739 55329 72358 77577 85527 90531 95023 100425 104215 710 44058 46246 49592 52600 56221 73380 78634 86635 91670 96189 101621 105432 720 44843 47051 50428 53462 57113 74401 79690 87743 92808 97353 102816 106648 730 45629 47858 51265 54325 58006 75422 80747 88850 93945 98516 104010 107862 740 46417 48666 52103 55189 58900 76443 81803 89956 95081 99678 105202 109074 750 47206 49475 52942 56054 59795 77464 82858 91061 96217 100839 106393 110286 191 Capítulo 13 Apêndice B Tabelas continua α ν 0995 0990 0975 0950 0900 0400 0250 0100 0050 0025 0010 0005 76 47997 50286 53782 56920 60690 78485 83913 92166 97351 101999 107583 111495 77 48788 51097 54623 57786 61586 79505 84968 93270 98484 103158 108771 112704 78 49582 51910 55466 58654 62483 80526 86022 94374 99617 104316 109958 113911 79 50376 52725 56309 59522 63380 81546 87077 95476 100749 105473 111144 115117 80 51172 53540 57153 60391 64278 82566 88130 96578 101879 106629 112329 116321 81 51969 54357 57998 61261 65176 83586 89184 97680 103010 107783 113512 117524 82 52767 55174 58845 62132 66076 84606 90237 98780 104139 108937 114695 118726 83 53567 55993 59692 63004 66976 85626 91289 99880 105267 110090 115876 119927 84 54368 56813 60540 63876 67876 86646 92342 100980 106395 111242 117057 121126 85 55170 57634 61389 64749 68777 87665 93394 102079 107522 112393 118236 122325 86 55973 58456 62239 65623 69679 88685 94446 103177 108648 113544 119414 123522 87 56777 59279 63089 66498 70581 89704 95497 104275 109773 114693 120591 124718 88 57582 60103 63941 67373 71484 90723 96548 105372 110898 115841 121767 125913 89 58389 60928 64793 68249 72387 91742 97599 106469 112022 116989 122942 127106 90 59196 61754 65647 69126 73291 92761 98650 107565 113145 118136 124116 128299 91 60005 62581 66501 70003 74196 93780 99700 108661 114268 119282 125289 129491 92 60815 63409 67356 70882 75100 94799 100750 109756 115390 120427 126462 130681 93 61625 64238 68211 71760 76006 95818 101800 110850 116511 121571 127633 131871 94 62437 65068 69068 72640 76912 96836 102850 111944 117632 122715 128803 133059 95 63250 65898 69925 73520 77818 97855 103899 113038 118752 123858 129973 134247 96 64063 66730 70783 74401 78725 98873 104948 114131 119871 125000 131141 135433 97 64878 67562 71642 75282 79633 99892 105997 115223 120990 126141 132309 136619 98 65694 68396 72501 76164 80541 100910 107045 116315 122108 127282 133476 137803 99 66510 69230 73361 77046 81449 101928 108093 117407 123225 128422 134642 138987 100 67328 70065 74222 77929 82358 102946 109141 118498 124342 129561 135807 140169 120 8385 8692 9157 9570 10062 12329 13005 14023 14657 15221 15895 16365 240 18732 19199 19898 20514 21239 24492 25439 26847 27714 28480 29389 30018 480 40395 41087 42119 43020 44075 48722 50052 52011 53208 54260 55501 56356 600 51453 52237 53402 54418 55606 60815 62299 64480 65809 66977 68352 69298 960 85089 86101 87603 88908 90429 97047 98918 101657 103319 104776 106487 107662 192 Capítulo 13 Apêndice B Tabelas continua ν1 ν2 15 20 25 30 40 50 60 70 80 90 100 200 300 1 9493 9581 9634 9670 9714 9741 9759 9772 9782 9789 9795 9822 9831 9849 2 3410 3426 3436 3443 3451 3456 3459 3462 3464 3465 3466 3471 3473 3476 3 2455 2460 2463 2465 2467 2469 2470 2470 2471 2471 2471 2473 2473 2474 4 2083 2083 2083 2082 2082 2082 2082 2082 2081 2081 2081 2081 2081 2081 5 1885 1882 1880 1878 1876 1875 1874 1874 1873 1873 1872 1871 1870 1869 6 1762 1757 1753 1751 1748 1746 1744 1743 1742 1742 1741 1739 1738 1737 7 1678 1671 1667 1663 1659 1657 1655 1654 1653 1652 1651 1648 1647 1645 8 1617 1609 1603 1600 1595 1591 1589 1588 1586 1586 1585 1581 1580 1578 9 1570 1561 1555 1551 1545 1541 1539 1537 1536 1535 1534 1530 1528 1526 10 1534 1523 1517 1512 1506 1502 1499 1497 1495 1494 1493 1489 1487 1484 11 1504 1493 1486 1481 1474 1469 1466 1464 1463 1461 1460 1455 1454 1450 12 1480 1468 1460 1454 1447 1443 1439 1437 1435 1434 1433 1428 1426 1422 13 1459 1447 1438 1432 1425 1420 1416 1414 1412 1411 1409 1404 1402 1398 14 1441 1428 1420 1414 1405 1400 1397 1394 1392 1391 1389 1383 1381 1377 15 1426 1413 1404 1397 1389 1383 1380 1377 1375 1373 1372 1366 1363 1359 20 1374 1358 1348 1340 1330 1324 1319 1316 1313 1311 1310 1302 1300 1294 25 1342 1325 1314 1306 1294 1287 1282 1279 1276 1273 1272 1263 1260 1254 30 1321 1303 1291 1282 1270 1263 1257 1253 1250 1247 1245 1236 1233 1226 40 1295 1276 1263 1253 1240 1231 1225 1220 1217 1214 1212 1201 1197 1188 50 1280 1259 1245 1235 1221 1212 1205 1200 1196 1193 1190 1178 1174 1164 60 1269 1248 1234 1223 1208 1198 1191 1186 1182 1178 1176 1163 1158 1147 70 1262 1240 1225 1214 1199 1189 1181 1176 1171 1168 1165 1151 1146 1135 80 1256 1234 1219 1208 1192 1181 1174 1168 1163 1160 1157 1142 1136 1124 90 1252 1229 1214 1202 1186 1176 1168 1162 1157 1153 1150 1135 1129 1116 100 1248 1226 1210 1198 1182 1171 1163 1157 1152 1148 1145 1129 1123 1109 200 1232 1209 1192 1179 1162 1149 1140 1133 1128 1123 1120 1100 1093 1074 300 1227 1203 1186 1173 1155 1142 1133 1125 1119 1115 1111 1090 1081 1060 1216 1191 1174 1160 1140 1127 1116 1108 1102 1096 1091 1066 1054 1000 194 Capítulo 13 Apêndice B Tabelas continua ν1 ν2 15 20 25 30 40 50 60 70 80 90 100 200 300 1 6122 6174 6206 6227 6253 6269 6279 6287 6293 6297 6301 6317 6322 6333 2 9425 9441 9451 9458 9466 9471 9475 9477 9479 9480 9481 9486 9488 9491 3 5200 5184 5175 5168 5160 5155 5151 5149 5147 5145 5144 5139 5137 5134 4 3870 3844 3828 3817 3804 3795 3790 3786 3782 3780 3778 3769 3767 3761 5 3238 3207 3187 3174 3157 3147 3140 3135 3132 3129 3126 3116 3112 3105 6 2871 2836 2815 2800 2781 2770 2762 2756 2752 2749 2746 2734 2730 2722 7 2632 2595 2571 2555 2535 2523 2514 2508 2504 2500 2497 2484 2480 2471 8 2464 2425 2400 2383 2361 2348 2339 2333 2328 2324 2321 2307 2302 2293 9 2340 2298 2272 2255 2232 2218 2208 2202 2196 2192 2189 2174 2169 2159 10 2244 2201 2174 2155 2132 2117 2107 2100 2095 2090 2087 2071 2066 2055 11 2167 2123 2095 2076 2052 2036 2026 2019 2013 2009 2005 1989 1983 1972 12 2105 2060 2031 2011 1986 1970 1960 1952 1946 1942 1938 1921 1915 1904 13 2053 2007 1978 1958 1931 1915 1904 1896 1890 1886 1882 1864 1858 1846 14 2010 1962 1933 1912 1885 1869 1857 1849 1843 1838 1834 1816 1810 1797 15 1972 1924 1894 1873 1845 1828 1817 1808 1802 1797 1793 1774 1768 1755 20 1845 1794 1761 1738 1708 1690 1677 1667 1660 1655 1650 1629 1622 1607 25 1771 1718 1683 1659 1627 1607 1593 1583 1576 1569 1565 1542 1534 1518 30 1722 1667 1632 1606 1573 1552 1538 1527 1519 1512 1507 1482 1474 1456 40 1662 1605 1568 1541 1506 1483 1467 1455 1447 1439 1434 1406 1397 1377 50 1627 1568 1529 1502 1465 1441 1424 1412 1402 1395 1388 1359 1349 1327 60 1603 1543 1504 1476 1437 1413 1395 1382 1372 1364 1358 1326 1315 1291 70 1587 1526 1486 1457 1418 1392 1374 1361 1350 1342 1335 1302 1291 1265 80 1574 1513 1472 1443 1403 1377 1358 1344 1334 1325 1318 1284 1271 1245 90 1564 1503 1461 1432 1391 1365 1346 1332 1321 1312 1304 1269 1256 1228 100 1557 1494 1453 1423 1382 1355 1336 1321 1310 1301 1293 1257 1244 1214 200 1522 1458 1414 1383 1339 1310 1289 1273 1261 1250 1242 1199 1183 1144 300 1510 1445 1401 1369 1325 1295 1273 1256 1243 1233 1224 1178 1160 1115 1487 1421 1375 1342 1295 1263 1240 1222 1207 1195 1185 1130 1106 1000 196 Capítulo 13 Apêndice B Tabelas continua ν1 ν2 15 20 25 30 40 50 60 70 80 90 100 200 300 1 2459 2480 2492 2501 2511 2517 2522 2525 2527 2529 2530 2536 2538 2543 2 1943 1944 1945 1946 1947 1947 1947 1948 1948 1948 1948 1949 1949 1949 3 8703 8660 8634 8617 8594 8581 8572 8566 8561 8557 8554 8540 8536 8526 4 5858 5803 5769 5746 5717 5699 5688 5679 5673 5668 5664 5646 5640 5628 5 4619 4558 4521 4496 4464 4444 4431 4422 4415 4409 4405 4385 4378 4365 6 3938 3874 3835 3808 3774 3754 3740 3730 3722 3716 3712 3690 3683 3669 7 3511 3445 3404 3376 3340 3319 3304 3294 3286 3280 3275 3252 3245 3230 8 3218 3150 3108 3079 3043 3020 3005 2994 2986 2980 2975 2951 2943 2928 9 3006 2936 2893 2864 2826 2803 2787 2776 2768 2761 2756 2731 2723 2707 10 2845 2774 2730 2700 2661 2637 2621 2610 2601 2594 2588 2563 2555 2538 11 2719 2646 2601 2570 2531 2507 2490 2478 2469 2462 2457 2431 2422 2404 12 2617 2544 2498 2466 2426 2401 2384 2372 2363 2356 2350 2323 2314 2296 13 2533 2459 2412 2380 2339 2314 2297 2284 2275 2267 2261 2234 2225 2206 14 2463 2388 2341 2308 2266 2241 2223 2210 2201 2193 2187 2159 2150 2131 15 2403 2328 2280 2247 2204 2178 2160 2147 2137 2130 2123 2095 2085 2066 20 2203 2124 2074 2039 1994 1966 1946 1932 1922 1913 1907 1875 1865 1843 25 2089 2007 1955 1919 1872 1842 1822 1807 1796 1787 1779 1746 1735 1711 30 2015 1932 1878 1841 1792 1761 1740 1724 1712 1703 1695 1660 1647 1622 40 1924 1839 1783 1744 1693 1660 1637 1621 1608 1597 1589 1551 1537 1509 50 1871 1784 1727 1687 1634 1599 1576 1558 1544 1534 1525 1484 1469 1438 60 1836 1748 1690 1649 1594 1559 1534 1516 1502 1491 1481 1438 1422 1389 70 1812 1722 1664 1622 1566 1530 1505 1486 1471 1459 1450 1404 1388 1353 80 1793 1703 1644 1602 1545 1508 1482 1463 1448 1436 1426 1379 1361 1325 90 1779 1688 1629 1586 1528 1491 1465 1445 1429 1417 1407 1358 1340 1302 100 1768 1676 1616 1573 1515 1477 1450 1430 1415 1402 1392 1342 1323 1283 200 1717 1623 1561 1516 1455 1415 1386 1364 1346 1332 1321 1263 1240 1189 300 1700 1606 1543 1497 1435 1393 1363 1341 1323 1308 1296 1234 1210 1150 1666 1571 1506 1459 1394 1350 1318 1293 1273 1257 1243 1170 1138 1000 198 Capítulo 13 Apêndice B Tabelas continua ν1 ν2 15 20 25 30 40 50 60 70 80 90 100 200 300 1 9848 9931 9980 1001 1005 1008 1009 1011 1011 1012 1013 1015 1016 1018 2 3943 3944 3945 3946 3947 3947 3948 3948 3948 3948 3948 3949 3949 3949 3 1425 1416 1411 1408 1403 1401 1399 1397 1397 1396 1395 1392 1392 1390 4 8657 8560 8501 8461 8411 8381 8360 8346 8335 8326 8319 8289 8278 8257 5 6428 6329 6268 6227 6175 6144 6123 6107 6096 6087 6080 6048 6037 6015 6 5269 5168 5107 5065 5012 4980 4959 4943 4932 4923 4915 4882 4871 4849 7 4568 4467 4405 4362 4309 4276 4254 4239 4227 4218 4210 4176 4165 4142 8 4101 3999 3937 3894 3840 3807 3784 3768 3756 3747 3739 3705 3693 3670 9 3769 3667 3604 3560 3505 3472 3449 3433 3421 3411 3403 3368 3357 3333 10 3522 3419 3355 3311 3255 3221 3198 3182 3169 3160 3152 3116 3104 3080 11 3330 3226 3162 3118 3061 3027 3004 2987 2974 2964 2956 2920 2908 2883 12 3177 3073 3008 2963 2906 2871 2848 2831 2818 2808 2800 2763 2750 2725 13 3053 2948 2882 2837 2780 2744 2720 2703 2690 2680 2671 2634 2621 2595 14 2949 2844 2778 2732 2674 2638 2614 2597 2583 2573 2565 2526 2513 2487 15 2862 2756 2689 2644 2585 2549 2524 2506 2493 2482 2474 2435 2422 2395 20 2573 2464 2396 2349 2287 2249 2223 2205 2190 2179 2170 2128 2114 2085 25 2411 2300 2230 2182 2118 2079 2052 2032 2017 2005 1996 1952 1936 1906 30 2307 2195 2124 2074 2009 1968 1940 1920 1904 1892 1882 1835 1819 1787 40 2182 2068 1994 1943 1875 1832 1803 1781 1764 1751 1741 1691 1673 1637 50 2109 1993 1919 1866 1796 1752 1721 1698 1681 1667 1656 1603 1584 1545 60 2061 1944 1869 1815 1744 1699 1667 1643 1625 1611 1599 1543 1524 1482 70 2028 1910 1833 1779 1707 1660 1628 1604 1585 1570 1558 1500 1480 1436 80 2003 1884 1807 1752 1679 1632 1599 1574 1555 1540 1527 1467 1446 1400 90 1983 1864 1787 1731 1657 1610 1576 1551 1531 1516 1503 1441 1419 1371 100 1968 1849 1770 1715 1640 1592 1558 1532 1512 1496 1483 1420 1397 1347 200 1900 1778 1698 1640 1562 1511 1474 1447 1425 1407 1393 1320 1293 1229 300 1877 1755 1674 1616 1536 1484 1446 1417 1395 1377 1361 1285 1255 1182 1833 1708 1626 1566 1484 1428 1388 1357 1333 1313 1296 1205 1166 1000 200 Capítulo 13 Apêndice B Tabelas continua ν1 ν2 15 20 25 30 40 50 60 70 80 90 100 200 300 1 6157 6208 6239 6260 6286 6302 6313 6320 6326 6330 6334 6349 6355 6365 2 9943 9944 9945 9946 9947 9947 9948 9948 9948 9948 9948 9949 9949 9949 3 2687 2669 2657 2650 2641 2635 2631 2628 2626 2625 2624 2618 2616 2612 4 1419 1402 1391 1383 13745 1369 1365 1362 1360 1359 1357 1352 1350 1346 5 9722 9553 9449 9379 9291 9238 9202 9176 9157 9142 9130 9075 9057 9020 6 7559 7396 7296 7229 7143 7091 7057 7032 7013 6998 6987 6934 6916 6880 7 6314 6155 6058 5992 5908 5858 5824 5799 5781 5766 5755 5702 5685 5650 8 5515 5359 5263 5198 5116 5065 5032 5007 4989 4975 4963 4911 4894 4859 9 4962 4808 4713 4649 4567 4517 4483 4459 4441 4426 4415 4363 4346 4311 10 4558 4405 4311 4247 4165 4115 4082 4058 4039 4025 4014 3962 3944 3909 11 4251 4099 4005 3941 3860 3810 3776 3752 3734 3719 3708 3656 3638 3602 12 4010 3858 3765 3701 3619 3569 3535 3511 3493 3478 3467 3414 3397 3361 13 3815 3665 3571 3507 3425 3375 3341 3317 3298 3284 3272 3219 3202 3165 14 3656 3505 3412 3348 3266 3215 3181 3157 3138 3124 3112 3059 3040 3004 15 3522 3372 3278 3214 3132 3081 3047 3022 3004 2989 2977 2923 2905 2868 20 3088 2938 2843 2778 2695 2643 2608 2582 2563 2548 2535 2479 2460 2421 25 2850 2699 2604 2538 2453 2400 2364 2337 2317 2302 2289 2230 2210 2169 30 2700 2549 2453 2386 2299 2245 2208 2181 2160 2144 2131 2070 2049 2006 40 2522 2369 2271 2203 2114 2058 2019 1991 1969 1952 1938 1874 1851 1805 50 2419 2265 2167 2098 2007 1949 1909 1880 1857 1839 1825 1757 1733 1683 60 2352 2198 2098 2028 1936 1877 1836 1806 1783 1764 1749 1678 1653 1601 70 2306 2150 2050 1980 1886 1826 1785 1754 1730 1711 1695 1622 1596 1540 80 2271 2115 2015 1944 1849 1788 1746 1714 1690 1671 1655 1579 1552 1494 90 2244 2088 1987 1916 1820 1759 1716 1684 1659 1639 1623 1546 1518 1457 100 2223 2067 1965 1893 1797 1735 1692 1659 1634 1614 1598 1518 1490 1427 200 2129 1971 1868 1794 1694 1629 1583 1548 1521 1499 1481 1391 1357 1279 300 2099 1940 1836 1761 1660 1594 1547 1511 1483 1460 1441 1346 1309 1220 2039 1878 1773 1696 1592 1523 1473 1435 1404 1379 1358 1247 1200 1000 202 Apêndice C Coordenadas polares Observando a Figura 141 podemos particionar um plano usando coordenadas retangulares ou car tesianas ou usando coordenadas polares Se p é um ponto cujas coordenadas são x y e as polares r θ então x r cos θ y r sin θ a Coordenadas retangulares b Coordenadas polares Figura 141 Coordenadas polares e retangulares A área de um círculo Ac de raio r como sabemos é Ac πr2 Se temos dois círculos concêntricos de raios r1 e r2 com r1 r2 então a área da região R chamada coroa circular compreendida entre as duas circunferências como visto na Figura 142 é AR πr2 2 r2 1 A área de um setor circular de raio r e ângulo θ é definida por AS θr2 2 Logo juntando as Figuras 142a e 142b teremos a área de um pedaço de abertura θ de uma coroa circular com raio menor r1 e raio maior r2 como apresentado na Figura 143 definida por Ac θr2 2 r2 1 2 203 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 1 Solução do Exercício 11 na página 16 Sabemos que no Brasil as barragens de mineração apresentam três tipos barragem a mon tante barragem a jusante e barragem linha de centro dos quais esses tipos levam o custo e a segurança da barragem porém todos eles depositam água juntamente com os rejeitos e isto proporciona uma certa instabilidade para a barragem Desse modo podemos ter como problema inicial que a instabilidade das barragens podem estar relacionados aos tipos de bar ragens desenvolvidas no Brasil Existe um outro tipo de barragem que pode ser desenvolvido a seco porém pouco conhecido no Brasil do qual o material acumulado é drenado e acumu lado em pilhas de modo a ficarem expostos à secagem do sol Assim como estudo inicial sobre essa alternativa de construção de barragem poderíamos nortear a pesquisa sob duas hipóteses a serem estudadas Pesquisa 1 H0 Barragens do tipo depósito de rejeito a seco são mais baratas que as existentes no Brasil Pesquisa 2 H0 Barragens do tipo depósito de rejeito a seco são mais seguras que as existentes no Brasil Solução do Exercício 12 na página 16 As propriedades do somatório é parte inerente a quase todas as medidas estatísticas como por exemplo as medidas resumo que compreende as medidas de posição e dispersão Podemos observar nas propriedades I III IV do Teorema 11 que são fundamentais para para as provas do Teorema 31 para as medidas de posição As propriedades V VII VIII estão relacionadas as propriedades da variância das quais algumas dessas estão no Teorema 42 Outras propriedades abordadas que envolvem duas variáveis no Teorema 11 podem ser utilizadas no Capítulo 11 quando formos estudar regressão e correlação linear Claro que as aplicações do somatório não se resumem apenas a esses resultados como consequências Ao longo de todo livro iremos abordar direta ou indiretamente essa técnica Solução do Exercício 13 na página 16 Essas medidas não são iguais por diversos fatores dentre elas a imprecisão dos instrumentos de medida Isso é o que define chamarmos essa característica de interesse no estudo de variá vel pois de elemento a elemento o valor assumido dessa característica varia Outros aspectos dessa variação podem ser as diferentes condições ambientais referentes ao tempo de medida dentre outros 206 Solução do Exercício 14 na página 16 a 4 i1 Xi 2 4 5 1 12 b 5 i1 4 X2 i 4 22 4 42 4 12 200 c 5 i2 Xi 4 5 1 2 12 d n i1 Xi Yi 2 1 4 2 2 8 46 e n i13Xi 2Yi 3 2 2 1 3 2 2 2 3 2 2 8 80 f n i1 XiYi n i1 Y2 i 2 1 4 2 2 8 12 22 82 149 g n i1 Xi 2 4 2 14 h n i1 Yi 1 2 8 19 i n i1 X2 i 22 42 22 50 j n i1 Y2 i 12 22 82 103 k n i1YiXi n i1 Yi Xi 2 1 4 2 2 8 46 l n i1 Yi2 1 2 82 361 m n i1 Xi2 2 4 22 196 n Considerando que n i1 Xin 2 4 25 2 8 unid então n i1Xi 2 82 2 2 82 4 2 82 2 2 82 10 8 unid2 o Considerando que n i1 Yin 1 2 85 3 8 unid então n i1Xi 3 82 2 3 82 4 3 82 2 3 82 30 8 unid2 p n i1 X2 i n i1 Xi2 n 22 42 22 2 4 225 10 8 unid2 q n i1 Y2 i n i1 Yi2 n 12 22 82 1 2 825 30 8 unid2 r h e j bem como i e j apresentam respostas iguais respectivamente Solução do Exercício 15 na página 16 a O Globo Rio de Janeiro Folha de São Paulo São Paulo Tribuna do Norte Rio Grande do Norte A crítica Manaus A Gazeta São Paulo b NET TIM Brisanet Vivo Oi c Samara Diego Anna Albuquerque Matheus Giliwiline d 85 75 65 42 57 Solução do Exercício 16 na página 17 a A população em estudo representa todos os atendimentos a empresa telefônica A b Verificar se o tempo médio em minutos era superior a 10 minutos 207 Capítulo 15 Gabarito dos Exercícios c Tempo de atendimento em minutos e a variável é aleatória contínua d Não podemos identificar o tamanho da população com essas informações mas o tamanho da amostra é possível dado por n 10 Solução do Exercício 17 na página 17 Pesquisa científica Ramos da Estatística Identificar o problema e o objetivo da pesquisa Formular a hipótese estudada Estatística Inferencial Revisão de literatura Formular um plano amostral e identificar as Amostragem Não o classificamos variáveis de interesse para a pesquisa com um ramo da estatística Coleta crítica e tratamento dos dados Estatística descritiva Apresentação dos dados Estatística descritiva Análise e interpretação dos dados Estatística inferencial e Probabilidade Conclusão e derivação dad conclusão que Estatística inferencial e Probabilidade poderá rejeitar ou não a hipótese estudada gerando assim uma confirmação ou indagações para outros problemas Apresentação dos dados por meio de trabalhos Estatística descritiva científicos para a propagação do conhecimento sobre o problema estudado Solução do Exercício 18 na página 17 Devemos observar nessa tabela a presença de algumas variáveis como Região Norte Nor deste Sudeste Sul CentroOeste e Brasil Zona Urbano e Rural Estado Nutricional Ma greza Adequado Sobrepeso I e Sobrepeso II e III e Número Vale lembrar que os valores internos da tabela representam a distribuição percentual de pes soas que se enquadram em um determinado estado nutricional separados por região Assim considerando que temos todos os valores de IMC das pessoas entrevistadas 2028 pessoas e que esta é representada pela variável X a a soma de todos os IMCs do Brasil levando em consideração a todas as outras variáveis pode ser representada por 2028 i1 Xi b Agora o total do IMC de homens do nordeste 586 pessoas e que estes são representados pela variável Y então 586 j1 Yj 151 c Por fim considerando o total do IMC de homens da zona urbana podemos aproveitar a notação anterior e complementar com um outro indexador k 1 2 se k 1 teremos uma pessoa da zona urbana e se k 2 teremos uma pessoa da zona rural então como representação de soma geral teríamos 586 j1 Yjk k 1 2 152 208 As expressões 151 e 152 são equivalentes Restringindo a soma apenas para homens da zona urbana temos 586 j1 Yj1 Este último resultado significa que alguns valores de Yj1 serão iguais a 0 pois sabemos pela tabela que há apenas 267 homens da zona urbana Solução do Exercício 19 na página 18 Fazendo D n i1 Xi A2 Expandindo o somatório e derivando D em relação a Atemse D n i1 Xi A2 n i1 X2 i 2AXi A2 n i1 X2 i n i1 2AXi n i1 A2 dD dA 2 n i1 Xi 2nA Igualando a derivada a zero e resolvendo em A temse dD dA 2 n i1 Xi 2nA 0 2nA 2 n i1 Xi A n i1 Xi n Certificando se o ponto é de máximo ou de mínimo d2D dAdA 2n 0 Como a segunda derivada é maior que zero fica provado que o ponto é de mínimo 209 Capítulo 15 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 2 Solução do Exercício 21 na página 30 Como desejamos não incluir as condições limiares às indagações podemos expressar as frequências acumuladas abaixo de e acima de como Faci i1 j1 Fj i 1 2 k 153 e Faci k ji1 Fj i 1 2 k 154 respectivamente sendo k o número de grupos ou classes Solução do Exercício 22 na página 30 Iremos apresentar os resultados para a distribuição de frequência do estado nutricional a nível de Brasil sem especificar as regiões do país Portanto temos Zona Estado Nutricional Xij Frequência Fij Urbano i 1 Magreza j 1 62 Adequado j 2 594 Sobrepeso I j 3 306 Sobrepeso II e III j 4 76 Rural i 2 Magreza j 1 116 Adequado j 2 710 Sobrepeso I j 3 140 Sobrepeso II e III j 4 24 Total 2028 Solução do Exercício 23 na página 31 Vamos representar esses dados por meio de um gráfico de barras bem como o seu código em R isto é 210 E segue o script R Script 1 Pacotes 2 installpackagesggplot2 3 4 Dados 5 dado readtableex22csv h T sep 6 7 Anexando o pacote 8 libraryggplot2 9 10 Gerando o grafico 11 ggplotdado 12 aesx estnut fill zona weight feq 13 geombar 14 scalefillhue 15 labsx EstadoNutricional y Frequência fill Zona 16 coordflip 17 themebw 18 facetgridvars varsregiao Solução do Exercício 24 na página 31 Para tabularmos esses dados temos que a variável é quantitativa contínua Assim tabulare mos esses dados agrupandoos em intervalos de classe Calculando o número de classes k inicialmente temos k n 25 5 classes Sabemos que a amplitute total é dada por At e a amplitude de cada classe c é dada por c At k 1 59 45 1 14 85 211 Capítulo 15 Gabarito dos Exercícios Por fim para o cálculo do limite inferior da primeira classe temos LI1a9 6 14 852 2 175 Ao final basta seguir o algoritmo para o desenvolvimento da distribuição de frequências abordado nesse capítulo e assim apresentamos a tabela de distribuição de frequências Classe Fi PM Fr Fac1 Fac2 Fp Fac1p Fac2p 1 217 1702 600 959 024 600 2500 2400 2400 10000 2 1702 3188 1000 2445 040 1600 1900 4000 6400 7600 3 3188 4673 600 3930 024 2200 900 2400 8800 3600 4 4673 6158 200 5416 008 2400 300 800 9600 1200 5 6158 7642 100 6900 004 2500 100 400 10000 400 212 Solução dos Exercícios do Capítulo 3 Solução do Exercício 31 na página 48 Vamos inicialmente inserir na tabela de notas a coluna dos pontos médios das classes e a frequência acumulada abaixo de faci do qual segue Notas Fi Xi Faci 0 2 4 1 4 2 4 12 3 16 4 6 15 5 31 6 8 13 7 44 8 10 6 9 50 Média X 1 4 3 12 9 6 50 5 2 pontos em que a notas dos estudantes se distribuem em torno desse valor Mediana MdX 4 25 16 15 2 5 2 pontos em que a distribuição das notas dos estudantes abaixo e acima de 5 2 pontos represen tam 50 dos dados Moda MoX 4 3 3 2 2 5 2 pontos em que esta representa a nota de maior frequência Solução do Exercício 32 na página 48 Usando o fato de que N n então µ X Essa soma de quadrados é minimizada quando o desvio é em relação a media amostral Logo a primeira soma é a menor desde que X µ Solução do Exercício 33 na página 48 Para as duas transformações X e Y dada uma amostra fixada as medidas X e S podem ser consideradas como uma constante pois elas não se alteram Então usando a propriedade II para os Teoremas 31 32 e 33 temos que respectivamente a média a mediana e a moda de Y são iguais a 0 Usando esses mesmos teoremas para o cálculo da média mediana e moda de Z precisamos redefinir essa variável como Zi XiS XS Assim para XiS basta considerarmos que Xi está multiplicado por uma constante k1 1S e daí usamos a propriedade I dos teoremas citados acrescido de outra constante k2 XS do qual usamos a propriedade II desses mesmos teoremas logo a média média e moda serão também iguais a 0 Para que haja um entendimento mais claro faremos a prova apenas para a média nas duas transformações e para as demais medidas deixaremos como exercício para os leitores 213 Capítulo 15 Gabarito dos Exercícios Média de Y Y n i1 Yi n n i1 Xi X n n i1 Xi n X X X 0 Média de Z Z n i1 Zi n n i1 Xi k1 k2 n n i1 Xi k1 n k2 k1 n i1 Xi n k2 k1 X k2 XS XS k1 1S e k2 XS 0 Solução do Exercício 34 na página 48 Considere o salário dos funcionários representado pela variável X cuja média salarial é dada por X Considere o reajuste salarial representado pela variável Y dada por Y X 0 10X 1 1X Assim para calcularmos a média reajustada isto é Y basta usarmos o resultado da proprie dade II do Teorema 31 isto é Y 1 1 X 1 1 1500 1650 reais Solução do Exercício 35 na página 48 Considere que a nota dos alunos podem ser representados pela variável Xi com i 1 2 n em que n representa o número de alunos que fizeram a prova Considere ainda o índice H na variável XHj representa o aluno j do sexo masculino que obteve nota XHj tal que j 1 2 nH sendo nH o número de rapazes que fizeram a prova E de modo similar o índice M na variável XMk representa a aluna k do sexo feminino que obteve nota XMj tal que k 1 2 nM sendo nM o número de moças que fizeram a prova Dessa forma a proporção 214 de mulheres que fizeram a prova é n i1 Xi nM k1 Xk nH j1 Xj n X nM XM nH XH 5 8n 6 3nM 4 3nH n nH nM 5 8n 6 3nM 4 3n nM 5 8n 4 3n 6 3nM 4 3nM 0 75n nM Portanto há 75 dos alunos que realizaram a prova eram mulheres Solução do Exercício 36 na página 48 Essa questão limita a menor nota tirada nessa prova bem como o número de alunos com a nota desejada Dessa forma o valor máximo para que tenhamos uma quantidade nX de alunos que retiram nota 90 pontos é considerar que os demais n nX retiraram o valor mínimo que é 60 pontos Caso algum dos n nX alunos tenham retirado nota acima de 60 pontos com certeza o número de alunos que retirou 90 pontos será menor que nX Assim o valor de nX pode ser encontrado da seguinte forma 30 i1 Xi 30 70 6030 nX 90nX 30 70 60nX 90nX 2100 1800 nX 30030 10 Logo o número máximo de alunos que tirou 90 pontos foi nH 10 215 Capítulo 15 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 4 Solução do Exercício 41 na página 64 I Considerando uma amostra X1 X2 Xn assumimos que X e SX são a média e o desvio padrão Dado a transformação Yi Xi c para i 1 2 n e c uma constante podemos afirmar pelos Teoremas 31 e 43 respectivamente que a média e o desvio padrão de Yi podem ser dadas por Y X c e SY SX respectivamente Dessa forma sabendo que o coeficiente de variação de Xi é dado por CVX SX X então o coeficiente de variação de Yi é CVY SY Y Solução do Exercício 42 na página 64 Solução do Exercício 43 na página 64 Solução do Exercício 44 na página 64 Solução do Exercício 45 na página 64 Solução do Exercício 46 na página 65 Solução do Exercício 47 na página 65 216 Solução dos Exercícios do Capítulo 5 Solução do Exercício 51 na página 99 Verifique a Definição 51 e formule uma resposta Solução do Exercício 52 na página 99 Verifique as Definições 52 e 53 e formule uma resposta Solução do Exercício 53 na página 99 a Consideremos Ci e Ki as faces superiores cara e coroa respectivamente para as moedas i 1 2 Assim o espaço amostral é dado por Ω C1 C2 C1 K2 K1 C2 K1 K2 e Ω 4 b Segue o resultado para o dado Dado 1 2 3 4 5 6 Resultado Ímpar Par Ímpar Par Ímpar Par Considerando que foi lançado duas vezes o dado cada elemento é um par de resultados e ainda mesmo alguns resultados representando elementos iguais como por exemplo Par Par 2 2 2 4 2 6 no espaço amostral só teremos o elemento Par Par Assim o espaço amostral é dado por Ω Par Par Par Ímpar Ímpar Par Ímpar Ímpar com Ω 4 c O espaço amostral para a somas das faces superiores de dois dados lançados é Ω 2 3 4 5 6 7 8 9 10 11 12 com cardinalidade Ω 11 d O espaço amostral para esse experimento aleatório considerando F pessoa do sexo femi nino e M pessoa do sexo masculino é Ω F F F F F M F M F M F F F M M M M F M F M M M M com cardinalidade Ω 8 Solução do Exercício 54 na página 99 Essa questão exige um conhecimento avançado de progrressão aritmética Vejamos iniciase o jogo com A posteriormente B Enquanto ninguém ganhar o jogo prossegue Dessa forma as jogadas em que A pode ganhar são 1ª 3ª 5ª 7ª e assim por diante As jogadas em que B pode ganhar são 2ª 4ª 6ª e assim por diante a Vejamos as chances de A ganhar Jogada Situação Probabilidade 1ª 3 moedas caras ou 3 coroas 2 123 14 3ª A perder B perder e A ganhar 342 14 5ª A perder B perder A perder B perder e A ganhar 134 14 Percebese que a sequência 14 143421 143422 143423 é uma pro gressão geométrica PG em que o primeiro elemento é a1 14 e a razão é q 342 217 Capítulo 15 Gabarito dos Exercícios Podese mostrar que a soma infinita de uma PG é dada por S a1 1 q 155 que representa a probabilidade de A ganhar isto é PA ganhar 14 1 342 47 b As chances de B ganhar são Jogada Situação Probabilidade 2ª A perder e B ganhar 1 1414 34 14 4ª A perder B perder A perder e B ganhar 343 14 6ª A perder B perder A perder B perder A perder e B ganhar 345 14 A série pode ser expressa como 316 316 3421 316 3422 e assim por diante Pelo mesmo raciocínio feito na probabilidade de A ganhar temos que a probabili dade de B ganhar é PB ganhar 316 1 342 3 7 Solução do Exercício 55 na página 99 a E Evento ser Esportista logo PE 400010000 0 40 b EA Esportista e aluno da Administração logo PEA 10010000 c E Evento ser esportista C Evento ser da C Contábeis logo PE C PE PC PE C 400010000 70010000 20010000 450010000 d E Evento ser esportista A Evento ser da administração como PE A PE PA PE A 400010000 50010000 10010000 440010000 logo PE Ac 1 440010000 Solução do Exercício 56 na página 99 PA B PA PB PA B PB PA B PA B PA 0 5 0 1 0 2 0 4 218 Capítulo 15 Gabarito dos Exercícios Solução do Exercício 512 na página 100 Considerando os eventos V bola de volei B bola de basquete A1 bola no armário 1 A2 bola no armário 2 assim a PVA1 PVA1 A1 39 49 3 4 b PBA2 PBA2 PA2 29 59 2 5 c Essa questão nos remete uma atenção O enunciado está desejando calcular a probabilidade de escolher um armário e em seguida uma de suas bolas sendo esta de basquete Como neste ítem não foi identificado qual armário seria o escolhido vamos identificar o evento A 1 que representa a escolha do armário 1 e o evento A 2 que representa a escolha do armário 2 Estes eventos são diferentes dos eventos A1 e A2 respectivamente pois estes últimos representam os eventos de escolher as bolas nestes respectivos armários e não a escolha do armário Logo a chance de escolhermos um dos armários é 50 isto é PA 2 PA 2 12 Dessa forma a probabilidade de escolhermos um armário e uma bola de basquete pode ser dada por PB PA 1 PBA1 PA 2 PBA2 12 14 12 25 13 40 0 3250 Solução do Exercício 513 na página 101 Seja A o evento do estudante ter mais de 180m e considere M o evento do estudante ser mulher Temos as seguintes informações disponíveis PH 0 60 PM 0 40 PAH 0 05 e PAM 0 02 Para calcularmos o evento A temos PA PA M PA H PAMPM PAHPH 0 02 0 40 0 05 0 6 0 038 220 Assim para calcularmos PMA temos PMA PM A PA 0 008 0 038 0 2105 Solução do Exercício 514 na página 101 Considere o evento H homem está vivo e o evento M mulher está viva Assim a PH Mc PH PMc 3 5 1 4 3 20 b PHc M PHc PM 2 5 3 4 6 20 c PH M PH PM 3 5 3 4 9 20 Solução do Exercício 515 na página 101 a PA B PA PB PB 0 8 0 5 0 3 b PA B PA PB PA B Se A e B são independentes então PA B PA PB Logo PA B PA PB PAPB PA PB1 PA PA PBPAc 0 8 0 5 PB 0 5 que resulta em PB 0805 05 03 05 0 60 Solução do Exercício 516 na página 101 Considerando que PBc 1 PB 0 6 então PABc PA Bc PBc 0 4 0 6 0 6667 Solução do Exercício 517 na página 101 Problema resolvido pelo teorema de Bayes Consideremos o evento G o evento das vitórias 221 Capítulo 15 Gabarito dos Exercícios do São Paulo e X o evento de chover Assim PXG PGXPX PGXPX PGXcPXc 0 7 0 3 0 7 0 3 0 8 0 7 0 21 0 77 0 2727 Solução do Exercício 518 na página 101 Considerando D o evento defeito temos PBD PDBPB PDAPA PDBPB PDCPC 0 05 0 50 0 03 0 30 0 05 0 50 0 02 0 20 0 0250 0 038 0 6579 Solução do Exercício 519 na página 101 Seja T o evento de gostar de teatro e B o evento de gostar de cinema Assim temos que T T B T Bc a Como PT B 0 então PT Bc PT 13 b PT Bc PT PTPB 13 13 12 16 c Nesse caso T B logo T Bc Assim PT Bc 0 d PT Bc PT PT B 13 18 524 e Sabemos que PTcBc 34 e que PTcBc PTBc 1 então PTBc 14 Sabe mos também que PT Bc PTBc PBc PTBc 1 PB 141 12 18 Solução do Exercício 520 na página 102 222 PA B PA PB PA B p2 p2 p4 2p2 p4 Solução do Exercício 521 na página 102 PA B C PA PB PC PA B PA C PB C PA B C p p p p2 p2 p2 p3 3p 3p2 p3 Solução do Exercício 522 na página 102 FXx 0 se x 0 157267837 160044908 se 0 x 1 158093995 160044908 se 1 x 2 1 se x 2 Solução do Exercício 523 na página 103 Considere a função de probabilidade x 5 7 8 20 pXx 02 03 04 01 Assim temos que a PX 7 PX 5 PX 7 0 2 0 3 0 5 b PX 7 PX 5 0 2 c P8 X 18 PX 8 0 4 223 Capítulo 15 Gabarito dos Exercícios d PX 15 PX 20 0 1 e A esperança é calculada da seguinte forma EX 5 0 2 7 0 3 8 0 4 20 0 1 8 3 unid a mediana é um número entre 7 e 8 pois abaixo e acima desses respectivos números temos 50 e por conveniência assumimos µd 7 82 7 5 unid isto é o ponto médio entre os dois valores centrais e por fim a moda é o valor de maior chance isto é µ0 8 unid Solução do Exercício 524 na página 103 Seja PA PA B PA Bc 156 e seja PB PA B PB Ac 157 Considere ainda que os eventos A Bc e Ac B são disjuntos Assim PA Bc Ac B PA Bc PAc B 158 Substituindo 156 e 157 em 158 temos PA Bc Ac B PA PA B PB PA B PA PB 2PA B o que prova o resultado 224 Capítulo 15 Gabarito dos Exercícios Tabela Z 001 19 04719 d PZ 1 13 0 5000 0 3708 0 8708 Graficamente temos Tabela Z 003 11 03708 e PZ 2 13 0 5000 0 4834 0 0166 Graficamente temos Tabela Z 003 21 04834 Solução do Exercício 64 na página 135 a Fazendo a transformação Z Xµ σ 3340 6 1 17 temos que PX 33 PZ 1 17 0 5000 P1 17 Z 0 0 5000 0 3790 0 1210 b Fazendo a transformação Z Xµ σ 2940 6 1 83 temos que PX 29 PZ 1 83 P1 83 Z 0 0 5000 0 4664 0 5000 0 9664 c Fazendo a transformação Z Xµ σ 2940 6 1 83 temos que PX 29 PZ 1 83 P1 83 Z 0 0 5000 0 4664 0 5000 0 9664 d Z 0 20 X µ Zσ 40 0 20 6 38 8 Tabela 226 Z 000 02 007926 e Z 1 28 X µ Zσ 40 1 28 6 47 68 Tabela Z 008 12 039973 f PZ 0 0 5000 Solução do Exercício 65 na página 135 Z X µ σ 5 6 1 5 0 67 PX 5 PZ 0 67 0 5000 P0 Z 0 67 0 5000 0 2486 0 7486 Logo entre 120 candidatos o número de candidatos aprovados é 120 0 7486 89 83 90 candidatos Solução do Exercício 66 na página 135 Tabela Z 008 12 039973 Z 1 28 µX X Zσ 400 1 28 20 425 60g Solução do Exercício 67 na página 136 CONCEITO A Considerando que µ σ 4 5 2 3 6 8 então Zµσ 6 8 4 5 2 3 1 Logo P XA µ σ P XA 6 8 PZ 1 0 5000 0 3413 0 1587 227 Assim para que PX 1 0 90 temos que PX 0 0 10 logo 0 85n 0 10 n log0 85 log0 10 0 16252n 2 30259 1 0 16252n 2 30259 n 2 30259 0 16252 n 14 1780 Para n 14 PX 1 0 8972 e para n 15 PX 0 9126 Portando n 15 As figuras abaixo podem auxiliar no entendimento do resultado Solução do Exercício 611 na página 136 a PX 0 0 300e030 0 0 7408182 b Como λ 0 3 824 0 1 alterações8 horas então PX 1 1 PX 0 PX 1 1 0 9048374 0 09048374 0 00467884 229 Solução dos Exercícios do Capítulo 7 231 Capítulo 15 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 8 232 Solução dos Exercícios do Capítulo 9 Solução do Exercício 91 na página 159 Solução do Exercício 92 na página 159 Solução do Exercício 93 na página 159 Solução do Exercício 94 na página 159 Solução do Exercício 95 na página 159 Solução do Exercício 96 na página 160 233 Capítulo 15 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 10 Solução do Exercício 101 na página 167 a Vamos assumir que as questões são independentes e que a variável aleatória X denota o número de acertos entre as 10 questões Portanto X tem distribuição binomial com parâmetros n 10 e p desconhecido Supondo que adotamos a seguinte regra de decisão o aluno não está advinhando se acertar 8 ou mais questões Isto equivale a Rejeitar H0 se X 8 Dessa forma a região crítica do teste é CΥ X X 8 É possível também que o aluno acerte 8 ou mais questões e esteja advinhando isto é podemos rejeitar H0 dado que ela é verdadeira A probabilidade de que isso ocorra é PX 8p 12 10 k8 12k1 1210k 0 055 Solução do Exercício 102 na página 167 Solução do Exercício 103 na página 167 Solução do Exercício 104 na página 167 Solução do Exercício 105 na página 168 Solução do Exercício 106 na página 168 234 Solução dos Exercícios do Capítulo 11 Solução do Exercício 111 na página 179 Solução do Exercício 113 na página 179 Solução do Exercício 113 na página 179 235 Capítulo 15 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 12 236 Solução dos Exercícios do Capítulo 13 237 Capítulo 15 Gabarito dos Exercícios Solução dos Exercícios do Capítulo 14 238 Referências Bibliográficas COMPANY B P BP statistical review of world energy London 2018 DEVORE J L Probabilidade e Estatística para Engenharia e Ciências 6 ed São Paulo Cengage Learning 2006 692 p Tradução Joaquim Pinheiro Nunes da Silva FERREIRA D F Estatística Básica 2 revisada ed Lavras Editora UFLA 2009 664 p HITE S Woman and love A cultural revolution in progress New York Knopf 1987 922 p JAMES B R Probabilidade um curso em nível intermediário 3 ed Rio de Janeiro IMPA 2004 304 p LOHR S L Sampling Design and analysis Boca Raton CRC Press 2019 596 p Magalhães M N LIMA A C P de Noções de Probabilidade e Estatística 7 ed São Paulo Edusp 2015 416 p MONTGOMERY D C RUNGER G C Estatística Aplicada e Probabilidade para Engenheiros 6 ed Rio de Janeiro LTC 2016 629 p Tradução Verônica Calado MORETTIN L G Estatística básica probabilidade e inferência Volume único São Paulo Pearson Prentice Hall 2010 390 p Presidential Comission On the Space Shuttle Challanger Accident Washington 1986 I 256 p SEKER S KALKAN T UZUM G CELIK C CEREZCI O Em effects of different mobile handsets on rats brain In 2002 IEEE International Symposium on Electromagnetic Compatibility Sl sn 2002 v 2 p 667670 vol2 SILVA J G C da Planejamento da Pesquisa Experimental Base conceitual e metodológica Pelotas Instituto de Física e Matemática 2007 509 p TAVARES E L ANJOS L A do Perfil antropométrico da população idosa brasileira resultados da pesquisa nacional sobre saúde e nutrição Cad Saúde Pública Rio de janeiro v 15 n 4 p 759768 outdez 1999 239 Índice Remissivo desvio padrão distribuição Bernoulli 106 distribuição Binomial 111 distribuição Poisson 120 distribuição Bernoulli 104 Binomial 107 Normal 122 Normal Padrão 128 Poisson 116 espaço amostral 67 contínuo 68 discreto 68 esperança matemática distribuição Bernoulli 106 distribuição Binomial 111 distribuição Poisson 120 experimentos aleatórios 66 de Bernoulli 104 106 116 função de probabilidade Bernoulli 104 Binomial 108 Poisson 118 função densidade de probabilidade Normal 123 Normal Padrão 128 medidas de posição 32 mediana 36 moda 44 média 32 R pacote stats dbinom 107 dpois 117 118 121 122 pbinom 107 ppois 117 121 subconjunto 69 variância distribuição Bernoulli 106 distribuição Binomial 111 distribuição Poisson 120 240