·
Cursos Gerais ·
Métodos Quantitativos Aplicados
Send your question to AI and receive an answer instantly
Recommended for you
1
Funcao Afim e Quadratica - Anotacoes de Aula
Métodos Quantitativos Aplicados
UMG
1
Análise da Função Afim do Caminho de um Skatista
Métodos Quantitativos Aplicados
UMG
27
Introducao a Teoria da Medida-Importancia e Aplicacoes em Pesquisas
Métodos Quantitativos Aplicados
UMG
94
Plano de Aula Estatística - Correlação Linear Simples e Regressão
Métodos Quantitativos Aplicados
UMG
1
Anotacoes Aulas de Nocoes de Probabilidade Distribuicao dos Estimadores e Testes de Hipoteses
Métodos Quantitativos Aplicados
UMG
102
Metodos Quantitativos Aplicados a Corporate Finance - Guia Completo FGV 2023
Métodos Quantitativos Aplicados
UMG
1
Análise da Variabilidade e Medidas de Dispersão
Métodos Quantitativos Aplicados
UMG
1
Estatistica Inferencial - Parte 2 - Correlação Regressão e Testes
Métodos Quantitativos Aplicados
UMG
1
Apostila de Estatística e Funções - Afim Quadrática Descritiva Inferencial
Métodos Quantitativos Aplicados
UMG
1
Estatística Inferencial - Noções de Probabilidade e Testes de Hipóteses
Métodos Quantitativos Aplicados
UMG
Preview text
Unidade 4 Distribuições de probabilidades e testes de hipóteses 3 Introdução da Unidade Agora que já definimos e aprendemos a calcular a probabilidade de um evento acontecer vamos entender um pouco mais a respeito dela incluindo situações de análises que facilitarão a resolução de problemas probabilísticos e a definir melhor a probabilidade de eventos acontecerem Isso se dará com a probabilidade condicional com a independência de eventos Também vamos estudar as variáveis aleatórias que como o próprio nome diz são valores variáveis que descreverão as probabilidades de eventos acontecerem Uma vez que definirmos as variáveis aleatórias veremos como calcular os valores das probabilidades correspondentes e esse conjunto das variáveis e das probabilidades correspondentes é denominado distribuição de probabilidades Essas distribuições podem assumir formas discretas e contínuas que serão detalhadas Associaremos então os já conhecidos desvio padrão e variância a essas distribuições para que fique ainda mais clara a sua importância Veremos também o que são populações e amostras novamente agora associando à ideia de parâmetros Veremos como são as distribuições amostrais e que a distribuição normal é a mais usada Ela servirá de base para conhecermos uma teoria de probabilidade e depois para entender como são feitos os testes estatísticos Vamos também entender que tipos de erros podemos ter em um teste estatístico Objetivos Entender os conceitos relacionados às múltiplas probabilidades Conhecer formas de distribuição de probabilidades discretas e contínuas Conhecer distribuições amostrais Conhecer testes de Hipóteses e Verificar as possibilidades de erros 4 Conteúdo programático Aula 01 Distribuição de probabilidades Aula 02 Testes de Hipóteses Você poderá também assistir às videoaulas em seu celular Basta apontar a câmera para os QRCodes distribuídos neste conteúdo Pode ser necessário instalar um aplicativo de leitura QRcode no celular e efetuar login na sua conta Gmail 5 Aula 01 Distribuição de probabilidades Probabilidade Condicional Algumas vezes queremos associar eventos e calcular a probabilidade de eles acontecerem em sequência Por exemplo qual é a probabilidade de se retirar um rei do baralho e de ele ser de copas Chamamos isso de probabilidade condicional e organizamos essa questão no seguinte enunciado Qual é a probabilidade de sortear uma carta de copas no baralho dado que foi sorteado um rei O evento em que ambos A e B ocorrem é chamado A interseção B portanto a probabilidade do evento A ocorrer ser sorteada uma carta de copas dado que B ocorreu foi sorteado um rei é de 𝑃𝐴𝐵 𝑃𝐴 𝐵 𝑃𝐵 𝑃𝑠𝑒𝑟 𝑟𝑒𝑖 𝑒 𝑑𝑒 𝑐𝑜𝑝𝑎𝑠 𝑎𝑜 𝑚𝑒𝑠𝑚𝑜 𝑡𝑒𝑚𝑝𝑜 𝑃𝑠𝑒𝑟 𝑟𝑒𝑖 1 52 4 52 1 4 25 Isso significa que a probabilidade de A ocorrer dado que B ocorreu é igual à probabilidade de ocorrência simultânea de A e B dividida pela probabilidade de ocorrência de B note que essa definição não se aplica quando PB0 afinal se assim fosse estaríamos dividindo por zero e como estamos partindo do princípio de que B aconteceu sua probabilidade de acontecimento não pode ser zero Exemplo Dois dados são lançados Consideremos os eventos A e B A é o evento em que a soma das faces superiores dos dados é 10 e B é o evento em que a face superior do primeiro dado é maior do que a do segundo 6 Em termos matemáticos temos A x1 x2 x1x210 e B x1 x2 x1 x2 onde x1 é o resultado do dado 1 e x2 é o resultado do dado 2 Qual é a probabilidade de que eu tenha a soma 10 dado que o resultado do primeiro dado é maior do que o do segundo PA Probabilidade da somar dar 10 A soma dá 10 nos casos 46 55 64 Então essa probabilidade é 336 PB Probabilidade do resultado do primeiro dado ser maior do que o do segundo O resultado do primeiro dado é maior do que o do segundo nos casos 21 31 32 41 42 43 51 52 53 54 61 62 63 64 65 Então essa probabilidade é 1536 PAB Probabilidade de a soma dar 10 e do resultado do primeiro dado ser maior do que o do segundo Isso só acontece no caso 64 A probabilidade de isso acontecer é 136 𝑃𝐴𝐵 1 36 15 36 1 15 Qual é a probabilidade de que o resultado do primeiro dado seja maior que o do segundo dado que a soma dos dados deu 10 𝑃𝐵𝐴 1 36 3 36 1 3 Como vimos que 𝑃𝐴𝐵 𝑃𝐴 𝐵 𝑃𝐵 7 Podemos brincar matematicamente com a fórmula de modo a termos 𝑃𝐴 𝐵 𝑃𝐴𝐵 𝑃𝐵 Essa brincadeira pode nos ajudar a conseguir outros resultados usando a mesma fórmula Independência Estatística Quando um evento não tem relação nenhuma com o outro sua interseção é nula são mutuamente excludentes Nesse caso a probabilidade de acontecer os dois eventos simultaneamente é zero Então esse evento é considerado independente do outro Nesse caso tendo dois eventos independentes A e B a probabilidade de A é igual à probabilidade condicional de A dado B PA PAB Usando a fórmula 𝑃𝐴 𝐵 𝑃𝐴𝐵 𝑃𝐵 Vamos conseguir um resultado interessante para eventos independentes 𝑃𝐴 𝐵 𝑃𝐴 𝑃𝐵 Exemplo Em uma caixa de leite com 12 caixinhas 4 estão estragadas 2 caixinhas são abertas uma após a outra Qual a probabilidade de que ambas sejam boas A a 1ª caixinha é boa B a 2ª caixinha é boa P A B PA PBA 812711561311433 Isto é se PAPAB É evidente que se A é independente de B B é independente de A PBPBA Se A e B são independentes então temos que 8 P A B PA P B Regra de Bayes Essa é uma regra que ajuda a descobrir probabilidades de um evento acontecer dado outro evento É uma generalização da probabilidade condicional para mais de dois eventos Sejam A1 A2 A3An n eventos mutuamente exclusivos tais que A1 A2 An S Sejam PAi as probabilidades conhecidas dos vários eventos e B um evento qualquer de S Podemos calcular a probabilidade de Ai acontecer dado B desde que sejam conhecidas todas as probabilidades condicionais PBAi Esse teorema também é chamado de Teorema da Probabilidade a Posteriori Ele relaciona uma das parcelas da probabilidade total com a própria probabilidade total Vamos ver alguns exemplos em que essa propriedade é importante para se resolver o problema Sendo PA 34 PB 13 e P A B 1112 calcular PAB Solução Como P A B P A B devemos calcular P A B PB Como P A B PA PB P A B temos 1112 34 13 P A B 1112 912 412 P A B 1112 1312 P A B P A B 21216 logo PAB 16 13 ½ 50 9 Em certo colégio 10 dos meninos e 12 das meninas gabaritaram as provas de estatística Por outro lado 40 dos estudantes são meninos Se um estudante é selecionado aleatoriamente e gabaritou a prova de estatística qual a probabilidade de que o estudante seja menina Solução Temos que PGaH 010 Probabilidade de ter gabaritado a prova dado que é menino PGaM 012 Probabilidade de ter gabaritado a prova dado que é menina PH 04 Probabilidade de ser menino PM 06 Probabilidade de ser menina O que queremos saber é a probabilidade de ser uma menina a aluna escolhida dado que ela gabaritou a prova Isto é queremos calcular PMGa 𝑃𝑀𝐺𝑎 𝑃𝑀𝑃𝐺𝑎𝑀 𝑃𝑀𝑃𝐺𝑎𝑀𝑃𝐻𝑃𝐺𝑎𝐻 06012 0601204010 0072 00720040643 Isso significa que a probabilidade de ser uma menina dado que gabaritou a prova é 643 Videoaula 1 Agora assista a um vídeo explicando as probabilidades condicionais e a relação entre probabilidades apresentadas nessa aula 10 Variáveis aleatórias Mesmo que tenhamos experimentos aleatórios que produzam resultados não numéricos podemos transformar seus resultados em números o que é feito por meio da variável aleatória que é uma regra de associação de um valor numérico a probabilidade de acontecer aquele evento a cada ponto do espaço amostral Portanto variáveis aleatórias são variáveis numéricas que podemos associar a modelos probabilísticos Começaremos nosso estudo sobre as variáveis aleatórias entendendo que ela tem um valor numérico para cada resultado de um experimento Depois vamos associar a probabilidade devida a cada resultado numérico de um experimento com a distribuição de probabilidades Definição Vamos imaginar um experimento que chamaremos de E que pode ser o lançamento de dois dados por exemplo S é o nome dado ao espaço amostral associado a esse experimento isto é todos os valores possíveis para esse experimento S11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 A variável aleatória é a função X que associa a cada elemento s S um número real Xs Isto é a variável aleatória vai levar cada elemento de S a um novo conjunto numérico S X Videoaula 1 Agora assista a um vídeo explicando as probabilidades condicionais e a relação entre probabilidades apresentadas nessa aula Utilize o QRcode para assistir 11 Exemplo E lançamento de dois dados X soma das faces dos dados que caírem voltadas para cima S11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 X 2 corresponde ao evento 11 com probabilidade 136 de acontecer 278 de chance de acontecer Veja que a variável aleatória X levou o elemento 11 no elemento 2 X 3 corresponde ao evento 12 21 com probabilidade 236 de acontecer 556 de chance de acontecer Veja que a variável aleatória X levou dois elementos 12 e 21 no mesmo elemento 3 Por isso ela tem uma probabilidade maior de acontecer E assim por diante Podemos ter um valor de x com maior probabilidade Neste caso seria o X7 Empregamos o nome de variável aleatória para descrever o valor da probabilidade correspondente ao resultado de determinado experimento As variáveis aleatórias também podem ser discretas ou contínuas e temos as seguintes definições Variáveis Aleatórias Discretas Admite um número finito de valores ou tem uma quantidade enumerável de valores isto é 1 2 3 4 Variáveis Aleatórias Contínuas pode tomar um número infinito de valores e esses valores podem ser associados a mensurações em uma escala contínua admite valores decimais como 123 Xs s Variável Aleatória 12 Videoaula 2 Agora assista a um vídeo mostrando o que são variáveis aleatórias e como elas são conseguidas Distribuição de probabilidade Já no exemplo dado para definir as variáveis aleatórias começamos a associar um cálculo muito interessante para cada valor da variável a sua probabilidade de acontecer Vimos por exemplo que o valor da variável X3 tem uma probabilidade de 556 de chance de acontecer É muito interessante quando conseguimos calcular as probabilidades de cada valor da variável aleatória acontecer Quando temos esse dado o conjunto das variáveis e das suas probabilidades correspondentes é denominado distribuição de probabilidades isto é o conjunto de todos os xipxi com o i12n é denominada distribuição de probabilidades de x Função de densidade de probabilidade É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente isto é PXxi PAi com i12 n Esperança matemática variância e desvio padrão propriedades Para as distribuições de probabilidades de uma variável aleatória discreta a média recebe um outro nome devido a chance daquele valor acontecer é chamada de esperança Videoaula 2 Agora assista a um vídeo mostrando o que são variáveis aleatórias e como elas são conseguidas Utilize o QRcode para assistir 13 matemática Assim como temos a média também temos a variância e o desvio padrão dos valores da distribuição de probabilidades São os parâmetros das distribuições a saber Esperança matemática ou simplesmente média E x é a média aritmética das probabilidades Variância VAR x Assim como a variância é a medida de dispersão dos dados em torno da média a variância na distribuição de probabilidades também é a medida do grau de dispersão ou de concentração das probabilidades em torno da média A média é um número representativo dos dados de probabilidade porém precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno dessa média Desvio Padrão DPX é o desvio padrão das probabilidades e é calculado tirando se a raiz quadrada da variância Distribuições discretas Bernoulli Binomial e Poisson Já sabemos que ao determinarmos todos os pontos possíveis em um evento estamos encontrando o seu espaço amostral Podemos operar com esses pontos e encontrar as probabilidades desses resultados acontecerem aí temos uma função de probabilidade Quando usamos uma função X que está definida dentro do espaço amostral de um evento e se os valores encontrados nessa função são enumeráveis podem ser associados à ideia de contagem essa função é chamada de variável aleatória discreta Exemplo Vamos imaginar que nosso espaço amostral são os resultados dos lançamentos de duas moedas Nossa variável aleatória discreta poderia ser o número de caras nesses lançamentos Veja que o evento foi jogar duas moedas e observar a face superior resultado do lançamento E veja também que a variável aleatória é enumerável já que vamos ter um número contável de caras que vai ser 0 1 ou 2 caras por isso é chamada de variável aleatória discreta Uma variável aleatória discreta X é caracterizada quando conseguimos saber quais são os possíveis valores x1 x2 xk no caso das moedas é o número de caras que pode ser 0 1 ou 2 que ela pode assumir e as calculamos as probabilidades desse valor acontecer px1 px2 pxk seriam 25 para x0 50 para x1 e 25 para x2 ou seja se conhecermos a sua função de probabilidade x px isto é onde px PX x 14 A esperança matemática é a multiplicação de cada valor da variável aleatória pela sua probabilidade de acontecer Chamamos variância de X ao valor 𝑉𝑎𝑟𝑥 𝐸𝑋² 𝐸𝑋² onde E de desvio padrão de X a 𝐷𝑃𝑋 𝑉𝑎𝑟𝑋 Distribuições Discretas de Probabilidade Distribuição de Bernoulli Um experimento que tem como resultado o sucesso ou o fracasso apenas essas duas possibilidades associado à probabilidade de cada caso é chamado de experimento de Bernoulli Vamos imaginar então que um experimento aleatório E foi realizado muitas vezes sempre nas mesmas condições E para cada vez que ele foi realizado tivemos um resultado que pode ser classificado como Sucesso s se acontecer o evento que nos interessa ou um Fracasso f se o evento não se realizar Vamos dar um exemplo suponha que estamos testando um grande conjunto de celulares para perceber se ele funciona adequadamente Vamos considerar esse experimento como um de Bernoulli desde que a nossa variável aleatória seja o sucesso ou o fracasso Chamaremos o sucesso de 1 e o fracasso de 0 Px é a probabilidade daquele celular funcionar Seja X a variável aleatória Sucesso ou Fracasso X x1 1 sucesso ou x 2 0 fracasso 15 PX p x1 p p x 2 1 p q P x 0 q e P x 1 p Nessas condições percebemos que temos um conjunto de Provas de Bernoulli ou um experimento de Bernoulli e sua função probabilidade é dada por P X x p x q1 x Principais características Como já sabemos quanto valem o x1 e o x2 vamos aplicar nas fórmulas de Média Variância e Desvio Padrão Média EX xi P xi 0q 1 p p Variância VarX E X 2 EX2 Distribuição Binomial Uma distribuição bem parecida com a de Bernoulli é a Binomial Enquanto na Bernoulli a variável aleatória era o sucesso ou o fracasso na distribuição binomial teremos as seguintes hipóteses n provas independentes e do mesmo tipo são realizadas cada prova admite dois resultados Sucesso ou Fracasso a probabilidade de sucesso em cada prova é p e de fracasso 1 p q E a nossa Variável aleatória X será a contagem do número de sucessos nas n realizações do experimento Usando um exemplo parecido com o anterior teríamos como 16 X a contagem do número de sucessos em um conjunto de testagens de celulares X pode assumir os valores 0 1 2 3 n Se considerarmos que o sucesso corresponde ao número 1 e o fracasso ao número 0 temos X 0 significa que não tivemos nenhum sucesso então teremos n fracassos e a probabilidade de isso acontecer é dada por q para cada fracasso Então como teremos uma sequência de n zeros 000000000 A probabilidade total P X 0 qqqqq q qn Para X 1 temos muitas possibilidades O sucesso pode ter acontecido apenas no primeiro teste apenas no segundo apenas no terceiro e assim por diante Representando com os números teremos uma sequência do tipo 10000 010000 0010000 Como o sucesso pode estar em qualquer posição teremos a possibilidade de n sequências cada uma com um único sucesso e n1 fracassos Por isso a probabilidade total para isso acontecer é 𝑃𝑋 1 𝑝 𝑞𝑛1 𝑛 Isso acontece porque teremos n possibilidades pqn1 Caso tenhamos qualquer outra quantidade de sucessos vamos considerar que X x isto é temos x sucessos e nx fracassos As possibilidades de isso acontecer geram sequências com x algarismos 1 e nx zeros Cada sequência dessas terá probabilidade pxqnx e como há uma combinação de sequências distintas que podem ser representadas pela combinação 𝑛 𝑥 temse Essa expressão geral também vale para os casos de X0 e X 1 Principais características Média EX np Variância VarX npq Exemplo Testamos 8 produtos que tinham 50 de chance de funcionar Encontre a probabilidade de 17 5 deles funcionarem Pelo menos 1 funcionar No máximo 2 funcionarem Resolução x funcionar p50 probabilidade do sucesso de X q 50 probabilidade do fracasso de X n 8 número de repetições do evento 𝑃𝑋 5 8 5 𝑝5 𝑞5 8 5 8 5 055 055 40320 720 058 021875 2188 Calcular a chance de pelo menos um funcionar é o mesmo que calcular a chance de todos falharem e retirar do 100 Sendo assim a probabilidade de pelo menos um funcionar é 1 P 0 isto é 100 menos a chance de todos falharem Px1 1 PX0 1 qn 1 058 09960 996 PX2 PX0 Px1 PX2 PX0 qn05800039062504 PX1 8 1 051 057 8 058 003125 31 PX2 8 2 052 056 28 058 0109375 109 PX2 0431109144 Distribuição contínua Vimos que uma variável aleatória discreta é relacionada a uma variável com valores enumeráveis Mas pode acontecer que essa variável tenha sentido em um intervalo contínuo isto é com valores reais contínuos Essa variável aleatória é chamada de variável aleatória contínua Quando escolhemos adequadamente a função de densidade de probabilidade podemos construir modelos teóricos para as variáveis aleatórias contínuas Essa função indica a probabilidade dos possíveis valores de X 18 O cálculo da probabilidade de a variável assumir valores entre a e b está ligado ao cálculo da área sob a função quando escolhemos o intervalo entre a e b Veja um gráfico disso na figura a seguir Distribuição Normal Temos um tipo de distribuição de probabilidades mais importante que é chamada de distribuição normal Por seu formato em forma de um sino de ponta cabeça é chamada de curva em forma de sino Ela tem a sua origem associada aos erros de medição pois quando fazemos várias medições utilizando um aparelho equilibrado não chegaremos ao mesmo resultado todas as vezes Ao invés disso teremos um conjunto de valores variando de modo que o gráfico contendo todos esses valores se aproxima muito de uma simetria em torno do verdadeiro valor O matemático Gauss deduziu matematicamente que todas as medições têm uma probabilidade de erros com a distribuição normal e chamou essa observação de lei normal dos erros Em um primeiro momento acreditavase que todos os fenômenos da vida real se descritos graficamente ficariam muito parecidos com uma curva em forma de sino caso isso não acontecesse suspeitavase de alguma anormalidade no processo de coleta de dados Daí a designação de curva normal Dá para imaginar que essa teoria se mostrou inadequada pela quantidade diferente de situações que podemos ter para associar a um único formato de curva De fato não são poucos os exemplos de fenômenos da vida real representados por distribuições não normais curvas assimétricas por exemplo Ainda assim essa curva continua desempenhando um papel relevante na estatística e os processos de inferência nela baseados têm larga aplicação a b PaXb 19 Quando vamos descrever matematicamente uma variável aleatória X que tem distribuição normal chamamos sua média de μ e sua variância de σ² e escrevemos X N µ σ 2 A figura a seguir mostra uma curva normal típica com seus parâmetros descritos graficamente Propriedades da distribuição normal Podemos perceber algumas características da média e do desvio padrão observando o formato da curva normal Quando temos a mesma média μ e diferentes desvios padrão σ a distribuição que tem maior desvio padrão se apresenta mais achatada o que acontece por que há uma maior dispersão em torno da média A que tem menor desvio padrão apresenta pico mais acentuado e maior concentração em torno da média A figura a seguir mostra três curvas normais com a mesma média porém com desvios padrão diferentes A curva A se apresenta mais dispersa que a curva B que por sua vez se apresenta mais dispersa que a curva C Nesse caso σA σB σC 20 Também podemos ter distribuições normais com o mesmo desvio padrão porém com as médias diferentes Pelo fato de terem a mesma dispersão mas centros diferentes elas apresentam formato parecido mas localização diferente na reta Por convenção matemática quanto maior a média mais à direita está a curva A figura a seguir ilustra o fato onde a curva A possui média maior que a curva B µA µB O mais interessante na distribuição normal é que algumas dessas áreas já são definidas em função da média e do desvio padrão Veja na figura a seguir 21 Perceba que 6826 dos valores populacionais estão dentro dos limites definidos como média mais um desvio padrão ou menos um desvio padrão μ 1 σ 9546 dos valores estão entre a média mais ou menos dois desvios padrão μ 2 σ e 9973 dos valores estão entre a média mais ou menos três desvios padrão μ 3 σ Videoaula 3 Agora assista a um vídeo mostrando o que são distribuições de probabilidades Videoaula 3 Agora assista a um vídeo mostrando o que são distribuições de probabilidades Utilize o QRcode para assistir 22 Aula 02 Testes de Hipóteses Inferência estatística é um processo usado para se obter informações sobre uma população a partir dos dados que foram observados na amostra Normalmente quando usamos amostras isso significa que a população tem um grande número de elementos e desejase a partir dessa amostra da população conhecer o mais próximo possível algumas características de toda a população As conclusões que são tiradas por uma amostragem quando generalizadas para a população acabam gerando um grau de incerteza ou risco de erros Quando queremos conseguir um certo grau de confiabilidade de confiança nas informações que conseguimos baseadas nos resultados das amostras usamos um conjunto de técnicas e procedimentos que damos o nome de Inferência Estatística A questão principal estudada pela Inferência Estatística é calcular o grau de incerteza ou risco dessas generalizações Para resolver essa questão precisamos de instrumentos que venham a permitir a viabilidade das conclusões por meio de afirmações estatísticas População e amostra Estatísticas e parâmetros Distribuições amostrais Já aprendemos que se tivermos um conjunto de dados com todas as observações possíveis chamamos de população por outro lado se tivermos um conjunto de dados com apenas uma parte das observações chamamos de amostra Podemos dizer que um dos principais objetivos ao estudarmos estatística por meio de análises ou pesquisas é tirar conclusões seguras em relação às populações baseando se em amostras Vamos então caracterizar algumas ferramentas importantes para a estatística que nos ajudarão a entender e tirar conclusões Parâmetro Chamamos de parâmetro as medidas usadas para descrever uma característica numérica populacional A média populacional µ a variância populacional σ² e o coeficiente de correlação ρ são alguns exemplos de parâmetros populacionais Estimador Quando estamos usando medidas que descrevem a amostra e nos ajudam a tirar conclusões sobre a população chamamos de estatística de um parâmetro 23 populacional ou de estimador É sempre relacionada à amostra uma função de seus elementos A média amostral x e a variância amostral s² são alguns dos exemplos de estimadores Distribuição Amostral Quando escolhemos uma amostra tomamos alguns elementos escolhidos dentro da população Podemos ter várias amostras possíveis e caso consideremos todas que forem possíveis de serem extraídas de determinada população podemos calcular o valor do estimador para cada uma delas Nesse caso teremos uma distribuição amostral desse estimador Podemos usar o estimador como uma variável aleatória e então determinar suas características isto é encontrar sua média variância desviopadrão Estimação Podemos usar dois métodos para a estimação por ponto e por intervalo Estimação pontual Como o próprio nome diz é a estimação de um ponto Esse ponto representa alguma característica numérica de uma distribuição desconhecida ex média variância Isso significa que calculamos a partir de observações um número que acreditamos ser uma aproximação da característica numérica exata da população Dá para imaginar que tenhamos problemas por encontrar apenas um ponto Isso fica mais claro quando tomamos um valor baseandose em uma amostra Vamos imaginar que temos um quebracabeça a ser montado e chamamos algumas pessoas para tentar montá lo Vamos imaginar que as 10 pessoas que chamamos montaram o quebracabeça em 10 19 12 25 13 18 12 15 11 16 minutos A média desta amostra é x 151 minutos Se recebêssemos a informação dessa média de forma isolada sem nenhuma outra informação acreditaríamos que ela é a melhor estimativa da média populacional isto é que ela representa o verdadeiro tempo médio de montagem do quebracabeça Chamamos esse tipo de estimativa de pontual por ser apenas um ponto na escala dos números reais Apesar de ser a forma mais usada de estimativa a pontual não nos dá a informação completa Veja que não sabemos quantas amostras foram feitas e nem o 24 tamanho da amostra ou da população Não sabemos sobre a possibilidade do erro e nem da amplitude dos dados para tirar mais conclusões Estimação por intervalo Como a estimação por pontos não nos informa tudo que precisamos saber a estimação por intervalo deve ter alguma certeza maior Quando temos a distribuição amostral do estimador pontual podemos construir um intervalo de confiança de modo a ter certeza de que o valor verdadeiro está dentro desse intervalo Por mais que não tenhamos certeza de que o valor verdadeiro esteja em um desses intervalos de confiança podemos ao menos calcular a probabilidade que tenhamos o verdadeiro valor do parâmetro da população dentro de um certo intervalo Esses limites são chamados limites de confiança Como descrito eles determinam um intervalo de confiança no qual há uma grande probabilidade de estar o verdadeiro valor do parâmetro Sendo assim estamos estimando por intervalo quando fixamos dois valores reais que determinam um intervalo de 3 a 6 por exemplo dentro do qual há 1 α de probabilidade de que o verdadeiro valor do parâmetro esteja α nível de incerteza ou grau de desconfiança 1 α coeficiente de confiança ou nível de confiabilidade Vou dar um exemplo Vamos imaginar que α seja 5 Ele pode ser representado por 005 então há 1005 de probabilidade de que o valor real do parâmetro esteja dentro do intervalo dado 1005 é 095 isto é 95 Assim há 95 de chance de o valor real estar dentro do intervalo dado Deu para perceber que α nos dá a medida da incerteza desta inferência nível de significância isto é quanto porcento de chance temos de errar ao considerar aquele intervalo A ideia de encontrar um estimador por intervalo é a partir das informações de amostra calcular os limites de um intervalo que tem apenas α de chance de não conter o valor do parâmetro verdadeiro da população Nesses casos há 1 α de chance de que o intervalo contenha o valor do parâmetro a estimar Esse intervalo é chamado de 25 intervalo de confiança e está relacionado com a curva normal de distribuição que já estudamos Para esse cálculo usamos a média amostral como estimador da média populacional Também fazemos uma padronização dos valores da média desvio padrão e número de valores chegando a um valor padronizado Z Videoaula 1 Agora assista a um vídeo apresentando o que significa esse parâmetro Z e o que ele pode nos ajudar a calcular Em que o valor x é a média amostral μ é a média populacional que queremos estimar σ é o desvio padrão e n o tamanho da amostra Como queremos um nível de confiança de 1 α vamos distribuir da seguinte forma Videoaula 1 Agora assista a um vídeo apresentando o que significa esse parâmetro Z e o que ele pode nos ajudar a calcular Utilize o QRcode para assistir 26 Veja que temos α2 de possibilidade de erro de cada lado da curva ao todo dará um erro possível de α O valor Z 𝛼 2 é muito importante Veja que como temos metade de Z de cada lado 50 e o erro de 25 de cada lado isso significa que Z 𝛼 2 é o Z para o intervalo de 4750 o que significa em números decimais que Z 𝛼 2 é o Z para o valor 04750 Se quiséssemos um erro de 3 por exemplo seriam 15 de cada lado Z 𝛼 2 seria o Z para o valor 04850 Esse valor de Z é encontrado na tabela de distribuição normal 27 Sendo assim sabemos que a probabilidade que z esteja entre z 𝛼 2 e z 𝛼 2 é 1 α 28 Isso significa que Substituindo o valor de z que tínhamos definido anteriormente teremos Como nos interessa que o intervalo esteja em torno da média populacional μ vamos isolála no centro da desigualdade O valor de Z 𝛼 2 é encontrado na tabela de distribuição normal Veremos melhor como fazer isso no exemplo A utilização dessa fórmula é muito simples Escolhemos o valor de erro aceitável para o parâmetro Esse será o valor de α Calculamos então o valor de 1 α e olhamos na tabela de distribuição normal padrão o valor de Z para deixar exatamente α2 em cada uma das caudas da distribuição Com os valores da amostra já teremos a média amostral x o desvio padrão σ que neste caso é conhecido e o tamanho da amostra n Sendo assim usamos a fórmula para construir o intervalo Para o caso de populações finitas usase a seguinte fórmula 29 Vamos calcular um exemplo A duração da vida útil de uma lâmpada é tal que σ5 horas Foram amostradas 100 dessas lâmpadas obtendose a média de 500 horas Desejase construir um intervalo de confiança para a verdadeira duração média da lâmpada com um nível de 95 Solução σ 5 n 100 x500 1 α10095 O gráfico da distribuição normal padrão será Lembrese que para descobrir a abscissa 196 entrouse na tabela de distribuição normal padronizada com o valor 04750 4750 já que a tabela é de faixa central Veja que na tabela o valor Z 𝛼 2 196 já que queremos 04750 de intervalo de confiança 30 Substituindo na fórmula temos 𝑃𝑥 𝑍 𝛼 2 𝜎 𝑛 𝜇 𝑥 𝑍 𝛼 2 𝜎 𝑛 1 α 𝑃500 196 5 100 𝜇 500 196 5 100 95 𝑃500 196 5 10 𝜇 500 196 5 10 95 𝑃500 196 05 𝜇 500 196 05 95 Efetuando os cálculos temos P 499025 µ 500975 95 Isso significa que a média está entre 499025 e 500975 Videoaula 2 Agora assista a um vídeo que mostra como esse cálculo de probabilidade pode ser usado para tirar conclusões 31 Testes de Hipóteses Uma outra forma de avaliar parâmetros a partir de amostras é construindo testes de hipóteses De forma parecida a que transformamos a média em uma medida padronizada podemos transformar outras hipóteses em medidas padronizadas e verificar um intervalo de confiança para analisar a hipótese Esta é uma técnica para se fazer inferência estatística Partindo de um teste de hipóteses realizado com base nos dados amostrais fazemos inferências sobre a população Principais conceitos Como o próprio nome indica vamos testar hipóteses estatísticas isto é vamos partir de uma suposição quanto ao valor de um parâmetro populacional ou quanto à forma da distribuição de probabilidade de uma variável populacional e verificar se essa suposição se concretiza Podemos exemplificar as hipóteses estatísticas com as seguintes suposições a As lâmpadas de uma certa marca têm vida média Hµ µ0 b A média de pessoas que frequenta um parque é Hµ µ0 c O produto produzido pelo processo A é de melhor qualidade que o aço produzido pelo processo BµA µB d O índice de massa corporal médio das pessoas de uma academia é 25 isto é H µ25 e A variância populacional das notas de uma turma vale 24 isto é H σ²24 Videoaula 2 Agora assista a um vídeo que mostra como esse cálculo de probabilidade pode ser usado para tirar conclusões Utilize o QRcode para assistir 32 O método de avaliação das hipóteses parte da formulação de duas Ho hipótese nula ou da existência H1 hipótese alternativa Depois de definidas testamos as hipóteses para com base no resultado tomarmos uma decisão entre duas alternativas Por essa razão o Teste de Hipótese é um Processo de Decisão Estatística Para formular essas hipóteses adequadamente partimos da definição dos seus tipos que podem ser H0 que já dissemos se chamar hipótese nula ou H1 que chamaremos de hipótese alternativa A nula é aquela que queremos testar a alternativa é a outra conclusão que podemos ter A hipótese nula é representada por uma igualdade já a hipótese alternativa é dada por uma desigualdade Por exemplo H0 μ 165 H1 μ 165 Esse é um exemplo de teste bilateral já que temos uma hipótese nula com um valor central e a hipótese alternativa pode ser tanto para a direita desse valor quanto para a esquerda chamamos de teste bicaudal H0 μ 165 H1 μ 165 Esse é um exemplo de teste unilateral à direita já que temos uma hipótese nula com um valor central e a hipótese alternativa só nos interessa à direita do valor testado chamamos de teste unicaudal à direita H0 μ 165 H1 μ 165 Esse é um exemplo de teste unilateral à esquerda já que temos uma hipótese nula com um valor central e a hipótese alternativa só no interessa à esquerda do valor testado chamamos de teste unicaudal à esquerda 33 Para realizar um Teste de Hipóteses fazemos as seguintes etapas Definemse as hipóteses do teste nula e alternativa Fixase um nível de significância α Levantase uma amostra de tamanho n e calculase uma estimativa do parâmetro escolhido na definição das hipóteses Usamos uma variável que tenha a distribuição amostral do estimador dos parâmetros mais concentrada em torno do verdadeiro valor do parâmetro Isso é feito para cada tipo de teste Calculamos com o valor do parâmetro a ser testado dado por H0 que é a hipótese de que o parâmetro é igual ao valor que está sendo testado o valor crítico valor observado na amostra ou valor calculado Determinamos duas regiões uma que se o valor encontrado estiver nela decidimos não rejeitar H0 chamase Região de não Rejeição RNR e a região que se o valor encontrado estiver nela decidimos rejeitar H0 chamase Região de Rejeição ou Região Crítica RC para o valor calculado ao nível de risco dado Ex Na figura abaixo consideramos como Região Crítica aquela hachurada pensando no valor médio central e no nível de risco de α2 Se o valor calculado está dentro da região de não rejeição a decisão é a de não rejeitar H0 Se o valor calculado está dentro da Região Crítica a decisão é a de rejeitar H0 Vamos calcular uma vez juntos para entender como funciona Imagine o seguinte problema 34 Suponha que são produzidas peças e que se esperava que elas possuíssem 45cm de comprimento Vamos considerar que a distribuição dos tamanhos das peças é normal e com variância 36 tomase uma amostra casual de 16 peças obtendose média 43 cm O que queremos é testar com nível de 10 de risco se podemos dizer que a média é realmente 45 cm Nesse caso nossas hipóteses serão H0 µ 45 H1 µ 45 Quando estamos calculando o teste para média de populações normais com variância conhecida podemos usar uma variável já conhecida como critério nesse caso a variável Z N01 que tem uma tabela já montada de valores Como o risco é 10 e o teste é bilateral teremos 5 de região para cada lado Sendo assim olhamos na tabela o valor de Z para 04500 que corresponde a 164 Como o teste é bilateral e α 10 a Região de Não Rejeição RNR é 35 P Z Zα 1 α PZ164 090 E a Região de Rejeição RC é dada por P Z Zα αP Z 164 010 A zona de não rejeição acontece quando Z está entre 164 e 164 A fórmula de Z já dada é 𝑍 𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 43 45 6 16 43 45 6 4 2 15 133 Como z calculado é 133 dá para perceber que está dentro da Região de não Rejeição Logo a decisão é não rejeitarmos H0 isto é a média é de 45 com 10 de risco de não rejeitarmos uma hipótese falsa Outro teste Unilateral Monocaudal à Esquerda Uma fábrica de geleia de frutas quer se adequar à regra da Anvisa sobre fragmentos de insetos nos seus potes Um pote de 100 gramas de geleia pode conter menos do que 36 25 fragmentos de insetos desde que não sejam um risco para a saúde humana Um laboratório realiza uma análise em 10 potes encontrando os seguintes resultados 25232221272426252723 Sabese que a quantidade de fragmentos de insetos em potes dessa fábrica se distribui normalmente com variância 536 Podese dizer que essa fábrica está adequada ao regulamento da Anvisa assumindo um risco de 5 H0 µ 25 H1 µ 25 Veja que como estamos falando de uma análise de apenas um dos lados da distribuição vamos verificar que α 5 e a região vai ser até 45 de Z Sendo assim vamos usar o valor de PZ 04500 novamente E já vimos que Z 164 Sendo assim qualquer Z calculado maior que 164 fará parte da região de não rejeição A Média x 243 σ²536 σ2315 n10 𝑍 𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 243 25 2315 10 07 2315 3162 07 0732 0957 37 Não se rejeita H0 isto é ao nível de 5 podemos concluir que a fábrica não respeita o regulamento da Anvisa Erros de Decisão Videoaula 3 Agora assista a um vídeo falando o que são erros de decisão e quais são os erros possíveis em um teste Podemos ter dois tipos de erro ao testar uma hipótese estatística O primeiro acontece quando escolhemos rejeitar uma hipótese quando ela é de fato verdadeira O segundo consiste em aceitar uma hipótese quando ela é de fato falsa A primeira é chamada erro tipo I A segunda é chamada de erro tipo II As probabilidades desses dois tipos de erros são designadas respectivamente por α e β A probabilidade α do erro tipo I é denominada nível de significância do teste Videoaula 3 Agora assista a um vídeo falando o que são erros de decisão e quais são os erros possíveis em um teste Utilize o QRcode para assistir 38 Observe que o erro tipo I só poderá ser cometido se se rejeitar H0 e o erro do tipo II quando se aceitar H0 Encerramento da Unidade Na aula de hoje aprendemos o que são probabilidades condicionais e como calculamos esse tipo de probabilidade Aprendemos o que são e como são encontradas ou definidas as variáveis aleatórias Aprendemos ainda que elas podem ser contínuas ou discretas de acordo com o conjunto do intervalo em que podem ser definidas Conhecemos alguns tipos de distribuições de probabilidades e a mais importante delas é a distribuição normal Vimos que podemos encontrar uma grande probabilidade de os dados estarem dentro do intervalo de 1 2 ou 3 desvios padrão em torno da média quando estamos falando desse tipo de distribuição de probabilidades Também vimos como se encontram as probabilidades de uma distribuição Vimos também que a distribuição normal tem valores padronizados em tabelas e como usamos esse estudo para testar hipóteses estatísticas 39 Referências CASTANHEIRA N P Estatística aplicada a todos os níveis1ª ed Curitiba Intersaberes 2012 Videoaula Encerramento Videoaula Encerramento Utilize o QRcode para assistir
Send your question to AI and receive an answer instantly
Recommended for you
1
Funcao Afim e Quadratica - Anotacoes de Aula
Métodos Quantitativos Aplicados
UMG
1
Análise da Função Afim do Caminho de um Skatista
Métodos Quantitativos Aplicados
UMG
27
Introducao a Teoria da Medida-Importancia e Aplicacoes em Pesquisas
Métodos Quantitativos Aplicados
UMG
94
Plano de Aula Estatística - Correlação Linear Simples e Regressão
Métodos Quantitativos Aplicados
UMG
1
Anotacoes Aulas de Nocoes de Probabilidade Distribuicao dos Estimadores e Testes de Hipoteses
Métodos Quantitativos Aplicados
UMG
102
Metodos Quantitativos Aplicados a Corporate Finance - Guia Completo FGV 2023
Métodos Quantitativos Aplicados
UMG
1
Análise da Variabilidade e Medidas de Dispersão
Métodos Quantitativos Aplicados
UMG
1
Estatistica Inferencial - Parte 2 - Correlação Regressão e Testes
Métodos Quantitativos Aplicados
UMG
1
Apostila de Estatística e Funções - Afim Quadrática Descritiva Inferencial
Métodos Quantitativos Aplicados
UMG
1
Estatística Inferencial - Noções de Probabilidade e Testes de Hipóteses
Métodos Quantitativos Aplicados
UMG
Preview text
Unidade 4 Distribuições de probabilidades e testes de hipóteses 3 Introdução da Unidade Agora que já definimos e aprendemos a calcular a probabilidade de um evento acontecer vamos entender um pouco mais a respeito dela incluindo situações de análises que facilitarão a resolução de problemas probabilísticos e a definir melhor a probabilidade de eventos acontecerem Isso se dará com a probabilidade condicional com a independência de eventos Também vamos estudar as variáveis aleatórias que como o próprio nome diz são valores variáveis que descreverão as probabilidades de eventos acontecerem Uma vez que definirmos as variáveis aleatórias veremos como calcular os valores das probabilidades correspondentes e esse conjunto das variáveis e das probabilidades correspondentes é denominado distribuição de probabilidades Essas distribuições podem assumir formas discretas e contínuas que serão detalhadas Associaremos então os já conhecidos desvio padrão e variância a essas distribuições para que fique ainda mais clara a sua importância Veremos também o que são populações e amostras novamente agora associando à ideia de parâmetros Veremos como são as distribuições amostrais e que a distribuição normal é a mais usada Ela servirá de base para conhecermos uma teoria de probabilidade e depois para entender como são feitos os testes estatísticos Vamos também entender que tipos de erros podemos ter em um teste estatístico Objetivos Entender os conceitos relacionados às múltiplas probabilidades Conhecer formas de distribuição de probabilidades discretas e contínuas Conhecer distribuições amostrais Conhecer testes de Hipóteses e Verificar as possibilidades de erros 4 Conteúdo programático Aula 01 Distribuição de probabilidades Aula 02 Testes de Hipóteses Você poderá também assistir às videoaulas em seu celular Basta apontar a câmera para os QRCodes distribuídos neste conteúdo Pode ser necessário instalar um aplicativo de leitura QRcode no celular e efetuar login na sua conta Gmail 5 Aula 01 Distribuição de probabilidades Probabilidade Condicional Algumas vezes queremos associar eventos e calcular a probabilidade de eles acontecerem em sequência Por exemplo qual é a probabilidade de se retirar um rei do baralho e de ele ser de copas Chamamos isso de probabilidade condicional e organizamos essa questão no seguinte enunciado Qual é a probabilidade de sortear uma carta de copas no baralho dado que foi sorteado um rei O evento em que ambos A e B ocorrem é chamado A interseção B portanto a probabilidade do evento A ocorrer ser sorteada uma carta de copas dado que B ocorreu foi sorteado um rei é de 𝑃𝐴𝐵 𝑃𝐴 𝐵 𝑃𝐵 𝑃𝑠𝑒𝑟 𝑟𝑒𝑖 𝑒 𝑑𝑒 𝑐𝑜𝑝𝑎𝑠 𝑎𝑜 𝑚𝑒𝑠𝑚𝑜 𝑡𝑒𝑚𝑝𝑜 𝑃𝑠𝑒𝑟 𝑟𝑒𝑖 1 52 4 52 1 4 25 Isso significa que a probabilidade de A ocorrer dado que B ocorreu é igual à probabilidade de ocorrência simultânea de A e B dividida pela probabilidade de ocorrência de B note que essa definição não se aplica quando PB0 afinal se assim fosse estaríamos dividindo por zero e como estamos partindo do princípio de que B aconteceu sua probabilidade de acontecimento não pode ser zero Exemplo Dois dados são lançados Consideremos os eventos A e B A é o evento em que a soma das faces superiores dos dados é 10 e B é o evento em que a face superior do primeiro dado é maior do que a do segundo 6 Em termos matemáticos temos A x1 x2 x1x210 e B x1 x2 x1 x2 onde x1 é o resultado do dado 1 e x2 é o resultado do dado 2 Qual é a probabilidade de que eu tenha a soma 10 dado que o resultado do primeiro dado é maior do que o do segundo PA Probabilidade da somar dar 10 A soma dá 10 nos casos 46 55 64 Então essa probabilidade é 336 PB Probabilidade do resultado do primeiro dado ser maior do que o do segundo O resultado do primeiro dado é maior do que o do segundo nos casos 21 31 32 41 42 43 51 52 53 54 61 62 63 64 65 Então essa probabilidade é 1536 PAB Probabilidade de a soma dar 10 e do resultado do primeiro dado ser maior do que o do segundo Isso só acontece no caso 64 A probabilidade de isso acontecer é 136 𝑃𝐴𝐵 1 36 15 36 1 15 Qual é a probabilidade de que o resultado do primeiro dado seja maior que o do segundo dado que a soma dos dados deu 10 𝑃𝐵𝐴 1 36 3 36 1 3 Como vimos que 𝑃𝐴𝐵 𝑃𝐴 𝐵 𝑃𝐵 7 Podemos brincar matematicamente com a fórmula de modo a termos 𝑃𝐴 𝐵 𝑃𝐴𝐵 𝑃𝐵 Essa brincadeira pode nos ajudar a conseguir outros resultados usando a mesma fórmula Independência Estatística Quando um evento não tem relação nenhuma com o outro sua interseção é nula são mutuamente excludentes Nesse caso a probabilidade de acontecer os dois eventos simultaneamente é zero Então esse evento é considerado independente do outro Nesse caso tendo dois eventos independentes A e B a probabilidade de A é igual à probabilidade condicional de A dado B PA PAB Usando a fórmula 𝑃𝐴 𝐵 𝑃𝐴𝐵 𝑃𝐵 Vamos conseguir um resultado interessante para eventos independentes 𝑃𝐴 𝐵 𝑃𝐴 𝑃𝐵 Exemplo Em uma caixa de leite com 12 caixinhas 4 estão estragadas 2 caixinhas são abertas uma após a outra Qual a probabilidade de que ambas sejam boas A a 1ª caixinha é boa B a 2ª caixinha é boa P A B PA PBA 812711561311433 Isto é se PAPAB É evidente que se A é independente de B B é independente de A PBPBA Se A e B são independentes então temos que 8 P A B PA P B Regra de Bayes Essa é uma regra que ajuda a descobrir probabilidades de um evento acontecer dado outro evento É uma generalização da probabilidade condicional para mais de dois eventos Sejam A1 A2 A3An n eventos mutuamente exclusivos tais que A1 A2 An S Sejam PAi as probabilidades conhecidas dos vários eventos e B um evento qualquer de S Podemos calcular a probabilidade de Ai acontecer dado B desde que sejam conhecidas todas as probabilidades condicionais PBAi Esse teorema também é chamado de Teorema da Probabilidade a Posteriori Ele relaciona uma das parcelas da probabilidade total com a própria probabilidade total Vamos ver alguns exemplos em que essa propriedade é importante para se resolver o problema Sendo PA 34 PB 13 e P A B 1112 calcular PAB Solução Como P A B P A B devemos calcular P A B PB Como P A B PA PB P A B temos 1112 34 13 P A B 1112 912 412 P A B 1112 1312 P A B P A B 21216 logo PAB 16 13 ½ 50 9 Em certo colégio 10 dos meninos e 12 das meninas gabaritaram as provas de estatística Por outro lado 40 dos estudantes são meninos Se um estudante é selecionado aleatoriamente e gabaritou a prova de estatística qual a probabilidade de que o estudante seja menina Solução Temos que PGaH 010 Probabilidade de ter gabaritado a prova dado que é menino PGaM 012 Probabilidade de ter gabaritado a prova dado que é menina PH 04 Probabilidade de ser menino PM 06 Probabilidade de ser menina O que queremos saber é a probabilidade de ser uma menina a aluna escolhida dado que ela gabaritou a prova Isto é queremos calcular PMGa 𝑃𝑀𝐺𝑎 𝑃𝑀𝑃𝐺𝑎𝑀 𝑃𝑀𝑃𝐺𝑎𝑀𝑃𝐻𝑃𝐺𝑎𝐻 06012 0601204010 0072 00720040643 Isso significa que a probabilidade de ser uma menina dado que gabaritou a prova é 643 Videoaula 1 Agora assista a um vídeo explicando as probabilidades condicionais e a relação entre probabilidades apresentadas nessa aula 10 Variáveis aleatórias Mesmo que tenhamos experimentos aleatórios que produzam resultados não numéricos podemos transformar seus resultados em números o que é feito por meio da variável aleatória que é uma regra de associação de um valor numérico a probabilidade de acontecer aquele evento a cada ponto do espaço amostral Portanto variáveis aleatórias são variáveis numéricas que podemos associar a modelos probabilísticos Começaremos nosso estudo sobre as variáveis aleatórias entendendo que ela tem um valor numérico para cada resultado de um experimento Depois vamos associar a probabilidade devida a cada resultado numérico de um experimento com a distribuição de probabilidades Definição Vamos imaginar um experimento que chamaremos de E que pode ser o lançamento de dois dados por exemplo S é o nome dado ao espaço amostral associado a esse experimento isto é todos os valores possíveis para esse experimento S11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 A variável aleatória é a função X que associa a cada elemento s S um número real Xs Isto é a variável aleatória vai levar cada elemento de S a um novo conjunto numérico S X Videoaula 1 Agora assista a um vídeo explicando as probabilidades condicionais e a relação entre probabilidades apresentadas nessa aula Utilize o QRcode para assistir 11 Exemplo E lançamento de dois dados X soma das faces dos dados que caírem voltadas para cima S11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 X 2 corresponde ao evento 11 com probabilidade 136 de acontecer 278 de chance de acontecer Veja que a variável aleatória X levou o elemento 11 no elemento 2 X 3 corresponde ao evento 12 21 com probabilidade 236 de acontecer 556 de chance de acontecer Veja que a variável aleatória X levou dois elementos 12 e 21 no mesmo elemento 3 Por isso ela tem uma probabilidade maior de acontecer E assim por diante Podemos ter um valor de x com maior probabilidade Neste caso seria o X7 Empregamos o nome de variável aleatória para descrever o valor da probabilidade correspondente ao resultado de determinado experimento As variáveis aleatórias também podem ser discretas ou contínuas e temos as seguintes definições Variáveis Aleatórias Discretas Admite um número finito de valores ou tem uma quantidade enumerável de valores isto é 1 2 3 4 Variáveis Aleatórias Contínuas pode tomar um número infinito de valores e esses valores podem ser associados a mensurações em uma escala contínua admite valores decimais como 123 Xs s Variável Aleatória 12 Videoaula 2 Agora assista a um vídeo mostrando o que são variáveis aleatórias e como elas são conseguidas Distribuição de probabilidade Já no exemplo dado para definir as variáveis aleatórias começamos a associar um cálculo muito interessante para cada valor da variável a sua probabilidade de acontecer Vimos por exemplo que o valor da variável X3 tem uma probabilidade de 556 de chance de acontecer É muito interessante quando conseguimos calcular as probabilidades de cada valor da variável aleatória acontecer Quando temos esse dado o conjunto das variáveis e das suas probabilidades correspondentes é denominado distribuição de probabilidades isto é o conjunto de todos os xipxi com o i12n é denominada distribuição de probabilidades de x Função de densidade de probabilidade É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente isto é PXxi PAi com i12 n Esperança matemática variância e desvio padrão propriedades Para as distribuições de probabilidades de uma variável aleatória discreta a média recebe um outro nome devido a chance daquele valor acontecer é chamada de esperança Videoaula 2 Agora assista a um vídeo mostrando o que são variáveis aleatórias e como elas são conseguidas Utilize o QRcode para assistir 13 matemática Assim como temos a média também temos a variância e o desvio padrão dos valores da distribuição de probabilidades São os parâmetros das distribuições a saber Esperança matemática ou simplesmente média E x é a média aritmética das probabilidades Variância VAR x Assim como a variância é a medida de dispersão dos dados em torno da média a variância na distribuição de probabilidades também é a medida do grau de dispersão ou de concentração das probabilidades em torno da média A média é um número representativo dos dados de probabilidade porém precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno dessa média Desvio Padrão DPX é o desvio padrão das probabilidades e é calculado tirando se a raiz quadrada da variância Distribuições discretas Bernoulli Binomial e Poisson Já sabemos que ao determinarmos todos os pontos possíveis em um evento estamos encontrando o seu espaço amostral Podemos operar com esses pontos e encontrar as probabilidades desses resultados acontecerem aí temos uma função de probabilidade Quando usamos uma função X que está definida dentro do espaço amostral de um evento e se os valores encontrados nessa função são enumeráveis podem ser associados à ideia de contagem essa função é chamada de variável aleatória discreta Exemplo Vamos imaginar que nosso espaço amostral são os resultados dos lançamentos de duas moedas Nossa variável aleatória discreta poderia ser o número de caras nesses lançamentos Veja que o evento foi jogar duas moedas e observar a face superior resultado do lançamento E veja também que a variável aleatória é enumerável já que vamos ter um número contável de caras que vai ser 0 1 ou 2 caras por isso é chamada de variável aleatória discreta Uma variável aleatória discreta X é caracterizada quando conseguimos saber quais são os possíveis valores x1 x2 xk no caso das moedas é o número de caras que pode ser 0 1 ou 2 que ela pode assumir e as calculamos as probabilidades desse valor acontecer px1 px2 pxk seriam 25 para x0 50 para x1 e 25 para x2 ou seja se conhecermos a sua função de probabilidade x px isto é onde px PX x 14 A esperança matemática é a multiplicação de cada valor da variável aleatória pela sua probabilidade de acontecer Chamamos variância de X ao valor 𝑉𝑎𝑟𝑥 𝐸𝑋² 𝐸𝑋² onde E de desvio padrão de X a 𝐷𝑃𝑋 𝑉𝑎𝑟𝑋 Distribuições Discretas de Probabilidade Distribuição de Bernoulli Um experimento que tem como resultado o sucesso ou o fracasso apenas essas duas possibilidades associado à probabilidade de cada caso é chamado de experimento de Bernoulli Vamos imaginar então que um experimento aleatório E foi realizado muitas vezes sempre nas mesmas condições E para cada vez que ele foi realizado tivemos um resultado que pode ser classificado como Sucesso s se acontecer o evento que nos interessa ou um Fracasso f se o evento não se realizar Vamos dar um exemplo suponha que estamos testando um grande conjunto de celulares para perceber se ele funciona adequadamente Vamos considerar esse experimento como um de Bernoulli desde que a nossa variável aleatória seja o sucesso ou o fracasso Chamaremos o sucesso de 1 e o fracasso de 0 Px é a probabilidade daquele celular funcionar Seja X a variável aleatória Sucesso ou Fracasso X x1 1 sucesso ou x 2 0 fracasso 15 PX p x1 p p x 2 1 p q P x 0 q e P x 1 p Nessas condições percebemos que temos um conjunto de Provas de Bernoulli ou um experimento de Bernoulli e sua função probabilidade é dada por P X x p x q1 x Principais características Como já sabemos quanto valem o x1 e o x2 vamos aplicar nas fórmulas de Média Variância e Desvio Padrão Média EX xi P xi 0q 1 p p Variância VarX E X 2 EX2 Distribuição Binomial Uma distribuição bem parecida com a de Bernoulli é a Binomial Enquanto na Bernoulli a variável aleatória era o sucesso ou o fracasso na distribuição binomial teremos as seguintes hipóteses n provas independentes e do mesmo tipo são realizadas cada prova admite dois resultados Sucesso ou Fracasso a probabilidade de sucesso em cada prova é p e de fracasso 1 p q E a nossa Variável aleatória X será a contagem do número de sucessos nas n realizações do experimento Usando um exemplo parecido com o anterior teríamos como 16 X a contagem do número de sucessos em um conjunto de testagens de celulares X pode assumir os valores 0 1 2 3 n Se considerarmos que o sucesso corresponde ao número 1 e o fracasso ao número 0 temos X 0 significa que não tivemos nenhum sucesso então teremos n fracassos e a probabilidade de isso acontecer é dada por q para cada fracasso Então como teremos uma sequência de n zeros 000000000 A probabilidade total P X 0 qqqqq q qn Para X 1 temos muitas possibilidades O sucesso pode ter acontecido apenas no primeiro teste apenas no segundo apenas no terceiro e assim por diante Representando com os números teremos uma sequência do tipo 10000 010000 0010000 Como o sucesso pode estar em qualquer posição teremos a possibilidade de n sequências cada uma com um único sucesso e n1 fracassos Por isso a probabilidade total para isso acontecer é 𝑃𝑋 1 𝑝 𝑞𝑛1 𝑛 Isso acontece porque teremos n possibilidades pqn1 Caso tenhamos qualquer outra quantidade de sucessos vamos considerar que X x isto é temos x sucessos e nx fracassos As possibilidades de isso acontecer geram sequências com x algarismos 1 e nx zeros Cada sequência dessas terá probabilidade pxqnx e como há uma combinação de sequências distintas que podem ser representadas pela combinação 𝑛 𝑥 temse Essa expressão geral também vale para os casos de X0 e X 1 Principais características Média EX np Variância VarX npq Exemplo Testamos 8 produtos que tinham 50 de chance de funcionar Encontre a probabilidade de 17 5 deles funcionarem Pelo menos 1 funcionar No máximo 2 funcionarem Resolução x funcionar p50 probabilidade do sucesso de X q 50 probabilidade do fracasso de X n 8 número de repetições do evento 𝑃𝑋 5 8 5 𝑝5 𝑞5 8 5 8 5 055 055 40320 720 058 021875 2188 Calcular a chance de pelo menos um funcionar é o mesmo que calcular a chance de todos falharem e retirar do 100 Sendo assim a probabilidade de pelo menos um funcionar é 1 P 0 isto é 100 menos a chance de todos falharem Px1 1 PX0 1 qn 1 058 09960 996 PX2 PX0 Px1 PX2 PX0 qn05800039062504 PX1 8 1 051 057 8 058 003125 31 PX2 8 2 052 056 28 058 0109375 109 PX2 0431109144 Distribuição contínua Vimos que uma variável aleatória discreta é relacionada a uma variável com valores enumeráveis Mas pode acontecer que essa variável tenha sentido em um intervalo contínuo isto é com valores reais contínuos Essa variável aleatória é chamada de variável aleatória contínua Quando escolhemos adequadamente a função de densidade de probabilidade podemos construir modelos teóricos para as variáveis aleatórias contínuas Essa função indica a probabilidade dos possíveis valores de X 18 O cálculo da probabilidade de a variável assumir valores entre a e b está ligado ao cálculo da área sob a função quando escolhemos o intervalo entre a e b Veja um gráfico disso na figura a seguir Distribuição Normal Temos um tipo de distribuição de probabilidades mais importante que é chamada de distribuição normal Por seu formato em forma de um sino de ponta cabeça é chamada de curva em forma de sino Ela tem a sua origem associada aos erros de medição pois quando fazemos várias medições utilizando um aparelho equilibrado não chegaremos ao mesmo resultado todas as vezes Ao invés disso teremos um conjunto de valores variando de modo que o gráfico contendo todos esses valores se aproxima muito de uma simetria em torno do verdadeiro valor O matemático Gauss deduziu matematicamente que todas as medições têm uma probabilidade de erros com a distribuição normal e chamou essa observação de lei normal dos erros Em um primeiro momento acreditavase que todos os fenômenos da vida real se descritos graficamente ficariam muito parecidos com uma curva em forma de sino caso isso não acontecesse suspeitavase de alguma anormalidade no processo de coleta de dados Daí a designação de curva normal Dá para imaginar que essa teoria se mostrou inadequada pela quantidade diferente de situações que podemos ter para associar a um único formato de curva De fato não são poucos os exemplos de fenômenos da vida real representados por distribuições não normais curvas assimétricas por exemplo Ainda assim essa curva continua desempenhando um papel relevante na estatística e os processos de inferência nela baseados têm larga aplicação a b PaXb 19 Quando vamos descrever matematicamente uma variável aleatória X que tem distribuição normal chamamos sua média de μ e sua variância de σ² e escrevemos X N µ σ 2 A figura a seguir mostra uma curva normal típica com seus parâmetros descritos graficamente Propriedades da distribuição normal Podemos perceber algumas características da média e do desvio padrão observando o formato da curva normal Quando temos a mesma média μ e diferentes desvios padrão σ a distribuição que tem maior desvio padrão se apresenta mais achatada o que acontece por que há uma maior dispersão em torno da média A que tem menor desvio padrão apresenta pico mais acentuado e maior concentração em torno da média A figura a seguir mostra três curvas normais com a mesma média porém com desvios padrão diferentes A curva A se apresenta mais dispersa que a curva B que por sua vez se apresenta mais dispersa que a curva C Nesse caso σA σB σC 20 Também podemos ter distribuições normais com o mesmo desvio padrão porém com as médias diferentes Pelo fato de terem a mesma dispersão mas centros diferentes elas apresentam formato parecido mas localização diferente na reta Por convenção matemática quanto maior a média mais à direita está a curva A figura a seguir ilustra o fato onde a curva A possui média maior que a curva B µA µB O mais interessante na distribuição normal é que algumas dessas áreas já são definidas em função da média e do desvio padrão Veja na figura a seguir 21 Perceba que 6826 dos valores populacionais estão dentro dos limites definidos como média mais um desvio padrão ou menos um desvio padrão μ 1 σ 9546 dos valores estão entre a média mais ou menos dois desvios padrão μ 2 σ e 9973 dos valores estão entre a média mais ou menos três desvios padrão μ 3 σ Videoaula 3 Agora assista a um vídeo mostrando o que são distribuições de probabilidades Videoaula 3 Agora assista a um vídeo mostrando o que são distribuições de probabilidades Utilize o QRcode para assistir 22 Aula 02 Testes de Hipóteses Inferência estatística é um processo usado para se obter informações sobre uma população a partir dos dados que foram observados na amostra Normalmente quando usamos amostras isso significa que a população tem um grande número de elementos e desejase a partir dessa amostra da população conhecer o mais próximo possível algumas características de toda a população As conclusões que são tiradas por uma amostragem quando generalizadas para a população acabam gerando um grau de incerteza ou risco de erros Quando queremos conseguir um certo grau de confiabilidade de confiança nas informações que conseguimos baseadas nos resultados das amostras usamos um conjunto de técnicas e procedimentos que damos o nome de Inferência Estatística A questão principal estudada pela Inferência Estatística é calcular o grau de incerteza ou risco dessas generalizações Para resolver essa questão precisamos de instrumentos que venham a permitir a viabilidade das conclusões por meio de afirmações estatísticas População e amostra Estatísticas e parâmetros Distribuições amostrais Já aprendemos que se tivermos um conjunto de dados com todas as observações possíveis chamamos de população por outro lado se tivermos um conjunto de dados com apenas uma parte das observações chamamos de amostra Podemos dizer que um dos principais objetivos ao estudarmos estatística por meio de análises ou pesquisas é tirar conclusões seguras em relação às populações baseando se em amostras Vamos então caracterizar algumas ferramentas importantes para a estatística que nos ajudarão a entender e tirar conclusões Parâmetro Chamamos de parâmetro as medidas usadas para descrever uma característica numérica populacional A média populacional µ a variância populacional σ² e o coeficiente de correlação ρ são alguns exemplos de parâmetros populacionais Estimador Quando estamos usando medidas que descrevem a amostra e nos ajudam a tirar conclusões sobre a população chamamos de estatística de um parâmetro 23 populacional ou de estimador É sempre relacionada à amostra uma função de seus elementos A média amostral x e a variância amostral s² são alguns dos exemplos de estimadores Distribuição Amostral Quando escolhemos uma amostra tomamos alguns elementos escolhidos dentro da população Podemos ter várias amostras possíveis e caso consideremos todas que forem possíveis de serem extraídas de determinada população podemos calcular o valor do estimador para cada uma delas Nesse caso teremos uma distribuição amostral desse estimador Podemos usar o estimador como uma variável aleatória e então determinar suas características isto é encontrar sua média variância desviopadrão Estimação Podemos usar dois métodos para a estimação por ponto e por intervalo Estimação pontual Como o próprio nome diz é a estimação de um ponto Esse ponto representa alguma característica numérica de uma distribuição desconhecida ex média variância Isso significa que calculamos a partir de observações um número que acreditamos ser uma aproximação da característica numérica exata da população Dá para imaginar que tenhamos problemas por encontrar apenas um ponto Isso fica mais claro quando tomamos um valor baseandose em uma amostra Vamos imaginar que temos um quebracabeça a ser montado e chamamos algumas pessoas para tentar montá lo Vamos imaginar que as 10 pessoas que chamamos montaram o quebracabeça em 10 19 12 25 13 18 12 15 11 16 minutos A média desta amostra é x 151 minutos Se recebêssemos a informação dessa média de forma isolada sem nenhuma outra informação acreditaríamos que ela é a melhor estimativa da média populacional isto é que ela representa o verdadeiro tempo médio de montagem do quebracabeça Chamamos esse tipo de estimativa de pontual por ser apenas um ponto na escala dos números reais Apesar de ser a forma mais usada de estimativa a pontual não nos dá a informação completa Veja que não sabemos quantas amostras foram feitas e nem o 24 tamanho da amostra ou da população Não sabemos sobre a possibilidade do erro e nem da amplitude dos dados para tirar mais conclusões Estimação por intervalo Como a estimação por pontos não nos informa tudo que precisamos saber a estimação por intervalo deve ter alguma certeza maior Quando temos a distribuição amostral do estimador pontual podemos construir um intervalo de confiança de modo a ter certeza de que o valor verdadeiro está dentro desse intervalo Por mais que não tenhamos certeza de que o valor verdadeiro esteja em um desses intervalos de confiança podemos ao menos calcular a probabilidade que tenhamos o verdadeiro valor do parâmetro da população dentro de um certo intervalo Esses limites são chamados limites de confiança Como descrito eles determinam um intervalo de confiança no qual há uma grande probabilidade de estar o verdadeiro valor do parâmetro Sendo assim estamos estimando por intervalo quando fixamos dois valores reais que determinam um intervalo de 3 a 6 por exemplo dentro do qual há 1 α de probabilidade de que o verdadeiro valor do parâmetro esteja α nível de incerteza ou grau de desconfiança 1 α coeficiente de confiança ou nível de confiabilidade Vou dar um exemplo Vamos imaginar que α seja 5 Ele pode ser representado por 005 então há 1005 de probabilidade de que o valor real do parâmetro esteja dentro do intervalo dado 1005 é 095 isto é 95 Assim há 95 de chance de o valor real estar dentro do intervalo dado Deu para perceber que α nos dá a medida da incerteza desta inferência nível de significância isto é quanto porcento de chance temos de errar ao considerar aquele intervalo A ideia de encontrar um estimador por intervalo é a partir das informações de amostra calcular os limites de um intervalo que tem apenas α de chance de não conter o valor do parâmetro verdadeiro da população Nesses casos há 1 α de chance de que o intervalo contenha o valor do parâmetro a estimar Esse intervalo é chamado de 25 intervalo de confiança e está relacionado com a curva normal de distribuição que já estudamos Para esse cálculo usamos a média amostral como estimador da média populacional Também fazemos uma padronização dos valores da média desvio padrão e número de valores chegando a um valor padronizado Z Videoaula 1 Agora assista a um vídeo apresentando o que significa esse parâmetro Z e o que ele pode nos ajudar a calcular Em que o valor x é a média amostral μ é a média populacional que queremos estimar σ é o desvio padrão e n o tamanho da amostra Como queremos um nível de confiança de 1 α vamos distribuir da seguinte forma Videoaula 1 Agora assista a um vídeo apresentando o que significa esse parâmetro Z e o que ele pode nos ajudar a calcular Utilize o QRcode para assistir 26 Veja que temos α2 de possibilidade de erro de cada lado da curva ao todo dará um erro possível de α O valor Z 𝛼 2 é muito importante Veja que como temos metade de Z de cada lado 50 e o erro de 25 de cada lado isso significa que Z 𝛼 2 é o Z para o intervalo de 4750 o que significa em números decimais que Z 𝛼 2 é o Z para o valor 04750 Se quiséssemos um erro de 3 por exemplo seriam 15 de cada lado Z 𝛼 2 seria o Z para o valor 04850 Esse valor de Z é encontrado na tabela de distribuição normal 27 Sendo assim sabemos que a probabilidade que z esteja entre z 𝛼 2 e z 𝛼 2 é 1 α 28 Isso significa que Substituindo o valor de z que tínhamos definido anteriormente teremos Como nos interessa que o intervalo esteja em torno da média populacional μ vamos isolála no centro da desigualdade O valor de Z 𝛼 2 é encontrado na tabela de distribuição normal Veremos melhor como fazer isso no exemplo A utilização dessa fórmula é muito simples Escolhemos o valor de erro aceitável para o parâmetro Esse será o valor de α Calculamos então o valor de 1 α e olhamos na tabela de distribuição normal padrão o valor de Z para deixar exatamente α2 em cada uma das caudas da distribuição Com os valores da amostra já teremos a média amostral x o desvio padrão σ que neste caso é conhecido e o tamanho da amostra n Sendo assim usamos a fórmula para construir o intervalo Para o caso de populações finitas usase a seguinte fórmula 29 Vamos calcular um exemplo A duração da vida útil de uma lâmpada é tal que σ5 horas Foram amostradas 100 dessas lâmpadas obtendose a média de 500 horas Desejase construir um intervalo de confiança para a verdadeira duração média da lâmpada com um nível de 95 Solução σ 5 n 100 x500 1 α10095 O gráfico da distribuição normal padrão será Lembrese que para descobrir a abscissa 196 entrouse na tabela de distribuição normal padronizada com o valor 04750 4750 já que a tabela é de faixa central Veja que na tabela o valor Z 𝛼 2 196 já que queremos 04750 de intervalo de confiança 30 Substituindo na fórmula temos 𝑃𝑥 𝑍 𝛼 2 𝜎 𝑛 𝜇 𝑥 𝑍 𝛼 2 𝜎 𝑛 1 α 𝑃500 196 5 100 𝜇 500 196 5 100 95 𝑃500 196 5 10 𝜇 500 196 5 10 95 𝑃500 196 05 𝜇 500 196 05 95 Efetuando os cálculos temos P 499025 µ 500975 95 Isso significa que a média está entre 499025 e 500975 Videoaula 2 Agora assista a um vídeo que mostra como esse cálculo de probabilidade pode ser usado para tirar conclusões 31 Testes de Hipóteses Uma outra forma de avaliar parâmetros a partir de amostras é construindo testes de hipóteses De forma parecida a que transformamos a média em uma medida padronizada podemos transformar outras hipóteses em medidas padronizadas e verificar um intervalo de confiança para analisar a hipótese Esta é uma técnica para se fazer inferência estatística Partindo de um teste de hipóteses realizado com base nos dados amostrais fazemos inferências sobre a população Principais conceitos Como o próprio nome indica vamos testar hipóteses estatísticas isto é vamos partir de uma suposição quanto ao valor de um parâmetro populacional ou quanto à forma da distribuição de probabilidade de uma variável populacional e verificar se essa suposição se concretiza Podemos exemplificar as hipóteses estatísticas com as seguintes suposições a As lâmpadas de uma certa marca têm vida média Hµ µ0 b A média de pessoas que frequenta um parque é Hµ µ0 c O produto produzido pelo processo A é de melhor qualidade que o aço produzido pelo processo BµA µB d O índice de massa corporal médio das pessoas de uma academia é 25 isto é H µ25 e A variância populacional das notas de uma turma vale 24 isto é H σ²24 Videoaula 2 Agora assista a um vídeo que mostra como esse cálculo de probabilidade pode ser usado para tirar conclusões Utilize o QRcode para assistir 32 O método de avaliação das hipóteses parte da formulação de duas Ho hipótese nula ou da existência H1 hipótese alternativa Depois de definidas testamos as hipóteses para com base no resultado tomarmos uma decisão entre duas alternativas Por essa razão o Teste de Hipótese é um Processo de Decisão Estatística Para formular essas hipóteses adequadamente partimos da definição dos seus tipos que podem ser H0 que já dissemos se chamar hipótese nula ou H1 que chamaremos de hipótese alternativa A nula é aquela que queremos testar a alternativa é a outra conclusão que podemos ter A hipótese nula é representada por uma igualdade já a hipótese alternativa é dada por uma desigualdade Por exemplo H0 μ 165 H1 μ 165 Esse é um exemplo de teste bilateral já que temos uma hipótese nula com um valor central e a hipótese alternativa pode ser tanto para a direita desse valor quanto para a esquerda chamamos de teste bicaudal H0 μ 165 H1 μ 165 Esse é um exemplo de teste unilateral à direita já que temos uma hipótese nula com um valor central e a hipótese alternativa só nos interessa à direita do valor testado chamamos de teste unicaudal à direita H0 μ 165 H1 μ 165 Esse é um exemplo de teste unilateral à esquerda já que temos uma hipótese nula com um valor central e a hipótese alternativa só no interessa à esquerda do valor testado chamamos de teste unicaudal à esquerda 33 Para realizar um Teste de Hipóteses fazemos as seguintes etapas Definemse as hipóteses do teste nula e alternativa Fixase um nível de significância α Levantase uma amostra de tamanho n e calculase uma estimativa do parâmetro escolhido na definição das hipóteses Usamos uma variável que tenha a distribuição amostral do estimador dos parâmetros mais concentrada em torno do verdadeiro valor do parâmetro Isso é feito para cada tipo de teste Calculamos com o valor do parâmetro a ser testado dado por H0 que é a hipótese de que o parâmetro é igual ao valor que está sendo testado o valor crítico valor observado na amostra ou valor calculado Determinamos duas regiões uma que se o valor encontrado estiver nela decidimos não rejeitar H0 chamase Região de não Rejeição RNR e a região que se o valor encontrado estiver nela decidimos rejeitar H0 chamase Região de Rejeição ou Região Crítica RC para o valor calculado ao nível de risco dado Ex Na figura abaixo consideramos como Região Crítica aquela hachurada pensando no valor médio central e no nível de risco de α2 Se o valor calculado está dentro da região de não rejeição a decisão é a de não rejeitar H0 Se o valor calculado está dentro da Região Crítica a decisão é a de rejeitar H0 Vamos calcular uma vez juntos para entender como funciona Imagine o seguinte problema 34 Suponha que são produzidas peças e que se esperava que elas possuíssem 45cm de comprimento Vamos considerar que a distribuição dos tamanhos das peças é normal e com variância 36 tomase uma amostra casual de 16 peças obtendose média 43 cm O que queremos é testar com nível de 10 de risco se podemos dizer que a média é realmente 45 cm Nesse caso nossas hipóteses serão H0 µ 45 H1 µ 45 Quando estamos calculando o teste para média de populações normais com variância conhecida podemos usar uma variável já conhecida como critério nesse caso a variável Z N01 que tem uma tabela já montada de valores Como o risco é 10 e o teste é bilateral teremos 5 de região para cada lado Sendo assim olhamos na tabela o valor de Z para 04500 que corresponde a 164 Como o teste é bilateral e α 10 a Região de Não Rejeição RNR é 35 P Z Zα 1 α PZ164 090 E a Região de Rejeição RC é dada por P Z Zα αP Z 164 010 A zona de não rejeição acontece quando Z está entre 164 e 164 A fórmula de Z já dada é 𝑍 𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 43 45 6 16 43 45 6 4 2 15 133 Como z calculado é 133 dá para perceber que está dentro da Região de não Rejeição Logo a decisão é não rejeitarmos H0 isto é a média é de 45 com 10 de risco de não rejeitarmos uma hipótese falsa Outro teste Unilateral Monocaudal à Esquerda Uma fábrica de geleia de frutas quer se adequar à regra da Anvisa sobre fragmentos de insetos nos seus potes Um pote de 100 gramas de geleia pode conter menos do que 36 25 fragmentos de insetos desde que não sejam um risco para a saúde humana Um laboratório realiza uma análise em 10 potes encontrando os seguintes resultados 25232221272426252723 Sabese que a quantidade de fragmentos de insetos em potes dessa fábrica se distribui normalmente com variância 536 Podese dizer que essa fábrica está adequada ao regulamento da Anvisa assumindo um risco de 5 H0 µ 25 H1 µ 25 Veja que como estamos falando de uma análise de apenas um dos lados da distribuição vamos verificar que α 5 e a região vai ser até 45 de Z Sendo assim vamos usar o valor de PZ 04500 novamente E já vimos que Z 164 Sendo assim qualquer Z calculado maior que 164 fará parte da região de não rejeição A Média x 243 σ²536 σ2315 n10 𝑍 𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 243 25 2315 10 07 2315 3162 07 0732 0957 37 Não se rejeita H0 isto é ao nível de 5 podemos concluir que a fábrica não respeita o regulamento da Anvisa Erros de Decisão Videoaula 3 Agora assista a um vídeo falando o que são erros de decisão e quais são os erros possíveis em um teste Podemos ter dois tipos de erro ao testar uma hipótese estatística O primeiro acontece quando escolhemos rejeitar uma hipótese quando ela é de fato verdadeira O segundo consiste em aceitar uma hipótese quando ela é de fato falsa A primeira é chamada erro tipo I A segunda é chamada de erro tipo II As probabilidades desses dois tipos de erros são designadas respectivamente por α e β A probabilidade α do erro tipo I é denominada nível de significância do teste Videoaula 3 Agora assista a um vídeo falando o que são erros de decisão e quais são os erros possíveis em um teste Utilize o QRcode para assistir 38 Observe que o erro tipo I só poderá ser cometido se se rejeitar H0 e o erro do tipo II quando se aceitar H0 Encerramento da Unidade Na aula de hoje aprendemos o que são probabilidades condicionais e como calculamos esse tipo de probabilidade Aprendemos o que são e como são encontradas ou definidas as variáveis aleatórias Aprendemos ainda que elas podem ser contínuas ou discretas de acordo com o conjunto do intervalo em que podem ser definidas Conhecemos alguns tipos de distribuições de probabilidades e a mais importante delas é a distribuição normal Vimos que podemos encontrar uma grande probabilidade de os dados estarem dentro do intervalo de 1 2 ou 3 desvios padrão em torno da média quando estamos falando desse tipo de distribuição de probabilidades Também vimos como se encontram as probabilidades de uma distribuição Vimos também que a distribuição normal tem valores padronizados em tabelas e como usamos esse estudo para testar hipóteses estatísticas 39 Referências CASTANHEIRA N P Estatística aplicada a todos os níveis1ª ed Curitiba Intersaberes 2012 Videoaula Encerramento Videoaula Encerramento Utilize o QRcode para assistir