·

Química ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Recommended for you

Preview text

Prof Dani Prestini Probabilidade e Estatística Estatística Descritiva 2 Conceitos Iniciais Estatística Descritiva O que é Estatística Parte da Matemática Aplicada que fornece os princípios e a metodologia para coleta organização apresentação resumo análise e interpretação de dados Possui um conjunto de métodos e processos quantitativos que auxiliam na tomada de decisões e pode ser usada para estudar e medir fenômenos coletivos Estatística Descritiva O que é Estatística Conjunto de métodos para planejamento de estudos e experimentos obtenção de dados e organização resumo apresentação análise interpretação e elaboração de conclusões baseadas nos dados Estatística Descritiva Algumas Aplicações Garantir que um novo medicamento é seguro e eficiente descrevendo os possíveis efeitos colaterais Estimar a preferência de um públicoalvo para lançar um novo produto ou serviço como preço renda média armazenamento Recebimento de lotes de mercadorias que satisfaçam os requisitos de qualidade acordados Estatística Descritiva Ramificações da Estatística Descritiva Análise de dados Coleta Organização e Resumo dos dados Teoria das Probabilidades Necessária para tirar conclusões a partir de amostras Indutiva ou Inferencial Envolve o uso da amostra para chegar a conclusão sobre uma população Estatística Descritiva População ou Universo Estatístico É todo o conjunto de elementos pessoas ou resultados experimentais que possuam ao menos uma ou mais características em comum e que se pretende estudar Amostra Conjunto de dados ou observações recolhidos a partir de um subconjunto da população que se estuda com o objetivo de tirar conclusões para a população de onde foi recolhida Estatística Descritiva Exemplo Um estudo para encontrar o salário médio de um engenheiro mecânico em Joinville População TODOS os engenheiros mecânicos de Joinville Amostra UM GRUPO de 20 engenheiros mecânicos de Joinville escolhidos aleatoriamente amostra população Estatística Descritiva Estatística Descritiva Censo Estudo que leva em consideração todos os elementos da população Amostra Estudo que leva em consideração alguns elementos da população A amostra pode ser mais atualizada do que a população devido a demora na coleta das informações de toda a população Tem menor custo que o censo Maior precisão envolve menor número de coletores de dados diminuindo a chance de erros Exigido precisão completa nos resultados Neste caso o censo é o único método aceitável X Estatística Descritiva Definições Dados e Variáveis O que é variável É uma condição ou característica dos elementos da população Pode assumir valores diferentes em diferentes elementos O que são dados São os valores coletados da variável em estudo Estatística Descritiva Números Contínuos Não permite uma ordenação Permite uma ordenação Números inteiros Valores expressos por atributos Valores expressos por números Estatística Descritiva Exemplos Classifique os dados como quantitativos T ou qualitativos L O peso em Kg de uma pessoa O número de ovos de uma galinha em 1 mês O sexo de uma pessoa mf O número de carros parados em um semáforo A cor dos olhos de uma pessoa Estatística Descritiva Exemplos Classifique os dados como quantitativos T ou qualitativos L T O peso em Kg de uma pessoa T O número de ovos de uma galinha em 1 mês L O sexo de uma pessoa mf T O número de carros parados em um semáforo L A cor dos olhos de uma pessoa Estatística Descritiva Exemplos Especifique o tipo de cada variável a Peso das encomendas postadas no correio CDNO b Marcas de carros CDNO c Resistência de um material CDNO d Religião CDNO e Escolaridade de um trabalhador CDNO f Número de músicas em um álbum CDNO Estatística Descritiva Exemplos Especifique o tipo de cada variável a Peso das encomendas postadas no correio CDNO b Marcas de carros CDNO c Resistência de um material CDNO d Religião CDNO e Escolaridade de um trabalhador CDNO f Número de músicas em um álbum CDNO AQUI NO LABORATÓRIO NÓS NÃO ACREDITAMOS EM AMOSTRAS ESTATÍSTICAS NÃO É SÓ UM POUQUINHO DE SANGUE QUE VAI SER SUFICIENTE PRA PROVAR SE O SENHOR ESTÁ OU NÃO DOENTE NÃO É VERDADE Estatística Descritiva Amostragem Casual ou Aleatória Simples equivalente ao sorteio Amostragem Proporcional Estratificada escolha proporcional Amostragem Sistemática característica escolhida pelo pesquisador Tipos de Amostragem Estatística Descritiva Amostragem Proporcional Estratificada A população é dividida em subpopulações que chamamos de estrato A amostra segue a proporcionalidade da população respeitando desta forma suas divisões estrato Estatística Descritiva Amostragem Proporcional Estratificada Exemplo No curso de graduação estão matriculados 90 alunos Destes 54 são do sexo masculino e 36 do sexo feminino Uma pesquisa deverá ter como amostra 20 da população Calcular o número de pessoas que devem ser escolhidas para fazer parte da amostra Sexo População 20 Amostra M 54 5420100 108 11 F 36 3620100 72 7 Total 90 9020100 18 18 Estatística Descritiva Amostragem Proporcional Estratificada Exemplo No curso de graduação estão matriculados 90 alunos Destes 54 são do sexo masculino e 36 do sexo feminino Calcular o número de pessoas que devem ser escolhidas para fazer parte da amostra Sexo População Cálculo Amostra M 54 60 5460100 324 32 F 36 40 3640100 144 14 Total 90 46 Estatística Descritiva Amostragem Sistemática Os elementos da população já se acham ordenados não há necessidade de construir um sistema de referência Selecionase um ponto de partida aleatório e depois a cada intervalo determinado escolhese outro elemento da estrutura Exemplos A lista de chamada de uma turma de alunos O boletim de ocorrência de um posto de saúde A linha de produção de uma empresa Estatística Descritiva Exercícios 1 Em uma escola do primeiro grau estudam 638 alunos Deste total 364 são meninas e 274 são meninos Elabore uma amostra proporcional estratificada com 8 dos alunos 2 Em uma escola pública estadual estudam 160 alunos que cursam o Ensino Médio Desses 64 alunos estão no 1º ano 65 alunos estão no 2º ano e 31 alunos estão no 3º ano Elabore uma amostra proporcional estratificada com 32 alunos do ensino médio dessa escola Estatística Descritiva Exercícios 1 Em uma escola do primeiro grau estudam 638 alunos Deste total 364 são meninas e 274 são meninos Elabore uma amostra proporcional estratificada com 8 dos alunos 2 Em uma escola pública estadual estudam 160 alunos que cursam o Ensino Médio Desses 64 alunos estão no 1º ano 65 alunos estão no 2º ano e 31 alunos estão no 3º ano Elabore uma amostra proporcional estratificada com 32 alunos do ensino médio dessa escola Método Estatístico Método Científico Método é um conjunto de meios para se chegar a um fim que se deseja Método Experimental consiste em manter constantes todas as causas fatores menos uma e variar esta causa de modo que o pesquisador possa descobrir seus efeitos caso existam Método Estatístico admite todas as causas presentes variandoas registrando essas variações e procurando determinar no resultado final que influências cabem a cada uma delas Método Estatístico Método Estatístico Fases do Método Científico Definição do Problema Planejamento Coleta dos dados Crítica dos dados Apuração dos dados Exposição dos resultados Análise dos resultados Método Estatístico Fases do Método Científico 1 Definição do Problema Formular corretamente o problema Examinar outros levantamentos realizados na mesma área Saber exatamente o que se pretender pesquisar Método Estatístico Fases do Método Científico 2 Planejamento Determinar os procedimentos para levantar as informações sobre o objeto de estudo Escolher e formular corretamente as perguntas Definir o tipo de levantamento censo ou amostragem Definir cronograma de atividades custos envolvidos delineamento da amostra etc Método Estatístico Fases do Método Científico 3 Coleta de Dados Primário Não foram ainda coletados Realizado pelo pesquisador para atender a uma necessidade específica da pesquisa Secundário Elementos de registro obrigatório ou que estão a disposição pública Método Estatístico Fases do Método Científico 31 Método Estatístico Fases do Método Científico 4 Crítica dos dados Observar os dados à procura de falhas e imperfeições visando eliminar erros grosseiros Crítica externa visa as causas dos erros por parte do informante Crítica interna visa observar os elementos originais dos dados da coleta Método Estatístico Fases do Método Científico 5 Apuração dos dados Processamento dos dados manual ou eletrônica 6 Exposição dos dados Apresentar os dados uso de tabelas eou gráficos Método Estatístico Fases do Método Científico 7 Análise dos resultados Realizada após a Estatística Descritiva Tirar conclusões sobre o todo a partir da amostra Uso da Estatística Inferencial Método Estatístico Resumo do Método Científico Formular ou Reformular o Problema Desenhar um projeto de pesquisa Coletar os dados Analisar criticamente os dados Apresentar os dados e a conclusão Método Estatístico Definiu o problema Definiu o público alvo Definiu o tipo de técnica amostral Definiu as perguntas que traçarão o perfil do entrevistado além de responder o problema Definiu com que instrumento coletará os dados Como organizar os dados Classificação de Dados Dados absolutos resultantes da coleta das informações conforme as frequências repetições de seus valores Embora verdadeiros não nos permitem de forma simples e objetiva chegar a uma conclusão numérica Dados relativos resultados de comparações que se estabelecem entre os dados absolutos Tem por objetivo facilitar a comparação entre as quantidades coletadas Podem ser apresentados em porcentagens frequência relativa índices coeficientes e taxas Classificação de Dados Porcentagem ou frequência relativa útil para expressar aumento ou redução das grandezas pesquisadas Cidade População em 2000 População em 2010 Crescimento Blumenau 261868 309011 1800 Joinville 436585 515288 1803 Florianópolis 331784 421240 2696 𝑽𝒂𝒍𝒐𝒓 𝑽𝒂𝒍𝒐𝒓 𝒇𝒊𝒏𝒂𝒍 𝑽𝒂𝒍𝒐𝒓 𝒊𝒏𝒊𝒄𝒊𝒂𝒍 𝑽𝒂𝒍𝒐𝒓 𝒊𝒏𝒊𝒄𝒊𝒂𝒍 𝟏𝟎𝟎 Classificação de Dados Índices razões estabelecidas entre duas grandezas diferentes que permitem estudos comparativos entre os dados obtidos 𝑸𝑰 𝐈𝐝𝐚𝐝𝐞 𝑴𝒆𝒏𝒕𝒂𝒍 𝑰𝒅𝒂𝒅𝒆 𝑪𝒓𝒐𝒏𝒐𝒍ó𝒈𝒊𝒄𝒂 𝑹𝒆𝒏𝒅𝒂 𝒑𝒆𝒓 𝒄𝒂𝒑𝒕𝒂 𝑹𝒆𝒏𝒅𝒂 𝑷𝒐𝒑𝒖𝒍𝒂çã𝒐 𝑫𝒆𝒏𝒔𝒊𝒅𝒂𝒅𝒆 𝒑𝒐𝒑𝒖𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 𝑷𝒐𝒑𝒖𝒍𝒂çã𝒐 𝑺𝒖𝒑𝒆𝒓𝒇í𝒄𝒊𝒆 Classificação de Dados Coeficientes razões resultantes de ocorrências quantitativas de uma parte da grandeza em relação a sua totalidade É adimensional 𝑪𝒐𝒆𝒇 𝑵𝒂𝒕𝒂𝒍𝒊𝒅𝒂𝒅𝒆 𝑵º 𝒏𝒂𝒔𝒄𝒊𝒎𝒆𝒏𝒕𝒐𝒔 𝒑𝒐𝒑 𝒕𝒐𝒕𝒂𝒍 𝑪𝒐𝒆𝒇 𝑴𝒐𝒓𝒕𝒂𝒍𝒊𝒅𝒂𝒅𝒆 𝑵º Ó𝒃𝒊𝒕𝒐𝒔 𝒑𝒐𝒑 𝒕𝒐𝒕𝒂𝒍 𝑪𝒐𝒆𝒇 𝒆𝒗𝒂𝒔ã𝒐 𝒆𝒔𝒄𝒐𝒍𝒂𝒓 𝑵º 𝒂𝒍𝒖𝒏𝒐𝒔 𝒆𝒗𝒂𝒅𝒊𝒅𝒐𝒔 𝑵º 𝒊𝒏𝒊𝒄𝒊𝒂𝒍 𝒅𝒆 𝒎𝒂𝒕𝒓í𝒄𝒖𝒍𝒂𝒔 Classificação de Dados Taxas razões são os coeficientes multiplicados por uma potência de 10 10 100 1000 etc para tornar o resultado mais inteligível 𝑻𝒂𝒙𝒂 𝒅𝒆 𝒎𝒐𝒓𝒕𝒂𝒍𝒊𝒅𝒂𝒅𝒆 𝒄𝒐𝒆𝒇 𝒎𝒐𝒓𝒕𝒂𝒍𝒊𝒅𝒂𝒅𝒆 𝟏𝟎𝟎𝟎 𝑻𝒂𝒙𝒂 𝒅𝒆 𝒏𝒂𝒕𝒂𝒍𝒊𝒅𝒂𝒅𝒆 𝒄𝒐𝒆𝒇 𝒏𝒂𝒕𝒂𝒍𝒊𝒅𝒂𝒅𝒆 𝟏𝟎𝟎𝟎 𝑻𝒂𝒙𝒂 𝒅𝒆 𝒆𝒗𝒂𝒔ã𝒐 𝒆𝒔𝒄𝒐𝒍𝒂𝒓 𝒄𝒐𝒆𝒇 𝒅𝒆 𝒆𝒗𝒂𝒔ã𝒐 𝒆𝒔𝒄𝒐𝒍𝒂𝒓 𝟏𝟎𝟎 Classificação de Dados Exemplo Um curso tinha 506 alunos matriculados no início do semestre No final do semestre eram 485 alunos Qual a taxa de evasão do curso 𝑻𝒂𝒙𝒂 𝒆𝒗𝒂𝒔ã𝒐 𝒏º 𝒂𝒍𝒖𝒏𝒐𝒔 𝒆𝒗𝒂𝒅𝒊𝒅𝒐𝒔 𝒏º 𝒅𝒆 𝒎𝒂𝒕𝒓𝒊𝒄𝒖𝒍𝒂𝒔 𝟏𝟎𝟎 𝟓𝟎𝟔 𝟒𝟖𝟓 𝟓𝟎𝟔 𝟏𝟎𝟎 𝟐𝟏 𝟓𝟎𝟔 𝟏𝟎𝟎 𝟒 𝟏𝟓 Apresentação dos Dados Após análise dos dados convém organizálos de maneira prática e racional para melhor entendimento dos fenômenos que está estudando A organização dos dados denominase série estatística e sua apresentação pode ocorrer por meio de tabelas ou gráficos Apresentação dos Dados As tabelas são importantes formas de representação de dados estatísticos pelo seu aspecto descritivo e maior facilidade na investigação A elaboração de tabelas obedece a Resolução no 886 de 26 de outubro de 1966 do Conselho Nacional de Estatística a partir de 1993 o IBGE passou a normalizar a apresentação de tabelas também 1 Tabelas Apresentação dos Dados Tabelas Uma tabela deve ter Título explica o conteúdo da tabela Corpo composto pelos dados organizados em linhas e colunas que se cruzam Cabeçalho especifica o conteúdo das colunas Coluna indicadora especifica o conteúdo das linhas Rodapé indica a fonte dos dados da tabela Apresentação dos Dados Apresentação de Tabelas PRODUÇÃO DE CAFÉ NO BRASIL ANOS PRODUÇÃO 1000 t 1991 2535 1992 2666 1993 2122 1994 3750 1995 2007 TÍTULO CABEÇALHO COLUNA NUMÉRICA CASA OU CÉLULA LINHAS FONTE IBGE CORPO COLUNA INDICADORA RODAPÉ CABEÇALHO As tabelas são consideradas séries estatísticas e apresentam a distribuição de um conjunto de dados estatísticos em função da época local ou espécie Podem ser então classificadas em 1 Série Temporal ou Cronológica 2 Série Geográfica ou Histórica 3 Série Específica Categórica 4 Série Mista ou de Dupla Entrada É a série estatística em que os dados são observados segundo o tempo que ocorrem TABELA 5 NÚMERO DE DIAS PERDIDOS DE TRABALHO POR AT ENTRE 2000 E 2007 NO BRASIL ENTRE TRABALHADORES SEGUROS QUE RECEBERAM BENEFÍCIOS PARA AFASTAMENTOS TEMPORÁRIOS¹ ANO INDUSTRIA DA CONSTRUÇÃO N MEDIANA 2000 94613 93 2001 1034169 100 2002 1144542 109 2003 1015838 128 2004 733186 99 2005 8428 71 2006 79419 89 2007 1348 74 É a série estatística em que os dados são observados segundo o local onde ocorrem Também chamada de espacial territorial ou de localização Média de habitantes por m² nas capitais Caracas São Paulo e Recife em 2008 Período Número Caracas 142 São Paulo 250 Recife 210 Fonte IBGE Apresentação dos Dados Série Específica Categórica É a série estatística em que os dados são observados e agrupados segundo a modalidade fatoespécie de ocorrência RANKING MARÇO as empresas mais reclamadas do mês 1º SKY 10155 418 2º NET SERVIÇOS 12743 795 3º VIVO 1734 0 4º OI 1639 0 5º EXTRACOMBR 5829 773 Apresentação dos Dados Série Mista ou Dupla Entrada Quantidade de acidentes do trabalho liquidados no setor de construção civil segundo consequência Brasil 20062012 ANO ASSISTÊNCIA MÉDICA INCAPACIDADE MENOS DE 15 DIAS INCAPACIDADE MAIS DE 15 DIAS INCAPACIDADE PERMANENTE ÓBITOS TOTAL 2006 4857 16677 9472 768 284 32058 2007 5588 16778 15635 751 319 39071 2008 7871 21385 9988 1117 384 54745 2009 7679 27202 1316 407 57830 2010 7145 25667 1288 456 58082 2011 8185 26941 1356 471 62027 2012 9665 27363 1448 450 65101 Variação 20122008 228 280 91 296 172 189 Fonte Anuário Estatístico de Acidentes do Trabalho AEAT Apresentação dos Dados A representação gráfica das séries estatísticas tem por finalidade dar uma ideia a mais imediata possível permitindo chegarse a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série Não há apenas uma maneira de representar graficamente uma série estatística Contudo a simplicidade a clareza e a veracidade devem ser considerados quando da elaboração de um gráfico Os principais tipos de gráficos são 2 Gráficos 1 Gráfico de Linha 2 Gráfico de Coluna 3 Gráfico de Barra 4 Gráfico de Setor 5 Gráfico Polar Apresentação dos Dados 2 Gráficos Requisitos básicos para apresentação de um gráfico estatístico Simplicidade trazer apenas o essencial Clareza possibilitar a leitura correta dos valores do fenômeno Veracidade expressar a verdade sobre o fenômeno representado Colocar o título na parte superior o subtítulo a seguir de preferência na horizontal da esquerda para a direita Cuidado com escala utilizada Representação das unidades do fenômeno em estudo Fontes dos dados Legendas claras e nítidas Cores utilizadas Apresentação dos Dados Gráfico de Linha Apresentação dos Dados Gráfico de Coluna Apresentação dos Dados Gráfico de Barra Apresentação dos Dados Gráfico de Setor Circular Apresentação dos Dados Gráfico de Setor Circular Apresentação dos Dados Gráfico Polar ou Radar Exercícios 1 Lista de Exercícios postada no Moodle Obrigado Prof Dani Prestini Probabilidade e Estatística Estatística Descritiva Estatística Descritiva Dados Brutos ou Tabela Primitiva Mostra os dados sem uma organização prévia Dificulta a análise e interpretação dos dados Curso Técnico em Mecânica Integrado IFSC Altura dos alunos em metros 165 178 155 167 169 152 175 156 153 166 185 153 165 172 156 172 165 172 167 157 175 156 156 163 167 173 175 172 173 169 176 156 166 173 157 167 172 169 154 173 Fonte IFSC Campus Joinville 2020 Estatística Descritiva Rol Tabela ordenada de forma crescente ou decrescente Facilita a análise e interpretação dos dados 152 153 153 154 155 156 156 156 156 156 157 157 163 165 165 165 166 166 167 167 167 167 169 169 169 172 172 172 172 172 173 173 173 173 175 175 175 176 178 185 Fonte IFSC Campus Joinville 2020 Curso Técnico em Mecânica Integrado IFSC Estatística Descritiva Distribuição de Frequência Uma distribuição de frequência lista os valores dos dados individualmente ou por grupo de intervalos juntamente com suas frequências correspondentes ou contagens As distribuições de frequência são construídas pelas seguintes razões Grandes conjuntos de dados podem ser resumidos Podemos obter alguma compreensão sobre a natureza dos dados Geramos uma base para construir gráficos como o histograma Estatística Descritiva Distribuição de Frequência Estatística Descritiva Distribuição de Frequência X fa Fa fr Fr 21 3 3 1765 1765 22 2 5 1176 2941 23 2 7 1176 4117 24 1 8 588 4705 25 4 12 2353 7058 26 3 15 1765 8823 28 1 16 588 9411 30 1 17 588 10000 17 10000 Estatística Descritiva Distribuição de Frequência Frequências relativas frj Dividese cada frequência faj de classe pelo total de todas as frequências 𝑓𝑟𝑗 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒 𝑗 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠 𝑓𝑎𝑗 σ𝑖1 𝑛 𝑓𝑎𝑖 Frequência acumulada Fj Soma de todas as frequência anteriores até a atual inclusive 𝐹𝑗 𝑖1 𝑗 𝑓𝑖 Estatística Descritiva Distribuição de Frequência No cálculo da frequência os dados podem ser agrupados sem intervalo ou com intervalo de classe Estatística Descritiva Distribuição de Frequência Simbologia de Classes Inclui o número a esquerda e excluiu o numero da direita Também pode ser representado por Inclui o número da esquerda e da direita Também pode ser representado por Exclui o número da esquerda e da direita Também pode ser representado por Exclui o número da esquerda e inclui o número da direita Também pode ser representado por Estatística Descritiva Exemplo dados agrupados sem intervalos de classes Na pesquisa de preços de um notebook mesma configuração os valores em reais encontrados foram os seguintes 3000 3500 3000 3600 3000 3600 3600 3500 3500 3000 3000 3000 3500 3600 3600 3600 3600 3600 3600 3600 Para facilitar o estudo da variável preço agrupamos os valores na tabela Os números na coluna Número de lojas indicam as frequências absolutas dos valores observados para a variável preço Preço R Número de lojas 3000 6 3500 4 3600 10 Total 20 Estatística Descritiva Exemplo dados agrupados sem intervalos de classes Na pesquisa de preços de um notebook mesma configuração os valores em reais encontrados foram os seguintes 3000 3500 3000 3600 3000 3600 3600 3500 3500 3000 3000 3000 3500 3600 3600 3600 3600 3600 3600 3600 Para facilitar o estudo da variável preço agrupamos os valores na tabela Os números na coluna Porcentagem indicam as frequências relativas dos valores observados para a variável preço Preço R Número de lojas 𝒇𝒂𝐣 Porcentagem 𝒇𝒓𝒋 3000 6 620 03 30 3500 4 420 02 20 3600 10 1020 05 50 Total 20 100 Estatística Descritiva Distribuição de Frequência Frequência Absoluta Acumulada Fa ou Fi soma de cada frequência absoluta com as frequências absolutas anteriores Frequência Relativa Acumulada Fra ou Fri soma de cada frequência relativa com as frequências relativas anteriores Preço R Número de lojas 𝒇𝒂𝐣 𝑭𝒂𝒋 Porcentagem 𝒇𝒓𝒋 𝑭𝒓𝒋 3000 6 6 620 03 30 30 3500 4 10 420 02 20 50 3600 10 20 1020 05 50 100 Total 20 100 Estatística Descritiva Exemplo Considere os dados sobre a idade dos atletas que participaram de uma pesquisa 21 21 21 22 22 23 23 24 25 25 25 25 26 26 26 28 30 Construa a tabela de distribuição com todas as frequências dessa pesquisa X fa Fa fr Fr 21 3 3 1765 1765 22 2 5 1176 2941 23 2 7 1176 4117 24 1 8 588 4705 25 4 12 2353 7058 26 3 15 1765 8823 28 1 16 588 9411 30 1 17 588 10000 17 10000 Estatística Descritiva Distribuição de Frequência para dados agrupados por intervalo de classe Classe de frequência intervalos de variação da variável Representada pela letra i 1 2 3k k representa o total de classes Limites de classes são os extremos de cada classe Temos o Li limite inferior e o Ls limite superior Nesse exemplo o intervalo de 155 a 160 define a 4ª classe i 4 e a distribuição é formada por 7 classes k 7 O limite inferior da 4ª classe é 155 e o limite superior dessa classe é é 160 Amplitude Amostral A Diferença entre o maior e o menor valor da amostra Estatística Descritiva Como definir o número de intervalos de classe Essas fórmulas apenas auxiliam na determinação do número de classes e não substituem o uso do bom senso como evitar classe com frequência nula ou frequência relativa exagerada Regra de Sturges k 1 33log n k Total de classes n tamanho da amostra Há quem prefira usar k n quantidade total de dados da amostra Estatística Descritiva Exemplo dados agrupados com intervalos de classes De acordo com a OMS Organização Mundial da Saúde ruídos acima de 50 db decibéis são prejudiciais ao ser humano Insônia dores de cabeça estresse e perda parcial ou total da audição são alguns dos efeitos prejudiciais da poluição sonora A seguir estão os níveis de ruído em db registrados em algumas áreas da cidade de São Paulo Níveis de ruído em db em áreas residenciais da cidade de São Paulo 7294 6684 6616 6478 6314 6189 6032 5667 7146 6443 6601 6471 6269 6149 6022 5603 7152 6417 6570 6581 6257 6096 6014 5589 7008 6329 6508 6415 6192 6074 5936 5577 Fonte Prefeitura de São Paulo 2015 Estatística Descritiva Cálculo do número de intervalos de classe 7294 6684 6570 6443 6314 6189 6032 5667 7152 6616 6508 6417 6269 6149 6022 5603 7146 6601 6478 6415 6257 6096 6014 5589 7008 6581 6471 6329 6192 6074 5936 5577 Calcular a Amplitude Total A 72 94 5577 1717 Usar a regra de Sturges ou outra que possibilite uma análise adequada de acordo com a natureza dos dados k 1 33log 32 k 597 6 classes ou classes n k 6 75 32 Identificar o maior e o menor valor coletado 7294 e 5577 Estatística Descritiva Cálculo do número de intervalos de classe Dividimos a Amplitude Total pelo número de intervalos que desejamos Temos como sugestão o uso de 6 intervalos de classe A razão obtida entre a Amplitude Total e o número de classes k é a Amplitude do Intervalo ou da classe indicada por h 206 Assim o primeiro intervalo começa em 55 decibéis indo até 58 decibéis 55 3 Para representar esse intervalo podemos usar duas notações 55 58 ou 55 58 3 2 86 6 1717 h Estatística Descritiva Distribuição de frequências para dados agrupados por intervalos de classe Ruído db fa Fa fr Fr 55 58 4 4 1250 125 58 61 6 10 1875 3125 61 64 7 17 2188 5312 64 67 11 28 3437 8750 67 70 0 28 0 8750 70 73 4 32 1250 100 Total 32 100 Estatística Descritiva Histograma É um gráfico de barras no qual a escala horizontal representa classes de valores de dados a escala vertical representa as frequências As alturas das barras correspondem aos valores das frequências e as barras são desenhadas adjacentes umas às outras sem separação Versão gráfica de uma tabela de distribuição de frequências Estatística Descritiva Estatística Descritiva Distribuição Normal Gráfico em formato de sino As frequências começam baixas crescem até uma frequência máxima e depois decrescem para uma frequência baixa A distribuição deve ser aproximadamente simétrica com frequências igualmente distribuídas em ambos os lados da frequência máxima Estatística Descritiva Distribuição Normal Distribuição Assimétrica Quando se estende mais para um lado do que para o outro Distribuição Simétrica Quando a metade da esquerda de seu histograma é praticamente uma imagem espelhada de sua metade direita Estatística Descritiva Distribuição Normal Estatística Descritiva Diagrama de Ramo e Folhas Tem como vantagem ser possível ver a distribuição dos dados e ainda reter a informação da lista original É uma maneira rápida de ordenar dados e será importante para encontrar mediana e percentis Estatística Descritiva Diagrama de Ramo e Folhas Dados 150 157 161 152 173 161 150 Ramo Folhas 15 0 0 2 7 16 1 1 17 3 Estatística Descritiva MEDIDAS DE TENDÊNCIA CENTRAL Estatística Descritiva Medidas de Tendência Central Estatística Descritiva Medidas de Tendência Central Medidas de Tendência Central Média Moda Mediana Servem para descrever características básicas de um estudo com dados quantitativos e comparar resultados Estatística Descritiva Média Símbolo X Usada para obter a medida de posição que possui a maior estabilidade Maior problema da média valores extremos podem distorcêla Estatística Descritiva Média Aritmética Simples usada para dados não agrupados n x x x x n 2 1 Razão entre a soma das variáveis pelo número de elementos da amostra i x média x soma dos elementos n número de elementos Exemplo Considere os atendimentos realizados na emergência de um PA nos últimos dez dias 23 34 15 26 32 24 31 19 21 30 Quantas pessoas foram atendidas em média Estatística Descritiva Média Aritmética Simples 23 34 15 26 32 24 31 19 21 255 10 30 X 10 X 255 26 pessoas Como essa informação ajuda na tomada de decisões Pode influenciar na escala de plantão do hospital Previsão de estoque mínimo de medicamentos importantes para o socorro desta natureza Redimensionamento no número de leitos Estatística Descritiva Média Aritmética Ponderada é bastante similar à média aritmética comum A diferença entretanto é que na média aritmética todos os valores contribuem com peso igual enquanto que no cálculo da média aritmética ponderada se leva em consideração a contribuição peso de cada termo uma vez que existem termos que contribuem mais que outros Usada para dados agrupados sem intervalo de classe i x f x f i i Estatística Descritiva Exemplo Para verificar a satisfação dos usuários de uma companhia elétrica de um município a prefeitura realizou uma pesquisa com 500 pessoas As notas sugeridas aos entrevistados buscam avaliar o nível de satisfação com o atendimento recebido e compreendem as notas inteiras entre 1 a 10 onde 1 significa que o usuário está muito insatisfeito e 10 que está muito satisfeito com os serviços prestados Os resultados são apresentados na tabela a seguir Qual a média de satisfação dos usuários da companhia elétrica em questão Estatística Descritiva Nota xi fi xifi 1 5 15 5 502 2 15 215 30 3 40 340 120 4 128 4128 512 5 150 5150 750 6 90 690 540 7 35 735 245 8 25 825 200 9 10 910 90 10 2 102 20 Total 500 2512 X 2512 X 502 500 i x f x f i i Estatística Descritiva Exemplo Durante o ano letivo um professor aplicou cinco provas para seus alunos A tabela apresenta as notas obtidas por um aluno em quatro das cinco provas realizadas e os pesos estabelecidos pelo professor para cada prova Se o aluno foi aprovado com média ponderada de 73 qual a nota obtida na prova IV Se o aluno foi aprovado com média final ponderada igual a 73 calculada entre as cinco provas a nota obtida por esse aluno na prova IV foi 165 273 375 2x 262 1 2 7 3 3 2 2 56 2x 73 2x 73 56 x 85 Nota 85 i x f x f i i Estatística Descritiva Média para dados agrupados com intervalo de classe Convencionase que todos os valores de um intervalo de classe coincidem com seu ponto médio e determinase a média ponderada ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA Fi PONTO MÉDIO xi xifi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 total 40 Estatística Descritiva Média para dados agrupados com intervalo de classe ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi PONTO MÉDIO xi xifi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 total 40 ҧ𝑥 Σ𝑥𝑖𝑓𝑖 Σ𝑓i Estatística Descritiva Média para dados agrupados com intervalo de classe ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi PONTO MÉDIO xi xifi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 152 156 160 164 168 172 total 40 𝑥𝑖 ponto médio 𝑥𝑖 𝑙𝑖𝑚𝑠𝑢𝑝 𝑙𝑖𝑚𝑖𝑛𝑓 2 Estatística Descritiva Média para dados agrupados com intervalo de classe ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi PONTO MÉDIO xi xifi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 152 156 160 164 168 172 608 1404 1760 1312 840 516 total 40 6440 𝑥 σ 𝑥𝑖𝑓𝑖 σ 𝑓𝑖 6440 40 161 Estatística Descritiva Mediana Símbolo 𝑀𝑑 É um valor central de um rol ou seja a mediana de um conjunto de valores ordenados crescente ou decrescente é a medida que divide este conjunto em duas partes iguais Dado um conjunto ordenado de valores mediana é o valor situado de tal maneira que este valor separa o conjunto em dois subconjuntos com mesmo numero de elementos Estatística Descritiva Mediana de dados não agrupados para 𝑛 ímpar o termo de ordem 𝑛1 2 para 𝑛 par a média aritmética dos termos de ordem 𝑛 e 𝑛1 2 Estatística Descritiva Mediana de dados não agrupados Exemplo A produção leiteira diária de uma vaca durante uma semana foi de 10 14 13 15 16 18 e 12 litros 10 12 13 14 15 16 18 1 2 3 4 5 6 7 mediana Estatística Descritiva Mediana de dados agrupados sem intervalo de classe Valor da variável correspondente a frequência acumulada imediatamente superior à metade da soma das frequências Exemplo Considere a distribuição relativa a 34 famílias de quatro filhos considerando como variável o número de filhos do sexo masculino Nº de meninos xi f i Fi 0 1 2 3 4 2 6 10 12 4 34 Estatística Descritiva Mediana de dados agrupados sem intervalo de classe Valor da variável correspondente a frequência acumulada imediatamente superior à metade da soma das frequências Exemplo Considere a distribuição relativa a 34 famílias de quatro filhos considerando como variável o número de filhos do sexo masculino Nº de meninos xi f i Fi 0 1 2 3 4 2 6 10 12 4 2 8 18 30 34 34 Frequência acumulada imediatamente superior a 17 2 34 2 if Estatística Descritiva Mediana de dados agrupados com intervalo de classe Determinar as frequências acumuladas Calcular σ 𝑓𝑖 2 Identificar a classe mediana correspondente a frequência acumulada imediatamente superior a σ 𝑓𝑖 2 Usar a fórmula 𝑙 𝑙𝑖𝑛𝑓 limite inferior da classe 𝐹𝑎𝑛𝑡 frequência acumulada simples anterior 𝑓𝑖 frequência simples da classe ℎ amplitude da classe 𝑀𝑑 𝑙 σ 𝑓𝑖 2 𝐹𝑎𝑛𝑡 ℎ 𝑓𝑖 Estatística Descritiva Mediana de dados agrupados com intervalo de classe ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi FREQUENCIA ACUMULADA Fi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 total 40 Estatística Descritiva Mediana de dados agrupados com intervalo de classe ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi FREQUENCIA ACUMULADA Fi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 4 13 24 32 37 40 total 40 identificar a classe mediana a classe correspondente a frequência acumulada imediatamente superior a σ 𝑓𝑖 2 σ 𝑓𝑖 2 40 2 20 Estatística Descritiva Mediana de dados agrupados com intervalo de classe ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi FREQUENCIA ACUMULADA Fi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 4 13 24 32 37 40 total 40 σ 𝑓𝑖 2 40 2 20 𝑀𝑑 𝑙 σ 𝑓𝑖 2 𝐹𝑎𝑛𝑡 ℎ 𝑓𝑖 158 20 13 4 11 16054 Estatística Descritiva Moda Símbolo 𝑀𝑜 Dentro de um conjunto de valores a moda é o valor mais frequente o valor que aparece mais vezes Um conjunto de dados pode ter Nenhuma moda amodal nenhum valor aparece mais vezes que outros Uma moda unimodal Duas ou mais modas multimodal dois ou mais valores de concentração Estatística Descritiva Moda de dados não agrupados Exemplo A produção leiteira diária de uma vaca durante uma semana foi de 10 14 13 15 16 18 e 12 litros 10 12 13 14 15 16 18 1 2 3 4 5 6 7 amodal Estatística Descritiva Moda de dados agrupados sem intervalo de classe Exemplo Considere a distribuição relativa a 34 famílias de quatro filhos considerando como variável o número de filhos do sexo masculino Nº de meninos xi f i Fi 0 1 2 3 4 2 6 10 12 4 34 MODA Estatística Descritiva Moda de dados agrupados com intervalo de classe Classe modal a classe que apresenta maior frequência Moda bruta valor resultante do método mais simples para o cálculo da moda tomase o ponto médio da classe modal ESTATURAS DE 40 ALUNOS DA FACULDADE A 2007 ESTATURAS cm FREQUÊNCIA fi PONTO MÉDIO xi xifi 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 152 156 160 164 168 172 608 1404 1760 1312 840 516 total 40 6440 Moda 160 Estatística Descritiva Moda de dados agrupados com intervalo de classe Fórmula de Czuber usada para cálculo mais elaborado da Moda Altura cm fi Mo 150 154 4 1596 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 𝑙𝑖𝑛𝑓 limite inferior da classe modal 158 𝐷1 𝑓 𝑓𝑎𝑛𝑡 freq simples freq simples anterior 𝐷1 11 9 𝐷1 2 𝐷2 𝑓 𝑓𝑝𝑜𝑠𝑡 freq simples freq simples posterior 𝐷2 11 8 𝐷2 3 ℎ amplitude da classe modal ℎ 162 158 ℎ 4 𝑴𝒐 𝟏𝟓𝟖 𝟐 𝟐 𝟑 𝟒 𝟏𝟓𝟗 𝟔 𝑴𝒐 𝒍𝒊𝒏𝒇 𝑫𝟏 𝑫𝟏 𝑫𝟐 𝒉 Estatística Descritiva MEDIDAS DE DISPERSÃO Estatística Descritiva Medidas de Dispersão Dispersão ou variabilidade de um conjunto se refere à maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação Permitem estabelecer comparações entre fenômenos de mesma natureza mostrando como os valores se distribuem acima ou abaixo da medida de tendência central Dois grupos podem ter a mesma média mas serem muito diferentes na amplitude de variação de seus dados Estatística Descritiva Medidas de Dispersão Exemplo Foram feitas várias medições da temperatura em oC em Joinville durante dois dias Veja os resultados Em qual desses dias a temperatura foi mais estável A média não responde essa questão pois nos dois dias a temperatura média foi a mesma Para obter esse conhecimento precisamos de outras medidas que permitam descrever o comportamento do grupo de valores em torno da média 1o dia 7 8 9 9 10 e 11 Média 9º C 2o dia 6 7 8 10 11 e 12 Média 9º C Estatística Descritiva Desvio Médio Simples Mede a dispersão dos dados afastamento em relação à média Também são chamados simplesmente de desvios Representa a média das distâncias entre cada elemento da amostra e seu valor médio Cálculo o Desvio Médio Dm Estatística Descritiva Desvio Médio Simples Considerando as temperaturas em Joinville construímos a tabela T xi 7 7 9 2 2 8 8 9 1 1 9 9 9 0 0 9 9 9 0 0 10 10 9 1 1 11 11 9 2 2 6 1o dia 9 X ix X ix X T yi 6 6 9 3 3 7 7 9 2 2 8 8 9 1 1 10 10 9 1 1 11 11 9 2 2 12 12 9 3 3 12 2o dia 9 Y iy Y iy Y Estatística Descritiva Desvio Médio Simples Calculo dos desvios médios para as temperaturas de cada dia temos 1o dia 2o dia Concluise que houve maior dispersão ou variabilidade de temperatura no 2o dia 2º C logo a temperatura permaneceu mais estável no 1o dia Estatística Descritiva Variância e Desvio Padrão As medidas mais utilizadas para representar a dispersão é a Variância e o Desvio Padrão Uma dificuldade no uso da Variância é que ela não é expressa nas mesmas unidades dos dados originais Estatística Descritiva Variância Var V S2 É a média aritmética dos quadrados dos desvios A variância tem pouca utilidade como estatística descritiva porém é extremamente importante na inferência estatística e em combinações de amostras Variância é uma medida de dispersão que mostra o quão distante cada valor desse conjunto está do valor central médio Estatística Descritiva Desvio Padrão S σ Dp Medida mais comum de dispersão estatística representado pelo símbolo σ sigma ou S ou Dp Ele mostra o quanto de variação ou dispersão existe em relação à média ou valor esperado Um baixo desvio padrão indica que os dados tendem a estar próximos da média um desvio padrão alto indica que os dados estão espalhados por uma gama de valores O desvio padrão é capaz de identificar o erro em um conjunto de dados caso quiséssemos substituir um dos valores coletados pela média aritmética Estatística Descritiva Desvio Padrão S σ Dp 𝜎 σ𝑥𝑖 lj𝑥2 𝑛 Para uma amostra de n observações x1 xn o desvio padrão S é definido como A vantagem do desvio padrão é que tratase de uma medida de variabilidade que leva em conta toda a informação contida na amostra O desvio padrão de uma população é representado por σ e o desvio padrão de uma amostra por S 𝑆 σ𝑥𝑖 lj𝑥2 𝑛 𝑆 𝑉 Estatística Descritiva Coeficiente de Variação CV O desvio padrão por si só não nos diz muita coisa O fato do desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais série de valores Para contornar essas dificuldades e limitações podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio medida essa denominada coeficiente de variação CV Estatística Descritiva Coeficiente de Variação CV 𝐶𝑉 Desvio Padrão Média 100 CV 15 baixa dispersão 15 CV 30 média dispersão CV 30 alta dispersão O CV é sempre expresso em termos de porcentagem Estatística Descritiva Medidas de Dispersão de dados não agrupados Exemplo Cálculo da Variância e do Desvio Padrão para uma amostra de temperaturas em Joinville T xi 7 7 9 2 4 8 8 9 1 1 9 9 9 0 0 9 9 9 0 0 10 10 9 1 1 11 11 9 2 4 10 1o dia 9 X ix X 2 ix X T yi 6 6 9 3 9 7 7 9 2 4 8 8 9 1 1 10 10 9 1 1 11 11 9 2 4 12 12 9 3 9 28 2o dia 9 Y iy Y 2 iy Y Estatística Descritiva Medidas de Dispersão de dados não agrupados Exemplo Cálculo da Variância e do Desvio Padrão para uma amostra de temperaturas em Joinville Para o 1o dia o 1 1 1 s Var 167 129 ou s 129 C Para o 2o dia o 2 2 2 s Var 467 216 ou s 216 C No 2º dia a temperatura apresentou maior oscilação Estatística Descritiva Medidas de Dispersão de dados agrupados Para obter a variância e o desvio padrão com os valores agrupados sem intervalos procedemos de modo semelhante ao cálculo da variância e do desvio padrão utilizando para a variância a média aritmética ponderada dos quadrados dos desvios 𝑆 𝑉𝑎𝑟 Estatística Descritiva Medidas de Dispersão de dados agrupados sem intervalos Exemplo Uma indústria produz 5000 esferas de aço por minuto Foram coletadas para análise 100 esferas Vamos determinar a média e o desvio padrão da distribuição dos diâmetros das esferas coletadas Medida do diâmetro xi em mm Quantidade de esferas fi 11 12 12 27 13 35 14 20 15 6 Total 100 Estatística Descritiva Para obter a média calculamos a média aritmética ponderada da distribuição Para determinar o desvio padrão vamos construir uma tabela a seguir Medidas de Dispersão de dados agrupados sem intervalos Estatística Descritiva Medida do diâmetro xi em mm Quantidade de esferas fi xi x xi x2 fi xi x2 11 12 0181 0032761 0393132 12 27 0081 0006561 0177147 13 35 0019 0000361 0012635 14 20 0119 0014161 0283220 15 6 0219 0047961 0287766 f i 100 f i xi x2 11539 Logo a média das medidas dos diâmetros das esferas da amostra é 1281 mm e o desvio padrão é aproximadamente 0107 mm Medidas de Dispersão de dados agrupados sem intervalos Estatística Descritiva Medidas de Dispersão de dados agrupados Agora se os valores estão agrupados com intervalos para obter a variância e o desvio padrão primeiro calculamos os pontos médios de cada intervalo e em seguida calculamos 𝑆 𝑉𝑎𝑟 Estatística Descritiva Medidas de Dispersão de dados agrupados com intervalos Exemplo Na auditoria anual de uma empresa foi anotado o tempo necessário em minuto para realizar a auditoria de 50 balanços Tempo de auditoria Número de balanços fi 10 20 3 20 30 5 30 40 10 40 50 12 50 60 20 Caracterize a dispersão da distribuição por meio do Desvio Padrão Estatística Descritiva Medidas de Dispersão de dados agrupados com intervalos Primeiro determinamos o ponto médio de cada intervalo e em seguida calculamos a média Tempo de auditoria Número de balanços fi Pmi PMi x PMi x2 fi PMi x2 10 20 3 15 282 79524 238572 20 30 5 25 182 33124 16562 30 40 10 35 82 6724 6724 40 50 12 45 18 324 3888 50 60 20 55 118 13924 27848 f i 50 f i PMi x2 7538 Estatística Descritiva Medidas de Dispersão de dados agrupados com intervalos Com base na tabela podemos encontrar a variância e assim obter o desvio padrão Logo podemos dizer que os valores observados se distanciam cerca de 123 min da média s Var 15076 123 Estatística Descritiva MEDIDAS DE POSIÇÃO RELATIVA Estatística Descritiva Percentis Os percentis são exemplos de quartis que dividem os dados em grupos com aproximadamente o mesmo número de valores em cada grupo Os percentis são medidas de localização denotadas por 𝑃1 𝑃2 𝑃99 que dividem os dados em 100 grupos com cerca de 1 dos valores em cada um Em outras palavras um elemento que se localize no 37º percentil é maior do que aproximadamente 37 dos possíveis valores da lista Estatística Descritiva Percentis Cálculo do percentil de um valor de dado O processo para se encontrar o percentil que corresponde a determinado valor 𝑥 é dado pela seguinte expressão 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑑𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥 𝐿 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑛𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑥 𝑘 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑛 100 Arredondar para o inteiro mais próximo Estatística Descritiva Percentis Exemplo A tabela abaixo lista os 35 valores dos orçamentos em milhões de dólares ordenados de uma amostra aleatória simples de filmes Ache o percentil para o valor de 𝑈29 milhões 17º percentil Estatística Descritiva Percentis Exemplo A tabela abaixo lista os 35 valores dos orçamentos em milhões de dólares ordenados de uma amostra aleatória simples de filmes Ache o percentil para o valor de 𝑈120 milhões 80º percentil Estatística Descritiva Conversão de um percentil em um valor dado Estatística Descritiva Conversão de um percentil em um valor dado Exemplo Jaime está viajando e percorrendo trilhas há 95 dias O histograma mostra o número de quilômetros que ele percorreu nesses dias Qual intervalo contém o 35º percentil desses dados 0 5 4 5 10 2 10 15 0 15 20 16 20 25 35 25 30 31 30 35 7 Estatística Descritiva Conversão de um percentil em um valor dado 𝑘 35 𝑛 95 𝐿 𝑛 100 𝑘 𝐿 95 100 35 𝐿 3335 𝐿 34 5 4 10 6 15 6 20 22 25 57 30 88 35 95 R 20 25 0 5 4 5 10 2 10 15 0 15 20 16 20 25 35 25 30 31 30 35 7 Estatística Descritiva Quartis Quartis são medidas de localização denotadas por 𝑄1 𝑄2 𝑒 𝑄3 que dividem um conjunto de dados em quatro grupos com cerca de 25 de valores em cada grupo 𝑄1 𝑃25 Separa os 25 inferiores dos 75 superiores dos valores ordenados 𝑄2 𝑃50 O mesmo que a mediana separa os 50 inferiores dos 50 superiores dos valores ordenados 𝑄3 𝑃75 Separa os 75 inferiores dos 25 superiores dos valores ordenados Estatística Descritiva Quartis Não existe um único método para determinar percentis e quartis Diferentes programas computacionais resultarão em valores diferentes Algumas estatísticas podem ser definidas usandose quatis e percentis Amplitude interquartilAIQ 𝑄3 𝑄1 Amplitude semiinterquartilAIQ 𝑄3 𝑄12 Quartil médio 𝑄3 𝑄12 Amplitude percentil 1090 𝑃90 𝑃10 Estatística Descritiva Resumo dos cinco números O resumo dos cinco números consiste No valor mínimo No 𝑄1 No 𝑄2 No 𝑄3 No valor máximo Estatística Descritiva Diagrama em caixa boxplot Um diagrama em caixa é um gráfico de um conjunto de dados que consiste em uma linha que se estende do valor mínimo ao valor máximo em uma caixa com linhas traçadas no primeiro quartil na mediana e no terceiro quartil O diagrama em caixa nos dá informação sobre a distribuição e dispersão dos dados Estatística Descritiva Diagrama em caixa boxplot Como fazer Ache o resumo dos cinco números Construa uma escala com valores que incluam os valores máximo e mínimo dos dados Construa uma caixa retangular estendendose de 𝑄1 a 𝑄3 e trace uma linha na caixa no valor da mediana Trace linhas estendendose para fora da caixa até os valores mínimo e máximo dos dados Estatística Descritiva Diagrama em caixa boxplot Exemplo Estabelecendo os limites de velocidade A seguir estão listadas as velocidades em kmh de carros selecionados aleatoriamente e que viajavam em um trecho da rodovia BR 280 Construa o boxplot desses dados Exercícios 1 Lista de Exercícios postada no Moodle Obrigado Prof Dani Prestini Probabilidade e Estatística Probabilidade Probabilidade Definições Consiste em utilizar a intuição humana para estudar os fenômenos do nosso cotidiano Usa o princípio básico do aprendizado humano que é a ideia de experimento Experimentos Aleatórios Casuais Não Aleatórios Determinísticos Experimento Determinístico É aquele que quando realizado sob determinadas condições é possível prever o resultado particular que irá ocorrer Exemplos Água aquecida a 100ºC sob pressão normal entra em ebulição Se tomarmos um determinado sólido sabemos que a uma certa temperatura haverá a passagem para o estado líquido A velocidade que um corpo atingirá o solo sabendose de que altura ele foi solto Probabilidade Definições Experimento Aleatório Procedimento que ao ser repetido sob as mesmas condições pode fornecer resultados diferentes Exemplos Resultado no lançamento de um dado Condições climáticas nesse fim de semana Tipo sanguíneo de um habitante escolhido ao acaso O tempo de vida útil de uma lâmpada nova Probabilidade Definições Espaço Amostral S ou Exemplos Conjunto de todos os resultados possíveis de um experimento aleatório O espaço amostral é equiprovável quando seus elementos têm a mesma chance de ocorrer Lançamento de um dado 1 2 3 4 5 6 Tipo sanguíneo com fator Rh A B AB O Hábito da leitura leitor não leitor Probabilidade Definições Eventos A B C Exemplos Lançamento de um dado subconjuntos do espaço amostral Espaço amostral 1 2 3 4 5 6 Alguns eventos A sair face par A 2 4 6 B sair face maior que 3 B 4 5 6 C sair face 1 C 1 Probabilidade Definições Evento Certo Exemplo Lançamento de um dado Ocorre quando um evento coincide com o espaço amostral Espaço amostral 1 2 3 4 5 6 Evento A Ocorrência de um número menor que 7 e maior que zero A 1 2 3 4 5 6 Portanto A logo o evento é certo Probabilidade Definições Evento Impossível Exemplo Lançamento de um dado Ocorre quando um evento é vazio Espaço amostral 1 2 3 4 5 6 Evento B Ocorrência de um número maior que 6 Não existe um número maior que 6 no dado Portanto B logo o evento é impossível Probabilidade Definições Eventos Mutuamente Exclusivos Exemplo Lançamento de uma moeda Ocorrem quando dois ou mais eventos não podem ocorrer ao mesmo tempo Espaço amostral cara coroa Evento A Ocorrência de cara Ao lançar a moeda o resultado pode ser cara ou coroa mas não ambos Evento B Ocorrência de coroa Probabilidade Definições Operações com Eventos Sejam A e B dois eventos de um espaço amostral A B interseção dos eventos A e B Representa a ocorrência simultânea dos eventos A e B A B união dos eventos A e B Representa a ocorrência de pelo menos um dos eventos A ou B Probabilidade Operações Operações com Eventos 1 2 3 4 5 6 Eventos A 2 4 6 B 4 5 6 e C 1 Exemplo Lançamento de um dado sair uma face par ou maior que 3 A B 2 4 6 4 5 6 2 4 5 6 sair uma face par ou face 1 A C 2 4 6 1 1 2 4 6 Probabilidade Operações Operações com Eventos 1 2 3 4 5 6 Eventos A 2 4 6 B 4 5 6 e C 1 Exemplo Lançamento de um dado sair uma face par e maior que 3 A B 2 4 6 4 5 6 4 6 sair uma face par e face 1 A C 2 4 6 1 A e C são eventos disjuntos ou mutuamente exclusivos quando não têm elementos em comum isto é A C Probabilidade Operações Probabilidade Medida da incerteza associada aos resultados do experimento aleatório Deve fornecer a informação de quão verossímil é a ocorrência de um particular evento É usada para quantificar a possibilidade ou chance de ocorrência de um resultado de um experimento aleatório Como atribuir probabilidade aos elementos do espaço amostral Duas abordagens possíveis 1 Frequências de ocorrências 2 Suposições teóricas Probabilidade Exemplo Lançamento de um dado Admitese que o dado é perfeitamente equilibrado Pface 1 Pface 6 16 1 Através das frequências de ocorrências O experimento aleatório é repetido n vezes Calculase a frequência relativa com que cada resultado ocorre Para um número grande de realizações a frequência relativa aproximase da probabilidade 2 Através de suposições teóricas Probabilidade A probabilidade de um evento 𝐴 que é um subconjunto finito de um espaço amostral Ω de resultados igualmente prováveis é 𝑃 𝐴 𝑛 𝐴 𝑛 Ω Sendo 𝑛𝐴 e 𝑛Ω as quantidades de elementos de 𝐴 e de Ω respectivamente 𝑃 𝐴 1 𝑃 Ω Evento Certo 𝑃 𝐴 0 𝑃𝜙 Evento Impossível 0 𝑃 𝐴 1 Probabilidade de um evento 𝐸 ocorrer Probabilidade Exemplo 1 Considere o lançamento de 2 dados balanceados Calcular a probabilidade de a Obter soma 7 b Obter soma maior que 5 c Que resultado do primeiro dado seja superior ao resultado do segundo 𝐸𝑠𝑝𝑎ç𝑜 𝐴𝑚𝑜𝑠𝑡𝑟𝑎𝑙 Ω 11 12 13 21 22 23 31 32 33 14 15 16 24 25 26 34 35 36 41 42 43 51 52 53 61 62 63 44 45 46 54 55 56 64 65 66 Probabilidade Continuação do Exemplo 1 a Obter soma 7 Ω 11 12 13 21 22 23 31 32 33 14 15 16 24 25 26 34 35 36 41 42 43 51 52 53 61 62 63 44 45 46 54 55 56 64 65 66 𝐴 61 52 43 34 25 16 𝑃 𝐴 𝑛 𝐴 𝑛 Ω 6 36 1 6 017 17 Probabilidade Continuação do Exemplo 1 b Obter soma maior que 5 Ω 11 12 13 21 22 23 31 32 33 14 15 16 24 25 26 34 35 36 41 42 43 51 52 53 61 62 63 44 45 46 54 55 56 64 65 66 𝑃 𝐵 𝑛 𝐵 𝑛 Ω 26 36 13 18 072 72 Probabilidade Continuação do Exemplo 1 c Que resultado do primeiro dado seja superior ao resultado do segundo Ω 11 12 13 21 22 23 31 32 33 14 15 16 24 25 26 34 35 36 41 42 43 51 52 53 61 62 63 44 45 46 54 55 56 64 65 66 𝑃 𝐶 𝑛 𝐶 𝑛 Ω 15 36 5 12 042 42 Probabilidade Exemplo 2 Considere o lançamento de uma moeda perfeita Calcule a probabilidade de sair coroa 𝐸𝑠𝑝𝑎ç𝑜 𝐴𝑚𝑜𝑠𝑡𝑟𝑎𝑙 Ω 𝑐𝑎𝑟𝑎 𝑐𝑜𝑟𝑜𝑎 𝑛 Ω 2 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 𝑐𝑜𝑟𝑜𝑎 𝑛 𝐴 1 𝑃 𝐴 𝑛 𝐴 𝑛 Ω 1 2 050 50 Probabilidade Exemplo 3 No lançamento de um dado perfeito qual é a probabilidade de sair número maior do que 4 𝐸𝑠𝑝𝑎ç𝑜 𝐴𝑚𝑜𝑠𝑡𝑟𝑎𝑙 Ω 1 2 3 4 5 6 𝑛 Ω 6 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 5 6 𝑛 𝐴 2 𝑃 𝐴 𝑛 𝐴 𝑛 Ω 2 6 1 3 033 33 Probabilidade Exemplo 4 Vamos formar todos os números de 3 algarismos distintos permutando os dígitos 7 8 e 9 Qual é a probabilidade de escolhendo um número desses ao acaso ele ser a ímpar b par c múltiplo de 6 d múltiplo de 4 e maior que 780 Ω 789 798 879 897 978 987 𝑛 Ω 6 𝑎 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 𝑠𝑒𝑟 í𝑚𝑝𝑎𝑟 789 879 897 987 𝑛 𝐴 4 𝑃 𝐴 𝑛 𝐴 𝑛 Ω 4 6 2 3 067 67 Probabilidade Continuação do exemplo 4 Ω 789 798 879 897 978 987 𝑛 Ω 6 b 𝐸𝑣𝑒𝑛𝑡𝑜 𝐵 𝑠𝑒𝑟 𝑝𝑎𝑟 798 978 𝑛 𝐵 2 𝑃 𝐵 𝑛 𝐵 𝑛 Ω 2 6 1 3 033 33 c 𝐸𝑣𝑒𝑛𝑡𝑜 𝐶 𝑚ú𝑙𝑡𝑖𝑝𝑙𝑜 𝑑𝑒 6 798 978 𝑛 𝐶 2 𝑃 𝐶 𝑛 𝐶 𝑛 Ω 2 6 1 3 033 33 Probabilidade Continuação do exemplo 4 Ω 789 798 879 897 978 987 𝑛 Ω 6 d 𝐸𝑣𝑒𝑛𝑡𝑜 𝐷 𝑚ú𝑙𝑡𝑖𝑝𝑙𝑜 𝑑𝑒 4 𝑛 𝐷 0 𝑃 𝐷 𝑛 𝐷 𝑛 Ω 0 6 0 0 e 𝐸𝑣𝑒𝑛𝑡𝑜 𝐸 𝑚𝑎𝑖𝑜𝑟 𝑞𝑢𝑒 780 𝑇𝑜𝑑𝑜𝑠 𝑛 𝐸 6 𝑃 𝐸 𝑛 𝐸 𝑛 Ω 6 6 1 100 Probabilidade Exemplo 5 Num grupo de 75 jovens 16 gostam de música esporte e leitura 24 gostam de música e esporte 30 gostam de música e leitura 22 gostam de esporte e leitura 6 gostam somente de música 9 gostam somente de esporte e 5 gostam somente de leitura Calcule a probabilidade de escolher ao acaso um desses jovens a ele gostar de música b ele não gostar de nenhuma dessas atividades 9 M L E 6 8 16 6 14 5 11 Probabilidade Continuação do exemplo 5 9 M L E 6 8 16 6 14 5 11 𝑛 Ω 75 a gostam de música 6 8 16 14 44 𝑃 𝐴 𝑛 𝐴 𝑛 Ω 44 75 059 59 𝑛 𝐴 44 b Não gostam de nenhuma das atividades 75 6 9 5 8 6 14 16 75 64 11 𝑃 𝐵 𝑛 𝐵 𝑛 Ω 11 75 015 15 𝑛 𝐵 11 Probabilidade Um evento pode ocorrer ou não Sendo p a probabilidade de que ele ocorra sucesso e q a probabilidade de que ele não ocorra insucesso para um mesmo evento existe a relação 𝑝 𝑞 1 Exemplo 1 Se a probabilidade de um evento ocorrer é p 15 a probabilidade de que ele não ocorra é de 45 𝑝 𝑞 1 1 5 𝑞 1 𝑞 1 1 5 𝑞 4 5 80 Eventos Complementares Probabilidade Exemplo 2 Em um lote de 30 peças 6 são defeituosas Sendo retirada uma peça calcule a A probabilidade dessa peça ser defeituosa b A probabilidade dessa peça não ser defeituosa Eventos Complementares a 𝑃 𝐴 𝑛 𝐴 𝑛 Ω 6 30 1 5 02 20 b 𝑃 𝐵 1 1 5 4 5 08 80 Probabilidade Se dois eventos são independentes a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos 𝑝 𝑝1 𝑝2 Exemplo 1 No lançamento de dois dados simultaneamente qual a probabilidade de tirar 3 no 1º dado e 6 no 2º dado Eventos Independentes 𝑝 𝑝1 𝑝2 𝑝 1 6 1 6 𝑝 1 36 278 Probabilidade Exemplo 2 De dois baralhos de 52 cartas retiramse simultaneamente uma carta do primeiro baralho e uma carta do segundo Qual a probabilidade da carta do primeiro baralho ser um rei e a do segundo ser o 5 de copas 𝑃 𝐸 𝑃 1𝐵 𝑃2𝐵 𝑃𝐸 1 13 1 52 𝑃 𝐸 1 676 00015 015 1º Baralho 𝑃 1𝐵 4 52 1 13 2º Baralho 𝑃 2𝐵 1 52 Eventos Independentes Probabilidade Exemplo 3 Uma urna A contém 3 bolas brancas 4 pretas 2 verdes uma urna B contém 5 bolas brancas 2 pretas e 1 verde uma urna C contém 2 bolas brancas 3 pretas e 4 verdes Uma bola é retirada de cada urna Qual é a probabilidade de as três bolas retiradas da primeira segunda e terceira urnas serem respectivamente branca preta e verde 𝑃 𝐸 𝑃 1𝑈 𝑃 2𝑈 𝑃 3𝑈 𝑃 𝐸 1 3 1 4 4 9 𝑃 𝐸 1 27 0037 370 1º Urna 𝑃 1𝑈 3 9 1 3 2º Urna 𝑃 2𝑈 2 8 1 4 3º Urna 𝑃 3𝑈 4 9 Eventos Independentes Probabilidade Se dois eventos são mutuamente exclusivos a probabilidade de que um ou outro ocorra é igual à soma das probabilidades de que cada um deles se realize 𝑝 𝑝1 𝑝2 Exemplo 1 No lançamento de um dado qual a probabilidade de se tirar 3 ou 5 Eventos Mutuamente Exclusivos 𝑝 𝑝1 𝑝2 𝑝 1 6 1 6 𝑝 1 3 03333 3333 Probabilidade Exemplo 2 São dados dois baralhos de 52 cartas Tiramos ao mesmo tempo uma carta do primeiro baralho e uma carta do segundo Qual é a probabilidade de tirarmos uma dama e um rei não necessariamente nessa ordem 1º Baralho Dama 𝑃 1𝐵𝐷 4 52 1 13 Eventos Mutuamente Exclusivos 2º Baralho Dama 𝑃 2𝐵𝐷 4 52 1 13 1º Baralho Rei 𝑃 1𝐵𝑅 4 52 1 13 2º Baralho Rei 𝑃 2𝐵𝑅 4 52 1 13 Probabilidade Continuação do exemplo 2 𝑃 𝐸 𝑃 𝐷𝑅 𝑃𝑅𝐷 𝑃 𝐸 1 169 1 169 2 169 𝑃 𝐸 00118 118 Eventos Mutuamente Exclusivos 𝑃 𝐷𝑅 1 13 1 13 1 169 A probabilidade de tirarmos uma dama no 1º baralho e um rei no 2º é 𝑃 𝑅𝐷 1 13 1 13 1 169 A probabilidade de tirarmos um rei no 1º baralho e uma dama no 2º é Probabilidade Probabilidade Condicional No cálculo de probabilidades é comum o estudo de situações que envolvem a ocorrência de eventos subsequentes Em alguns casos os resultados dos primeiros eventos podem interferir nos resultados dos posteriores Em geral o espaço amostral posterior é reduzido pela ocorrência do evento anterior Dizemos que se trata de uma probabilidade condicional A probabilidade de um evento A sabendo qual será o resultado do evento B é dada por 𝑃 𝐴 𝐵 É chamada de probabilidade condicional de A dado B Probabilidade Para calcular essa probabilidade usamos a relação 𝑃 𝐴 𝐵 𝑃 𝐴 𝐵 𝑃𝐵 𝑃 𝐵 0 Frequentemente necessitase calcular a probabilidade da interseção de dois eventos A definição de probabilidade condicional pode ser reescrita e teremos a conhecida regra da multiplicação para probabilidades 𝑃 𝐴 𝐵 𝑃 𝐵 𝐴 𝑃 𝐴 𝑃 𝐴 𝐵 𝑃𝐵 Probabilidade Condicional Probabilidade Exemplo 1 Um gerente de controle de qualidade utiliza equipamento de teste para detectar modens de computador defeituosos Retiramse aleatoriamente dois modens de um grupo onde há 12 defeituosos e 18 sem defeitos Qual a probabilidade a de ambos serem defeituosos b de que o primeiro seja defeituoso e o segundo não defeituoso c de que um seja defeituoso e outro não defeituoso Probabilidade Condicional Probabilidade Continuação do exemplo 1 a de ambos serem defeituosos Probabilidade Condicional 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 12 30 11 29 01517 1517 b de que o primeiro seja defeituoso e o segundo não defeituoso 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 12 30 18 29 02483 2483 Probabilidade Continuação do exemplo 1 c de que um seja defeituoso e outro não defeituoso Probabilidade Condicional 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑃 𝑑𝑒𝑓 𝑑𝑒𝑓 12 30 18 29 18 30 12 29 216 870 216 870 432 870 04966 4966 Probabilidade Exemplo 2 Em uma universidade foi selecionada uma amostra de 500 alunos que cursaram a disciplina de Estatística Entre as questões levantadas estava Você gostou da disciplina De 240 homens 140 responderam que sim De 260 mulheres 200 responderam que sim Para avaliar as probabilidades podemos organizar as informações em uma tabela Probabilidade Condicional Probabilidade Continuação do exemplo 2 Probabilidade Condicional Qual a probabilidade de que um aluno escolhido aleatoriamente a seja um homem b gostou da disciplina c seja uma mulher d não gostou da disciplina e seja uma mulher ou gostou da disciplina f seja uma mulher e gostou da disciplina g dado que o aluno escolhido gostou da disciplina qual a probabilidade de ser homem h dado que o aluno seja uma mulher qual a probabilidade de não ter gostado da disciplina Probabilidade Continuação do exemplo 2 Probabilidade Condicional a seja um homem 𝑃 𝐻 240 500 048 48 b gostou da disciplina 𝑃 𝐺 340 500 068 68 c seja uma mulher 𝑃 𝑀 260 500 052 52 d não gostou da disciplina 𝑃 𝑁𝐺 160 500 032 32 e seja uma mulher ou gostou da disciplina 𝑃 𝑀 𝐺 260 500 340 500 200 500 08 80 Probabilidade Continuação do exemplo 2 Probabilidade Condicional f seja uma mulher e gostou da disciplina 𝑃 𝑀 𝐺 200 500 04 40 g dado que o aluno escolhido gostou da disciplina qual a probabilidade de ser homem 𝑃 𝐻 𝐺 𝑃 𝐻 𝐺 𝑃 𝐺 140 340 04118 4118 h dado que o aluno seja uma mulher qual a probabilidade de não ter gostado da disciplina 𝑃 𝑁𝐺 𝑀 𝑃 𝑁𝐺 𝑀 𝑃 𝑀 60 260 02308 2308 Probabilidade Probabilidade Total Sejam 𝐴1 𝐴2 𝐴𝑛 eventos que formam uma partição do espaço amostral 𝑆 isto é os eventos 𝐴𝑖 são dois a dois mutuamente exclusivos tal que a união de todos eles é igual a 𝑆 Seja 𝐵 um evento qualquer de 𝑆 quando já se conhecem todos os eventos da família 𝐴𝑖 e com estes se intercepta na formada figura Probabilidade Probabilidade Total Então a probabilidade de 𝐵 dado que um dos eventos 𝐴𝑖 tenha ocorrido é expressa pela união das intersecções de todos os eventos 𝐴𝑖 com 𝐵 tal que 𝑃 𝐵 𝑃 𝐴1 𝐵 𝑃 𝐴2 𝐵 𝑃 𝐴𝑛 𝐵 𝑃 𝐵 ራ 𝑖1 𝑛 𝑃𝐴𝑖 𝐵 Probabilidade Probabilidade Total Pelo teorema do produto para eventos dependentes deduzse que 𝑃 𝐵 𝑃 𝐴1 𝑃 𝐵 𝐴1 𝑃 𝐴2 𝑃 𝐵 𝐴2 𝑃 𝐴𝑛 𝑃 𝐵 𝐴𝑛 𝑃 𝐵 𝑖1 𝑛 𝑃 𝐴𝑖 𝑃𝐵𝐴𝑖 Probabilidade Probabilidade Total Exemplo 1 Uma determinada peça é manufaturada por 3 fábricas A B e C Sabese que A produz o dobro de peças que B e que B e C produzem o mesmo número de peças Sabese ainda que 2 das peças produzidas por A e por B são defeituosas enquanto que 4 das produzidas por C são defeituosas Todas as peças produzidas são misturadas e colocadas em um depósito Se do depósito for retirada uma peça ao acaso qual a probabilidade de que ela seja defeituosa Probabilidade Probabilidade Total Continuação do exemplo 1 Eventos 𝐷 A peça é defeituosa 𝐴 A peça provém da fábrica 𝐴 𝐵 A peça provém da fábrica 𝐵 𝐶 A peça provém da fábrica 𝐶 Temos 𝑃 𝐴 50 05 𝑃 𝐵 𝑃 𝐶 25 025 𝑃 𝐷 𝐴 𝑃 𝐷 𝐵 2 002 𝑃 𝐷 𝐶 4 004 Probabilidade Probabilidade Total Continuação do exemplo 1 Pelo teorema da probabilidade total 𝑃 𝐷 𝑃 𝐴 𝑃 𝐷 𝐴 𝑃 𝐵 𝑃 𝐷 𝐵 𝑃 𝐶 𝑃 𝐷 𝐶 pois AB e C formam uma partição do espaço amostral 𝑃 𝐷 05002 025002 025004 25 Probabilidade Teorema de Bayes Em teoria da probabilidade o Teorema de Bayes mostra a relação entre uma probabilidade condicional e a sua inversa Por exemplo a probabilidade de uma hipótese dada pela observação de uma evidência e a probabilidade da evidência dada pela hipótese Esse teorema representa uma das primeiras tentativas de modelar de forma matemática a inferência estatística feita por Thomas Bayes Probabilidade Teorema de Bayes O teorema de Bayes serve para calcular a probabilidade de um particular evento 𝐴𝑖 dado que 𝐵 aconteceu por meio da fórmula 𝑃 𝐴𝑖 𝐵 𝑃 𝐵 𝐴𝑖 𝑃 𝐴𝑖 𝑃 𝐵 𝑜𝑛𝑑𝑒 𝑃𝐵 0 Como 𝑃 𝐵 σ𝑖1 𝑛 𝑃 𝐴𝑖 𝑃 𝐵 𝐴𝑖 segue a fórmula geral 𝑃 𝐴𝑖 𝐵 𝑃 𝐵 𝐴𝑖 𝑃 𝐴𝑖 σ𝑖1 𝑛 𝑃 𝐴𝑖 𝑃 𝐵 𝐴𝑖 Probabilidade Teorema de Bayes Exemplo 1 Numa pequena fábrica de garrafas térmicas a máquina A mais moderna responde por 70 das unidades produzidas A máquina B mais antiga responde pelas 30 restantes Os percentuais de unidades defeituosas são de 15 na máquina A e 5 na B Se uma garrafa for retirada causalmente para teste de qualidade calcule a a probabilidade de ela ser defeituosa b se ela é defeituosa qual a probabilidade de ter sido produzida pela máquina A Probabilidade Teorema de Bayes Continuação do exemplo 1 Eventos 𝐷 A garrafa é defeituosa 𝐴 A garrafa provém da máquina 𝐴 𝐵 A garrafa provém da máquina 𝐵 Temos 𝑃 𝐴 70 07 𝑃 𝐵 30 03 𝑃 𝐷 𝐴 15 0015 𝑃 𝐷 𝐵 5 005 Probabilidade Teorema de Bayes Continuação do exemplo 1 a a probabilidade de ela ser defeituosa 𝑃 𝐷 𝑃 𝐴 𝑃 𝐷 𝐴 𝑃 𝐵 𝑃 𝐷 𝐵 𝑃 𝐷 070015 03005 𝑃 𝐷 00105 0015 00255 255 b se ela é defeituosa qual a probabilidade de ter sido produzida pela máquina A 𝑃 𝐴 𝐷 𝑃 𝐷 𝐴 𝑃 𝐴 𝑃𝐷 001507 00255 00105 00255 𝑃 𝐴 𝐷 04118 4118 Probabilidade Teorema de Bayes Exemplo 2 Um piloto de Fórmula 1 tem 50 de probabilidade de vencer determinada corrida quando esta se realiza sob chuva Caso não chova durante a corrida sua probabilidade de vitória é de 25 Se o serviço de Meteorologia estimar em 30 a probabilidade de que chova durante a corrida qual é a probabilidade deste piloto ganhar a corrida Eventos 𝐺 ganhar a corrida 𝐶ℎ chover 𝑁𝐶ℎ não chover Temos 𝑃 𝐶ℎ 30 03 𝑃 𝑁𝐶ℎ 70 07 𝑃 𝐺 𝐶ℎ 50 05 𝑃 𝐺 𝑁𝐶ℎ 25 025 Probabilidade Teorema de Bayes Continuação do exemplo 2 Queremos a CHANCE do piloto ganhar a corrida com ou sem chuva 𝑃 𝐺 𝑃 𝐺 𝐶ℎ 𝑃 𝐺 𝑁𝐶ℎ 𝑃 𝐺 𝑃 𝐺 𝐶ℎ 𝑃 𝐶ℎ 𝑃 𝐺 𝑁𝐶ℎ 𝑃 𝑁𝐶ℎ 𝑃 𝐺 05030 025070 𝑃 𝐺 015 0175 𝑃 𝐺 0325 325 Exercícios 1 Lista de Exercícios postada no Moodle Obrigado Prof Dani Prestini Probabilidade e Estatística Variável Aleatória Variável Aleatória Variável Aleatória Variável Aleatória Variável Aleatória Introdução Dizemos que uma va é contínuaquando ela pode assumir qualquer valor em um dado intervalo Exemplos Tempo até a cura de uma doença Altura de árvores Peso de recémnascidos Concentração de CO₂ na água Poluição sonora Variável Aleatória Discreta Seja X uma variável aleatória va discreta e x1 x2 x3 seus diferentes valores A função que atribui a cada valor da variável aleatória sua probabilidade é denominada de função discreta de probabilidade ou simplesmente de função de probabilidade A notação a ser utilizada é P X xi pi i 1 2 X x1 x2 x3 Pi p1 p2 p3 Função de Probabilidade 𝑓𝑥 𝑃 𝑋 𝑥𝑖 Condições necessárias 1 0 Px 1 2 Px 1 Variável Aleatória Discreta Exemplo 1 No lançamento de duas moedas seja X a variável aleatória Número de coroas obtidas Construa a distribuição de probabilidade de X X 0 1 2 PX 14 12 14 PX 0 ¼ PX 1 ½ PX 2 ¼ Distribuição de probabilidade Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada X 0 1 2 PX 14 12 14 PX 0 ¼ PX 1 ½ PX 2 ¼ Distribuição de probabilidade Função de Distribuição de Probabilidade Acumulada Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Representação Gráfica Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Representação Gráfica X Número obtido no lançamento de um dado comum Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Exemplo 2 Verifique se a correspondência dada por 𝑓 𝑥 𝑥3 15 para 𝑥 1 2 𝑒 3 pode ser a distribuição de propriedade de alguma variável aleatória Solução f1 415 f2 515 e f3 615 Como nenhum desses valores é negativo ou maior que 1 e a soma de f1 f2 f3 1 a função dada pode ser a distribuição de probabilidade de alguma variável aleatória Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Exemplo 3 O Departamento de Estatística é formado por 35 professores sendo 21 homens e 14 mulheres Uma comissão de 3 professores será constituída sorteando ao acaso três membros do departamento Qual é a probabilidade da comissão ser formada por pelo menos duas mulheres Vamos definir a variável aleatória X nº de mulheres na comissão Espaço Amostral probabilidade x 𝐻 𝐻 𝑀 21 35 20 34 14 33 0150 1 𝐻 𝐻 𝐻 21 35 20 34 19 33 0203 0 𝐻 𝑀 𝐻 21 35 14 34 20 33 0150 1 Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Continuação do Exemplo 3 Espaço Amostral probabilidade x 𝑀 𝐻 𝐻 14 35 21 34 20 33 0150 1 𝑀 𝐻 𝑀 14 35 21 34 13 33 0097 2 𝐻 𝑀 𝑀 21 35 14 34 13 33 0097 2 𝑀 𝑀 𝐻 14 35 13 34 21 33 0097 2 𝑀 𝑀 𝑀 14 35 13 34 12 33 0056 3 Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Continuação do Exemplo 3 x 0 1 2 3 PXx 0203 0450 0291 0056 Assim temos 𝑃𝑋 2 𝑃𝑥 2 𝑃𝑥 3 0291 0056 0347 Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Exemplo 4 Em cada caso determine se os valores dados podem ser valores de uma distribuição de probabilidade de alguma variável aleatória Gabarito a Não b Não c Sim d Não e Sim Variável Aleatória Discreta Função de Distribuição de Probabilidade Acumulada Exemplo 5 Seja a variável aleatória X discreta com distribuição de probabilidade dada por Assim temos Variável Aleatória Contínua As probabilidades de eventos associados a uma variável aleatória contínua X podem ser calculadas através de uma função densidade de probabilidade f que deve satisfazer Variável Aleatória Contínua Exemplo 6 Variável Aleatória Contínua Continuação do Exemplo 6 Variável Aleatória Contínua Exemplo 7 Variável Aleatória Contínua Continuação do Exemplo 7 Variável Aleatória Contínua Continuação do Exemplo 7 Exercícios 1 Lista de Exercícios postada no Moodle Obrigado Prof Dani Prestini Probabilidade e Estatística Correlação e Regressão Correlação Situação Estamos avaliando as médias de 15 estudantes no ensino médio relacionandoas com os índices dos mesmos estudantes no seus cursos universitários As médias no ensino médio podem variar de 0 a 100 e os índices na universidade de 0 a 4 Como verificar se essas variáveis estão associadas Correlação Teste de Hipóteses Estabelece se existe associação entre duas variáveis mas Não quantifica a força da associação e Não permitem representar a relação existente sob uma forma funcional Correlação Uma correlação é uma relação entre duas variáveis Os dados podem ser representados por pares ordenados x y sendo x a variável independente ou explanatória e y a variável dependente ou resposta a Quantificando a força dessa relação correlação b Explicitando a forma dessa relação regressão A presença ou ausência de relação linear pode ser investigada sob dois pontos de vista Correlação DIAGRAMA DE DISPERSÃO Utilizase um diagrama de dispersão no qual os pares ordenados x y são colocados no gráfico como pontos em um plano coordenado A variável independente explanatória x é indicada no eixo horizontal e a variável dependente resposta y no eixo vertical Um diagrama de dispersão pode ser usado para averiguar sobre a existência de uma correlação linear linha reta entre duas variáveis Interpretar a correlação usando um diagrama de dispersão pode ser subjetivo Correlação a Relação linear direta b Relação linear inversa c Relação curvilínea direta d Não há relação Correlação COEFICIENTE DE CORRELAÇÃO Uma maneira adequada de obter a direção e medir a força de uma correlação linear entre duas variáveis é calcular o coeficiente de correlação O coeficiente de correlação é uma medida da força e da direção de uma relação linear entre duas variáveis A variação do coeficiente de correlação é de 1 a 1 Quando x e y têm uma correlação linear positiva forte r está próximo de 1 Quando x e y têm uma correlação linear negativa forte r está próximo de 1 Quando x e y têm correlação linear positiva ou negativa perfeita r é igual a 1 ou 1 respectivamente Correlação COEFICIENTE DE CORRELAÇÃO Quando não há correlação linear r está próximo a 0 É importante lembrar que quando r está próximo de 0 não significa que não há relação entre x e y significa apenas que não há relação linear Esta medida é também chamada de coeficiente de correlação de Pearson em homenagem ao seu criador Simbologia r amostra ou população O valor de r pode ser calculado por 𝑟 𝑛Σ𝑥𝑖𝑦𝑖 Σ𝑥𝑖Σ𝑦𝑖 𝑛 Σ𝑥𝑖2 Σ𝑥𝑖2 𝑛 Σ𝑦𝑖2 Σ𝑦𝑖2 Correlacao Correlação Uma vez calculado o r o coeficiente de correlação amostral você deve determinar se há evidência suficiente para decidir se o coeficiente de correlação é significativo Para que um coeficiente de correlação seja significativo seu valor absoluto em geral deve estar próximo de 1 Para determinar se o coeficiente de correlação r é significativo usamos valores críticos tabelados construída em função da distribuiçãot A correlação é significativa quando o valor absoluto de r é maior que o valor tabelado Correlacao Note que para menos pares de dados menores valores de n a evidência da correlação deve ser mais forte para aumentar a chance de se concluir pela significância dessa correlação Correlação Exemplo Relação entre o número de clientes e as vendas semanais em milhares de reais para uma amostra de 20 empresas de remessa de cargas Empresa Clientes Vendas Empresa Clientes Vendas 1 907 112 11 679 763 2 926 1105 12 872 943 3 506 684 13 924 946 4 741 921 14 607 764 5 789 942 15 452 692 6 889 1008 16 729 895 7 874 945 17 794 933 8 510 673 18 844 1023 9 529 724 19 1010 1177 10 420 612 20 621 741 Correlação 0 2 4 6 8 10 12 14 300 400 500 600 700 800 900 1000 1100 Número de clientes Vendas Correlação 𝑖1 20 𝑥𝑖 14623 𝑖1 20 𝑦𝑖 17611 𝑖1 20 𝑥𝑖 2 11306209 𝑖1 20 𝑦𝑖 2 1602097 𝑖1 20 𝑥𝑖 𝑦𝑖 1341279 𝑛 20 𝑟 20 1341279 14623 17611 20 11306209 14623 2 20 1602097 17611 2 0954913 FORTE CORRELAÇÃO LINEAR POSITIVA Correlação Exemplo Estamos avaliando as médias de 15 estudantes no ensino médio relacionandoas com os índices dos mesmos estudantes no seus cursos universitários As médias no ensino médio podem variar de 0 a 100 e os índices na universidade de 0 a 4 Construa um diagrama de dispersão e calcule o coeficiente de correlação linear de Pearson para os dados a seguir Interprete os resultados encontrados Correlacao Índice MédiaEnsinо Médio x Indice na Universidade Y 800 10 6400 10 800 820 10 6724 10 820 840 21 7056 441 1764 850 14 7225 196 1190 870 21 7569 441 1827 880 17 7744 289 1496 880 20 7744 40 1760 890 35 7921 1225 3115 900 31 8100 961 2790 910 24 8281 576 2184 910 27 8281 729 2457 920 30 8464 90 2760 940 39 8836 1521 3666 960 36 9216 1296 3456 980 40 9604 160 3920 Correlação Sabese que n 15 há 15 alunos Podemos concluir que o coeficiente de correlação linear de Pearson teve resultado positivo e próximo de 1 indicando forte correlação linear positiva entre a média no ensino médio e o índice na universidade ao menos para estes estudantes EXEMPLO O Old Faithful localizado no Parque Nacional Yellowstone nos Estados Unidos é o gêiser mais famoso do mundo A duração em minutos de diversas erupções do Old Faithful e os intervalos em minutos até a próxima erupção ocorrem são mostrados na tabela ao lado a Diagrama de dispersão Observando os pontos da esquerda para a direita conforme os tempos de duração das erupções crescem os intervalos até a próxima erupção também tendem a crescer tempos de erupção x tempos de duração EXEMPLO continuação b Coeficiente de correlação r 0976569 Como o coeficiente de correlação foi próximo de 1 podese verificar que existe uma correlação positiva forte entre o tempo de duração e o intervalo entre as erupções c Testando o coeficiente de correlação ρ com um nível de significância de 005 Na tabela considerando n25 e α005 temos que r0369 então a correlação populacional é significativa Há evidência suficiente ao nível de significância de 5 para concluir que há uma correlação linear entre a duração das erupções do Old Faithful e o tempo entre elas Após verificar que a correlação linear entre duas variáveis é significativa o próximo passo é determinar a equação da reta que melhor modela os dados Regressão Uma reta de regressão é a reta para a qual a soma dos quadrados dos resíduos é mínima Ao determinar a equação de uma reta de regressão é útil construir um diagrama de dispersão dos dados para verificar se há valores discrepantes que podem influenciar bastante essa reta de regressão Você também deve verificar se há lacunas e concentrações nos dados Relação entre os tempos de erupção e os tempos de duração até a próxima erupção Regressão COEFICIENTE DE DETERMINAÇÃO Isso significa que 9537 da variação em y pode ser explicada pelo modelo que relaciona x e y Exercícios 1 Lista de Exercícios postada no Moodle Obrigado