·

Engenharia Ambiental ·

Probabilidade e Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Visão geral e estatística descritiva 1 11 Populações amostras e processos 2 12 Métodos tabular e gráfico em estatística descritiva 12 13 Medidas de localização 28 14 Medidas de variabilidade 34 A disciplina de estatística nos ensina a fazer julgamentos inteligentes e a tomar decisões na presença de incertezas e variações Sem incertezas ou variações haveria pouca necessidade de estatísticos ou métodos estatísticos Onde ocorrem incertezas e variações Dados Dados Informação Conhecimento Ideia Sabedoria Fonte wwwmobimalscombr 11 Populações amostras e processos Engenheiros e cientistas estão constantemente expostos a conjuntos de fatos ou dados tanto em suas carreiras como em suas atividades diárias A disciplina de estatística fornece métodos para organizar e sintetizar os dados e tirar conclusões com base em informações contidas nos dados População censo amostra variável 1 População uma coleção bem definida de objetos de interesse 2 Quando as informações desejadas estiverem disponíveis para todos os objetos da população temos o que é denominado censo Exemplo Quando a coleção de interesse é a População Brasileira temos o Censo do IBGE População censo amostra variável 3 Restrições de tempo dinheiro e outros recursos tornam um censo impraticável ou inviável Em vez disso um subconjunto da população uma amostra é selecionado de forma prescrita 4 Estamos geralmente interessados apenas em determinadas características dos objetos em uma população Uma variável é qualquer característica cujo valor pode mudar de um objeto para outro na população Exemplo Dados uni bi e multivariados Temos dados univariados quando há interesse em uma única característica São bivariados quando as observações são feitas em cada uma de duas variáveis Exemplo O conjunto de dados pode consistir em um par altura peso de cada jogador de basquete de um time com a primeira observação primeiro jogador como 72 168 a segunda como 75 212 e assim por diante Os dados multivariados surgem quando são feitas observações sobre mais que uma variável para cada elemento sujeito objeto da amostra Tipos de variáveis Variáveis Categóricas ou qualitativas Por exemplo podemos determinar o tipo de transmissão automática A ou manual M de cada um dentre dez automóveis recentemente comprados em determinada concessionária resultando em um conjunto de dados categóricos M A A A M A A M A A Variáveis quantitativas Uma amostra de frequências de pulso batimentos por minuto referente a pacientes recentemente admitidos em uma unidade de terapia intensiva para adultos é um conjunto de dados numéricos univariados 88 80 71 103 154 132 67 110 60 105 Variáveis categóricas ou qualitativas Nominais ou ordinais Exemplos Cor da blusa do aluno Satisfação com o serviço Qualidade do ar Resultado de laudo de contaminação da água Variáveis quantitativas Discretas ou contínuas Exemplos Quantidade de defeitos em um lote de peças Número de trabalhadores treinados Tempo para entregar um projeto Consumo de combustível Tipos de variáveis Variáveis Ramos da estatística Estatística descritiva 1 Resumir e descrever as características importantes dos dados 2 Natureza gráfica os principais exemplos incluem a construção de histogramas gráficos boxplots e gráficos de dispersão 3 Outros métodos descritivos envolvem o cálculo de medidas numéricas como médias desvios padrão percentis e coeficientes de correlação Inferência estatística Com uma amostra da população uma pesquisadora frequentemente usaria essas informações para tirar algum tipo de conclusão fazer uma inferência de algum tipo sobre a população Ou seja a amostra é um meio para chegar a um fim e não o fim em si População Amostra Legenda Possíveis Locais de Monitoramento POPULAÇÃO Coletando dados A estatística lida não somente com a organização e análise de dados depois de sua coleta como também com o desenvolvimento de técnicas de coleta Se os dados não são coletados de forma correta um investigador pode não ter condições de responder às perguntas considerando um nível de confiança razoável Um problema comum é que a populaçãoalvo a respeito da qual serão tiradas conclusões pode ser diferente da população da qual se obteve a amostra Você pode dar um exemplo Amostra de conveniência é obtida pela seleção de indivíduos ou objetos sem aleatoriedade sistemática Como exemplo um grupo de tijolos pode ser empilhado de forma que seja extremamente difícil selecionar as peças centrais Se os tijolos do topo e das laterais forem de alguma forma diferentes dos demais os dados resultantes da amostra não serão representativos da população Amostra aleatória simples Tratase de uma amostra em que qualquer subconjunto de tamanho específico como uma amostra de tamanho 100 tem a mesma chance de ser selecionada Amostragem estratificada Métodos de amostragem usados para facilitar o processo de seleção para obter informações extras ou para aumentar o nível de confiança das conclusões Um desses métodos a amostragem estratificada exige a separação das unidades da população em grupos não passíveis de sobreposição e a retirada de uma amostra de cada um deles Engenheiros e cientistas frequentemente coletam dados executando algum tipo de experimento o que pode envolver a decisão de como alocar diferentes tratamentos como fertilizantes ou revestimentos para proteção de corrosão às diversas unidades experimentais lotes de terra ou segmentos de tubo Além disso um investigador pode variar sistematicamente os níveis ou categorias de determinados fatores como pressão ou tipo de material isolante e observar o efeito em alguma variável resposta como o resultado de um processo de produção Notação importante Dado um conjunto de dados que consiste em n observações de uma variável X as observações individuais serão representadas por x1 x2 x3 xn O índice não tem nenhuma relação com a magnitude de determinada observação Dessa forma x1 em geral não será a menor observação do conjunto e xn usualmente não será a maior Em diversas aplicações x1 será a primeira observação coletada pelo investigador x2 será a segunda e assim por diante A iésima observação do conjunto de dados será representada por xi 12 Métodos tabular e gráfico em estatística descritiva Técnicas visuais conhecidas Tabelas de frequência folhas de contagem histogramas gráficos de pizza gráficos de barras diagramas de dispersão etc Como escolher o seu gráfico Algumas sugestões Como escolher o seu gráfico Algumas sugestões Gráfico de Dispersão Composição Dados qualitativos ou categóricos Quais gráficos podemos utilizar para representar estes dados Tabela 21 Cirurgias realizadas no Hospital Geral no ano passado Tipo de cirurgia Número de casos Torácica 20 Ossos e articulações 45 Olho ouvido nariz e garganta 58 Geral 98 Abdominal 115 Urológica 74 Proctológica 65 Neurocirúrgica 23 Total 498 Figura 22 Gráfico de barras Cirurgias realizadas no Hospital Geral no ano passado Diagrama de Pareto Lista Oficial das Espécies Ameaçadas de Extinção é divulgada O Ministério do Meio Ambiente MMA divulgou nesta quartafeira 8 a Lista Oficial das Espécies Brasileiras Ameaçadas de Extinção Ao todo foram avaliadas 5353 espécies da flora avaliadas e 8537 espécies da fauna O Instituto Chico Mendes de Conservação da Biodiversidade ICMBio é responsável pela avaliação do risco de extinção da fauna enquanto o Jardim Botânico do Rio de Janeiro é o responsável pela avaliação da flora Lista Oficial das Espécies Ameaçadas de Extinção é divulgada Exercício Construa um Diagrama de Pareto com um dos conjuntos de dados do MMA e justifique a escolha do conjunto de dados Apresente seu gráfico interpretando e discutindo os dados Dados quantitativos Uma razão importante para construir um gráfico de dados quantitativos é mostrar a sua distribuição ou o padrão de variabilidade exibido pelos dados de uma variável Como você faria uma representação gráfica dos dados da Tabela 22 Dados quantitativos Que tipo de dados são estes Como você faria uma representação gráfica dos dados da Tabela 22 7 6 4 8 2 Há outra representação gráfica para os dados da Tabela 22 5 2 6 6 8 2 7 6 4 6 8 2 6 8 4 8 2 6 4 2 8 9 6 2 Há outra representação gráfica para os dados da Tabela 22 Histogramas Alguns dados numéricos são obtidos pela contagem variável discreta enquanto outros dados são obtidos por medições variável contínua As diretrizes para montar um histograma geralmente são diferentes nesses dois casos Váriavel discreta Exemplo adaptado A Tabela 11 é uma distribuição de frequência do número de acertos por equipe por partida Construa o histograma de acertos em jogos Frequência relativa Acertos jogo Número de jogos frequência relativa 0 20 00010 1 72 00037 2 209 00108 3 527 00272 4 1048 00541 5 1457 00752 6 1988 01026 7 2256 01164 8 2403 01240 9 2256 01164 10 1967 01015 11 1509 00779 12 1230 00635 13 834 00430 14 569 00292 15 393 00203 16 253 00131 17 171 00088 18 97 00050 19 53 00027 20 31 00016 21 19 00010 22 13 00007 23 5 00003 24 1 00001 25 0 00000 26 1 00001 27 1 00001 total 19383 1 1Selecione os dados 2 Inserir gráfico Variável contínua A construção de um histograma de dados contínuos medições exige que o eixo das medidas seja subdividido em um número aceitável de intervalos de classe ou classes de forma que cada observação esteja contida exatamente em uma classe EXEMPLO 110 As empresas de energia necessitam de informações sobre o consumo de seus clientes para obterem previsões precisas da demanda Investigadores da Wisconsin Power and Light determinaram o consumo de energia BTUs durante determinado período para uma amostra de 90 residências aquecidas a gás O valor de consumo ajustado foi calculado conforme segue consumo ajustado clima em grausdiasárea da casa 297 400 520 556 594 598 635 662 672 678 680 685 694 715 716 723 729 762 762 769 773 787 793 800 826 829 837 847 854 858 861 867 869 881 960 976 982 983 983 984 996 1004 1021 1028 1028 1030 1035 1036 1040 1049 1050 1064 1095 1109 1112 1121 1129 1143 1162 1170 1179 1216 1219 1228 1231 1262 1269 1271 1292 1338 1342 1343 1347 1360 1396 1424 1435 1512 1526 1606 1690 1826 Classe 13 35 57 79 911 1113 1315 1517 1719 Consumo ajustado 297 400 520 556 598 678 685 694 715 723 762 782 900 962 1100 1100 1300 1500 1700 1900 intervalo de bloco 300 500 700 900 1100 1300 1500 1700 1900 Passo a passo para construção do Histograma no Excel 300 1 Frequência Passo a passo para construção do Histograma no Calc Limite superior das classes Dados cursor Histograma FREQUÊNCIAA2A91C2C10 1 Tipo de gráfico 2 Intervalo de dados FREQUÊNCIAA2A91C3C11 Formatos de histogramas Um histograma é simétrico se a metade esquerda for uma imagem refletida da metade direita Um histograma unimodal é aquele que possui um aclive para um único pico e depois um declive Um histograma unimodal tem assimetria positiva se a cauda direita ou superior for estendida em comparação à cauda esquerda ou inferior e assimetria negativa se desviarse para a esquerda Um histograma bimodal possui dois picos diferentes Um histograma com mais de dois picos é denominado multimodal 13 Medidas de locação localização Medidas de tendência central média mediana Medidas de posição quartis percentis máximo mínimo A partir dos dados tentamos extrair diversas quantidades resumidas que servem para caracterizar o conjunto de dados e indicar algumas informações consideráveis Nossa preocupação principal será com os dados numéricos A média amostral das observações x₁ x₂ xₙ é dada por x x₁ x₂ xₙn Σxᵢn O numerador de x pode ser escrito mais informalmente como Σxᵢ em que a soma se dá sobre todas as observações da amostra 1 Qual o efeito de um outlier no valor da média 2 Qual o efeito de multiplicar os valores x por k no valor da média 3 Qual o efeito de somar uma constante a ao valor x no resultado da média x₁ 160 x₂ 305 x₆ 100 x₇ 156 x₁₁ 189 x₃ 177 x₄ 175 x₅ 141 x₉ 191 x₁₀ 179 x₈ 150 x₁₃ 122 x₁₄ 60 A Figura 114 mostra um gráfico de pontos dos dados uma porcentagem de absorção de água no meio das dezenas parece ser típica Com Σxᵢ 2290 a média amostral é x 229014 1636 Uma interpretação física da média amostral demonstra como avalia o centro da amostra Pense em cada ponto no gráfico de pontos como representando o peso de 1 kilo Em seguida um fulcro colocado com sua ponta no eixo horizontal equilibrará precisamente quando estiver localizado em x Assim a média amostral pode ser considerada o ponto de equilíbrio da distribuição das observações Da mesma forma que x representa o valor médio das observações de uma amostra a média de todos os valores da população pode ser calculada Esta média é chamada média populacional e é nomeada pela letra grega μ Quando existem N valores na população uma população finita então μ soma dos valores N da populaçãoN Nos Capítulos 3 e 4 forneceremos uma definição mais geral de μ que se aplica a populações finitas e conceitualmente infinitas Da mesma forma que x é uma medida de localização amostral importante e interessante μ é uma característica interessante e importante frequentemente a mais importante de uma população Uma de nossas primeiras tarefas na inferência estatística será apresentar métodos com base na média amostral para obtenção de conclusões sobre uma média populacional Por exemplo podemos usar a média amostral x 1636 calculada no Exemplo 114 como uma estimativa pontual um único número que é o melhor palpite de μ à verdadeira porcentagem média de absorção de água de todas as amostras tratadas conforme descrito A mediana amostral é obtida pela ordenação das n observações da menor para a maior com os valores repetidos incluídos de forma que cada observação da amostra seja exibida na lista ordenada Então ℎ n 1º valor ordenado média de n2º e n2 1º valores ordenados De forma análoga ℎ como valor central na amostra é o valor central da população a mediana populacional representada por μ Como acontece com ℎ e μ podemos considerar o uso da mediana amostral ℎ para fazer inferências de μ A média da população μ e a mediana μ geralmente não serão idênticas Se a distribuição da população tiver desvio positivo ou negativo conforme ilustrado na Figura 116 então μ μ Quando esse for o caso ao fazer inferências devemos primeiro decidir quais características das populações são de maior interesse e então proceder de acordo Figura 116 Três formas diferentes para uma distribuição de população Moda A moda é o valor de x que ocorre com mais frequência Medidas de Posição quartis e percentis Para obter melhores medidas de locação colocamos os dados em ordem CRESCENTE A mediana populacional ou a amostral divide o conjunto de dados em duas partes de mesmo tamanho Medidas de Posição Podemos dividir o conjunto de dados em mais partes Os quartis dividem o conjunto de dados em quatro partes iguais sendo que as observações acima do terceiro quartil constituem o quarto superior do conjunto de dados o segundo quartil é idêntico à mediana e o primeiro quartil separa o quarto inferior dos três quartos superiores De forma similar um conjunto de dados amostra ou população pode ser dividido mais detalhadamente usando percentis o 99º percentil separa o 1 superior dos 99 inferiores e assim por diante Quartis são valores da variável que dividem os dados classificados em quatro partes iguais O primeiro quartil Q1 é um número tal que no máximo 25 dos dados possuem valores menores que Q1 e no máximo 75 possuem valores maiores O segundo quartil é a mediana O terceiro quartil Q3 é um número tal que no máximo 75 dos dados possuem valores menores que Q3 e no máximo 25 possuem valores maiores Os percentis são os valores da variável que dividem um conjunto de dados classificado em 100 subgrupos iguais O késimo percentil Pk é um valor tal que no máximo k dos dados são menores em valor que Pk e no máximo 100 k dos dados são maiores Figura 226 Procedimento para encontrar Pk Passo 1 Classificar os n dados em ordem crescente Passo 2 Calcular nk100 Resulta em um A inteiro Passo 3 dPk A5 Passo 4 Pk é o ponto médio entre o valor dos dados na Aésima posição e o valor dos dados na posição A 1 dPk B o maior inteiro a seguir Pk é o valor de dados na Bésima posição Exemplo para percentis 257383469132456364282 Qual o tamanho da amostra Calcular P10 P30 Q3 ou P75 Boxplot Tabela 214 Pontuações brutas para a prova de estatística elementar Provas P1 e P2 Boxplot de precipitação mensal 19812010 Região 108 INFORMAÇÕES SOBRE PRODUTOS DE MONITORAMENTO CLIMÁTICO MENSAL E TRIMESTRAL DAS CHUVAS NO BRASIL NA PÁGINA DO CPTECINPE 14 Medidas de variabilidade Informar uma medida de tendência central fornece apenas informações parciais sobre um conjunto de dados ou uma distribuição A pergunta seguinte é Como estão distribuídas A medida de variabilidade mais simples de uma amostra é a amplitude a diferença entre o maior e o menor valor da amostra Quantos valores são considerados ao estabelecermos a Amplitude O que você acha disso Desvio padrão e variância A variância amostral denotado por s² é dada por s² xi x² n 1 Sxx n 1 O desvio padrão amostral denotado por s é a raiz quadrada positiva da variância s s² Sendo x¹ x² xₙ uma amostra e c qualquer constante que não seja zero 1 Se y₁ x₁ c y₂ x₂ c yₙ xₙ c então sy² sx² e 2 Se y₁ cx₁ yₙ cxₙ então sy² c²sx² sy csx quando s²x é a variância amostral de x e sy² é a variância amostral de y Exercício Utilize sua calculadora para obter a média e o desvio padrão dos valores desta amostra 21 35 31 42 40 43 28 27 41 32 Exercícios sugeridos Construa um Diagrama de Pareto para os dados das cirurgias e faça a análise Tente usar um programa Exercícios do livro p 23 exercícios 10 20 e 24 use um programa p 33 exercícios 34 e 38 p 42 exercício 48