·

Engenharia Elétrica ·

Álgebra Linear

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Estatística Descritiva A Linguagem dos Dados Estatística é a ciência que estuda e comunica dados Este conhecimento ajuda a utilizar os métodos adequados para coletar os dados empregar as análises corretas e apresentar os resultados de forma eficaz Há duas razões cruciais pelas quais o estudo da estatística é fundamental na sociedade moderna a primeira é que os resultados estatísticos divulgados e aplicados a problemas comuns podem levar a conclusões incorretas A segunda dada a crescente importância das decisões e opiniões baseadas em dados é muito importante conseguirmos avaliar criticamente a qualidade da análise que os outros apresentamnos Assim além do que já estudamos até aqui é preciso conhecer e saber calcular as medidas estatísticas Você já estudou anteriormente que quando falamos de dados referimonos a uma amostra ou população Assim podemos usar medidas descritivas numéricas da estudada para fazer inferências sobre as medidas correspondentes para uma população Estas são as de tendência central e as de variabilidade ou dispersão e é o que estudaremos aqui Objetivo Ao final desta unidade você deverá ser capaz de Calcular medidas de tendência central aplicando os resultados a situaçõesproblema Calcular medidas de dispersão e variabilidade aplicando os resultados a situações problema Aplicar conceitos básicos de probabilidade Conteúdo Programático Esta unidade está organizada de acordo com os seguintes temas Tema 1 Medidas estatísticas de tendência central e algumas aplicações Tema 2 Medidas estatísticas de dispersão e algumas aplicações Tema 3 Probabilidade e algumas aplicações Tema 4 Estatística no cotidiano da Engenharia O gráfico acima é uma comparação entre duas curvas denominadas Gaussiana e q Gaussiana em um estudo sobre estrelas binárias que têm uma de nêutrons ou um buraco negro como componente A utilização das medidas em Estatística é fundamental para que os cientistas possam divulgar comparar analisar estudar e inferir estudos e resultados científicos A estatística por trás disso é mais complexa do que a estudada aqui mas não chegamos aos últimos degraus de um prédio se não subirmos o primeiro não é mesmo Então vamos lá Tema 1 Medidas estatísticas de tendência central e algumas aplicações O que são e para que servem as medidas de tendência central Estas são um tipo de medida de posição da Estatística A tendência central em uma amostra é uma medida utilizada para identificar os diferentes pontos centrais dos dados É comum referimonos a elas como médias As mais usuais são a média a mediana e a moda Mas para que as utilizamos Porque a identificação do valor central permite comparar com outros valores mostrando assim a dispersão ou agrupamento da amostra que por sua vez é conhecida como dispersão ou variação Quando a distribuição de dados é simétrica e a média mediana moda dizemos que os dados têm uma distribuição normal Todavia também existem as distribuições não normais Média Média aritmética é a soma de todos os valores em um conjunto de dados dividida pela quantidade deles neste mesmo grupo Ou seja representaremos genericamente os valores de uma determinada amostra estatística por 𝑥1 𝑥2 𝑥3 𝑥𝑛 Assim 𝑛 é a quantidade destes valores Portanto em termos de fórmula podemos representar assim 𝑀é𝑑𝑖𝑎 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑜𝑎 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑢𝑚𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 𝑄𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒𝑠𝑠𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 𝑥 𝑥1 𝑥2 𝑥𝑛 𝑛 O símbolo 𝒙 é um dos mais utilizados para representar a média de uma amostra Por isso o utilizaremos aqui Existem outros tipos de média por exemplo a ponderada e a geométrica e cada uma delas terá uma fórmula associada Aqui referimonos apenas à média aritmética Vamos exemplificar Digamos que em termos de valores tenhamos os seguintes dados coletados 1 1 1 2 4 4 5 7 17 Assim a média será 𝑥 𝑥1 𝑥2 𝑥𝑛 𝑛 1 1 1 2 4 4 5 7 17 9 467 Mediana Tratase de outra medida de tendência central Para encontrar seu valor organizamos os dados do menor para o maior e a mediana será o valor que separará a metade inferior da superior do conjunto de dados ou seja o valor do meio A mediana é imediatamente encontrada se a quantidade de valores dados for ímpar pois ao organizar os dados o valor do meio já é ela própria No entanto também será possível calcular quando tivermos uma quantidade par de valores Neste caso a mediana será a média dos dois valores centrais o que significa que eles devem ser somados e divididos por dois Por exemplo digamos que você tem os valores 17 12 17 20 10 9 14 13 14 e quer calcular a mediana Colocando os dados em ordem do menor para o maior você obterá 9 10 12 13 14 14 17 17 20 O valor central é 14 9 10 12 13 14 14 17 17 20 Assim a mediana desta lista é 14 Porém digamos que você tem o seguinte conjunto 17 12 17 20 10 9 14 13 14 9 Aqui temos uma quantidade par de dados Então dispomos os valores na ordem crescente 9 9 10 12 13 14 14 17 17 20 E em seguida calculamos a média aritmética dos dois valores centrais 13 14 2 28 1 14 Moda A terceira medida de tendência central é a moda Ela é simplesmente o valor que mais se repete num conjunto de dados É possível ter dois valores que aparecem com maior frequência Neste caso teremos uma amostra bimodal Caso tenha os três valores que mais se repetem então teremos uma distribuição trimodal Mais do que isso denominase polimodal Por fim caso nenhum valor se repita no conjunto de dados então dizemos que a distribuição é amodal Por exemplo digamos que você tem os seguintes dados 14 12 17 10 9 14 13 17 20 Algumas pessoas costumam colocálos em ordem crescente como se faz quando queremos calcular a mediana mas isso não é necessário aqui só se você quiser Neste conjunto de dados temos dois valores que mais se repetem 14 e 17 Portanto ele é bimodal e assim há dois valores para a moda exatamente 14 e 17 Dados agrupados Sem intervalo de classe O cálculo para as medidas de tendência central que vimos até aqui se refere a dados não agrupados mas lembrese de que eles podem estar agrupados e ainda mais agrupados em classes Nestes casos precisamos utilizar algumas fórmulas para os cálculos dessas medidas Considere por exemplo a tabela a seguir que representa a distribuição de 34 estudantes de uma escola de Ensino Fundamental que têm quatro professores A tabela mostra quantos docentes são do gênero feminino Aqui temos um caso de dados agrupados mas eles não estão em classes ou seja dados agrupados sem intervalos de classes Número de docentes do gênero feminino xi 𝒇 0 2 1 6 2 10 3 12 4 4 𝑓 34 O símbolo representa o somatório dos valores ou seja a soma total deles Neste caso o cálculo da média dáse pela fórmula 𝑥 𝑥𝑖𝑓 𝑓 A tabela utilizada deverá conter mais uma coluna Aplicando a fórmula para o cálculo da média obtemos 𝑥 𝑥𝑖𝑓 𝑓 78 34 229 23 A média é de 23 professoras mulheres Podemos calcular a mediana para esse mesmo conjunto de dados Para isso utilizamos a seguinte fórmula 𝑓𝑀𝑑 𝑓 2 em que 𝑀𝑑 é a mediana e 𝑓𝑀𝑑 é a frequência correspondente ao valor mediano que queremos encontrar Precisamos também da coluna das frequências acumuladas abaixo de No nosso exemplo calculando a frequência simples acumulada abaixo de obtemos Número de docentes do gênero feminino xi 𝒇 𝑭 0 2 02 1 6 08 2 10 18 3 12 30 4 4 34 𝑓 34 Calculando a mediana 𝑓𝑀𝑑 𝑓 2 34 2 17 Após encontrarmos esse valor buscamos qual na coluna das frequências acumuladas é igual ou imediatamente maior que o encontrado que no nosso exemplo foi 17 Como o maior valor imediatamente maior que 17 na nossa coluna de 𝐹 é 18 então verificamos qual o corresponde em 𝑥𝑖 ou o valor de 𝑥𝑖 que está na mesma linha Como aqui 𝑥𝑖 2 então a mediana também o é Isto é duas professoras docentes do gênero feminino Por fim o cálculo da moda para dados agrupados sem classes é o mais fácil Basta considerar o valor da variável que tiver maior frequência simples absoluta No nosso exemplo o maior valor de 𝑓 é 12 Como o 𝑥𝑖 correspondente a 12 é três temos que a moda é igual a este número Portanto 𝑀𝑜 3 Dados agrupados Com intervalos de classes Ainda temos os casos em que precisamos determinar as tendências centrais para dados agrupados em classes Para aprender a calcular a média a moda e a mediana de dados agrupados em intervalos de classe utilizaremos a tabela que representa as alturas de alunos de uma determinada classe Elas estão dispostas em cm Classes fj 150 154 04 154 158 09 158 162 11 162 166 08 166 170 05 170 174 03 Total 40 Calcularemos a média a moda e a mediana para esses dados dispostos em intervalos de classe Porém antes disso é preciso conceituar ponto médio de uma classe As classes são os valores que temos em nossa amostra ou população e que organizamos em intervalos conforme já explicado Aqui os intervalos são 150 a 154 154 a 158 O ponto médio da classe é a média aritmética do limite inferior com o superior de cada classe O limite inferior é o primeiro valor dela Por exemplo O limite inferior da terceira classe em nossa tabela é 158 enquanto o inferior da 61 classe é 170 Obviamente o limite superior é o valor que está à direita Na primeira classe de nossa tabela o limite superior é 154 enquanto o superior da última classe a sexta é 174 Assim o ponto médio da primeira classe é 150154 2 152 Para calcularmos a média podemos utilizar a seguinte fórmula 𝑥 𝑓𝑥𝑖 𝑓 Para isso precisamos do ponto médio de cada uma e também de uma coluna que mostre o produto de 𝑓 frequência simples absoluta por 𝑥𝑖 ou seja ponto médio de cada classe A tabela a seguir mostra tudo isso Classes 𝑓 𝑥𝑖 𝑓𝑥𝑖 150 154 04 152 608 154 158 09 156 1404 158 162 11 160 1760 162 166 08 164 1312 166 170 05 168 840 170 174 03 172 516 Total 𝑓 40 𝑓 𝑥𝑖 Agora aplicando a fórmula para o cálculo da média temos 𝑥 𝑓 𝑥𝑖 𝑓 6440 40 161 Assim a média das alturas dos alunos é 161 cm Agora calcularemos a moda para dados agrupados em classes Para isto podemos utilizar uma das fórmulas mais conhecidas 𝑀𝑜 𝑙𝑖𝑛𝑓 𝑐 𝑓𝑃 𝑓𝐴 𝑓𝑃 Todas essas siglas podem parecer complicadas mas basta acompanhar o que cada uma significa e ficará fácil entender Outro ponto importante é que elas podem ser apresentadas de maneiras diferentes embora signifiquem a mesma coisa Depende muito de como cada autor prefere apresentálas No entanto a fórmula é a mesma Ademais essa não é a única fórmula Pode ser que você encontre outras em livros ou em algum site Caso prefira utilizar outra pode haver alguma diferença pequena nos resultados mas isso não é um problema já que teremos valores bem próximos 𝑀𝑜 𝑚𝑜𝑑𝑎 𝑙𝑖𝑛𝑓 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑐 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒 𝑓𝐴 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑓𝑃 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 Agora calcularemos a moda utilizando a mesma tabela Note que a classe modal é a que tem a maior frequência simples absoluta Aplicando a fórmula temos 𝑀𝑜 𝑙𝑖𝑛𝑓 𝑐 𝑓𝑃 𝑓𝐴𝑓𝑃 158 4 8 98 15988 aproximadamente Calcularemos neste momento a mediana para dados agrupados em classes A fórmula para isto é 𝑀𝑑 𝑙𝑖𝑛 𝑐 𝐸𝑀𝑑 𝐹𝐴 𝑓𝑀𝑑 𝑀𝑑 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑙𝑖𝑛 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑐 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝐹𝐴 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝐸𝑀𝑑 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜 𝑓𝑀𝑑 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 Para encontrar 𝐸𝑀𝑑 basta dividir o total da frequência simples absoluta por dois A classe mediana é aquela que é igual ou imediatamente superior ao valor de 𝑓𝑀𝑑 Assim utilizando a mesma tabela calcularemos a mediana Porém primeiro temos que calcular as frequências acumuladas abaixo de Como 𝐸𝑀𝑑 40 2 20 nossa classe mediana será 158 162 pois temos que considerar o valor de 𝐹𝐴 que é igual ou imediatamente superior à 20 que em nosso exemplo é 24 Agora sim poderemos calcular a mediana 𝑀𝑑 𝑙𝑖𝑛 𝑐 𝐸𝑀𝑑𝐹𝐴 𝑓𝑀𝑑 158 4 2013 11 16054 aproximadamente Tema 2 Medidas estatísticas de dispersão e algumas aplicações O que são medidas de dispersão e para que servem Antes de estudálas temos que falar de outras medidas Temos algumas de posição que não estão enquadradas nas medidas de tendência central mas complementam as informações relacionadas aos dados que estivermos analisando Por isso é importante falar sobre elas também O quartil o decil e o centil ou percentil são as medidas de posição mais comuns Elas dão uma ideia do quanto os valores na distribuição dos dados estão pendendo para um determinado número Por exemplo ao calcularmos essas medidas poderemos perceber se um valor está mais próximo da média ou se está muito acima ou abaixo do conjunto de dados A mediana também é uma medida de posição que divide a distribuição em duas partes iguais Já o quartil permite dividir a distribuição em quatro partes iguais em relação ao número de elementos em cada uma O decil por sua vez permite dividir a distribuição em 10 partes iguais e o centil em 100 partes iguais O valor que divide o conjunto de dados é denominado de separatriz O quartil como dissemos divide a série em quatro partes iguais daí seu nome Os representaremos aqui por 𝑄𝑘 em que 𝑘 significa a denominação da separatriz que neste caso são Q1 Q2 e Q3 25 50 75 Q1 Q2 Q3 Q1 é o primeiro quartil e equivale à separação dos primeiros 25 de elementos do conjunto de dados Q2 é o segundo quartil e esse valor é a mediana Q2 Md pois divide o conjunto de dados em dois ficando cada um com 50 Q3 é o terceiro quartil e equivale à separação dos últimos 25 de elementos do conjunto de dados isto é os 75 deles Para calcular as medidas de posição ou separatrizes podemos seguir o seguinte passo a passo 1º passo organize os dados em ordem crescente 2º passo encontre a localização L da separatriz Para isso utilize a fórmula 𝐿 𝑘𝑛 1 100 𝑘 é o percentual que se quer determinar Se você quiser por exemplo calcular Q1 ou C25 então 𝑘 25 Para Q2 D5 C50 e mediana k 50 Para Q3 e C75 𝑘 75 3º passo determine o valor mas para isso atentese para algumas observações Se L for um número inteiro então o quartil o decil ou o centil serão o valor que se encontra nesta localização Se L for decimal o quartil o decil ou o percentil Sk serão encontrados por meio da fórmula 𝑆𝑘 𝑙1 𝐷𝑙2 𝑙1 Sendo Sk separatriz quartil decil ou percentil I1 valor do conjunto de dados correspondente à parte inteira de L I2 valor do grupo de dados referente à parte inteira de L mais 1 D valor da parte fracionária ou decimal Para calcular o quartil você deve seguir os passos descritos a seguir 1 Passo determine a posição do quartil 3 1 2 4 ou K onde Kn PQK 2 Passo identifique a posição mais próxima na lista de valores 3 Passo Verifique qual valor está na posição encontrada Por exemplo no conjunto de dados 4 1 8 0 11 0 7 12 9 2 6 8 quais são o primeiro o segundo e o terceiro quartis O primeiro pode ser representado por Q1 o segundo por Q2 e o terceiro por Q3 Agora coloque os valores na ordem crescente 0 1 2 4 6 7 8 8 9 10 11 12 Utilizaremos os seguintes passos para o cálculo do primeiro quartil 1 Passo determinar a posição do primeiro quartil quartil posição do PQ 1 3 4 12 1 1 2 Passo identificar a posição três 3 Passo procurar no rol o valor do número que está na posição identificada Para dados agrupados em classes encontraremos os quartis de maneira semelhante à usada para o cálculo da mediana k índice que corresponde ao quartil 1 2 ou 3 linf limite inferior da classe quartílica h amplitude do intervalo de classe Fant frequência acumulada anterior à classe quartílica f frequência absoluta daquela classe f h F f k l Q ant i k inf 4 As medidas de tendência central dão somente uma exibição parcial do conjunto de dados Por exemplo você pode ter tirado sua melhor nota em uma prova mas quão bem você se saiu em comparação aos outros alunos Caso os dados estejam agrupados em valores próximos certamente você foi muito bem mas caso eles estejam espalhados provavelmente significa que há várias pontuações de fato altas Assim é necessário completar a descrição com a medida de variabilidade ou dispersão As medidas de dispersão são categorizadas em dois grupos As baseadas em percentis As baseadas na média que é comumente conhecida como desvio padrão A análise da distribuição dos dados determina se eles têm uma tendência central forte ou fraca com base em sua dispersão As principais medidas de dispersão são 1 Amplitude total 2 Intervalo interquartílico 3 Variância 4 Desviopadrão 1 A amplitude total é a diferença entre os valores máximo e mínimo da amostra 𝐴𝑇 𝑥𝑖𝑀á𝑥 𝑥𝑖𝑀𝑖𝑛 Para dados não agrupados podemos calcular diretamente Por exemplo fornecidos os valores da amostra 20 23 34 52 67 73 a amplitude total é 𝐴𝑇 73 20 53 No caso dos agrupados temos o seguinte exemplo conforme a tabela a seguir 𝒙𝒊 0 1 2 3 4 𝒇 4 6 10 5 2 𝐴𝑇 4 0 4 Para os agrupados em classes utilizaremos os mesmos dados da tabela usada anteriormente 𝑖 Classes fj 1 150 154 04 2 154 158 09 3 158 162 11 4 162 166 08 5 166 170 05 6 170 174 03 Total 40 Neste caso a amplitude total é calculada pela diferença entre o limite superior da última classe e o inferior da primeira 𝐴𝑇 174 150 2 O intervalo interquartílico da amostra é a diferença entre o terceiro e o primeiro quartis amostrais 𝐼𝑄 𝑄3 𝑄1 3 A variância de uma amostra pode ser calculada por mais de fórmula 𝑠2 𝑥𝑖𝑥2 𝑛 e 𝑠2 𝑥𝑖 2𝑓 𝑓 𝑥2 são algumas delas O exemplo a seguir ilustra a utilização de uma das fórmulas 𝒙𝒊 𝒇 0 2 0 1 6 6 2 14 56 3 3 18 4 1 16 Total 25 96 𝑠2 𝑥𝑖 2𝑓 𝑓 𝑥2 96 25 1762 074 4 O desviopadrão amostral é a raiz quadrada da variância No entanto por meio de cálculos encontrados em livros e sites é possível observar fórmulas distintas que derivam umas das outras 𝑠 𝑥𝑖 2 𝑛 𝑥𝑖 𝑛 2 No nosso exemplo para saber o desviopadrão basta calcular a raiz quadrada do valor encontrado na variância Porém também podemos utilizar as fórmulas disponíveis Tema 3 Probabilidade e algumas aplicações Para que calcular probabilidades Probabilidade nada mais é do que a possibilidade de que algo aconteça Isto é chamado de evento Assim a teoria das probabilidades é um ramo da Matemática que estuda a ocorrência de eventos aleatórios Qualquer resultado dentro disso estará sempre entre zero e um O objetivo da probabilidade é prever as chances de que determinados eventos ocorram Em outras palavras podemos dizer que essa teoria calcula o quanto é provável que algo aconteça Ademais o estudo e o crescimento da teoria das probabilidades permitiu que a Estatística se formasse e ampliasse seus ramos de atuação por meio de métodos de amostragem mais apropriados e de maneiras de relacionar as amostras às populações inferência estatística Normalmente ao examinar os fenômenos convém buscar um modelo matemático que permita descrevêlos de modo adequado e assim explicálos melhor Para isso é preciso uma apresentação matemática para os observados Os modelos matemáticos podem ser então determinísticos ou aleatórios Modelo determinístico Este é construído por meio de experimentos cujo objetivo é apresentar os resultados utilizando padrões matemáticos Qualquer erro por menor que seja nunca deve modificar o modelo Desse modo ele tornase suficiente para estabelecer regras de utilização e ampliar esta Por exemplo Quem estudou Física em algum momento da vida conhece a fórmula 𝑣 𝑠 𝑡 em que 𝑣 representa a velocidade e 𝑡 o tempo Por meio dela obteremos o valor de 𝑠 que designa posição ou espaço Isso faz parte de um modelo matemático que pode ser utilizado no campo da cinemática além de que serve para infinidades de aplicações por ser um modelo Simplificando o modelo determinístico indica que um experimento pode ser realizado quantas vezes forem necessárias pois os mesmos resultados serão obtidos Modelo aleatório Já este é aquele que ao repetirmos nas mesmas condições pode gerar respostas diferentes Isso ocorre porque as circunstâncias iniciais não validam o resultado do fenômeno Esse tipo de modelo contém elementos aleatórios de modo que é possível prever as possibilidades de ocorrência do fenômeno mas não assegurar que sempre será assim Por exemplo ao tirarmos uma carta do baralho podemos determinar a chance de um naipe de ouros vir mas não temos como determinar a certeza disso Os experimentos aleatórios podem ser repetidos quantas vezes quisermos mas dentro das possibilidades existentes cada resultado será diferente No entanto há algo curioso ao longo do estudo e das pesquisas realizadas notouse que quanto mais repetimos o experimento maior a chance de observarmos uma regularidade estatística ou seja maiores são as chances de o evento ocorrer como prevíamos Alguns exemplos de experimentos aleatórios Jogar um dado e observar o resultado Jogar uma moeda e verificar se a face que caiu para cima é cara ou coroa Contar o número de peças defeituosas produzido periodicamente em uma fábrica Quando realizamos um experimento aleatório o conjunto de todos os seus resultados possíveis é denominado espaço amostral e há diversas representações para ele Aqui utilizaremos o símbolo Ω e a quantidade de elementos do espaço amostral representaremos com Ω Nonono nonono nonono nonono nonono nonono nonono nonono nonono nonono nonono nonono nonono nonono nonono No experimento lançamento de uma moeda para verificar qual face cai para cima se representarmos cara com a letra k e coroa com c obteremos o seguinte espaço amostral Ω k c Já para o experimento lançamento de um dado para verificar qual número estará na face voltada para cima teremos o seguinte espaço amostral Ω 1 2 3 4 5 6 Só mais um exemplo Ao lançarmos duas moedas e observarmos quais foram os resultados nas faces voltadas para cima também obteremos o espaço amostral Ω kk kc ck cc Já que vimos alguns exemplos cabe agora definir o que é um evento Evento é qualquer subconjunto do espaço amostral no experimento que realizamos Além disso temos Evento certo se ele coincide com o espaço amostral Evento impossível se ele é o conjunto vazio Para exemplificar Considere o lançamento de um dado de seis faces O evento ocorrência de um número ímpar maior que 1 é E 35 Se quisermos saber o evento cuja ocorrência seja um número maior que zero e menor que sete teremos E 123456 que coincide com o espaço amostral Logo este é um evento certo Ainda no mesmo exemplo A ocorrência de um número menor que um dá um conjunto vazio E Æ Consequentemente tratase de um evento impossível Para reforçar considere o lançamento de dois dados de seis faces não viciados O espaço amostral será Ω 1 1 2 1 3 1 4 1 5 1 6 1 1 2 2 2 3 2 4 2 5 2 6 2 1 3 2 3 3 3 4 3 5 3 6 3 14 2 43 4 4 4 5 4 6 4 1 5 2 5 3 5 4 5 5 5 6 5 1 6 2 6 3 6 4 6 5 6 6 6 Note que representamos os eventos dentro do conjunto com todas as possibilidades Assim daqui podemos extrair todos os eventos possíveis Se quisermos por exemplo o evento soma dos valores nas faces voltadas para cima igual a seis teremos E xyxy5 E 1524334251 Você pode ter notado que quando nos referimos a espaços amostrais e eventos utilizamos a representação de conjuntos Esta é a maneira mais comum de representálos embora não seja a única Assim nesta aula ela será a que usaremos por ser mais fácil e comum E já que falamos de conjuntos podemos explicar as operações com eventos Uma vez que utilizamos a linguagem dos conjuntos então também poderemos aplicar os mesmos conceitos de operações entre ou de conjuntos para os eventos Assim temos alguns mais comuns Considere que A e B são dois eventos Temos as seguintes operações mais usuais I A B é o evento que acontece se A ou B ou ambos ocorre II A B é o evento que ocorre se A e B acontecem III A B é o evento de ocorrência de A mas não de B IV 𝐴𝐶 𝑜𝑢 𝐴 é tudo que existe se A não ocorre Ou seja é o espaço amostral menos o evento A aqui aquele faz o papel de conjunto universo da teoria dos conjuntos É o mesmo que A Que tal reforçar o que acabamos de aprender Considere o lançamento de duas moedas não viciadas Digamos que queremos saber os seguintes eventos Evento A sair exatamente uma cara e uma coroa Evento B sair apenas uma cara na primeira moeda Evento C sair ao menos uma coroa Primeira coisa que você deve fazer é determinar o espaço amostral Neste exemplo ele é Ω KK KC CK CC Os eventos por sua vez são A KC CK B KK KC C KC CK CC Eventos mutuamente exclusivos Dois eventos A e B são mutuamente exclusivos se AB Definimos probabilidade logo no início mas em termos matemáticos temos a definição clássica que diz que a de um evento ocorrer é igual a 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑢𝑚 𝑒𝑣𝑒𝑛𝑡𝑜 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑎𝑛𝑒𝑖𝑟𝑎𝑠 𝑐𝑜𝑚 𝑞𝑢𝑒 𝑖𝑠𝑠𝑜 𝑝𝑜𝑑𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 Se dermos ao evento o nome de A então matematicamente podemos escrever 𝑃𝐴 𝐴 𝑊 Por exemplo No lançamento de um dado de seis faces qual é a probabilidade de obtermos um número múltiplo de dois O evento é A 24 Como já vimos que o espaço amostral tem seis elementos então A 2 e o número de elementos do espaço amostral é Ω6 Lembrese de que a quantidade número de elementos é representada aqui por 𝑃𝐴 A Ω 2 6 1 3 A probabilidade é então determinada com base na proporção de vezes que ocorre um resultado favorável em um certo número de observações ou experimentos Em experiências históricas uma moeda foi lançada 4040 vezes e observouse o resultado cara 2048 vezes Assim a probabilidade pode ser calculada da seguinte forma 𝑃 2040 4040 05059 Se aumentarmos a quantidade de vezes de lançamentos da moeda chegaremos cada vez mais próximos do valor de 05 ou 50 Isso significa que admitimos que a frequência relativa de caras e de coroas é próxima de 05 quando reconhecemos que a moeda é lançada muitas vezes Incrível não é mesmo Veremos agora mais um exemplo Imagine que temos cinco bolas de gude em um saco Quatro são azuis e uma é vermelha Qual é a probabilidade de que uma bolinha azul seja retirada O número de maneiras que isso pode acontecer é quatro afinal temos esta quantidade bolinhas azuis O número total de resultados é igual a cinco pois temos este valor no total Então a probabilidade é de 08 pois 𝑃 4 5 08 No entanto temos ainda algumas considerações a fazer Se A é um evento do espaço amostral então o número real PA será denominado probabilidade da ocorrência de A se satisfizer os seguintes axiomas 0 PA 1 PΩ 1 Se A e B são eventos de Ω mutuamente exclusivos então PA B PA PB Observação PA 0 se A é um evento impossível PA 1 se A é um evento certo A Ω A e B são mutuamente exclusivos A B Temos também alguns teoremas famosos na teoria das probabilidades Designaremos por T cada um com uma numeração para dizer que são diferentes No entanto não há uma ordem específica para eles Portanto faremos isto apenas por uma questão de organização didática 𝑻𝟏 Sendo um evento impossível então P0 𝑻𝟐 Se 𝐴 é o complemento de A então P𝐴 1 PA Podemos representar por meio da imagem a seguir 𝑻𝟑 Se 𝐴 e 𝐵 são eventos quaisquer então 𝑃𝐴 𝐵 𝑃𝐴 𝑃𝐵 𝑃𝐴 𝐵 O terceiro é também conhecido como Teorema da Soma e é representado na imagem que segue Contudo antes de mostrar o quarto teorema você precisa saber que Dois eventos são chamados de mutuamente exclusivos se não houver elementos em comum entre eles gora sim vamos ao próximo teorema 𝑻𝟒 Vamos supor que há mais de dois eventos e representaremos cada um deles com a letra A e um índice para numerálos Se A1A2 An forem eventos mutuamente exclusivos então 𝑃 𝐴1 𝐴2 𝐴𝑛 𝑃 𝐴1 𝑃 𝐴2 𝑃 𝐴𝑛 Antes de continuarmos veja o exemplo Qual é a probabilidade de um número menor que cinco aparecer quando jogarmos um dado Já sabemos que o espaço amostral é Ω 1 2 3 4 5 6 O evento pode ser representado por E aparecer um número menor do que 5 1234 Assim a probabilidade é PA 4 6 2 3 Teorema de Bayes Para finalizarmos os teoremas temos o mais famoso de todos o de Bayes que também é conhecido como Teorema da Probabilidade Condicional Ele ajuda a calcular a probabilidade de ocorrência de um evento com base na condição de ocorrência de outro Por exemplo suponha que existam três sacos e cada um tem bolas azuis verdes e amarelas Qual é a probabilidade de retirarmos uma bola amarela do terceiro saco Como além das bolas amarelas há as azuis e verdes podemos calcular a probabilidade com base nessas condições também Ela é chamada de probabilidade condicional e está representada na fórmula 𝑃𝐴𝐵 𝑃𝐵𝐴 𝑃𝐴 𝑃𝐵 𝑃𝐴𝐵 representa a frequência com que o evento A acontece na condição de que B também ocorra e 𝑃𝐵𝐴 representa a frequência com que B acontece na condição de que A igualmente suceda Por exemplo considere o lançamento de dois dados Observando as faces voltadas para cima qual é a probabilidade de sair cinco na face voltada para cima no primeiro dado sabendo que a soma dos dois números é maior que sete Primeiro lembraremos que o espaço amostral é 𝛀11121314151621222324252631323334 35364142434445465152535455566162 63646566 O evento pode ser assim representado Evento A ocorrência do número cinco no primeiro dado A515253545556 Evento B que é a soma dos dois números maior que sete é o conjunto representado por B263536444546535455566263646566 𝐴 𝐵 53545556 Como 𝑃𝐵 15 36 e 𝑃𝐴 𝐵 4 36 então aplicando a fórmula do Teorema de Bayes temos 𝑃𝐴𝐵 𝑃𝐵𝐴𝑃𝐴 𝑃𝐵 4 36 15 36 4 15 que é a probabilidade condicional aplicada Tema 4 Estatística no cotidiano da Engenharia Por que engenheirosas precisam da Estatística Os mecanismos de soluções práticas para problemas cotidianos precisam usar técnicas para resolver situações como encontrar diferentes soluções para testes e análises de dados Como vimos anteriormente Estatística é a ciência dos dados e como tal analisa o padrão significativo disponível numa determinada área Na Série de Distribuição de Frequências a época o fenômeno e o local continuam fixos O que varia é somente a intensidade do fenômeno ou seja sua frequência Qualquer engenheiro pode cometer erros enquanto trabalha aliás todo profissional Contudo como o foco aqui são os engenheiros é por isso que apenas os citamos Engenheiros quase sempre tentam descobrir seus erros para melhorar seus desempenhos No entanto nem todos são visíveis a olho nu por isto alguns precisam ser identificados a partir do problema criado no processo de construção do trabalho executado É aqui que as estatísticas entram em cena Para uma coleta de dados relevante é preciso identificar o padrão e chegar à conclusão As estatísticas em uma empresa ou fábrica por exemplo não são úteis apenas para identificar a causa do problema mas também para prever problemas futuros Assim há infinidade de aplicações significativas de probabilidade e estatística na Engenharia Falar em Engenharia é muito amplo até porque temos muitos ramos e especialidades E em todos os seus ramos existem medições que possuem faixas de erro aleatório Vamos conhecer um pouco mais Em Eletrônica e Comunicações pode haver ruído aleatório e probabilidade de erros nos elementos de sinalização bits e blocos dentro das mensagens uma vez que armazenamento e comunicação hoje não são puramente binários Em Engenharia Civil as estatísticas oferecem base para uma série de tarefas Por exemplo engenheiros civis que trabalham com transportes preocupamse com a capacidade dos sistemas rodoviários regionais Um problema típico envolveria dados sobre o número de viagens a quantidade de pessoas e o número de veículos com o objetivo de produzir um modelo de geração de viagens relacionandoas ao número de pessoas Um método estatístico conhecido como análise de regressão pode ser utilizado para construir este modelo O de geração de viagens é uma importante ferramenta para o planejamento de sistemas de transporte e tem também aplicações em Engenharia de Tráfego Basicamente é impossível ser um bom engenheiro sem conhecimento estatístico Se você está estudando para tornarse um engenheiro eletricista ou já trabalha como um saiba que frequentemente eles envolvemse em pesquisa e design de sistemas de comunicação de informação e outros processos e produtos também no desenvolvimento de testes para sistemas além de muitos outros exemplos Todos eles precisam de conhecimentos estatísticos Assim é imprescindível para um engenheiro eletricista conhecer não apenas estatística mas também métodos de comunicação e colaboração A Estatística é uma ferramenta crítica para análise de robustez de erro do sistema de medição de dados de teste avaliação de risco probabilístico e muitos outros campos no mundo da Engenharia Em Engenharia Ambiental a análise estatística é uma ferramenta que permite descobrir a contribuição de determinado fator ambiental e se dados suficientes foram coletados Na verdade compreender como diferentes fatores afetam os dados é realmente um requisito importante A análise estatística é essencial para o campo das ciências ambientais porque permite que os pesquisadores obtenham entendimento a respeito das questões ambientais por meio de pesquisas e desenvolvimento de possíveis soluções para as questões que estudam As aplicações de métodos estatísticos às ciências ambientais são numerosas e variadas As estatísticas dão uma noção de onde estamos com nosso ambiente e permite conhecer a condição atual do nosso ambiente e para onde ele está indo Somente assim poderemos saber como lidar com os riscos Para a Engenharia Mecânica praticamente tudo que é empírico é baseado em estatísticas Apesar de todos os avanços nas simulações de computador só existe uma maneira de combinar teoria e realidade e esse papel é desempenhado pela Estatística Engenheiros mecânicos não podem darse ao luxo de fazer algo no papel que não funcione na vida real Eles têm que prototipar e executar testes e analisá los Quando estão confiantes o suficiente para passar da simulação para a produção imediatamente foi porque seus modelos foram verificados estatisticamente Por exemplo se você olhar para algumas tabelas de vapor todos os números têm um enorme conjunto de experimentos para respaldálos unidos por estatísticas O mesmo vale para propriedades de materiais ou fluidos tratamentos térmicos margens de segurança ferramentas de medição e praticamente todas as constantes índices ou variáveis que você procura em uma tabela em algum lugar Em termos Engenharia Computacional ou Engenharia da Computação a teoria da probabilidade aplicase muito bem à análise de algoritmos e é a base da teoria da informação Quanto ao lado prático muitas pessoas de Ciência da Computação estão envolvidas com ciência de dados e Machine Learning Para algumas da área o erro mais comum é ignorar o pensamento estatístico e não entender as raízes estatísticas de seus algoritmos Os estatísticos aprenderam a lidar com dados muito antes de os computadores estarem disponíveis ou serem tão poderosos como são hoje Um pouco desse conhecimento é muito relevante para a ciência de dados moderna e o aprendizado de máquina E finalmente de uma perspectiva histórica a ciência não teria progredido até onde está sem estatísticas Sem o progresso científico que tivemos especialmente no século passado talvez não tivéssemos computadores O campo de aprendizado de máquina atualmente o paradigma dominante na maioria das áreas de Inteligência Artificial é praticamente construído sobre uma base de métodos e pensamento estatístico As redes de aprendizado profundo são entendidas como mecanismos gigantes que usam métodos estatísticos para aprender a detectar certos padrões de interesse em meio a uma gama muito ampla de dados disponíveis Apenas para adicionar mais um exemplo os métodos estatísticos são utilizados para expressar e avaliar a confiabilidade de vários sistemas de hardware com base nas estatísticas de falhas e na confiabilidade de componentes Além disso a modelagem estatística é muito útil em dois níveis na Ciência da Computação para controle de qualidade e preços de hardware e software de computador Portanto como vimos de maneira muito breve a Estatística tem papel fundamental em quase todas as áreas de que temos conhecimento e não seria diferente com as engenharias Sendo assim você pode perceber que embora esse seja um curso de nível inicial será importante estudála e aplicála cada vez mais Boa sorte Vídeo Para saber mais assista ao vídeo publicado na unidade da disciplina no Ambiente Virtual de Aprendizagem Encerramento O que são e para que servem as medidas de tendência central Simplificadamente elas representam um valor que expressa o centro de um conjunto de dados Elas são obtidas por meio de cálculos estatísticos utilizando fórmulas associadas e também tabelas Para determinar o valor central ou típico em um conjunto de dados existem maneiras diferentes e variadas para efetuar tais cálculos e encontrar as informações de que necessitamos ao conceber um estudo estatístico As medidas de tendência central mais comuns e estudadas são a média a moda e a mediana A média aritmética é empregada para exprimir por meio de um único valor a ideia principal de um conjunto de dados De modo simplificado podemos dizer que ela é encontrada por meio de uma fórmula matemática que calcula o quociente entre o somatório dos elementos divido pela quantidade de elementos da amostra ou da população estudada A moda identifica e expressa a medida que mais frequentemente aparece no conjunto de dados A mediana é definida como o termo central de uma sequência crescente ou decrescente de valores Para calculála temos que levar em conta se a quantidade de valores da amostra ou população é um número par ou ímpar pois para cada um temos alguma modificação na forma de encontrála O que são medidas de dispersão e para que servem As medidas de dispersão ou de variabilidade são empregadas quando queremos indicar o grau de variação dos dados de um conjunto de valores em relação à sua média As mais utilizadas são amplitude total desvio médio variância e desvio padrão A amplitude é a diferença entre o maior e o menor número de um conjunto de dados O desvio serve para determinar o quão distantes os valores estão da média Ele é calculado por meio da subtração de cada um dos valores do conjunto de dados em relação à média A variância mostra a distância de cada valor em relação ao termo central Quanto menor a variância mais próximos os valores estão da média Ela é calculada efetuandose a diferença entre a média aritmética dos quadrados e o seu quadrado Por fim o desviopadrão é a raiz quadrada da variância Para que calcular probabilidades Como ela é a área da Matemática responsável por calcular as chances de um evento ocorrer em um experimento aleatório ela permite estudar as formas de calcular a chance de um determinado evento acontecer Ela é muito empregada em diversas áreas e a utilizamos muito mais do que você pode imaginar Já verificou como estará o tempo no período em que deseja fazer uma viagem por exemplo Ao fazer isso você precisou que algum site eou aplicativo fizesse muitos cálculos de probabilidade Mas não é só para ajudálo a saber se fará sol ou se choverá ela é empregada nos jogos nas diversas áreas da ciência e em todo lugar em que é necessário determinar alguma previsibilidade Por isso a teoria das probabilidades é tão importante Por que engenheirosas precisam de Estatística Para eles o conhecimento estatístico tem grande importância devido à gama infindável de aplicações Embora seja inicialmente um obstáculo para alguns estudantes para o engenheiro formado é comum ter que aplicar instrumentos estatísticos no planejamento e na supervisão ou na produção dentro da sua área O estudo da Estatística permite aplicar os resultados e adaptálos a problemas sociais econômicos e ambientais só para citar alguns Além disso a Estatística é utilizada no planejamento eou na previsão de ações ou levantamentos para a previsão de resultados futuros muito importantes tanto na esfera pública como na privada uma vez que aumenta as chances de aplicar métodos de maior eficácia na atividade industrial empresarial e mesmo para questões relativas à sociedade de modo geral A possibilidade de fazer inferências a fenômenos futuros minimizam incertezas e proporcionam previsões úteis em qualquer área o que gera mais lucro e menos perdas seja de suprimentos material ou qualquer meio empregado na produção de itens e objetos Seja como aliada na detecção de problemas e minimização de desperdícios seja como auxílio na produção eficiente na aplicação de controle de qualidade simulação do planejamento e controle da produção ou qualquer outra demanda a Estatística tornase cada vez mais importante para a Engenharia e toda e qualquer área Resumo da Unidade As medidas de tendência central e dispersão fazem parte das estatísticas descritivas e são aplicadas no resumo dos dados coletados Basicamente elas fornecem uma forma de resumir e apresentar os dados porque indicam padrões e tendências A estatística descritiva é relevante na análise de dados porque delineia os brutos de maneira simplificada e isso é fundamental para aperfeiçoar a interpretação A média a moda e a mediana são medidas de tendência central pois medem a distribuição dos dados em torno de um valor central Amplitude total o desviopadrão e a variância são medidas de dispersão porque indicam o grau de variação de um dado a partir de um valor central Aqui concentramonos nos princípios básicos que compreendem as medidas de posição de tendência central e de dispersão Estudamos as mais comumente usadas e aprendemos como calculálas Vimos que as medidas de tendência central resumem um conjunto de observações em um único número que representa de modo genérico o centro Como este termo é ambíguo e amplo existem diferentes medidas de tendência central Elas podem ser mais ou menos adequadas para uma finalidade ou outra O tipo de variável nominal ordinal ou quantitativa por exemplo também influenciará na escolha da medida a ser utilizada As medidas de dispersão indicam o quanto as observações estão espalhadas ao redor do centro Neste estudo fizemos um resumo sobre as três medidas mais importantes de dispersão a amplitude total a variância e o desviopadrão Para isso também estudamos um pouco sobre as separatrizes que você estudou aqui mais pelo nome de medidas de posição Embora as medidas de tendência central sejam importantes elas não contam toda a história a respeito dos dados Por exemplo imagine que a avaliação média em uma prova de matemática seja de 70 A partir destas informações é possível determinar um intervalo para a nota obtida pela maioria das pessoas A resposta é não Por esta razão outros dois tipos de medidas que são as de posição e dispersão ajudamnos a pintar uma imagem mais clara de que existem mais medidas que estão escondidas nos dados e que nem sempre conseguimos ver as medidas são os quartis decis e centis ou seja as de posição Quanto à Teoria das Probabilidades as pessoas usamnas em muitas situações cotidianas para decidir para que tipo de clima prepararse comprar ou não uma ação e quanto apostar em um jogo A probabilidade ajudanos a entender quais escolhas são mais seguras e quais são mais ou menos arriscadas Claro esta tarefa é muito mais fácil quando temos um conhecimento fluente do assunto Ao aprendermos sobre isto podemos conhecer sobre a probabilidade de eventos futuros e prepararmonos para eles Referências da Unidade LIMA C P de MAGALHÃES M Noções de probabilidade e estatística 3 ed São Paulo IME USP 2002 BUSSAB W O MORETTIN P A Estatística Básica São Paulo Saraiva 2003 ISBN 8502034979 FARIAS A A SOARES J F CÉSAR C C Introdução à estatística 2 Ed Rio de Janeiro LTC 2003 FURTADO F D Estatística básica Lavras UFLA 2005 HINES WW et al Probabilidade e estatística na engenharia 4 ed Rio de Janeiro LTC 2006 MARTINS G A Estatística geral e aplicada São Paulo Atlas 2001 MEYER P L Probabilidade aplicações à estatística 2 ed ed Rio de Janeiro Livros Técnicos e Científicos 1983 MONTGOMERY D C RUNGER G C Estatística aplicada e probabilidade para engenheiros 2 ed Rio de Janeiro LTC 2003 ISBN 9788521613601 MORETTIN L G Estatística Básica probabilidade São Paulo McGrawHill 1999 MORETTIN L G Estatística Básica São Paulo McGrawHill 2000 v 2 NAVIDI W Probabilidade e estatística para ciências exatas Rio de Janeiro AMGH 2012 PIMENTELGOMES F GARCIA C H Estatística aplicada a experimentos agronômicos e florestais Piracicaba FEALQ 2002 RODRIGUES P C Bioestatística 3 ed Niterói EDUFF 2002 SILVA H M da et al Estatística São Paulo Atlas 1999 v 2 TOLEDO G L I I OVALE Estatística Básica São Paulo ATLAS 2006 Para aprofundar e aprimorar os seus conhecimentos sobre os assuntos abordados nessa unidade não deixe de consultar as referências bibliográficas básicas e complementares disponíveis no plano de ensino publicado na página inicial da disciplina