·
Marketing e Comunicação ·
Probabilidade e Estatística 1
Send your question to AI and receive an answer instantly
Recommended for you
17
Representação Gráfica e Tabular em Estatística
Probabilidade e Estatística 1
ESTACIO
12
Medidas de Dispersão em Estatística e Probabilidade
Probabilidade e Estatística 1
ESTACIO
2
Determinação da Localização Ideal para Fábrica com Método do Centro de Gravidade e Mediana
Probabilidade e Estatística 1
UMG
11
Análise de Localização e Ponto de Equilíbrio para Nova Unidade Industrial
Probabilidade e Estatística 1
UMG
9
Teste de Igualdade de Proporções e Análise Estatística
Probabilidade e Estatística 1
UMG
1
Analise de Variancia ANOVA Modelos Probabilisticos e Teste F - Estatistica
Probabilidade e Estatística 1
UMG
1
Analise de Variancia-ANOVA-Modelos Probabilisticos e Teste de Compressao de Embalagens
Probabilidade e Estatística 1
UMG
1
Analise de Variancia-Introducao aos Modelos Probabilisticos
Probabilidade e Estatística 1
UMG
2
Análise de Custos e Localização de Produção
Probabilidade e Estatística 1
UMG
3
Análise de Viabilidade para Segunda Unidade de Restaurante e Descentralização da Indústria
Probabilidade e Estatística 1
UMG
Preview text
Estatística e Probabilidade Medidas de Posição Produção Gerência de Desenho Educacional NEAD Desenvolvimento do material Gregório Dalle Vedove Nosaki 1ª Edição Copyright 2022 Unigranrio Nenhuma parte deste material poderá ser reproduzida transmitida e gravada por qualquer meio eletrônico mecânico por fotocópia e outros sem a prévia autorização por escrito da Unigranrio Núcleo de Educação a Distância wwwunigranriocombr Rua Prof José de Souza Herdy 1160 25 de Agosto Duque de Caxias RJ Reitor Arody Cordeiro Herdy PróReitoria de Programas de PósGraduação Nara Pires PróReitoria de Programas de Graduação Lívia Maria Figueiredo Lacerda PróReitoria Administrativa e Comunitária Carlos de Oliveira Varella Núcleo de Educação a Distância NEAD Lúcia Inês Kronemberger Andrade Sumário Medidas de Posição Para início de conversa 4 Objetivos 4 1 Medidas de tendência central 5 2 Separatrizes 14 Referências 18 Estatística e Probabilidade 3 Para início de conversa Os dados coletados em uma pesquisa medição ou experimento são também chamados de observáveis e cada variável possui um espectro de valores que podem ser atingidos Vamos trabalhar com as medidas de posição que visam a dar uma noção geral e sintética da coleção de valores que estão sendo considerados para uma determinada variável As medidas de posição trabalhadas aqui também são conhecidas como medidas de tendência central pois acompanham de certa forma a maioria dos valores que fazem parte da nossa coleção de dados considerados Estudaremos a média aritmética média ponderada mediana e moda Apresentaremos diversos exemplos para ilustrar as aplicações de tais conceitos tão importantes para a análise estatística Além disso trabalharemos também com as separatrizes que podem ser adaptadas de acordo com o tamanho da amostra que estamos considerando para particionar esse grupo em subgrupos de mesmo tamanho e dessa forma podermos ter uma ideia da variação dos valores que determinada variável assume na nossa base de dados Objetivos Calcular e interpretar as medidas de tendência central média moda e mediana Entender como as medidas de posição influenciam a forma da distribuição dos dados Calcular e interpretar resultados de medidas separatrizes Estatística e Probabilidade 4 1 Medidas de tendência central Além dos gráficos e das tabelas apresentados anteriormente existem diversas informações que podem ser obtidas a partir de uma colação de dados que podem auxiliar na compreensão de determinadas características e comportamentos da nossa população ou amostra Vamos explorar as medidas de tendência central que visam descrever de maneira geral uma série de dados Começaremos estabelecendo a notação de somatório e produtório que serão utilizadas neste e nos próximos capítulos Definição dada uma coleção de valores denotaremos o somatório dessa coleção como sendo Considere um grupo de 5 pessoas cujas idades são 20 23 21 18 e 21 anos Esses valores representam uma coleção finita que pode ser representada como O somatório da idade de todas pessoas do grupo é A representação do somatório pode ser utilizada para qualquer conjunto de valores por exemplo a soma de todos os números naturais pode ser representada como sendo ou ainda Note que neste caso o somatório não é um valor finito mas sempre que o conjunto de valores for finito o somatório será finito Utilizando essa notação apresentaremos a primeira medida de tendência central que é a média Estatística e Probabilidade 5 Definição dada uma coleção finita de valores definimos a média aritmética ou apenas média como sendo No exemplo anterior temos que a média da idade no grupo de cinco pessoas é ou seja a idade média das pessoas nesse grupo é de 206 anos A média nos auxilia a identificar de maneira mais generalizada o valor de uma determinada variável estudada mas ela pode nem sempre representar a realidade Considere ainda um grupo com 5 pessoas onde estamos interessados na idade das pessoas mas dessa vez as idade são como apresentada a seguir Calculando a idade média nesse grupo obtemos A idade média no primeiro e no segundo grupo é a mesma Devemos ter cuidado ao calcularmos a média em determinadas coleções de dados pois elas podem induzir a resultados que não correspondem à realidade Dizer que em ambos os grupos a média das idades de cada uma das pessoas é de 20 anos não faz jus a realidade dos dados Estudaremos nos próximos capítulos como medir esse tipo de variação entre os valores obtidos em uma amostra Outro tipo de média bastante utilizada é a média ponderada Neste tipo de média há uma diferença entre os pesos que cada um dos dados considerados Um dos exemplos mais comuns no nosso cotidiano são as médias ponderadas para calcular a nota final de uma disciplina ou de uma prova dividida em diferentes etapas Vejamos alguns exemplos desse tipo de média e como ela deve ser calculada Exemplo 1 três pessoas prestaram um mesmo processo seletivo para um concurso que foi dividido em três etapas distintas A primeira Estatística e Probabilidade 6 etapa corresponde a uma prova escrita com peso 3 a segunda etapa corresponde uma entrevista com peso 2 e a terceira e última etapa corresponde à análise de currículo dos candidatos com peso 1 Observe a tabela a seguir com as notas dos três candidatos em cada uma das etapas Candidato 1ª etapa 2ª etapa 3ª etapa A 7 8 65 B 8 6 6 C 65 9 85 As notas de cada uma das etapas varia de 0 a 10 Calculando a média ponderada do desempenho de cada um dos candidatos obtemos Note que para calcular a média ponderada devemos dividir pelo total da soma dos pesos de cada uma das etapas e não apenas pelo número de etapas Exemplo 2 considere a seguinte tabela que mostra o número de estudantes de acordo com o número de faltas em uma determinada disciplina Número de faltas Quantidade de alunos 0 13 1 8 2 3 3 5 4 1 Para determinar qual a média de faltas para cada aluno desta disciplina devemos utilizar uma média ponderada Multiplicaremos o número de faltas pelo número de alunos que correspondem na tabela e dividiremos pelo total de alunos ou seja A média de faltas por alunos nessa disciplina é de pouco mais de uma falta Estatística e Probabilidade 7 As médias ponderadas também podem nos fornecer informações que não correspondem à realidade No exemplo 2 por exemplo a média de faltas por aluno foi de 11 falta no entanto mais de um terço dos alunos dessa turma não apresentou nenhuma falta A partir da média não podemos inferir muitas informações quanto a distribuição dos dados dentro de nossa amostra Nos exemplos anteriores trabalhamos com tabelas e distribuições de frequência para dados não agrupados isto é cada categoria considerada corresponde a apenas um valor Esse tipo de representação geralmente é utilizado quando estamos trabalhando com variáveis numéricas discretas como número de faltas número de filhos quantidade de televisores em uma residência e assim por diante Outro tipo de distribuição de frequência pode ser descrita por meio de dados agrupados geralmente utilizada quando trabalhamos com uma variável numérica contínua como por exemplo peso altura temperatura Veja por exemplo a tabela abaixo que mostra a distribuição de frequências das alturas dos alunos de uma classe Altura m Número de alunos Menos de 160 3 160 170 12 170 180 16 180 190 8 Maior ou igual a 190 2 O símbolo significa o intervalo da classe que estamos considerando Por exemplo as pessoas que estão na classe 160 170 têm entre 160m e 170 Nesta classe estão as pessoas que tem exatamente 160m mas somente as pessoas que têm menos de 170m Podemos considerar que se trata de um intervalo fechado à esquerda e aberto à direita pois estamos trabalhando com uma variável numérica contínua e portanto os valores podem ser números reais Para calcular as medidas de posição que foram apresentadas e as indicadas a seguir devemos determinar um valor dentro do intervalo da classe que irá representála e que utilizaremos nas fórmulas para distribuições de frequência de dados nãoagrupados Uma das formas mais simples de lidar com dados agrupados é determinar o valor médio do intervalo de cada classe e realizar o cálculo para aqueles valores No exemplo anterior podemos utilizar os valores apresentados na tabela a seguir Estatística e Probabilidade 8 Altura m Número de alunos Valor médio m Menos de 160 3 160 160 170 12 165 170 180 16 175 180 190 8 185 Maior ou igual a 190 2 190 Utilizando o valor médio de cada uma das classes podemos proceder com o cálculo da média aritmética como sendo Apresentaremos mais exemplos de como trabalhar com dados agrupados no decorrer do capítulo Além das médias aritmética e ponderada existem também outras médias que podem ser calculadas a partir de uma coleção de dados A média geométrica de um conjunto de dados será denotada por e é dada pela fórmula ou seja é o produto de todas as observáveis e deste resultado é extraída a raíz nésima onde n é o número de observáveis Por exemplo a média geométrica do conjunto é igual a A média harmônica de um conjunto de dados denotada aqui por é obtida pela seguinte fórmula Tomamos o inverso de cada uma das observáveis e realizamos a soma deles A seguir efetuamos o quociente entre o número de observáveis e o total do somatório anterior Utilizando o mesmo conjunto a média harmônica deste conjunto de observáveis é Mais exemplos do cálculo dessas duas médias podem ser encontrados em Spiegel e Stephens 2009 Estatística e Probabilidade 9 Apresentaremos agora duas outras medidas de posição que são muito utilizadas para sintetizar um conjunto de dados Definição a mediana de uma coleção de valores é o valor que ocupa a posição central quando os dados são dispostos em ordem crescente Por exemplo se nossos valores observados para uma determinada variável forem 2 3 7 5 1 2 e 6 devemos ordenar os valores e determinar o valor que está exatamente no meio de todos os valores em ordem crescente 1 2 2 3 5 6 7 No caso do conjunto de observações apresentado anteriormente a mediana é igual a 3 Caso o número de observações seja par então a mediana é igual a média aritmética entre os dois valores que ocupam a posição central Por exemplo se temos os seguintes valores observados 1 2 3 5 7 8 8 9 então a mediana é igual a Muitas vezes encontramos tabelas com a distribuição de frequência acumulada que faz referência à soma de todas as ocorrências que são anteriores àquele determinado valor ou intervalo de classe Observe a tabela a seguir em que apresentamos a distribuição de frequência acumulada juntamente com a distribuição de frequências em um caso com dados agrupados Peso kg Número de indivíduos Distribuição de frequência acumulada Menos de 50 2 4 50 60 4 12 60 70 11 34 70 80 19 72 80 90 8 88 90 100 3 94 100 110 2 98 Acima de 110 1 100 Para calcular a mediana para dados agrupados devemos proceder da seguinte maneira primeiro devemos determinar em qual intervalo de classe está o valor que divide as observáveis ao meio no caso do exemplo anterior é a classe 70 80 pois pela coluna da frequência acumulada sabemos que 72 dos valores das observáveis são estritamente menores que 80 enquanto que 34 das observáveis são menores que Estatística e Probabilidade 10 70 Determinada a classe onde o valor que divide as observáveis ao meio utilizamos a seguinte fórmula onde é o limite inferior da classe determinada anteriormente é o número total de observáveis é o número total de observáveis que pertencem às classes menores que a classe onde está localizada a mediana é o número de observáveis que pertencem ao intervalo onde está localizada a mediana e é o comprimento do intervalo de classe No exemplo anterior temos que e Portanto a mediana é igual a Definição a moda de uma coleção de valores é o valor com maior número de ocorrências dentro da coleção Por exemplo dada a coleção de dados 1 2 2 2 3 3 5 6 6 7 então 2 é a moda dessa coleção No caso de dados agrupados a moda é igual ao ponto médio do intervalo de classe de maior frequência dentro da amostra No exemplo da tabela com o peso de 50 indivíduos divididos em intervalos de classe o intervalo com maior frequência é o 70 80 e portanto a moda é igual a 75kg Vejamos um exemplo com o cálculo das medidas de posição em um experimento no qual as observáveis são as faces superiores de um dado em uma sequência de lançamentos Exemplo 3 Considere 10 lançamento de um dado de 6 faces cujos resultados são apresentados na lista a seguir 2 5 4 5 3 6 1 5 3 6 Vamos determinar a média a mediana e a moda desses lançamentos Para calcular a média devemos somar todos os valores e dividir pelo número total de lançamentos Dessa forma obtemos que Estatística e Probabilidade 11 Para calcular a mediana e a moda organizaremos os dados observados em ordem crescente 1 2 3 3 4 5 5 5 6 6 Como estamos trabalhando com um conjunto de números pares de observações a mediana será a média entre os dois valores centrais ou seja Observando os resultados obtidos concluímos que a moda desses 10 lançamentos foi 5 Portanto para esses 10 lançamentos realizados com um dado de seis faces a média é igual a 4 a mediana é igual a 45 e a moda é igual a 5 Exemplo 4 os jogos olímpicos são competições de diversas modalidades esportivas que ocorrem de 4 em 4 anos em diferentes países do mundo Em cada modalidade são premiados os três primeiros lugares com medalhas de ouro prata e bronze para o primeiro segundo e terceiro colocado respectivamente Observe o quadro de medalhas do Brasil nas últimas seis edições dos jogos olímpicos apresentado a seguir Edição do jogos Ouro Prata Bronze Rio 2016 7 6 6 Londres 2012 3 5 9 Pequim 2008 3 4 10 Atenas 2004 5 2 3 Sydney 2000 0 6 6 Atlanta 2000 3 3 9 Tabela 1 Quadro de medalhas do Brasil nas últimas seis edições dos jogos olímpicos Fonte COB Vamos determinar qual a média de cada um dos três tipos de medalhas que o Brasil teve nas últimas seis edições dos jogos olímpicos Média de medalhas de ouro Média de medalhas de prata Média de medalhas de bronze Estatística e Probabilidade 12 Considere agora que cada medalha de ouro seja equivalente a 5 pontos cada medalha de prata seja equivalente a 3 pontos e cada medalha de bronze seja equivalente a 1 ponto Vamos determinar a média de pontos que o Brasil teve nas 6 últimas edições dos jogos olímpicos Primeiro devemos calcular os pontos totais que o Brasil teve em cada uma das edições dos jogos olímpicos apresentada na tabela Para calcular o total de pontos devemos levar em consideração além do número de medalhas também a pontuação correspondente a cada uma de acordo com o seu tipo Para calcular o total de pontos que o Brasil teve na edição de 2016 procedemos da seguinte maneira Repetindo o processo para todas as outras linhas da tabela apresentada anteriormente obtemos os seguintes resultados Edição dos jogos Pontuação do Brasil Rio 2016 59 Londres 2012 39 Pequim 2008 37 Atenas 2004 34 Sydney 2000 24 Atlanta 2000 33 Agora podemos calcular a média aritmética da pontuação do Brasil nas seis últimas edições e assim obtemos Note que a média que estamos tomando aqui é a média aritmética Para o cálculo da pontuação do Brasil por cada edição usamos um sistema de pontuação com pesos distintos para as medalhas que se assemelha à média ponderada mas neste caso não dividimos pela soma total dos pesos pois estamos apenas determinando a quantidade de pontos Logo a média de pontos do Brasil seguindo o sistema de pontuação descrito anteriormente foi de 3766 A pandemia causada pelo coronavírus que teve início no final de 2019 acarretou o adiamento dos jogos olímpicos de Tóquio que ocorreriam no ano de 2020 Essa não foi a primeira vez que eventos globais afetaram a realização dos jogos olímpicos As edições dos jogos de 1916 1940 e 1944 foram canceladas em razão das duas grandes guerras mundiais Estatística e Probabilidade 13 2 Separatrizes As separatrizes podem ser vistas como generalizações do conceito de mediana Enquanto a mediana divide os valores de uma coleção ao meio as separatrizes podem dividir os valores da coleção em quantas partes forem estipuladas Os quartis são um exemplo de separatrizes que dividem uma dada coleção de dados em quatro partes devemos ordenar os dados em ordem crescente e depois dividir os dados observados de modo a encontrar os valores que dividem a coleção em quatro partes Vejamos um exemplo numérico para ilustrar essa definição Exemplo 5 Considere a tabela a seguir com a temperatura mínima e máxima mensal registrada na cidade de São Paulo Mês Temperatura mínima ºC Temperatura máxima ºC Janeiro 194 263 Fevereiro 194 268 Março 187 258 Abril 171 246 Maio 143 22 Junho 131 217 Julho 123 215 Agosto 129 229 Setembro 146 241 Outubro 162 248 Novembro 169 245 Dezembro 184 258 Na tabela acima temos dados referentes às temperaturas mínimas e máximas mensais registradas em um determinado ponto da cidade de São Paulo Temos portanto um conjunto de 12 observáveis para cada variável mínima e máxima Vamos determinar os quartis de cada uma dessas variáveis Devemos ordenar os valores em ordem crescente assim como fizemos para determinar a mediana Para as temperaturas mínimas temos 123 129 131 143 146 162 169 171 184 187 194 194 Estatística e Probabilidade 14 Como no total temos 12 observáveis ao dividirmos nossos dados em 4 subgrupos com o mesmo número de elementos cada subgrupo terá 3 observáveis Para determinar os valores dos quartis podemos determinar primeiro a mediana e depois a mediana de cada um dos subgrupos de dados obtidos 123 129 131 143 146 162 169 171 184 187 194 194 Portanto a mediana é igual a 1655 Temos agora duas coleções de 6 dados cada e portanto basta proceder da mesma maneira 123 129 131 143 146 162 169 171 184 187 194 194 Os quartis da temperatura mínima são 137 1655 e 1855 Procedendo da mesma maneira para as temperatura máxima obtemos os quartis 2245 243 e 258 Estatística e Probabilidade 15 Observe que os quartis de uma distribuição de frequência são 3 valores que dividem os dados em quatro subgrupos de mesmo tamanho Se chamarmos os quartis de e então os quatro quartis são determinados como sendo 1 O primeiro é formado pelas observáveis que são menores que 2 O segundo é formado pelas observável que estão entre e 3 O terceiro é formado pelas observáveis que estão entre e 4 O quarto é formado pelas observáveis que são maiores que O gráfico a seguir mostra uma representação de uma distribuição assimétrica de dados dividida pelos quartis Note que cada subconjunto definido pelos quartis tem 25 do total das observáveis que a distribuição representa Q1 25 25 25 25 Q2 Q3 De forma análoga podemos dividir nosso subconjunto de dados em quantas parcelas forem necessárias Quanto maior o volume de dados considerados dividilo em parcelas menores torna mais fácil compreender o comportamento e a distribuição dos valores registrados por meio das separatrizes Alguns autores usam a denominação quantil para significar os valores que indicam dividem o conjunto das observáveis de acordo com uma proporção com onde os valores menores que correspondem a uma fração do total de observáveis Por exemplo o quantil tomando é a mediana pois esse quantil divide o conjunto de observáveis de modo que 50 dos valores está abaixo dele e 50 dos valores está acima dele O quantil é tal que uma proporção de de todas as observáveis está abaixo dele e uma proporção de de todas as observáveis são maiores que ele Um procedimento simples para poder determinar os quantis de um conjunto com observáveis começa com a ordenação de todos os dados em ordem crescente Seja a ordenação de todas os dados em ordem crescente ou seja Determinado a proporção devemos determinar quantas das observáveis corresponde a essa proporção no caso A partir daí temos duas possibilidades para determinar o quantil supondo que onde e se então o quantil é tal que Estatística e Probabilidade 16 se então o quantil é tal que Considere a coleção de observáveis X 2 7 9 7 5 1 7 1 Ordenando as observáveis em ordem crescente temos 1 1 2 5 7 7 7 9 Para determinar o quantil quando então e portanto Isso significa que 25 dos valores do conjunto X são menores que 15 Tomando temos então e portanto Isso significa que 60 dos valores do conjunto X são menores que 7 Esse processo de determinação de quantis pode ser aplicado para qualquer tipo de separatriz Basta que a partir do número de subconjuntos que se quer dividir a coleções de dados determine a porcentagem que cada um dos conjuntos irá representar do total Para determinar os valores de cada separatriz basta aplicar o mesmo procedimento descrito acima para cada um dos quantis necessários Os quantis que determinam as separatrizes de ordem 4 isso é os quartis são e É indispensável considerar o volume de observáveis para realizar o cálculo das separatrizes de um conjunto No exemplo 5 consideramos um conjunto com 12 observáveis referentes a cada um dos meses do ano portanto dividir esse conjunto em decis dez partes iguais não faria muito sentido Esse tipo de separatrizes são utilizadas em conjuntos com uma quantidade muito grande de dados As medidas de posição podem nos dar uma ideia da maneira como os valores de uma determinada variável assumem dentro de uma Estatística e Probabilidade 17 coleção de dados Vimos que tais medidas sozinhas podem não ser suficientes para descrever o comportamento de um conjunto de valores Neste capítulo descrevemos os conceitos de média aritmética média ponderada mediana e moda Trabalhamos também com as separatrizes que particionam nosso conjunto de dados em subconjunto de mesmo tamanho de acordo com a nossa necessidade Apresentamos diversos exemplos comentados para fixar os conceitos apresentados Nos próximos capítulos trabalharemos com outras formas de descrever de maneira sintética um determinado conjunto de dados que possibilitam uma melhor interpretação dessa coleção Referências CLIMA São Paulo Temperatura Tempo e Dados climatológicos São Paulo Disponível em httpsptclimatedataorgamericadosulbrasilsao paulosaopaulo655 Acesso em 23 jun 2021 MEDALHAS Olímpicas por edição dos jogos COB 2021 Disponível em httpswwwcoborgbrptcobtimebrasilbrasilnosjogosmedalhas olimpicas Acesso em 23 jun 2021 FONSECA J S da MARTINS G de A Curso de estatística 6 ed São Paulo Atlas 2012 MATTOS V L D de AZAMBUJA A M V de K A C Introdução à estatística aplicações em ciências exatas Rio de Janeiro LTC 2017 MOORE D NOTZ W FLIGNER M A estatística básica e sua prática 7 ed Rio de Janeiro LTC 2017 MORETTIN P BUSSAB W Estatística básica 9 ed São Paulo Saraiva 2017 SPIEGEL M STEPHENS L Estatística Porto Alegre Bookman 2009 SPIEGEL M SCHILLIER J SRINIVASAN A Probabilidade e estatística 3 ed Porto Alegre Bookman 2013 TRIOLA M Introdução à estatística 12 ed Rio de Janeiro LTC 2017 VIEIRA S Fundamentos de Estatística 6 ed São Paulo Atlas 2019 Estatística e Probabilidade 18
Send your question to AI and receive an answer instantly
Recommended for you
17
Representação Gráfica e Tabular em Estatística
Probabilidade e Estatística 1
ESTACIO
12
Medidas de Dispersão em Estatística e Probabilidade
Probabilidade e Estatística 1
ESTACIO
2
Determinação da Localização Ideal para Fábrica com Método do Centro de Gravidade e Mediana
Probabilidade e Estatística 1
UMG
11
Análise de Localização e Ponto de Equilíbrio para Nova Unidade Industrial
Probabilidade e Estatística 1
UMG
9
Teste de Igualdade de Proporções e Análise Estatística
Probabilidade e Estatística 1
UMG
1
Analise de Variancia ANOVA Modelos Probabilisticos e Teste F - Estatistica
Probabilidade e Estatística 1
UMG
1
Analise de Variancia-ANOVA-Modelos Probabilisticos e Teste de Compressao de Embalagens
Probabilidade e Estatística 1
UMG
1
Analise de Variancia-Introducao aos Modelos Probabilisticos
Probabilidade e Estatística 1
UMG
2
Análise de Custos e Localização de Produção
Probabilidade e Estatística 1
UMG
3
Análise de Viabilidade para Segunda Unidade de Restaurante e Descentralização da Indústria
Probabilidade e Estatística 1
UMG
Preview text
Estatística e Probabilidade Medidas de Posição Produção Gerência de Desenho Educacional NEAD Desenvolvimento do material Gregório Dalle Vedove Nosaki 1ª Edição Copyright 2022 Unigranrio Nenhuma parte deste material poderá ser reproduzida transmitida e gravada por qualquer meio eletrônico mecânico por fotocópia e outros sem a prévia autorização por escrito da Unigranrio Núcleo de Educação a Distância wwwunigranriocombr Rua Prof José de Souza Herdy 1160 25 de Agosto Duque de Caxias RJ Reitor Arody Cordeiro Herdy PróReitoria de Programas de PósGraduação Nara Pires PróReitoria de Programas de Graduação Lívia Maria Figueiredo Lacerda PróReitoria Administrativa e Comunitária Carlos de Oliveira Varella Núcleo de Educação a Distância NEAD Lúcia Inês Kronemberger Andrade Sumário Medidas de Posição Para início de conversa 4 Objetivos 4 1 Medidas de tendência central 5 2 Separatrizes 14 Referências 18 Estatística e Probabilidade 3 Para início de conversa Os dados coletados em uma pesquisa medição ou experimento são também chamados de observáveis e cada variável possui um espectro de valores que podem ser atingidos Vamos trabalhar com as medidas de posição que visam a dar uma noção geral e sintética da coleção de valores que estão sendo considerados para uma determinada variável As medidas de posição trabalhadas aqui também são conhecidas como medidas de tendência central pois acompanham de certa forma a maioria dos valores que fazem parte da nossa coleção de dados considerados Estudaremos a média aritmética média ponderada mediana e moda Apresentaremos diversos exemplos para ilustrar as aplicações de tais conceitos tão importantes para a análise estatística Além disso trabalharemos também com as separatrizes que podem ser adaptadas de acordo com o tamanho da amostra que estamos considerando para particionar esse grupo em subgrupos de mesmo tamanho e dessa forma podermos ter uma ideia da variação dos valores que determinada variável assume na nossa base de dados Objetivos Calcular e interpretar as medidas de tendência central média moda e mediana Entender como as medidas de posição influenciam a forma da distribuição dos dados Calcular e interpretar resultados de medidas separatrizes Estatística e Probabilidade 4 1 Medidas de tendência central Além dos gráficos e das tabelas apresentados anteriormente existem diversas informações que podem ser obtidas a partir de uma colação de dados que podem auxiliar na compreensão de determinadas características e comportamentos da nossa população ou amostra Vamos explorar as medidas de tendência central que visam descrever de maneira geral uma série de dados Começaremos estabelecendo a notação de somatório e produtório que serão utilizadas neste e nos próximos capítulos Definição dada uma coleção de valores denotaremos o somatório dessa coleção como sendo Considere um grupo de 5 pessoas cujas idades são 20 23 21 18 e 21 anos Esses valores representam uma coleção finita que pode ser representada como O somatório da idade de todas pessoas do grupo é A representação do somatório pode ser utilizada para qualquer conjunto de valores por exemplo a soma de todos os números naturais pode ser representada como sendo ou ainda Note que neste caso o somatório não é um valor finito mas sempre que o conjunto de valores for finito o somatório será finito Utilizando essa notação apresentaremos a primeira medida de tendência central que é a média Estatística e Probabilidade 5 Definição dada uma coleção finita de valores definimos a média aritmética ou apenas média como sendo No exemplo anterior temos que a média da idade no grupo de cinco pessoas é ou seja a idade média das pessoas nesse grupo é de 206 anos A média nos auxilia a identificar de maneira mais generalizada o valor de uma determinada variável estudada mas ela pode nem sempre representar a realidade Considere ainda um grupo com 5 pessoas onde estamos interessados na idade das pessoas mas dessa vez as idade são como apresentada a seguir Calculando a idade média nesse grupo obtemos A idade média no primeiro e no segundo grupo é a mesma Devemos ter cuidado ao calcularmos a média em determinadas coleções de dados pois elas podem induzir a resultados que não correspondem à realidade Dizer que em ambos os grupos a média das idades de cada uma das pessoas é de 20 anos não faz jus a realidade dos dados Estudaremos nos próximos capítulos como medir esse tipo de variação entre os valores obtidos em uma amostra Outro tipo de média bastante utilizada é a média ponderada Neste tipo de média há uma diferença entre os pesos que cada um dos dados considerados Um dos exemplos mais comuns no nosso cotidiano são as médias ponderadas para calcular a nota final de uma disciplina ou de uma prova dividida em diferentes etapas Vejamos alguns exemplos desse tipo de média e como ela deve ser calculada Exemplo 1 três pessoas prestaram um mesmo processo seletivo para um concurso que foi dividido em três etapas distintas A primeira Estatística e Probabilidade 6 etapa corresponde a uma prova escrita com peso 3 a segunda etapa corresponde uma entrevista com peso 2 e a terceira e última etapa corresponde à análise de currículo dos candidatos com peso 1 Observe a tabela a seguir com as notas dos três candidatos em cada uma das etapas Candidato 1ª etapa 2ª etapa 3ª etapa A 7 8 65 B 8 6 6 C 65 9 85 As notas de cada uma das etapas varia de 0 a 10 Calculando a média ponderada do desempenho de cada um dos candidatos obtemos Note que para calcular a média ponderada devemos dividir pelo total da soma dos pesos de cada uma das etapas e não apenas pelo número de etapas Exemplo 2 considere a seguinte tabela que mostra o número de estudantes de acordo com o número de faltas em uma determinada disciplina Número de faltas Quantidade de alunos 0 13 1 8 2 3 3 5 4 1 Para determinar qual a média de faltas para cada aluno desta disciplina devemos utilizar uma média ponderada Multiplicaremos o número de faltas pelo número de alunos que correspondem na tabela e dividiremos pelo total de alunos ou seja A média de faltas por alunos nessa disciplina é de pouco mais de uma falta Estatística e Probabilidade 7 As médias ponderadas também podem nos fornecer informações que não correspondem à realidade No exemplo 2 por exemplo a média de faltas por aluno foi de 11 falta no entanto mais de um terço dos alunos dessa turma não apresentou nenhuma falta A partir da média não podemos inferir muitas informações quanto a distribuição dos dados dentro de nossa amostra Nos exemplos anteriores trabalhamos com tabelas e distribuições de frequência para dados não agrupados isto é cada categoria considerada corresponde a apenas um valor Esse tipo de representação geralmente é utilizado quando estamos trabalhando com variáveis numéricas discretas como número de faltas número de filhos quantidade de televisores em uma residência e assim por diante Outro tipo de distribuição de frequência pode ser descrita por meio de dados agrupados geralmente utilizada quando trabalhamos com uma variável numérica contínua como por exemplo peso altura temperatura Veja por exemplo a tabela abaixo que mostra a distribuição de frequências das alturas dos alunos de uma classe Altura m Número de alunos Menos de 160 3 160 170 12 170 180 16 180 190 8 Maior ou igual a 190 2 O símbolo significa o intervalo da classe que estamos considerando Por exemplo as pessoas que estão na classe 160 170 têm entre 160m e 170 Nesta classe estão as pessoas que tem exatamente 160m mas somente as pessoas que têm menos de 170m Podemos considerar que se trata de um intervalo fechado à esquerda e aberto à direita pois estamos trabalhando com uma variável numérica contínua e portanto os valores podem ser números reais Para calcular as medidas de posição que foram apresentadas e as indicadas a seguir devemos determinar um valor dentro do intervalo da classe que irá representála e que utilizaremos nas fórmulas para distribuições de frequência de dados nãoagrupados Uma das formas mais simples de lidar com dados agrupados é determinar o valor médio do intervalo de cada classe e realizar o cálculo para aqueles valores No exemplo anterior podemos utilizar os valores apresentados na tabela a seguir Estatística e Probabilidade 8 Altura m Número de alunos Valor médio m Menos de 160 3 160 160 170 12 165 170 180 16 175 180 190 8 185 Maior ou igual a 190 2 190 Utilizando o valor médio de cada uma das classes podemos proceder com o cálculo da média aritmética como sendo Apresentaremos mais exemplos de como trabalhar com dados agrupados no decorrer do capítulo Além das médias aritmética e ponderada existem também outras médias que podem ser calculadas a partir de uma coleção de dados A média geométrica de um conjunto de dados será denotada por e é dada pela fórmula ou seja é o produto de todas as observáveis e deste resultado é extraída a raíz nésima onde n é o número de observáveis Por exemplo a média geométrica do conjunto é igual a A média harmônica de um conjunto de dados denotada aqui por é obtida pela seguinte fórmula Tomamos o inverso de cada uma das observáveis e realizamos a soma deles A seguir efetuamos o quociente entre o número de observáveis e o total do somatório anterior Utilizando o mesmo conjunto a média harmônica deste conjunto de observáveis é Mais exemplos do cálculo dessas duas médias podem ser encontrados em Spiegel e Stephens 2009 Estatística e Probabilidade 9 Apresentaremos agora duas outras medidas de posição que são muito utilizadas para sintetizar um conjunto de dados Definição a mediana de uma coleção de valores é o valor que ocupa a posição central quando os dados são dispostos em ordem crescente Por exemplo se nossos valores observados para uma determinada variável forem 2 3 7 5 1 2 e 6 devemos ordenar os valores e determinar o valor que está exatamente no meio de todos os valores em ordem crescente 1 2 2 3 5 6 7 No caso do conjunto de observações apresentado anteriormente a mediana é igual a 3 Caso o número de observações seja par então a mediana é igual a média aritmética entre os dois valores que ocupam a posição central Por exemplo se temos os seguintes valores observados 1 2 3 5 7 8 8 9 então a mediana é igual a Muitas vezes encontramos tabelas com a distribuição de frequência acumulada que faz referência à soma de todas as ocorrências que são anteriores àquele determinado valor ou intervalo de classe Observe a tabela a seguir em que apresentamos a distribuição de frequência acumulada juntamente com a distribuição de frequências em um caso com dados agrupados Peso kg Número de indivíduos Distribuição de frequência acumulada Menos de 50 2 4 50 60 4 12 60 70 11 34 70 80 19 72 80 90 8 88 90 100 3 94 100 110 2 98 Acima de 110 1 100 Para calcular a mediana para dados agrupados devemos proceder da seguinte maneira primeiro devemos determinar em qual intervalo de classe está o valor que divide as observáveis ao meio no caso do exemplo anterior é a classe 70 80 pois pela coluna da frequência acumulada sabemos que 72 dos valores das observáveis são estritamente menores que 80 enquanto que 34 das observáveis são menores que Estatística e Probabilidade 10 70 Determinada a classe onde o valor que divide as observáveis ao meio utilizamos a seguinte fórmula onde é o limite inferior da classe determinada anteriormente é o número total de observáveis é o número total de observáveis que pertencem às classes menores que a classe onde está localizada a mediana é o número de observáveis que pertencem ao intervalo onde está localizada a mediana e é o comprimento do intervalo de classe No exemplo anterior temos que e Portanto a mediana é igual a Definição a moda de uma coleção de valores é o valor com maior número de ocorrências dentro da coleção Por exemplo dada a coleção de dados 1 2 2 2 3 3 5 6 6 7 então 2 é a moda dessa coleção No caso de dados agrupados a moda é igual ao ponto médio do intervalo de classe de maior frequência dentro da amostra No exemplo da tabela com o peso de 50 indivíduos divididos em intervalos de classe o intervalo com maior frequência é o 70 80 e portanto a moda é igual a 75kg Vejamos um exemplo com o cálculo das medidas de posição em um experimento no qual as observáveis são as faces superiores de um dado em uma sequência de lançamentos Exemplo 3 Considere 10 lançamento de um dado de 6 faces cujos resultados são apresentados na lista a seguir 2 5 4 5 3 6 1 5 3 6 Vamos determinar a média a mediana e a moda desses lançamentos Para calcular a média devemos somar todos os valores e dividir pelo número total de lançamentos Dessa forma obtemos que Estatística e Probabilidade 11 Para calcular a mediana e a moda organizaremos os dados observados em ordem crescente 1 2 3 3 4 5 5 5 6 6 Como estamos trabalhando com um conjunto de números pares de observações a mediana será a média entre os dois valores centrais ou seja Observando os resultados obtidos concluímos que a moda desses 10 lançamentos foi 5 Portanto para esses 10 lançamentos realizados com um dado de seis faces a média é igual a 4 a mediana é igual a 45 e a moda é igual a 5 Exemplo 4 os jogos olímpicos são competições de diversas modalidades esportivas que ocorrem de 4 em 4 anos em diferentes países do mundo Em cada modalidade são premiados os três primeiros lugares com medalhas de ouro prata e bronze para o primeiro segundo e terceiro colocado respectivamente Observe o quadro de medalhas do Brasil nas últimas seis edições dos jogos olímpicos apresentado a seguir Edição do jogos Ouro Prata Bronze Rio 2016 7 6 6 Londres 2012 3 5 9 Pequim 2008 3 4 10 Atenas 2004 5 2 3 Sydney 2000 0 6 6 Atlanta 2000 3 3 9 Tabela 1 Quadro de medalhas do Brasil nas últimas seis edições dos jogos olímpicos Fonte COB Vamos determinar qual a média de cada um dos três tipos de medalhas que o Brasil teve nas últimas seis edições dos jogos olímpicos Média de medalhas de ouro Média de medalhas de prata Média de medalhas de bronze Estatística e Probabilidade 12 Considere agora que cada medalha de ouro seja equivalente a 5 pontos cada medalha de prata seja equivalente a 3 pontos e cada medalha de bronze seja equivalente a 1 ponto Vamos determinar a média de pontos que o Brasil teve nas 6 últimas edições dos jogos olímpicos Primeiro devemos calcular os pontos totais que o Brasil teve em cada uma das edições dos jogos olímpicos apresentada na tabela Para calcular o total de pontos devemos levar em consideração além do número de medalhas também a pontuação correspondente a cada uma de acordo com o seu tipo Para calcular o total de pontos que o Brasil teve na edição de 2016 procedemos da seguinte maneira Repetindo o processo para todas as outras linhas da tabela apresentada anteriormente obtemos os seguintes resultados Edição dos jogos Pontuação do Brasil Rio 2016 59 Londres 2012 39 Pequim 2008 37 Atenas 2004 34 Sydney 2000 24 Atlanta 2000 33 Agora podemos calcular a média aritmética da pontuação do Brasil nas seis últimas edições e assim obtemos Note que a média que estamos tomando aqui é a média aritmética Para o cálculo da pontuação do Brasil por cada edição usamos um sistema de pontuação com pesos distintos para as medalhas que se assemelha à média ponderada mas neste caso não dividimos pela soma total dos pesos pois estamos apenas determinando a quantidade de pontos Logo a média de pontos do Brasil seguindo o sistema de pontuação descrito anteriormente foi de 3766 A pandemia causada pelo coronavírus que teve início no final de 2019 acarretou o adiamento dos jogos olímpicos de Tóquio que ocorreriam no ano de 2020 Essa não foi a primeira vez que eventos globais afetaram a realização dos jogos olímpicos As edições dos jogos de 1916 1940 e 1944 foram canceladas em razão das duas grandes guerras mundiais Estatística e Probabilidade 13 2 Separatrizes As separatrizes podem ser vistas como generalizações do conceito de mediana Enquanto a mediana divide os valores de uma coleção ao meio as separatrizes podem dividir os valores da coleção em quantas partes forem estipuladas Os quartis são um exemplo de separatrizes que dividem uma dada coleção de dados em quatro partes devemos ordenar os dados em ordem crescente e depois dividir os dados observados de modo a encontrar os valores que dividem a coleção em quatro partes Vejamos um exemplo numérico para ilustrar essa definição Exemplo 5 Considere a tabela a seguir com a temperatura mínima e máxima mensal registrada na cidade de São Paulo Mês Temperatura mínima ºC Temperatura máxima ºC Janeiro 194 263 Fevereiro 194 268 Março 187 258 Abril 171 246 Maio 143 22 Junho 131 217 Julho 123 215 Agosto 129 229 Setembro 146 241 Outubro 162 248 Novembro 169 245 Dezembro 184 258 Na tabela acima temos dados referentes às temperaturas mínimas e máximas mensais registradas em um determinado ponto da cidade de São Paulo Temos portanto um conjunto de 12 observáveis para cada variável mínima e máxima Vamos determinar os quartis de cada uma dessas variáveis Devemos ordenar os valores em ordem crescente assim como fizemos para determinar a mediana Para as temperaturas mínimas temos 123 129 131 143 146 162 169 171 184 187 194 194 Estatística e Probabilidade 14 Como no total temos 12 observáveis ao dividirmos nossos dados em 4 subgrupos com o mesmo número de elementos cada subgrupo terá 3 observáveis Para determinar os valores dos quartis podemos determinar primeiro a mediana e depois a mediana de cada um dos subgrupos de dados obtidos 123 129 131 143 146 162 169 171 184 187 194 194 Portanto a mediana é igual a 1655 Temos agora duas coleções de 6 dados cada e portanto basta proceder da mesma maneira 123 129 131 143 146 162 169 171 184 187 194 194 Os quartis da temperatura mínima são 137 1655 e 1855 Procedendo da mesma maneira para as temperatura máxima obtemos os quartis 2245 243 e 258 Estatística e Probabilidade 15 Observe que os quartis de uma distribuição de frequência são 3 valores que dividem os dados em quatro subgrupos de mesmo tamanho Se chamarmos os quartis de e então os quatro quartis são determinados como sendo 1 O primeiro é formado pelas observáveis que são menores que 2 O segundo é formado pelas observável que estão entre e 3 O terceiro é formado pelas observáveis que estão entre e 4 O quarto é formado pelas observáveis que são maiores que O gráfico a seguir mostra uma representação de uma distribuição assimétrica de dados dividida pelos quartis Note que cada subconjunto definido pelos quartis tem 25 do total das observáveis que a distribuição representa Q1 25 25 25 25 Q2 Q3 De forma análoga podemos dividir nosso subconjunto de dados em quantas parcelas forem necessárias Quanto maior o volume de dados considerados dividilo em parcelas menores torna mais fácil compreender o comportamento e a distribuição dos valores registrados por meio das separatrizes Alguns autores usam a denominação quantil para significar os valores que indicam dividem o conjunto das observáveis de acordo com uma proporção com onde os valores menores que correspondem a uma fração do total de observáveis Por exemplo o quantil tomando é a mediana pois esse quantil divide o conjunto de observáveis de modo que 50 dos valores está abaixo dele e 50 dos valores está acima dele O quantil é tal que uma proporção de de todas as observáveis está abaixo dele e uma proporção de de todas as observáveis são maiores que ele Um procedimento simples para poder determinar os quantis de um conjunto com observáveis começa com a ordenação de todos os dados em ordem crescente Seja a ordenação de todas os dados em ordem crescente ou seja Determinado a proporção devemos determinar quantas das observáveis corresponde a essa proporção no caso A partir daí temos duas possibilidades para determinar o quantil supondo que onde e se então o quantil é tal que Estatística e Probabilidade 16 se então o quantil é tal que Considere a coleção de observáveis X 2 7 9 7 5 1 7 1 Ordenando as observáveis em ordem crescente temos 1 1 2 5 7 7 7 9 Para determinar o quantil quando então e portanto Isso significa que 25 dos valores do conjunto X são menores que 15 Tomando temos então e portanto Isso significa que 60 dos valores do conjunto X são menores que 7 Esse processo de determinação de quantis pode ser aplicado para qualquer tipo de separatriz Basta que a partir do número de subconjuntos que se quer dividir a coleções de dados determine a porcentagem que cada um dos conjuntos irá representar do total Para determinar os valores de cada separatriz basta aplicar o mesmo procedimento descrito acima para cada um dos quantis necessários Os quantis que determinam as separatrizes de ordem 4 isso é os quartis são e É indispensável considerar o volume de observáveis para realizar o cálculo das separatrizes de um conjunto No exemplo 5 consideramos um conjunto com 12 observáveis referentes a cada um dos meses do ano portanto dividir esse conjunto em decis dez partes iguais não faria muito sentido Esse tipo de separatrizes são utilizadas em conjuntos com uma quantidade muito grande de dados As medidas de posição podem nos dar uma ideia da maneira como os valores de uma determinada variável assumem dentro de uma Estatística e Probabilidade 17 coleção de dados Vimos que tais medidas sozinhas podem não ser suficientes para descrever o comportamento de um conjunto de valores Neste capítulo descrevemos os conceitos de média aritmética média ponderada mediana e moda Trabalhamos também com as separatrizes que particionam nosso conjunto de dados em subconjunto de mesmo tamanho de acordo com a nossa necessidade Apresentamos diversos exemplos comentados para fixar os conceitos apresentados Nos próximos capítulos trabalharemos com outras formas de descrever de maneira sintética um determinado conjunto de dados que possibilitam uma melhor interpretação dessa coleção Referências CLIMA São Paulo Temperatura Tempo e Dados climatológicos São Paulo Disponível em httpsptclimatedataorgamericadosulbrasilsao paulosaopaulo655 Acesso em 23 jun 2021 MEDALHAS Olímpicas por edição dos jogos COB 2021 Disponível em httpswwwcoborgbrptcobtimebrasilbrasilnosjogosmedalhas olimpicas Acesso em 23 jun 2021 FONSECA J S da MARTINS G de A Curso de estatística 6 ed São Paulo Atlas 2012 MATTOS V L D de AZAMBUJA A M V de K A C Introdução à estatística aplicações em ciências exatas Rio de Janeiro LTC 2017 MOORE D NOTZ W FLIGNER M A estatística básica e sua prática 7 ed Rio de Janeiro LTC 2017 MORETTIN P BUSSAB W Estatística básica 9 ed São Paulo Saraiva 2017 SPIEGEL M STEPHENS L Estatística Porto Alegre Bookman 2009 SPIEGEL M SCHILLIER J SRINIVASAN A Probabilidade e estatística 3 ed Porto Alegre Bookman 2013 TRIOLA M Introdução à estatística 12 ed Rio de Janeiro LTC 2017 VIEIRA S Fundamentos de Estatística 6 ed São Paulo Atlas 2019 Estatística e Probabilidade 18