·
Cursos Gerais ·
Métodos Quantitativos Aplicados
Send your question to AI and receive an answer instantly
Recommended for you
94
Plano de Aula Estatística - Correlação Linear Simples e Regressão
Métodos Quantitativos Aplicados
UMG
39
Distribuições de Probabilidades e Testes de Hipóteses Estatísticos
Métodos Quantitativos Aplicados
UMG
27
Introducao a Teoria da Medida-Importancia e Aplicacoes em Pesquisas
Métodos Quantitativos Aplicados
UMG
2
Analise de Dados
Métodos Quantitativos Aplicados
UMG
4
Avaliação Formativa - Produção de Texto e Critérios de Avaliação
Métodos Quantitativos Aplicados
UMG
4
AVC-Avaliacao Continua-Folha de Resposta-Criterios de Avaliacao
Métodos Quantitativos Aplicados
UMG
4
AVC-Avaliacao-Continua-Folha-de-Resposta-Criterios-de-Avaliacao
Métodos Quantitativos Aplicados
UMG
3
Analise de Viabilidade Investimento
Métodos Quantitativos Aplicados
UMG
1
Análise da Função Afim do Caminho de um Skatista
Métodos Quantitativos Aplicados
UMG
1
Funcao Afim e Quadratica - Anotacoes de Aula
Métodos Quantitativos Aplicados
UMG
Preview text
Unidade 2 Medidas Quantitativas e suas representações 3 Introdução da Unidade Uma pesquisa nos fornece dados seja ela feita com a população toda ou com uma amostra como vimos nas aulas anteriores O fato é que depois de fazer uma boa pesquisa teremos uma porção de dados estatísticos para analisar Essa análise só será completa se conseguirmos interpretar os dados e tomar decisões acertadas com relação ao assunto da pesquisa feita Isso começa com uma organização desses dados para termos maior ou menor facilidade em interpretálos e passa por destacar informações ou valores que representem adequadamente as variáveis analisadas Esse é o foco dessa unidade de estudos a quantificação adequada a organização dos dados e a descoberta de valores representativos relacionados às informações conseguidas Esse processo é o que chamamos de encontrar Medidas Quantitativas e suas organizações Na disposição de dados que normalmente encontramos é comum que esses valores representativos estejam nos centros de concentração dos dados Explico melhor normalmente podemos escolher valores representando a pesquisa quando descobrimos quais são os intervalos que mais se repetem Para ficar ainda mais claro vou usar um exemplo se em uma pesquisa sobre cores de olhos percebemos que a maior parte dos entrevistados tinham olhos castanhos ou verdes podemos dizer que um valor representativo dessa variável é a cor de olhos castanhos e outro valor representativo é a cor de olhos verdes Essas informações podem ajudar muito a tomar decisões e criar argumentos sobre a pesquisa realizada por isso vamos estudar formas de conseguir tais valores Objetivos Conhecer as principais medidas quantitativas Representar corretamente dados coletados Calcular as medidas de tendência central Interpretar as medidas de tendência central 4 Conteúdo programático Aula 01 Introdução à teoria da medida Aula 02 Medidas de Tendência Central Você poderá também assistir às videoaulas em seu celular Basta apontar a câmera para os QRCodes distribuídos neste conteúdo Pode ser necessário instalar um aplicativo de leitura QRcode no celular e efetuar login na sua conta Gmail 5 Aula 01 Introdução à teoria da medida Como você pôde observar nas aulas anteriores quando os dados estão desorganizados dificultam a interpretação correta e decisiva dos mesmos Essa organização pode começar pela disposição destes dados em um rol Rol é a organização dos elementos numéricos em uma ordem préestabelecida crescente ou decrescente o que aumentaria muito a facilidade de interpretação das informações conseguidas Vamos para um exemplo para montar a tabela a seguir tomamos apenas os dados que desejamos analisar os tempos das ligações anteriormente listados Quadro 1 Tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa dados em rol crescente 82 11 1 13 2 14 2 16 7 87 11 5 13 6 14 2 16 9 90 12 0 13 7 14 4 17 2 98 12 2 13 8 14 6 17 9 10 1 12 2 13 8 15 1 18 3 10 4 12 7 13 8 15 4 18 9 10 6 12 9 14 0 16 1 20 1 10 8 13 2 14 1 16 3 20 8 Fonte elaborado pela autora 2021 Só o fato de estar em uma disposição em ordem crescente nos permite concluir algumas informações importantes como o menor tempo observado que foi de 82 minutos da mesma forma podemos perceber que o maior foi de 208 minutos Essas duas informações já nos dão uma medida que é chamada de amplitude total Amplitude Total 6 corresponde à diferença entre o maior e o menor valor observado em um conjunto de dados que foi da ordem de 126 minutos Essa é uma medida padrão que normalmente é analisada em uma pesquisa Veja que ela nos diz a maior diferença possível entre dois dados encontrados Você pode estar se perguntando o que isso ajuda na interpretação Vou responder a essa questão com uma interpretação possível mas poderíamos ter outras sabemos que os dados estão bem espalhados que não estão concentrados já que o menor dado possível foi 82 minutos mas existe uma diferença de até 126 minutos se compararmos com os outros dados uma diferença maior do que os 82 comentados podemos afirmar então que os dados não estão concentrados próximos a um valor estão bem dispersos Outra coisa interessante da organização em ordem crescente é que como os números próximos ficam agrupados podemos verificar que alguns tempos como 122 min 132 min 138 min e 142 min foram os mais frequentes ou seja os resultados que mais aconteceram na observação Você deve estar se perguntando a essa altura Como organizar os dados de uma forma mais eficiente ainda E como descobrir mais informações com base nesses dados Já vimos algumas vantagens da forma como apresentamos os dados mas podemos complementar essa forma e a análise desse rol montado anteriormente se utilizarmos mais um recurso na organização do conjunto de dados assim você pode representálos de uma forma ainda melhor Essa organização permite analisar a frequência dos dados isto é quantas vezes eles aparecem Além disso os dados próximos podem ser tão parecidos que podem ser considerados em conjunto na contagem da frequência Isso é feito por meio de uma tabela de distribuição de frequências essa nova tabela é construída agrupando dados próximos em classes e é feita a contagem dos dados pertencentes a cada uma dessas classes Vamos entender melhor A ideia dessa nova tabela é agrupar os dados parecidos valores como 120 e 122 na nossa tabela por exemplo que são muito próximos e poderíamos contálos em conjunto Esses valores parecidos podem ser distribuídos em classes intervalos de valores nos quais agrupamos os dados próximos na variável analisada e contar o número de valores contidos dentro do intervalo de cada classe Exemplo se construíssemos uma classe que agrupa os valores entre 108 e 129 minutos temos nos dados apresentados 8 valores que fariam parte dessa classe o próprio 7 108 o 111 o 115 o 120 122 duas vezes o 127 e o 129 Poderíamos dizer que temos então 8 elementos na classe de 108 a 129 É dessa forma que se obtém a frequência de classe A tabela formada pela disposição dos dados agrupados nessas classes em conjunto com as frequências contadas ou calculadas que se chama distribuição de frequências Vamos esmiuçar um pouco mais esse nosso exemplo Se tomarmos a tabela usada a de contagem de tempo em minutos do uso de celulares e o exemplo de se incluir em uma única classe todos os indivíduos que possuam tempo entre 108 e 129 minutos assim a classe irá variar de 108 a 129 minutos Temos que tomar outro cuidado quando construirmos a tabela de distribuição de frequências pois como teremos mais de uma classe na distribuição precisamos identificar cada uma delas para isso devese conhecer o menor valor limitante e o maior valor limitante da classe são esses valores que delimitam o intervalo de classe Por isso dizemos que essa classe é de 108 a 129 Só que temos valores que estão exatamente nesses limites são os tempos exatamente iguais a 108 ou a 129 minutos Ambos pertencem ou não a esta classe A resposta dessa pergunta vem de uma padronização acordada entre os estudiosos da Estatística Não são regras descobertas são criadas Há uma forma já determinada para definir essa resposta para o intervalo de classe vamos dizer se ele é aberto ou fechado Portanto podemos ter exemplo de notação dos diferentes tipos de intervalos Intervalos abertos 108 min 129 min Intervalos fechados 108 min 129 min Podese ter ainda intervalos mistos 108 min 129 min 8 Videoaula 1 Agora assista a um vídeo explicando essa notação Você notou o que tem de diferente em cada forma de representar os intervalos Essa diferença está ligada àquela barra vertical próxima ao número Existem outras formas de se representar esses tipos de intervalo mas vamos nos ater a explicar o que cada uma das formas quer dizer Intervalos abertos os limites da classe inferior e superior não pertencem a ela Seria o caso de nem o 108 e nem o 129 pertencerem a essa classe Intervalos fechados os limites de classe superior e inferior pertencem à classe em questão Seria o caso de tanto o 108 e quanto o 129 pertencerem a essa classe Intervalos mistos um dos limites pertence à classe e o outro não Seria o caso de o 108 pertencer à classe veja que a barra vertical está próxima do 108 já o 129 não pertenceria a essa classe Qual é a diferença então Se usássemos intervalos abertos essa classe teria 6 elementos com intervalos fechados ela teria 8 elementos com intervalos mistos teria 7 elementos Ainda utilizando os dados do nosso exemplo relativo ao tempo de utilização dos celulares vamos construir uma distribuição de frequência e ao longo dessa construção identificar os conceitos presentes nela Calculando uma distribuição de frequências podemos começar a construir a distribuição de frequências determinando o número de classes k que serão usadas para agrupar os dados Até agora tínhamos pensado em uma classe do 108 ao 129 mas ela Videoaula 1 Agora assista a um vídeo explicando essa notação Utilize o QRcode para assistir 9 existe de fato Seriam esses os extremos de uma classe Quantas classes teríamos naquela tabela que usamos de exemplo A resposta para essas perguntas começa pela definição de quantas classes teremos Para que não fique uma quantidade nem muito pequena e nem muito grande sugerese utilizar de 5 a 20 classes sempre dependendo é claro da quantidade de valores que a observação tem Podemos também usar uma fórmula para o cálculo de uma quantidade ideal para o número de classes k a ser utilizado Essa fórmula envolve diretamente o número de observações n O primeiro passo é encontrar o número de elementos n da nossa fórmula Como na pesquisa apresentada temos 40 elementos isso é o mesmo que dizer que o valor de n é 40 ou seja n 40 colaboradores Para calcularmos o número de classes mais apropriado usaremos a fórmula k 𝑛 isto é o número de classes será a parte inteira da raiz quadrada do número de elementos E como n vale 40 sabemos que k 40 632 mas o número de classes deve ser inteiro então usaremos 6 classes O número de classes pode também ser definido sem utilizar essa fórmula ele pode ser escolhido pela vontade do analisador dos dados Um exemplo disso seria usar as classes de 10 em 10 ou outra escolha qualquer Mas temos que tomar cuidado para não ter muitas classes com poucos elementos em cada classe e nem poucas classes de forma que cada uma tenha muitos elementos e não tenhamos uma identificação de como se comportam os dados isto é a maior parte deles está em qual classe 10 Agora que já temos o número de classes k e sabemos que os dados serão agrupados em 6 grupos podemos calcular o tamanho de cada intervalo de classe que é chamado de amplitude do intervalo de classe e é simbolizado com a letra c Para calcular a amplitude do intervalo de classe precisamos começar calculando um dado que já temos a amplitude total dos dados A isto é a diferença entre o maior valor observado e o menor valor observado Como já havíamos calculado teremos A 208 82 126 mm Agora a análise é simples com base neste valor da amplitude total A vamos obter a amplitude do intervalo de classe c Já que definimos que teremos 6 classes basta dividir a amplitude total pelo número de classes que teremos 𝑐 𝐴 𝑛 126 6 21 𝑚𝑖𝑛 Por mais que essa seja a forma mais usada para esse cálculo outros materiais podem trazer outras formas de calcular a amplitude da classe Agora que já conhecemos a amplitude das classes vamos determinar um a um os intervalos de classe O intervalo de classe é a definição de onde começa e onde termina cada uma delas O limite inferior da primeira classe que tomaremos será o menor valor que temos 82 O limite superior da primeira classe será calculado tomando o limite inferior mais a amplitude da classe isto é 8221 que é igual a 103 Isso significa que calculamos a nossa primeira classe que terá os limites então de 82 a 103 Lembrando que devemos definir se teremos intervalos abertos fechados ou mistos O mais comum é termos intervalos mistos a princípio com o primeiro valor pertencente ao intervalo e o segundo não Assim já podemos obter as outras classes da nossa distribuição basta que somemos a amplitude do intervalo de classe a cada limite inferior Assim teremos 82 103 primeira classe 103 124 segunda classe 124 145 terceira classe 11 145 166 quarta classe 166 187 quinta classe 187 208 sexta classe É interessante criar uma tabela com essas classes e uma coluna para se acrescentar a Frequência Absoluta Quadro 2 Distribuição de frequências do tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa Classes min Frequência Absoluta fa 82 103 103 124 124 145 145 166 166 187 187 208 Fonte elaborado pela autora 2021 Videoaula 2 Agora assista a um vídeo falando como construir essa tabela de frequências Videoaula 2 Agora assista a um vídeo falando como construir essa tabela de frequências Utilize o QRcode para assistir 12 Agora que já montamos a estrutura da tabela precisamos definir se nossa contagem dos elementos será registrada como frequência absoluta fa frequência relativa fr e frequência acumulada fac Vamos entender melhor o que é isso tudo A frequência absoluta fa é registrada quando contamos o número de observações que temos em uma determinada classe isto é vamos verificar quantos dados estão dentro do intervalo numérico ou seja quantos valores há nos nossos dados entre o menor e o maior valor da classe que estamos preenchendo Podemos ter dados que não são numéricos quando a variável for qualitativa por exemplo Nesse caso contamos os casos que pertencem àquela classe qualitativa explicando melhor se a variável for a cor dos olhos e queremos saber quantos são verdes contamos quantos olhos verdes temos nos dados apresentados Nesse exemplo como temos dados numéricos a frequência absoluta será a contagem simples dos elementos que estão dentro do intervalo numérico Quando sabemos a frequência absoluta e o total de dados podemos calcular a frequência relativa e acumulada A frequência relativa fr é calculada a partir da divisão do número de observações fa em uma determinada classe em relação ao total de observações que temos Esta frequência pode ser expressa em termos percentuais Para isto basta multiplicar o resultado da divisão indicada no cálculo da frequência relativa por 100 O cálculo da frequência relativa é feito como já dissemos dividindo a frequência absoluta daquela classe pela quantidade total de observações Essa forma de apresentação de dados a distribuição de frequência pode ser útil se você quiser sintetizar as informações Não sabemos os valores exatos dos dados mas temos uma aproximação interessante e conseguimos tirar conclusões difíceis de outras formas Veja que podemos perceber que a maioria dos nossos dados estão entre 124 e 145 minutos e nos limiares dessa classe Sendo assim um bom plano para atender a esses colaboradores seria um que tivesse a franquia de 150 minutos por exemplo 13 Essa forma de apresentação facilita a visualização desse tipo de característica dos dados Na Tabela apresentada a seguir foram calculadas as frequências fa e fr relacionadas ao tempo de utilização do aparelho celular Quadro 3 Distribuição de frequências do tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa Classes min Frequência Absoluta fa Frequência Absoluta fr 82 103 5 0125 103 124 8 020 124 145 14 035 145 166 5 0125 166 187 5 0125 187 208 3 0075 Total 40 1 Fonte elaborado pela autora 2021 14 Uma pergunta que podemos fazer é quantos dos nossos dados estão acima ou abaixo de um determinado valor Nesse caso vamos além das frequências absolutas e relativas calculando valores acumulados A frequência acumulada que equivale à soma da frequência daquela classe com as frequências de todas as classes menores do que ela é usada para verificar quantos dados temos até a classe que escolhemos No exemplo a seguir temos 32 dados até a classe de 166 minutos Se quisermos interpretar isso de forma percentual vemos na outra coluna que isso representa 80 dos nossos dados Quadro 4 Distribuição de frequência acumulada do tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa Classes min Frequência Acumulada Frequência Acumulada relativa 82 103 5 0125 125 103 124 13 0325 325 124 145 27 0675 675 145 166 32 08 80 166 187 37 0925 925 187 208 40 1000 100 Fonte elaborado pela autora 2021 Como você faria a interpretação da distribuição de frequências Uma das interpretações possíveis dessa tabela de tempos de utilização do celular das 40 pessoas avaliadas em questão é que esses dados estão concentrados na segunda e terceira classes com mais da metade da quantidade total de indivíduos pesquisados Essa utilização vai decrescendo em direção às classes do início e do fim da tabela Além das interpretações a apresentação desses dados na forma de tabela de frequências facilita ainda o cálculo de várias outras medidas estatísticas mas podemos destacar que ela facilita a construção de uma apresentação gráfica E se a variável for qualitativa podemos fazer distribuição de frequências 15 A resposta a essa pergunta é sim podemos construir as distribuições de frequência mesmo usando variáveis qualitativas desde que possamos contar os elementos que possuem os atributos variáveis Vou explicar melhor imagine uma pesquisa sobre o estado civil de uma pessoa A variável estado civil vai receber valores como casado solteiro viúvo que são palavras e não valores numéricos Porém é possível contar quantas pessoas responderam casado ou solteiro Gerando dados de frequência absoluta A tabela é construída listando os valores diferentes encontrados na variável essa é a primeira coluna Depois encontramos a frequência absoluta contando a quantidade de vezes que aparecem os valores listados Vamos tomar como exemplo uma pesquisa para saber o estado civil dos colaboradores de uma empresa Com base nos dados foi construída a seguinte tabela Quadro 5 Distribuição de frequências do número de colaboradores em relação ao seu estado civil em 2020 Estado Civil fa fr Casado 87 058 Solteiro 45 030 Outros 18 012 Total 150 100 Fonte elaborado pela autora 2021 Existem outras formas de apresentar e analisar um conjunto de dados Podemos responder que é claro que sim Há algumas formas de representar tabelas e dados graficamente Isso vai depender é claro também do tipo de variável dos resultados conseguidos e da intenção do apresentador Para cada situação podemos ter um tipo de gráfico mais adequado em alguns casos a tabela é a melhor apresentação e em outros um texto com a conclusão conseguida a partir dos dados é o melhor Se a opção for por gráficos é bom saber que há muitos tipos diferentes histogramas polígonos de frequência ogivas gráficos de setores pictogramas e outros Geralmente os gráficos por apresentarem um aspecto visual atraente permitem uma melhor interpretação dos resultados ou pelo menos uma interpretação mais rápida Há muitas formas manuais e eletrônicas de se construir gráficos mas nosso propósito por enquanto é entendêlos melhor 16 Os histogramas Um grande representante da categoria dos gráficos estatísticos é o Histograma Ele é constituído por um conjunto de colunas com as bases assentadas sobre um eixo horizontal tendo o centro de cada coluna no ponto médio da classe que representa e cuja altura é proporcional à frequência da classe O histograma do nosso exemplo ficaria assim Gráfico 1 Histograma dos minutos das ligações Fonte elaborado pela autora 2021 Veja que como tivemos 5 elementos na classe de 82 a 103 a altura da coluna correspondente é 5 Cada coluna começa onde a outra termina pois os pontos de separação das classes são comuns isto é a primeira classe vai até 103 e a segunda começa no 103 por isso as colunas são encostadas umas nas outras Polígono de frequências O polígono de frequências é um gráfico que se parece muito com o histograma e até podemos dizer que deriva dele por ter a sua construção de uma forma muito parecida com ele Ele é usado para alguns tipos de análises nas quais as frequências das classes são localizadas sobre perpendiculares levantadas nos pontos médios de cada classe Vou explicar de uma forma mais simples o polígono de frequência é obtido pela simples união dos pontos médios dos topos das colunas de um histograma A linha do polígono começa ligada ao limite inferior do lado esquerdo da primeira coluna e termina no eixo x também no que seria o final da última coluna do histograma 17 Gráfico 2 Polígono de Frequências do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora Fonte elaborado pela autora 2021 Videoaula 3 Agora assista a um vídeo falando como construir histogramas e polígonos de frequências Caso os nossos dados sejam de uma variável qualitativa podemos optar por escolher um outro tipo de gráfico para apresentar os resultados o gráfico de setores Ele é popularmente conhecido como gráfico de pizza Sua construção é simples sabese que uma fatia que correspondesse a 100 do valor apresentado deveria ter o tamanho da circunferência toda isto é corresponderia ao setor circular com ângulo de 360º Isso é o mesmo que dizer que 360º equivale a 100 assim para obterse o ângulo do setor cuja área representa um determinado valor basta resolver uma regra de três simples 360º 100 Videoaula 3 Agora assista a um vídeo falando como construir histogramas e polígonos de frequências Utilize o QRcode para assistir 18 xº Freq Relativa Percentual Gráfico 3 do estado civil de pessoas que trabalham em uma determinada empresa Fonte elaborado pela autora 2021 19 Aula 02 Medidas de Tendência Central Ao organizarmos os dados de uma pesquisa podemos representálos por meio de alguns valores que resumem os dados isto é podem servir de parâmetro para indicar como os dados se comportam Esses valores normalmente são encontrados de forma a se aproximarem de uma maneira uniforme de todos os valores encontrados Como essa representação fica muito próxima do centro dos elementos essas medidas são chamadas de medidas de tendência central Vamos ver que podemos calcular essas medidas em relação aos elementos às suas representações em tabelas e em relação às classes montadas Medidas de tendência central Até agora já estudamos formas de organizar dados em tabelas gráficos distribuição de frequências e polígonos de frequência de maneira que podemos sintetizar suas informações visualmente Assim podemos descrever por meio da observação o padrão de variação dos fenômenos estatísticos Existem também outras maneiras de resumir dados de uma variável quantitativa de uma forma diferente das tabelas e gráficos Podemos representar essas informações na forma de um valor numérico que descreve por aproximação todos os valores da variável estudada Videoaula 1 Agora assista a um vídeo falando sobre as medidas que vamos estudar principalmente sobre a média moda e mediana Videoaula 1 Agora assista a um vídeo falando sobre as medidas que vamos estudar principalmente sobre a média moda e mediana Utilize o QRcode para assistir 20 É claro que esse valor acumula um erro em relação aos valores da variável como um todo pois há diferentes valores que são resumidos em um único valor Quando calculamos uma medida como essa a partir de toda a população dos dados podemos chamar de parâmetro e quando calculamos a partir da amostra chamamos de estimadores ou estatísticas pois não temos certeza de que esse valor é preciso em toda a população por melhor que tenha sido escolhida a amostra Essas medidas descritivas ajudam na análise do comportamento dos dados isto é ajudam a descrever para que valores o conjunto todo de dados está rumando Como esses dados podem vir de toda a população ou de uma amostra temos que representar por notações diferentes para cada caso conforme mostra a tabela a seguir Nela resumimos algumas notações para facilitar o entendimento dos cálculos futuros Medidas Parâmetros população Estimadores amostras Número de Elementos N n Média μ 𝑋 Variância σ² S² Desvio Padrão σ S Esses são apenas símbolos mas é importante sabermos que dependendo do símbolo usado já estamos indicando se estamos falando de uma amostra ou da população toda dos dados De um modo geral é interessante sabermos o que essas medidas significam para depois entendermos melhor essa simbologia Além disso podemos classificar essas medidas descritivas como sendo as medidas de posição que podem ser as de tendência central ou as separatrizes as medidas de dispersão as medidas de assimetria e as de curtose Vamos ver cada caso para entender como funcionam Medidas de posição Tendência Central e Separatrizes MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central recebem esse nome por tratar de números que estão posicionados visualmente no centro dos dados apresentados Vou dar um exemplo 21 para ficar mais claro ao falar sobre média aritmética por exemplo estamos calculando um valor que se posicionaria a mesma distância de todos os dados utilizados Pensando em dois dados por exemplo 35 e 67 a média aritmética estaria bem no meio dos dois O número que ficaria bem no meio desses valores é 3567 2 que resulta em 51 51 é a média aritmética entre 35 e 67 Mesmo que tenhamos mais dados a média aritmética sempre vai ser um número central que mantém a mesma distância dos outros dados se pensarmos no conjunto todo e não individualmente Isso é tão verdade que se somarmos as diferenças entre a média aritmética e cada um dos outros dados nessa ordem a soma dará zero É essa característica que faz com que essas medidas sejam chamadas de Medidas de Tendência Central por indicarem um ponto em torno do qual se concentram os dados Este ponto tende a ser o centro da distribuição dos dados A seguir vamos definir as principais medidas de tendência central média mediana e moda Para começar vamos definir melhor a média Na verdade podemos ter várias médias diferentes que podem ser calculadas de diferentes maneiras dependendo do caso a se estudar Por exemplo a média aritmética é um valor que está na mesma distância do conjunto todo de dados se eu tenho um dado isolado muito fora do restante do conjunto esse valor puxa a média para próximo desse valor isolado Isso pode dar uma falsa impressão Vou dar um exemplo Caso calculemos a média entre 5 5 6 66 4 4 4 8 8 e 35 O valor da média será 827 Veja que o valor da média ficou acima de quase todos os dados O valor da média harmônica seria 570 um valor muito próximo dos dados excluindo o valor que está mais longe dos outros O valor da média Geométrica seria 643 um valor mais central para esses dados sem que o valor 35 afetasse tanto a representação Como vimos temos diferentes médias para cada caso Vamos ver quais são os cálculos envolvidos em cada caso 22 Média aritmética Como já vimos anteriormente a média aritmética que podemos representar por 𝑋 é calculado somando todos os valores observados e dividindo pela quantidade de valores Podemos associar esse valor a uma visão geométrica como sendo o centro de gravidade dos valores observados isto é ela representa o ponto de equilíbrio de um conjunto de dados É a medida de tendência central mais utilizada para representar o conjunto de dados observados Normalmente chamamos de x1 x2 x3 e assim por diante os dados e na fórmula eles são chamados de xi isto é o índice i representa a ordem do dado observado o primeiro dado é o índice 1 então xi será o x1 para o primeiro dado o segundo dado será o 2 assim xi será x2 para ele e assim por diante A média é dada por Explicando a média será isto é será o somatório de todos os elementos xi indo de 1 até n que é o último elemento No caso da média que falamos anteriormente seria a soma 444556668835 A primeira parte consiste em somar todos os elementos Depois dividimos por n que é o número de elementos da população e aparece na parte de baixo da fórmula Para os dados amostrais temos n como o número de elementos da amostra Assim nossa média anterior seria 444556668835 11 que resulta no valor 827 que tínhamos encontrado Caso os dados estejam apresentados segundo uma distribuição de frequência tem se Vale lembrar que a distribuição de frequência mostra o elemento xi e a quantidade de vezes que ele aparece que chamamos na fórmula de Fi Assim supondo que na distribuição de frequência tenhamos 23 x F 4 3 5 2 6 3 8 2 35 1 O elemento x1 é o 4 e aparece 3 vezes então F1 é 3 Na fórmula faríamos a multiplicação de xi por Fi x F xiFi 4 3 12 5 2 10 6 3 18 8 2 16 35 1 35 A soma de todos os xiFi que na fórmula é representado por é 1210181635 Essa soma será dividida pelo número de elementos total no nosso caso 11 O resultado será o mesmo 827 Intervalo de classes Videoaula 2 Agora assista a um vídeo explicando a diferença de tratarmos de média conhecendo os valores e quando temos apenas os intervalos das classes 24 Quando precisamos calcular a média pode ser que tenhamos o intervalo de classes definido e não o elemento Vamos imaginar por exemplo uma situação diferente da anterior em que tenhamos muitos valores e que eles sejam representados pela tabela de distribuição de frequências abaixo x F 0 4 6 4 8 12 8 12 11 12 16 8 16 20 2 Nessa distribuição a primeira classe tem valores que vão de 0 a 4 mas não sabemos os valores exatamente se eram 3 ou 15 por exemplo Nesse caso vamos usar o ponto médio de cada classe como xi E usaremos a mesma fórmula Assim teremos como x1 o valor 2 que é o ponto médio de 0 a 4 x2 será 6 que é o ponto médio de 4 a 8 E assim por diante Sendo assim nossa tabela será x F xiFi 0 4 6 26 12 4 8 12 612 72 8 12 11 1011110 12 16 8 148112 16 20 2 18236 Videoaula 2 Agora assista a um vídeo explicando a diferença de tratarmos de média conhecendo os valores e quando temos apenas os intervalos das classes Utilize o QRcode para assistir 25 Veja que nesse caso a média aritmética será obtida a partir de uma ponderação onde os pesos são as frequências absolutas de cada classe e xi é o ponto médio da classe i Somamos então os valores 127211011236342 e dividimos pela quantidade total de valores somando as frequências em que esses valores aparecem 612118239 A média aritmética nesse caso será 342 dividido por 39 que resulta em 877 Como vimos há processos diferentes para cálculo da média aritmética quando temos os elementos soltos as frequências absolutas dos valores e as frequências das classes Porém podemos ter outros cálculos de média que se baseiam nessa última forma dar peso aos dados é a média ponderada veremos posteriormente Propriedades da média aritmética Para identificar a necessidade e a vantagem de se usar a média aritmética vejamos algumas das suas propriedades 1 A média é um valor calculado que depende de todas as observações 2 É única para o mesmo conjunto de dados isto é não admite valores diferentes para os mesmos dados E nem sempre é igual a um dos valores observados 3 A média é afetada por valores extremos muito acima ou muito abaixo em relação aos outros valores observados 4 Por depender de todos os valores observados quando fazemos uma mudança nos dados ela afeta diretamente a média Isto quer dizer que se somarmos um valor a todos os elementos observados a média fica somada desse valor o mesmo acontece se subtrairmos multiplicarmos ou dividirmos todos os valores observados a média também fica subtraída multiplicada ou dividida 5 Se subtrairmos a média de cada valor observado e depois somarmos os resultados encontrados essa soma resultará em zero Σxi 𝑥 0 A propriedade 5 é muito importante para um tema que estudaremos no futuro a definição de variância uma medida de dispersão Também é importante destacar a propriedade 3 que mostra que no caso de dados discrepantes no conjunto dados observados a média aritmética não é uma medida apropriada para representar os dados Neste caso podemos usar uma das outras médias harmônica ou geométrica O ideal é a partir da experiência do pesquisador decidir por uma delas ou pela mediana ou moda 26 Exemplo Vamos calcular a idade média de um grupo de 22 pessoas As idades são 18 18 19 20 20 20 20 21 21 22 22 22 22 23 23 24 26 26 26 32 36 37 a idade média é Assim a idade média dessas pessoas é 235 anos aproximadamente Caso façamos o agrupamento de dados semelhantes teremos xi Fi 18 2 19 1 20 4 21 2 22 4 23 2 24 1 26 3 32 1 36 1 37 1 Podemos fazer xiFi para auxiliar no cálculo da média xi Fi xiFi 18 2 36 19 1 19 20 4 80 21 2 42 22 4 88 23 2 46 24 1 24 26 3 78 32 1 32 27 36 1 36 37 1 37 O cálculo da média será 𝑋 12 1 𝑥𝑖 𝐹𝑖 𝑛 182 191 204 361 371 22 518 22 235 No entanto ao considerar os dados agrupados em classes teremos a seguinte tabela Classes Fi xi xiFi 18 22 9 2 0 180 22 26 7 2 4 168 26 30 3 2 8 84 30 34 1 3 2 32 34 38 2 3 6 72 A média será 𝑋 5 1 𝑥𝑖 𝐹𝑖 𝑛 209 247 283 321 362 22 536 22 2436 Perceba que esta diferença acontece pelo fato de se utilizar os dados sem o conhecimento de seus valores individuais Neste caso tornouse necessário representálos pelos pontos médios de suas respectivas classes resultando numa certa perda de informação Média Harmónica Um valor central existente se baseia na relação entre os inversos dos valores usados para evitar que um deles consiga puxar a média para um valor impreciso Essa é a média harmônica Ela resulta da divisão da quantidade de dados pela soma dos inversos dos dados isto é 28 𝑀é𝑑𝑖𝑎 𝐻𝑎𝑟𝑚ô𝑛𝑖𝑐𝑎 𝑛 1 𝑥1 1 𝑥2 1 𝑥3 1 𝑥𝑛 Média Geométrica Outra forma de evitar o problema de termos valores influenciando mais pesadamente a média é a média geométrica Ela resulta da raiz enésima da multiplicação dos elementos isto é 𝑥1 𝑥2 𝑥3 𝑥𝑛 𝑛 O resultado é um valor entre a média aritmética e a média harmônica A escolha por uma dessas médias é feita pensando em qual é o valor que melhor representa os dados Agora vejamos outros valores que representam o conjunto de dados Moda Você já deve ter ouvido a palavra moda associada ao que a maioria das pessoas gostam ou usam Na matemática a Moda também tem a ver com a maioria porém ela representa os dados observados com o valor que mais aparece no conjunto analisado Isso significa que a moda Mo é o valor que apresenta a maior frequência da variável entre os valores observados Isso é facilmente determinado quando conseguimos observar os valores individualmente e ela também pode ser determinada imediatamente observando se o rol ou a frequência absoluta dos dados vendo aquele valor que tem a maior Fi frequência absoluta Vendo os dados 12 13 13 15 15 15 15 18 18 19 20 21 21 vemos que o dado que mais aparece é o 15 isso significa que esse é o valor da Moda Vendo a tabela de frequências xi Fi 120 12 132 15 135 8 138 9 140 11 29 Veja que o dado que tem maior frequência é o 132 que aparece 15 vezes Sendo assim a Moda é 132 O problema dos intervalos de classe é que não temos um valor que mais se repete Na melhor das hipóteses temos uma classe E quando estamos falando de uma relação de dados apresentada por meio de uma distribuição de frequência de valores agrupados em classes primeiramente é necessário identificar a classe modal isto é a classe que possui maior quantidade de elementos Classe Fi 120 130 20 130 140 25 140 150 18 150 160 30 160 170 11 Nesse caso a classe modal é a que tem 30 elementos Ou seja a classe modal é de 150 a 160 Depois disso a moda é calculada aplicandose a fórmula Onde i é a ordem da classe modal li é o limite inferior da classe modal h é a amplitude da classe modal Fi é a frequência absoluta da classe modal Fi1 é a frequência absoluta da classe anterior à classe modal Fi1 é a frequência absoluta da classe posterior à classe modal No caso apresentado a moda será calculada como sendo 𝑀𝑜 150 103018 30183011 150 1012 1219 150387 15387 É importante destacar que um conjunto de dados pode apresentar todos seus elementos com a mesma frequência absoluta Isso significa que todos os elementos 30 aparecem um mesmo número de vezes neste caso não existirá um valor para a moda essa distribuição de valores é chamada de amodal Também podemos ter dois valores que aparecem o mesmo número de vezes o que se chama de bimodal Se aparecerem três valores o mesmo número de vezes chamase trimodal caso haja muitos valores com o mesmo número de aparições teremos uma distribuição plurimodal O uso da moda é mais indicado quando se deseja obter rapidamente uma medida de tendência central Um outro aspecto que favorece a utilização da moda é que seu valor não é afetado pelos valores extremos do conjunto de dados analisado Exemplo Caso tenhamos uma amostra de idades com a tabela descrita Classes Fi 18 22 9 22 26 7 26 30 3 30 34 1 34 38 2 Ao considerar a distribuição apresentada na Tabela a moda é 𝑀𝑜 18 490 9097 18 49 92 18327 2127 A interpretação é análoga à determinada pontualmente Mediana A palavra mediana vem de ponto médio que é o ponto que está no meio de um segmento de reta A mediana Md é o valor que está na posição central dos valores observados desde que estejam colocados em ordem crescente Caso consigamos dividir o conjunto em duas partes iguais a mediana será ou o valor do meio ou a média entre os valores do meio caso não haja apenas um Vamos pensar nos seguintes valores 12 13 13 15 15 15 15 18 18 19 20 21 21 Como eles já estão em ordem crescente basta pegar o valor do meio Como temos 6 elementos antes e 6 depois do número 15 ele será a mediana 31 Vendo a tabela de frequências abaixo temos 55 elementos xi fi 120 12 132 15 135 8 138 9 140 11 Teremos 27 elementos antes e 27 depois do elemento central Nesse caso será o valor 135 a nossa mediana Caso tenhamos um número par de elementos 11 12 13 13 14 15 17 18 19 19 21 21 Calculamos a média entre os dois elementos centrais nesse caso o 15 e o 17 Sendo assim nossa mediana é o valor 1517 2 isto é 16 Na tabela também xi fi 25 10 27 12 30 8 33 6 35 8 Como temos 44 elementos teremos dois elementos centrais o 27 e o 30 assim a mediana será a média aritmética deles que será 2730 2 que será 285 Com os exemplos dados percebese que a mediana não é influenciada por valores extremos Podemos descrever passos para indicar uma forma para o cálculo da mediana seja qual for o tamanho da amostra O primeiro passo consiste em ordenar as observações em ordem crescente ou decrescente Com isso você vai descobrir o número de elementos da observação n 32 Calcular a posição p que a mediana ocupa no conjunto de dados p n 12 Obter a mediana pela equação Md xIp Fp xIp1 xIp onde Ip é a parte inteira de p e Fp a parte fracionária ou decimal xIp é o valor que está na posição inteira de p xIp1 é o valor que está depois de xIp Vamos exemplificar com os seguintes dados 18 18 19 20 20 20 20 20 20 21 21 22 23 24 25 25 25 26 29 30 35 37 Como são 22 dados temos que p é igual a 22 12 que resulta em 115 xIp é o 11º elemento isto é 21 xIp1 é o 12º elemento isto é 22 Md 21 052221 21 051 Md 21 05 215 Quando falamos em distribuições de frequências em classes o cálculo da mediana é Onde p n2 indica a posição central da série li é o limite inferior da classe que contém a posição central da série h é a amplitude da classe central da série i é a ordem da classe que contém o menor valor de Fai tal que Fai p Fai1 é a frequência acumulada da classe anterior à da mediana Fi é a frequência absoluta da classe que contém a mediana Vamos exemplificar com os dados da tabela abaixo Classes Fi Fa 18 22 9 9 22 26 7 16 26 30 3 19 33 30 34 1 20 34 38 2 22 p 11 li 22 h4 Fai19 Fi 7 Md 22 4119 7 22 42 7 22 8 7 22 114 2314 MEDIDAS SEPARATRIZES A palavra separatriz vem de separação São medidas que separam os dados em porções iguais Podemos ter várias porções as mais usadas são os quartis os decis e os percentis Como o próprio nome sugere os quartis dividem os dados em quatro partes os decis em dez partes e os percentis em cem partes Estas medidas são portanto valores que ocupam posições específicas no conjunto de dados em rol dividindoo em partes iguais Podemos imaginar que os quartis seriam 4 porém não são não Vamos imaginar um segmento de reta Veja que para ele ser dividido em 4 partes iguais temos o ponto inicial o ponto final e precisamos encontrar apenas 3 pontos dentro do segmento Com relação aos dados já sabemos qual é o seu ponto inicial e final precisamos encontrar então 3 pontos quartis dentro dos dados observados O primeiro quartil está exatamente no primeiro quarto dos dados o segundo quartil no segundo quarto que corresponde à metade e por isso equivale à mediana o terceiro e último quartil está no terceiro quarto dos dados Quartil Os quartis dividem o conjunto de dados em quatro partes iguais Descrição dos quartis dados amostrais 34 Decil Os decis dividem o conjunto de dados em dez partes iguais Descrição dos decis dados amostrais Percentil Os percentis dividem o conjunto de dados em cem partes iguais A seguir são apresentados alguns dos percentis mais usados Para os dados apresentados individualmente o cálculo das medidas separatrizes é muito semelhante ao da mediana Pode ser conseguido com a seguinte fórmula 35 xIp é o valor correspondente à posição da parte inteira de p Fp é a parte fracionária de p xIp1 é o valor seguinte ao xIp Quando temos uma distribuição em classes temos um cálculo muito semelhante ao da mediana também E a fórmula para esse cálculo é Nesse caso o valor de p depende da separatriz usada p 𝑛 4 𝑘 com k1 2 3 para determinação dos quartis p 𝑛 10 𝑘 com k1 2 9 para determinação dos decis p 𝑛 100 𝑘 com k1 2 99 para determinação dos percentis h é a amplitude da classe da medida separatriz escolhida li é o limite inferior da classe da medida separatriz escolhida Fai1 é a frequência acumulada da classe anterior a da medida separatriz escolhida Fi é a frequência absoluta da classe da medida separatriz escolhida Videoaula 3 Agora assista a um vídeo falando sobre a utilização das medidas separatrizes Videoaula 3 Agora assista a um vídeo falando sobre a utilização das medidas separatrizes Utilize o QRcode para assistir 36 Encerramento da Unidade Na aula de hoje aprendemos como organizar as informações estatísticas de modo a apresentar dados e tomar decisões de forma adequada Uma das formas de se organizar essas informações é a distribuição de frequências que nos dá uma visão ampla dos dados pesquisados e serve de base para podermos montar gráficos polígonos de frequência e histogramas Após todo esse nosso estudo espero que você consiga apresentar uma coleta de dados com o formato de uma tabela de distribuição de frequências ou um gráfico adequado Também aprendemos como são calculadas e para que servem as medidas de tendência central Além disso vimos como são encontradas e para que servem as medidas chamadas de separatrizes O objetivo da aula de hoje foi mostrar formas de organizar os dados e representálos para facilitar a interpretação da observação feita Referências CASTANHEIRA Nelson Pereira Estatística aplicada a todos os níveis1ª ed Curitiba Intersaberes 2012 UniFil EDUCAÇÃO A DISTÂNCIA UNIFILBR
Send your question to AI and receive an answer instantly
Recommended for you
94
Plano de Aula Estatística - Correlação Linear Simples e Regressão
Métodos Quantitativos Aplicados
UMG
39
Distribuições de Probabilidades e Testes de Hipóteses Estatísticos
Métodos Quantitativos Aplicados
UMG
27
Introducao a Teoria da Medida-Importancia e Aplicacoes em Pesquisas
Métodos Quantitativos Aplicados
UMG
2
Analise de Dados
Métodos Quantitativos Aplicados
UMG
4
Avaliação Formativa - Produção de Texto e Critérios de Avaliação
Métodos Quantitativos Aplicados
UMG
4
AVC-Avaliacao Continua-Folha de Resposta-Criterios de Avaliacao
Métodos Quantitativos Aplicados
UMG
4
AVC-Avaliacao-Continua-Folha-de-Resposta-Criterios-de-Avaliacao
Métodos Quantitativos Aplicados
UMG
3
Analise de Viabilidade Investimento
Métodos Quantitativos Aplicados
UMG
1
Análise da Função Afim do Caminho de um Skatista
Métodos Quantitativos Aplicados
UMG
1
Funcao Afim e Quadratica - Anotacoes de Aula
Métodos Quantitativos Aplicados
UMG
Preview text
Unidade 2 Medidas Quantitativas e suas representações 3 Introdução da Unidade Uma pesquisa nos fornece dados seja ela feita com a população toda ou com uma amostra como vimos nas aulas anteriores O fato é que depois de fazer uma boa pesquisa teremos uma porção de dados estatísticos para analisar Essa análise só será completa se conseguirmos interpretar os dados e tomar decisões acertadas com relação ao assunto da pesquisa feita Isso começa com uma organização desses dados para termos maior ou menor facilidade em interpretálos e passa por destacar informações ou valores que representem adequadamente as variáveis analisadas Esse é o foco dessa unidade de estudos a quantificação adequada a organização dos dados e a descoberta de valores representativos relacionados às informações conseguidas Esse processo é o que chamamos de encontrar Medidas Quantitativas e suas organizações Na disposição de dados que normalmente encontramos é comum que esses valores representativos estejam nos centros de concentração dos dados Explico melhor normalmente podemos escolher valores representando a pesquisa quando descobrimos quais são os intervalos que mais se repetem Para ficar ainda mais claro vou usar um exemplo se em uma pesquisa sobre cores de olhos percebemos que a maior parte dos entrevistados tinham olhos castanhos ou verdes podemos dizer que um valor representativo dessa variável é a cor de olhos castanhos e outro valor representativo é a cor de olhos verdes Essas informações podem ajudar muito a tomar decisões e criar argumentos sobre a pesquisa realizada por isso vamos estudar formas de conseguir tais valores Objetivos Conhecer as principais medidas quantitativas Representar corretamente dados coletados Calcular as medidas de tendência central Interpretar as medidas de tendência central 4 Conteúdo programático Aula 01 Introdução à teoria da medida Aula 02 Medidas de Tendência Central Você poderá também assistir às videoaulas em seu celular Basta apontar a câmera para os QRCodes distribuídos neste conteúdo Pode ser necessário instalar um aplicativo de leitura QRcode no celular e efetuar login na sua conta Gmail 5 Aula 01 Introdução à teoria da medida Como você pôde observar nas aulas anteriores quando os dados estão desorganizados dificultam a interpretação correta e decisiva dos mesmos Essa organização pode começar pela disposição destes dados em um rol Rol é a organização dos elementos numéricos em uma ordem préestabelecida crescente ou decrescente o que aumentaria muito a facilidade de interpretação das informações conseguidas Vamos para um exemplo para montar a tabela a seguir tomamos apenas os dados que desejamos analisar os tempos das ligações anteriormente listados Quadro 1 Tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa dados em rol crescente 82 11 1 13 2 14 2 16 7 87 11 5 13 6 14 2 16 9 90 12 0 13 7 14 4 17 2 98 12 2 13 8 14 6 17 9 10 1 12 2 13 8 15 1 18 3 10 4 12 7 13 8 15 4 18 9 10 6 12 9 14 0 16 1 20 1 10 8 13 2 14 1 16 3 20 8 Fonte elaborado pela autora 2021 Só o fato de estar em uma disposição em ordem crescente nos permite concluir algumas informações importantes como o menor tempo observado que foi de 82 minutos da mesma forma podemos perceber que o maior foi de 208 minutos Essas duas informações já nos dão uma medida que é chamada de amplitude total Amplitude Total 6 corresponde à diferença entre o maior e o menor valor observado em um conjunto de dados que foi da ordem de 126 minutos Essa é uma medida padrão que normalmente é analisada em uma pesquisa Veja que ela nos diz a maior diferença possível entre dois dados encontrados Você pode estar se perguntando o que isso ajuda na interpretação Vou responder a essa questão com uma interpretação possível mas poderíamos ter outras sabemos que os dados estão bem espalhados que não estão concentrados já que o menor dado possível foi 82 minutos mas existe uma diferença de até 126 minutos se compararmos com os outros dados uma diferença maior do que os 82 comentados podemos afirmar então que os dados não estão concentrados próximos a um valor estão bem dispersos Outra coisa interessante da organização em ordem crescente é que como os números próximos ficam agrupados podemos verificar que alguns tempos como 122 min 132 min 138 min e 142 min foram os mais frequentes ou seja os resultados que mais aconteceram na observação Você deve estar se perguntando a essa altura Como organizar os dados de uma forma mais eficiente ainda E como descobrir mais informações com base nesses dados Já vimos algumas vantagens da forma como apresentamos os dados mas podemos complementar essa forma e a análise desse rol montado anteriormente se utilizarmos mais um recurso na organização do conjunto de dados assim você pode representálos de uma forma ainda melhor Essa organização permite analisar a frequência dos dados isto é quantas vezes eles aparecem Além disso os dados próximos podem ser tão parecidos que podem ser considerados em conjunto na contagem da frequência Isso é feito por meio de uma tabela de distribuição de frequências essa nova tabela é construída agrupando dados próximos em classes e é feita a contagem dos dados pertencentes a cada uma dessas classes Vamos entender melhor A ideia dessa nova tabela é agrupar os dados parecidos valores como 120 e 122 na nossa tabela por exemplo que são muito próximos e poderíamos contálos em conjunto Esses valores parecidos podem ser distribuídos em classes intervalos de valores nos quais agrupamos os dados próximos na variável analisada e contar o número de valores contidos dentro do intervalo de cada classe Exemplo se construíssemos uma classe que agrupa os valores entre 108 e 129 minutos temos nos dados apresentados 8 valores que fariam parte dessa classe o próprio 7 108 o 111 o 115 o 120 122 duas vezes o 127 e o 129 Poderíamos dizer que temos então 8 elementos na classe de 108 a 129 É dessa forma que se obtém a frequência de classe A tabela formada pela disposição dos dados agrupados nessas classes em conjunto com as frequências contadas ou calculadas que se chama distribuição de frequências Vamos esmiuçar um pouco mais esse nosso exemplo Se tomarmos a tabela usada a de contagem de tempo em minutos do uso de celulares e o exemplo de se incluir em uma única classe todos os indivíduos que possuam tempo entre 108 e 129 minutos assim a classe irá variar de 108 a 129 minutos Temos que tomar outro cuidado quando construirmos a tabela de distribuição de frequências pois como teremos mais de uma classe na distribuição precisamos identificar cada uma delas para isso devese conhecer o menor valor limitante e o maior valor limitante da classe são esses valores que delimitam o intervalo de classe Por isso dizemos que essa classe é de 108 a 129 Só que temos valores que estão exatamente nesses limites são os tempos exatamente iguais a 108 ou a 129 minutos Ambos pertencem ou não a esta classe A resposta dessa pergunta vem de uma padronização acordada entre os estudiosos da Estatística Não são regras descobertas são criadas Há uma forma já determinada para definir essa resposta para o intervalo de classe vamos dizer se ele é aberto ou fechado Portanto podemos ter exemplo de notação dos diferentes tipos de intervalos Intervalos abertos 108 min 129 min Intervalos fechados 108 min 129 min Podese ter ainda intervalos mistos 108 min 129 min 8 Videoaula 1 Agora assista a um vídeo explicando essa notação Você notou o que tem de diferente em cada forma de representar os intervalos Essa diferença está ligada àquela barra vertical próxima ao número Existem outras formas de se representar esses tipos de intervalo mas vamos nos ater a explicar o que cada uma das formas quer dizer Intervalos abertos os limites da classe inferior e superior não pertencem a ela Seria o caso de nem o 108 e nem o 129 pertencerem a essa classe Intervalos fechados os limites de classe superior e inferior pertencem à classe em questão Seria o caso de tanto o 108 e quanto o 129 pertencerem a essa classe Intervalos mistos um dos limites pertence à classe e o outro não Seria o caso de o 108 pertencer à classe veja que a barra vertical está próxima do 108 já o 129 não pertenceria a essa classe Qual é a diferença então Se usássemos intervalos abertos essa classe teria 6 elementos com intervalos fechados ela teria 8 elementos com intervalos mistos teria 7 elementos Ainda utilizando os dados do nosso exemplo relativo ao tempo de utilização dos celulares vamos construir uma distribuição de frequência e ao longo dessa construção identificar os conceitos presentes nela Calculando uma distribuição de frequências podemos começar a construir a distribuição de frequências determinando o número de classes k que serão usadas para agrupar os dados Até agora tínhamos pensado em uma classe do 108 ao 129 mas ela Videoaula 1 Agora assista a um vídeo explicando essa notação Utilize o QRcode para assistir 9 existe de fato Seriam esses os extremos de uma classe Quantas classes teríamos naquela tabela que usamos de exemplo A resposta para essas perguntas começa pela definição de quantas classes teremos Para que não fique uma quantidade nem muito pequena e nem muito grande sugerese utilizar de 5 a 20 classes sempre dependendo é claro da quantidade de valores que a observação tem Podemos também usar uma fórmula para o cálculo de uma quantidade ideal para o número de classes k a ser utilizado Essa fórmula envolve diretamente o número de observações n O primeiro passo é encontrar o número de elementos n da nossa fórmula Como na pesquisa apresentada temos 40 elementos isso é o mesmo que dizer que o valor de n é 40 ou seja n 40 colaboradores Para calcularmos o número de classes mais apropriado usaremos a fórmula k 𝑛 isto é o número de classes será a parte inteira da raiz quadrada do número de elementos E como n vale 40 sabemos que k 40 632 mas o número de classes deve ser inteiro então usaremos 6 classes O número de classes pode também ser definido sem utilizar essa fórmula ele pode ser escolhido pela vontade do analisador dos dados Um exemplo disso seria usar as classes de 10 em 10 ou outra escolha qualquer Mas temos que tomar cuidado para não ter muitas classes com poucos elementos em cada classe e nem poucas classes de forma que cada uma tenha muitos elementos e não tenhamos uma identificação de como se comportam os dados isto é a maior parte deles está em qual classe 10 Agora que já temos o número de classes k e sabemos que os dados serão agrupados em 6 grupos podemos calcular o tamanho de cada intervalo de classe que é chamado de amplitude do intervalo de classe e é simbolizado com a letra c Para calcular a amplitude do intervalo de classe precisamos começar calculando um dado que já temos a amplitude total dos dados A isto é a diferença entre o maior valor observado e o menor valor observado Como já havíamos calculado teremos A 208 82 126 mm Agora a análise é simples com base neste valor da amplitude total A vamos obter a amplitude do intervalo de classe c Já que definimos que teremos 6 classes basta dividir a amplitude total pelo número de classes que teremos 𝑐 𝐴 𝑛 126 6 21 𝑚𝑖𝑛 Por mais que essa seja a forma mais usada para esse cálculo outros materiais podem trazer outras formas de calcular a amplitude da classe Agora que já conhecemos a amplitude das classes vamos determinar um a um os intervalos de classe O intervalo de classe é a definição de onde começa e onde termina cada uma delas O limite inferior da primeira classe que tomaremos será o menor valor que temos 82 O limite superior da primeira classe será calculado tomando o limite inferior mais a amplitude da classe isto é 8221 que é igual a 103 Isso significa que calculamos a nossa primeira classe que terá os limites então de 82 a 103 Lembrando que devemos definir se teremos intervalos abertos fechados ou mistos O mais comum é termos intervalos mistos a princípio com o primeiro valor pertencente ao intervalo e o segundo não Assim já podemos obter as outras classes da nossa distribuição basta que somemos a amplitude do intervalo de classe a cada limite inferior Assim teremos 82 103 primeira classe 103 124 segunda classe 124 145 terceira classe 11 145 166 quarta classe 166 187 quinta classe 187 208 sexta classe É interessante criar uma tabela com essas classes e uma coluna para se acrescentar a Frequência Absoluta Quadro 2 Distribuição de frequências do tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa Classes min Frequência Absoluta fa 82 103 103 124 124 145 145 166 166 187 187 208 Fonte elaborado pela autora 2021 Videoaula 2 Agora assista a um vídeo falando como construir essa tabela de frequências Videoaula 2 Agora assista a um vídeo falando como construir essa tabela de frequências Utilize o QRcode para assistir 12 Agora que já montamos a estrutura da tabela precisamos definir se nossa contagem dos elementos será registrada como frequência absoluta fa frequência relativa fr e frequência acumulada fac Vamos entender melhor o que é isso tudo A frequência absoluta fa é registrada quando contamos o número de observações que temos em uma determinada classe isto é vamos verificar quantos dados estão dentro do intervalo numérico ou seja quantos valores há nos nossos dados entre o menor e o maior valor da classe que estamos preenchendo Podemos ter dados que não são numéricos quando a variável for qualitativa por exemplo Nesse caso contamos os casos que pertencem àquela classe qualitativa explicando melhor se a variável for a cor dos olhos e queremos saber quantos são verdes contamos quantos olhos verdes temos nos dados apresentados Nesse exemplo como temos dados numéricos a frequência absoluta será a contagem simples dos elementos que estão dentro do intervalo numérico Quando sabemos a frequência absoluta e o total de dados podemos calcular a frequência relativa e acumulada A frequência relativa fr é calculada a partir da divisão do número de observações fa em uma determinada classe em relação ao total de observações que temos Esta frequência pode ser expressa em termos percentuais Para isto basta multiplicar o resultado da divisão indicada no cálculo da frequência relativa por 100 O cálculo da frequência relativa é feito como já dissemos dividindo a frequência absoluta daquela classe pela quantidade total de observações Essa forma de apresentação de dados a distribuição de frequência pode ser útil se você quiser sintetizar as informações Não sabemos os valores exatos dos dados mas temos uma aproximação interessante e conseguimos tirar conclusões difíceis de outras formas Veja que podemos perceber que a maioria dos nossos dados estão entre 124 e 145 minutos e nos limiares dessa classe Sendo assim um bom plano para atender a esses colaboradores seria um que tivesse a franquia de 150 minutos por exemplo 13 Essa forma de apresentação facilita a visualização desse tipo de característica dos dados Na Tabela apresentada a seguir foram calculadas as frequências fa e fr relacionadas ao tempo de utilização do aparelho celular Quadro 3 Distribuição de frequências do tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa Classes min Frequência Absoluta fa Frequência Absoluta fr 82 103 5 0125 103 124 8 020 124 145 14 035 145 166 5 0125 166 187 5 0125 187 208 3 0075 Total 40 1 Fonte elaborado pela autora 2021 14 Uma pergunta que podemos fazer é quantos dos nossos dados estão acima ou abaixo de um determinado valor Nesse caso vamos além das frequências absolutas e relativas calculando valores acumulados A frequência acumulada que equivale à soma da frequência daquela classe com as frequências de todas as classes menores do que ela é usada para verificar quantos dados temos até a classe que escolhemos No exemplo a seguir temos 32 dados até a classe de 166 minutos Se quisermos interpretar isso de forma percentual vemos na outra coluna que isso representa 80 dos nossos dados Quadro 4 Distribuição de frequência acumulada do tempo em minutos de uso de telefone celular por colaboradores de uma determinada empresa Classes min Frequência Acumulada Frequência Acumulada relativa 82 103 5 0125 125 103 124 13 0325 325 124 145 27 0675 675 145 166 32 08 80 166 187 37 0925 925 187 208 40 1000 100 Fonte elaborado pela autora 2021 Como você faria a interpretação da distribuição de frequências Uma das interpretações possíveis dessa tabela de tempos de utilização do celular das 40 pessoas avaliadas em questão é que esses dados estão concentrados na segunda e terceira classes com mais da metade da quantidade total de indivíduos pesquisados Essa utilização vai decrescendo em direção às classes do início e do fim da tabela Além das interpretações a apresentação desses dados na forma de tabela de frequências facilita ainda o cálculo de várias outras medidas estatísticas mas podemos destacar que ela facilita a construção de uma apresentação gráfica E se a variável for qualitativa podemos fazer distribuição de frequências 15 A resposta a essa pergunta é sim podemos construir as distribuições de frequência mesmo usando variáveis qualitativas desde que possamos contar os elementos que possuem os atributos variáveis Vou explicar melhor imagine uma pesquisa sobre o estado civil de uma pessoa A variável estado civil vai receber valores como casado solteiro viúvo que são palavras e não valores numéricos Porém é possível contar quantas pessoas responderam casado ou solteiro Gerando dados de frequência absoluta A tabela é construída listando os valores diferentes encontrados na variável essa é a primeira coluna Depois encontramos a frequência absoluta contando a quantidade de vezes que aparecem os valores listados Vamos tomar como exemplo uma pesquisa para saber o estado civil dos colaboradores de uma empresa Com base nos dados foi construída a seguinte tabela Quadro 5 Distribuição de frequências do número de colaboradores em relação ao seu estado civil em 2020 Estado Civil fa fr Casado 87 058 Solteiro 45 030 Outros 18 012 Total 150 100 Fonte elaborado pela autora 2021 Existem outras formas de apresentar e analisar um conjunto de dados Podemos responder que é claro que sim Há algumas formas de representar tabelas e dados graficamente Isso vai depender é claro também do tipo de variável dos resultados conseguidos e da intenção do apresentador Para cada situação podemos ter um tipo de gráfico mais adequado em alguns casos a tabela é a melhor apresentação e em outros um texto com a conclusão conseguida a partir dos dados é o melhor Se a opção for por gráficos é bom saber que há muitos tipos diferentes histogramas polígonos de frequência ogivas gráficos de setores pictogramas e outros Geralmente os gráficos por apresentarem um aspecto visual atraente permitem uma melhor interpretação dos resultados ou pelo menos uma interpretação mais rápida Há muitas formas manuais e eletrônicas de se construir gráficos mas nosso propósito por enquanto é entendêlos melhor 16 Os histogramas Um grande representante da categoria dos gráficos estatísticos é o Histograma Ele é constituído por um conjunto de colunas com as bases assentadas sobre um eixo horizontal tendo o centro de cada coluna no ponto médio da classe que representa e cuja altura é proporcional à frequência da classe O histograma do nosso exemplo ficaria assim Gráfico 1 Histograma dos minutos das ligações Fonte elaborado pela autora 2021 Veja que como tivemos 5 elementos na classe de 82 a 103 a altura da coluna correspondente é 5 Cada coluna começa onde a outra termina pois os pontos de separação das classes são comuns isto é a primeira classe vai até 103 e a segunda começa no 103 por isso as colunas são encostadas umas nas outras Polígono de frequências O polígono de frequências é um gráfico que se parece muito com o histograma e até podemos dizer que deriva dele por ter a sua construção de uma forma muito parecida com ele Ele é usado para alguns tipos de análises nas quais as frequências das classes são localizadas sobre perpendiculares levantadas nos pontos médios de cada classe Vou explicar de uma forma mais simples o polígono de frequência é obtido pela simples união dos pontos médios dos topos das colunas de um histograma A linha do polígono começa ligada ao limite inferior do lado esquerdo da primeira coluna e termina no eixo x também no que seria o final da última coluna do histograma 17 Gráfico 2 Polígono de Frequências do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora Fonte elaborado pela autora 2021 Videoaula 3 Agora assista a um vídeo falando como construir histogramas e polígonos de frequências Caso os nossos dados sejam de uma variável qualitativa podemos optar por escolher um outro tipo de gráfico para apresentar os resultados o gráfico de setores Ele é popularmente conhecido como gráfico de pizza Sua construção é simples sabese que uma fatia que correspondesse a 100 do valor apresentado deveria ter o tamanho da circunferência toda isto é corresponderia ao setor circular com ângulo de 360º Isso é o mesmo que dizer que 360º equivale a 100 assim para obterse o ângulo do setor cuja área representa um determinado valor basta resolver uma regra de três simples 360º 100 Videoaula 3 Agora assista a um vídeo falando como construir histogramas e polígonos de frequências Utilize o QRcode para assistir 18 xº Freq Relativa Percentual Gráfico 3 do estado civil de pessoas que trabalham em uma determinada empresa Fonte elaborado pela autora 2021 19 Aula 02 Medidas de Tendência Central Ao organizarmos os dados de uma pesquisa podemos representálos por meio de alguns valores que resumem os dados isto é podem servir de parâmetro para indicar como os dados se comportam Esses valores normalmente são encontrados de forma a se aproximarem de uma maneira uniforme de todos os valores encontrados Como essa representação fica muito próxima do centro dos elementos essas medidas são chamadas de medidas de tendência central Vamos ver que podemos calcular essas medidas em relação aos elementos às suas representações em tabelas e em relação às classes montadas Medidas de tendência central Até agora já estudamos formas de organizar dados em tabelas gráficos distribuição de frequências e polígonos de frequência de maneira que podemos sintetizar suas informações visualmente Assim podemos descrever por meio da observação o padrão de variação dos fenômenos estatísticos Existem também outras maneiras de resumir dados de uma variável quantitativa de uma forma diferente das tabelas e gráficos Podemos representar essas informações na forma de um valor numérico que descreve por aproximação todos os valores da variável estudada Videoaula 1 Agora assista a um vídeo falando sobre as medidas que vamos estudar principalmente sobre a média moda e mediana Videoaula 1 Agora assista a um vídeo falando sobre as medidas que vamos estudar principalmente sobre a média moda e mediana Utilize o QRcode para assistir 20 É claro que esse valor acumula um erro em relação aos valores da variável como um todo pois há diferentes valores que são resumidos em um único valor Quando calculamos uma medida como essa a partir de toda a população dos dados podemos chamar de parâmetro e quando calculamos a partir da amostra chamamos de estimadores ou estatísticas pois não temos certeza de que esse valor é preciso em toda a população por melhor que tenha sido escolhida a amostra Essas medidas descritivas ajudam na análise do comportamento dos dados isto é ajudam a descrever para que valores o conjunto todo de dados está rumando Como esses dados podem vir de toda a população ou de uma amostra temos que representar por notações diferentes para cada caso conforme mostra a tabela a seguir Nela resumimos algumas notações para facilitar o entendimento dos cálculos futuros Medidas Parâmetros população Estimadores amostras Número de Elementos N n Média μ 𝑋 Variância σ² S² Desvio Padrão σ S Esses são apenas símbolos mas é importante sabermos que dependendo do símbolo usado já estamos indicando se estamos falando de uma amostra ou da população toda dos dados De um modo geral é interessante sabermos o que essas medidas significam para depois entendermos melhor essa simbologia Além disso podemos classificar essas medidas descritivas como sendo as medidas de posição que podem ser as de tendência central ou as separatrizes as medidas de dispersão as medidas de assimetria e as de curtose Vamos ver cada caso para entender como funcionam Medidas de posição Tendência Central e Separatrizes MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central recebem esse nome por tratar de números que estão posicionados visualmente no centro dos dados apresentados Vou dar um exemplo 21 para ficar mais claro ao falar sobre média aritmética por exemplo estamos calculando um valor que se posicionaria a mesma distância de todos os dados utilizados Pensando em dois dados por exemplo 35 e 67 a média aritmética estaria bem no meio dos dois O número que ficaria bem no meio desses valores é 3567 2 que resulta em 51 51 é a média aritmética entre 35 e 67 Mesmo que tenhamos mais dados a média aritmética sempre vai ser um número central que mantém a mesma distância dos outros dados se pensarmos no conjunto todo e não individualmente Isso é tão verdade que se somarmos as diferenças entre a média aritmética e cada um dos outros dados nessa ordem a soma dará zero É essa característica que faz com que essas medidas sejam chamadas de Medidas de Tendência Central por indicarem um ponto em torno do qual se concentram os dados Este ponto tende a ser o centro da distribuição dos dados A seguir vamos definir as principais medidas de tendência central média mediana e moda Para começar vamos definir melhor a média Na verdade podemos ter várias médias diferentes que podem ser calculadas de diferentes maneiras dependendo do caso a se estudar Por exemplo a média aritmética é um valor que está na mesma distância do conjunto todo de dados se eu tenho um dado isolado muito fora do restante do conjunto esse valor puxa a média para próximo desse valor isolado Isso pode dar uma falsa impressão Vou dar um exemplo Caso calculemos a média entre 5 5 6 66 4 4 4 8 8 e 35 O valor da média será 827 Veja que o valor da média ficou acima de quase todos os dados O valor da média harmônica seria 570 um valor muito próximo dos dados excluindo o valor que está mais longe dos outros O valor da média Geométrica seria 643 um valor mais central para esses dados sem que o valor 35 afetasse tanto a representação Como vimos temos diferentes médias para cada caso Vamos ver quais são os cálculos envolvidos em cada caso 22 Média aritmética Como já vimos anteriormente a média aritmética que podemos representar por 𝑋 é calculado somando todos os valores observados e dividindo pela quantidade de valores Podemos associar esse valor a uma visão geométrica como sendo o centro de gravidade dos valores observados isto é ela representa o ponto de equilíbrio de um conjunto de dados É a medida de tendência central mais utilizada para representar o conjunto de dados observados Normalmente chamamos de x1 x2 x3 e assim por diante os dados e na fórmula eles são chamados de xi isto é o índice i representa a ordem do dado observado o primeiro dado é o índice 1 então xi será o x1 para o primeiro dado o segundo dado será o 2 assim xi será x2 para ele e assim por diante A média é dada por Explicando a média será isto é será o somatório de todos os elementos xi indo de 1 até n que é o último elemento No caso da média que falamos anteriormente seria a soma 444556668835 A primeira parte consiste em somar todos os elementos Depois dividimos por n que é o número de elementos da população e aparece na parte de baixo da fórmula Para os dados amostrais temos n como o número de elementos da amostra Assim nossa média anterior seria 444556668835 11 que resulta no valor 827 que tínhamos encontrado Caso os dados estejam apresentados segundo uma distribuição de frequência tem se Vale lembrar que a distribuição de frequência mostra o elemento xi e a quantidade de vezes que ele aparece que chamamos na fórmula de Fi Assim supondo que na distribuição de frequência tenhamos 23 x F 4 3 5 2 6 3 8 2 35 1 O elemento x1 é o 4 e aparece 3 vezes então F1 é 3 Na fórmula faríamos a multiplicação de xi por Fi x F xiFi 4 3 12 5 2 10 6 3 18 8 2 16 35 1 35 A soma de todos os xiFi que na fórmula é representado por é 1210181635 Essa soma será dividida pelo número de elementos total no nosso caso 11 O resultado será o mesmo 827 Intervalo de classes Videoaula 2 Agora assista a um vídeo explicando a diferença de tratarmos de média conhecendo os valores e quando temos apenas os intervalos das classes 24 Quando precisamos calcular a média pode ser que tenhamos o intervalo de classes definido e não o elemento Vamos imaginar por exemplo uma situação diferente da anterior em que tenhamos muitos valores e que eles sejam representados pela tabela de distribuição de frequências abaixo x F 0 4 6 4 8 12 8 12 11 12 16 8 16 20 2 Nessa distribuição a primeira classe tem valores que vão de 0 a 4 mas não sabemos os valores exatamente se eram 3 ou 15 por exemplo Nesse caso vamos usar o ponto médio de cada classe como xi E usaremos a mesma fórmula Assim teremos como x1 o valor 2 que é o ponto médio de 0 a 4 x2 será 6 que é o ponto médio de 4 a 8 E assim por diante Sendo assim nossa tabela será x F xiFi 0 4 6 26 12 4 8 12 612 72 8 12 11 1011110 12 16 8 148112 16 20 2 18236 Videoaula 2 Agora assista a um vídeo explicando a diferença de tratarmos de média conhecendo os valores e quando temos apenas os intervalos das classes Utilize o QRcode para assistir 25 Veja que nesse caso a média aritmética será obtida a partir de uma ponderação onde os pesos são as frequências absolutas de cada classe e xi é o ponto médio da classe i Somamos então os valores 127211011236342 e dividimos pela quantidade total de valores somando as frequências em que esses valores aparecem 612118239 A média aritmética nesse caso será 342 dividido por 39 que resulta em 877 Como vimos há processos diferentes para cálculo da média aritmética quando temos os elementos soltos as frequências absolutas dos valores e as frequências das classes Porém podemos ter outros cálculos de média que se baseiam nessa última forma dar peso aos dados é a média ponderada veremos posteriormente Propriedades da média aritmética Para identificar a necessidade e a vantagem de se usar a média aritmética vejamos algumas das suas propriedades 1 A média é um valor calculado que depende de todas as observações 2 É única para o mesmo conjunto de dados isto é não admite valores diferentes para os mesmos dados E nem sempre é igual a um dos valores observados 3 A média é afetada por valores extremos muito acima ou muito abaixo em relação aos outros valores observados 4 Por depender de todos os valores observados quando fazemos uma mudança nos dados ela afeta diretamente a média Isto quer dizer que se somarmos um valor a todos os elementos observados a média fica somada desse valor o mesmo acontece se subtrairmos multiplicarmos ou dividirmos todos os valores observados a média também fica subtraída multiplicada ou dividida 5 Se subtrairmos a média de cada valor observado e depois somarmos os resultados encontrados essa soma resultará em zero Σxi 𝑥 0 A propriedade 5 é muito importante para um tema que estudaremos no futuro a definição de variância uma medida de dispersão Também é importante destacar a propriedade 3 que mostra que no caso de dados discrepantes no conjunto dados observados a média aritmética não é uma medida apropriada para representar os dados Neste caso podemos usar uma das outras médias harmônica ou geométrica O ideal é a partir da experiência do pesquisador decidir por uma delas ou pela mediana ou moda 26 Exemplo Vamos calcular a idade média de um grupo de 22 pessoas As idades são 18 18 19 20 20 20 20 21 21 22 22 22 22 23 23 24 26 26 26 32 36 37 a idade média é Assim a idade média dessas pessoas é 235 anos aproximadamente Caso façamos o agrupamento de dados semelhantes teremos xi Fi 18 2 19 1 20 4 21 2 22 4 23 2 24 1 26 3 32 1 36 1 37 1 Podemos fazer xiFi para auxiliar no cálculo da média xi Fi xiFi 18 2 36 19 1 19 20 4 80 21 2 42 22 4 88 23 2 46 24 1 24 26 3 78 32 1 32 27 36 1 36 37 1 37 O cálculo da média será 𝑋 12 1 𝑥𝑖 𝐹𝑖 𝑛 182 191 204 361 371 22 518 22 235 No entanto ao considerar os dados agrupados em classes teremos a seguinte tabela Classes Fi xi xiFi 18 22 9 2 0 180 22 26 7 2 4 168 26 30 3 2 8 84 30 34 1 3 2 32 34 38 2 3 6 72 A média será 𝑋 5 1 𝑥𝑖 𝐹𝑖 𝑛 209 247 283 321 362 22 536 22 2436 Perceba que esta diferença acontece pelo fato de se utilizar os dados sem o conhecimento de seus valores individuais Neste caso tornouse necessário representálos pelos pontos médios de suas respectivas classes resultando numa certa perda de informação Média Harmónica Um valor central existente se baseia na relação entre os inversos dos valores usados para evitar que um deles consiga puxar a média para um valor impreciso Essa é a média harmônica Ela resulta da divisão da quantidade de dados pela soma dos inversos dos dados isto é 28 𝑀é𝑑𝑖𝑎 𝐻𝑎𝑟𝑚ô𝑛𝑖𝑐𝑎 𝑛 1 𝑥1 1 𝑥2 1 𝑥3 1 𝑥𝑛 Média Geométrica Outra forma de evitar o problema de termos valores influenciando mais pesadamente a média é a média geométrica Ela resulta da raiz enésima da multiplicação dos elementos isto é 𝑥1 𝑥2 𝑥3 𝑥𝑛 𝑛 O resultado é um valor entre a média aritmética e a média harmônica A escolha por uma dessas médias é feita pensando em qual é o valor que melhor representa os dados Agora vejamos outros valores que representam o conjunto de dados Moda Você já deve ter ouvido a palavra moda associada ao que a maioria das pessoas gostam ou usam Na matemática a Moda também tem a ver com a maioria porém ela representa os dados observados com o valor que mais aparece no conjunto analisado Isso significa que a moda Mo é o valor que apresenta a maior frequência da variável entre os valores observados Isso é facilmente determinado quando conseguimos observar os valores individualmente e ela também pode ser determinada imediatamente observando se o rol ou a frequência absoluta dos dados vendo aquele valor que tem a maior Fi frequência absoluta Vendo os dados 12 13 13 15 15 15 15 18 18 19 20 21 21 vemos que o dado que mais aparece é o 15 isso significa que esse é o valor da Moda Vendo a tabela de frequências xi Fi 120 12 132 15 135 8 138 9 140 11 29 Veja que o dado que tem maior frequência é o 132 que aparece 15 vezes Sendo assim a Moda é 132 O problema dos intervalos de classe é que não temos um valor que mais se repete Na melhor das hipóteses temos uma classe E quando estamos falando de uma relação de dados apresentada por meio de uma distribuição de frequência de valores agrupados em classes primeiramente é necessário identificar a classe modal isto é a classe que possui maior quantidade de elementos Classe Fi 120 130 20 130 140 25 140 150 18 150 160 30 160 170 11 Nesse caso a classe modal é a que tem 30 elementos Ou seja a classe modal é de 150 a 160 Depois disso a moda é calculada aplicandose a fórmula Onde i é a ordem da classe modal li é o limite inferior da classe modal h é a amplitude da classe modal Fi é a frequência absoluta da classe modal Fi1 é a frequência absoluta da classe anterior à classe modal Fi1 é a frequência absoluta da classe posterior à classe modal No caso apresentado a moda será calculada como sendo 𝑀𝑜 150 103018 30183011 150 1012 1219 150387 15387 É importante destacar que um conjunto de dados pode apresentar todos seus elementos com a mesma frequência absoluta Isso significa que todos os elementos 30 aparecem um mesmo número de vezes neste caso não existirá um valor para a moda essa distribuição de valores é chamada de amodal Também podemos ter dois valores que aparecem o mesmo número de vezes o que se chama de bimodal Se aparecerem três valores o mesmo número de vezes chamase trimodal caso haja muitos valores com o mesmo número de aparições teremos uma distribuição plurimodal O uso da moda é mais indicado quando se deseja obter rapidamente uma medida de tendência central Um outro aspecto que favorece a utilização da moda é que seu valor não é afetado pelos valores extremos do conjunto de dados analisado Exemplo Caso tenhamos uma amostra de idades com a tabela descrita Classes Fi 18 22 9 22 26 7 26 30 3 30 34 1 34 38 2 Ao considerar a distribuição apresentada na Tabela a moda é 𝑀𝑜 18 490 9097 18 49 92 18327 2127 A interpretação é análoga à determinada pontualmente Mediana A palavra mediana vem de ponto médio que é o ponto que está no meio de um segmento de reta A mediana Md é o valor que está na posição central dos valores observados desde que estejam colocados em ordem crescente Caso consigamos dividir o conjunto em duas partes iguais a mediana será ou o valor do meio ou a média entre os valores do meio caso não haja apenas um Vamos pensar nos seguintes valores 12 13 13 15 15 15 15 18 18 19 20 21 21 Como eles já estão em ordem crescente basta pegar o valor do meio Como temos 6 elementos antes e 6 depois do número 15 ele será a mediana 31 Vendo a tabela de frequências abaixo temos 55 elementos xi fi 120 12 132 15 135 8 138 9 140 11 Teremos 27 elementos antes e 27 depois do elemento central Nesse caso será o valor 135 a nossa mediana Caso tenhamos um número par de elementos 11 12 13 13 14 15 17 18 19 19 21 21 Calculamos a média entre os dois elementos centrais nesse caso o 15 e o 17 Sendo assim nossa mediana é o valor 1517 2 isto é 16 Na tabela também xi fi 25 10 27 12 30 8 33 6 35 8 Como temos 44 elementos teremos dois elementos centrais o 27 e o 30 assim a mediana será a média aritmética deles que será 2730 2 que será 285 Com os exemplos dados percebese que a mediana não é influenciada por valores extremos Podemos descrever passos para indicar uma forma para o cálculo da mediana seja qual for o tamanho da amostra O primeiro passo consiste em ordenar as observações em ordem crescente ou decrescente Com isso você vai descobrir o número de elementos da observação n 32 Calcular a posição p que a mediana ocupa no conjunto de dados p n 12 Obter a mediana pela equação Md xIp Fp xIp1 xIp onde Ip é a parte inteira de p e Fp a parte fracionária ou decimal xIp é o valor que está na posição inteira de p xIp1 é o valor que está depois de xIp Vamos exemplificar com os seguintes dados 18 18 19 20 20 20 20 20 20 21 21 22 23 24 25 25 25 26 29 30 35 37 Como são 22 dados temos que p é igual a 22 12 que resulta em 115 xIp é o 11º elemento isto é 21 xIp1 é o 12º elemento isto é 22 Md 21 052221 21 051 Md 21 05 215 Quando falamos em distribuições de frequências em classes o cálculo da mediana é Onde p n2 indica a posição central da série li é o limite inferior da classe que contém a posição central da série h é a amplitude da classe central da série i é a ordem da classe que contém o menor valor de Fai tal que Fai p Fai1 é a frequência acumulada da classe anterior à da mediana Fi é a frequência absoluta da classe que contém a mediana Vamos exemplificar com os dados da tabela abaixo Classes Fi Fa 18 22 9 9 22 26 7 16 26 30 3 19 33 30 34 1 20 34 38 2 22 p 11 li 22 h4 Fai19 Fi 7 Md 22 4119 7 22 42 7 22 8 7 22 114 2314 MEDIDAS SEPARATRIZES A palavra separatriz vem de separação São medidas que separam os dados em porções iguais Podemos ter várias porções as mais usadas são os quartis os decis e os percentis Como o próprio nome sugere os quartis dividem os dados em quatro partes os decis em dez partes e os percentis em cem partes Estas medidas são portanto valores que ocupam posições específicas no conjunto de dados em rol dividindoo em partes iguais Podemos imaginar que os quartis seriam 4 porém não são não Vamos imaginar um segmento de reta Veja que para ele ser dividido em 4 partes iguais temos o ponto inicial o ponto final e precisamos encontrar apenas 3 pontos dentro do segmento Com relação aos dados já sabemos qual é o seu ponto inicial e final precisamos encontrar então 3 pontos quartis dentro dos dados observados O primeiro quartil está exatamente no primeiro quarto dos dados o segundo quartil no segundo quarto que corresponde à metade e por isso equivale à mediana o terceiro e último quartil está no terceiro quarto dos dados Quartil Os quartis dividem o conjunto de dados em quatro partes iguais Descrição dos quartis dados amostrais 34 Decil Os decis dividem o conjunto de dados em dez partes iguais Descrição dos decis dados amostrais Percentil Os percentis dividem o conjunto de dados em cem partes iguais A seguir são apresentados alguns dos percentis mais usados Para os dados apresentados individualmente o cálculo das medidas separatrizes é muito semelhante ao da mediana Pode ser conseguido com a seguinte fórmula 35 xIp é o valor correspondente à posição da parte inteira de p Fp é a parte fracionária de p xIp1 é o valor seguinte ao xIp Quando temos uma distribuição em classes temos um cálculo muito semelhante ao da mediana também E a fórmula para esse cálculo é Nesse caso o valor de p depende da separatriz usada p 𝑛 4 𝑘 com k1 2 3 para determinação dos quartis p 𝑛 10 𝑘 com k1 2 9 para determinação dos decis p 𝑛 100 𝑘 com k1 2 99 para determinação dos percentis h é a amplitude da classe da medida separatriz escolhida li é o limite inferior da classe da medida separatriz escolhida Fai1 é a frequência acumulada da classe anterior a da medida separatriz escolhida Fi é a frequência absoluta da classe da medida separatriz escolhida Videoaula 3 Agora assista a um vídeo falando sobre a utilização das medidas separatrizes Videoaula 3 Agora assista a um vídeo falando sobre a utilização das medidas separatrizes Utilize o QRcode para assistir 36 Encerramento da Unidade Na aula de hoje aprendemos como organizar as informações estatísticas de modo a apresentar dados e tomar decisões de forma adequada Uma das formas de se organizar essas informações é a distribuição de frequências que nos dá uma visão ampla dos dados pesquisados e serve de base para podermos montar gráficos polígonos de frequência e histogramas Após todo esse nosso estudo espero que você consiga apresentar uma coleta de dados com o formato de uma tabela de distribuição de frequências ou um gráfico adequado Também aprendemos como são calculadas e para que servem as medidas de tendência central Além disso vimos como são encontradas e para que servem as medidas chamadas de separatrizes O objetivo da aula de hoje foi mostrar formas de organizar os dados e representálos para facilitar a interpretação da observação feita Referências CASTANHEIRA Nelson Pereira Estatística aplicada a todos os níveis1ª ed Curitiba Intersaberes 2012 UniFil EDUCAÇÃO A DISTÂNCIA UNIFILBR