·

Cursos Gerais ·

Estatística 2

Send your question to AI and receive an answer instantly

Ask Question

Recommended for you

Preview text

UniEnsino CENTRO UNIVERSITÁRIO DO PARANÁ MATERIAL DE APOIO DISCIPLINA Estatística AULA UM Olá pessoal Sou a professora Ana Rita sou formada em Engenharia Mecânica pela Universidade Federal da Bahia e tenho mestrado em Engenharia aqui pela Universidade Tecnológica Federal do Paraná Hoje vamos falar sobre Estatística Começo com um questionamento vocês sabem onde a estatística está presente ela está presente em vários lugares que a gente nem imagina vamos começar a fazer um para ver aonde tá a estatística que a gente nem percebe Por exemplo na eleitoral Vocês se lembram da última eleição Então aparecia uma pesquisa na nos jornais falando que tantos de um de um candidato tinha tantos de voto outros candidatos tinham tanto de voto Vocês sabem como é que foi feita essa pesquisa Então essa pesquisa foi feita com dados estatísticos ou seja vocês sabem que a nossa população brasileira tem em torno de cem milhões de habitantes mas você acha que os cem milhões de habitantes foram consultados para fazer essa não Apenas os dois mil dois mil e poucos dois mil e poucas pessoas foram consultadas e aí foram levantados os dados os dados da de quanto essas pessoas quem essas pessoas escolheriam como candidato e daí foi feito um dado estatístico aí tantos vão votar nessa pessoa tantos vão votar nessa Isso é o total da população Não Mas com a estatística a gente pode pegar esses dados e extrapolar os resultados dele Isso é estatística isso é uma das aplicações da estatística que está no nosso dia a dia e às vezes a gente nem percebe Um outro local que a estatística está que a gente vê todos os dias e a gente nem imagina que tem estatística lá previsão do tempo Então quando os meteorologistas falam a previsão é de vinte de chuva é de cinquenta de chuva como é que eles pegam esses dados Baseado na estatística Então como vocês podem ver a estatística está em várias a gente pode tá tanto nas áreas de humanas quanto na área de matemática física química quanto tá na área também de medicina de saúde Então vamos ver mais um outro local onde a estatística está presente Loteria Loteria é outro local que a estatística está presente Então quando você faz um jogo lá na Megasena por exemplo você faz um jogo você e milhões de pessoas fazem o jogo Aí dá aquela probabilidade Qual é a probabilidade de você ganhar Uma e um milhão um e dez milhões e por aí vai a probabilidade tá dentro também da estatística a loteria é um outro local onde a estatística está presente Já na área de saúde temos os testes dos medicamentos quando o medicamento ele é lançado são feitos testes com um grupo de controle e esse grupo é estendido para o resto da população ou seja são dados estatísticos são dados amostrais é pega uma amostra mais tarde vamos ver o que que é amostra o que a população vamos definir esses termos pegam uma amostra e essa amostra é uma amostra representativa de toda a população o medicamento é testado ali naquela amostra e esse teste ele é extrapolado para o resto da população Então testes de medicamento também a estatística está presente Um outro local que a estatística está presente é na pesquisa de satisfação de clientes Então por exemplo quando a gente compra aqueles a gente utiliza aqueles sites de pôr exemplo de comida Vocês não sei se vocês já utilizaram mas quando a gente utiliza depois que a gente utiliza tem sempre a pesquisa de satisfação Quantos você ficou satisfeito Se você não ficou satisfeito Como é que eles usam esses dados Eles pegam esses dados dessas pessoas fazem um levantamento estatístico de quantos tão satisfeito quantos não estão satisfeitos Então ali também entra a estatística Então como vocês podem ver a estatística está em várias áreas Eu poderia citar mais várias aplicações da estatística mas aí vamos com o passar do tempo aqui da disciplina vamos ver mais outras aplicações da estatística Então até a próxima aula AULA DOIS Hoje vamos ver a introdução à Estatística Vamos ver alguns termos e vamos ver algumas definições O que é estatística A estatística é uma parte da matemática aplicada que fornece métodos para coleta organização descrição análise e interpretação de dados e para utilização dos mesmos na tomada de decisões E o que que é método Existem várias definições para método Vamos utilizar aqui duas definições método é o pelo qual se chega a um determinado resultado ou o método é um procedimento regular explícito e passível de ser repetido para conseguirmos alguma coisa seja material ou conceitual Vamos ver agora as áreas da estatística A grosso modo podemos dividir a estatística em 3áreas estatística descritiva probabilidade e inferência e estatística A estatística descritiva pode ser definida como um conjunto de técnicas destinadas a descrever e resumir dados a fim de que possa tirar conclusões a respeito de características de interesse Em geral utilizamos a estatística descritiva na etapa inicial da análise quando tomamos contato com os dados pela primeira vez Objetivando tirar conclusões de modo informal e direto a maneira mais simples seria a observação dos valores colhidos Entretanto ao depararmos com a grande massa de dados percebemos imediatamente que a tarefa pode não ser simples Para tentar retirar dos dados informações a respeito do sobre estudo é preciso aplicar algumas técnicas que nos permitem simplificar a informação daquele particular conjunto de valores A finalidade da estatística descritiva é tornar as coisas mais fáceis de entender de relatar e discutir Vamos ver agora o que que é probabilidade Então a probabilidade pode ser pensada como a teoria matemática utilizada para estudar a incerteza oriunda de fenômenos que envolvem o acaso Por exemplo jogos de dados e de cartas ou lançamento de uma moeda enquadra enquadramse na categoria do acaso A maioria dos jogos esportivos também é influenciada pelo acaso até certo ponto A decisão de um fabricante de cola de empreender uma grande campanha de propaganda visando aumentar sua participação no mercado a decisão de parar de imunizar pessoas com menos de vinte anos contra determinada doença a decisão de arriscar se atravessar uma rua no meio do quarteirão todas utilizam a probabilidade consciente ou inconscientemente Vamos ver agora o que que a inferência está a inferência estatística é o estudo de técnicas que possibilitam a extrapolação a um grande conjunto de dados Das informações e conclusões obtidas a partir de subconjuntos de valores usualmente de dimensões muito menores Devese notar que se tivermos acesso a todos os elementos que desejamos estudar não é necessário o uso das técnicas de inferência estatística Entretanto elas são indispensáveis quando existe a impossibilidade de acesso a todo o conjunto de dados por razões natureza econômica ética ou física É o caso por exemplo da aula passada que falei sobre a pesquisa eleitoral Então vamos ver as fases do trabalho estatístico O trabalho estatístico inicia na coleta essa coleta pode ser por amostragem ou por senso Com os dados coletados passamos pro tratamento desses dados a apresentação a análise e a conclusão Vamos ver cada um deles especificamente o que que é cada um deles Vamos começar pela coleta Então após definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa forma pela qual os dados serão coletados cronograma de atividades custos envolvidos exame das informações disponíveis delineamento da amostra etecetera o passo seguinte é a coleta dos dados que consiste na busca ou compilação dos dados das variáveis componentes do fenômeno a ser estudado A coleta de dados é direta quando os dados são obtidos diretamente da fonte originária como no caso da empresa que uma pesquisa para saber a preferência dos consumidores para sua marca Ou a coleta dos dados é indireta quando é inferida a partir dos elementos conseguidos pela coleta direta Vamos ver agora os tratamentos dos dados Nada mais é o tratamento dos dados nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação Pode ser manual eletrônica É nessa hora que a gente faz os cálculos A apresentação dos dados Por mais diversa que seja a finalidade que se tem em vista os dados devem ser sob forma adequada Normalmente eles são apresentados sob forma de tabelas ou gráficos ou ambos tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico Vamos ver agora a análise dos resultados e a conclusão Após a apresentação dos dados devemos calcular as medidas típicas convenientes para fazermos uma análise dos resultados obtidos através dos métodos da estatística indutiva ou inferencial e tirarmos desses resultados conclusões e previsões e a conclusão é de é de responsabilidade de um especialista no assunto que está sendo pesquisado que não é necessário estatístico relatar as conclusões de maneira que sejam facilmente entendidas porque se for usar na tomada de decisões Vamos ver agora alguns termos utilizados na estatística o primeiro termo que vamos ver aqui é população O que que é população É uma coleção completa de todos os elementos a serem estudados A amostra amostra é uma subcoleção de elementos extraídos de uma população Senso é a coleção de dados relativos a todos elementos de uma população Parâmetro é a medida numérica que descreve uma característica de uma população e estatística é uma medida numérica que descreve uma característica de uma amostra Vamos ver alguns outros dados alguns outros termos que vamos ver muito aqui daqui para frente dados contínuos resultam de um número infinito de valores possíveis que pode ser associado a pontos em uma escala contínua de tal maneira que não haja lacunas Dados discretos resultam de um conjunto de valores possíveis ou de um conjunto inumerável de valores Dados quantitativos constituem números que representam contagens ou medidas Dados qualitativos podem ser separados em diferentes categorias que se distinguem por alguma característica não numérica a gente tem o seguinte os dados quantitativos as variáveis quantitativas e qualitativas Vamos ver como é que elas se dividem e vamos ver depois alguns exemplos de cada um deles Os dados qualitativos ou dados categóricos ou atributos são aqueles que não são números eles podem ser nominais ou ordinais Nominais é quando são nomes rótulos categorias e não podem estar no esquema ordenado Por exemplo quando a gente faz uma pesquisa e a resposta é sim ou não isso aí é um dado qualitativo ou nominal Dado qualitativo ordinal são dados que podem estar dispostos em alguma ordem mas as diferenças dos valores não podem ser determinadas Por exemplo quando pergunto a cor do cabelo dos alunos de uma classe Você tem o preto o preto mais claro o marrom escuro e aí você pode colocar numa determinada ordem e não é número Quantitativos são números que representam contagens ou medidas Aí tem os quantitativos discretos e contínuos Os discretos são por exemplo número de filhos de uma família Só pode ser números inteiros um dois três quatro não pode ser um e meio contínuos resulto de um conjunto infinito de valores que podem estar associados numa escala contínua por exemplo altura dos alunos de uma classe pode ser um e sessenta um sessenta e um sessenta e dois sessenta e 3e por aí vai Vamos ver alguns exemplos aqui de dados quantitativos e qualitativos Vejam aqui nessa tabela que que a gente tem Exemplo de quantitativo peso de bebês recémnascidos contínuo porque podem ter duzentos gramas trezentas gramas quinhentas gramas por aí vai Número de CDs vendidos no shopping discreto pode ser vendido um dois três 4CDs Dureza dos materiais ferrosos contínuo número de pedestre por minuto numa passarela discreto Altura dos edifícios do centro de uma cidade contínuo Densidade dos fluidos de petróleo contínuo Tempo de aula contínuo Velocidade dos carros de Fórmula um contínuo Número de carros fabricados num determinado mês Discreto número de carros só pode ser um dois três quatro Número de animais do pasto discreto vamos fazer um exercício aqui vejam aqui essa tabela vamos lá cor dos que que vocês acham que é a cor dos olhos Isso qualitativa ordinal Número de filhos de um casal quantitativa discreta Peso dos alunos de uma turma Quantitativa continua Número de alunos de uma escola Quantitativa discreta Altura de um indivíduo Quantitativa contínua Tipo sanguíneo Qualitativa nominal tipo sanguíneo a gente não pode colocar numa ordem tem A B O A B A B O mas esse não tem uma ordem pode ser B O A B por aí vai o sexo masculino e feminino qualitativa nominal Quantidade de livros de uma biblioteca Só pode ser um dois três quatro mil Sempre números inteiros quantitativa discreta Salário dos empregados de uma empresa Quantitativa contínua Estado civil de uma amostra qualitativa nominal casado solteiro mas não tem uma ordem Profissão qualitativa nominal Então ficou bem claro gente o que que são as variáveis discretas contínuas nominais e ordinais Por essa aula aqui é só até a próxima AULA TRÊS Olá pessoal Antes de a gente entrar nos cálculos estatísticos propriamente dito vamos fazer uma revisão sobre razão fração e porcentagem para que vocês tenham uma noção de como vamos fazer os cálculos estatísticos Não se assustem os cálculos são bem simples Vamos começar com uma revisão dessas áreas para vocês já irem se ambientando com estatística Vamos começar com fração Qual é o conceito de fração Fração é um de números naturais com o segundo elemento diferente de zero ou seja temos aqui A sobre B com A pertencente aos números naturais e B pertencente aos números naturais diferentes de 0porque vocês lembram que se a gente tiver um 0no denominador esse número não vai pertencer aos números reais Vamos ver algumas definições de fração temos fração própria imprópria e aparente Fração própria é aquela cujo numerador diferente de 0é menor que o denominador o numerador que o numerador é o número de cima o denominador número de baixo Então tem alguns exemplos aqui dois terços 4quintos doze sobre dezessete por aí vai Fração imprópria É aquela cujo numerador é igual ao denominador menor que ele 5 sobre 2 3 sobre 3 8 sobre 4 etecetera E fração aparente é a fração imprópria cujo numerador é múltiplo do denominador Então 3dividido por 3que dá um 8dividido por que dá dois eteceteras Vamos ver aqui algumas observações sobre as frações Então há notas aqui a fração aparente representa o número natural que é o coeficiente do numerador pelo denominador Assim 8sobre 4representa o número natural dois pois 8dividido por 4igual a dois Se o numerador é zero a fração representa o número zero independente de qual seja o denominador exceto o zero Todo número natural pode ser representado por uma fração com denominador e numerador igual ao número considerado Assim 5pode ser representado por 5sobre um Vamos ver agora o que são frações equivalentes Duas frações são equivalentes quando os produtos do numerador de uma pelo denominador da outra são iguais Exemplo dois terços e 4sextos Assim temos duas vezes 6é igual a 3vezes quatro Logo dois terços é uma fração equivalente a 4sextos Simplificação de frações Simplificar uma fração é obter uma fração equivalente a primeira com termos menores por exemplo se temos dez8sobre trinta se dividirmos os dois termos por 6teremos a fração 3quintos 3quintos é a fração simplificada é a versão simplificada de dez8sobre trinta Vamos ver o que que é fração irredutível Fração irredutível é aquela cujo os termos são números primos entre si isto é não possuem outro divisor comum a não ser o número um essas frações elas já estão na sua forma mínima não podem ser simplificadas reduções de frações ao mesmo denominador calculase o menor múltiplo comum MMC dos denominadores Escrevese como comum das frações o MMC calculado em seguida dividese o MMC por cada um dos denominadores das frações dadas e multiplicase o resultado pelo respectivo numerador Espera aí espera aí que tá muito confuso vamos ver aqui como é que é essa explicação toda em palavras vamos ver em números exemplo vamos reduzir ao mesmo denominador as frações 7sobre oito 3sobre quatro um sobre seis pegamos os denominadores que é oito 4e fazemos o cálculo do MMC O MMC vai dar dois ao cubo vezes três que dá igual a vinte e quatro Daí pegamos esse valor vinte e 4dividimos por oito vinte e 4dividido por oito três 3vezes sete Vinte e 4dividido por quatro seis 6vezes três Vinte e 4dividido por seis quatro 4vezes um E aí temos a fração vinte e um vinte e quatro Dez8vinte e 4e 4vinte e quatro Vamos ver agora a comparação de frações Se quisermos compara ou mais frações devemos reduzilas ao mesmo denominador e lembrar que se duas frações com o mesmo denominador é maior a que tem um maior numerador operações com frações adição e subtração Frações homogêneas conservamse o denominador e adicionamse ou subtraise os numeradores no caso a gente tem um denominador comum já tem o denominador comum mantém o denominador e somam os numeradores Como vocês podem ver aqui nos exemplos Frações são aquelas que têm denominadores diferentes A gente reduz o denominador como a gente viu com MMC e faz a conta em cima ou soma ou subtrai Multiplicação O produto de duas frações é uma fração cujo numerador é o produto dos numeradores e o denominador produto dos denominadores Então se a gente tem duas frações Por exemplo aqui dois terços e 3quintos Multiplica dois vezes 3e multiplica 3vezes cinco Temos a fração 6sobre quinze que ainda pode ser simplificada como a gente viu lá atrás Então fica dois O quociente de duas frações é o produto da primeira pelo inverso da segunda Se temos a divisão por exemplo 4quintos dividido por 5sextos Isso vai ser igual a 4quintos vezes 6quintos Ou seja vamos inverter a segunda fração mantém a primeira e inverte a segunda Então o resultado dá vinte e 4sobre vinte e cinco Na potenciação quando a gente eleva uma fração a um determinado número por exemplo 3sobre dois ao quadrado fazemos o numerador ao quadrado e o denominador também ao quadrado Fazemos a potenciação no tanto no numerador quanto no denominador Então exemplos aqui que fração da semana corresponde a um dia Se uma semana tem 7dias a fração de um dia corresponde a um sétimo Que fração do ano corresponde a dois meses Se um ano tem doze meses a fração de dois meses corresponde a dois sobre doze que simplificando dá um sobre seis Que fração do mês de um ano não bissexto corresponde a uma semana Sabemos que no ano não bissexto o mês de fevereiro tem vinte e 8dias que são 4semanas ou seja vinte e 8dividido por 7igual a quatro Então uma semana do mês de fevereiro corresponde a um quarto 3inteiros quantos quintos são 3inteiros que são é que é o número três corresponde a quinze sobre cinco pois quinze dividido por 5é igual a três Frações decimais São as frações denominadoras são potências de dez exemplo um sobre dez um sobre cem quarenta e dois sobre mil As frações decimais podem ser representadas por outro numeral denominado número decimal O qual é obtido pela seguinte convenção São dadas ao numerador tanto as ordens decimais casas quanto são 0do denominador Vamos ver alguns exemplos aqui um sobre dez é 0 um ou um décimo Um sobre cem 00um centésimo Um sobre mil 000um um milésimo Um sobre dez mil 00um que é um décimo de milésimo Quatrocentos e cinquenta e dois por cem é 4 cinquenta e dois ou seja 4inteiros e cinquenta e dois centésimo Vamos ver agora as razões razões de dois números A razão do número A pelo número B é o quociente exato de A por B Então os números A e B são os termos da razão A é chamado antecedente e B consequente da razão A razão de para doze é 3sobre doze que a gente pode ainda simplificar e ficar um quarto A razão de vinte para 5é vinte sobre 5que é igual a quatro Razão de duas grandezas é o quociente dos números que que expressa essas grandezas Exemplo um automóvel percorre trinta e 6quilômetros com 4litros de álcool A razão entre a distância percorrida e o álcool gasta trinta e 6dividido por 4que dá 9quilômetros por litro Podemos dizer que esse automóvel faz 9quilômetros por litro de álcool ou 9por litro Então porcentagem denominando razões percentuais as razões cujos consequentes sejam iguais a cem Sempre quando a gente tem um denominador cem a gente tem uma característica especial para esse que é a porcentagem É chamado de porcentagem ou percentagem Então temos aqui vinte e 5por cem 4por cem duzentos e doze por cem A razão percentual vinte por cem pode também ser indicada pelo símbolo vinte Lemos vinte Assim quando dizemos que noventa dos alunos de uma classe foram aprovados e se tivesse cem alunos noventa desses alunos teriam sido aprovados Temos noventa que é noventa sobre cem essa foi uma breve revisão paramos utilizar muita porcentagem nas próximas aulas Até a próxima AULA QUATRO Na aula de hoje vamos falar sobre população e amostra Então o que é população O conjunto de entes portadores de pelo menos uma característica comum denominamos população estatística ou universo estatístico Tendo em vista as dificuldades de várias naturezas para observar todos os elementos da população tomaremos para formar um grupo a ser estudado A essa parte proveniente da população em estudo denominamos amostra Uma amostra é um subconjunto finito de uma população Então vamos ver como trabalhamos com população e com amostra Os pesquisadores trabalham com amostras Primeiro porque as populações infinitas só podem ser estudadas através de amostras As populações finitas muito grandes também só podem ser estudadas através de amostras Finalmente todo cuidadoso de uma amostra tem mais valor científico do que o estudo rápido de toda a população Como a gente já viu alguns termos nas outras aulas vamos ver o que são parâmetros e estimativas estatísticas As medidas estatísticas obtidas com base na população são denominadas parâmetros As medidas obtidas com base em amostras são denominadas estimativas Tanto parâmetros quanto estimativos são numéricos a única diferença é o fato de os parâmetros serem obtidos com base na população e as estimativas com base nas amostras Vamos falar agora sobre a amostragem Vamos ver algumas técnicas de amostragem Então as amostragens elas são divididas em e não probabilísticas Existe uma técnica especial a amostragem para recolher amostras que garantam tanto quanto o possível caráter de representatividade do todo que possam ser usados para permitir fazer inferências acerca da população de que originou Quanto mais complexa for amostragem maiores cuidados deverão ser tomados nas análises estatísticas utilizadas Em contrapartida o uso de um esquema de amostragem mais elaborado pode levar a uma diminuição do a amostra necessária para o andar da precisão Antes de escolher a amostra é preciso definir a técnica de amostragem isto é os critérios que serão usados para escolher os elementos da população que constituirão a amostra De acordo com a técnica usada temse um tipo de amostra Como falamos existem duas dois tipos de amostras amostra probabilística e amostra não probabilística Vamos ver agora as técnicas de amostragem probabilística primeiro depois vamos ver as não probabilísticas As probabilísticas são de 3tipos basicamente existe a aleatória simples que equivale a um sorteio lotérico a estratificada onde a população é organizada em grupos ou extratos e a sistemática onde a população é ordenada e escolhida pelos elementos da amostra e é feita periodicamente vamos começar pela aleatória simples Como vimos a aleatória simples equivale a um sorteio lotérico para evitar os possíveis erros com o uso de cartas bolas etecetera existem tabelas especialmente elaboradas chamadas tabelas de números aleatórios De modo que os dez algarismos 0a 9são distribuídos ao caso na nas linhas e colunas Vamos ver a seguir aqui um exemplo de uma tabela de números aleatórios Como vocês podem ver existem vários números várias colunas e várias linhas Então vamos ver agora como é que a gente usa essa tabela como é que a gente faz o levantamento da amostra pelo sistema aleatório simples Para usar uma tabela de números aleatórios devemos Primeiro fazer um uma lista dos números da população Numerar os itens na lista e começar do 0ou do 0um aí fica a escolha da pessoa que tá fazendo a pesquisa Ler os números na tabela de números aleatórios de modo que o número de algarismos em cada um seja igual o número de algarismo do último número de sua listagem Então por exemplo se a gente tem uma lista de um a oitenta o último número tem que ser oitenta que tem dois dígitos Desprezar qualquer número que não corresponda a um número da lista ou que sejam repetições dos números lidos anteriormente Continua o até ter o número desejado de observações Usar os números assim escolhidos para identificar os itens da lista a serem incluídos na amostra Tá complicado né gente Vamos ver um exemplo aqui numérico para vocês entenderem melhor Então exemplo imagine que quinhentos clientes estão cadastrados em sua empresa e você precisa obter uma amostra aleatória de dois dos cadastros Como você usaria a tabela de números aleatórios para extrair essa amostra A solução primeiro o tamanho da amostra duas vezes quinhentos que são dez elementos A gente já lá a porcentagem como é que faz né gente Uso da tabela Depois de numerar os cadastros podemos escolher por exemplo percorrer a última coluna da tabela de cima para baixo lendo os 3primeiros algarismos de cada linha Os números obtidos dessa forma são esses aqui que estão aí na tela Desprezando os números que são maiores do que quinhentos e eventuais repetições devemos tomar para amostra os cadastros de números que estão mostrados aí na tela Vamos ver agora a amostragem sistemática Então quando os da população já se acha ordenados não há necessidade de construir um sistema de referência São exemplos prontuários médicos em hospitais os prédios de uma rua as linhas de produção etecetera Nesse caso a seleção dos elementos que constituíram a amostra pode ser feita por um sistema imposto pelo pesquisador A amostragem sistemática ela é constituída de elementos retirados da população segundo o sistema préestabelecido Exemplo vamos imaginar que clientes que clientes já estão cadastrados em sua empresa e você obter uma amostra aleatória de dois dos cadastros como você obteria uma amostra sistemática Vimos no outro exemplo uma amostra que a gente fez uma amostra uma amostra aleatória simples onde a gente teve que fazer o cadastro Agora a gente já tem os clientes cadastrados Então a amostra do mesmo tamanho de dez tá Para obter amostra podemos dividir 500 por 10 e obter 50 O que é essa divisão Essa divisão é para saber o espaço que a gente tem a distância que a gente tem entre um da amostra e o item seguinte o número da população dividido pelo tamanho da amostra a gente tem o espaço que tem que ter máximo entre uma amostra e outro entre o número da amostra e outra Sorteamos um número entre um e cinquenta inclusive para ser o primeiro cadastro da amostra e a partir desse número contamos cinquenta cadastros e retiramos o último para fazer parte da amostra Precedemos dessa forma até completarmos os dez cadastros da amostra O número sorteado foi o vinte e quatro logo a amostra será vinte e quatro O número seguinte vinte e 4mais cinquenta setenta e quatro O próximo setenta e 4mais cinquenta cento e vinte e quatro O próximo cento e vinte e 4mais cinquenta cento e setenta e 4e assim sucessivamente até chegar no décimo número da amostra a gente tem resumindo que é a amostra sistemática ela se resume o a amostra dela vai ser A A mais K A mais K mais K onde A é o número sorteado e K é a divisão do tamanho da amostra do tamanho da população pelo tamanho da amostra Vamos ver agora a amostragem estratificado Muitas vezes a população se divide em subpopulações denominadas de estratos Como é provável que a característica em estudo dessa população apresente de estratoextrato um comportamento heterogêneo e dentro de cada extrato um comportamento homogêneo convém que o sorteio dos elementos da amostra consideração tais extratos Então a amostra estratificada ela pode ser do tipo uniforme ou proporcional Aqui no exemplo a gente quer estudar a população fumante no México e estipulamos que a idade pode ser um bom critério Dividimos essa população extrato O extrato um é a população mexicana menor de deze9anos corresponde a quarenta e dois4milhões de pessoas o extrato dois é uma população mexicana de vinte a quarenta e 4anos que corresponde a trinta e 76milhões E o 3é a população mexicana maior de quarenta e 4anos que corresponde a vinte e 35milhões e aqui entre parênteses temos a porcentagem no extrato um quarenta e um o extrato dois trinta e 63e o extrato 3vinte e dois7 Se quisermos obter uma amostra de mil elementos e fizermos uma amostra estratificada uniforme teremos que no extrato um vamos pegar trezentos e trinta e 4pessoas no dois trezentos e trinta e 3e no 3trezentos e trinta e três Vocês acham que essa amostra vai representar bem a população Acho que não Porque a gente tem quarenta e um na no primeiro extrato Pegamos praticamente a mesma quantidade de pessoas que no extrato que tem vinte e dois7por cento para resolver isso pegamos a estratificada proporcional considerando esse mesmo exemplo vimos que na amostra estratificada proporcional vamos fazer uma proporção entre o tamanho da amostra e o tamanho da população por exemplo para pro extrato um que tem quarenta e um vamos pegar quarenta e um mil que vai dar quatrocentos e dez pessoas e assim sucessivamente até chegar na terceira amostra esse tipo de amostragem ela dá uma condição muito melhor de se avaliar ou seja a nossa amostra ela vai ser proporcional a nossa população o que vai ter vai ser muito mais representativo a pesquisa Vamos ver agora a amostragem não probabilística temos dois tipos de amostragem não probabilística A amostragem a esmo e amostragem por julgamento Amostragem a esmo é o caso que o pesquisador ele procura ser aleatório sem no entanto utilizar um sorteio aleatório rigoroso Exemplo uma fábrica produz parafusos Queremos fazer uma um teste de qualidade nesse parafuso São todos os parafusos iguais estão todos numa caixa vamos tirar um parafuso dez parafusos dentro dessa caixa de forma aleatória porém sem fazer um sorteio vamos retirar a gente chama que tá retirando a tão qualquer um dos parafusos que o tire vai ter a mesma representatividade que os outros Essa é a amostragem na amostragem por julgamento amostra é colhida na parte da população que é acessível se faz uma distinção entre população objeto aquela que se tem em mente ao realizar o estudo e a população amostrada parte da população que é acessível Se essas duas tiver as mesmas características esse tipo de amostragem vai ser equivalente a uma amostragem probabilística Então por exemplo uma cadeia de restaurante pode querer experimentar uma nova técnica de serviço empregando bandejas com aquecimento Problemas de custo podem fazer com que a experiência se limite a dois restaurantes Os quais podem diferir consideravelmente em termos de tamanho localização critério e lucratividade Ao invés de uma seleção aleatória dos dois locais a ser usado como teste será melhor confiar no conhecimento da administração para fazer tal escolha essa amostra é uma amostra por julgamento a pessoa que é o especialista vai julgar qual é a melhor amostra a ser retirada Até a próxima aula AULA CINCO Olá pessoal Então na aula passada a gente viu população em amostra Agora vamos fazer alguns exercícios para fazer aplicação bem no passo a passo para vocês entenderem bem como vamos aplicar isso Vamos fazer o primeiro exercício Uma cidade X apresenta um seguinte quadro relativo às suas escolas de primeiro grau Obtém uma amostra proporcional estratificada de 120 alunos Então temos o seguinte Na escola A temos 80 alunos do sexo masculino 95 do feminino Na escola B 102 do masculino 120 do feminino Na C 110 do masculino 92 do feminino Na D 134 do masculino 228 do feminino Na E 150 do masculino 130 do feminino E na F 300 do masculino e 290 do feminino Totalizando o número de estudantes do sexo masculino é 876 E do sexo feminino 955 O segundo exercício vamos fazer depois Vamos começar pelo primeiro Em primeiro lugar devemos somar a quantidade total de alunos e temos que a quantidade do sexo masculino são oitocentos e setenta e seis sexo feminino novecentos e cinquenta e cinco somando os dois o total mil oitocentos e trinta e um alunos No segundo passo com essa quantidade de aluno já calculada mil oitocentos e trinta e um fazemos a proporção da amostra ou seja se mil oitocentos e trinta e um corresponde a cem qual a percentagem de cento e vinte alunos ou seja da amostra Daí fazemos uma regra de três Então mil oitocentos e trinta e um está para cem assim como cento e vinte tá para X Temos o seguinte X vezes mil oitocentos e trinta e um é igual a cem vezes cento e vinte e esse valor dá aproximadamente 6e meio por então com a porcentagem calculada agora calculamos cada item da planilha dessa forma Primeiro a gente faz aumenta aqui as colunas da planilha Na planilha masculina vamos fazer o cálculo da porcentagem temos uma amostra calculada e finalmente a amostra final No feminino fazemos a mesma coisa pegamos o item multiplicado pela porcentagem calculada que 6e meio a amostra calculada e a amostra Com a porcentagem calculada calculamos cada ida da planilha Então um exemplo aqui do lado temos que oitenta aqui por exemplo na escola A aqui masculino Temos oitenta vezes 6e meio dividido por cem ou seja 6e meio dá 5 dois Então a amostra calculada que é 5 dois Repetimos esse mesmo cálculo aqui para todos os as escolas do sexo masculino os alunos do sexo masculino e temos a amostra calculada aqui do lado 56 seis 7 quinze 8 sete 9 setenta e cinco deze9e meio Repetimos o mesmo processo para as escolas do sexo feminino Fazemos o cálculo né noventa e 5vezes 6e meio dividido por cem cento e vinte noventa e dois e por aí vai Então temos amostra calculada 6 dois 7 oito 5 noventa e oito catorze oito 8 quarenta e 5e dez8 oitenta e cinco Após os cálculos são encontrados valores decimais mas lembramos que pessoas são variáveis discretas e os números devem ser inteiros É preciso fazer aproximações Então como é que fazemos aproximação não sei se vocês lembram lá da aproximação quando a gente tem um número depois damenor do que cinco aproximamos para baixo maior que 5aproximamos para cima ou seja 5dois aproximamos para cinco 66pra sete 7quinze para sete 87pra nove 9setenta e 5pra dez deze9e meio para vinte isso aqui no sexo masculino obtemos como amostra total dos do masculino cinquenta e oito No sexo fazemos a mesma coisa Pegamos as amostras calculadas e fazemos as aproximações 62 vai virar 6 7 8 5 98 6 14 8 15 8 45 8 e 18 85 19 Totalizando 62 Temos o quê Sessenta e dois mais cinquenta e 8igual a cento e vinte Então com isso obtemos a nossa amostra cada escola vai ter a sua amostra masculina e feminina exemplo na escola A temos vamos pegar 5alunos do sexo masculino e 6alunos do sexo feminino essa vai ser a nossa amostra estratificada das escolas Vamos ver agora o exemplo dois em uma escola oitenta alunos obtém uma amostra de dois alunos para esse exercício podemos utilizar amostragem aleatória simples ou amostragem sistemática vamos resolver pela amostragem aleatória simples utilizando a tabela de números aleatórios os alunos ser numerados de um oitenta primeira parte ou de um a oitenta ou de 0079 aí fica o gosto de cada um Prefiro numerar de 1 a 80 Prefiro utilizar o 1 Escolhemos um critério de pesquisa na tabela Escolhemos nesse caso a quarta coluna da esquerda para direita Então como vocês podem ver aqui na tabela marcado aqui ó de vermelho tá aqui destacado a coluna que nós escolhemos Dessa coluna vamos pegar os dois últimos algarismos Então obtemos aqui os números vinte oitenta e nove vinte e três doze noventa e sete oitenta e seis setenta e sete vinte e um cinquenta e dois noventa e nove trinta quarenta e três vejam que são números aleatórios Depois eliminamos os números maiores que oitenta e quantos sobraram Por exemplo número oitenta e nove Ele é maior que oitenta a gente elimina Noventa e 7eliminado Oitenta e 6também eliminado Noventa e nove eliminado E esses 3últimos eliminamos porque já chegamos ao número que queríamos que é ou seja os doze números que queríamos da amostra Então os que estão marcados em vermelho são aqueles escolhidos como amostra Ficou claro aí gente Entenderam como é que faz os exercícios Até a próxima aula AULA SEIS Olá pessoal Nessa aula nós vamos ver séries estatísticas Então um dos objetivos da estatística é sintetizar os valores que um ou mais variáveis podem assumir para que tenhamos uma visão global da variação dessa ou dessas variáveis E isso ela consegue inicialmente apresentando esses valores em tabelas e gráficos que irão nos fornecer rápida e seguras informações a respeito das variáveis em estudo permitindo determinações administrativas e pedagógicas mais coerentes e científicas Nesta aula nós vamos ver as tabelas e tabela é um quadro que resume um conjunto de observações vamos ver quais são os componentes que as tabelas as tabelas estatísticas devem ter Então ela deve ter os seguintes componentes o título que precede a tabela e explica em poucas palavras o dado em estudo Se for em o caso indica o tempo e o lugar que os dados se referem Cabeçalho especifique o conteúdo de cada coluna Coluna indicadora especifique em cada os valores que os dados podem assumir e o corpo da tabela apresenta a frequência dos dados e a fonte específica entidade o pesquisador ou pesquisadores que forneceram os dados quando esses não foram coletados por você Vamos ver aqui uma figura exemplificando onde é que tá cada um desses componentes aqui no exemplo vocês podem ver que o título tem escrito aqui valor em dólares dos principais produtos que o Brasil vende à Argentina por exemplo No cabeçalho produto e valores em dólares Na coluna indicadora tenho quais são os produtos automóveis veículos de carga autopeças motores etc No corpo da tabela tenho os valores que são justamente os valores que nos interessam Embaixo aqui a fonte que está dizendo que isso foi da revista Época de janeiro de 99 O que são séries estatísticas Denominamos série estatística toda a tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época do local ou da espécie Daí podemos inferir que uma série estatística observamos a existência de 3elementos ou fatores o tempo o espaço e a espécie Então conforme variam dos elementos da série podemos classificála em série histórica geográfica e específica Séries cronológicas temporais ou marchas ou históricas Descrevem os valores da variável em determinado local discriminando segundo intervalos de tempo variáveis Então por exemplo preço do acém no varejo em São Paulo em mil novecentos e oitenta e 9a mil novecentos e noventa e quatro temos os anos aqui de oitenta e 9até noventa e 4e o preço médio do Acém Séries geográficas espaciais territoriais ou de localização Descreve os valores da variável em determinado instante discriminando segundo regiões por exemplo duração média dos estudos superiores em mil novecentos e noventa e quatro Temos alguns países que mostra a parte geográfica E o número de anos Séries ou categóricas descreve os valores da variável em determinado tempo local discriminado segundo especificações ou categorias por exemplo aqui no exemplo dado são rebanhos brasileiros os rebanhos brasileiros ele não é nem temporal nem histórica nem geográfica ele é considerado uma série específica Um outro tipo de série são as conjugadas onde a gente tem duas dois tipos de séries juntos na mesma tabela por exemplo aqui a gente tem os terminais telefônicos em serviço regiões Norte Nordeste Sudeste Sul e CentroOeste e 3anos diferentes aqui a gente tem uma série geográfica juntamente com a série histórica a gente tem localização e tempo essa é uma série conjugada Vamos ver alguns exemplos aqui para ver se vocês pegaram bem essa primeira série aqui ó Produção de borracha natural Ela é uma série cronológica Por que é uma série cronológica Temos os anos lembrando que essa tabela da esquerda é o que vai nos determinar o tipo da série Uma segunda a gente tem aqui a avicultura brasileira espécies galinha galo frango codorna essa não está classificada nem como geográfica nem como histórica nem como temporal ela é uma série específica vacinação contra poliomielite temos as regiões norte nordeste sudeste sul centrooeste e a quantidade de vacinação uma série geográfica que estamos considerando locais específicos Aquecimento de um motor de avião de uma marca X temos o tempo aqui na coluna da esquerda os minutos e a temperatura na coluna da direita Lembrando que a gente determina a série pela coluna da esquerda a coluna da esquerda está dando tempo 0um dois três quatro cinco 6minutos essa é uma série temporal Produção brasileira de aço bruto A gente tem aqui na da esquerda temos os processos oxigênio básico forno EOF e na coluna da direita temos 3colunas temporais essa é uma série conjugada temos uma série específica junto com a série histórica ou temporal Esse aqui é um outro exemplo da série da série conjugada temos os importadores América Latina Estados Unidos e Canadá Europa Ásia e Oceania que seria geográfica e temos aqui a parte temporal cinco noventa noventa e cinco Essa é uma série conjugada Vamos ver o que são dados absolutos e dados relativos Os dados estatísticos resultantes da coleta direta da fonte sem a outra manipulação senão a contagem ou medida são chamados dados absolutos E dados relativos são o resultado da comparação por quociente ou razões que se estabelecem entre os dados absolutos e tem por finalidade realizar ou facilitar as comparações entre quantidades Traduzemse os relativos em geral por meio de percentagens índices coeficientes e taxas Vamos ver alguns exemplos aqui Então considerando a série matrícula nas escolas da cidade A Temos aqui a quantidade número de alunos do primeiro do segundo e do terceiro grau Esses números mostrados na tabela são os números absolutos Então deze9mil duzentos e oitenta e seis mil seiscentos e oitenta e um duzentos e trinta e quatro Vamos calcular as porcentagens dos alunos de cada grau Como é que vamos calcular isso aqui A gente pegar o valor o valor de cada um do primeiro grau por exemplo deze9mil duzentos e oitenta e 6multiplicado por cem dividido pela quantidade total que é vinte e um mil duzentos e um Então temos a porcentagem dessa da do primeiro grau em relação ao total e assim fazemos até nos 3nos 3casos Colocamos acrescentamos mais uma coluna essa tabela colocando a porcentagem Então dessa forma a gente consegue visualizar melhor qual é a de alunos em cada uma das turmas Só com os números absolutos a gente não consegue ter essa visão assim da proporção Essa visão de proporção a gente só consegue ver com a porcentagem Aqui um outro caso que fica bem claro como a porcentagem é importante Na cidade A temos uma determinada quantidade de alunos na cidade B uma determinada quantidade de alunos em cada grau Qual é delas que tem a maior porcentagem de alunos em cada grau Então para saber isso o maior número proporcional que seria a porcentagem para saber para ter essa visão conseguir ver claramente na tabela precisamos calcular as porcentagens de cada um de cada cidade em cada grau Calculando essa porcentagem vemos aqui na tabela já com as porcentagens inclusas que fica bem fácil de ver que eles têm proporcionalmente a mesma quantidade de alunos praticamente a mesma quantidade de alunos Ou seja no primeiro grau a A tem noventa e um a cidade B também No segundo grau a cidade A tem 79por cento na cidade B tem 8por cento que é praticamente a mesma coisa No terceiro grau a cidade A tem um e a cidade B tem um Então fica bem claro a fazer essa comparação depois que a gente coloca as porcentagens Os índices os índices são razões entre duas grandezas tais que uma não inclui a outra Exemplo índice cefálico É o diâmetro transverso do crânio pelo diâmetro longitudinal do crânio vezes cem para dar a porcentagem Consciente idade mental por idade cronológica densidade demográfica população por superfície e alguns índices econômicos também produção per capita consumo per capita renda per capita e receita per capita Os cocientes coeficientes são razões entre o número de ocorrências e o número total por exemplo coeficiente de natalidade Número de nascimentos dividido pela população total Coeficiente de mortalidade número de óbitos pela população total Coeficiente educacional coeficiente de evasão escolar número de alunos evadidos pelo número inicial de matrículas Coeficiente de aproveitamento número de alunos aprovados por número final de matrículas E as taxas são coeficientes multiplicados por uma potência de dez cem ou mil para tornar o resultado mais inteligível Então exemplo de taxa a taxa de mortalidade sempre é multiplicada por mil Mortalidade e natalidade Quando você diz por exemplo que o coeficiente de vamos supor que foi 18 18 vezes 1000 De cada 1000 pessoas 78 morrem por exemplo taxa de natalidade vamos supor que seja 9então de cada mil pessoas 9nascem taxa de evasão escolar ela já é em porcentagem o coeficiente de evasão vezes cem aqui a gente mostra alguns exemplos o estado A apresentou setecentos e trinta e 3mil novecentos e oitenta e 6matrículas na primeira série no início do ano e seiscentos e oitenta e 3mil oitocentos e dezes6no fim O estado B apresentou respectivamente quatrocentos e trinta e 6cento e vinte e 7quatrocentos e doze quatrocentos e cinquenta e sete Qual estado que apresentou maior evasão escolar qual é a taxa de evasão escolar É a quantidade total de matrícula menos a quantidade que ficou no final dividido pela quantidade inicial vezes cem a gente vê que na escola A a gente tem 68por cento de evasão e na escola B 54por cento de evasão Vejam que só com os números absolutos a gente não consegue visualizar essa taxa A gente só consegue visualizar quando coloca em forma de porcentagem Aqui tem um outro exemplo que uma escola registrou em março na primeira série a matrícula de quarenta e a matrícula efetiva em dezembro de trinta e cinco A taxa de evasão é o número de evadidos pelo número de matrícula inicial vezes cem que é quarenta menos trinta e 5sob quarenta vezes cem que dá 5sob quarenta vezes cem que dá doze e meio No segundo aqui calcule a taxa de aprovação de um professor de uma classe de quarenta e 5alunos sabendo que obtiver aprovação trinta e seis É o número de aprovação pelo número de matrícula final vezes cem Então trinta e 6dividido por quarenta e 5vezes cem que vai dar oitenta Até a próxima aula AULA SETE Olá pessoal Vimos a série estatística na aula passada Nessa aula vamos fazer um exerciciozinho para vocês acompanharem como é que vamos calcular como é que vamos trabalhar com as séries estatísticas Vamos fazer o exercício No nosso exercício temos o seguinte Um professor preencheu um quadro enviado pelo departamento acadêmico com os seguintes dados Temos aqui a série a turma o número de alunos no início do ano o número de alunos no final do ano os promovida recuperação ou seja promovidos os aprovados Os retidos sem recuperação foram os reprovados sem recuperação os que ficaram em recuperação os recuperados que passaram na recuperação os não recuperados que foram reprovados na recuperação e o total geral dos aprovados e dos reprovados promovidos que a gente chamou de promovidos aqui são aprovados e retidos são reprovados Perguntase primeiro a taxa de evasão da classe 1C Letra B a taxa de evasão total Na letra C quero saber a taxa de aprovação da classe 1E Na letra D a taxa de recuperação geral Vamos fazer aqui o passo a passo para vocês entenderem vamos começar pela letra A Na letra E peço a taxa de evasão da classe 1C Como vocês podem ver aqui em destaque a classe primeiro C tem o número de alunos em trinta de março eram quarenta e 9o número de alunos em trinta do onze quarenta e dois taxa de evasão é o quê O número de alunos inicial menos o número de aluno que saiu pelo número de aluno que ficou dividido pelo número total vezes 100 Tenho quarenta e 9 menos 42 dividido por 49 vezes 100 que dá 1428 A taxa de evasão da classe 1C foi 1428 Na letra B pedi a taxa de evasão total Aqui em 30 de março tínhamos total cento e vinte cento e noventa e dois alunos e em trinta do onze cento e sessenta e um a taxa de evasão é o cento e noventa e dois menos cento e sessenta e um foram quantos saíram dividido e noventa e dois vezes cem que deu 1614 essa foi a taxa de evasão total contando todas as escovas Na letra C peço a taxa de aprovação da classe 1E Temos o seguinte No dia temos aqui em destaque em trinta do onze a turma primeiro E tinha trinta alunos e foram aprovados trinta que é a aprovação geral Então a taxa de aprovação é trinta dividido por trinta e 5vezes cem que dá 8571 Por fim vamos ver a taxa de recuperação geral Do total de alunos 15 foram para recuperação E destes 8 foram recuperados A taxa de recuperação é 8dividido por 15 vezes 100 que deu 53 33 Ou seja um pouco mais da metade conseguiu recuperar depois da vamos ver um segundo exemplo agora um segundo exercício Então considerando que Minas Gerais em mil novecentos e noventa e dois apresentou esses dados são fornecidos pelo IBGE a população de quinze mil novecentos e cinquenta e 76mil ou seja esse valor gente é dado assim vezes mil significa que são quinze milhões novecentos e cinquenta e 7mil e seiscentos habitantes superfície de quinhentos e oitenta e 6mil seiscentos e vinte e 4quilômetros quadrados duzentos e noventa e dois mil e trinta e seis óbitos noventa e 9281 Quero saber na letra A o índice de densidade demográfica na letra B a taxa de natalidade e na letra C a taxa de mortalidade Vamos começar pelo índice de densidade demográfica Vimos que a densidade demográfica é a população dividido pela área ocupada a minha população é quinze milhões novecentos e cinquenta e 7mil e seiscentos habitantes dividido pela superfície que é quinhentos e oitenta e 6mil seiscentos e vinte e 4quilômetros quadrados Fazendo essa temos que a nossa o índice demográfico é 272 habitantes por quilômetros quadrados Vamos ver agora a taxa de natalidade A taxa de natalidade é a quantidade de nascimentos pela população vezes mil Lembram que a taxa de natalidade é por mil temos taxa de natalidade é duzentos e noventa e dois mil e trinta e 6dividido por quinze milhões novecentos e cinquenta e 7mil e seiscentos vezes mil que dá dez83nascimentos por mil habitantes assim que se lê a taxa de natalidade E vamos ver agora a taxa de mortalidade A de mortalidade a quantidade de óbitos pela população vezes mil a taxa de mortalidade vai ser noventa e 9mil duzentos e oitenta e um dividido por quinze milhões novecentos e cinquenta e 7600 vezes mil que dá 622 óbitos por mil habitantes Vejam que a taxa de natalidade foi bem maior que a taxa de mortalidade até a próxima AULA OITO Oi pessoal Nessa aula vamos falar sobre gráficos estatísticos Vindo na aula passada a importância das tabelas Existem duas formas de representação Ou a gente representa por tabela ou representa por gráficos Então vimos as tabelas agora vamos ver os gráficos O gráfico estatístico é uma forma de apresentação dos dados estatísticos cujo objetivo é de produzir no investigador ou no público em geral uma impressão mais rápida e viva do fenômeno estudo Já que os gráficos falam mais rápido a que é séries por ser visual Então para tornar possível uma representação gráfica estabelecemos uma correspondência entre os termos da série e determinada figura geométrica de tal modo que cada elemento da série seja representado por uma figura proporcional A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil Primeiro simplicidade O gráfico deve ser destituído de detalhes de importância secundária assim como de traços necessários que possam levar o observador a um e morosa ou com erros Também ele deve ter clareza Então ele deve possibilitar uma correta interpretação dos valores representativos do fenômeno estudo E ele deve ter uma grande veracidade ou seja ele deve expressar a verdade sobre o fenômeno estudo Os principais tipos de gráficos são os diagramas os cartogramas e os pictogramas Uma das maneiras da gente fazer os gráficos é utilizando a planilha eletrônica do Excel para fazer o gráfico não é muito complicado O primeiro passo é montar uma tabelinha Aqui tem uma tabela bem simples com alguns números alguns valores depois nós selecionamos esses valores e na coluna inserir e escolhe o gráfico ele vai dar alguns gráficos recomendados e escolhe se o gráfico e faz o gráfico deseja vamos ver aqui os vários tipos de gráfico que a gente utiliza muito na estatística os diagramas os diagramas são gráficos geométricos de no máximo duas dimensões para sua construção fazemos uso normalmente do sistema cartesiano o primeiro é o gráfico em linha ou em curva esse tipo de gráfico se utiliza da linha poligonal para representar a série estatística o gráfico em linha constitui uma aplicação do processo de representação das funções no sistema de coordenadas cartesianas Que a coordenadas cartesianas são dois eixos que se cruzam na origem onde tem o eixo das habilitas ou o eixo do X é o eixo horizontal e o eixo das ordenadas ou o eixo dos Y é o eixo vertical Vamos ver aqui um exemplo de um gráfico em linha normalmente um gráfico sempre quase sempre um gráfico ele é gerado de uma tabela iniciase com uma tabela e da tabela se produz o gráfico aqui nesse exemplo temos a produção brasileira de óleo de dendê onde tem os anos e a isso visto numa tabela e aqui do lado direito temos a representação desse gráfico dessa tabela num gráfico Esse gráfico foi gerado lá na planilha eletrônica do Excel Um outro tipo de gráfico é o gráfico em colunas ou em barras Então ele é a representação de uma série por meio de retângulos dispostos verticalmente em colunas ou horizontalmente em barras Quando em colunas os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados Quando em os retângulos tem a mesma altura e os comprimentos são proporcionais aos respectivos dados Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos Vamos ver alguns exemplos aqui Primeiro exemplo do gráfico em coluna Temos aqui a produção brasileira de carvão mineral uma tabelinha dessa tabela gerou o gráfico Aqui do lado no gráfico a gente consegue visualizar melhor que aqui em oitenta e 9teve uma produção maior e a produção menor aqui em noventa e um Então visto em forma de gráfico a gente consegue visualizar de forma mais rápida a proporção dos dados Um outro exemplo é o exemplo de barras do gráfico de barras No gráfico de barras a gente ele também deriva de uma tabela Na tabela aqui tem exportações brasileiras Então tem aqui os estados e esses valores eles foram transportados para o gráfico Vendo aqui que é a primeira linha aqui a primeira barra que é a de São Paulo mostra como a exportação foi muito maior do que os outros estados A gente consegue visualizar melhor no gráfico os dados estatísticos do que numa tabela O gráfico em colunas ou em barras múltiplas Esse tipo de gráfico é geralmente empregado quando queremos representar simultaneamente dois ou mais fenômenos estudados com propósitos de comparação Vamos ver um exemplo aqui Nesse gráfico de barras a gente normalmente tem duas cores de barras que faz esse contraste para fazer a comparação por exemplo aqui a gente tem as exportações tem os anos aqui e tem dois valores exportações e importação na tabela na tabela a gente consegue não consegue visualizar tanto a proporção entre um e outro já no gráfico que aqui na direita a gente consegue visualizar até a evolução do que aconteceu entre exportação e importação e comparar um com o outro um outro tipo de gráfico são gráficos em setores esse gráfico é construído com base em um e empregado sempre que desejamos ressaltar a participação do dado no total Ele também é chamado de gráfico em pizza O total é representado pelo círculo que fica dividido em tantos setores quanto a são as partes Ele é chamado de gráfico de pizza porque vocês vão ver que ele parece realmente uma pizza Então o exemplo de gráfico em setores Vamos ver um exemplo aqui do gráfico em setores Antes da gente fazer o gráfico às vezes é preciso fazer algum cálculo Claro que se você for fazer o gráfico direto lá na planilha ela já vai fazer direto sem precisar calcular Como é que é feito esse gráfico Então a gente tem o total que corresponde a trezentos e sessenta graus ou a cem né que a gente sabe que o ciclo ele tem trezentos e sessenta graus e cada pedaço ele vai corresponder a um determinado número de graus Esse número de graus é que vai formar fatias da pizza digamos assim Vamos ver um exemplo aqui de um gráfico de pizza ou gráfico em setores Então um exemplo no rebanho suíno no do Brasil temos aqui os valores os estados e as quantidades como a gente viu lá no exemplo anterior dividido aqui no gráfico de ele já dá em porcentagem pode dar em porcentagem pode dar em graus O ideal é que apareça em porcentagem para gente conseguir visualizar melhor Um outro tipo de gráfico é o gráfico polar Esse gráfico é ideal para representar séries temporais cíclicas isto é séries temporais que apresentem seu desenvolvimento determinada periodicidade por exemplo a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia a arrecadação da zona azul durante a semana o consumo de energia elétrica durante o mês ou ano o número de passageiros de uma linha de ônibus ao longo da semana etecetera O gráfico polar faz uso do sistema de coordenadas polares Vamos ver um exemplo aqui de um gráfico polar sobre a precipitação pluviométrica aqui tem a tabela com precipitação pluviométrica nos meses com os milímetros de chuva E aqui do lado direito foi gerado um gráfico polar Esse gráfico também gente é gerado lá pelo Excel de forma bem simples Uma outra forma de representação é a é o cartograma O cartograma é representação sobre uma carta geográfica este gráfico é empregado quando o objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas tem duas aplicações Ele represe lados representa lados absolutos população Nesse caso lançamos mão geral dos pontos em número aos dados e representar dados relativos densidade nesse caso lançamos mão em geral de ou cores Vamos ver aqui um exemplo de um cartograma Temos aqui a população da região sul do Brasil Então temos aqui o Paraná Santa Catarina e Rio Grande do Sul Com a população a área e a densidade Aqui no lado da esquerda a gente tem a população projetada da região sul vejam aqui que tá em com os pontinhos né que é o a localização da população e a densidade no gráfico da direita projetado da região sul do Brasil Temos aqui por quantidade de habitantes Um outro exemplo de cartograma vamos ver aqui Então temos a chuva média mensal Podem ver que tá dividido em cores dizendo onde é que tá chovendo mais onde tá chovendo menos e as temperaturas também as máximas e as mínimas A gente vê muito esses gráficos na no jornal por exemplo quando a gente assiste o jornal e aparece o gráfico da das ou gráfico de onde tá chovendo mais não sei se vocês já viram se não viram preste atenção que esses são gráficos cartográficos Um outro tipo é o cartograma que também é montado em cima de um mapa também para mostrar nesse caso a população Então aqui por exemplo temos o cartograma com o senso de Curitiba Tem aqui mostrando a população onde a população está mais concentrada onde tá menos concentrada Um último tipo de gráfico é o pictograma O pictograma é um gráfico que mostra de figuras representa através de figuras os dados que a gente tá coletando por exemplo aqui a gente tem a população do Brasil em anos e habitantes e vejam que eles tão representado com bonequinhos com pessoas para você conseguir visualizar o tipo de representação que ele tá mostrando Um outro exemplo aqui são os gastos do mês a gente tem celular aí mostra o desenho do celular cartão de crédito desenho do cartão de crédito do carro os desenhos do carro e outros o valor em moeda tá Então esse é um exemplo de um gráfico tipo pictograma Nesse outro exemplo vemos aqui a produção de café açúcar e soja representado com os seus respectivos grãos Último exemplo aqui temos a representação da quantidade de cabeça de boi tá Dos anos representado com literalmente cabeça de boi Esse tipo de gráfico é um gráfico que mostra o elemento que você tá considerando e as quantidades relativas a ele Então por hoje por essa aula é só Até a próxima AULA NOVE Olá pessoal nessa aula nós vamos ver a parte de distribuição de frequência na estatística é uma parte muito importante porque a partir dela vamos conseguir fazer todas as inferências estatísticas necessárias Vamos lá Vamos começar por uma tabela primitiva vamos considerar que vamos pegar as estaturas de quarenta alunos de um colégio e vamos anotar aleatoriamente esses valores Temos aqui uma tabela com quarenta valores que não estão ordenados Essa tabela de tabela primitiva mas não é a melhor forma da gente conseguir arrumar esses valores Para arrumar esses valores é interessante a gente colocar colocálos ou em ordem crescente ou em ordem decrescente Quando a gente faz esse movimento a gente obtém um de dados Vamos ver aqui um exemplo Então vamos supor que aquela tabela aquela mesma tabela dos alunos das estaturas dos alunos foram colocadas agora em ordem Agora está em ordem a gente consegue ver que a menor estatura é um metro e meio e a maior estatura é um metro e setenta e três eles estão em ordem crescente mas essa tabela ainda não é a melhor forma da gente identificar a quantidade de alunos com cada uma das estaturas para isso a gente tem a frequência ou seja vamos supor a estatura é um metro e meio aparece com que frequência Quantas pessoas tem essa estatura A de um metro e setenta que frequência ela ocorre nessa série no exemplo que trabalhamos a variável em questão estatura será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocamos ao lado de cada valor número de vezes que aparece repetido denominamos esse valor de frequência o número de alunos que fica relacionado a um determinado valor da variável Obtemos assim uma tabela recebe o nome de distribuição de frequência como vocês podem ver aqui a gente tem a estatura um metro e meio aparece uma vez por exemplo a estatura um metro e sessenta parece 5vezes A estatura um metro e sessenta e oito aparece duas vezes e por aí vai aqui a gente já tem uma maneira de visualizar melhor Mas o processo dado ainda não é totalmente conveniente já que exige muito espaço mesmo como quando o número de valores é de tamanho razoável Sendo possível a solução mais aceitável pela própria natureza da variável é o agrupamento dos valores em vários intervalos Então desse modo estaremos agrupando os valores da variável e intervalos sendo que em estatística preferimos chamar os intervalos de classes Chamando de frequência de uma classe o número de valores de variáveis pertencente a classe Então os dados da tabela podem ser dispostos como na tabela seguinte denominada distribuição de frequência com intervalos de classe Agora tendo uma classe ou seja quantidade vamos colocar na coluna da esquerda uma determinada quantidade de estaturas e na coluna da direita a frequência que essa classe aparece na série vamos ver aqui o exemplo nessa nesse mesmo exemplo da estatura de quarenta alunos temos o seguinte da estatura de um metro e meio a um e cinquenta e 4foram 4pessoas estão nessa classe de um e cinquenta e 4a um e cinquenta e 89pessoas estão nessa classe e sucessivamente até completar as quarenta pessoas falando sobre classe vamos ver agora os elementos de distribuição de classe Primeiro é a classe A classe de frequência ou simplesmente classe são intervalos de variação da variável as classes são representadas simbolicamente pela letra I o I minúsculo que é um dois 3K onde K é um número total de classe da distribuição as classes elas têm um valor inferior e um valor superior Esses são chamados de limites de classe Então denominase os limites de classe os extremos de cada classe O número menor é o limite inferior e o maior é o limite superior representado por L minúsculo limite inferior e L maiúsculo limite superior O número de classe de uma série O número de classe de uma série ele pode ser calculado Tem uma formulazinha para calcular o número que vamos utilizar para classe Então o número de classe chamado de cá classe chamada de I não existe regra fixa pá se determinar o número de classe mas a gente tem uma formulazinha que dá uma um indicativo de quanto que vamos utilizar em cada classe É chamado da regra de que nos dá o número de classe em função do número de valor da variável Então por exemplo K é um mais 33vezes o logarítmo de N onde N é o número de itens que compõe a amostra Só que para quando o K é igual a cinco quando o meu número de menor que vinte e 5e K é igual a raiz de N para N maior que vinte e cinco A gente pode utilizar essas duas formas a fórmula de baixo ela é mais simples exemplo considerando o exemplo anterior N é igual a quarenta pela fórmula de a gente tem K é igual a um mais 33vezes o logarismo de quarenta que dá 6 vinte e oito K aproximadamente igual a seis E adotando K igual a raiz de N temos K igual a raiz de quarenta que é aproximadamente 63com K igual a seis Chegamos mais ou menos no mesmo valor com as duas fórmulas Vamos ver outros elementos da distribuição de classe Temos a amplitude de um intervalo de classe A amplitude ela é a diferença entre o limite superior e o limite inferior ou seja é o tamanho da classe Então a amplitude e o intervalo de classe é a medida do intervalo que define a classe Que é chamada de H H vai ser o L que é o limite superior classe o L maiúsculo menos o L minúsculo e o limite inferior da classe A amplitude total da distribuição A amplitude total que é chamada de AT é a diferença entre o limite superior da última classe limite superior máximo e o limite inferior da primeira classe ou seja o menor valor é o maior valor menos o menor valor Nesse exemplo que a gente deu a gente viu que o maior valor ou seja o limite superior da última classe é um 74e o limite da primeira classe é um 5zero Então um 74menos um 5zero dá vinte e quatro A amplitude total da distribuição vinte e 4centímetros Um outro dado é a amplitude amostral Amplitude amostral é a diferença entre o valor máximo e o valor mínimo da amostra Então a gente tem no exemplo o apesar da classe ter o valor de cento e setenta e quatro o nosso valor máximo da distribuição é um 7três que não tem ninguém com o valor de um 7quatro Um 74é o tamanho da classe E o valor mínimo coincidiu com o valor mínimo da série que é um 5zero Então a amplitude amostral é de vinte e 3centímetros O ponto médio de uma classe O ponto médio de uma classe é como o próprio nome indica o ponto que divide o intervalo da classe em duas partes iguais O ponto médio da classe vai ser o limite inferior mais o limite superior dividido por dois No nosso exemplo aqui a gente tem por exemplo na segunda classe a gente tem um 54mais um 58por dois que vai dar um 5meia Esse é o ponto médio da classe Aí o tipo vamos ver agora os tipos de frequência Frequência simples ou absolutas que é representada pela letra minúscula F I são os valores que realmente representam o número de dados de cada classe Temos a frequência relativa que são os valores das razões entre as frequências simples e a frequência total Então a frequência relativa é a frequência da classe dividido pelo somatório de todas as frequências Por exemplo a frequência do da classe 3então é onze que é a frequência da classe dividida por quarenta que é a frequência total que dá 0 dois 7cinco Um outro tipo de frequência é a frequência acumulada A frequência acumulada representada pela letra F maiúsculo FI que é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma classe por exemplo na primeira frequência a gente tem o valor da frequência na segunda vai ser a primeira mais a segunda na terceira vai ser a primeira mais a segunda mais a terceira e assim sucessivamente até chegar na última Normalmente sempre a última frequência acumulada vai ser igual ao total das frequências Um outro tipo é a frequência acumulada relativa Representada pela letra F maiúsculo R minúsculo a frequência acumulada relativa é a frequência relativa frequência acumulada dividido pelo somatório das frequências Por exemplo você tem uma frequência acumulada de vinte e quatro dividido por quarenta que é o somatório das do total da frequência Então da 0 sessenta Aqui vamos uma tabelinha com o resumo desses dados vamos ver aqui nas tabelas nessa tabela um exemplo de quanto como é que é representado como é que é distribuído esses valores Então na primeira coluna temos valor de I que é o número da classe Na segunda coluna temos as classes na terceira coluna a frequência simples Na próxima coluna temos os pontos médios de cada classe Depois a gente tem a frequência relativa em relação a cada classe Na subsequente a gente tem F maiúsculo I que é a frequência acumulada e por último a frequência acumulada relativa temos também a distribuição de frequência sem intervalo de classe ou seja quando a variável é discreta a gente tem uma distribuição de frequência porém sem intervalo de classe com números fixos pessoal na aula de hoje vimos a parte de distribuição de frequência como é que elas se relacionam como é que elas são representadas numa tabela Até a próxima aula AULA DEZ Olá pessoal Na aula passada vimos a parte da distribuição de classe Nessa aula nós vamos fazer uma aplicação Vamos fazer um exercício com todo o passo a passo para vocês verem como é que vamos fazer essa distribuição de classe na prática Vejam o que a gente tem aqui as colunas A primeira coluna é o número das classes a segunda são as estaturas que vamos dividir em classes depois vem a frequência simples o ponto médio a frequência relativa a frequência acumulada e a frequência acumulada relativa Vamos ver o passo a passo Primeiro nós vamos anotar os valores das alturas desses alunos Então vamos lá Vamos anotar aqui vamos dar nomes fictícios E os as dos alunos Então temos aqui Maria tem um metro e cinquenta e oito Joana tem um metro e sessenta e cinco Felipe tem um metro e oitenta e dois Gabriel tem um metro e oitenta e oito Rafael um metro e setenta e dois Milena um e sessenta e dois Rafaela um e sessenta e três Gabriela um e sessenta e três Ana um e sessenta e sete João um e setenta e cinco José um e Fabiana um e sessenta e 7e Gabriela um e sessenta e oito Temos aqui valores que não estão ordenados Podemos ver que elas não estão ordenadas essas alturas que estão destacadas que a altura de Maria e de Gabriel são as que vão determinar a amplitude da amostra como as variáveis elas são quantitativas contínuas é preciso separálas em classes Vimos lá na aula de distribuição de classe que quando o de elementos é menor que vinte e cinco que é o nosso caso que são 3elementos o número de classes deve ser cinco Pra saber o número de elementos de cada classe precisamos calcular a amplitude da amostra que é o maior valor menos o menor valor E vimos que o maior valor foi um oitenta e 8e o menor valor foi um e cinquenta e oito Então fazendo um e oitenta e oito menos um e cinquenta e oito temos o valor de seis que será o número de elementos de cada classe Com esses valores nós vamos preencher as duas primeiras colunas da planilha Então temos os números de classe que são 5classes que vimos aqui e preenchemos as estaturas Vemos aqui na primeira classe temos de um e cinquenta e 8a um e sessenta e quatro Na segunda classe de um e sessenta e 4pra um e setenta Veja que um e sessenta e quatro menos um e cinquenta e 8igual a seis um e setenta menos um e sessenta e 4igual a 6e assim sucessiva considerando que vamos ter cada classe vai ter amplitude de seis Então com as classes definidas vamos agora preencher as demais colunas Vamos lá no passo a passo Vimos aqui o seguinte vamos lá naquela tabela e vamos descobrir quantas pessoas tem em cada classe Então vimos o seguinte que na primeira classe de um e cinquenta e 8a um e sessenta e quatro temos 4alunos na segunda também quatro na terceira temos três na quarta não temos um e na quinta temos dois totalizando treze que é o número de nossos elementos Vamos agora pro próximo passo que é calcular o ponto médio das classes Como calculamos esse ponto Pegamos o limite superior mais o limite inferior e dividimos por dois ou seja é a média entre eles na primeira na primeira classe o ponto médio um meia um na segunda um meia 7e assim sucessivamente AULA ONZE Oi pessoal Nessa aula nós vamos ver a representação gráfica de frequência Os tipos de gráficos que tem o gráfico da frequência o gráfico tipo polígono o gráfico tipo histograma Vamos lá então A distribuição de frequência ela pode ser representada graficamente pelo histograma pelo polígono de frequência e pelo polígono de frequência acumulado Construímos qualquer um dos gráficos mencionados utilizando o primeiro quadrante do sistema de eixos coordenados cartesiano ortogonais ou seja os eixos X e Y Na linha horizontal colocamos os valores da variável e na linha vertical o eixo das ordenadas as frequências Vamos começar pelo histograma O histograma é formado por um conjunto de retângulos justapostos cujas bases se localizam sobre o eixo horizontal de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe As larguras dos retângulos são iguais as amplitudes dos intervalos de classe As alturas dos retângulos devem ser proporcionais as frequências das classes sendo a amplitude intervalos iguais Isso nos permite tomar as alturas numericamente iguais as frequências Vamos ver um exemplo aqui do histograma tendo esse exemplo que a gente já viu na aula passada as estaturas que vai de um e cinquenta a um e setenta e quatro Temos aqui as classes e as frequências Vejam aqui por exemplo na primeira a primeira a primeira classe que vai de cento e cinquenta a cento e cinquenta e 4e a frequência quatro aqui no eixo das do X No eixo das abcissas temos a distância aqui temos as classes tá Os limites das classes e no eixo das nos eixos das ordenadas aqui no eixo dos Y temos as frequências Então a classe que vai de cento e cinquenta a cento e cinquenta e 4tem a frequência 4e assim sucessivamente O histograma ele gosta de uma propriedade da qual faremos considerável uso A área de histograma é proporcional a soma das frequências Então no caso de usarmos as frequências relativas obtemos um braço gráfico de área unitária Quando queremos comparar duas distribuições o ideal é fazêlo pelo histograma de frequências relativas Vamos ver agora o polígono de frequência O polígono de frequência é um gráfico de linha sendo as frequências marcadas sobre perpendiculares ao eixo horizontal levantada pelos pontos médios dos intervalos de classe Para realmente obtermos um polígono uma linha fechada devemos completar a figura ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da a última da distribuição Conforme vamos ver aqui no exemplo Tendo aqui a as estaturas aquelas mesmas estaturas que a gente viu com as frequências de cada classe e os pontos médios agora a gente pega os pontos médios das classes Então veja que na primeira classe o ponto médio é cento e cinquenta e dois 152 é relativo a 4 que é a frequência dessa classe Vemos que aqui na classe anterior temos aqui seria uma classe supostamente anterior classe não existe seria cento e quarenta e 8e a frequência dela seria zero A mesma coisa na frequência posterior que seria depois da cento e setenta e dois seria uma sétima classe que não existe onde o ponto médio é cento e setenta e 6e a frequência é zero Vejam que nessa representação gráfica temos um polígono fechado Se não considerarmos a frequência anterior e a frequência posterior o polígono seria aberto Vamos ver um outro exemplo aqui Então no caso de termos uma variável essencialmente positiva cuja distribuição se inicia no zero devemos considerar o intervalo anterior localizado no sem eixo negativo Porém consideraremos apenas a parte positiva do segmento que liga o ponto médio desse intervalo com a frequência do intervalo zero temos aqui na primeira classe que vai de 0até dois a frequência é um marcamos aqui o ponto médio entre 0e dois que é né e aqui a frequência tá aqui em um Porém para poder fecharmos o polígono temos que pegar a frequência anterior que seria de vamos supor que seja de menos dois até zero De 2 até 0 tem o ponto aqui no centro e vai ter a frequência 0 mas vamos considerar só a parte positiva A mesma coisa da frequência posterior que vai de nove aqui de 8a dez de dez a doze Então seria até tão seria o ponto médio que seria o onze para que o polígono fique fechado precisamos fazer essa extrapolação para depois e fazer uma interpolação para antes Vamos ver agora o polígono de frequência acumulado Então o polígono de frequência acumulada é traçado marcandose as frequências acumuladas sobre ao eixo levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe Agora pegamos os intervalos superiores que é o cento e cinquenta e quatro cento e cinquenta e oito cento e sessenta e dois cento e seis cento e setenta cento e setenta e 4e a frequência acumulada em cada uma dessas classes Então no caso aqui na primeira classe quatro na segunda treze Na terceira vinte e 4e aí sucessivamente Vamos ver que vamos ter uma curva ascendente E não mais uma curva fechada como das frequências simples Vamos ver agora um caso onde a distribuição não é separada em classes Então uma distribuição de frequência sem intervalo de classe é representada por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional a respectiva frequência Assim para distribuição da tabela temos a gente tem uma tabela aqui onde tem os valores da os valores da do ponto médio os valores da frequência e da frequência acumulada vemos aqui a os valores certo Aqui da dos pontos médios e da frequência inicial Essa curva gente viu do polígono ela é uma curva que tem linhas retas se quisermos suavizar essas linhas transformar ela numa curva realmente vamos tratar agora de chamada da curva polida para chegarmos à curva polida temos alguns calçõezinhos para fazer para conseguirmos chegar a essa curva que vai ser realmente uma curva quanto polígono de frequência da imagem real do fenômeno a curva polígono polida da imagem tendencial do fenômeno O poli o polimento geometricamente corresponde a eliminação dos vértices da linha poligonal Conseguese isso com o emprego de uma fórmula bastante simples a qual a partir das frequências reais nos fornece novas frequências frequências calculadas que se como no polígono de frequência nos pontos médios A fórmula que nos dá frequência calculada chamada de FC é a frequência calculada Vai ser a frequência simples da classe anterior a classe considerada mas duas vezes a frequência da classe considerada mas a da classe superior a classe considerada dividido por quatro para cada classe vamos fazer esse cálculo Vamos ver um exemplo aqui da aplicação dessa curva polida temos aqui a estatura que vai de um e cinquenta a um e cinquenta e 4temos o quê A classe dela é quatro A frequência quatro a frequência é calculada seria 0que é a frequência da classe anterior mais duas vezes a frequência desta classe que é o 4mais 9que é a frequência da classe seguinte da classe dois dividido por quatro o valor da 4cinco Mais um exemplo o da classe dois temos 4que é a frequência anterior da classe dois mais duas vezes 9que é a frequência desta classe mais onze que é a frequência da classe posterior que é da classe 3dividido por 4e assim sucessivamente Na última classe temos o seguinte vai ser 5que é da classe anterior mais duas vezes 3que é dessa classe mais a classe posterior Como essa é a última classe a classe posterior vai ser 0dividido por quatro Daí pegamos os valores marcamos aqui no gráfico e traçamos a curva polida Vejam que agora a gente não tem mais um polígono temos realmente uma curva Vamos ver agora as formas da curva de frequência Então a primeira curva a primeira forma que vamos ver são as curvas em forma de sino As curvas em forma de sino caracterizamse pelo fato de apresentarem um valor máximo na região central São muitos os fenômenos que oferecem distribuições em forma de sino A estatura de o peso de adultos a inteligência medida em testes mentais os preços relativos etecetera Então distinguimos a curva em forma de sino em simétrica e a simétrica Simétrica quando ela é toda igual e a simétrica quando ela tem uma diferença para um lado pro outro vamos ver elas aqui a simétrica Vejam aqui que a simétrica é realmente uma forma de um sino O valor máximo é no ponto central Os pontos são a que distante do centro possui a mesma frequência e teóricas Na prática curvas as curvas têm alguma inclinação Essa curva simétrica ela é uma curva mais teórica Aí das curvas assimétricas Temos a assimétrica positiva ou enviesada direita e a simétrica negativa ou enviesada à esquerda Nessa aula vimos a distribuição de frequência em forma de curvas Então até a próxima aula AULA DOZE Olá pessoal Na última aula vemos a representação gráfica de distribuição de frequência Nessa aula nós vamos fazer alguns exercícios para com o passo a passo para ver como é que nós vamos construir esses gráficos Vamos lá No primeiro considerando a distribuição de frequência seguinte confeccione a o histograma B o polígono de frequência e C o polígono de frequência acumulado Temos aqui uma tabela onde temos 5classes a primeira vai de quarenta a quarenta e quatro a última vai de cinquenta e 6a sessenta com as suas frequências e o valor total de frequências são vinte e seis Vamos começar pela letra A para fazer o histograma Vimos lá na aula anterior que o histograma representa a área área do histograma vai representar a frequência da das classes temos começamos aqui na no eixo do X hoje vamos marcar os pesos Vamos começar vamos marcar todos os valores que aparecem aqui nos na nas classes quarenta quarenta e quarenta e oito cinquenta e dois cinquenta e 6e sessenta A primeira classe que vai de quarenta a quarenta e 4tem a frequência dois marcamos um traço aqui na horizontal entre quarenta e quarenta e 4na marcando nas ordenadas o ponto dois como tá marcado aqui com a setinha A segunda classe de quarenta e 4a quarenta e 8a frequência agora é o cinco de quarenta e 4a quarenta e 8marcamos aqui traço na horizontal na altura de 5aqui nas frequências A classe seguinte quarenta e 8a cinquenta e dois já é nove Então de quarenta e 8a cinquenta e dois marcamos um traço na horizontal aqui na altura de nove Na quarta classe que vai de cinquenta e dois a cinquenta e seis marcamos aqui no ponto seis que é a frequência dessa classe E na última classe de cinquenta e 6a sessenta marcamos em 4e fechando o histograma temos aqui a distribuição a representação gráfica da frequência em formato de histograma Vamos ver agora o polígono de frequência que é a letra B do exercício Vimos que para fazer o polígono de frequência precisamos achar o ponto médio das da das classes Vamos pegar aqui as classes que temos aqui quarenta quarenta e quatro quarenta e 4a quarenta e oito quarenta e 8a cinquenta e dois cinquenta e dois cinquenta e 6e cinquenta e 6a sessenta Lembra como é que o ponto médio quarenta mais quarenta e 4dividido por dois quarenta e dois Quarenta e 4mais quarenta e 8dividido por dois quarenta e seis Quarenta e 8mais cinquenta e dois dividido por dois cinquenta cinquenta e dois mais cinquenta e 6dividido por dois cinquenta e 4e cinquenta e 6mais sessenta dividido por dois cinquenta e oito Então acrescentamos aqui essa coluna com os pontos médios e as suas respectivas frequências No polígono de frequência vamos marcar no eixo do X os pontos temos aqui quarenta e dois quarenta e seis cinquenta cinquenta e quatro cinquenta e 8e no eixo das ordenadas no eixo dos vamos marcar as frequências Então temos aqui ó a no ponto quarenta e dois frequência dois No quarenta e seis frequência cinco No cinquenta nove no cinquenta e 46e no cinquenta e 8quatro gerando assim o polígono de frequência Esse gráfico foi gerado no Excel como a gente já viu nas aulas passadas que a gente pode fazer tanto o gráfico à mão quanto ao das ferramentas existentes que são as os programas de planilha eletrônica Vamos ver agora o gráfico da frequência acumulada O polígono de frequência acumulada para acharmos a frequência acumulada vamos abrir também mais uma coluna aqui na nossa tabelinha que é da frequência acumulada Vimos que a frequência acumulada é a frequência dessa da dessa classe somada com a frequência da classe anterior até chegarmos na uma frequência Temos aqui a frequência acumulada dois sete dezesseis vinte e dois e vinte e seis No polígono de frequência acumulada marcamos no eixo do X a o limite superior das classes não mais o ponto médio agora temos aqui o limite superior das classes que tá marcado aqui na figura que tá representado aqui destacado aqui em vermelho temos aqui no eixo do X quarenta e quatro quarenta e oito cinquenta e dois cinquenta e seis sessenta são os limites superiores dessa vez não mais os pontos médios aqui aí marcamos as frequências acumuladas em cada um desses pontos Então no quarenta e 4vai ser dois relação a quarenta e 8sete cinquenta e dois dezesseis cinquenta e seis vinte e dois e sessenta vinte e seis formando assim o polígono de frequência acumulada Vamos ver um outro exercício agora para calcularmos a curva polida do da frequência Vemos que a curva polida a gente precisa fazer alguns calculozinhos para conseguir chegar os valores da curva Considerando confeccione a curva polida referente a distribuição de frequência essa mesma distribuição de frequência que a gente viu aqui uma outra distribuição aquela primeira lá daqueles exercícios temos aqui estatura cento e cinquenta a cento e cinquenta e 4cento e cinquenta e quatro cento e cinquenta e oito cento e cinquenta e 8a cento e sessenta e dois cento e sessenta e dois a cento e sessenta e seis cento e sessenta e seis cento e setenta e cento e setenta cento e setenta e quatro temos aqui os cálculos Na primeira frequência temos a frequência anterior que é o 0mais duas vezes a frequência da classe que a gente está considerando que seria a primeira que é duas vezes 4mais a frequência posterior que é o 9então fazendo todos os cálculos temos aqui a coluna com todas as frequências marcadas as frequências calculadas no gráfico de frequência vamos marcar os pontos médios tá Que temos aqui marcando os pontos médios e esses pontos da frequência calculada Com esses pontos marcados na curva vamos fazer a curva polida pessoal por hoje é só vimos aqui alguns exercícios sobre as curvas de frequência Tá Até a próxima AULA TREZE Olá pessoal Até agora vimos os elementos de distribuição de frequência Mas será que essa distribuição o ponto dessas distribuições está realmente no local certo será que a gente consegue visualizar Nessa aula agora vamos ver os elementos vai começar a ver os elementos de posição das frequências ou seja a média a moda a mediana desvio padrão Nessa primeira aula agora nós vamos ver a média aritmética Vamos lá Então o estudo que sobre distribuições de frequência até agora permite nos descrever de modo geral os grupos dos valores que uma variável pode assumir dessa forma podemos localizar a maior concentração de valores de uma data de distribuição isto é se ela localiza no início no meio ou no final ou ainda se há uma distribuição por igual Porém para ressaltar as tendências características de cada distribuição isoladamente ou em confronto com outras necessitamos introduzir que se expressem através de números que nos permitam traduzir essas tendências Esses conceitos são denominados elementos típicos da distribuição e são as medidas de posição medidas de variabilidade ou dispersão medidas de assimetria e medidas de curtose Nós vamos ver aqui no nosso curso as medidas de posição e as medidas de variabilidade ou dispersão Vamos começar a ver as medidas de posição Uma das medidas de posição que é a primeira que vamos ver é a média Dentre os elementos típicos destacase aqui as medidas de posição que nos orienta quanto a posição da distribuição em relação ao eixo do X As medidas de posição mais importantes são as medidas de tendência central Entre elas estão a média aritmética a mediana e a moda As outras medidas de posição são as separatrizes que englobam a própria mediana os quartis e os persentis Vamos começar média aritmética A média aritmética é o cociente da divisão da soma dos valores da variável pelo número deles Então considerando aqui X barra a média aritmética XI os valores da variável e N o número de valores Dizemos que X barra que é a média aritmética é igual somatório dos valores da variável dividido pelo número de valores Temos dois casos temos os dados agrupados e os dados não agrupados Vamos começar pelos dados Então quando desejamos conhecer a média dos dados não agrupados determinamos a média aritmética simples Exemplo sabemos que a produção leiteira diária da vaca A Durante uma semana foi de dez catorze treze quinze dezesseis dez8e doze litros Temos para produção média da semana a média X barra vai ser dez mais catorze mais treze mais quinze mais dezes6mais dez8mais doze dividido por 7que são a que é a quantidade de valores de litros que a gente tem aqui é igual a noventa e 8dividido por 7que tá igual a catorze Logo a média dessas da produção dessas vacas é quatorze litros Às vezes a média pode ser um número diferente de todos os da série de dados que ela representa É o que acontece quando temos os valores dois quatro 8e 9para os quais a média é cinco Esse será o número representativo dessa série de valores Embora não esteja representado nos dados originais Nesse caso costumamos dizer que a média não tem existência concreta Vamos ver os em relação à média Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética Designando desvio por DI temos DI vai ser XI que é o valor daquela série daquele daquela classe menos a X barra que é a média Então para o exemplo dado temos o desvio um vai ser o X um que foi dez menos quatorze menos quatro O desvio dois catorze menos quatorze zero O desvio três treze menos quatorze menos um o desvio quatro quinze menos quatorze igual a um e por aí vai Vamos ver agora algumas propriedades da média Primeira propriedade a soma algébrica dos desvios tomados em relação a média é nula ou seja se pegarmos todos aqueles desvios dos valores em relação à média e somarmos todos eles o valor vai ser zero Essa é uma das propriedades da média Vamos ver uma segunda propriedade da média somandose ou subtraindose uma constante C de todos os valores a variável a média do conjunto fica aumentada ou diminuída dessa mesma constante por exemplo se temos o valor Y um foi igual a X um mais ou menos uma constante C o valor a média de Y vai ser igual a média de X mais ou menos o C nesse exemplo fazendo o C igual a dois e somando a cada elemento do exemplo dado temse o Y vai ser dez mais dois quatorze mais dois treze mais dois quinze mais dois de Y vai ser doze mais dezes6mais quinze mais 17 mais 18 mais 20 mais 14 que dá 112 Fazendo como N é igual a 7 temos que o nosso novo X barra o nosso Y barra vai ser 12 mais 16 mais 15 mais 17 mais 18 mais 20 mais 14 dividido por 7 112 dividido por 7 que vai dar 16 Lembram do exemplo Esse exemplo tinha dado a nossa média agora deu 16 que justamente comprova a propriedade da média Deu 14 mais 2 que é 16 Vamos ver uma terceira propriedade da média Multiplicandose e dividindose todos os valores de uma variável por uma constante C qualquer a média do conjunto fica multiplicada ou dividida por essa constante Por exemplo se temos Y igual a XY vezes uma constante C o Y barra vai ser X barra vezes essa mesma constante C ou YXI dividido por C O Y barra vai ser X barra dividido por C Por exemplo multiplicando 3 por 3 cada um dos valores da variável do exemplo dado temos 30 42 39 45 48 54 e 36 Fazendo o somatório temos o valor de duzentos e noventa e 4dividido por 7dá quarenta e dois Quarenta e dois justamente a média inicial que era catorze multiplicado por três ou seja Y barra X barra vezes três Vamos ver agora o caso dos dados agrupados vimos até agora os dados não agrupados vamos ver os dados agrupados Os dados agrupados temos o sem intervalo de classe Então consideramos a distribuição relativa a trinta e 4famílias de 4filhos Tomando pela variável número de filhos do sexo masculino Número de meninos que tem 0meninos são duas famílias que tem um 6famílias dois dez famílias três doze famílias e 4famílias neste caso como as frequências são números indicadores da intensidade de cada valor da variável elas funcionam como fatores de ponderação o que nos leva a calcular a média aritmética ponderada dada pela fórmula X barra vai ser o somatório de XI vezes FI dividido pelo somatório da frequência ou seja pegamos aqui o número de meninos que é dois na primeira e o número de meninos zero a frequência duas famílias vai ser 0vezes dois que vai ser zero Na segunda classe na segunda posição temos aqui número de meninos um frequência seis um vezes seis 6e assim sucessivamente Fazemos o somatório dessa coluna que é XI e FI que dá setenta e oito a minha média ponderada vai ser setenta e 8dividido por trinta e quatro ou seja XI A somatório de XI e FI dividido pelo somatório de FI temos que esse valor vai dar dois vinte e 9aproximadamente dois três a média seria dois3meninos por família nessa aula vimos a parte da média aritmética até a próxima aula AULA CATORZE Olá pessoal na aula passada começamos a ver sobre média nessa aula nós vamos continuar falando sobre a média vamos falar sobre a média ponderada e vamos falar sobre um processo chamado processo breve que é um pouquinho mais complexo do que o processo que a gente viu porém ele chega nos valores bem mais rápido vamos lá Falamos sobre a na aula passada falamos sobre média aritmética sem intervalo de classes Agora vamos ver a média aritmética com intervalo de classe nesse caso convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio e determinamos a média aritmética ponderada por meio da fórmula somatório X barra vai ser igual o somatório de XI FI sobre o somatório de X de FI onde XI é o ponto médio da classe o seguinte considerando a seguinte distribuição que é a distribuição que a gente tá vendo lá desde o início do curso temos a classe a primeira classe que vai de cento e cinquenta a cento e 4as estaturas temos que a frequência é 4e assim sucessivamente até a sexta classe para calcularmos a média aritmética precisamos primeiro calcular o valor do ponto médio Lembram do ponto médio o ponto médio é o limite inferior mais o limite superior da classe dividido por dois Então fazendo essa conta aqui acrescentamos essa coluna do ponto médio e depois acrescentamos a coluna do ponto médio vezes a frequência que é o que vamos precisar para calcular Temos aqui os pontos médios das classes cento e cinquenta e dois cento e cinquenta e seis cento e sessenta cento e sessenta e quatro cento e sessenta e 8e cento e setenta e dois E temos a multiplicado por esse ponto médio para cada uma das classes Então temos a frequência que é no por exemplo na primeira classe frequência quatro ponto médio cento e cinquenta e dois 152 vezes 4 Assim sucessivamente somamos esses valores deu 6440 Agora é o seguinte com esse valor que é o somatório de XI vezes FI que é 6mil quatrocentos e quarenta o somatório de FI que são as frequências deu quarenta e a média vai ser de X e FI sobre o somatório de FI temos X barra que é a é a média vai ser 6mil quatrocentos e quarenta dividido por quarenta que vai dar cento e sessenta e um centímetros podemos dizer que a média da estatura dessa frequência dessa distribuição de frequência é cento e sessenta e um centímetros Vamos ver agora um processo chamado processo breve que é um processo que apesar de ter os cálculos um pouquinho mais complexos ele vai com números menores o que vai facilitar as contas não vai trabalhar com números tão grandes Então com a o intuito de eliminarmos o grande número de cálculos que às vezes se apresenta na determinação da média empregamos o que dominamos de processo breve Em oposição ao processo usado anteriormente processo longo baseado em uma mudança da variável X por outra variável Y tal que Y vai ser o XI menos um X 0dividido por H Onde X é uma constante arbitrária escolhida convenientemente dentre os pontos médios da distribuição de preferência o de maior frequência mas não obrigatoriamente Fazendo uma mudança de variável de acordo com a segunda e a terceira propriedade da média ela resulta diminuída de X 0e dividida por H Mas isso pode ser compensado somando X 0a média da nova variável E ao mesmo tempo multiplicando por H Resulta a fórmula modificada X barra vai igual a X 0mais o somatório de Y e F I vezes H dividido pelo somatório de FI parece complicado né gente Mas vamos ver lá como é que fica esse aqui exemplo para a distribuição daquela tabela que a gente viu anteriormente tomando para o valor de X 0o ponto médio da maior frequência se bem que podemos tomar qualquer dos valores do ponto médio vamos pegar o X 0igual a cento e sessenta que é onde tem a maior frequência como H é igual quatro H é a amplitude da classe temos cento e sessenta a classe cada classe que vai de cento e cinquenta a cento e cinquenta e quatro cento e cinquenta e 4a cento e cinquenta e oito o H é a amplitude da classe temos o seguinte para o primeiro ponto temos o ponto médio da primeira classe que é cento e cinquenta e dois menos o X 0que nós escolhemos que é cento e sessenta dividido por quatro esse valor dá menos dois e assim sucessivamente fazemos para todos os valores vamos tabela com as colunas correspondentes aos pontos médios aos valores da nova variável Y e aos produtos Y FI temos aqui a X barra O XI que são os pontos médios o Y I que são os valores que a gente calculou e o Y vezes FI O somatório temos aqui o somatório do Y e FI o somatório de FI Pelo processo breve temos escolhemos o X 0cento e sessenta o somatório de Y e F I deu dez e o somatório de F I quarenta i u h é 4que é a amplitude di cada classe substituindo esses valores das fórmulas temos que X barra vai ser u X 0que é u cento i sessenta mais u somatório di Y FI que deu dez vezes u h que é 4dividido por quarenta que é u somatório di FI aqui vamos achar que esse valor vai ser cento i sessenta mais um que é cento i sessenta i um Vimos que deu u mesmo resultado du processo breve i u processo longo Nesse K não vale muito a pena porque temos valores pequenos mas em caso por exemplo de algumas séries onde temos valores muito grandes que vai chegar em milhões vamos ver que é muito melhor fazer pelo processo breve só que tem algumas observações sobre esse processo breve nem sempre ele pode ser aplicado o processo breve com a nova variável definida por nós só pode ser usado em distribuições que apresentam intervalos de classe na mesma amplitude se as minhas classes forem todas iguais tiverem as mesmas amplitudes a gente pode aplicar o processo breve Se as amplitudes forem o processo breve já não se aplica ele pode também ser aplicado para distribuições sem intervalo de classe bastando fazer igual a um tem algumas fases aqui para o cálculo da média pelo processo breve como já vimos abrimos primeiro abrimos uma coluna para os valores de XI depois escolhemos um dos pontos médios de preferência de maior frequência para o valor de X zero Abrimos uma coluna para os valores de Y I e escrevemos 0na linha correspondente a classe onde se encontra o valor de X zero A sequência menos um menos dois menos 3logo acima do 0e a sequência um dois 3logo abaixo Abrimos uma coluna para os valores do produto Y e FI conservando se mais ou menos e em seguida somando somamos algebricamente esse produto e aí daí aplicamos a fórmula como vocês podem ver não é tão complicado assim por hoje vimos a parte da média a finalizamos a média Na próxima aula vamos ver outra medida de posição AULA QUINZE Olá pessoal Então dando continuidade às nossas medidas de posição nessa aula nós vamos ver a moda Vamos lá Denominamos moda o valor que ocorre com maior frequência em uma série de valores Desse modo o salário modal por exemplo dos empregados de uma indústria é o salário mais comum Isto é o salário recebido pelo maior número de empregados dessa indústria Exemplo determine a moda dos dados Então temos alguns números aqui zero zero cinco três sete quatro sete oito sete nove meia Vimos que a moda nesse caso é o 7que tá aqui destacado em vermelho porque é o valor que ocorre o maior número de vezes o conjunto de dados pode não ter moda porque nenhum valor se repete o maior número de vezes é o caso do conjunto três cinco oito dez doze treze Dizemos que esse conjunto é amolda ou seja ele não tem moda Em outros casos ao contrário pode haver dois ou mais valores de concentração Dizemos que o conjunto tem dois ou mais valores modais No 2 3 4 4 4 5 6 7 7 7 8 9 temos duas modas 4 e 7 Esse conjunto se diz bimodal ou seja ele tem duas modas E o que é a moda A moda funciona como medida descritiva quando se trata de contar dados essa medida não se presta manipulações matemáticas de um ponto de vista de vista puramente descritivo a moda indica o valor típico em termos de maior ocorrência além disso se as frequências são razoavelmente uniformes a moda perde muito de sua importância como medida descritiva Por outro lado a utilidade da moda se acentua quando um ou dois valores ou um grupo de valores ocorre com muito mais frequência que os outros Na maior parte das vezes a média aritmética e a mediana fornece melhor descrição da tendência central dos dados A média aritmética nós já vimos a mediana vamos ver na sequência nas próximas aulas vamos ver os dados agrupados sem intervalo de classe Uma vez agrupados dados é possível determinar imediatamente a moda basta fixar o valor da variável de maior frequência Exemplo considere a tabela de distribuição de frequência relativas ao percentual de vezes que cinquenta alunos formulam questões durante uma palestra Então número de vezes um dois três quatro cinco seis sete E a frequência na primeira uma vez 5por cento duas vezes três 3vezes dezessete 4vezes trinta e cinco cinco dezoito seis quinze sete sete Nesse caso fica bem simples de ver a moda fica bem claro que a moda nesse caso é o quatro pois a maior parte dos alunos trinta e 5por cento formularam 4perguntas para o palestrante Nesse caso fica bem claro de ver qual é o valor da moda Vamos ver agora o caso dos dados com intervalo de classe Então a classe que apresenta a maior frequência é denominada classe modal Pela definição podemos afirmar que a moda neste caso é o valor dominante que está compreendido entre os limites da classe modal O método simples para o cálculo da moda consiste em tomar o ponto médio da classe modal Damos a esse valor denominação de moda bruta Temos que a moda vai ser o limite inferior da classe modal mais o limite superior da classe modal dividido por dois Uma média simples Vamos ver um exemplo na distribuição onde a gente já viu as estaturas e as frequências A primeira classe cento e cinquenta cento e cinquenta e quatro a frequência A terceira classe cento e cinquenta e oito cento e sessenta e dois a frequência é onze vimos que essa é a classe modal que é a que tem a maior frequência Vimos que a moda nesse caso vai ser o limite inferior mais o limite superior da classe modal dividido por dois A classe modal é a cento e cinquenta e 8a cento e sessenta e dois Então a moda vai ser cento e cinquenta e 8mais cento e sessenta e dois dividido por dois que dá trezentos e vinte dividido por dois que é igual a cento e sessenta Logo a moda igual a cento e sessenta centímetros Agora com os dados esses dados agrupados com intervalo de classe a gente tem um outro método para esse cálculo da moda Chamado de fórmula de Czuber Essa fórmula diz o seguinte a moda é o limite inferior da classe modal mais o D um vezes o H dividido por D um mais D dois Quem são D um e D dois D um é a frequência simples da classe modal menos a frequência simples da classe anterior a classe modal E o D dois é a frequência simples da classe modal menos a simples da classe posterior a classe modal e H como já vimos é a amplitude da classe Vamos ver o exemplo da aplicação da fórmula de tendo aqui aquela mesma distribuição com as estaturas e as frequências vamos calcular a moda pela fórmula de temos que a moda o valor o valor do limite inferior da classe modal mais o D um sobre D um mais D dois vezes H D um que vai ser vai ser a frequência da classe modal que é o onze menos a frequência anterior que é nove E D dois é a frequência da classe modal menos a frequência da classe superior que é a oito vai dar igual a três Então aplicando a fórmula temos que a moda vai ser cento e cinquenta e oito que é o limite inferior da classe modal mais D um que é dois dividido por D um mais D dois que é dois mais 3vezes quatro Fazendo as contas aqui vemos que a moda deu cento e cinquenta e 9 seis Vejam que ela deu um pouquinho diferente da moda calculada pela outra fórmula Então na outra fórmula na fórmula simples na moda bruta deu 160 aqui deu 1596 Vemos aqui agora as expressões gráficas da moda Temos uma curva modal uma curva modal que é a curva em si não lembra que a gente viu a curva em sino onde a moda tá bem no meio aqui da curva modal A curva não modal temos uma linha reta e a curva amolda onde é uma curva não tem moda Outros tipos de curvas tem a curva antimodal que não tem que a moda ela ao invés de ser o valor superior ao valor inferior temos a curva bimodal onde temos duas modas e a curva trimodal onde aparece aqui os valores de 3modas O emprego da moda A moda é utilizada a quando desejamos obter uma medida rápida e aproximada de posição Quando a medida de posição deve ser o valor mais tipo da distribuição Então a medida moda Definição valor mais frequente Vantagens Um valor típico maior quantidade de valores concentrados nesse ponto Limitações Não se presta análise matemática como a gente já viu Pode não haver moda para acesso conjunto de dados E quando usar primeiro quando deseja se obter uma medida rápida e aproximada de posição ou quando a medida da posição deve ser o valor mais típico da distribuição Isso aí foi a gente viu a moda na próxima aula ver mais uma medida de posição AULA DEZESSEIS Olá pessoal Dando continuidade às medidas de posição nessa aula nós vamos ver a mediana Vamos lá Então a mediana é outra medida de posição definida como número que se encontra no centro de uma série de números Estando estes dispostos segundo a ordem Em outras palavras a mediana de um conjunto de valores ordenados segundo a ordem de grandeza é o valor situado de tal forma no conjunto que separe dois subconjuntos de mesmo número de elementos A mediana para não agrupados Então dado uma série de valores como por exemplo cinco treze dez dois dezoito quinze Seis dezes6e nove A primeira coisa que precisamos fazer é ordenar os números Então vamos ordenálos Fica dois cinco seis nove dez treze quinze dezesseis dezoito Nesse caso a nossa mediana é o número dez que vai dividir a série 4números para esquerda 4pras direitas Em seguida tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda Em nosso exemplo esse valor é o dez Que nessa série há 4elementos acima dele e 4abaixo Temos a mediana igual a dez Se porém a série dada tiver um número par de termos a mediana será por definição qualquer dos números compreendidos entre os dois valores centrais da série Convencionou se utilizar o ponto médio Assim a série de valores dois seis sete dez doze treze dez8e vinte e um tem para mediana a média aritmética entre dez e doze que são os dois números centrais a mediana vai ser dez mais doze dividido por dois que é vinte e dois dividido por dois que vai ser onze a mediana igual a onze verificamos que estando ordenados os valores de uma série E sendo N o número de elementos da série o valor mediano o termo da ordem N mais um sobre dois se N for ímpar e a média aritmética dos termos de ordem N sobre dois e N sobre dois mais um se N for par Podemos comprovar tal fato nas séries seguintes Para N igual a 9temos 9mais um sobre dois que é igual a cinco Logo a mediana é o quinto termo da série Isto é mediana igual a dez Para N igual a 8termos 8sobre dois é igual a 4e 8sobre dois mais um é igual a cinco logo a mediana é a média aritmética do quarto e quinto termos da série isto é dez mais doze sobre dois que dá vinte e dois sobre dois que é igual a onze logo a mediana é igual a onze Vamos ver algumas notas sobre a mediana para dados não agrupados o valor da mediana pode coincidir ou não com o elemento da série como vimos Quando o número de elementos da série é ímpar a coincidência o mesmo não acontece porém quando esse número é par A média é a média aritmética não tem necessariamente o mesmo valor Na primeira série apresentada por exemplo temos a média dez4e a mediana dez A mediana como vimos depende da posição e não dos valores dos elementos na série ordenada Essa é uma das diferenças marcantes entre a mediana e a média que se deixa influenciar e muito pelos valores extremos Essa propriedade da mediana pode ser constatada através do exemplo a seguir Por exemplo se temos a série cinco sete dez treze quinze a média é dez e a mediana também é dez Se temos um elemento cinco sete dez treze e sessenta e cinco vejam que o extremo o ponto extremo agora mudou temos a média vinte e a mediana continua sendo dez Isto é a média do segundo conjunto de valores é maior que a do primeiro Por influência dos valores extremos ao passo que é a mediana permanece a mesma A mediana muitas vezes por valor mediano Vamos ver agora a mediana para os dados agrupados Então se os dados se agrupam em uma distribuição de frequência o cálculo da mediana se processa de modo muito semelhante aquele dos dados não agrupados implicando porém a determinação prévia das frequências acumuladas Ainda aqui temos que determinar um valor tal que divide a distribuição em dois grupos que contém o mesmo número de elementos Para o caso de uma distribuição porém a ordem a partir de qualquer um dos extremos é dada pelo somatório das frequências dividido por dois Vamos ver exemplo da mediana para uma classe no de grupos não ordenados Sem o intervalo de classe Então temos aqui o número de meninos zero um dois 3e quatro A frequência dois seis dez doze 4e as frequências acumuladas Para sabermos qual é a classe que está a nossa mediana primeiro temos que dividir a frequência em dois para sabermos onde está a metade da distribuição fazemos a frequência total que é trinta e 4dividido por dois que é igual a dezes7com esse valor vamos na coluna das frequências acumuladas para saber qual é a classe que contém a frequência contém essa frequência de dezessete a classe que contém aqui no caso essa que tá destacada aqui em vermelho que é onde a frequência acumulada é igual a dezoito podemos dizer que é a mediana nesse caso são dois meninos Vamos ver um outro exemplo aqui sem intervalo de classe temos aqui com um XI doze quatorze quinze dezesseis dezessete vinte onde a frequência é um dois um dois um um e a frequência acumulada um três quatro seis 7e oito no caso de existir uma frequência acumulada tá o quê A frequência acumulada é o somatório de FI sobre dois a mediana será dada por XI mais um e etecetera 8sobre dois que é a quantidade a frequência dividido por dois tá igual a 4então estamos na frequência na terceira coluna aqui um 3quatro onde tem o quatro Logo a mediana vai ser quinze mais dezes6sobre dois que é igual a trinta e um sobre dois Vemos o quê Que temos o número par Então temos um dois três quatro cinco seis Vimos lá que no número par pegamos os dois números do centro e dividimos por dois No nosso na nossa mediana aqui vai dar quinze cinco Vamos ver agora a mediana com intervalo de classe neste caso o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana Para tanto temos inicialmente que determinar a classe na qual se acha a mediana A classe mediana Tal classe será evidentemente aquela correspondente e a frequência acumulada imediatamente superior a somatório de das frequências sobre dois Feito isto um problema de interpolação resolve a questão Admitindose agora que os valores se distribuam uniformemente em todo intervalo de classe vamos ver as etapas de como é que a gente faz esses cálculos primeiro determinamos as frequências acumuladas do jeito que a gente já viu vai somando a frequência com a outra até chegar na frequência acumulada final Calculamos o somatório das frequências dividido por dois não das frequências acumuladas as frequências simples Marcamos a classe correspondente à frequência acumulada imediatamente superior ao somatório de FI sobre dois que é a classe mediana e em seguida empregamos a fórmula a mediana vai igual a L que é o limite inferior da classe mediana mas o somatório das frequências sobre dois menos a frequência acumulada anterior a classe medianas vezes o H que é a amplitude do intervalo da classe mediana dividido por F que é a frequência simples da classe mediana parece complicado mas não é Vamos ver um exemplo aqui com é que vamos fazer esse cálculo temos o nosso exemplo padrão aqui que é aquele exemplo das estaturas de cento e cinquenta cento e cinquenta e 4até cento e setenta cento e setenta e quatro Temos as frequências o somatório das frequências é quarenta temos aqui as frequências acumuladas Já vimos aqui quatro treze vinte e quatro trinta e dois trinta e 7e quarenta Fazemos o somatório das frequências que é dividido por dois Quarenta dividido por dois que é igual a vinte temos que a nossa frequência a nossa classe mediana é a classe 3aqui onde tem onde está contido esse valor de vinte e temos vinte que é o valor calculado menos treze que é a frequência acumulada da classe anterior dividido por onze que é a frequência da classe é medianas vezes 4que é amplitude que dá 7sobre onze vezes 4então a mediana vai ser o valor o limite inferior da classe mediana que é cento e cinquenta e 8mais esse cálculo que a gente fez aqui 7sobre onze vezes 4que vai dar cento e 8mais dois vírgulas cinquenta e 4que vai dar cento e sessenta cinquenta e 4ou cento e sessenta5centímetros Lembra o que a gente viu lá que a média era cento e sessenta e um e a gente tem a mediano cento e sessenta5e a moda nesse mesmo exemplo fora cento e sessenta Lembram Vamos ver um outro exemplo aqui uma nota No caso de existir uma frequência acumulada exatamente igual a somatório da frequência sobre dois A mediana será o limite superior da classe correspondente Por exemplo aqui nesse exemplo a gente tem as classes de um até 6que vai de 0a dez até de cinquenta a sessenta e suas respectivas frequências e suas respectivas frequências acumuladas fazemos o somatório das frequências que é vinte e 6dividido por dois dá igual a treze Vimos aqui que na frequência acumulada a gente tem uma classe aqui que já tem a frequência treze vimos que a mediana nesse caso vai ser igual ao limite superior da classe mediana que é o trinta no a mediana vai ser igual ao limite superior que vai ser igual a trinta vamos ver aqui o emprego da mediana empregamos a mediana quando desejamos obter o ponto que divide a distribuição em partes iguais quando há valores extremos que afeta de uma maneira acentuada a média e quando a variável estudo é por exemplo o salário Posição relativa da média moda e mediana vejam aqui que numa curva simétrica a média coincide com a mediana que coincide com a moda Numa curva assimétrica temos o seguinte na curva assimétrica à esquerda temos que a moda é um pouco menor do que a mediana que é menor do que a média E na curva assimétrica direita temos que a média é menor do que a do que a mediana que é menor do que a moda Então pessoal isso aí essa foi a aula de hoje vimos a parte de mediana Na próxima aula vamos ver as separatrizes AULA DEZESSETE Olá pessoal Nesta aula nós vamos ver as separatrizes que são os e os que são mais uma medida de posição Então como vimos a mediana caracteriza uma série de valores devido a sua posição central No entanto ela apresenta uma outra característica tão importante quanto a primeira Ela separa a série em dois que apresentam o mesmo número de valores assim além das medidas de posição estudamos há outras que consideradas individualmente não são medidas de tendência central mas estão ligadas a mediana relativamente a sua segunda característica já que se baseiam em sua posição na série Essas medidas os quartis os persentis e os decis são juntamente com a mediana conhecidas pelo nome genérico de separatrizes porque ela vai eles vão separar a série em partes Vamos ver nessa aula os e os persentis Denominamos os valores de uma série que a que a dividem em 4partes iguais Há portanto 3o primeiro chamado de Q um que é o valor de tal modo na série que uma quarta parte ou vinte e 5por cento dos dados é menor que ele e as 3quartas partes restantes setenta e 5por cento são maiores Temos o segundo quartil que é o Q dois que é evidentemente coincide com a mediana o dois é igual a mediana E temos o terceiro quartil que é valor situado de tal modo que as 3quartas partes setenta e 5por cento dos termos são menores que ele e uma quarta parte vinte e 5por cento é maior Vamos ver a dos vocês vão ver que as fórmulas dos e dos na verdade elas são derivadas da fórmula da mediana elas são bem parecidas com a fórmula da mediana considerando apenas a parte de com o quarto e a parte de com a percentagem Vamos lá ver a dos quando os dados são agrupados para determinar os usando a mesma técnica do cálculo da mediana bastando substituir na fórmula da mediana somatório de FI sobre dois por K vezes somatório de FI e agora sobre 4porque quatro porque quatro Porque agora a gente tem um quartinho vamos dividir por quatro Sendo K um número de ordem do quartil Se eu tiver falando do primeiro quartil é 1 se eu tiver falando do segundo quartil vou coincidir com a mediana vocês vão ver se eu colocar duas vezes FI sobre 4 Vai dar o somatório de FI sobre 2 que é a mediana E o terceiro quartinho temos no primeiro quartil vai ser o valor do limite inferior da classe mediana mais o somatório de FI sobre 4menos a frequência acumulada anterior dividido pela frequência da classe mediana ou da classe do quartis vezes H O terceiro quartil vai ser o L da do da classe do quartil que multiplica os que soma 3vezes o somatório de FI sobre quatro menos a acumulada anterior vez o H dividido pela frequência do vamos ver um exemplo aqui do cálculo do primeiro quartinho e do terceiro quartinho os vamos lá um exemplo utilizando aquele mesmo exemplo que a gente tá utilizando sempre das estaturas de cento e cinquenta cento e cinquenta e quatro cento e setenta cento e setenta e quatro Primeira coisa que fazemos é calcular a frequência acumulada temos a frequência acumulada quatro treze vinte e quatro trinta e dois trinta e 7e quarenta Vamos começar primeiro quartil para identificar a classe onde está localizado o primeiro quartil primeiro fazendo somatório de FI sobre quatro Um vezes o somatório de FI que nesse caso K é igual a um Então vai dar quarenta sobre 4que é igual a dez Reconhecemos que a o primeiro quartil ele tá localizado aqui na segunda classe Então vamos calcular quem é esse quartil Vai ser cento e cinquenta e quatro que é o limite inferior da segunda classe mais dez que é o valor que a gente achou Que é o somatório de FI sobre quatro menos a frequência acumulado anterior que é 4dividido por 9que é a frequência da série da classe vezes 4que é a amplitude da classe temos cento e cinquenta e 4mais vinte e 4sobre nove ou seja o primeiro quartinho o valor é cento e cinquenta e 67centímetros Vamos ver agora o terceiro quartinho para fazer o terceiro quartil primeiro para localizar onde está onde ele está situado nas classes fazemos 3vezes o somatório de FI sobre 4que vai dar 3vezes quarenta dividido por 4que dá igual a trinta localizamos que o terceiro quartinho ele está onde a frequência acumulado é trinta É maior que trinta temos aqui temos aqui que ele está na quarta classe aqui o terceiro quartinho calcular quem é o valor do terceiro quartinho Pegamos o limite inferior da classe que é cento e sessenta e dois mais o valor calculado de 3vezes somatório de FI sobre quatro que é trinta menos a frequência acumulada anterior da classe anterior que é vinte e quatro vezes a amplitude da classe que é 4dividido pela frequência da classe do quartil que é oito temos cento e dois mais vinte e 4sobre 8que dá cento e sessenta e dois mais 3que dá cento e sessenta e 5centímetros resumindo temos que o primeiro quartinho cento e cinquenta e 67centímetros e o terceiro quartinho cento e sessenta e 5centímetros Isso significa o quê Cento e cinquenta e 67centímetros Vinte e 5por cento das frequências estão acima desse valor e setenta e 5por cento estão abaixo desse valor É o que como separa a classe no terceiro quartinho significa o quê Que setenta e 5por cento dos valores estão acima de cento e sessenta e 5e vinte e 5por cento estão abaixo desse tão acima desse valor Vamos ver agora os pés Então denominando os pés gentis os noventa e 9valores que separam a série em cem partes iguais temos P um P dois P trintam e dois até P noventa e nove É evidente que o P cinquenta que é a metade cinquenta cinquenta é igual a mediana O P vinte e 5é igual um P setenta e 5igual o quartil três o cálculo de um percentil segue a mesma técnica do cálculo da mediana Porém a fórmula somatória de FI sobre dois será substituída por K vezes o somatório de FI sobre cem onde K é o número de ordem do percentil Vamos ver um exemplo aqui Considerando aquela nossa mesma série Vamos calcular o oitavo percentil da série fazemos K para K o K igual a oito temos 8vezes o somatório da frequência dividido por cem que dá 8quarenta dividido por cem dá 3 dois definimos que o oitavo quartinho está na primeira classe logo aqui vamos pegar qual é o oitavo percentil vai ser o limite inferior da classe que é cento e cinquenta mais esse valor de K vezes somatório de FI sobre cem que deu 3 dois menos a frequência acumulada da classe inferior Como essa é a primeira classe a classe inferior vai ter a frequência acumulada de zero Vezes que é o a amplitude da classe dividido por quatro Então temos que o oitavo tá em cento e cinquenta mais doze8sobre 4que dá cento e cinquenta mais 3 dois que dá cento e cinquenta e 3 dois Ou seja o oitavo pé sentiu é o valor de cento e cinquenta e 3 dois centímetros Isso com isso aí a gente encerra essa parte das medidas de posição Próxima AULA DEZOITO Olá pessoal Na aula de hoje vamos ver as medidas de dispersão Vimos a medida de posição para saber onde está localizado na série Agora precisamos saber qual é a dispersão desses dados ou seja quanto ele tá mais próximo da média quanto ele tá mais longe da média da mediana e assim por diante Chamamos essas medidas de medida de dispersão Vamos acompanhar comigo Então o que é dispersão ou variabilidade Considerando os seguintes conjuntos de valores das variáveis X Y Z Temos no conjunto setenta setenta setenta setenta setenta No conjunto Y sessenta e oito sessenta e nove setenta setenta e um setenta e dois No conjunto Z cinco quinze cinquenta cento e vinte cento e sessenta Vamos calcular a média aritmética de cada um dos conjuntos Então temos no conjunto X a média aritmética é setenta No conjunto Y a média aritmética também é setenta No conjunto Z também é setenta Vemos que os 3conjuntos apresentam a mesma média aritmética setenta Apesar dos 3terem a mesma média eles são iguais a gente viu que eles não são iguais Vamos ver agora como a gente trabalha nas medidas de dispersão para diferenciar um conjunto de outro Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável Em torno de um valor de tendência central tomando como ponto de comparação podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula porque ele tem todos os valores iguais E o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z é a diferença entre os valores e a média são menores Portanto para qualificar os valores de uma data variável Ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e sua medida de posição a estatística recorre as medidas de dispersão ou de variabilidade Dessas medidas estudaremos a amplitude total a variância o desvio padrão e o coeficiente coeficiente de variação Vamos começar pela amplitude total A amplitude total é a diferença entre o maior e o menor valor observado A amplitude total é igual a X máximo menos o X mínimo exemplo para os valores quarenta quarenta e cinco quarenta e oito cinquenta e dois cinquenta e quatro sessenta e dois setenta A amplitude total vai ser o maior valor que é o setenta menos o menor valor que é o quarenta que vai ser igual a trinta Nos que a gente viu X Y e Z temos o quê Na no conjunto X a amplitude total vai ser o valor maior menos o menor que é setenta menos setenta vai ser zero tem a dispersão nula No conjunto Y pegamos o maior valor que é setenta e dois menos o menor valor que é sessenta e 8e a dispersão é quatro Já no conjunto Z pegamos o maior valor cento e sessenta e o menor valor 5e vemos que a amplitude total é igual a cento e cinquenta e cinco conjunto Z apesar dos 3terem a mesma média vemos que o conjunto Z tem uma dispersão muito maior por exemplo do que o conjunto X que tem a dispersão nula Então vamos ver a amplitude para dados agrupados sem intervalo de classe Nesse caso ainda temos que a amplitude total é X máxima menos o X mínimo Então considerando a seguinte tabela X é igual a zero um dois 3e 4e a frequência dois seis doze 7e três A amplitude vai ser o 4menos o 0que é igual a quatro No caso de dados agrupados com intervalo de classe vamos ver como é que fica neste caso a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe temos aqui naquele nosso clássico exemplo das estaturas que vai de cento e cinquenta a cento e setenta e 4a minha amplitude vai ser cento e setenta e 4que é o limite máximo da última da última classe menos cento e que é o limite inferior da primeira classe Vai ser amplitude total vinte e quatro Vimos a amplitude Agora vamos ver uma característica chamada variância e desvio padrão Então como vimos a amplitude total é instável Por se deixar influenciar pelos valores extremos que são na sua maioria devidos ao acaso A variância e o desvio padrão são medidas que fogem a essa falha pois leva em considera a totalidade dos valores da variável estudo o que faz delas índices de variabilidade bastante estáveis e por isso mesmo os mais geralmente empregados A variância baseiase nos desvios em torno da média aritmética porém determinando a média aritmética dos quadrados dos desvios Assim representando a variância por S ao quadrado temos que a variância que é o S ao quadrado é o somatório de XI menos a X barra que é a média ao quadrado o somatório de FI Considerando o somatório de FI igual a N que é o número De total de valores temos que a variância vai ser o somatório de XI menos X barra quadrado sobre N Sendo a variância calculada a partir dos quadrados dos desvios ela é um número em unidade quadrada em relação a variável em questão O que sob o ponto de vista de vista prático é o inconveniente Por isso mesmo imaginouse uma nova medida que tem utilidade e interpretação prática denominada desvio padrão definida como a raiz quadrada da variância representada por s Normalmente o que nós utilizamos nos cálculos é o desvio padrão que é S que é a raiz quadrada do somatório de X I menos X barra sobre dois dividido por N para simplificar os cálculos nós fazemos algumas jogadas para melhorar essa fórmula do desvio padrão e podemos utilizar de uma forma mais fácil Então a fórmula dada pro cálculo desvio padrão é a que torna mais fácil a sua ela não é uma boa fórmula para fins de computação pois em geral a média aritmética é um número fracionário o que torna pouco prático o cálculo das quantidades XI menos X barra sobre dois Podemos simplificar os cálculos fazendo o uso da igualdade Somatório de X I menos X barra ao quadrado é o somatório de XI ao quadrado menos o somatório de XI ao quadrado sobre N Assim soma substituindo o somatório de XI menos X barra ao quadrado ser o equivalente na equação um obtemos que S vai ser o somatório de XI ao quadrado menos o somatório de XI ao quadrado sobre N Dessa forma temos a fórmula final do desvio padrão que é o somatório dos quadrados de XI sobre N menos o somatório de XI sobre N ao quadrado dessa forma vamos ter valores mais fáceis de se trabalhar vamos ver algumas propriedades do desvio padrão O desvio padrão goza de algumas propriedades dentre as quais destacamos Primeira soma subtraindose uma constante de todos os valores de uma variável o desvio padrão não se altera por exemplo se o Y for o X I mais ou menos C o S de Y vai ser igual ao S de X E multiplicandose todos os valores de uma variável por uma constante diferente de zero o desvio padrão fica multiplicado por essa constante se o Y for constante multiplicado por X I o desvio padrão de Y vai ser essa constante vezes o desvio padrão de X Essa nos permite introduzir no cálculo do desvio padrão simplificações úteis como veremos mais adiante Para o cálculo do desvio padrão consideraremos os seguintes casos Vamos ver um exemplo aqui da variância e do desvio padrão para dados não agrupados exemplo temos os valores quarenta quarenta e cinco quarenta e oito cinquenta e dois cinquenta e quatro sessenta e dois e setenta É o valor de XI Abrimos uma coluna aqui e fazemos o ao quadrado temos os valores aqui quarenta ao quadrado quarenta e 5ao quadrado Temos o de XI e o somatório de XI ao quadrado Aplicando na fórmula vemos o seguinte N é igual a sete são 7valores Quem vai ser o valor de s vai ser o somatório de XI ao quadrado sobre N menos o somatório de XI sobre N ao quadrado Então chegamos ao valor que o desvio padrão é 9 quarenta e nove Vamos ver os dados agrupados sem intervalo de classe Como nesse caso temos a presença de frequência devemos levar em consideração temos na fórmula somatório de FI XI ao quadrado sobre N menos o somatório de FIX XI sobre N ao quadrado Nesse caso vamos levar em consideração as frequências Vamos ver um exemplo aqui exemplo se temos o XI 0um dois 3e 4e a frequência em cada uma dessas classes que não são classes Cada uma dessas séries dois seis doze sete 3fazemos FI vezes XI temos os valores aqui e fazemos F I vezes XI ao quadrado temos aqui também o somatório quem vai ser o desvio padrão Vai ser o somatório de FI XI ao quadrado sobre N menos o somatório de FIXI sobre N ao quadrado chegamos ao valor que o desvio padrão é um04agora vamos ver com os dados agrupados em intervalo de classe a fórmula vocês podem ver eles não ela não vai se alterar O que é que temos aqui Temos as estaturas temos as frequências e os valores de XI que é o ponto médio No caso dos dados agrupados com intervalo de classe o valor de XI vai ser o ponto médio das classes como a gente já viu anteriormente temos a frequência vezes o ponto médio e a frequência vezes o ponto médio ao quadrado temos aqui o somatório de FIXI e o somatório de FI XI ao quadrado Aplicando não temos o somatório de FIX XI ao quadrado que deu um milhão e trinta e 8e oitenta dividido por quarenta menos o somatório de FI XI que são 6mil quatrocentos e quarenta dividido por quarenta ao quadrado Chegamos ao desvio padrão de 5 cinquenta e 7centímetros Vamos ver agora o coeficiente de variação o desvio padrão por si só não nos diz muita coisa Assim um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é duzentos no entanto se a média foi ao vinte o mesmo não pode ser dito Além disso o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores relativamente a sua dispersão ou variabilidade quando expressa em unidades diferentes para contornar essas dificuldades e limitações podemos caracterizar dispersão ou variabilidade dos dados em termos relativos ao seu valor médio medida esse denominado coeficiente de variação O CV dizemos que o coeficiente de variação é o desvio padrão dividido pela média vezes cem e esse valor vai dar em porcentagem Vamos ver um exemplo aqui da do coeficiente de variação considerando aquela mesma nossa série tá De estaturas frequências ponto médio FIXI FIX ou quadrado achamos lá anteriormente o valor do desvio padrão de 5 cinquenta e 7achamos o valor de X barra da média de cento e sessenta e um Lembra como é que a gente calcula a média Somatório de FIXI dividido por somatório de FI dá cento e sessenta e um vamos achar o coeficiente de variação o coeficiente de variação é o desvio padrão dividido pela média vezes cem que é 5 cinquenta e 7dividido e sessenta e um vezes cem que dá 003459vezes cem que dá 3 aproximadamente 3e meio Vimos aqui a parte de desvio padrão de coeficiente de variação e até a próxima aula AULA DEZENOVE Olá pessoal Nessa aula nós vamos falar de uma parte muito importante da estatística que é a probabilidade ou seja a probabilidade de um evento acontecer Normalmente pode ser um evento qualquer um evento que tenha a probabilidade de acontecer Então vamos lá ver como é que como é que vamos definir a probabilidade A probabilidade é essencial pro estudo da estatística indutiva ou inferencial O que é um experimento aleatório Em quase tudo em maior ou menor grau vislumbramos o acaso Assim da afirmação é provável que meu time ganhe a partida de hoje pode resultar que apesar do favoritismo ele perca que como pensamos ele ganhe ou que ele empate Como vimos o resultado final depende do acaso Fenômenos como esse são chamados de fenômenos aleatórios ou experimentos aleatórios ou fenômenos aleatórios são aqueles que mesmo repetidos várias vezes sob condições semelhantes apresentam resultados imprevisíveis o espaço a cada experimento correspondem geral vários resultados possíveis assim ao lançarmos uma moeda a dois resultados possíveis ocorrer cara ou correr coroa já ao lançarmos um dado a 6resultados possíveis um dois 345ou 6ao desses resultados possíveis damos o nome de espaço amostral ou conjunto universo representado por S Então no caso de uma moeda que temos duas opções o nosso espaço amostral dois No dado que temos 6opções de ocorrer o espaço amostral seria três E no caso daquele nosso time que a gente falou que ele tem 3opções de ocorrer Nosso espaço amostral seria três ganhar perder ou empate Então os experimentos citados anteriormente tem os seguintes espaços amostrais o lançamento da moeda o espaço amostral é cara ou coroa e o lançamento do dado o espaço amostral é um dois três quatro cinco ou seis Do mesmo modo como os dois lançamentos sucessivos de uma moeda podem obter cara nos dois lançamentos ou cara no primeiro e coroa no segundo ou coroa no primeiro e cara no segundo ou coroa nos dois lançamentos o espaço amostral seria cara a cara coroa coroa cara ou coroa coroa Algum outro caso desse aí ele vai começar a se repetir Vamos falar um pouco mais sobre o espaço amostral Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto amostral Assim se dois pertences ao espaço amostral dois é um ponto amostral de s E vamos falar agora sobre eventos Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório Vamos definir um pouco mais sobre evento Assim qualquer que seja é que é o evento se é estar contido em S E é um evento de S Se E foi igual a S ele é chamado de evento certo Se o E está contido em S ele é chamado de evento elementar E se E é igual ao espaço vazio é chamado de evento impossível no lançamento de um dado onde S é um dois 3456temos Por exemplo A dois 4C ele está contido em s Logo A é um evento de s simplesmente um evento Se B é um dois três quatro cinco 6está contido em S logo B é um evento certo de s porque B é igual a S Se temos um conjunto C igual a quatro esse conjunto C ele está contido em S Logo C é um evento elementar de S que é um evento único E se D foi igual ao conjunto vazio que está contido em S logo D é um evento impossível de S Um evento definido por uma sentença Assim os eventos acima podem ser obtidos pelas sentenças Obter um número par na face superior que é o evento A Obter um número menor ou igual a 6na face superior o evento B Obter o número 4na face superior seria o evento C e obter um número maior que 6 na face superior seria o evento D que é o evento impossível Então visto a parte de evento e de espaço amostral vamos ver o que é probabilidade Dado um aleatório sendo S o seu espaço amostral vamos admitir que todos os elementos de S têm a mesma chance de acontecer ou seja S é um conjunto equiprovável Chamamos de probabilidade de um evento A ou seja de A está contido em S O número real P de A que é a probabilidade de A Tá o quê A probabilidade de A é N de A que é o número de elementos de A dividido por N S que é o número de elementos de S Vamos alguns exemplos exemplo A considerando o lançamento de uma moeda e o evento A obter cara Temos o espaço amostral é cara ou coroa Então N de S são dois E o meu evento que é ter uma cara é um CA que é o A N de A é igual a um A probabilidade de acontecer uma cara é um sobre dois ou seja cinquenta Vamos ver um outro exemplo Então exemplo B considerando o lançamento de um dado vamos calcular a probabilidade do evento A Obter um número par na face superior Temos que o conjunto é um dois três quatro cinco seis Desse conjunto quais são os números pares Dois 4e seis O nosso espaço amostral é 6e os nossos eventos três Então a nossa probabilidade vai ser 3dividido por seis que é um sobre dois que também é cinquenta A probabilidade evento B obter um número menor ou igual a 6na face superior Temos que essa probabilidade é cem porque temos que o espaço amostral é um dois três quatro cinco 6e os eventos também um dois três quatro cinco seis 6dividido por 6dá igual a um que é cem de acontecer ou seja se você for lançar um dado é cem de certeza que você vai obter um número menor igual a 6na face superior Vamos ver que o evento C e D A probabilidade do evento C que é obter o número 4na face superior Temos que o nosso espaço amostral são 6números um dois três quatro cinco seis e o nosso evento que é o quatro que é uma vez só Temos a probabilidade de ser é o número de eventos que é um dividido pelo espaço amostral que é seis Então um sobre seis A probabilidade do evento D que é obter um número maior que 6na face superior temos que o espaço amostral vai de um até 6e o evento é o conjunto vazio que é igual a 0 É 0 sobre 6 que é igual a 0 ou seja não existe essa possibilidade vamos ver um resumo aqui pelos exemplos que acabamos de ver podemos concluir que sendo N de S igual a N a probabilidade do evento certo é igual a um a probabilidade do evento impossível é igual a 0a probabilidade de evento é qualquer é um número real Ele está maior é maior que 0e menor que um E a probabilidade de um evento elementar é qualquer lembrando que N de E é igual a um Então a probabilidade qualquer é um dividido por N de um de um evento elementar Vamos ver o que são eventos complementares Sabemos que o evento pode ocorrer ou não Sendo P a probabilidade que ele ocorra o sucesso e que a probabilidade ele não ocorra um insucesso para o mesmo evento existe sempre a relação P mais Q é igual a um ou seja a probabilidade de sucesso mas a probabilidade de sucesso é cem ou seja o insucesso vai ser um menos a probabilidade do sucesso e viceversa se a probabilidade de se realizar um evento é um quinto a probabilidade que ele não ocorra é um menos um quinto que é 4quintos então sabemos que a probabilidade de tirar o 4no lançamento de um dado é um sobre seis Logo a probabilidade de não tirar o 4no lançamento é um menos um sobre 6que é 5sobre seis Vamos ver agora a definição de eventos independentes Dizemos que dois eventos são independentes quando a realização ou a não realização de um dos eventos não afeta a probabilidade de realização do outro e viceversa Por exemplo quando lançamos dois dados o resultado obtido deles independe do resultado obtido no outro Se dois eventos são independentes a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos Assim sendo P um a probabilidade de realização do primeiro evento e P dois a probabilidade realização do segundo evento a probabilidade de que os dois eventos se realizem ao mesmo tempo é dada por P igual a P um vezes P dois Vamos ver alguns dos eventos independentes lançamos dois dados A probabilidade de obtermos um no primeiro dado é um sobre seis A probabilidade de obtermos 5no segundo dado é também um sobre seis Logo a probabilidade de obtermos simultaneamente um no primeiro E 5no segundo é um sobre 6vezes um sobre 6que é um sobre trinta e seis Vamos ver agora os eventos mutuamente exclusivos dizendo que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do outro Assim no lançamento de uma moeda o evento tirar a cara e o evento tirar a coroa são mutuamente exclusivos Já que esse ao se realizar um deles o outro não se realiza Se dois eventos são mutuamente exclusivos a probabilidade de que um ou outro se realize é igual a soma das probabilidades de cada um deles se realize A probabilidade vai ser P um mais P dois Então lançamos um dado A probabilidade de tirar o 3ou o 5é um sobre seis mais um sobre seis que é dois sobre 6ou um sobre três Pois como vimos os dois eventos são mutuamente exclusivos Com isso encerramos a nossa disciplina de estatística Qualquer dúvida procurem os tutores Façam os exercícios e estudem bastante Então muito obrigado pela atenção de vocês Até breve