·
Psicologia ·
Métodos Matemáticos
Send your question to AI and receive an answer instantly
Recommended for you
1
Teste T Student Nicotina Cigarros - Estatistica do Teste
Métodos Matemáticos
UNIA
1
Probabilidade de Acidentes de Carro em Cidade do Campo - Exercício Resolvido
Métodos Matemáticos
UNIA
1
Questão Sobre Integração: Assinale a Alternativa Correta
Métodos Matemáticos
UNIA
1
Questão sobre Probabilidades em Dados de Pesquisa COVID-19
Métodos Matemáticos
UNIA
39
Processos Estocasticos e Processos de Renovacao iid - Sistemas Reparaveis
Métodos Matemáticos
UNIA
1
Probabilidade Olhos Azuis Feminino Administracao - Exercicios Resolvidos
Métodos Matemáticos
UNIA
1
Conteúdo Programático de Álgebra Linear, Cálculo Numérico e Estatística
Métodos Matemáticos
UNIA
52
Plano de Ensino - Métodos Matemáticos: Álgebra Linear, Cálculo Numérico, Probabilidade e Estatística
Métodos Matemáticos
UNIA
1
Distribuicao Normal Gaussiana - VVF Verdadeiro ou Falso
Métodos Matemáticos
UNIA
30
Polinomio Interpolador Metodos Matematicos - Guia Completo
Métodos Matemáticos
UNIA
Preview text
Métodos cuantitativos Junior Francisco Dias Métodos quantitativos Dados Internacionais de Catalogação na Publicação CIP Dias Junior Francisco ISBN 9788584823543 1 Funções 2 Pesquisa quantitativa 3 Estatística matemática 4 Matemática aplicada I Título CDD 518 Editora e Distribuidora Educacional SA 2016 240 p D541m Métodos quantitativos Junior Francisco Dias Londrina 2016 por Editora e Distribuidora Educacional SA Todos os direitos reservados Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer modo ou por qualquer outro meio eletrônico ou mecânico incluindo fotocópia gravação ou qualquer outro tipo de sistema de armazenamento e transmissão de informação sem prévia autorização por escrito da Editora e Distribuidora Educacional SA Presidente Rodrigo Galindo VicePresidente Acadêmico de Graduação Mário Ghio Júnior Conselho Acadêmico Dieter S S Paiva Camila Cardoso Rotella Emanuel Santana Alberto S Santana Regina Cláudia da Silva Fiorin Cristiane Lisandra Danna Danielly Nunes Andrade Noé Parecerista Rogério Siqueira Chiacchio Thiago Barroso Fonte Boa Editoração Emanuel Santana Cristiane Lisandra Danna André Augusto de Andrade Ramos Daniel Roggeri Rosa Adilson Braga Fontes Diogo Ribeiro Garcia eGTB Editora 2016 Editora e Distribuidora Educacional SA Avenida Paris 675 Parque Residencial João Piza CEP 86041100 Londrina PR email editoraeducacionalkrotoncombr Homepage httpwwwkrotoncombr Unidade 1 Função afim e função quadrática Seção 11 Função Seção 12 Função afim Seção 13 Função quadrática Seção 14 Sinal mínimo e máximo da função quadrática Unidade 2 Estatística descritiva Seção 21 Amostragem Seção 22 Métodos tabulares e métodos gráficos Seção 23 Medidas de posição Seção 24 Medidas de dispersão Unidade 3 Estatística inferencial parte I Seção 31 Noções de probabilidade Seção 32 Distribuição dos estimadores Seção 33 Testes de hipóteses para a média σ2 conhecido Seção 34 Testes de hipóteses para a média σ2 desconhecido Unidade 4 Estatística inferencial parte II Seção 41 Correlação entre variáveis quantitativas Seção 42 Teste de significância Seção 43 Regressão linear Seção 44 Estudando resíduos 7 8 22 34 45 55 57 75 94 108 123 124 137 151 166 181 183 196 209 221 Sumário Palavras do autor Caro aluno seja bemvindo Nesta unidade curricular estudaremos funções e noções de estatística Utilizamos esses dois temas o tempo todo mas nem sempre nos damos conta disso Observe um exemplo simples com relação à função no supermercado ao levarmos os produtos ao caixa o atendente passa o código de barras pelo leitor e o computador registra o preço do item Nesse caso o computador desempenha o papel de uma função que recebe a informação de um código de barras e como resposta registra o preço do produto Essa é a ideia básica de qualquer função ou seja dado certo elemento que pode ser um objeto um número uma pessoa etc a função o relaciona a outro podendo este ser tão diverso quanto o primeiro Exemplos como o anterior podem ser adaptados para mostrar a aplicação das funções em qualquer relação de comércio mas não é somente nesse contexto que as funções são utilizadas Ao andar de carro você já deve ter reparado a funcionalidade do velocímetro A ação desse mecanismo também pode ser associada a uma função pois ele recebe o sinal referente à frequência dos giros da roda do carro transformando essa informação em registro de velocidade Com relação à estatística também fazemos uso da mesma em nosso cotidiano com muita frequência Ao fazer um levantamento da quantidade de pessoas que moram em uma região estamos construindo uma estatística Quando se realiza uma pesquisa eleitoral ou ainda ao se comparar preços de itens de supermercado estamos usando a estatística Para que seu estudo ocorra de modo organizado este material didático foi dividido em 4 unidades de ensino cada qual subdividida em 4 seções de autoestudo totalizando 16 seções A primeira unidade trata das funções afim e quadrática A unidade 2 aborda a estatística descritiva As unidades 3 e 4 abordam a estatística inferencial Desejamoslhe sucesso nesta empreitada U1 Função afim e função quadrática 7 Unidade 1 Função afim e função quadrática Olá aluno Na Unidade 1 deste livro didático trataremos das funções afim e quadrática Essas duas classes de funções são muito utilizadas não somente na Matemática mas também na Física na Economia na Engenharia na Administração etc Na Física por exemplo a trajetória de um projétil pode ser descrita por uma função quadrática função essa também utilizada na Engenharia para modelar a geometria de algumas estruturas a exemplo da ponte Juscelino Kubitschek Figura 11 em Brasília cujos arcos lembram o gráfico dessa função A afim por sua vez é utilizada por exemplo na modelagem de alguns problemas nas áreas econômicas e de gestão em que a utilização de outro tipo de recurso tornaria o problema muito complexo para ser resolvido Para tornar o assunto desta unidade mais interessante veja uma situação em que o emprego de funções pode facilitar a gestão de um negócio Imagine que você seja o dono de uma empresa que fabrica bonés Para melhor analisar os custos e lucros você decidiu estudar esses números utilizando funções e gráficos matemáticos buscando uma melhor organização e maiores lucros bem como um planejamento de expansão da empresa No decorrer desta unidade você será convidado a desempenhar o papel de dono da empresa e resolver os desafios inerentes à administração dela mas para tanto precisará relacionar diversas grandezas presentes no dia a dia bem como interpretar números e gráficos Convite ao estudo U1 Função afim e função quadrática 8 Seção 11 Função Diálogo aberto Para gerir melhor sua empresa você deve analisar os custos as receitas e o lucro pois sem lucro a empresa não pode ser mantida O custo da produção dos bonés é contabilizado a partir de diversos gastos como matériaprima mão de obra energia elétrica entre outros Com isso há uma relação direta entre o custo e a quantidade de bonés produzida ou seja quanto mais bonés produzidos maior o custo de produção Além do custo outro item importante na gestão da empresa é a receita que é o valor recebido com a comercialização dos bonés Vamos imaginar que o preço de venda dos bonés seja de R 3000 por unidade Qual a receita obtida com a venda de 10 unidades Com um cálculo simples podemos notar que a receita é de R 30000 10 R 3000 R 30000 Mas e se quiséssemos escrever isso em uma planilha de modo que em uma coluna tivéssemos a quantidade vendida e em outra a receita correspondente como podemos agilizar esse cálculo para diversas quantidades comercializadas Pense um pouco Por fim o lucro é a diferença entre a receita e o custo de produção Vamos supor que a partir de balanços financeiros de anos anteriores chegouse à conclusão de que mensalmente o custo com a produção é composto por um custo fixo de R 900000 mais um custo variável de R 2000 por boné Nesse caso com a produção e venda de 750 bonés em um mês temse lucro ou prejuízo E se forem produzidos e comercializados 1200 bonés Para responder a essas e outras perguntas você deve empregar conceitos de funções Vamos lá FontehttpscommonswikimediaorgwikiFilePonteJKBrasC3ADliajpg Acesso em 19 out 2015 Figura 11 Ponte Juscelino Kubitschek em Brasília U1 Função afi m e função quadrática 9 Conjuntos Para compreender a ideia de função primeiramente é necessário relembrar alguns conceitos geralmente trabalhados no ensino médio entre eles conjunto elemento e pertinência Para uma melhor compreensão observe os seguintes exemplos Conjunto das vogais A a e i o u Conjunto dos planetas do sistema solar B Mercúrio Vênus Terra Netuno Conjunto dos meses do ano C janeiro fevereiro dezembro Não pode faltar Lembrese e 271828 r 314159 No primeiro exemplo A é o símbolo utilizado para representar o conjunto das vogais cada vogal é um elemento do conjunto Podemos dizer inclusive que a vogal u pertence ao conjunto A afirmação que pode ser expressa sinteticamente por lê se u pertence a A A consoante m não pertence ao conjunto A e escrevemos lêse m não pertence a A Os exemplos mais conhecidos de conjuntos são Números naturais N 1 2 3 4 5 6 99 100 101 Números inteiros Z 7 6 1 0 1 2 5 6 7 Números inteiros sem o zero 7 6 1 1 2 5 6 7 Números racionais a a d Z e b d Z Q b lêse Q é o conjunto dos números a b tais que a pertence a z e b pertence a z Números reais 50 37 e π 2 1 2 0 1 2 1 10 9 2 π 4 7π U1 Função afi m e função quadrática 10 Números irracionais I xx d R e x d Q lêse I é o conjunto dos números x tais que x pertence a R e x não pertence a Q Em relação aos conjuntos numéricos temos as seguintes inclusões Figura 12 lêse N está contido em Figura 12 Conjuntos numéricos Fonte O autor 2015 Ainda sobre esses conjuntos numéricos nenhum elemento de Q pertence a I e nenhum elemento de I pertence a Q ou seja na interseção desses dois conjuntos não há elementos e indicamos isso por Q I Q em que Q é o conjunto vazio Por fim ao reunir os dois conjuntos Q e I obtemos o conjunto dos números reais ou seja Q U I R ambos são subconjuntos de R Pesquise mais Para mais detalhes sobre a teoria de conjuntos acesse o link disponível em httpwwwuelbrprojetosmatessencialmedioconjuntosconjunto htm Acesso em 20 out 2015 Elaborado pelo professor Ulysses Sodré da Universidade Estadual de Londrina esse site possui alguns dos fundamentos da teoria de conjuntos notações mais utilizadas e exemplos numéricos com linguagem bastante acessível Vale a pena conferir Produto cartesiano Outro conceito importante para o entendimento de uma função é o de produto cartesiano Assimile Dados dois conjuntos A e B o produto cartesiano de A por B é o conjunto dos pares ordenados ab tais que a A e b B AxB ab aA e bB Produto cartesiano de A por B U1 Função afim e função quadrática 11 Veja um exemplo numérico de produto cartesiano Exemplificando Considerando os conjuntos A 023 e B 2037 escreva o produto cartesiano de A por B Resolução A x B ab a A e b B Para a 0 temos 0 2 00 03 07 Para a 2 temos 2 2 20 23 27 Para a 3 temos 3 2 3 0 33 37 Logo Relação Outro conceito muito importante para o entendimento de uma função é o de relação Assimile Dados dois conjuntos A e B uma relação R de A em B é qualquer subconjunto de A x B ou seja Exemplificando Considere os conjuntos A 023 e B 2 0 3 7 e escreva os elementos da relação R descrita pela equação yx22x em que x A e y B Resolução Para facilitar os cálculos dos elementos de R vamos utilizar um quadro como a seguir Elementos de A Elementos de B Elementos de R x yx22x xy 0 yx2 2x02 200 00 2 yx2 2x22 220 20 3 yx2 2x32 233 33 U1 Função afi m e função quadrática 12 Portanto R 00 20 33 Compare os elementos de R com os de A B e veja que Fonte O autor 2015 Na relação R 00 20 33 dizemos que o valor 0 A está associado ao valor 0 B 2 A está associado ao valor 0 B 3 A está associado ao valor 3 B Plano cartesiano Uma relação R pode ser visualizada graficamente em um diagrama denominado plano cartesiano Veja por exemplo a representação gráfica da relação R 00 20 33 no plano cartesiano da Figura 13 Figura 13 Representação gráfica Observe que a representação de R corresponde a três pontos no plano Em relação ao ponto p 20 o par ordenado 20 corresponde a suas coordenadas O primeiro valor 2 é denominado abscissa de P e o segundo 0 a ordenada O valor x 2 corresponde à distância a que o ponto P se encontra do eixo vertical eixo y ou eixo das ordenadas e o valor y 0 à distância a que o ponto se encontra do eixo horizontal eixo x ou eixo das abscissas O ponto de coordenadas 00 é denominado origem Em um plano cartesiano as abscissas são positivas se estiverem à direita da origem negativas se estiverem à esquerda da origem ordenadas são positivas se estiverem acima da origem negativas se estiverem abaixo da origem U1 Função afi m e função quadrática 13 Pesquise mais Veja mais detalhes sobre a construção de um plano cartesiano e a localização de pontos a partir de suas coordenadas no link disponível em httpsptkhanacademyorgmathalgebraintroductiontoalgebra overviewhistalgvdescartesandcartesiancoordinates Acesso em 22 out 2015 Função A partir dos conceitos aprendidos até agora podemos definir função Assimile Dados dois conjuntos A e B uma função f de A em B denotada é uma relação tal que para cada está associado um único O conjunto A é o domínio de f denotado por Df e o conjunto B é o contradomínio de f denotado por CDf Convencionase utilizar o símbolo x para representar um elemento qualquer de A e y para representar um elemento qualquer de B Além disso se x está relacionado a y por meio da função f escrevemos yfx para simbolizar essa associação e o par ordenado correspondente será xy ou xfx Imf yByfx e xA é denominado conjunto imagem de f Além disso se yfx então y é a imagem de x obtida por meio de f Para compreender melhor considere as relações R 00 20 33 e S 00 20 33 23 de A 023 em B2037 Temos que R é uma função e S não é uma função pois o valor 2A está associado por meio de S a dois elementos de B a saber 0 e 3 Essa constatação pode ser feita mais facilmente por meio de um diagrama de Venn como os apresentados na Figura 14 Figura 14 Diagrama de Venn a da relação R b da relação S a b Fonte O autor 2015 U1 Função afim e função quadrática 14 Observe que no caso da relação S há duas setas partindo do número 2A uma relacionandoo a 0 e outra relacionandoo a 3 e isso não se encaixa na definição de função Exemplificando Considerando os conjuntos A2 1 0 1 3 e B 012439 e e a função f AB de modo que y f x x2 identifique o domínio contradomínio e a imagem de f Resolução Como visto anteriormente A é o domínio de f e B é o contradomínio logo Df A 2 1013 CDf B 012439 Para escrevermos o conjunto imagem precisamos determinar os elementos xy pertencentes à relação vide quadro ao lado Logo Imf 0149 x y x2 xy 2 y 22 4 24 1 y 12 1 11 0 y 02 0 00 1 y 12 1 11 3 y 32 9 39 Faça você mesmo Represente graficamente e elabore um diagrama de Venn para a relação com A2 1013 B 012439 e y f x x2 Lei de formação e gráfico de uma função No exemplo anterior y f x x2 é o que denominamos lei de formação ou regra de associação da função f AB Em alguns problemas conhecemos a lei de formação da função e em outros não Quando não a conhecemos em alguns casos é possível determinála a partir de informações do problema Veja um exemplo considere que em determinado posto de combustíveis o preço do etanol seja de R 240 o litro Qual é a lei de formação da função que relaciona a quantidade de etanol abastecida x e o valor a pagar vx U1 Função afi m e função quadrática 15 Fonte O autor 2015 Figura 15 Representação gráfica de v 240x A B A primeira investigação da lei de formação pode ser feita por meio da Tabela 11 Observe que para encontrarmos o valor a ser pago por determinada quantidade de combustível multiplicamos essa quantidade pelo preço de um litro Logo ao adquirirmos x litros de etanol devemos pagar 240x reais Portanto a função v AB em que A é o conjunto das quantidades de etanol e B é o conjunto dos possíveis preços possui lei de formação vx 240x Os dados apresentados na Tabela 11 com o acréscimo de alguns valores podem ser representados de forma gráfica como na Figura 15 a Observe que todos os pontos estão alinhados e se utilizássemos inúmeros valores intermediários para x ou ainda se considerássemos x R teríamos uma linha reta como na Figura 15 b Para fazer essa constatação de forma mais dinâmica acesse o link disponível em httptubegeogebraorgm1886475 acesso em 23 out 2015 A linha reta da Figura 15 b é o que denominamos gráfico da função v Mais formalmente o gráfico de uma função f AB é o conjunto Gf xy x A y B e y f x U1 Função afi m e função quadrática 16 Exemplificando Uma empresa de táxi cobra pela corrida um valor fixo de R 485 bandeirada mais um valor variável de R 290 por quilômetro rodado Construa a lei de formação da função que retorna o preço fx para uma distância x percorrida Além disso escreva o domínio a imagem e esboce o gráfico de f Calcule também o valor a ser pago por uma corrida de 6 km Resolução A corrida é composta por um valor fixo de R 485 e um valor variável de R 290 por quilômetro rodado matematicamente essas informações podem ser traduzidas da seguinte forma fx 485 290 x em que x é a distância percorrida e fx é o preço Essa é a lei de formação A função f AB é tal que A domínio é o conjunto com todos os valores possíveis e adequados ao problema que pode ser qualquer quantidade maior ou igual a zero ou seja x 0 Logo A x d R x 0 A imagem de f é o conjunto Imf B que possui todos os possíveis preços a serem pagos cujo mínimo é R 485 não há valor máximo Logo Imf x R x 485 Para esboçar o gráfico de f montamos uma tabela com alguns valores de x fx e esboçamos os pares ordenados em um plano cartesiano Figura 16 Distância km Preço R 0 f04852900485 1 f14852901775 2 f248529021065 3 f348529031355 Fonte O autor 2015 Figura 16 Gráfico de f Por fim o valor a ser pago por uma corrida de 6 km é f 6 485 290 6 2225 R 2225 Pesquise mais Para esclarecer possíveis dúvidas leia mais sobre relações funções e seus gráficos em httpwwwuelbrprojetosmatessencialmedio funcoesfuncoeshtm Acesso em 23 out 2015 U1 Função afi m e função quadrática 17 Vamos retomar o problema proposto no início desta seção Um dos questionamentos feitos foi como agilizar os cálculos das receitas para diversas quantidades de bonés comercializados Como fazer isso em uma planilha por exemplo Lembrese de que o preço de venda de cada boné é R 3000 Se nenhum boné for vendido não há receita Se 1 boné for vendido a receita é R 3000 Se 2 bonés forem vendidos a receita é R 6000 Se x bonés forem vendidos a receita é x R3000 R3000 x Portanto a função receita é Rx 30x Esse cálculo pode ser agilizado em uma planilha como na Figura 17 Sem medo de errar Figura 17 Planilha de cálculo da receita de bonés vendidos a R 3000 por unidade a b c a b c a b c a b c Fonte O autor 2015 Observe que na Figura 17 os valores de x estão inseridos na coluna A os valores de yRx são calculados na coluna B sendo cada um U1 Função afim e função quadrática 18 calculado pela função R A sequência a b e c da Figura 17 apenas ilustra como agilizar os cálculos Outro questionamento feito foi em relação ao lucro mas para isso precisamos determinar a função custo traduzindo matematicamente a informação o custo com a produção é composto por um custo fixo de R 900000 mais um custo variável de R 2000 por boné Observe que esse problema é semelhante ao exemplo da corrida de táxi trabalhado nesta seção Por analogia podemos escrever a função custo da seguinte forma Cx 9000 20 x em que x é a quantidade de bonés produzida Como o lucroprejuízo é a diferença entre a receita e o custo podemos analisar o lucroprejuízo na produção e venda de 750 ou 1200 bonés em um mês 750 bonés receita custo lucro receita custo 22500 24000 1500 1200 bonés Rx 30 x R1200 30 1200 36000 receita Cx 9000 20 x C 1200 900020 1200 33000 custo lucro receita custo 36000 33000 3000 Portanto ao produzir e vender 750 bonés o prejuízo é de R 150000 no caso de 1200 bonés o lucro é de R 300000 Pesquise mais Veja mais detalhes de como utilizar funções e agilizar cálculos no Excel nos links a seguir Visão geral de fórmulas no Excel Disponível em httpssupportoffice comptbrarticleVisC3A3ogeraldefC3B3rmulasnoExcel ecfdc708916249e8b993c311f47ca173uiptBRrsptBRadBR Acesso em 26 out 2015 Preencher dados automaticamente nas células da planilha Disponível em httpssupportofficecomptbrarticlePreencherdados automaticamentenascC3A9lulasdaplanilha74e31bddd993 45daaa8235a236c5b5dbomktptBRuiptBRrsptBRadBR Acesso em 26 out 2015 U1 Função afi m e função quadrática 19 Avançando na prática Pratique mais Instrução Desafi amos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas Atualizando preços 1 Competências de Fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio logico e quantitativo 2 Objetivos de aprendizagem Aplicar o conceito de função na atualização de preços 3 Conteúdos relacionados Função Lei de formação de uma função 4 Descrição da SP Em determinado supermercado será realizada uma remarcação de preços para embutir o aumento da energia elétrica no preço de venda Após alguns cálculos foi decidido que cada produto deveria sofrer um aumento de 2 e para agilizar o trabalho os novos preços seriam calculados com a ajuda de uma planilha Veja na Figura 18 alguns preços a serem ajustados Figura 18 Tabela de preços Fonte O autor 2015 Qual função deve ser inserida na célula C2 para que o preço da célula B2 seja reajustado em 2 Qual o preço ajustado de cada produto U1 Função afim e função quadrática 20 5 Resolução da SP Suponha que o preço atual de um produto seja x e que o preço ajustado seja Px O preço atual corresponde a 100 já o preço ajustado 2 corresponde a 102 Logo por regra de três Ao calcular a função Px para determinado preço ela o reajusta em 2 Adaptando a função para a planilha temos que na célula C2 devemos inserir a função 102B2 Para os preços apresentados na Figura 18 temos Item Preço atual Preço ajustado Produto 1 R 2000 P2000 102 2000 2040R 2040 Produto 2 R 2200 P2200 102 2200 2244R 2244 Produto 3 R 1600 P1600 102 1600 1632R 1632 Produto 4 R 1800 P1800 102 1800 1836R 1836 Produto 5 R 2500 P2500 102 2500 2550R 2550 Lembrese Uma regra de três pode ser utilizada quando temos duas grandezas proporcionais sendo que de uma delas conhecemos dois valores e da outra um valor A regra de três é utilizada para determinar o quarto valor Veja um breve resumo sobre esse assunto em httpeducacaoglobo commatematicaassuntomatematicabasicaregradetreshtml Acesso em 27 out 2015 Faça valer a pena 1 Os conjuntos numéricos são de grande importância para a matemática principalmente no estudo das funções Os tipos mais utilizados são números naturais N número inteiros Z números inteiros exceto o zero Z números racionais Q números irracionais I números reais R Sobre os conjuntos numéricos e seus elementos é correto afirmar que U1 Função afim e função quadrática 21 a 1 N b 2 I c d 0Q e 0Z 2 A reunião do conjunto A com o conjunto B é definida como o conjunto C xx d A ou x d B e a simbolizamos por C A U B Sendo A 12346 e B 02458 assinale a alternativa que contém o conjunto A U B a 01234568 b 12346 c 02458 d 013458 e 24 3 O produto cartesiano de A por B é o conjunto dos pares ordenados ab tais que a d A e b d B De acordo com o trecho anterior assinale a alternativa que contém o produto cartesiano de A 125 por B 346 a 314161324262354565 b 131416 c 131416232426535456 d 232426 e 535456 U1 Função afim e função quadrática 22 Seção 12 Função afim Diálogo aberto Você se lembra de que na seção anterior estudou o lucro e a receita da sua fábrica de bonés E que para fazer isso foi necessário relembrar alguns conjuntos numéricos compreender a ideia de produto cartesiano estudar as relações que são subconjuntos dos produtos cartesianos e as funções que são casos específicos de relações além de representar esses conjuntos graficamente no plano cartesiano e no diagrama de Venn Pois bem tudo isso abriu caminho para outras possibilidades Imagine que você precise construir uma apresentação contendo um estudo sobre as finanças da empresa que será usada para convencer seu sócio a aumentar o investimento na fábrica e expandir o negócio Um gráfico mostrando os possíveis lucros com o aumento da produção poderia ser interessante e deixálo empolgado Além disso você poderia incrementar a apresentação com informações detalhadas sobre os lucros ou prejuízos e mostrar a ele que você entende do assunto Quanto mais informação maior o poder de convencimento concorda Pense um pouco Será possível determinar uma função que relacione a quantidade produzida e comercializada com o lucro Será que independentemente da quantidade produzida e comercializada há lucro ou para determinadas quantidades há prejuízo A partir de que quantidade há lucro Se aumentarmos a produção em 200 bonés ao mês nos próximos três meses indo dos atuais 600 para 1200 quanto lucro teremos no trimestre Essas são algumas das perguntas cujas respostas poderiam estar em sua apresentação Entretanto para realizar tudo isso temos que estudar mais a fundo as funções e mais especificamente a função afim e suas propriedades Vamos lá Não pode faltar A função afim é um tipo específico de função polinomial e por este motivo é também denominada função do 1 grau ou ainda função polinomial de grau 1 Mais rigorosamente definimos U1 Função afim e função quadrática 23 Assimile Uma função afim é uma função fRR cuja lei de formação é fx ax b em que a d R não nulo é denominado coeficiente angular e b d R é denominado coeficiente linear O domínio e contradomínio de uma função afim podem ser intervalos de números reais Pesquise mais Saiba mais sobre intervalos de números reais acessando o site disponível em httpwwwcasadascienciasorgdmdocumentsintervalo1011 pdf Acesso em 2 nov 2015 Uma característica interessante da função afim é a forma do seu gráfico que é uma reta IEZZI et al 1977 p 96A Veja um exemplo Exemplificando Dada a função afim fx 2x 1 escreva os pares ordenados xy tais que x d A 21012f Df e y fx Em seguida esboce o gráfico de f Resolução Para escrever os pares ordenados solicitados podemos fazer uso do quadro a seguir Para esboçar o gráfico da função primeiramente marcamos os pontos determinados no quadro e depois traçamos uma reta passando por eles como mostra a Figura 19 Para uma visualização mais dinâmica da construção do gráfico dessa função acesse httptubegeogebraorgm1980917 Acesso em 4 nov 2015 Fonte O autor 2015 Figura 19 Gráfico de fx 2x 1 x yfx 2x 1 xy 2 y f2 2 2 1 3 2 3 1 y f1 21 1 1 1 1 0 y f0 2 0 1 1 01 1 y f1 2 1 1 3 13 2 y f2 2 2 1 5 25 U1 Função afim e função quadrática 24 Da geometria sabese que para determinar uma reta bastam dois pontos Logo para esboçar o gráfico do exemplo anterior e o de qualquer função afim basta determinarmos dois pares ordenados e não mais que isso Faça você mesmo 1 Esboce o gráfico da função fx 3x 2 Assim como podemos esboçar o gráfico de uma função afim a partir de sua lei de formação também é possível determinar sua lei de formação a partir de seu gráfico Para executar essa tarefa é necessário determinar a e b de modo que a função fx ax b possua o gráfico desejado Veja um exemplo Exemplificando Com base no gráfico da função afim f representado na Figura 110 determine sua lei de formação Resolução O primeiro detalhe importante a ser observado é que a função é afim ou seja seu gráfico é uma reta e sua lei de formação é fx ax b Para determinar os valores de a e b em que o gráfico dessa função passe pelos pontos destacados na Figura 110 podemos escolher dois pontos quaisquer escolheremos os pontos de coordenadas 11 e 13 Lembrese de que o gráfico de uma função é formado pelos pontos xy em que y fx e x d Df Para o ponto de coordenadas 11 temos fx ax b f1 a1 b 1 a b 13 temos fx ax b f 1 a 1 b 3 a b Observe que temos duas equações lineares com duas incógnitas ou seja um sistema linear Neste caso podemos simplificar o sistema somando as duas equações como segue U1 Função afim e função quadrática 25 Fonte O autor 2015 Figura 110 Gráfico de f Como b 1 temos a b 1 a 1 1 a 11 2 Portanto a função procurada é fx 2x 1 Faça você mesmo 2 Determine a lei de formação da função afim cujo gráfico passa pelos pontos 28 e 24 Função afim crescente e função afim decrescente Uma característica interessante de ser observada em uma função afim é se ela é crescente ou decrescente Como essa característica é estudada para qualquer função podemos compreendêla de modo geral e depois ver como ela se aplica à função afim De acordo com Thomas Weir e Hass 2012 p 6 Assimile Seja f uma função definida em um intervalo I e sejam x1 e x2 dois pontos em I 1 Se fx2 fx1 sempre que x1x2 então f é crescente em I 2 Se fx2 fx1 sempre que x1x2 então f é decrescente em I Essa definição pode ser facilmente visualizada na Figura 111 No caso fx é crescente e gx é decrescente em I Decorre da definição anterior que dado x1x2 a função fx é crescente pois U1 Função afi m e função quadrática 26 gx é decrescente pois Fonte O autor 2015 Figura 111 Função crescente e função decrescente Simplificadamente fx é crescente porque seus valores aumentam com o aumento dos valores de x e gx é decrescente porque seus valores diminuem conforme os valores de x aumentam Observe as inclinações das funções fx e gx Podemos denotar Δy f x2 fx1 ou Δy gx2 gx1 variação de y e Δx x2 x1 variação de x e utilizar a razão Δy Δx para avaliar se a função é crescente ou decrescente Uma grande vantagem de utilizar a razão Δy Δx é que ela está diretamente relacionada à lei de formação da função afim sendo inclusive muito utilizada para determinar a lei de formação a partir do gráfico Mais precisamente dada uma função afim fx ax b em relação aos seus coeficientes temos Assimile a Δy Δx se a 0 a função é crescente e se a 0 a função é decrescente f 0 a 0 b b Você pode encontrar a demonstração da igualdade a 3y 3x disponível em httpwwwprofessoresuffbrhjbortol disciplinas20101gma00116aulasgma00116aula124upcolor pdf Acesso em 6 nov 2015 U1 Função afim e função quadrática 27 Exemplificando Sabendo que os pontos de coordenadas 13 e 25 pertencem ao gráfico de uma função afim qual é a lei de formação dessa função Resolução Primeiramente calculamos as diferenças Δy e Δx e o coeficiente a ΔyΔx Δy fx2 fx1 5 3 2 Δx x2 x1 2 1 1 a Δy Δx 21 2 Substituindo fx 2x b e além disso f 1 3 2 1 b 3 2 b 3 b 1 Portanto a lei de formação da função é f x 2x 1 Faça você mesmo 3 Volte ao exemplo da Figura 110 e determine a lei de formação da função f utilizando as igualdades a Δy Δx e b f0 Ângulo associado a uma função afim A toda função afim podemos associar um ângulo q que está diretamente relacionado ao seu gráfico Esse ângulo pode ser medido a partir da horizontal no sentido antihorário como ilustra a Figura 112 Fonte O autor 2015 Figura 112 Ângulo relacionado a uma função afim Dica Para visualizar a localização desse ângulo de forma mais dinâmica acesse httptubegeogebraorgm1995699 Acesso em 06 nov 2015 Quando o gráfico é de uma função afim há apenas duas possibilidades para o ângulo q formado com a horizontal 0o q 90o a exemplo U1 Função afi m e função quadrática 28 do ângulo α da Figura 112 ou 90o q 180o a exemplo do ângulo β da Figura 112 Se q 0o ou seja se o gráfico for horizontal a função é denominada constante e sua lei de formação é fx b em que b pertence a R R conjunto dos números reais Se q 90o ou seja se o gráfico for vertical não se trata de uma função mas de uma relação Zero e sinal da função afim Observe na Figura 113 que o gráfico de fx ax b cruza o eixo horizontal eixo x no ponto P É perceptível que a ordenada de P é igual a 0 ou seja y 0 Mas e a abscissa de P qual é seu valor A abscissa de P é o que denominamos zero da função Assimile O zero de uma função fx é o valor x0 tal que fx0 0 Atenção Alguns livros utilizam a denominação raiz no lugar de zero Contudo o mais comum é dizer que funções possuem zeros e equações possuem raízes Para uma função afim se x0 é o seu zero temos Na linguagem matemática para fx crescente temos a quando x0 x ou ainda fx fx0 0 fx fx0 0 b quando x x0 ou ainda f x0 f x 0 f x f x0 0 Simplificadamente se fx é crescente e fx0 0 fx 0 para x x0 e fx 0 para x x0 A mesma análise pode ser feita para o caso de fx decrescente e ambos os casos estão ilustrados na Figura 114 De modo mais simples para a região do plano cartesiano em que o gráfico de fx está acima do eixo das abscissas isto é fx tem valores maiores que zero dizse que o sinal da função é positivo E para regiões em que fx 0 dizse que a função tem sinal negativo Fonte O autor 2015 Figura 113 Ponto de interseção com o eixo x U1 Função afi m e função quadrática 29 Figura 114 Sinal da função afim a fx crescente b fx decrescente Fonte O autor 2015 Exemplificando Dada a função fx 5x 10 determine a o zero b os valores de x para os quais fx 0 c os valores de x para os quais fx 0 Resolução Lembrese de que o zero da função é um valor x0 tal que fx0 0 Além disso se a função é crescente fx 0 para x x0 e fx 0 para x x0 Aplicando estes conceitos temos a f x0 0 5x0 10 0 5x0 10 x0 105 2 Logo 2 é o zero de fx b Como a função é crescente pois a 5 0 fx 0 para todos os valores x x0 2 c fx 0 para todos os valores x x0 2 Dica Esboce o gráfico da função e verifique as respostas graficamente Pesquise mais Veja mais sobre funções e em especial funções afim emhttp cejarjcecierjedubrmaterialimpressomatematicacejamatematica unidade6pdf Acesso em 10 nov 2015 E acesse também este link httpcejarjcecierjedubrmaterialimpressomatematicaceja matematicaunidade9pdf Acesso em 10 nov 2015 U1 Função afim e função quadrática 30 Vamos retomar o problema proposto no início desta seção imaginese como o dono da fábrica de bonés e suponha que você deva convencer seu sócio a expandir o negócio Para isso você deve fazer uma apresentação contendo a Um gráfico com os lucrosprejuízos para cada quantidade produzida b Determinar intervalos de produção para os quais há lucro ou prejuízo c O lucro do trimestre com o aumento da produção dos atuais 600 bonés para 1200 bonés ao mês com acréscimo de produção de 200 bonés mensais Primeiramente para esboçar um gráfico com o lucroprejuízo é necessário construir a função lucro Lx Rx Cx ou seja a diferença entre a receita e o custo de produção Sem medo de errar Lembrese Na seção anterior Seção 11 você estudou que a função receita era Rx 30 x e a função custo Cx 9000 20 x em que x é a quantidade de bonés Logo dado Rx 30 x e Cx 9000 20x a função lucro é Lx 30 x 9000 20 x 10x 9000 Podemos construir uma tabela com alguns valores de x e os respectivos lucrosprejuízos para esboçar o gráfico como na Figura 115 Com isso resolvemos o item a Fonte O autor 2015 Figura 115 Gráfico de Lx 10x 9000 U1 Função afim e função quadrática 31 Foi traçada uma linha junto ao gráfico de Lx para melhorar a visualização Entretanto o correto nesse caso seriam somente pontos isolados pois só faz sentido para essa função a atribuição de valores inteiros para x pois se trata da quantidade de bonés produzida Observe que o gráfico de Lx cruza o eixo x no ponto de coordenadas x00 em que x0 é o zero da função Para este problema o zero da função indica a quantidade produzida para a qual não há lucro nem prejuízo Para quantidades maiores que x0 há lucro e para quantidades menores prejuízo Para determinar x0 resolvemos a equação Lx0 0 como segue Lx0 0 10x0 9000 0 10x0 9000 x0 900010 900 Portanto ao produzir 900 bonés o lucro é zero ao produzir menos de 900 há prejuízo e ao produzir mais há lucro ficando resolvido o item b Para chegar a 1200 bonés ao mês a produção deve aumentar 200 bonés por mês nos próximos três meses sendo produzidos um total de 800 bonés no primeiro mês 1000 bonés no segundo mês 1200 bonés no terceiro mês Logo o lucro no trimestre será dado pela expressão L800 L1000 L1200 Temos L800 L1000 L1200 10 800 9000 10 1000 9000 10 1200 9000 1000 1000 3000 3000 Portanto respondendo o item c haverá um lucro de R 300000 no trimestre Dica Pense no fato de um dia você estar em uma empresa e ter de convencer alguém a concordar com suas ideias Uma demonstração com embasamento matemático como a apresentada não seria muito mais convincente Pense em como mostrar suas ideias na forma de uma apresentação com dados tabelas e gráficos Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as ativi dades e depois as compare com as de seus colegas U1 Função afim e função quadrática 32 Melhor Negócio 1 Competências de fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio logico e quantitativo 2 Objetivos de aprendizagem Determinar uma função cuja análise de sinal resolva o problema proposto 3 Conteúdos relacionados Sinal da função afim 4 Descrição da SP Uma empresa de aluguel de veículos possui duas opções de locação 1ª R 9000 a diária livre de quilometragem 2ª R 4000 a diária mais R 050 por quilômetro rodado Um cliente vai até essa empresa para saber as seguintes informações a Para quais distâncias é mais vantajosa a 1ª opção E a 2ª opção b Para qual distância percorrida no dia ambas as opções geram o mesmo custo Imagine que você seja o funcionário dessa empresa Como orientar o cliente 5 Resolução da SP Perceba que há uma semelhança entre esse problema e o da fábrica de bonés A primeira pergunta que você deve se fazer é quais funções relacionam a distância percorrida e o preço a pagar para ambas as opções de locação Vamos denotar por f e g as funções para a 1ª e 2ª opções respectivamente e por x a distância percorrida Temos fx 9000 função constante pois independe da quilometragem gx 4000 050x custo fixo de R 4000 mais custo variável de R 050 Agora considere a função diferença dx fx gx 9000 4000 050x 050x 5000 Se para dado x a diferença for negativa é mais vantajosa a 1ª opção pois dx 0 fx gx 0 fx gx positiva é mais vantajosa a 2ª opção pois dx 0 fx gx 0 fx gx nula ou seja igual a zero ambas as opções geram o mesmo custo pois dx 0 fx gx 0 fx gx Sendo x0 o zero de dx temos dx0 0 050x0 5000 0 050x0 5000 Portanto para 100 quilômetros percorridos no dia o custo é o mesmo em ambas as opções ficando respondido o item b Como o coeficiente angular de dx é a 050 0 a função é decrescente e como consequência positiva à esquerda de x0 100 e negativa à direita desse mesmo valor Podemos concluir a partir disso que para distâncias menores que 100 quilômetros xx0 100 é mais vantajosa a 2ª opção e para distâncias maiores xx0 100 é mais vantajosa a 1ª opção ficando respondido o item a Essa conclusão pode ser observada na Figura 116 U1 Função afim e função quadrática 33 5 Resolução da SP Fonte O autor 2015 Figura 116 Gráfico de dx 050x 5000 Faça valer a pena 1 Estimouse que em 22 dias foram desperdiçados 572 litros de água por uma torneira pingando A partir dessa estimativa pode ser desejado saber o quanto é desperdiçado em 4 dias em 37 dias ou em x dias Pensando nisso assinale a alternativa que relaciona a quantidade de dias x e o volume de água Vx desperdiçado por essa torneira a Vx 4x b Vx 22x c Vx 26x 2 Lembrese de que função afim é aquela cuja lei de formação é fx ax b em que a e b são os coeficientes Sendo o coeficiente linear igual a 2 o coeficiente angular igual a 1 e dado x 4 assinale a alternativa que contém as coordenadas de um ponto pertencente ao gráfico de f a 43 b 43 c 41 3 O preço de uma corrida de táxi é composto pelo valor da bandeirada R 500 mais um valor variável que depende da distância percorrida R 300 km Considerando essas informações e que por determinada corrida foram pagos R 2900 qual foi a distância percorrida a 5 km b 8 km c 9 km d Vx 34x e Vx 37x d 42 e 40 d 10 km e 12 km U1 Função afi m e função quadrática 34 Seção 13 Função quadrática Diálogo aberto Lembrase que na aula anterior você precisava convencer seu sócio a aumentar o investimento na fábrica de bonés e ampliar os negócios Pois é o resultado foi melhor que o esperado Vocês saíram do prejuízo de quando produziam 600 bonés ao mês e começaram a ganhar dinheiro ao produzir 1200 Seu sócio ficou tão feliz que vocês aumentaram ainda mais a produção chegando a 2400 bonés por mês Com uma boa margem de lucro agora é seu sócio quem quer convencêlo a ampliar o negócio ainda mais aumentando o espaço físico indo dos atuais 300 m² como mostra a Figura 117 para 750 m² futuramente Devido aos equipamentos que estão instalados e o terreno onde o galpão se encontra o plano é aumentar tanto o comprimento quanto a largura em um valor x ainda desconhecido conforme Figura 118 Como seu sócio não entende tanto do assunto pediu para que você determinasse a medida x que deve ser acrescida e o custo desse investimento uma vez que se estima o valor de R 72585 por metro quadrado a ser construído Aqui vão algumas dicas para resolver este problema você precisa estudar um novo tipo de função a quadrática Além disso para facilitar todo o processo você pode se focar em responder as seguintes perguntas Fonte O autor Figura 117 Galpão Figura 118 Esboço do projeto Fonte O autor U1 Função afi m e função quadrática 35 a Que função relaciona a medida x e a área total do galpão incluindo a atual E qual função relaciona x com o valor do investimento Quais os gráficos dessas funções b Qual medida x proporcionará uma área total de 750 m² Bons estudos e sucesso neste planejamento As funções quadráticas são uma classe de funções muito utilizadas em problemas de cálculo de área em cálculos de erro no estudo do movimento de projéteis entre outros Assim como a função afim essa também é uma função polinomial mas de grau 2 motivo pelo qual é conhecida popularmente como de 2 grau Segundo Iezzi et al 1977 p 123 Não pode faltar Assimile Uma aplicação ou relação f de R em R recebe o nome de função quadrática ou do 2º grau quando associa a cada o elemento ax2 bx c d R em que a 0 Alternativamente podemos dizer que uma função quadrática é aquela cuja lei de formação é com a 0 Os valores a b e c são denominados coeficientes e ax2 é o termo dominante Reflita Por que para definir a função quadrática é especificado que a 0 Uma característica importante das funções quadráticas é seu gráfico que apresenta uma curva plana denominada parábola SODRÉ 2010 p 1 Para definir uma parábola são necessários dois objetos uma reta diretriz e um ponto que chamamos de foco conforme Figura 119 Não abordaremos aspectos formais da construção de uma parábola mas você pode se aprofundar neste assunto acessando httpmathworld wolframcomParabolahtml Acesso em 14 nov 2015 Para compreender melhor o gráfico de uma função quadrática veja o exemplo a seguir Fonte O autor 2015 Figura 119 Parábola U1 Função afi m e função quadrática 36 Exemplificando Esboce o gráfico da função fx x2 4x 5 Resolução Primeiramente construímos um quadro com alguns valores de x os respectivos y fx e as coordenadas xy Observe x y fx x2 4x 5 xy 3 32 43 5 2 32 4 42 44 5 5 45 5 52 45 5 10 510 x y fx x2 4x 5 xy 1 12 4 1 5 10 1 10 0 02 40 5 5 05 1 12 41 5 2 12 2 22 42 5 1 21 Fonte O autor 2015 Figura 120 Gráfico de fx x2 4x 5 Observando a Figura 120 há alguns elementos importantes o ponto de coordenadas 21 é o vértice e a linha vertical x 2 é o eixo de simetria da parábola No caso do exemplo anterior dizemos que a parábola tem concavidade para cima e isso é controlado pelo coeficiente do termo dominante ou seja o valor de a Veja a seguir alguns gráficos de funções quadráticas da forma para Figura 121 a e para Figura 121 b Fonte O autor 2015 Figura 121 Gráficos de fx ax2 4x 5 para vários valores de a a a0 b a0 Com base nas coordenadas calculadas marcamos os pontos e traçamos a parábola conforme Figura 120 U1 Função afi m e função quadrática 37 Perceba na Figura 121 que quanto mais próximo de zero está o valor de a mais aberta é a parábola e quanto mais distante mais fechada Além disso Assimile Assimile Se o valor de a é Positivo a 0 a concavidade da parábola é voltada para cima Negativo a 0 a concavidade da parábola é voltada para baixo O coeficiente c é igual à ordenada do ponto de interseção do gráfico de fx ax2 bx c com o eixo y Observe ainda na Figura 121 que em todos os casos o ponto de coordenadas 05 pertence ao gráfico de fx ax2 4x 5 e que isso se deve ao fato de o coeficiente c ser igual a 5 Veja se x 0 temos f0 a02 40 5 5 não importando o valor de a ou b Assim como podemos determinar a lei de formação de uma função afim observando seu gráfico também é possível fazer o mesmo com uma função quadrática Veja um exemplo Exemplificando Determine a lei de formação da função quadrática cujo gráfico é apresentado na Figura 122 Fonte O autor 2015 Figura 122 Gráfico de fx Resolução Observe que o ponto de interseção do gráfico de fx ax2 bx c com o eixo y possui coordenadas 03 Logo c 3 e fx ax2 bx 3 U1 Função afi m e função quadrática 38 Além disso como os pontos de coordenadas 10 e 12 pertencem ao gráfico de fx temos f10a12 b130a b30ab3 f12a12b132ab32ab32ab321 Segue que a e b são tais que Adicionando as equações temos a b a b 3 1 2a 4 a 4 2 2 Com a 2 obtemos a b 32 b 3 b 1 Por fim concluímos que fx 2x2 x 3 Para compreender melhor a relação entre os coeficientes da função quadrática e seu gráfico acesse o objeto disponível no link http tubegeogebraorgm2078515 Acesso em 16 nov 2015 Zeros da função quadrática Lembrese Na seção anterior você aprendeu que denominamos zero da função o valor da abscissa do ponto de interseção do gráfico com o eixo x No caso x0 será um zero de fx se fx0 0 Além disso para uma função afim fx ax b o único zero era x0 ba Observe agora na Figura 122 que o gráfico de fx 2x2 x 3 corta o eixo em dois pontos e não somente em um como na função afim Entretanto nem sempre isso ocorre O gráfico de uma função quadrática pode tocar o eixo das abscissas em dois em um ponto ou até não o tocar como mostra a Figura 123 Fonte O autor 2015 Figura 123 Zeros de uma função quadrática a dois zeros b um zero c nenhum zero U1 Função afim e função quadrática 39 Para obter os zeros de uma função quadrática quando existem utilizamos a fórmula do discriminante popularmente conhecida como Fórmula de Bhaskara Assimile Dada uma função quadrática os valores de x para os quais fx 0 são ou ainda O valor Δ b2 4ac é denominado discriminante ou delta Veja um exemplo de como utilizar a fórmula do discriminante Exemplificando Dada as funções a seguir determine seus zeros caso existam a fx x2 6x 5 b gx 2x2 12x 18 c hx x2 2x 3 Resolução a Para esta função os coeficientes são a 1 b 6 e c 5 Logo o discriminante será Δ b2 4ac 62 4 1 5 36 20 16 Substituindo o valor Δ 16 temos Portanto os zeros de f são x1 5 e x2 1 b No caso da função g os coeficientes são a 2 b 12 e c 18 Assim o discriminante será e U1 Função afim e função quadrática 40 Portanto g possui um único zero e este é x3 c Para a função h os coeficientes são a 1 b 2 e c 3 Com isso segue que Δ b2 4ac 22 4 1 3 4 12 8 e Como 8dR isto é não é um número real a expressão anterior não faz sentido para os números reais e em consequência a função h não possui zeros reais Atenção No exemplo anterior a função fx x2 6x 5 possui discriminante positivo Δ 16 0 e dois zeros Já a função gx 2x2 12x 18 possui discriminante nulo Δ 0 e um único zero Por fim o discriminante da função hx x2 2x 3 é negativo Δ 8 0 e esta não possui zeros reais Esta observação é válida para toda função quadrática e pode ser compreendida geometricamente com a Figura 123 Em a o discriminante é positivo b o discriminante é nulo c o discriminante é negativo Faça você mesmo 1 Determine os zeros e esboce o gráfico das funções a seguir a fx x2 8x 12 b gx x2 6x 12 Pesquise mais Para saber mais sobre as funções quadráticas acesse o material disponível no link httpbitprofmatsbmorgbrxmluibitstream handle123456789465201100355FABIOANTONIOLEAO SOUSApdfsequence1 Acesso em 17 nov 2015 Além disso você pode encontrar uma demonstração simples da fórmula do discriminante em httpwwwufrgsbrespmatdisciplinasfuncoes modelagemmoduloIVfundamentos4fhtm Acesso em 17 nov 2015 Agora que já tratamos de vários detalhes acerca da função quadrática vamos retomar o problema proposto no início desta seção Sem medo de errar U1 Função afi m e função quadrática 41 Uma das perguntas que você deveria responder era qual função relaciona a medida x e a área total do galpão incluindo a atual Para começar a área de um retângulo é obtida multiplicando as medidas de dois lados consecutivos No caso da área atual a medida 300 m² é obtida multiplicando 20 m por 15 m Para calcular a área futura multiplicamos 20 x m por 15 x m Logo a função que relaciona a medida x em metros e a área futura em metros quadrados é Ax 20 x 15 x 20 x 15 20 x x 20 15 x 15 20 x x x x2 35x 300 Você também deveria obter a função que relaciona a medida x com o valor do investimento Para construir determinada área o investimento realizado pode ser calculado multiplicando a área correspondente pelo valor do metro quadrado que é R 72585 Logo a função investimento Ix é obtida multiplicando 72585 valor do metro quadrado pela área que será acrescida Veja Para esboçar os gráficos de Ax e Ix calculamos alguns pares ordenados os marcamos no plano cartesiano e traçamos a parábola como na Figura 124 Figura 124 Área acrescida e investimento a quadro de valores b função Ax c função Ix a x Ax Ix 0 300 000 1 336 2613060 2 374 5371290 3 414 8274690 4 456 11323260 5 500 14517000 b c Fonte O autor 2015 U1 Função afi m e função quadrática 42 Por fim a última informação que você deveria obter é a medida x que proporcionará uma área total de 750 m² Como temos a função área Ax basta igualar Se definirmos fx x2 35x 450 determinar x para o qual Ax 450 é equivalente a calcular o zero de f Logo Observe que f possui dois zeros e portanto há também dois valores de x para os quais Ax 450 Contudo para o problema prático só faz sentido utilizarmos valores positivos pois x é uma medida de comprimento Concluímos deste modo que para a área futura do galpão ser de 750 m² tanto a largura quanto o comprimento devem ser acrescidos em 10 m Faça você mesmo 2 Para x 10 m qual é o valor do investimento na reforma do galpão Avançando na prática Pratique mais Instrução Desafi amos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas Movimento de projéteis 1 Competências de fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcio nar o desenvolvimento do raciocínio logico e quantitativo U1 Função afi m e função quadrática 43 2 Objetivos de aprendizagem Aplicar os conhecimentos sobre função quadrática no estudo do movimento de projéteis 3 Conteúdos rela cionados Função quadrática zero 4 Descrição da SP Determinado projétil é lançado para o alto e para frente descrevendo uma trajetória parabólica A equação que fornece a altura do projétil em função da distância hori zontal x a que ele se encontra do ponto de lançamento é Com base nessas informações que distân cia horizontal o projétil percorrerá até que toque o solo 5 Resolução da SP Vamos primeiramente observar o gráfi co dessa função na Figura 125 Fonte O autor 2015 Figura 125 Gráfico de fx Note que após o lançamento o objeto sobe até certa altu ra e cai novamente até atingir o solo num ponto P sendo a abscissa desse ponto o zero da função Calculando o zero temos O valor de x1corresponde ao ponto de partida e o valor de x2 é a abscissa do ponto P Portanto o projétil percorrerá 30 m até atingir o solo U1 Função afi m e função quadrática 44 Faça valer a pena 1 Um bloco retangular de concreto tem dimensões x 3 x 2 e x conforme Figura 126 A função Ax que fornece a área total da superfície do bloco é a Ax 4x2 4x 12 b Ax 6x2 4x 12 c Ax 6x2 4x 12 d Ax 4x2 4x 12 e Ax 8x2 4x 12 2 Uma caixa de papelão tem suas dimensões representadas na Figura 127 A função Vx que relaciona x com o volume da caixa e o respectivo volume para x 20 cm são a Vx 30x2 180x 1200 e 12400 cm³ b Vx 30x2 160x 1200 e 14400 cm³ c Vx 30x2 180x 1200 e 14400 cm³ d Vx 30x2 160x 1200 e 12400 cm³ e Vx 30x2 180x 1200 e 14400 cm³ Fonte O autor 2015 Figura 126 Bloco Fonte adaptada de httpspixabay comp152428 Acesso em 17 nov 2015 Figura 127 Caixa de papelão 3 Uma revendedora de cosméticos estima que para um preço de x reais são vendidas 5000 2x unidades de certo produto mensalmente Para este produto há um custo de R 1000 por unidade Nestas condições qual é o lucro obtido em um mês em que o preço de venda deste produto era R 1600 a R 2861800 b R 1616800 c R 5000000 d R 2980800 e R 4886100 U1 Função afim e função quadrática 45 Seção 14 Sinal mínimo e máximo da função quadrática Diálogo aberto Na seção anterior você estudou a função quadrática cuja aplicação proporcionou uma solução para o problema da ampliação do galpão da empresa Dos 300 m² que havia de espaço físico passouse para 750 m² com a ampliação sendo acrescidos 10 m tanto no comprimento quanto na largura O galpão atualmente possui 30 m de comprimento por 25 m de largura Você ainda pôde calcular o investimento com a reforma por meio da função I x 72585 x2 2540475 x Para o valor x acrescido nas dimensões do galpão temos I10 72585 102 2540475 10 72585 2540475 3266325 R 32663250 isto é o investimento com a reforma foi de R 32663250 Após todos esses gastos seu sócio quer agora recuperar parte do investimento aumentando o preço de venda dos bonés Atualmente são produzidos e comercializados 2400 bonés por mês vendidos por R 3000 cada Para que tudo ocorra de modo planejado ele se adiantou e fez uma pesquisa junto aos consumidores estimando que para cada x reais acrescidos no preço de cada boné são vendidas 2400 60x unidades por mês Considerando as informações anteriores qual deve ser o preço de cada boné para que a receita seja a maior possível Não pode faltar Máximos e mínimos Você viu na seção anterior alguns elementos da parábola entre eles o vértice como ilustrado na Figura 128 O ponto A é o vértice do gráfico de fx 075x2 45x 375 e o ponto B é o vértice do gráfico de gx 3x2 42x 145 Ambos os gráficos possuem eixo de simetria linha tracejada que passa pelo vértice U1 Função afi m e função quadrática 46 Fonte O autor 2015 Figura 128 Gráficos de f e g O fato de uma parábola ter eixo de simetria significa que o lado direito da curva é o reflexo do lado esquerdo ou seja se desenhássemos uma parábola em um papel e o dobrássemos sobre o eixo de simetria os lados da curva se sobreporiam Observe que o coeficiente do termo dominante de fx 075x2 45x 375 é negativo e que o coeficiente do termo dominante de gx 3x2 42x 145 é positivo Como já abordado na seção anterior isso influencia na concavidade da parábola o gráfico de f tem concavidade para baixo e o gráfico de g tem concavidade para cima Em decorrência disso há algo interessante em relação ao vértice no caso do gráfico de f o vértice A é o ponto mais alto da parábola e no caso do gráfico de g o vértice B é o ponto mais baixo da parábola Isso pode ser observado para toda função quadrática e está de acordo com o exposto a seguir Assimile Assimile Seja fx ax2 bx c uma função quadrática Se a 0 o gráfico tem concavidade voltada para cima e o vértice é seu ponto mais baixo a 0 o gráfico tem concavidade voltada para baixo e o vértice é seu ponto mais alto Uma função fx possui um máximo em xv pertencente a um intervalo I se fxv fx para todo x d I Nesse caso fxv será o maior valor alcançado valor máximo pela função nesse intervalo De modo semelhante uma função fx possui um mínimo em xv pertencente a um intervalo I se fxv fx para todo x d I Nesse caso fxv Essa percepção gráfica em relação à função quadrática auxilia no entendimento de um conceito estudado para qualquer função U1 Função afi m e função quadrática 47 será o menor valor alcançado valor mínimo pela função nesse intervalo Em ambos os casos dizemos que os valores são extremos da função No exemplo da Figura 128 A é um ponto de máximo e B é um ponto de mínimo Para uma função quadrática as coordenadas do vértice são xv yv em que xv é o x do vértice e yv o y do vértice Figura 129 Simetria da parábola Fonte O autor 2015 Como a parábola é simétrica em relação ao seu vértice segue que fxv1 fxv1 como mostra a Figura 129 Com base nessa igualdade temos Da última igualdade segue que Com essa propriedade e as observações anteriores podemos enunciar o seguinte Assimile Dada uma função quadrática fx ax2 bx c o vértice de seu gráfico tem coordenadas b 2a f b 2a Não entraremos em detalhes mas pode ser demonstrado que xv b 2a e yv Δ 4a Reflita Como podemos deduzir yv Δ 4a a partir de xv b2a e fx ax2 bx c U1 Função afim e função quadrática 48 Exemplificando Dada a função quadrática fx 2x2 4x 8 determine as coordenadas do vértice de seu gráfico e se este é um ponto de máximo ou de mínimo Resolução Para esta função temos a 2 b 4 e c 8 Logo Portanto as coordenadas do vértice são 16 Como a 2 0 o gráfico de f possui concavidade voltada para cima o que implica que seu vértice é um ponto de mínimo Nesse caso f1 6 é o menor valor mínimo assumido pela função Sinal da função quadrática Observe na Figura 130 as funções f g h p q r A partir do exposto na seção anterior e analisando os gráficos segue que as funções f e p possuem dois zeros reais cada Δ 0 as funções g e q possuem um único zero cada Δ 0 e as funções h e r não possuem zeros reais Δ 0 A partir de uma análise gráfica podemos ainda afirmar que hx 0 é positiva no intervalo 33 R pois seu gráfico está totalmente acima do eixo x r x 0 é negativa no intervalo 33 R pois seu gráfico está totalmente abaixo do eixo x gx 0 nos intervalos 3x1 e x1 3 em que gx1 0 na Figura 130 x1 7 qx 0 nos intervalos 3x1 e x1 3 em que qx1 0 na Figura 130 x1 7 fx 0 em 3x1 e x2 3 fx 0 em x1 x2 e fx1 fx2 0 na Figura 130 x1 1 e x2 3 px 0 em 3x1 e x2 3 px 0 em x1 x2 e px1 px2 0 na Figura 130 x1 1 e x2 3 U1 Função afi m e função quadrática 49 Figura 130 Funções quadráticas Fonte O autor 2015 Exemplificando Dada a função fx x2 2x 3 faça o estudo dos sinais e determine se f possui um valor máximo ou um mínimo e especifique esse valor Como para esta função a 1 0 a concavidade de seu gráfico é voltada para baixo Em consequência o vértice é o ponto mais alto do gráfico tornandoo um ponto de máximo Além disso como b 2 e c 3 temos Δ b2 4ac 22 4 1 3 4 12 16 Δ 16 0 Como o discriminante é positivo a função possui dois zeros reais além de seu gráfico interceptar o eixo da ordenadas no ponto de coordenadas 03 pois c 3 Com essas informações podemos inferir que o gráfico da função é semelhante ao esboço da Figura 131 Calculando os zeros de f temos Logo fx 0 em 3 1 e 3 3 fx 0 em 1 3 e f1 f3 0 Para determinar o máximo de f precisamos primeiramente do valor de xv Com isso o valor máximo de f será fxv f1 12 2 1 3 1 2 3 4 Fonte O autor 2015 Figura 131 Esboço U1 Função afim e função quadrática 50 Faça você mesmo 1 Dada a função fx x2 6x 5 faça o estudo dos sinais e determine se f possui um valor máximo ou um mínimo e especifique esse valor Pesquise mais Você pode investigar de forma mais dinâmica a relação entre os coeficientes da função quadrática e seu sinal com o objeto disponível no link httpswwwgeogebraorgm171465 Acesso em 24 nov 2015 Além disso para ver mais sobre as funções quadráticas principalmente quanto a máximos e mínimos e ao sinal acesse httpwwwfund198 ufbabraposcnffuncao4pdf Acesso em 24 nov 2015 Sem medo de errar Vamos retomar o problema proposto no início da seção atualmente são produzidos e comercializados 2400 bonés por mês e estes são vendidos por R 3000 cada Além disso seu sócio estimou que para cada x reais acrescidos no preço de cada boné são vendidas 2400 60x unidades por mês Com todas essas informações como calcular o preço de cada boné para que a receita seja a maior possível Vamos interpretar o problema obter a maior receita possível é o mesmo que obter a receita máxima Desse modo se conseguirmos construir uma função receita que modele toda essa dinâmica obter a receita máxima é o mesmo que calcular o valor máximo da função Considere que o preço do boné que atualmente é de R 3000 seja acrescido em x reais O novo preço será Com o boné nessa faixa de preço são vendidas 2400 60x unidades Lembrese de que a função receita é obtida multiplicando a quantidade vendida pelo preço logo U1 Função afim e função quadrática 51 Desenvolvendo os cálculos temos Rx 2400 60x 30 x 2400 60x 30 2400 60x x 72000 1800x 2400x 60x2 Portanto Rx 60x2 600x 72000 Depois de interpretar o problema podemos resolvêlo com o auxílio da função receita para essa função temos a 60 0 e consequentemente essa função possui um valor máximo atingido em xv b2a 600 2 60 600120 5 Esse é o valor que pode ser acrescido no preço atual do boné para alcançar a receita máxima Como o preço atual é R 3000 o novo valor será R 3500 ficando resolvido o problema Faça você mesmo 2 Qual será a receita máxima Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas Área máxima 1 Competências de fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio logico e quantitativo 2 Objetivos de aprendizagem Utilizar o conceito de máximo e mínimo de uma função na resolução de problemas de otimização 3 Conteúdos relacionados Máximos e mínimos 4 Descrição da SP Uma área retangular será cercada com tela em três lados sendo que no quarto lado será utiliza do um muro já existente conforme Figura 132 U1 Função afi m e função quadrática 52 Se há 40 metros de tela disponível quais serão as dimensões do cercado que possui área máxima Fonte O autor 2015 Figura 132 Área a ser cercada Faça valer a pena 1 Um aspecto muito interessante em relação às funções consiste em seus valores extremos que podem ser mínimos ou máximos Para as funções quadráticas sabemos se um valor extremo será um mínimo ou um máximo apenas observando seus coeficientes Em relação aos valores extremos as funções e possuem respectivamente a máximo mínimo e máximo b mínimo máximo e mínimo c máximo máximo e mínimo d mínimo mínimo e máximo e mínimo máximo e máximo 2 Os gráficos das funções e possuem o mesmo vértice conforme Figura 133 Nesse caso qual é o valor do coeficiente c da função f a 4 b 2 c 1 d 3 e 5 Fonte O autor 2015 Figura 133 Funções f e g U1 Função afim e função quadrática 53 3 Determinado trecho de uma montanharussa tem seu trilho a uma altura fx 01x2 2x 14 com x pertencente ao intervalo 020 em metros Nesse trecho qual é a altura do trilho no seu ponto mais baixo considerando o eixo das abscissas como sendo o solo a 1 m b 2 m c 3 m d 4 m e 5 m U1 Função afim e função quadrática 54 Referências ANTON Howard BIVENS Irl DAVIS Stephen Cálculo 10 ed Porto Alegre Bookman 2014 IEZZI Gelson et al Fundamentos de matemática elementar conjuntos e funções 3 ed São Paulo Atual 1977 LARSON Ron Cálculo aplicado curso rápido 8 ed São Paulo Cengage Learning 2011 ROGAWSKI Jon Cálculo Porto Alegre Bookman 2009 SIMMONS George F Cálculo com geometria analítica São Paulo McGrawHill 1987 SODRÉ Ulysses Funções quadráticas 2010 Disponível em httpwwwuelbr projetosmatessencialsuperiormatzooquadraticapdf Acesso em 14 nov 2015 STEWART James Cálculo 7 ed São Paulo Cengage Learning 2013 1 v THOMAS George B WEIR Maurice D HASS Joel Cálculo 12 ed São Paulo Pearson 2012 U2 Estatística descritiva 55 Unidade 2 Estatística descritiva Você já tomou conhecimento na Unidade 1 de alguns termos utilizados na estatística entre eles a própria palavra estatística que simplificadamente nós poderíamos definir como a ciência que cuida da coleta descrição e interpretação de dados Contudo essa não é a única maneira de se definir estatística Segundo Johnson e Kuby 2013 a palavra estatística possui significados diferentes para pessoas de diferentes áreas e interesses Veja por exemplo a seguinte definição para estatística Convite ao estudo Reflita A estatística moderna é uma tecnologia quantitativa para a ciência experimental e observacional que permite avaliar e estudar as incertezas e os seus efeitos no planejamento e interpretação de experiências e de observações de fenômenos da natureza e da sociedade Raul Yukihiro Matsushita professor assistente do Departamento de Estatística da Universidade de Brasília Sugestão pesquise outras definições para estatística e faça um comparativo Ainda na Unidade 1 citamos a estatística descritiva e a estatística inferencial A primeira mais frequentemente utilizada cuida da coleta análise e sintetização de dados Já a segunda se utiliza dos resultados obtidos pela primeira para realizar a interpretação das informações e posteriormente auxiliar na tomada de decisão Para iniciar seus estudos em estatística descritiva imagine que você é um funcionário de uma grande empresa que U2 Estatística descritiva 56 denominaremos de M e foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários O relatório final dessa pesquisa deverá conter informações pessoais como idade peso altura sexo cor dos olhos raça e também informações sobre a satisfação em relação às condições de trabalho e à remuneração Considere que o prazo estipulado para a realização dessa tarefa seja uma semana Nesse ponto algumas dúvidas devem ter surgido Entre elas podemos mencionar O que exatamente devo pesquisar Como fazer essa pesquisa O tempo será suficiente para pesquisar todos os funcionários Em caso negativo o que fazer Como apresentar os resultados obtidos com a pesquisa No decorrer dessa unidade pouco a pouco algumas dessas perguntas serão respondidas e você poderá ter uma visão geral de todo o processo Ao final esperamos que você Compreenda as principais técnicas de amostragem Interprete informações apresentadas em tabelas e gráficos Entenda as medidas de posição e sua representatividade Compreenda as medidas de dispersão e sua representatividade Atenção Observe que o termo peso foi empregado incorretamente Nesse contexto o correto seria massa O peso é uma grandeza física mais especificamente uma força Apesar disso como esse termo é de uso frequente no dia a dia manteremos o sentido coloquial da palavra peso U2 Estatística descritiva 57 Seção 21 Amostragem Diálogo aberto Para iniciarmos os estudos em estatística vamos retomar a situação proposta anteriormente imagine que você é um funcionário da empresa M e que foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários O relatório final dessa pesquisa deverá conter informações pessoais como idade peso altura sexo cor dos olhos raça e também informações sobre a satisfação em relação às condições de trabalho e à remuneração Considere que o prazo estipulado para a realização dessa tarefa seja uma semana Para que essa tarefa seja executada o primeiro passo é planejar a coleta de dados assunto que será estudado nesta seção de autoestudo Não Pode Faltar Conceitos básicos Antes de iniciar o planejamento da coleta de dados é essencial que você consiga identificar alguns objetos de estudo da estatística tais como população e amostra Uma população é o conjunto de todos os elementos que possuem determinada característica em comum Para o nosso exemplo a população corresponde aos 30 mil funcionários da empresa M Além de pessoas populações podem ser compostas por animais objetos substâncias químicas etc Exemplificando Suponha que se queira analisar o Comportamento das formigas cortadeiras no Brasil Nesse caso a população corresponderia à totalidade das formigas dessa espécie no país Número de peças defeituosas fabricadas por determinada máquina Nesse caso a população corresponderia a todas as peças fabricadas por essa máquina U2 Estatística descritiva 58 A população pode ser finita quando é possível listar fisicamente todos os seus elementos ou infinita quando não há essa possibilidade No caso dos funcionários da empresa M a população é finita pois poderíamos por exemplo solicitar ao departamento de pessoal que fornecesse uma lista com os nomes de todos os funcionários que constam na folha de pagamento Para o exemplo do estudo do comportamento das formigas cortadeiras apesar de haver um número finito dessas formigas podemos considerar essa população como sendo infinita pois esse número é muito grande e jamais conseguiríamos observar todas elas Uma amostra é qualquer subconjunto de uma população Geralmente amostras são finitas e utilizadas quando a população é muito numerosa ou infinita o que dificulta ou até impossibilita a observação de todos os seus elementos Assimile População é o conjunto de todos os elementos que possuem determinada característica em comum Amostra é qualquer subconjunto de uma população Outros objetos de estudo da estatística são o censo e a amostragem Um censo corresponde ao processo de coleta de dados de toda a população enquanto que uma amostragem é o processo de coleta de dados de uma amostra ou seja de apenas parte da população Censos são raramente feitos pois são muito demorados e caros quando comparados a uma amostragem Pesquise mais No Brasil o IBGE Instituto Brasileiro de Geografia e Estatística se encarrega de realizar um censo a cada 10 anos Nele são coletadas diversas informações sobre a população e os domicílios Para mais informações acesse wwwibgegovbr Acesso em 8 jul 2015 Variáveis Quando estudamos uma população estamos interessados em suas v e nos possíveis valores que elas podem assumir Idade peso altura sexo cor dos olhos e raça são exemplos de variáveis U2 Estatística descritiva 59 Veja na Figura 21 algumas informações a respeito do jogador Pelé e mais alguns exemplos de variáveis Fontes 20102015 Graphic Resources LLC Disponível em httpbrfreepikcomfotosgratispele jogadordefutebollendas566595htm e httpesporteuolcombrfutebolbiografias559pele Acesso em 28 abr 2015 Figura 21 Dados pessoais do jogador Pelé em 2015 Nome completo Édson Arantes do Nascimento Posição Meiaatacante Ano de nascimento 1940 Idade anos 74 Nacionalidade Brasileira Local de nascimento Três Corações MG Altura metros 173 Peso kg 75 Formação acadêmica Superior completo Na Figura 21 podemos identificar as variáveis nome posição ano de nascimento idade nacionalidade local de nascimento altura peso e formação acadêmica Além disso Édson Arantes do Nascimento meiaatacante 1940 74 brasileira Três Corações MG 173 75 e superior completo são respectivamente os valores que elas assumem para o jogador Pelé Observe que algumas dessas variáveis retornaram valores numéricos e outras não numéricos Quando uma variável retorna valores numéricos nós a denominamos variável quantitativa Já aquela que retorna valores não numéricos nós a denominamos variável qualitativa Essa diferença é fácil de ser assimilada pois a palavra quantitativa lembra quantidade ou seja números enquanto a palavra qualitativa lembra qualidade isto é atributos As variáveis quantitativas e as qualitativas podem ainda ser subdivididas em dois subgrupos conforme ilustra a Figura 22 Figura 22 Tipos de variáveis Variáveis Quantitativas Qualitativas Discretas Contínuas Ordinais Nominais Fonte Os autores 2015 U2 Estatística descritiva 60 Uma variável quantitativa discreta é aquela que em geral assume valores inteiros ou um número finito de valores bem definidos Na Figura 21 podemos observar duas variáveis com essa característica ano de nascimento e idade Já uma variável quantitativa contínua é aquela que pode assumir qualquer valor inteiro ou não dentro de um intervalo Na Figura 21 podemos observar também duas variáveis com essa característica altura e peso Uma variável qualitativa ordinal é aquela não numérica que apresenta uma ordenação entre seus valores a exemplo da variável formação acadêmica Veja que Pelé possui ensino superior completo Entretanto caso observássemos os valores dessa variável para outras pessoas poderíamos ter como resposta ensino fundamental ou ensino médio por exemplo Uma ordenação natural para nós é que o ensino fundamental antecede o ensino médio que por sua vez antecede o ensino superior Por fim uma variável qualitativa nominal é aquela não numérica que não possui ordenação entre seus valores como nome posição nacionalidade e local de nascimento Assimile Variável quantitativa discreta aquela que em geral assume valores inteiros ou um número finito de valores bem definidos quantitativa contínua aquela que pode assumir qualquer valor inteiro ou não dentro de um intervalo qualitativa ordinal aquela não numérica que apresenta uma ordenação entre seus valores qualitativa nominal aquela não numérica que não possui ordenação entre seus valores Para verificar se você compreendeu as diferenças entre os diversos tipos de variáveis classifique as da Figura 23 em discretas contínuas nominais ou ordinais U2 Estatística descritiva 61 Figura 23 Exemplos de variáveis altura formação acadêmica peso cor dos olhos número de filhos doentesadio fumante não fumante estágio de uma doença inicial intermediário terminal sexo tempo número de bactérias por litro de leite número de cigarros fu mados por dia pressão arterial idade anos mês de observação ja neiro fevereiro dezembro Fonte O autor 2015 Confira sua classificação com a proposta no apêndice da Seção 21 Quando aferimos um valor a partir de uma análise de determinada variável em uma amostra o denominamos estatística Já se o referido valor é obtido a partir de uma análise de uma variável na população como um todo o denominamos parâmetro A média de altura dos funcionários do setor administrativo da empresa M por exemplo corresponde a uma estatística Tal estatística busca estimar a verdadeira média da altura de todos os funcionários da empresa M a qual corresponde a um parâmetro Grande parte das pesquisas é feita a partir de amostras Tais pesquisas obtêm estatísticas que buscam estimar os parâmetros da população Tipos de amostragem Antes de atingirmos o objetivo dessa seção de autoestudo que é o de planejar a coleta de dados precisamos ainda compreender os principais tipos de amostragem A escolha adequada do método é de fundamental importância para a confiabilidade dos dados a serem coletados Um grande desafio de quem está planejando fazer uma pesquisa é saber como coletar uma amostra confiável ou seja como conseguir selecionar na população um subconjunto que seja representativo do todo Observe que essa é uma etapa de grande importância já que pode impactar todo o restante do trabalho U2 Estatística descritiva 62 Uma coleta mal planejada pode provocar impressões erradas acerca da população fornecendo valores que não a representam A distorção de uma estatística em comparação com um parâmetro populacional é denominada viés Você poderá notar um exemplo clássico de amostragens enviesadas na época das eleições Vários candidatos apresentam resultados de pesquisas de intenção de voto sendo que cada uma tem um resultado diferente Fique atento Na literatura sobre o assunto são diversos os métodos de amostragem Dentre eles os mais conhecidos são Amostragem de conveniência Amostragem voluntária Amostragem aleatória simples Amostragem sistemática Amostragem aleatória estratificada Amostragem por conglomerado Uma amostragem por conveniência geralmente ocorre quando o indivíduo seleciona na população elementos que considera pertinentes os quais imagina serem representativos do todo Essa conduta estatisticamente falha muitas vezes é a causadora de resultados muito divergentes dos verdadeiros parâmetros da população Vide exemplo das pesquisas eleitorais Na amostragem voluntária a amostra é obtida por seleção de voluntários Frequentemente vemos esse tipo de pesquisa sendo feita pela internet ou por telefone Pense um pouco você já respondeu a alguma enquete realizada por esses canais Foi sincero na resposta dada à enquete Se suas respostas foram sim e não você acaba de perceber a origem de um dos problemas desse tipo de amostragem a saber o nível de confiança nos dados coletados Geralmente as pessoas não estão dispostas a responder a pesquisas Portanto quando estas são feitas com voluntários os resultados obtidos devem ser tratados com muito cuidado Pode parecer então que esse tipo de amostragem não deve nunca ser empregado contudo em muitos casos essa é a única opção Imagine que uma empresa farmacêutica queira testar um novo fármaco destinado à prevenção e ao tratamento do HIV Você concordaria em fazer parte da pesquisa considerando que não A amostragem aleatória simples é aquela realizada por meio de sorteio Esse tipo de amostragem tem a vantagem em relação às anteriores de garantir que todos os elementos da população tenham a mesma probabilidade de pertencer à amostra Para realizar uma amostragem desse tipo também se pode utilizar uma tabela de números aleatórios como a apresentada na página 146 do arquivo disponível em httpwwwestufprbrce003materialapostilace003pdf Acesso em 29 abr 2015 Para obter orientações de como utilizar uma tabela de números aleatórios assista ao vídeo disponível em httpswwwyoutubecomwatchvUgxLkkXuRQ Outra maneira de realizar uma amostragem aleatória simples é por meio de uma planilha eletrônica Leia um pequeno tutorial de como gerar números aleatórios em planilhas no link httpdicadeseexcelcombr20090526comogerarnumerosaleatorios Há ainda a possibilidade de utilizar uma calculadora científica Para outras orientações de como gerar números aleatórios em uma calculadora assista a um vídeo sobre o assunto em httpswwwyoutubecomwatchv2fW92PRPwfQ Acesso em 29 abr 2015 Uma amostra sistemática pode ser feita facilmente quando há uma ordenação natural dos elementos da população como a ordem alfabética ou a sequência de casas em uma rua Para retirar uma amostra sistemática de tamanho n de uma população com N elementos ordenados de 1 até N seguimos os seguintes passos 1 Dividimos a população em n subgrupos de tamanho k Nn 2 No primeiro grupo realizamos um sorteio amostragem aleatória simples para determinar o primeiro elemento pertencente à amostra Suponha que ele esteja na posição p k 3 A partir do sorteio do passo anterior os demais n 1 elementos pertencentes à amostra ficam determinados Serão aqueles que estiverem nas posições p k p 2k p 3k p n 1k U2 Estatística descritiva 64 Exemplificando Considere uma população de 20 alunos da disciplina de Métodos Quantitativos os quais estão listados a seguir em ordem alfabética 1 Alice 8 Isabella 15 Matheus 2 Arthur 9 Júlia 16 Miguel 3 Bernardo 10 Laura 17 Pedro 4 Davi 11 Lucas 18 Rafael 5 Gabriel 12 Luíza 19 Sophia 6 Giovanna 13 Manuela 20 Valentina 7 Heitor 14 Maria Selecione uma amostra sistemática de tamanho 4 dessa população Resolução Observe que essa população tem tamanho N 20 e a amostra solicitada tem tamanho n 4 Portanto devemos dividir a população em 4 subgrupos de tamanho k 204 5 como segue 1 Alice 6 Giovanna 11 Lucas 16 Miguel 2 Arthur 7 Heitor 12 Luíza 17 Pedro 3 Bernardo 8 Isabella 13 Manuela 18 Rafael 4 Davi 9 Júlia 14 Maria 19 Sophia 5 Gabriel 10 Laura 15 Matheus 20 Valentina Nessa etapa é necessário que façamos um sorteio no primeiro grupo para determinar o primeiro a pertencer à amostra Suponha que o sorteado tenha sido o número p 2 ou seja Arthur Desse modo os próximos a pertencerem à amostra serão p k 2 5 7 Heitor p 2k 2 2 5 12 Luíza p 3k 2 3 5 17 Pedro A amostragem aleatória estratificada difere das anteriores principalmente por envolver mais de uma etapa Esse tipo de amostragem é utilizado geralmente nos casos em que a população possui subgrupos com características próprias que podem ser pertinentes à pesquisa Imagine que se queira pesquisar o gênero U2 Estatística descritiva 65 musical preferido de uma população Convém supor que a preferência possa ser diferente de acordo com a idade da pessoa pois em épocas diferentes as tendências musicais são outras e considerar toda a população como um grupo homogêneo pode ser um erro para a coleta de dados Desse modo talvez seja prudente dividir a população em vários grupos por faixa etária por exemplo de 0 a 9 anos de 10 a 19 anos de 20 a 40 anos e mais de 40 anos Atenção essa é apenas uma sugestão Para determinar quais subdivisões da população devemos considerar é necessário um estudo mais aprofundado Cada subgrupo considerado na amostragem aleatória estratificada recebe o nome de estrato A definição desses estratos primeira etapa da amostragem é feita de modo a se obter maior homogeneidade entre os seus elementos e maior heterogeneidade entre os estratos Na segunda etapa retirase uma amostra em cada estrato podendo este procedimento ser realizado por amostragem aleatória simples sistemática ou outra que for mais adequada Geralmente na amostragem aleatória estratificada o tamanho da amostra retirada de cada estrato é correspondente ao percentual que o estrato representa em relação à população Exemplificando Suponha que para determinada pesquisa seja necessário dividir a população de 100 indivíduos em dois estratos os homens 45 indivíduos e as mulheres 55 indivíduos Se quisermos retirar uma amostra estratificada de tamanho 20 dessa população quantos homens e quantas mulheres teremos Resolução Inicialmente calculamos a porcentagem que cada estrato representa em relação ao total Estrato 1 mulheres 55 100 55 Estrato 2 homens 45 100 45 Desse modo a amostra deve ser composta em 55 de mulheres e 45 de homens ou seja U2 Estatística descritiva 66 Amostra do estrato 1 55 20 11 mulheres Amostra do estrato 2 45 20 9 homens Observe no exemplo anterior que pelo fato de termos dividido a população em dois estratos homens e mulheres dentro de cada um os elementos são homogêneos todos os elementos são do mesmo sexo e quando comparamos os estratos entre si eles são significativamente heterogêneos pois em um há só mulheres e no outro apenas homens A amostragem por conglomerado também denominada amostragem por cluster é um processo que assim como a amostragem estratificada envolve mais de uma etapa A diferença básica entre essas duas é que enquanto a estratificada busca dividir a população em subgrupos cujos elementos sejam homogêneos a por conglomerado divide a população em subgrupos cujos elementos sejam heterogêneos Cada subgrupo definido nesse tipo de amostragem denominado conglomerado ou cluster será semelhante à população o que implica a semelhança entre os conglomerados Após definir os conglomerados primeira etapa geralmente se utiliza amostragem aleatória simples para escolher quais farão parte da amostra segunda etapa Em seguida realizase um censo em cada conglomerado selecionado terceira etapa Exemplificando A amostragem por conglomerado pode ser utilizada no caso de uma empresa que possua várias filiais Esperase que as filiais sejam semelhantes entre si e semelhantes à empresa como um todo Considerando que dentro de cada filial possa ser observada a mesma heterogeneidade que no restante da empresa temos uma situação semelhante à teorizada para esse tipo de amostragem Um procedimento padrão seria considerar cada filial da empresa como um conglomerado realizandose uma amostragem aleatória simples para definir quais conglomerados serão recenseados Agora que você já conhece alguns métodos de amostragem elabore um roteiro para realizar a coleta de dados proposta na situaçãoproblema do tópico DIÁLOGO ABERTO dessa seção de U2 Estatística descritiva 67 autoestudo Após a elaboração do roteiro compare sua proposta com a apresentada a seguir Roteiro para uma coleta de dados Uma das etapas mais importantes de toda coleta de dados é o planejamento Geralmente ele pode ser feito por meio da determinação de um roteiro ou um checklist Para ter eficiência esse roteiro deve ser elaborado e revisado a fim de evitar falhas Ao final o pesquisador deve conferir se todas as etapas previstas no roteiro foram concluídas Veja a seguir um possível roteiro para uma coleta de dados exemplificado para o caso da empresa M apresentada no início dessa seção de autoestudo 1 Definir o objetivo da pesquisa Exemplo determinar o perfil dos funcionários da empresa M 2 Definir as variáveis e a população de interesse Exemplo idade peso altura sexo cor dos olhos raça satisfação em relação às condições de trabalho e à remuneração A população corresponde aos 30 mil funcionários da empresa M 3 Definir o sistema de coleta Exemplo será realizado um censo ou uma amostragem No caso de uma amostragem qual método será utilizado Qual é o tamanho da amostra Quais são os meios de obtenção dos dados telefonemas questionários entrevistas etc 4 Coletar os dados Nessa etapa é necessário que o pesquisador tome o cuidado de não criar um viés Exemplo é possível que se tenha respostas enviesadas realizando perguntas como você NÃO está feliz com o seu trabalho Você acha que está ganhando POUCO Perguntas com negativas ou com ênfase em determinados termos podem influenciar as respostas dos entrevistados 5 Revisar os dados coletados Essa etapa é muito importante para a coleta pois é possível que sejam identificados erros que podem impactar todo o restante do trabalho Exemplo determinado funcionário da empresa M pode ter respondido que seu nome é João da Silva e também que é do sexo feminino Será que U2 Estatística descritiva 68 essa resposta é verídica Vale a pena conferir o processo para verificar possíveis erros de coleta Esperamos que até o momento você tenha tido uma visão geral de como é feita a amostragem e sua importância para a realização de uma pesquisa Vale ressaltar que o explicitado aqui é apenas uma noção básica do processo Existem livros inteiros dedicados ao estudo desse tema e muitos materiais disponíveis na internet Pesquise mais Para se aprofundar nas técnicas de amostragem faça uma pesquisa sobre o assunto Algumas sugestões são Livros BOLFARINE Heleno BUSSAB Wilton de O Elementos de amostragem São Paulo Edgard Blucher 2005 SILVA Nilza N da Amostragem probabilística um curso introdutório 2 ed São Paulo Editora da Universidade de São Paulo 2004 Internet Receita Federal do Brasil httpwwwreceitafazendagov brmanuaiswebexportacaotopicosconferenciaaduaneira verificacaofisicaamostragemhtm Acesso em 29 abr 2015 Tribunal de Contas da União httpportal2tcugovbrportalpls portaldocs2064402PDF Acesso em 29 abr 2015 Sem Medo de Errar Vamos retomar a situaçãoproblema do início dessa seção de autoestudo e personalizar um roteiro para a coleta de dados incluindo detalhes específicos como os propostos no tópico ROTEIRO PARA UMA COLETA DE DADOS 1 Definir o objetivo da pesquisa O objetivo da pesquisa pode ser identificado na situação problema proposta no início dessa seção de autoestudo determinar o perfil dos 30 mil funcionários da empresa M U2 Estatística descritiva 69 2 Definir as variáveis e a população de interesse A tarefa à qual você foi incumbido especificava que o objetivo era determinar o perfil dos funcionários da empresa M Para realizar essa tarefa você deveria pesquisar idade peso altura sexo cor dos olhos raça satisfação em relação às condições de trabalho e à remuneração Portanto essas serão as variáveis de estudo Para cada uma delas você deve elaborar uma pergunta de forma imparcial por exemplo a Qual é a sua idade b Qual é o seu peso c Qual é a sua altura d Qual é o seu sexo e Qual é a cor de seus olhos f Qual é a sua raça g Qual é a sua satisfação em relação às condições de trabalho h Qual é a sua satisfação em relação à sua remuneração Observe que algumas das perguntas anteriores deixam espaço para respostas muito amplas a exemplo do item g Alguns funcionários poderiam responder me sinto bem outros poderiam dizer apenas nota 10 Como comparar essas respostas posteriormente Nessa etapa do planejamento é melhor incluir algumas restrições para as respostas para facilitar a análise a posteriori Algumas sugestões são a Qual é a sua idade anos b Qual é o seu peso kg coloque valores inteiros c Qual é a sua altura centímetros d Sexo Masculino Feminino e Cor dos olhos Castanhos Azuis Verdes f Raça Amarela Branca Indígena Parda Preta U2 Estatística descritiva 70 g De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação às condições de trabalho 0 1 2 3 4 5 6 7 8 9 10 h De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação à sua remuneração 0 1 2 3 4 5 6 7 8 9 10 A população corresponde aos 30 mil funcionários da empresa M 3 Definir o sistema de coleta Lembrese de que para a situação proposta no início dessa seção de autoestudo o prazo estipulado para a pesquisa é de uma semana Nesse caso consideramos que fazer uma amostragem é o mais prudente pois devido ao tempo de coleta e àquele que ainda será gasto no tratamento das informações realizar um censo seria inviável Entretanto essa escolha irá depender de quais recursos estão disponíveis ficando a cargo do pesquisador definir entre amostragem ou censo Em relação ao tipo de amostragem vamos supor que na empresa M 5 dos funcionários sejam gerentes 15 possuam cargos administrativos e os 80 restantes cargos operacionais Como a pesquisa pode ser influenciada pela variável cargo o mais adequado é realizar uma amostragem estratificada em que os estratos gerentes cargos administrativos e cargos operacionais possuam a mesma representatividade na amostra tal qual é observada na população Não entraremos em detalhes sobre o cálculo do tamanho da amostra pois ele envolve conceitos ainda não trabalhados Entretanto para este exemplo vamos utilizar uma sugestão disponível em httpsptsurveymonkeycommpsamplesize com uma margem de erro de 10 para os resultados obtidos Você poderá verificar nesse link que o tamanho sugerido para a amostra é 96 U2 Estatística descritiva 71 Resta ainda definir como serão coletados os dados Novamente isso irá depender de quais recursos estão disponíveis Uma sugestão para pequenas amostras é a utilização de um formulário a ser enviado via internet Um exemplo de ferramenta gratuita para criação desse tipo de formulário é o Formulários Google Veja mais informações sobre este recurso em httpswww googlecomintlptBRformsabout 4 Coletar os dados No caso da utilização da ferramenta sugerida anteriormente os formulários podem ser enviados por email Entretanto nessa etapa o pesquisador deve ficar atento se os indivíduos selecionados para a amostra realmente estão respondendo à pesquisa 5 Revisar os dados coletados Com a ferramenta sugerida anteriormente essa etapa tende a ser ágil visto também que o tamanho da amostra é pequeno Avançando na Prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com a de seus colegas 1 Competência de fundamentos de área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Elaborar um roteiro para a realização de uma pesquisa 3 Conteúdos relacionados Amostragem 4 Descrição da situação problema Suponha que uma companhia telefônica o contratou para elaborar uma pesquisa de satisfação com os clientes acerca do serviço prestado Elabore um roteiro para coleta de dados sabendo que a companhia possui 1 milhão de clientes e deseja realizar a pesquisa por amostragem com 1000 clientes U2 Estatística descritiva 72 5 Resolução da situação problema 1 Definir o objetivo da pesquisa Determinar a satisfação dos clientes acerca do serviço prestado pela companhia telefônica 2 Definir as variáveis e a população de interesse Como não foram indicadas restrições e o detalhamento acerca da pesquisa foi pequeno assumiremos que a empresa queira saber apenas a satisfação de seus clientes variável de interesse sem outras informações agregadas A população corresponde a um milhão de clientes da companhia 3 Definir o sistema de coleta Como os clientes devem constar na base de dados da empresa podemos considerar que é possível gerar uma lista em ordem alfabética com os nomes e os telefones de cada um Sendo assim uma amostragem sistemática pode atender às necessidades e o meio de coleta das informações será o contato por telefone algo natural para uma empresa de telefonia O tamanho da amostra já foi definido anteriormente 1000 indivíduos Resta determinar o que será perguntado aos clientes Novamente pela ausência de detalhes assumiremos que uma pergunta como Em uma escala de 0 a 10 sendo 0 ruim e 10 ótimo qual nota oa senhora atribuiria ao serviço prestado por esta companhia seja suficiente para obter as informações requeridas 4 Coletar os dados Empregar pessoal devidamente treinado para realizar os contatos por telefone Nessa etapa é interessante ressaltar que o treinamento dos entrevistadores é muito importante pois se pode causar um viés 5 Revisar os dados coletados Havendo peculiaridade nos dados coletados eles podem ser revisados com base nas gravações telefônicas das entrevistas caso esse recurso esteja disponível Lembrese População conjunto de todos os elementos que possuem determinada característica em comum Amostra qualquer subconjunto de uma população Variável determinada característica que se deseja estudar em uma população ou amostra Subdividese em quantitativa discreta quantitativa contínua qualitativa ordinal e qualitativa nominal U2 Estatística descritiva 73 Amostragem processo de coleta de dados em um subconjunto da população denominado amostra Os principais tipos são amostragem de conveniência amostragem voluntária amostragem aleatória simples amostragem sistemática amostragem aleatória estratificada e amostragem por conglomerado Faça você mesmo Reúnase com seus colegas e planejem a criação de uma eleição mesmo que fictícia para presidente de turma Após a definição dos candidatos elaborem roteiros para pesquisas de intenção de voto explorando vários métodos de amostragem Realizem pelos menos duas pesquisas por amostragem sistemática e aleatória simples por exemplo e depois realizem a eleição em que todos devem votar Ao final comparem o resultado da eleição com os obtidos nas pesquisas de intenção de voto verificando qual método obteve o resultado mais representativo Redijam um pequeno texto com as conclusões Faça Valer a Pena 1 Assinale a alternativa que apresenta características de censo a Em uma linha de produção uma em cada 50 peças é inspecionada para controle de qualidade b A contagem da população realizada pelo IBGE em 2007 por questões de custos envolveu a coleta de dados em municípios de até 170 mil habitantes e em mais 21 municípios com população acima desta quantidade c O Teste Rápido de HIV é feito com a retirada de uma gota de sangue do paciente O sangue é colocado em dois dispositivos de testagem Em caso de resultado positivo nos dois o diagnóstico já é dado como certo d Nas eleições municipais a cada quatro anos todos os eleitores são obrigados a ir às urnas para votar em dois representantes um candidato a vereador e um candidato a prefeito e Ultimamente algumas lojas têm instalado painéis eletrônicos ou urnas para que os clientes caso queiram possam deixar suas opiniões sobre o atendimento 2 Assinale a alternativa que apresenta uma variável quantitativa discreta a Altura b Sexo c Peso U2 Estatística descritiva 74 d Velocidade e Número de filhos 3 Assinale a alternativa que apresenta uma variável qualitativa nominal a Cor dos olhos b Escolaridade Ensino Fundamental Ensino Médio Ensino Superior c Idade d Classificação em uma corrida Primeiro Segundo Terceiro e Cor da faixa de um judoca Cinza Azul Amarela Laranja 4 Para controle de qualidade 10 das peças que saem de uma linha de produção são inspecionadas Para compor a amostra selecionase 1 em cada 10 sempre na ordem em que são produzidas ou seja produzemse 9 peças e retirase a décima produzemse mais 9 e a vigésima é selecionada para a amostra e assim por diante Essa amostragem é do tipo a conveniência b aleatória simples c sistemática d aleatória estratificada e conglomerado 5 Uma grande rede de lojas pretende consultar os consumidores de determinada região para determinar suas preferências na hora de comprar roupas O foco dessa rede é o mercado feminino que corresponde a 70 de seu faturamento Os 30 restantes correspondem ao público masculino Para fazer essa consulta que tipo de amostragem essa rede de lojas deve utilizar a Amostragem por conveniência b Amostragem aleatória simples c Amostragem sistemática d Amostragem aleatória estratificada e Amostragem por conglomerado 6 Conceitue população e amostra 7 Descreva as características de uma amostragem aleatória estratificada U2 Estatística descritiva 75 Seção 22 Métodos tabulares e métodos gráficos Diálogo aberto Nessa seção vamos dar continuidade ao estudo da estatística descritiva A primeira etapa foi trabalhada na Seção 21 em que você aprendeu alguns conceitos básicos de estatística e os principais tipos de amostragem Além disso foi abordada a seguinte situação problema imagine que você é um funcionário da empresa M e que foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários O relatório final dessa pesquisa deverá conter informações pessoais como idade peso altura sexo cor dos olhos raça e também informações sobre a satisfação em relação às condições de trabalho e à remuneração Considere que o prazo estipulado para a realização dessa tarefa seja uma semana Fizemos um planejamento da coleta de dados para a pesquisa da empresa M e elaboramos um roteiro para a realização de tal tarefa Para continuar o trabalho vamos considerar que os dados já foram coletados sendo a nossa tarefa agora organizálos resumilos e apresentálos Reflita Dados são fatos em si não trazem grande significado só depois que eles forem de alguma forma agrupados ou processados é que poderemos ver o significado ser revelado Marcello Martinelli professor associado da Universidade de São Paulo Não Pode Faltar Dados brutos A coleta de dados planejada na Seção 21 terá como resultado fichas como a exemplificada na Figura 24 U2 Estatística descritiva 76 Figura 24 Exemplo de ficharesposta da coleta de dados N 1 a Qual é a sua idade anos b Qual é o seu peso kg coloque valores inteiros c Qual é a sua altura centímetros d Sexo X Masculino Feminino e Cor dos olhos X Castanhos Azuis Verdes f Raça Amarela Branca Indígena X Parda Preta g De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação às condições de trabalho 0 1 2 3 4 5 6 7 X 8 9 10 h De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação à sua remuneração 0 1 2 3 4 5 6 X 7 8 9 10 Fonte O autor 2015 Lembrese de que no planejamento da coleta de dados com os funcionários da empresa M o tamanho pretendido para a amostra era 96 Com essa quantidade de fichas em mãos fica difícil inferir algo sobre o perfil dos funcionários pois os dados não estão organizados ou seja estão de forma bruta Para facilitar a visualização precisamos agrupar os dados que se referem à mesma variável e dispor as informações de um modo mais agradável e intuitivo para leitura e apresentação Uma maneira interessante de organizar os dados registrados nas fichas é em uma planilha eletrônica pois ela permite uma manipulação simples e rápida dos dados Observe na Figura 25 uma possível maneira de registrar as respostas obtidas na ficha da Figura 21 Figura 25 Registro da ficha N 1 em uma planilha eletrônica Fonte O autor 2015 26 74 174 U2 Estatística descritiva 77 Observe na Figura 25 que indicamos o número da ficha para eventuais conferências pois em caso de dúvidas fica simples lo calizála Veja também que para ficar sucinto indicamos somente as letras para fazer correspondência às perguntas realizadas Outra tática utilizada foi registrar apenas as letras M e C para representar as respostas Masculino e Castanhos Note que na pergunta f não pudemos utilizar essa estratégia pois causaríamos confusão entre as respostas Parda e Preta Para tornar o processo de aprendizagem mais simples vamos supor que o tamanho da nossa amostra seja apenas 20 indivíduos cu jas respostas dadas ao questionário estão apresentadas na Tabela 21 Distribuição de frequências Geralmente quando se estuda determinado problema procu rase conhecer o comportamento das variáveis envolvidas obser vando a ocorrência de seus valores na amostra para poder inferir algo a respeito da população Figura 24 Exemplo de ficharesposta da coleta de dados1 apresenta os dados de forma bruta de modo Fonte O autor 2015 Tabela 21 Respostas recebidas na coleta de dados N Questão a b c d e f g h 1 21 74 174 M C Parda 8 7 2 21 93 176 F A Parda 5 4 3 25 86 171 F C Amarela 1 5 4 27 83 179 F C Preta 4 5 5 28 88 185 M C Preta 10 7 6 29 63 181 M C Amarela 5 4 7 31 60 177 M V Parda 5 5 8 35 58 163 F C Branca 5 4 9 37 84 180 F C Preta 4 4 10 37 81 165 M C Branca 5 4 11 39 74 175 M C Parda 9 8 12 42 85 162 M C Indígena 7 7 13 43 60 165 M C Parda 3 4 14 47 67 170 M C Parda 4 3 15 48 81 162 M A Branca 2 4 16 51 85 165 F C Preta 5 3 17 51 86 170 M A Branca 1 5 18 53 57 170 F C Branca 7 6 19 55 88 179 F C Parda 10 6 20 59 68 188 F A Branca 9 8 U2 Estatística descritiva 78 que não conseguimos extrair muita informação ao observála Dessa maneira para podermos fazer algum tipo de inferência pre cisamos organizar os valores obtidos para cada variável de forma mais simples e de modo que uma rápida leitura possa fornecer informações que ainda estão ocultas Uma das maneiras mais utilizadas para organizar dados são as tabe las de distribuição de frequências Veja na Tabela 22 como podemos dispor os dados relativos à idade da amostra de funcionários da empresa M A notação 20 30 indica que estão sendo considerados os valores maiores ou iguais a 20 e menores que 30 Os demais são interpretados de modo semelhante A coluna Frequência da Tabela 22 também denominada frequên cia absoluta é construída por contagem direta dos valores dispostos na coluna a da Tabela 21 As demais colunas exigem alguns cálcu los Para calcular as Proporções também conhecidas como frequências relativas dividimos as frequências absolutas pela soma de todas as frequências Exemplo 0 30 6 20 Porcentagens multiplicamos as proporções por 100 Exemplo 30 030 100 Ao observarmos a distribuição de frequências da variável idade conseguimos obter informações que antes não estavam visíveis Por exemplo podemos afirmar que a faixa etária de 20 anos ou mais e menos de 30 anos tem 30 dos funcionários ou ainda que mais da metade dos funcionários 3025 têm menos de 40 anos Fonte O autor 2015 Tabela 22 Distribuição de frequências da variável idade na amostra Faixa etária Frequência Proporção Porcentagem 20 30 6 030 30 30 40 5 025 25 40 50 4 020 20 50 60 5 025 25 Total 20 100 100 U2 Estatística descritiva 79 Assimile Para calcularmos uma proporção dividimos a frequência absoluta correspondente pela soma de todas as frequências Uma porcentagem é calculada multiplicando uma proporção por 100 A Tabela 22 está organizada em intervalos de classe Essa estratégia é bastante utilizada quando os valores obtidos são muito variados não há repetição Exemplificando Algumas vezes não é necessário agrupar os valores obtidos de uma variável em intervalos de classe como é o caso da variável número de títulos em mundiais de futebol Até 2015 os campeões das 20 edições do torneiro eram Brasil 5 títulos Itália 4 títulos Alemanha 4 títulos Uruguai 2 títulos Argentina 2 títulos França 1 título Inglaterra 1 título e Espanha 1 título A distribuição de frequências dessa variável pode ser observada na Tabela 23 Número de títulos Frequência Proporção Porcentagem 1 3 0375 375 2 2 0250 250 3 1 0125 125 4 1 0125 125 5 1 0125 125 Total 8 1000 1000 Fonte FUTPÉDIA 2015 Tabela 23 Distribuição de frequências da variável número de títulos em mundiais de futebol Desafio construa as distribuições de frequências das demais variáveis presentes na Tabela 21 e compare sua resposta com a esperada no apêndice da Seção 22 Rol Você deve ter tido um pouco mais de trabalho para construir a tabela de distribuição de frequências da variável peso se compararmos com o empenho que seria necessário para construir a Tabela 22 Isso se deve ao fato de os dados referentes a essa variável não estarem organizados do modo como estão os referentes à variável idade vide Tabela 21 Como já foi mencionado quando os dados estão desordenados dizemos que eles estão de forma bruta a exemplo dos dados referentes U2 Estatística descritiva 80 à variável peso Quando os dados estão organizados em uma ordem crescente ou decrescente dizemos que eles estão em rol como é o caso dos dados relativos à variável idade Gráficos estatísticos Além de tabelas também podemos representar informações em gráficos Esse tipo de representação tem forte apelo visual sendo atrativo aos olhos dos leitores e muitas vezes pode dar uma ideia melhor da variabilidade de um conjunto de dados do que uma tabela São inúmeros os tipos de representações gráficas tanto para variáveis qualitativas quanto para quantitativas Abordaremos apenas os tipos mais simples e caberá a você pesquisar outras representações e suas particularidades Gráficos para variáveis qualitativas Um tipo particular de gráfico é o de barras Observe na Figura 26 um exemplo desse tipo de gráfico elaborado a partir da Tabela 21 Exemplificando Organize o seguinte conjunto de dados em rol crescente e em rol decrescente 18 11 35 26 22 16 Resolução Rol crescente 11 16 18 22 26 35 Rol decrescente 35 26 22 18 16 11 Assimile Um rol é uma organização crescente ou decrescente de dados Figura 26 Cor dos olhos da amostra de funcionários da empresa M Fonte Os autores 2015 U2 Estatística descritiva 81 Num gráfico de barras o eixo horizontal é denominado eixo das categorias e o vertical eixo das quantidades Cada barra representa um dos valores assumidos pela variável uma categoria A altura da barra é proporcional à frequência com que determinada resposta aparece na amostra e a largura é constante para todas as barras A construção de gráficos de barras pode ser facilitada em papel milimetrado ou em uma planilha eletrônica Veja um vídeo tutorial de como utilizar uma planilha para construção de um gráfico de barras em httpswwwyoutubecomwatchvPrqDotQ7B54 Outro tipo bastante utilizado de gráfico é o de setores também conhecido como gráfico de pizza São muito úteis para visualizar a participação frequência de determinada categoria em relação ao todo Esse tipo de gráfico é construído com base em um círculo dividido a partir de seu centro em quantas partes for o número de valores possíveis para a variável em questão Na Figura 27 é apresentado um gráfico de setores construído a partir da tabela de distribuição de frequências para a variável raça cuja construção foi proposta anteriormente e que consta no apêndice da Seção 22 Cada setor de um gráfico de pizza corresponde a um possível valor da variável Esse setor terá tamanho proporcional à participação desse valor em relação ao todo Essa participação fica facilmente visualizável quando observamos a coluna Porcentagem da tabela de distribuição de frequências Veja que os valores percentuais calculados para essa coluna são apresentados no interior do gráfico de setores Em determinadas situações a participação de certas categorias em relação ao todo é tão pequena que convém agrupar seus valores em um único setor para facilitar a visualização Figura 27 Distribuição dos funcionários da empresa M Fonte O autor 2015 U2 Estatística descritiva 82 Exemplificando Observe na Tabela 24 a quantidade de mandioca em kg produzida pelos estados da região Nordeste em 2006 UF Quantidade em kg Porcentagem Pernambuco 2401684 30 Alagoas 1479204 18 Maranhão 1315186 16 Bahia 1246801 15 Sergipe 685133 8 Piauí 394665 5 Ceará 426183 5 Rio Grande do Norte 139452 2 Paraíba 82627 1 Fonte O autor 2015 Tabela 24 Produção de mandioca em kg na região Nordeste em 2006 Para construir um gráfico de setores a partir dessa tabela teríamos problemas de visualização pois alguns setores ficariam muito pequenos Em casos como este geralmente agrupamse os setores menores em um só denominado Outros Veja um exemplo na Figura 28 Figura 28 Participação dos estados na produção de mandioca da região Nordeste em 2006 Fonte IBGE Produção vegetal 2015 Gráficos para variáveis quantitativas Gráficos de barra também são bastante utilizados para representar variáveis quantitativas Veja um exemplo na Figura 29 construído a partir da Tabela 23 U2 Estatística descritiva 83 Vale ressaltar que quando se trata de variáveis quantitativas a variedade de representações gráficas é maior A mesma informação apresentada na Figura 29 também poderia ser representada de outras formas como mostra a Figura 210 Figura 29 Número de títulos em mundiais de futebol Fonte FUTPÉDIA 2015 Fonte FUTPÉDIA 2015 Figura 210 Número de títulos em mundiais de futebol a b c As representações da Figura 210 a e da Figura 210 b são denominadas gráficos de dispersão Nesses exemplos a variável em questão é discreta Quando trabalhamos com variáveis quantitativas contínuas precisamos fazer uma adaptação para construir representações semelhantes Considere a distribuição de frequências para a variável altura cuja construção foi proposta anteriormente e é apresentada na Tabela 25 com alguns acréscimos Veja na Tabela 25 que foi acrescentada a coluna Ponto médio Nessa coluna temos os U2 Estatística descritiva 84 pontos médios das classes que são obtidos somandose os valores extremos e dividindose por 2 O ponto médio da classe servirá como representante na hora de construir uma representação gráfica Veja na Figura 211 um gráfico de barras construído a partir da Tabela 25 Outra maneira de representar os dados da Tabela 25 é por meio de um histograma o qual pode ser visto na Figura 212 Em um histograma cada barra possui a largura do intervalo da classe e altura proporcional à frequência correspondente Uma das principais características do histograma é que suas barras são justapostas ou seja grudadas umas às outras Tabela 25 Distribuição de frequências da variável altura apresentada na Tabela 21 Altura em cm Ponto médio Frequência Proporção Porcentagem 160 165 1625 3 015 15 165 170 1675 3 015 15 170 175 1725 5 025 25 175 180 1775 5 025 25 180 185 1825 2 010 10 185 190 1875 2 010 10 Total 20 100 100 Fonte O autor 2015 Figura 211 Altura dos funcionários da amostra da empresa M Fonte O autor 2015 Figura 212 Altura dos funcionários da amostra da empresa M Fonte O autor 2015 U2 Estatística descritiva 85 Para criar um histograma de modo rápido e fácil acesse o site httpwwwsocscistatisticscomdescriptivehistogramsDefault aspx e insira os dados relativos às alturas da amostra disponíveis na Tabela 21 Ramosefolhas A ideia geral ao se construir um gráfico seja de barras dispersão ou histograma é determinar como os dados se distribuem A linguagem simplificada e resumida de um gráfico é de grande ajuda nessa tarefa Uma grande desvantagem ao construir uma representação gráfica é a perda de informação dos dados originais Para facilitar na visualização da distribuição dos dados e ainda não perder muita informação dos dados brutos podemos utilizar um diagrama de ramosefolhas Veja na Figura 213 um diagrama construído a partir da Tabela 21 para a variável altura Para compreender como é construído um diagrama como esse vamos repetir no quadro ao lado os dados relativos às alturas dos funcionários da amostra organizados em rol e destacado o último algarismo em cada observação Note que para construir o diagrama traçamos uma linha vertical e à esquerda dessa linha dispomos os dois primeiros algarismos das observações à direita dessa linha dispomos os últimos algarismos das observações separados por vírgula Analisando o diagrama da Figura 213 podemos observar a distribuição dos valores há prevalência de valores na classe do meio e ainda mantivemos as informações originais 162 162 163 165 165 165 170 170 170 171 174 175 176 177 179 179 180 181 185 188 U2 Estatística descritiva 86 Figura 213 Diagrama de ramosefolhas para a variável altura 16 223555 17 0001456799 18 0158 Fonte O autor 2015 Exemplificando Observe o diagrama de ramosefolhas da Figura 214 Como poderíamos escrever os dados desse diagrama por extenso Resolução 170 173 175 177 180 186 189 196 197 198 203 204 211 215 215 Figura 214 Peso de uma amostra de 15 novilhos Fonte O autor 2015 17 0357 18 069 19 678 20 34 21 155 Em estatística existem diversas normas para apresentação de dados em tabelas e gráficos Determinados elementos são considerados essenciais e quando compõem um desses objetos é preciso se atentar às normas Há também uma maneira padrão para a elaboração de uma tabela de distribuição de frequências agrupadas em intervalos de classe Veja no link httpwwweeuspbrgraduacaoens435 modulo4modulo4lhtml alguns dos elementos considerados essenciais na apresentação de tabelas e gráficos e no link httpwww fernandokbprobrp201 a forma padrão para a construção de uma tabela de distribuição de frequências Pesquise mais Além dos tipos de gráficos apresentados existem diversos outros sendo que cada um possui uma característica própria que o faz mais adequado para determinada situação Para se aprofundar nesse assunto segue uma sugestão de leitura Suporte Office Disponível em httpssupportofficecomptbr articleTiposdegrC3A1ficosdisponC3ADveisb22a8bb9 a6734d7fb481aa747c48eb3duiptBRrsptBRadBR Acesso em 15 jul 2015 U2 Estatística descritiva 87 Sem Medo de Errar Relembrando a situaçãoproblema proposta no início da seção vamos agora nos preocupar com a apresentação dos dados da amostra apresentada na Tabela 21 e para termos maior riqueza de detalhes vamos tratar apenas das variáveis sexo e peso As demais podem ser trabalhadas de modo semelhante Considerando essas duas variáveis qual seria a melhor forma de apresentálas Com um gráfico ou uma tabela Como seria essa apresentação Métodos tabulares são aplicáveis na maioria das vezes tanto para variáveis qualitativas quanto para quantitativas Têm a vantagem de em geral possuir maior riqueza de detalhes do que uma representação gráfica Contudo tabelas podem ser de difícil leitura trabalho que pode ser simplificado por meio de um gráfico Como a construção das tabelas de distribuição de frequências para essas variáveis já foi proposta anteriormente e consta no apêndice dessa seção vamos apresentar os dados de forma gráfica Para isso resta decidir qual tipo de gráfico é mais adequado para cada uma Primeiramente vamos tratar da variável sexo que é qualitativa nominal Nessa seção foram mostrados dois tipos de gráficos para apresentação de dados relativos a esse tipo de variável o de barras e o de setores Ambos estão representados na Figura 215 Figura 215 Distribuição dos funcionários da empresa M por sexo Fonte O autor 2015 a b U2 Estatística descritiva 88 Para que a representação gráfica seja adequada sempre devemos considerar o objetivo do pesquisador Não existe uma rigidez quanto à escolha do tipo de gráfico mas vale observar as sugestões apresentadas nas leituras sugeridas no Pesquise Mais Nesse exemplo por questões estéticas consideramos como mais adequado o gráfico de setores pois ele deixa visível a participação da cada categoria com relação ao todo Dando continuidade a variável peso é quantitativa contínua Para escolher uma entre as representações gráficas apresentadas são válidas algumas observações Gráfico de barras para elaborar um gráfico desse tipo temos que considerar a mesma estratégia utilizada para elaborar o gráfico da Figura 28 ou seja determinar o ponto médio de cada intervalo de classe Acreditamos que com isso perderíamos um pouco de informação Gráfico de dispersão como não há muitos valores repetidos para a variável peso um gráfico desse tipo poderia ser de difícil leitura Gráfico de setores os dados estão agrupados na tabela de distribuição de frequências veja apêndice em classes justapostas Logo um gráfico de setores pode não ser adequado ou pouco informativo para esse exemplo Figura 216 Peso dos funcionários da empresa M Fonte O autor 2015 Considerando as observações anteriores e a semelhança entre esse exemplo e o apresentado na Figura 212 concluímos que a representação gráfica mais adequada é um histograma que está representado na Figura 216 U2 Estatística descritiva 89 AVANÇANDO NA PRÁTICA Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competências de fundamentos de área Conhecer os conceitos matemáticos básicos e pro porcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Expor dados da amostra por meio de gráficos e tabelas 3 Conteúdos relacionados Métodos tabulares e métodos gráficos para apresentação de dados 4 Descrição da situação problema O IMC Índice de massa corpórea é um indicador reconhecido pela Organização Mundial da Saúde para dimensionar a relação entre peso e altura de um indivíduo Para calculálo dividimos o peso em kg pela altura em metros ao quadrado ou seja IMC Peso Altura 2 Conhecendose o IMC podemos utilizar a seguinte classificação1 Menos de 185 Abaixo do peso 185 250 Peso adequado 250 300 Sobrepeso 300 ou mais Obeso De acordo com essas informações e com base nos dados da Tabela 21 construa Um gráfico de barras duplas horizontais para as variáveis satisfação em relação às condições de trabalho e remuneração Uma tabela de distribuição de frequências para o IMC U2 Estatística descritiva 90 Estatística descritiva U2 96 5 Resolução da situação problema Para construir o gráfi co de barras vamos considerar os dados da tabela de distribuição de frequências para as variáveis satisfação em relação às condições de trabalho e remuneração cuja construção foi proposta anteriormente e cujos dados constam no apêndice da seção 22 Veja esse gráfi co na Figura 217 Figura 217 Satisfação em relação às condições de trabalho e remuneração da amostra de funcionários da empresa M Fonte O autor 2015 Para construir a tabela de distribuição de frequências primeiro precisamos calcular os IMCs N Peso em kg Altura em metros IMC N Peso em kg Altura em metros IMC 1 74 174 244 11 74 175 242 2 93 176 300 12 85 162 324 3 86 171 294 13 60 165 220 4 83 179 259 14 67 170 232 5 88 185 257 15 81 162 309 6 63 181 192 16 85 165 312 7 60 177 192 17 86 170 298 8 58 163 218 18 57 170 197 9 84 180 259 19 88 179 275 10 81 165 298 20 68 188 192 Agora a partir desses dados podemos construir a distribuição de frequências apresentada na Tabela 26 Tabela 26 Distribuição de frequências do IMC Classifi cação Frequência Proporção Porcentagem Abaixo do peso 0 000 0 Peso adequado 9 045 45 Sobrepeso 8 040 40 Obeso 3 015 15 Total 20 100 100 Fonte O autor 2015 Lembrese Dados brutos são aqueles que não estão ordenados Uma tabela de distribuição de frequências é uma organização tabular que busca relacionar os possíveis valores de uma variável às frequências com que aparecem numa amostra U2 Estatística descritiva 91 Rol é uma organização crescente ou decrescente dos dados de uma amostra Faça você mesmo Organizese com seus colegas e pesquisem por amostragem a altura dos alunos da turma Depois construa uma tabela de distribuição de frequências agrupadas em intervalos de classe e um histograma Por fim compare sua resposta com a dos colegas Faça valer a pena 1 Assinale a alternativa que contém dados organizados em rol a 71 88 56 65 99 b 95 92 75 60 44 c 20 56 67 53 70 d 32 81 59 17 38 e 87 62 37 76 61 2 Com base nas informações da Tabela 27 assinale a alternativa que contém a sequência de valores x y z w nessa ordem a 64 24 9 3 b 62 24 9 5 c 64 22 9 5 d 60 28 9 5 e 66 21 8 5 3 Em determinado hospital foram realizados exames em diversos pacientes com suspeita de uma doença Os resultados foram compilados no gráfico da Figura 218 U2 Estatística descritiva 92 Figura 218 Resultados dos exames realizados Fonte O autor 2015 Assinale a alternativa que contém os dados brutos que deram origem a esse gráfico a NNNNNNPPPPPPPPII b NNNNPPPPPI c NNNNNNNPPPPPPPPPPI d NNNNNNNPPPPPPPPIII e NNNNNNPPPPPPPPPIII 4 A Tabela 28 apresenta a distribuição da população brasileira em 2010 por faixa etária Fonte O autor 2015 Tabela 28 Distribuição da população brasileira em 2010 Faixa etária Frequência em milhões Porcentagem 0 20 6289 3310 20 40 x 3330 40 60 y 2260 60 ou mais z w Total 19000 10000 Com base nos dados da tabela assinale a alternativa correta a Metade da população tinha mais 40 anos b Aproximadamente 30 milhões de brasileiros tinham 60 anos ou mais c Um terço da população tinha menos de 40 anos d 18 da população tinha 60 anos ou mais e Mais de 63 milhões de brasileiros possuíam entre 20 e 40 anos U2 Estatística descritiva 93 5 O histograma da Figura 219 mostra a distribuição dos salários ganhos pelos funcionários de uma empresa Fonte O autor 2015 Tabela 29 População brasileira por região em 2010 Região População em milhões Norte 159 Nordeste 531 Sudeste 804 Sul 274 CentroOeste 141 Com base no histograma assinale a alternativa correta a Seis funcionários ganham até 3 salários mínimos b Sete funcionários ganham 5 salários mínimos ou mais c 10 dos funcionários ganham 6 salários mínimos ou mais d 25 dos funcionários ganham menos de 2 salários mínimos e Metade dos funcionários ganha mais de 4 salários mínimos 6 A Tabela 29 mostra a quantidade de habitantes no Brasil em 2010 Figura 219 Salários ganhos pelos funcionários de uma empresa Fonte O autor 2015 Elabore um gráfico de setores a partir da Tabela 29 e em cada setor indique a porcentagem correspondente 7 Elabore um diagrama de ramosefolhas a partir do conjunto de dados a seguir 132 259 188 573 540 458 663 780 614 937 872 170 312 223 601 559 535 687 782 645 953 895 U2 Estatística descritiva 94 Seção 23 Medidas de posição Diálogo aberto Na Seção 22 você aprendeu sobre diferentes formas de apresentar informações como as tabelas e os gráficos Vimos que as tabelas são úteis para organizar e resumir dados mas que em alguns casos podem ser de difícil leitura e interpretação Nesse sentido uma representação gráfica pode ser mais fácil de interpretar resume ainda mais os dados e dá uma ideia melhor da distribuição Existem ainda outras maneiras de resumir conjuntos de dados que vão além de uma tabela ou um gráfico Ferramentas para esse fim são denominadas medidas de posição as quais buscam sintetizar um conjunto com um único valor São exemplos de medidas de posição a média aritmética a mediana e a moda Considere a Tabela 21 e imagine maneiras de representar os dados referentes a cada variável por um único valor Como você faria isso Que valor seria mais adequado para cada conjunto Essas perguntas serão respondidas ao final dessa seção de autoestudo Leia o texto e se aprofunde no assunto com a sugestão de leitura do Pesquise mais Não deixe também de consultar outras bibliografias Reflita Estatística a ciência que diz que se eu comi um frango e tu não comeste nenhum teremos comido em média meio frango cada um Dino Segrè escritor italiano Não pode faltar Você aprendeu anteriormente que dados brutos são aqueles que se apresentam da maneira como foram coletados ou seja U2 Estatística descritiva 95 fora de ordem Também vimos que ao ordenar esses dados em ordem crescente ou decrescente estamos construindo um rol Veja um exemplo Dados brutos 18 42 31 26 21 24 20 90 Rol crescente 18 20 21 24 26 31 42 90 Rol decrescente 90 42 31 26 24 21 20 18 A construção de um rol é o primeiro passo para a confecção de tabelas e gráficos Entretanto essa não é sua única utilidade O rol será de grande ajuda na obtenção de algumas medidas de posição Estas por sua vez são valores que buscam resumir ainda mais um conjunto de dados mais até do que as tabelas e os gráficos As medidas mais conhecidas que possuem essa finalidade são a média aritmética a mediana e a moda Trataremos de cada uma mais adiante mas antes temos que adotar algumas notações para simplificar a escrita Na Seção 22 atribuímos valores às variáveis estudadas na amostra de funcionários Eram elas idade peso altura sexo cor dos olhos raça satisfação em relação às condições de trabalho e satisfação em relação à remuneração Para não ser necessário reescrever repetidamente os nomes dessas variáveis utilizamos letras maiúsculas para representálas como a seguir A idade B peso C altura D sexo E cor dos olhos F raça G satisfação em relação às condições de trabalho H satisfação em relação à remuneração Com essa padronização sempre que quisermos nos referir à variável satisfação em relação às condições de trabalho por exemplo podemos escrever simplesmente variável G Bem mais simples não concorda Outro procedimento bastante utilizado é enumerar os elementos de um conjunto de dados geralmente quando eles já estão organizados em rol Para exemplificarmos considere a variável definida a seguir U2 Estatística descritiva 96 X idade dos leitores de uma revista Admita que em uma pesquisa realizada para estudar a variável X se tenham sido obtidos os seguintes valores já organizados em rol Dados da amostra 18 20 21 24 26 31 42 90 Como os dados se referem à variável X comumente simbolizamos cada um pela letra x minúscula acompanhada do índice i que indica a posição que o valor aparece no rol O quadro a seguir resume essa associação Posição no rol i 1 2 3 4 5 6 7 8 xi 18 20 21 24 26 31 42 90 Ao escrevermos o símbolo x3 por exemplo estamos nos referindo ao valor obtido para a variável X que ocupa a posição i 3 terceira posição do rol isto é x3 21 No quadro anterior foram apresentados oito valores obtidos a partir de uma amostra Essa quantidade geralmente é simbolizada pela letra n minúscula Nesse caso temos que n 8 é o tamanho da amostra Atenção Na continuidade dessa seção com frequência os conjuntos de dados serão apresentados em rol crescente para facilitar a compreensão das medidas de posição Entretanto fique atento ao trabalhar com os dados brutos em outras situações pois você terá primeiro que organizálos em ordem crescente ou decrescente para calcular algumas dessas medidas Média aritmética A média aritmética ou simplesmente média corresponde à divisão da soma de todos os valores de um conjunto de dados pela quantidade de valores desse conjunto Se um conjunto tiver n valores x1 x2 x3 xn sua média será simbolizada por x x n x x x x n n 1 2 3 Calcule a média do seguinte conjunto de dados 18 20 21 24 26 31 42 90 Resolução x Σxn x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈8 18 20 21 24 26 31 42 908 2728 34 Leitura dos símbolos x x barra Σx soma dos valores de x A média é uma das mais importantes medidas de posição Veja que o conjunto de dados do exemplo anterior corresponde ao da amostra da variável X apresentada anteriormente O resultado obtido nesse exemplo nos indica que em média os leitores da referida revista possuem 34 anos Pergunta o valor 34 descreveu bem o conjunto de dados Por quê A resposta esperada para essa pergunta seria não A média aritmética é uma medida fortemente influenciada por valores extremos muito baixos ou muito altos motivo que nos leva quase sempre a não a utilizar sozinha para descrever um conjunto Em inúmeros casos essa medida é utilizada conjuntamente com outras como a mediana e medidas de dispersão que medem a variabilidade de um conjunto Quando o conjunto de valores é mais homogêneo a média cumpre eficientemente o papel de descrevêlo como no exemplo a seguir Conjunto 82 82 83 83 83 84 84 Média x 83 Dizer que nesse conjunto os valores são em média 83 não é longe do esperado Como determinar a média final do aluno visto que cada avaliação tem importância diferente Em situações como essa em que alguns elementos de um conjunto têm mais importância do que outros costumase utilizar a média ponderada para resumir os dados A média aritmética ponderada xp de um conjunto de dados é calculada ao multiplicarmos os números por seus respectivos pesos e dividirmos a soma desses produtos pela soma dos pesos Para o exemplo anterior temos xp 90038078547063746 15920 795 Portanto a média final do aluno na disciplina é 795 pontos Simbolicamente representamos a média ponderada de x₁ x₂ xn valores cujos pesos são respectivamente p₁ p₂ pn por xp x₁p₁ x₂p₂ xnpnp₁ p₂ pn Resolução Efetuamos os cálculos das médias Marcio xp Σxp Σp 1002 505 903 2 5 3 72 Lucas xp Σxp Σp 802 905 703 2 5 3 82 Portanto o candidato aprovado é Lucas Mediana Considere a variável Y como sendo os salários dos funcionários de uma empresa e que os valores amostrados para essa variável foram 840 860 790 780 1800 880 2800 A média dos salários é y 1250 contudo ao afirmar isso não descrevemos o quadro de salários satisfatoriamente visto que grande parte dos valores é próxima de 800 reais Em casos como este a mediana pode ser uma boa opção para descrever o conjunto A mediana ou valor mediano de um conjunto de dados corresponde ao valor central de um rol Para calculála temos de considerar dois casos 1º quantidade ímpar de valores no conjunto 2º quantidade par de valores no conjunto 1º caso quantidade ímpar de valores no conjunto No caso da amostra colhida para a variável Y considere o seguinte rol i 1 2 3 4 5 6 7 yi 780 790 840 860 880 1800 2800 Como n 7 ímpar a mediana simbolizada por Md corresponde ao valor que ocupa a posição i n 12 7 12 4 ou seja Md 860 Veja que abaixo e acima de 860 temos 3 valores isto é a mediana divide o rol ao meio em que metade dos valores é menor ou igual à mediana e a outra metade é maior ou igual à mediana Afirmação que o salário mediano dos trabalhadores da empresa é 860 reais corresponde melhor a uma descrição do conjunto do que a média 2º caso quantidade par de valores no conjunto Considere Z o número diário de visitantes em um museu e a amostra coletada para essa variável como sendo o conjunto 80 73 92 98 160 77 Nesse caso temos n 6 par elementos na amostra Ao organizar os dados em rol obtemos i 1 2 3 4 5 6 zi 73 77 80 92 98 160 Observe que agora não temos um único valor no centro do rol mas dois deles Um dos valores está localizado na posição i n2 62 3 e o outro na posição i n2 1 62 1 3 1 4 Para representar a mediana nesse caso utilizamos a média aritmética dos dois valores centrais ou seja Md z3 z42 80 922 86 Calcule a mediana dos valores amostrados das variáveis X e Y apresentados a seguir i 1 2 3 4 5 6 7 8 xi 102 103 135 144 148 159 160 166 yi 413 484 495 543 558 565 580 O símbolo indica que o dado é ausente Resolução Observe que o tamanho da amostra da variável X é nx 8 par e o tamanho da amostra para Y é ny 7 ímpar Assim para calcular a mediana de X MdX temos que utilizar o 2º caso e para a mediana de Y MdY o 1º caso como segue mediana de X i n2 82 4 primeira posição central i n2 1 82 1 4 1 5 segunda posição central MdX x4 x52 144 1482 146 mediana de Y i n 12 7 12 82 4 posição central MdY y4 543 Moda O que lhe vem à cabeça quando falamos a palavra moda Aquela roupa descolada que bastante gente está usando Pois bem em estatística essa palavra tem um sentido semelhante A moda simbolizada por Mo é o valor com maior frequência em um conjunto de dados Lembrase da tabela apresentada na seção 22 que continha os dados referentes à amostra de 20 funcionários da empresa M veja Tabela 21 Os dados referentes à variável raça F estão reproduzidos a seguir Parda Parda Amarela Preta Preta Amarela Parda Branca Preta Branca Parda Parda Branca Preta Branca Branca Parda Branca A distribuição de frequências desse conjunto de dados é apresentada na Tabela 211 Como pode ser observado na coluna Frequência o valor que teve a maior frequência foi Parda Portanto para este exemplo Mo Parda Tabela 212 Distribuição de frequências da variável F Raça Frequência Proporção Percentagem Amarela 2 010 10 Branca 6 030 30 Indígena 1 005 5 Parda 7 035 35 Preta 4 020 20 Total 20 100 100 A moda é uma medida de posição indicada tanto para variáveis quantitativas quanto para qualitativas como é o caso da variável raça Isso não ocorre por exemplo com a média e a mediana que são medidas indicadas somente para variáveis quantitativas Quando os possíveis valores de uma variável aparecem em igual número de vezes em uma amostra têm a mesma frequên U2 Estatística descritiva 102 cia dizemos que o conjunto é amodal isto é não possui moda Também podemos classificar os conjuntos em unimodais uma moda bimodais duas modas trimodais três modas e multimo dais quatro ou mais modas Assimile A média aritmética a mediana e a moda são medidas que buscam resumir um conjunto de dados em um único valor Para calcular a média aritmética adicionamos todos os valores e dividimos o resultado pela quantidade de valores adicionados Se a média aritmética for ponderada devemos levar em consideração os respectivos pesos A mediana divide o conjunto de dados ao meio Ela corresponde ao valor central em um rol se a quantidade de valores for ímpar e à média aritmética dos dois valores centrais se a quantidade for par A moda é o valor com maior frequência em um conjunto Pesquise mais Apresentamos aqui os cálculos de algumas medidas de posição para dados não agrupados em classes Essas mesmas medidas podem ser utilizadas também para dados agrupados em tabelas de distribuição de frequências Para conhecer o cálculo dessas medidas para dados agrupados e outras medidas de posição como as separatrizes sugerimos a seguinte leitura complementar Descrição de amostras Disponível em httpwwwufpabrdicas biomebioamoshtm Acesso em 15 jul 2015 Sem Medo de Errar Vamos relembrar as questões feitas no início dessa seção de autoestudo considerando a Tabela 21 como representar os dados referentes a cada variável por um único valor Que valor seria mais adequado para cada conjunto Trataremos aqui das variáveis A idade e D sexo O tratamento das demais será proposto na seção AVANÇANDO NA PRÁTICA Variável A Iremos utilizar a média aritmética e a mediana para descrever as idades Para calcular a média efetuamos a a n 21 21 25 53 55 59 20 779 20 3895 39 Logo os funcionários da empresa têm em média 39 anos aproximadamente Para o cálculo da mediana observe que o conjunto possui n 20 par valores Portanto a mediana corresponderá à média aritmética dos elementos nas posições i n 2 20 2 10 i n 2 1 20 2 1 10 1 11 Assim Md a10 a11 2 37 39 2 38 Concluímos então que a mediana das idades é 38 anos Observe que a mediana e a média sozinhas não descrevem muito bem o conjunto de dados Isso ocorre porque há muita variabilidade Temos funcionários com 21 anos e outros com 59 Veremos na seção 24 que há ferramentas que auxiliam as medidas de posição a descrever o conjunto Por enquanto nos limitaremos a apresentar estes valores como descrição Variável D Para descrever os dados referentes à variável D não podemos utilizar a média e a mediana visto que essa variável é qualitativa Nos resta então utilizar a moda Repetimos aqui os dados para contabilizar as frequências M F F F M F M M F F M M M M M M M F M F F Observe que temos 11 funcionários do sexo masculino e 9 resultando em Mo M ou seja a maioria dos funcionários é do sexo masculino Avançando na Prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competências de fundamentos de área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Resumir dados por meio de uma medida de posição 3 Conteúdos relacionados Medidas de posição 4 Descrição da situação problema Considerando os dados apresentados na Tabela 21 calcule o peso médio a altura mediana a cor dos olhos e a raça de maior frequência a moda dos dados referentes às variáveis G e H Peso médio Para calcular a média dos pesos efetuamos b b n 74 93 86 57 88 68 20 1521 20 7605 76 Portanto o peso médio dos funcionários é aproximadamente 76 quilogramas Altura mediana Para calcular a mediana primeiro precisamos construir um rol como a seguir 162 162 163 165 165 165 170 170 170 171 174 175 176 177 179 179 180 181 185 188 Como n20 par a mediana corresponderá à média dos valores nas posições i n 2 20 2 10 i n 2 1 20 2 1 10 1 11 Assim Md c10 c11 2 171 174 2 1725 173 Concluímos que a altura mediana é aproximadamente 173 centímetros Cor dos olhos e raça de maior frequência U2 Estatística descritiva 105 Para determinar a moda de cada conjunto de dados utilizaremos as tabelas de distribuição de frequências cuja construção foi proposta na seção 22 e cujo gabarito consta no apêndice O valor modal para a cor dos olhos foi Castanhos com porcentagem igual a 75 raça foi Parda com porcentagem igual a 35 Moda dos dados referentes às variáveis G e H Para determinarmos a moda de cada conjunto primeiro construímos um rol como a seguir Variável G 1 1 2 3 4 4 4 5 5 5 5 5 5 7 7 8 9 9 10 10 Variável H 3 3 4 4 4 4 4 4 4 5 5 5 5 6 6 7 7 7 8 8 Com o rol disponível podemos observar que o valor de maior frequência em cada caso é 5 e 4 para as variáveis G e H respectivamente Lembrese Para calcular a média aritmética adicionamos todos os valores e dividimos o resultado pela quantidade de valores adicionados Se a média aritmética for ponderada devemos levar em consideração os respectivos pesos A mediana divide o conjunto de dados ao meio Ela corresponde ao valor central em um rol se a quantidade de valores for ímpar e à média aritmética dos dois valores centrais se a quantidade for par A moda é o valor com maior frequência em um conjunto Faça você mesmo Na Seção 22 no tópico Faça você mesmo foi proposto que junto com seus colegas você pesquisasse a altura dos alunos da turma Aproveite os dados coletados nessa pesquisa e calcule a média e a mediana do conjunto Também classifique o conjunto com relação à quantidade de modas e indique os valores modais U2 Estatística descritiva 106 Faça Valer a Pena 1 Assinale a alternativa que contém o conjunto com a maior média a 409 337 104 b 131 115 302 c 395 404 369 d 250 432 1562 e 258 156 223 2 Assinale a alternativa que contém a média aritmética do conjunto de dados sintetizado no diagrama de ramosefolhas ao lado a 138 b 139 c 140 d 141 e 142 3 Observe o seguinte conjunto de dados 12 27 16 42 16 23 41 25 Com relação à média à mediana e à moda do conjunto anterior assinale a alternativa correta a Mo x Md b Mo Md x c Md Mo x d Md x Mo e x Mo Md 4 Observe a Tabela 213 em que constam as idades de 20 crianças que participam de um projeto social Assinale a alternativa que contém a média e a mediana das idades das crianças 10 88 11 6 12 07 13 11 14 4 15 08899 16 47 U2 Estatística descritiva 107 Dica escreva o rol correspondente à distribuição de frequências a x 9 e Md 7 b x 9 e Md 8 c x 9 e Md 9 d x 8 e Md 9 e x 7 e Md 9 5 Em uma turma de 40 alunos há alguns com 20 anos 21 anos 24 anos e ainda outros com 28 anos A quantidade de alunos com cada uma dessas idades é apresentada na Figura 220 Assinale a alternativa que contém a média das idades dos alunos dessa turma a 242 anos b 240 anos c 220 anos d 244 anos e 224 anos 6 Calcule a média a mediana e a moda do seguinte conjunto de dados 1 1 2 2 2 3 3 3 3 4 4 4 5 5 6 6 6 6 6 7 7 7 7 7 8 8 9 9 9 9 Depois classifique o conjunto com relação à quantidade de modas 7 Considere o seguinte conjunto de dados 1932 y 1596 1649 1597 Calcule o valor de y sabendo que a média do conjunto é 1646 Figura 220 Distribuição das idades Fonte O autor 2015 Figura 220 Distribuição das idades Fonte O autor 2015 Tabela 213 Distribuição de frequências Idade Frequência Proporção Porcentagem 7 4 020 20 8 4 020 20 9 5 025 25 10 3 015 15 11 3 015 15 12 1 005 5 Total 20 100 100 U2 Estatística descritiva 108 Seção 24 Medidas de dispersão Diálogo aberto Vimos na unidade anterior que existem maneiras ainda mais sintéticas de resumir um conjunto de dados do que as tabelas e os gráficos Tais métodos envolvem a obtenção de um único valor ou poucos valores para representar todo o conjunto valor esse que denominamos medida de posição As medidas que estudamos foram a média aritmética a média aritmética ponderada a mediana e a moda No exemplo apresentado na seção SEM MEDO DE ERRAR constatamos que nem sempre uma medida como a média representa significativamente um conjunto Isso também pode ser observado nos conjuntos a seguir 1 conjunto 90 90 90 90 90 2 conjunto 86 88 90 92 94 3 conjunto 30 60 90 120 150 Os conjuntos possuem média e mediana iguais a 90 calcule entretanto apenas para os dois primeiros esse valor é representativo Aqui surgem alguns questionamentos quando uma média é representativa em um conjunto Quais ferramentas podem ser utilizadas para auxiliar as medidas de posição na descrição de um conjunto de dados Para auxiliar as medidas de posição na descrição de um conjunto utilizamos as medidas de dispersão Essas medidas buscam dimensionar quanto os dados estão distantes da média por exemplo Com o auxílio delas podemos decidir por exemplo se a média pode ser utilizada como representante de um conjunto No decorrer dessa seção buscaremos responder aos questionamentos anteriores e mais especificamente decidir se a média é adequada para resumir os dados referentes aos funcionários da empresa M apresentados na Tabela 21 e quantificar a variabilidade de cada conjunto de dados Dispersão ou variabilidade de um conjunto referese à maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação Carlos Augusto de Medeiros chefe da Unidade de Administração Geral da Fundação Universidade Aberta do Distrito Federal Não Pode Faltar Desvio Vamos considerar os dados do 1 2 e 3 conjuntos apresentados anteriormente como sendo provenientes de censo das variáveis X Y e Z respectivamente Denominamos desvio a diferença de um valor do conjunto com relação à média Para os conjuntos de dados apresentados anteriormente temos os desvios calculados na Tabela 214 lembrese de que x y z 90 Tabela 214 Desvios dos conjuntos de dados i Valores do conjunto Desvios 1 90 86 30 90 90 0 86 90 4 30 90 60 2 90 88 60 90 90 0 88 90 2 60 90 30 3 90 90 90 90 90 0 90 90 0 90 90 0 4 90 92 120 90 90 0 92 90 2 120 90 30 5 90 94 150 90 90 0 94 90 4 150 90 60 Total Σx 450 Σy 450 Σz 450 Σxi x 0 Σyi y 0 Σzi z 0 Observe que para as amostras das variáveis X Y e Z a soma de todos os desvios é igual a zero Isso não ocorre somente para estes conjuntos mas para todos os conjuntos de dados Desse modo qualquer tentativa de utilizar a soma dos desvios Σxi x para dimensionar a variabilidade dos dados será frustrada Isso ocorre pois os desvios negativos neutralizam os positivos tornando o total igual a zero Para driblar esse contratempo os estatísticos se utilizam de um artifício matemático o valor absoluto O valor absoluto de um número corresponde à distância que este se encontra do 0 zero A distância é sempre um valor positivo ou zero Outra maneira de neutralizar o efeito do sinal negativo ocorrido na Tabela 214 é elevar cada desvio ao quadrado como mostra a Tabela 216 O desvio padrão simbolizado por Dp é uma medida de dispersão definida como a raiz quadrada da variância VarB b b² 3 959 1038² 1065 1038² 1090 1038² 3 6241 729 2704 3 322467 relatório são definidas determinadas regrasnormas as quais o pesquisador segue fielmente deixandoas explícitas para os leitores De modo semelhante para adotarmos certa padronização iremos recorrer à Tabela 217 Consideraremos a média representativa de um conjunto de dados quando este tiver baixa dispersão U2 Estatística descritiva 116 A mediana seria representativa nos casos em que apenas poucos valores do conjunto se distanciam consideravelmente da média Quando isso ocorre geralmente esses valores são denominados outliers ou valores atípicos Avançando na Prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois ascompare com as de seus colegas 1 Competências de fundamentos de área Conhecer os conceitos matemáticos básicos e pro porcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Compreender a utilização das medidas de dispersão 3 Conteúdos relacionados Variância Desvio padrão Coeficiente de variação 4 Descrição da situação problema Uma área em que a estatística está muito presente é a de controle de qualidade Geralmente processos industriais procuram uniformidade nos produtos que saem de uma linha de produção Imagine que uma fábrica de refrigerantes que envasa embalagens de 1 litro e de 600 mililitros utilize os seguintes critérios para realizar o controle de qualidade Serão amostradas sistematicamente para controle de qualidade 5 da produção a cada 20 embalagens de cada tipo será retirada 1 para conferência do volume de refrigerante Se uma amostra de tamanho n 20 apresentar coeficiente de variação superior a 4 todo o lote de 400 embalagens correspondente a essa amostra será rejeitado Com base nesses critérios analise as amostras a seguir e decida a Qual das amostras é mais homogênea b Qual das amostras causará rejeição do lote de refrigerantes Amostra de embalagens de 1 litro 0983 1025 1047 1027 1013 0958 0996 0991 0960 1036 0987 0971 0972 1016 Amostra de embalagens de 600 mililitros 627 641 556 591 590 613 646 565 614 592 584 627 600 597 Sejam X volume das embalagens de 1 litro Y volume das embalagens de 600 mililitros Temos x X nx 0983 1025 1050 0969 20 0999 VarX Xx2 nx1 0983 09992 096909992 201 0000912 DpX 0000912 0030199 CVX DpX x 0030199 0999 003 3 y Y ny 627 641 586 578 20 60575 VarY Yy2 ny1 627605752 578605752 201 73893 2718 DpY 73893 2718 CVY DpY y 2718 60575 0045 45 Em relação à pergunta a como CVY CVX segue que a amostra de X é mais homogênea ou seja a amostra de refrigerantes de 1 litro é mais homogênea que a de 600 mililitros Com relação à pergunta b como CVX 4 CVY a amostra de Y causará rejeição do lote enquanto a amostra de X está dentro das conformidades O desvio é a diferença de um valor do conjunto com relação à média O desvio médio simbolizado por Dm é uma medida de dispersão calculada por meio da média aritmética dos valores absolutos dos desvios A variância simbolizada por Var é uma medida de dispersão calculada por meio da média aritmética dos quadrados dos desvios O desvio padrão simbolizado por Dp é uma medida de dispersão definida como a raiz quadrada da variância O coeficiente de variação simbolizado por CV é uma medida de dispersão definida como a razão entre o desvio padrão e a média de um conjunto de dados Um conjunto de dados é classificado como baixa dispersão se CV 15 média dispersão se 15 CV 30 alta dispersão se CV 30 Na seção 22 no tópico Faça você mesmo foi proposto que junto com seus colegas você pesquisasse a altura dos alunos da turma Verifique se a média é representativa do conjunto de dados de acordo com os critérios estabelecidos nesta seção O conjunto de dados a seguir obtido a partir da população possui média x 33 Assinale a alternativa que contém o desvio padrão do conjunto y 20 40 60 a 1844 b 1846 c 1863 d 1802 e 1774 4 Observe os conjuntos A123 B234 e C567 Assinale a alternativa que apresenta respectivamente a classificação desses conjuntos quanto à dispersão a alta dispersão média dispersão média dispersão b média dispersão média dispersão baixa dispersão c alta dispersão alta dispersão média dispersão d alta dispersão baixa dispersão média dispersão e alta dispersão média dispersão baixa dispersão 5 Considerando o apresentado nessa seção e os conjuntos A123 B234 e C567 assinale a alternativa que completa a frase A média é uma medida representativa U2 Estatística descritiva 120 6 Os dados a seguir referemse às alturas dos atletas das seleções masculina e feminina do vôlei brasileiro que participaram das Olimpíadas de Atenas em 2004 Seleção masculina X 199 199 201 184 192 196 203 184 195 191 205 190 Seleção feminina Y 177 179 184 180 194 180 173 188 179 180 185 190 Calcule a média a variância o desvio padrão e o coeficiente de variação de cada conjunto e conclua em qual deles há maior variabilidade na altura dos atletas 7 Observe os dados a seguir 1000 1260 1320 1380 1410 1645 1980 2106 2230 2239 2379 2760 3060 3120 3460 4030 4260 5050 5120 6460 Esse conjunto referese aos salários amostrados de alguns funcionários de uma grande empresa Calcule a média e justifique por que ela não é representativa para esse conjunto Em seguida construa um histograma para sintetizar os dados Os intervalos de classes devem ser 1000 2000 2000 30003000 40004000 50005000 60006000 7000 U2 Estatística descritiva 121 Referências ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística aplicada à administração e economia Trad José Carlos Barbosa dos Santos 2 ed São Paulo Cengage Learning 2011 CRESPO Antônio A Estatística fácil 17 ed São Paulo Saraiva 2002 FREUND John E Estatística aplicada economia administração e contabilidade Trad Claus Ivo Doering 11 ed Porto Alegre Bookman 2006 FUTPÉDIA Disponível em httpfutpediaglobocomcampeonatocopado mundo Acesso em 13 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística População presente e residente Disponível em wwwibgegovbr Acesso em 14 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística Produção vegetal Disponível em wwwibgegovbr Acesso em 14 maio 2015 JOHNSON Robert KUBY Patrícia Estatística São Paulo Cengage Learning 2013 MEDEIROS Valéria Z Coord Métodos quantitativos com excel São Paulo Cengage Learning 2008 MORETTIN Luiz G Estatística básica probabilidade e inferência São Paulo Pearson Prentice Hall 2010 UOL Esporte Disponível em httpesporteuolcombrfutebolbiografias559 pele Acesso em 28 abr 2015 U3 Estatística inferencial parte I 123 Unidade 3 Estatística inferencial parte I Tomamos nossas decisões com base em conhecimentos prévios e experiências vivenciadas em situações semelhantes Fazemos isso com o objetivo de potencializar os benefícios ou minimizar os efeitos negativos entretanto sempre estamos sujeitos a erros Sabendo disso uma área da estatística denominada estatística inferencial tenta mensurar as chances de ocorrerem erros e acertos nas tomadas de decisão Você aprendeu na unidade anterior a coletar classificar organizar e apresentar dados No que se refere à apresentação foram discutidos métodos pontuais que denominamos medidas de posição e vimos que nem sempre uma medida como a média é capaz de representar um conjunto Mais adiante você verá que a chance de uma média estimada corresponder exatamente ao parâmetro populacional é muito pequena ou até impossível de ocorrer Desse modo o que a estatística inferencial tenta fazer por exemplo é mensurar a chance de determinado estimador pertencer a um intervalo Outro objeto de estudo da estatística inferencial é o levantamento e o teste de hipóteses Por exemplo podemos considerar como hipótese a afirmativa o produto A pertence ao lote 1 O que a estatística inferencial irá fazer nesse caso é aceitar ou refutar essa afirmação com certa margem de incerteza algo que sempre está presente na estatística Para trabalharmos todas essas ideias fazse necessário abordar alguns pontos importantes probabilidade distribuições amostrais intervalos de confiança e testes de hipóteses Um a um esses pontos serão discutidos no decorrer desta unidade e ao final esperamos que você seja capaz de estimar probabilidades construir intervalos de confiança para estimadores e testar hipóteses estatísticas objetivando a tomada de decisão Bons estudos Convite ao estudo U3 Estatística inferencial parte I 124 Seção 31 Noções de probabilidade Diálogo aberto Qual é a chance de você ser atingido por um raio E de ganhar na Mega Sena Pode parecer piada mas é mais fácil ocorrer o primeiro do que o segundo acontecimento As chances de acertar as seis dezenas são de uma para cada 50 milhões aproximadamente Já as chances de ser atingido por um raio durante sua vida são de uma para cada 6250 de acordo com a National Oceanic and Atmosferic Administration A chance de ocorrência de determinado acontecimento é mensurada pela probabilidade uma subárea da matemática que se tornou o pilar da estatística inferencial Com base nessa mensuração podemos tomar decisões apoiados em certos níveis de segurança do que pode vir a ocorrer Lembrase de que na Unidade 2 fizemos uma coleta de dados com base em uma amostra de funcionários da empresa M Com base nessa amostra é possível medir a chance de sortear um funcionário na empresa e este ser do sexo masculino Ou então qual é a chance de ele pesar 70 quilogramas ou mais Essas e outras questões serão respondidas ao longo desta seção Bons estudos Noção de probabilidade Para ilustrarmos a ideia de probabilidade considere o diagrama de dispersão representado na Figura 31 o qual se refere a uma amostragem de funcionários da empresa M Nesse diagrama pontos marcados sobre as marcas de escala no eixo horizontal referemse àquele valor específico por exemplo exatamente 1 funcionário declarou ter exatamente 155 m Já os pontos marcados entre duas marcas de escala referemse a funcionários que declararam ter altura entre esses valores e não Não pode faltar U3 Estatística inferencial parte I 125 iguais a eles por exemplo exatamente 4 funcionários declararam ter mais de 155 m e menos de 160 m Como já foi descrito na Unidade 2 o diagrama de dispersão tenta dar uma ideia da distribuição dos valores de uma variável Observando a Figura 31 por exemplo podemos perceber que os valores estão concentrados em torno de 175 m e as frequências diminuem conforme nos afastamos desse valor Intuitivamente temos a impressão de que ao selecionarmos aleatoriamente um funcionário dessa amostra as chances de que ele tenha por volta de 175 m são maiores que as chances de que ele tenha por volta de 155 m Antes de continuarmos fazse necessário introduzir alguns conceitos Figura 31 Frequência das alturas de uma amostra de 167 da empresa M Fonte Os autores 2015 Assimile Denominamos experimento todo e qualquer ato de experimentação ou experiência e investigação de determinado fenômeno sob condições controladas a fim de observálo e classificálo Como exemplo de experimento temos a investigação da altura dos funcionários da empresa M O conjunto de todos os resultados possíveis na investigação de uma variável em um experimento é denominado espaço amostral o qual denotamos por Ω ômega O espaço amostral da variável altura é o intervalo 0 0 t R t Ω que contempla os valores maiores que zero Um valor específico pertencente a um espaço amostral é denominado ponto amostral A altura 175 m é um exemplo de ponto amostral de Ω Qualquer subconjunto de um espaço amostral é denominado evento As alturas compreendidas entre 155 m e 175 m por exemplo compõem um evento Medimos a chance de ocorrência de determinado evento utilizando a probabilidade Simplificadamente a probabilidade é um valor numérico compreendido no intervalo 01 t ℝ 0 t 1 e calculado por meio da razão entre o número de resultados favoráveis ao evento em questão pelo total de resultados possíveis no espaço amostral Quanto mais próximo de 0 menor é a chance de ocorrência de um evento quanto mais próximo de 1 maior é a chance de ocorrência Vamos compreender melhor o conceito de probabilidade por meio do exemplo a seguir Considerando a Figura 31 qual é a probabilidade de em um sorteio ao acaso selecionarmos um funcionário da empresa M que possua altura maior ou igual a 185 m e menor que 190 m Resolução Considere o evento A faltas maiores ou iguais a 185 m e menores que 190 m Denotamos por nA o número de elementos do conjunto A ou seja o número de ocorrências de alturas no intervalo citado Observando o diagrama de dispersão vemos que nA 17 10 7 Além disso o espaço amostral Ω possui 167 elementos ou seja nΩ 167 Dessa forma a probabilidade de ocorrência do evento A é igual a PA nA nΩ 17 167 0102 102 No exemplo anterior denotando por X a variável altura e por x um ponto amostral qualquer podemos simbolizar a probabilidade de ocorrência do evento A por PA P185 X 190 Dados dois eventos B e C sendo PB 1 100 e PC 0 0 dizemos que B é um evento certo e que C é um evento impossível Ainda considerando a Figura 31 calcule a P160 X 170 c PX 200 U3 Estatística inferencial parte I 127 b P165 X 190 d P150 X 200 Curva normal Observando a Figura 31 você notou alguma peculiaridade A forma como os pontos se distribuem se assemelha a algum objeto conhecido do mundo real Esperamos que você tenha notado que a forma como os pontos se distribuem se assemelha a um sino Observe novamente esse diagrama na Figura 32 na qual adicionamos uma linha contínua contornando os pontos A linha contornando os pontos denominada curva normal obedece a uma regra matemática dada por uma função do tipo exponencial descrita por µ σ f x e x σ π µ σ 2 2 1 2 2 2 x em que x corresponde a um ponto amostral μ mu é a média da população σ2 é a variância populacional e σ sigma é o desvio padrão populacional Figura 32 Frequência das alturas de uma amostra de 167 da empresa M Curva normal Fonte Os autores 2015 Atenção Na Unidade 2 com exceção da variância e do desvio padrão não fizemos distinção simbólica entre medidas calculadas a partir de uma amostra e medidas calculadas a partir de dados populacionais Naquele momento não havia necessidade de abordar essa diferença Entretanto agora podemos ampliar a simbologia U3 Estatística inferencial parte I 128 média amostral VarX variância amostral1 DpX desvio padrão amostral μ média populacional σ2 variância populacional σ desvio padrão populacional As demais medidas por serem utilizadas em menor frequência não serão simbolizadas de forma diferente para amostras ou populações 1 Alguns autores também denotam a variância amostral por s2 e o desvio padrão amostral por s A função f descrita anteriormente chamada de função densidade de probabilidade fdp é determinada pelos valores de μ e σ2 Sendo X uma variável que possui distribuição dos dados com formato de sino caracterizada por μ e σ2 simbolizamos X N μ σ2 para descrever que X possui distribuição normal com média μ e variância σ2 Variáveis com distribuição normal são muito comuns na natureza Um dos principais estudiosos a observálas foi Carl Friedrich Gauss 17771855 em seus trabalhos sobre astronomia por volta de 1810 Motivo pelo qual alguns autores também denominam gaussiana essa distribuição A probabilidade de ocorrência de um evento está diretamente ligada aos parâmetros μ e σ2 provenientes da população Conhecendo esses valores considerando dada variável com distribuição normal e um evento A podemos calcular a probabilidade de ocorrência de A por meio do cálculo de uma área Exemplificando Identifique a área correspondente à probabilidade de ocorrência de A Z 05 e Z 21 sendo ZN 01 Resolução Observe que para esse exemplo μ 0 e σ2 1 e σ 1 Com isso a fdp fica 0 1 f z e z 1 2 2 2 π cujo gráfico está representado na Figura 33 A área R destacada corresponde à probabilidade de ocorrência de A ou seja PA R Figura 33 Distribuição da variável Z Fonte Os autores 2015 U3 Estatística inferencial parte I 129 No exemplo anterior temos ZN 01 Pelo fato de μ 0 e σ2 1 essa distribuição recebe uma denominação especial normal padrão ou normal padronizada Veja outras curvas normais em httpwwwufpabrdicasbiomebiofigcurnor02gif para diferentes valores dos parâmetros μ e σ2 O cálculo da área R destacada no exemplo é feito por meio de técnicas que não serão detalhadas aqui pois não é o objetivo do nosso estudo Uma maneira alternativa e mais simples para o cálculo dessa área é a utilização da Tabela da Distribuição Normal Padrão ou tabela Z Para compreendermos a utilização dessa tabela fazemse necessárias algumas observações A área limitada pela curva normal e pelo eixo horizontal fz 0 de Z até Z é igual a 1 no exemplo anterior temos P Z PΩ 1 Pa X b PX b PX a área sob a curva entre a e b no exemplo anterior temos P05 Z 21 R PX x0 0 para x0 fixo Na prática a probabilidade de ocorrência de um valor específico é igual a zero o que nos força a calcular a probabilidade para intervalos e não para valores particulares No exemplo anterior temos PZ 05 0 0 PX μ PX μ 05 ou seja a probabilidade de X ser menor que a média é igual a 50 assim como a probabilidade de X ser maior que a média no exemplo anterior temos PZ 0 PZ 0 05 PX x 1 PX x Entendidas essas observações vamos então ao cálculo da área R A Tabela 31 apresenta o valor da área abaixo da curva fz acima do eixo horizontal fz 0 entre Z e Z z como mostra a Figura 34 Simbolizamos o valor dessa área por PZ z ou PZ z Figura 34 Área representada por PZ z Fonte Os autores 2015 Para calcularmos PA P05 Z 21 efetuaremos P05 Z 21 Z 21 Z 05 pois os valores à direita da igualdade podem ser consultados na Tabela 31 em destaque Para calcularmos PZ 21 consultamos a primeira coluna da tabela onde há o valor z 2 Em seguida percorremos essa linha até alcançarmos a coluna z 01 Como 21 2 01 temos que PZ 21 0982 De modo semelhante chegamos a PZ 05 0691 Logo PA P05 Z 21 PZ 21 PZ 05 0982 0691 0291 291 Portanto o evento A Z 05 e Z 21 tem 291 de chance de ocorrência Normalização de variáveis Como você deve ter notado na indicação que fizemos anteriormente uma distribuição normal depende dos parâmetros μ e σ² Se formos considerar todas as possibilidades de μ e σ² teríamos que ter infinitas tabelas para consultar as probabilidades correspondentes Para contornar essa dificuldade normalizamos a variável em questão Considere XNμσ² e a transformação Z X μσ Nessas condições é possível demonstrar que ZN01 ou seja Z é uma variável normal padronizada PX x PZ z em que z x μ σ Com o auxílio dessa transformação podemos utilizar a Tabela 31 para calcularmos PX x para quaisquer μ e σ² Sendo XN104 calcule a PX 64 b P88 X 116 Resolução a PX 64 1 PX 64 1 PZ z em que z 64 10 4 36 2 18 Consultando a Tabela 31 vemos que PZ 18 0036 linha z 1 coluna z 08 Logo PX 64 1 PZ 18 1 0036 0964 964 b P88 X 116 PX 116 PX 88 Calculamos separadamente PX 116 e PX 88 PX 116 PZ z em que z 116 10 4 16 2 08 Consultando a tabela vemos que PX 116 PZ 08 0788 788 PX 88 PZ z em que z 88 10 4 12 2 06 Consultando a tabela vemos que PZ 06 0274 linha z 0 coluna z 06 Logo PX 88 PZ 06 0274 274 Portanto P88 X 116 PX 116 PX 88 0788 0274 0514 514 Para consultar uma tabela de distribuição normal mais completa que a Tabela 31 acesse o link a seguir Tabela normal padrão Disponível em httpwwwlegufprbrsilviaCE001tabelanormalpdf ² No decorrer deste livro sempre serão utilizados os valores desta tabela Sem medo de errar Vamos relembrar a situaçãoproblema proposta no início desta seção Com base na amostra de funcionários apresentada na Tabela 21 é possível medir a chance de sortear um funcionário na empresa e este ser do sexo masculino Ou então qual é a chance de ele pesar 70 quilogramas ou mais Para responder a essas questões vamos representar as variáveis sexo e peso respectivamente por X e Y e considerar os eventos A funcionário sorteado ser do sexo masculino e B funcionário sorteado ter 70 quilogramas ou mais As perguntas anteriores podem ser representadas simbolicamente por PA PX masculino e PB PY 70 respectivamente Para o cálculo de PA e PB vamos utilizar os dados amostrais e supor que os verdadeiros parâmetros populacionais sejam próximos O número de homens na amostra é igual a 11 e o total de elementos amostrados foi 20 Logo PA 1120 055 55 Para o cálculo de PB vamos supor que YNμσ² Você pode verificar a partir da Tabela 21 que ȳ 7605 VarY 1379 e DpY 117 Sendo assim consideraremos μ ȳ 7605 σ² VarY 1379 e σ DpY 117 Assim PB PY 70 1 PY 70 1 PZ z em que z 70 7605 117 05 Consultando a tabela Z temos PZ 05 0309 Logo PB 1 PZ z 1 0309 0691 691 Para finalizar a probabilidade de sortear um funcionário do sexo masculino na empresa M é de 55 e a de ele ter 70 quilogramas ou mais é de 691 Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competências técnicas Não se aplica 2 Objetivos de aprendizagem Compreender o conceito de probabilidade e suas aplicações 3 Conteúdos relacionados Probabilidade Distribuição normal 4 Descrição da SP Em uma indústria para garantir a qualidade são inspecionadas amostras de 15 unidades a cada lote de 200 produzidas A seguir constam as medições em mililitros dos conteúdos de duas amostras uma do lote 1 e outra do lote 2 Lote 1 104 95 96 104 96 104 101 104 104 103 100 100 100 102 95 Lote 2 105 104 100 96 97 105 100 100 94 97 99 97 104 102 101 O lote deve ser descartado se a probabilidade de nele conter uma unidade do produto com menos de 95 mililitros for maior que 6 Pergunta qual lote deve ser descartado 1 ou 2 Utilize os estimadores como aproximações para os parâmetros populacionais Fazemos algumas considerações X quantidade em mililitros de cada unidade do produto no lote 1 Y quantidade em mililitros de cada unidade do produto no lote 2 A uma unidade do produto conter menos de 95 mililitros Você pode verificar que x 10067 DpX 352 y 10007 DpY 345 Assim Lote 1 PA PX 95 PZ z em que z 9510067 352 16 Consultando a tabela Z temos PX 95 PZ 16 0055 55 Lote 2 PA PY 95 PZ z em que z 9510007 345 15 Consultando a tabela Z temos PY 95 PZ 15 0067 67 Como PX 95 6 PY 95 segue que o lote 2 deve ser descartado Experimento todo e qualquer ato de experimentação ou experiência e investigação de determinado fenômeno sob condições controladas a fim de observálo e classificálo Espaço amostral conjunto de todos os resultados possíveis na investigação de uma variável em um experimento o qual denominamos por Ω Ponto amostral valor específico pertencente a um espaço amostral Evento qualquer subconjunto de um espaço amostral U3 Estatística inferencial parte I 135 Probabilidade valor numérico compreendido no intervalo 01 t ℝ 0 t 1 e calculado por meio da razão entre o número de resultados favoráveis a um evento pelo total de resultados possíveis no espaço amostral Faça você mesmo Sendo X a altura em metros dos alunos de graduação no Brasil faça uma estimativa para PX 145 Para isso calcule as estatísticas x e DpX a partir da sua turma e utilize esses valores como aproximação para os verdadeiros parâmetros populacionais Faça valer a pena 1 Assinale a alternativa INCORRETA a A probabilidade é igual à razão entre o número de resultados favoráveis a um evento pelo total de resultados possíveis no espaço amostral b Denominamos evento qualquer subconjunto de um espaço amostral c Um ponto amostral é um valor específico de Ω d Quando a probabilidade de ocorrência de um evento é igual a zero dizemos que o evento é certo e Quanto mais próxima de 1 maior a probabilidade de ocorrência de um evento 2 Considere Ω a b c d e f g h i j k l e um evento A b d f Assinale a alternativa que contém PA a 020 b 025 c 030 d 035 e 040 3 Sendo YN01 assinale a alternativa que contém o valor de PY 16 a 0945 U3 Estatística inferencial parte I 136 b 0055 c 1000 d 0000 e 0726 4 Considere ZN01 e um ponto amostral z 0 tal que Pz Z z 954 Assinale a alternativa que contém o valor de z a 10 b 15 c 20 d 25 e 30 5 Sendo XN159 assinale a alternativa que contém o valor de P12 X 18 a 159 b 841 c 628 d 429 e 682 6 Considerando XN5016 e YN10025 qual o evento mais provável sortear um valor de X menor que 48 ou um valor de Y maior que 102 7 Em determinada linha de produção um produto é descartado se seu peso for menor que 49 kg Sabese que a variável peso X nessa linha de produção possui distribuição normal com média de 5 kg e desvio padrão de 006 kg Nessas condições qual é a probabilidade de se descartar um produto U3 Estatística inferencial parte I 137 Seção 32 Distribuição dos estimadores Diálogo aberto Você aprendeu na seção anterior o conceito de probabilidade e como ele pode ser aplicado a situações reais tais como no exemplo do controle de qualidade Nesse exemplo e em outros momentos utilizamos os valores x e VarX para estimar os verdadeiros parâmetros μ e σ2 e solicitamos a você que fizesse o mesmo Como é de se esperar sempre que utilizamos x e VarX para estimar μ e σ2 estamos cometendo erros Muitas vezes esses erros são tão importantes quanto o valor que se pretende estimar Você confiaria por exemplo em uma estimativa para a altura média da população brasileira de 190 m considerando que o dado não seja acompanhado de nenhuma informação sobre os erros de estimativa Essa informação é um tanto quanto suspeita Quando apresentamos estimadores como a média e a variância seja em relatórios artigos obrigatoriamente temos de apresentar informações acerca dos erros de estimativa pois isso dá credibilidade Nesse contexto podemos nos perguntar fixada certa probabilidade de acerto e dado x calculado a partir de uma amostra qual é o erro que estamos cometendo ao aproximar μ por x Ou ainda fixada uma probabilidade de acerto qual é o tamanho da amostra que temos de coletar para cometer um erro máximo predeterminado Essa última pergunta nos faz relembrar uma informação dada na Unidade 2 de que quanto maior a amostra melhor a estimativa feita dos verdadeiros parâmetros Nesta seção você verá uma justificativa concreta para essa afirmação Entretanto para iniciarmos os estudos propomos a seguinte situaçãoproblema com uma probabilidade de 95 de acerto qual é o erro máximo que estamos cometendo ao aproximar a média do peso dos funcionários da empresa M por y 7605 Qual deveria ser o tamanho da amostra para que o erro fosse de no máximo 2 kg Para que possamos responder a essas perguntas precisamos entender melhor a distribuição de probabilidade da média amostral Não pode faltar Teorema do Limite Central Para entendermos o que significa distribuição de probabilidade da média considere que ao observar uma variável X na população tenhamos obtido Ω 1234 Qual o valor de µ Lembrese de que µ é a média populacional e um cálculo simples mostra que µ 1234 4 25 Ao retirar uma amostra de tamanho 2 dessa população conseguiríamos estimar precisamente µ por x Ou ainda em todas as amostras o valor de x seria o mesmo As respostas para essas perguntas são respectivamente pouco provável e não Veja a seguir todas amostras possíveis de tamanho 2 e suas respectivas médias Amostra x Amostra x Amostra x 11 10 21 15 31 20 41 25 12 15 22 20 32 25 42 30 13 20 23 25 33 30 43 35 14 25 24 30 34 35 44 40 Podemos montar um diagrama de dispersão com os valores das médias amostrais como na Figura 35 Figura 35 Frequências das médias amostrais Fonte Os autores 2015 Observou algo de curioso na forma como os dados se distribuíram A linha ajudou mas esperamos que você tenha notado que os dados se distribuíram de forma semelhante a uma curva normal A média amostral também pode ser considerada uma variável Vamos calcular a média das médias amostrais µ x e a variância das médias amostrais σ² x para termos uma ideia quantitativa da distribuição µ x 101520303540 16 40 16 25 σ² x 1025²1525²3525²4025² 16 10 16 0625 Observe que a média das médias amostrais é exatamente igual à média da população ou seja µ x µ E quanto à variância será que σ² x σ² Vejamos σ² 1025²2025²3025²4025² 4 5 4 125 Note que σ² x σ² resultado que pode ser mais bem compreendido com a leitura do Teorema do Limite Central TLC De acordo com Morettin 2010 o TLC diz que para n amostras aleatórias simples retiradas de uma população com média µ e variância σ² finita a distribuição amostral da média aproximase para n grande de uma distribuição normal com média µ e variância σ²n O TLC é de extrema importância para a estatística inferencial e tem implicações muito interessantes Observe que apesar de ele não dizer nada a respeito da distribuição da população afirma que a distribuição amostral da média aproximase de uma curva normal e além disso essa distribuição tem a mesma média que a população e variância σ²n isto é a mesma variância que a população mas dividida por n A partir desse resultado concluímos que quanto maior o número de amostras mais precisão teremos para a média pois σ²n diminui conforme n aumenta Podemos visualizar esse resultado na Figura 36 Figura 36 Distribuição amostral da média x de uma população XN01 para vários valores de n n 10 fx fx n 40 fx fx n 70 fx fx n 100 fx fx Fonte Os autores 2015 Se X N01 a fdp da variável x pode ser escrita como fx01n n2π enx²2 Com base no TLC há ainda dois resultados interessantes que podemos enunciar De acordo com Morettin 2010 sendo X uma variável com média μ e variância σ² finita e x a variável média amostral então a variável Z xμσn nxμσ tem distribuição normal com média 0 e variância 1 ou seja Z N01 Podemos ainda definir a variável e como a diferença entre o estimador x e o parâmetro μ ou seja e xμ Determinando o tamanho de uma amostra Vamos relembrar um questionamento feito no início desta seção fixada certa probabilidade de acerto e dado x calculada a partir de uma amostra qual é o erro que estamos cometendo ao aproximar μ por x Ou ainda fixada uma probabilidade de acerto qual é o tamanho da amostra que temos de coletar para cometer um erro máximo predeterminado Vamos supor que o erro máximo que estimulamos para estimar a média populacional seja ε Desse modo qualquer valor x no intervalo μεμε nos deixará satisfeitos para essa estimativa Para assimilar melhor suponha que queiramos estimar a verdadeira média populacional μ 170 m da altura de certo grupo de atletas e para isso queiramos cometer um erro máximo de ε 2 cm Portanto qualquer valor de x pertencente ao intervalo 168 m 172 m servirá Além disso para acompanhar essa estimativa suponha que queiramos ter uma probabilidade de acerto de γ 95 por exemplo uma margem de segurança Matematicamente afirmar que x pertence ao intervalo μεμε implica με x με ou xμ ε Além disso ter uma probabilidade de acerto de γ que xμ ε pode ser traduzido matematicamente por Pxμ ε γ Com base nos resultados obtidos do TLC temos Pxμ ε γ Pε xμ ε γ Pnεσ xμnσ nεσ γ Lembrese de que Z nxμσ logo Pnεσ xμ nεσ γ Pnεσ Z nεσ γ Dado um valor y podemos obter na tabela Z um valor zy tal que Pzy Z zy γ e ainda zy nεσ zyσ nε n zyσ²ε² Observe que se tivermos o conhecimento de σ² podemos estimar n em função de y e ε prefixados ou estimar ε em função de y e n Com base na última igualdade podemos justificar a afirmativa feita na Unidade 2 de que o erro diminui à medida que o tamanho da amostra aumenta pois n zyσ²ε² ε² zyσ²n ε zyσ²n Podemos agora observando a última igualdade ver claramente que se n aumenta n o erro diminui ε 0 Seja uma variável XNμ4 observada em dada população Com precisão de 95 qual o erro máximo que cometemos ao estimar a verdadeira média dessa população com base em uma amostra de tamanho n 30 90 qual o tamanho da amostra que deve ser coletada para que o erro seja de no máximo ε 1 Resolução a Observe que a fórmula do erro ε zy²σ²n depende de zy σ² e n O parâmetro σ² 4 foi dado e n 30 Resta determinar zy em que γ 95 095 para que tenhamos Pzy Z zy γ 095 Observe a Figura 37 Figura 37 Região correspondente a Pzy Z zy 095 Fonte Os autores 2015 Veja que o valor zy deve ser tal que PZ zy 0025 095 0975 Consultando a tabela Z temos zy 196 Logo ε zy²σ²n 196²430 072 Portanto com precisão de 95 o erro máximo que cometemos ao estimar a verdadeira média dessa população com base em uma amostra de tamanho n 30 é ε 072 Figura 38 Região correspondente a Pzy Z zy 090 Pε x μ ε γ Px ε μ x ε γ Px ε μ x ε γ Sem medo de errar Se com 98 de probabilidade de acerto o erro amostral da média for superior a 005 L a linha de produção é pausada para verificações nos equipamentos Como ε 005 L a decisão seria diferente ou seja se γ 901 a linha de produção não seria pausada U3 Estatística inferencial parte I 148 Faça valer a pena 1 Seja uma variável XNμ9 observada em dada população Com precisão de 90 assinale a alternativa que contém o erro máximo que cometemos ao estimar a verdadeira média dessa população com base em uma amostra de tamanho n 25 a 1099 b 0099 c 2909 d 2970 e 0990 2 Seja uma variável XNμ 16 observada em dada população Supondo que queiramos um erro amostral da média máximo de ε 1 com 94 de probabilidade entre as alternativas a seguir assinale aquela que contém o menor tamanho de amostra que possibilite esse erro máximo estabelecido a 46 b 55 c 59 d 62 e 68 3 Os conjuntos de dados a seguir são obtidos a partir de amostragem Eles representam as idades de determinado grupo de frequentadores de um estabelecimento Grupo 1 X1 31 27 33 33 24 25 28 29 24 31 Grupo 2 X2 31 28 28 30 29 31 31 28 Grupo 3 X3 30 28 31 28 31 30 28 31 29 32 Sendo ε1 ε2 e ε3 os erros amostrais dos grupos 1 2 e 3 respectivamente assinale a alternativa correta a ε1 ε2 ε3 b ε1 ε2 ε3 c ε1 ε2 ε3 U3 Estatística inferencial parte I 149 d ε1 ε2 ε3 e ε1 ε2 ε3 4 As variáveis XNμx49 YNμY45 e WNμw30 são observadas em uma população Desejase coletar uma única amostra para estimar a média populacional de ambas as variáveis Para os estudos que serão realizados é necessário que o erro amostral da média seja no máximo ε 2 com confiança de 9030 8812 e 9796 para as variáveis X Y e Z respectivamente Desse modo assinale a alternativa que contém o menor tamanho de amostra que atenda a essas exigências a n 41 b n 34 c n 28 d n 26 e n 49 5 Para a realização de certo estudo coletouse a seguinte amostra 1075 979 1034 1090 904 920 908 1026 963 Foi constatado com 95 de probabilidade que o erro amostral da média era de no máximo 4638 valor que foi considerado alto Com base nisso estabeleceuse um novo erro máximo tolerado ε 15 sendo necessário coletar uma nova amostra que será dimensionada com base na variância VarX da amostra que será descartada Assinale a alternativa que contém a dimensão da nova amostra a 43 b 94 c 72 d 87 e 112 6 Enuncie o Teorema do Limite Central e elenque duas de suas consequências U3 Estatística inferencial parte I 150 7 As duas amostras a seguir foram retiradas de uma mesma população e são referentes a uma mesma variável XN μσ2 Amostra 1 X1 616 638 617 597 665 641 586 590 Amostra 2 X2 594 594 630 588 636 596 592 645 616 603 Faça uma estimativa pontual para μ calculando x a partir da amostra que apresentar o menor erro amostral para a média Calcule o erro amostral com precisão de 9386 U3 Estatística inferencial parte I 151 Seção 33 Testes de hipóteses para a média σ2 conhecido Diálogo aberto Você aprendeu anteriormente sobre o Teorema do Limite Central TLC e algumas de suas implicações Esse teorema é de extrema importância para a estatística inferencial e existem diversas situações em que pode ser utilizado sendo que uma delas é no teste estatístico de hipóteses Mas o que significa isso Segundo Morettin e Bussab 2010 p 330 feita determinada afirmação sobre uma população usualmente sobre um parâmetro dessa desejamos saber se os resultados experimentais provenientes de uma amostra contrariam ou não tal afirmação Muitas vezes essa afirmação sobre a população é derivada de teorias desenvolvidas no campo substantivo do conhecimento A adequação ou não dessa teoria ao universo real pode ser verificada ou refutada pela amostra O objetivo do teste estatístico de hipóteses é então fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apoiem ou não uma hipótese estatística formulada Para avançarmos um pouco neste assunto considere a seguinte situaçãoproblema suponha que a empresa M seja uma prestadora de serviços e que irá concorrer com outras para ser contratada para determinado projeto A empresa contratante empresa N afirma que para a execução das tarefas pertinentes ao projeto é desejável que os funcionários possuam em média 80 kg e altura média maior ou igual a 170 cm para utilizarem os Equipamentos de Proteção Individual EPIs de que a empresa dispõe Em vista disso a empresa M declara que seus funcionários se encaixam nesses padrões e acrescenta que em medições feitas recentemente constatouse que o desvio padrão do peso de seus funcionários era 12 kg e que o desvio padrão da altura era 8 cm Considerando que a empresa N tenha acesso aos dados U3 Estatística inferencial parte I 152 amostrados na Tabela 21 ela consegue constatar se a afirmação da empresa M é verídica Para que possamos verificar essas afirmações precisamos compreender melhor como formular hipóteses adotar algumas simbologias que nos auxiliarão no processo e compreender os erros a que estamos sujeitos No decorrer desta seção apresentaremos um roteiro para que você possa testar as hipóteses apresentadas e ao final verificaremos as afirmações Formulando hipóteses As situações abordadas em testes estatísticos de hipóteses podem nos parecer bem familiares Considere por exemplo a afirmação A vai chover hoje Essa afirmação pode ser considerada uma hipótese cuja negativa é outra hipótese B não vai chover hoje Observe que as duas hipóteses levantadas são complementares isto é ocorre a primeira ou ocorre a segunda não há outra possibilidade Como verificar a veracidade da hipótese A É possível ter certeza absoluta da ocorrência de A ou B Para respondermos a essas perguntas observe a Figura 39 Veja que a previsão do tempo para Natal traz uma informação muito importante a probabilidade de precipitação ou seja a chance de chover Para facilitar nossa discussão vamos denotar as hipóteses A e B como a seguir H0 vai chover hoje H1 não vai chover hoje Não pode faltar Temperatura mínima 21 C Temperatura máxima 29 C Probabilidade de precipitação 60 Sol e aumento de nuvens de manhã Pancadas de chuva à tarde e à noite Figura 39 Previsão do Tempo em Natal RN para o dia 18062015 Fonte Climatempo Assimile A hipótese H0 denominada hipótese nula geralmente é afirmativa ou no caso de uma variável quantitativa uma hipótese de igualdade Ela é nossa principal hipótese o foco da nossa análise e a que queremos U3 Estatística inferencial parte I 153 pôr à prova A hipótese H1 denominada hipótese alternativa é aquela que será aceita se rejeitarmos a hipótese nula Atenção Alguns autores também denotam a hipótese alternativa por Ha Em relação a nossa decisão de aceitar ou rejeitar H0 podemos ter quatro resultados possíveis elencados na Tabela 32 Para o nosso exemplo a ocorrência do erro tipo I seria rejeitar a hipótese vai chover hoje e ao final do dia constatarmos que choveu Denotamos por a a probabilidade de ocorrência desse erro e nesse caso a 60 A ocorrência do erro tipo II nesse caso seria não rejeit ar a hipótese vai chover hoje e no final do dia constatarmos que não choveu A probabilidade de ocorrência desse erro é β 40 Podem os escrever Perro tipo I a e Perro tipo II β Portanto respon dendo às perguntas feitas anteriormente para verificar a veracidade da hipótese A temos de realizar um teste de hipóteses Contudo nunca teremos certeza absoluta da ocorrência de uma hipótese pois sempre estamos sujeitos a cometer um dos erros apresentados na Tabela 32 Testando hipóteses Para fixarmos um procedimento para o teste de uma hipótese nula considere o seguinte exemplo Decisão Possibilidades para H0 Verdadeira Falsa Não rejeitar H0 Decisão correta Erro tipo II Rejeitar H0 Erro tipo I Decisão correta Tabela 32 Resultados possíveis para um teste de hipóteses Fonte Morettin 2010 Exemplificando Uma variável X N µ 18 é estudada em determinada população Parte dos pesquisadores suspeita que µ µ 1 55 e outros que µ µ 2 50 No intuito de pôr à prova essas suspeitas eles decidiram fazer testes para identificar qual delas é a correta Para isso foi retirada U3 Estatística inferencial parte I 154 uma amostra da população a qual é apresentada a seguir 49 50 48 51 47 48 55 50 55 49 51 53 Com 95 de confiança qual é a verdadeira média da população µ1 55 ou µ2 50 Resolução Vamos inicialmente testar se µ µ 1 55 Passo 1 elaborar as hipóteses precisamos estipular duas hipóteses a nula e a alternativa Como a hipótese nula é sempre de igualdade como foi descrito anteriormente determinamos H0 µ 55 H1 µ 55 Passo 2 determinar a estatística de teste Como nosso objetivo é testar a média populacional da variável X N µ 18 pelo TLC nossa estatística de teste será x N 55 18 12 ou x N 55 1 5 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância Como queremos 95 de confiança a probabilidade de cometermos o erro tipo I deve ser α 100 95 5 Essa probabilidade também é denominada nível de significância Figura 310 Região crítica para H0 µ 55 e H1 µ 55 com α 5 Fonte Os autores 2015 Rejeitaremos a hipótese H0 caso o valor x obtido a partir da amostra seja muito maior ou muito menor que µ1 55 ou ainda quando x pertencer à região crítica RC ilustrada na Figura 310 A região crítica pode ser denotada por RC x x xc R 1 ou x xc 2 Observando a tabela Z e lembrando que z x n µ σ 2 temos U3 Estatística inferencial parte I 155 z x x x z c c c 1 2 1 96 55 1 5 1 96 1 5 55 55 1 96 1 5 52 6 1 1 1 1 96 55 1 5 1 96 1 5 55 55 1 96 1 5 57 4 2 2 2 x x x c c c RC x x R 52 6 ou x 57 4 Passo 4 calcular a estatística a partir da amostra a média amostral é x0 50 5 Passo 5 tomar uma decisão como x 0 RC decidimos rejeitar H0 isto é há indícios suficientes que nos permitem refutar a possibilidade de a média populacional ser µ1 55 Vamos testar agora se µ µ2 50 Passo 1 elaborar as hipóteses H0 µ 50 H1 μ 50 Passo 2 determinar a estatística de teste x N 50 18 12 ou x N 50 1 5 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância α 5 Rejeitaremos a hipótese H0 caso o valor x obtido a partir da amostra pertença à região crítica RC ilustrada na Figura 311 Observando a tabela Z e lembrando que z x n µ σ 2 temos Figura 311 Região crítica para H0 μ 50 e H1 μ 50 com α 5 Fonte Os autores 2015 U3 Estatística inferencial parte I 156 z x x x z c c c 1 1 96 50 1 5 1 96 1 5 50 50 1 96 1 5 47 6 1 1 1 2 1 96 50 1 5 1 96 1 5 50 50 1 96 1 5 52 4 2 2 2 x x x c c c RC x x R 47 6 ou x 52 4 Passo 4 calcular a estatística a partir da amostra a média amostral é x0 50 5 Passo 5 tomar uma decisão como x 0 RC não podemos rejeitar H0 isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser µ2 50 Desse modo em concordância com o problema apresentado devemos concluir que a verdadeira média da população é µ2 50 Assimile Região crítica região de rejeição da hipótese nula Atenção Testes de hipóteses como o do exemplo anterior são ditos bilaterais pois a região crítica tem parte à esquerda e parte à direita do valor que está sendo testado Caso a região crítica estivesse somente à esquerda do valor que está sendo testado o teste seria unilateral à esquerda caso estivesse somente à direita o teste seria unilateral à direita Veja a seguir um exemplo de teste unilateral à esquerda Exemplificando Uma empresa de telefonia fixa oferece um pacote de acesso à internet com franquia ilimitada e velocidade média mensal de μ 50 Mbps com σ2 6 Mbps² Paulo contratou o serviço e anda desconfiado de que a velocidade média é menor que a anunciada Para testar se está sendo trapaceado pela empresa de telefonia ele mediu a velocidade de sua Passo 1 elaborar as hipóteses H0 μ 50 H1 μ 50 Passo 2 determinar a estatística de teste x N5004 Passo 3 fixar o nível de significância suponha α 5 Como nos interessa H1 μ 50 a região crítica é RC x ℝ x xc com Px xc 5 como mostra a Figura 312 Valorp Se efetuarmos zc fracoverlinex musigmasqrtn obtemos um valor denominado z calculado ou ainda z estrela z como alguns autores preferem denotar Retomando o exemplo anterior temos zc frac489 50sqrt04 approx 174 Veja a representação de zc 174 e de z 164 determinado a partir do nível de significância alpha 5 na Figura 313 Lembrese de que ao fixarmos o nível de significância alpha 5 obtemos z 164 a partir da tabela Z Além disso com a relação PZ leq z Poverlinex leq overlinexc calculamos o valor de overlinexc que serviu de base para analisar a hipótese nula Além dessa metodologia de análise existe outra bastante utilizada a qual envolve o cálculo do valorp No caso do exemplo anterior representado pela Figura 313 o valorp corresponde à área que se apresenta à esquerda de zc abaixo da curva normal e acima do eixo horizontal região hachurada Mais formalmente se o teste de hipóteses for unilateral à esquerda o valorp é igual a PZ leq zc unilateral à direita o valorp é igual a PZ geq zc bilateral o valorp é igual a PZ leq zc PZ geq zc 2 PZ leq zc De acordo com Robert Johnson e Patrícia Kuby 2013 uma vez calculado o valorp podemos adotar a seguinte regra de decisão Se o valorp é menor ou igual ao nível de significância alpha então a decisão deve ser rejeitar H0 Se o valorp é maior que o nível de significância alpha então a decisão deve ser não rejeitar H0 U3 Estatística inferencial parte I 159 Pesquise mais Leia mais sobre os testes de hipóteses no Capítulo 5 do material disponível em httpwwwestufprbrce003materialapostilace003pdf Sem medo de errar Observe que cada afirmação feita pela empresa M trata de uma suposição 1 o peso médio dos funcionários é 80 kg 2 a altura média é maior ou igual a 170 cm Denotando por X e Y respectivamente o peso e a altura temos que as afirmações anteriores podem ser traduzidas matematicamente como μX 80 e μY 170 Sendo assim temos duas hipóteses nulas a serem testadas Problema 1 Problema 2 H0 μX 80 H0 μY 170 H1 μX 80 H1 μY 170 Para ambos os problemas o passo 1 já foi realizado ou seja as hipóteses já foram fixadas Problema 1 testar μX 80 Passo 2 determinar a estatística de teste x N 80 12 2 20 ou x N 80 7 2 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância suponha a 2 e RC como mostra a Figura 314 Consultando a tabela Z e lembrando que z x n µ σ 2 temos Figura 314 Região crítica para H0 μX 80 e H1 μX 80 com a 2 Fonte Os autores 2015 z x x x z c c c 1 2 2 33 80 7 2 2 33 7 2 80 80 2 33 7 2 73 7 1 1 1 2 33 80 7 2 2 33 7 2 80 80 2 33 7 2 86 3 2 2 2 x x x c c c RC x in mathbbR overlinex leq 737 ext ou overlinex geq 863 Passo 4 calcular a estatística a partir da amostra overlinex0 7605 Passo 5 tomar uma decisão como overlinex0 otin RC não podemos rejeitar H0 isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser mux 80 Problema 2 testar muy 170 Passo 2 determinar a estatística de teste overliney sim N170 82 ou overliney sim N170 32 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância suponha alpha 2 e RC como mostra a Figura 315 Consultando a tabela Z e lembrando que z fracoverlinex musigmasqrtn temos z 205 Rightarrow fracoverlineyc 170sqrt32 205 Rightarrow overlineyc 170 205sqrt32 approx 1663 RC y in mathbbR overliney leq 1663 Passo 4 calcular a estatística a partir da amostra overliney0 17285 Passo 5 tomar uma decisão como overliney0 otin RC não podemos rejeitar H0 isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser muy 170 Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois compare com as de seus colegas 1 Competências técnicas Não se aplica 2 Objetivos de aprendizagem Realizar testes de hipóteses pela abordagem valorp 3 Conteúdos relacionados Testes de hipóteses para a média com variância conhecida 4 Descrição da SituaçãoProblema Determinada máquina corta barras de metal com 50 cm em média sendo o comprimento dessas barras uma variável X sim Nmu 252 Caso a média dos comprimentos seja superior a 50 cm há prejuízo para a empresa Alguns funcionários suspeitam que a máquina esteja desregelada e que isso tem causado prejuízo Para verificarem a suspeita coletaram uma amostra de tamanho n 36 e obtiveram overlinex 52 cm Utilizando a abordagem valorp e o nível de significância alpha 2 verifique se há indícios suficientes para confirmar a suspeita dos funcionários Passo 1 elaborar as hipóteses H0 mu 50 H1 mu 50 Passo 2 determinar a estatística de teste overlinex sim N50 25236 ou overlinex sim N50 069 Passo 3 fixar o nível de significância alpha 2 dado Passo 4 calcular a estatística a partir da amostra overlinex 52 zc fracoverlinex musigma2n frac52 50sqrt2536 24 valorp PZ z PZ 24 1 PZ 24 082 Passo 5 tomar uma decisão como valorp a optamos por rejeitar H₀ ou seja existem indícios suficientes de que a média populacional é maior que µ 50 Concluímos que há indícios suficientes de que a suspeita dos funcionários pode ser confirmada 1 Considere as hipóteses H₀ µ 100 e H₁ µ 100 elaboradas para a média de uma variável X Nµ9 Para testar essas hipóteses coletouse uma amostra de tamanho n 36 e obtevese x 98 Supondo um nível de significância α 5 assinale a alternativa que contém a região crítica ou seja a região de rejeição da hipótese nula a RC x ℝ x 9918 ou x 10082 b RC x ℝ x 9902 ou x 10098 c RC x ℝ x 99175 ou x 100825 d RC x ℝ x 950 ou x 1050 e RC x ℝ x 975 ou x 1025 c 75 d 50 e 25 e A probabilidade de se selecionar um funcionário desse setor da indústria e este receber mais de R 150000 é menor que 10 6 Considere uma fábrica de refrigerantes que envasam embalagens de 2 L sendo a quantidade de refrigerante nas garrafas uma variável X Nμ 001 Para controle de qualidade são coletadas periodicamente amostras de 20 unidades e mensuradas respectivas quantidades Se ao nível de significância de 2 a hipótese de a média das quantidades ser igual a 2 L for refutada a linha de produção é pausada para verificações e ajustes nos equipamentos Com base na amostra a seguir a linha de produção deve ser pausada 190 209 207 201 189 194 189 215 210 206 213 205 203 204 211 212 215 186 210 198 190 7 Os parafusos fabricados por uma empresa têm resistência média à tração de 120 kg com desvio padrão de 5 kg Um depósito possui uma caixa com parafusos que o proprietário afirma ser desse fabricante Entretanto a informação não pode ser confirmada pois algum funcionário descuidado estragou a embalagem e perdeuse a informação sobre a origem Na tentativa de vender para um comprador interessado nos parafusos desse fabricante ou de melhor qualidade o proprietário do depósito disse que faria um desconto no produto e daria 15 unidades para que o comprador pudesse testar a resistência média à tração e confirmar a origem Da amostra testada o comprador constatou que a resistência média foi de 1175 kg Com essas informações e um nível de significância de 2 é possível confirmar a informação dada pelo proprietário do depósito U3 Estatística inferencial parte I 166 Seção 34 Testes de hipóteses para a média σ2 desconhecido Diálogo aberto Na seção anterior você aprendeu a formular e testar hipóteses Entretanto há um detalhe que deve ser acrescentado nós supusemos que a variância populacional era conhecida Essa suposição também foi feita nas seções 31 e 32 e em alguns casos utilizamos VarX como aproximação de σ2 Diante disso surgem alguns questionamentos 1 em situações reais com que frequência conhecemos o verdadeiro valor de σ2 2 é correto utilizarmos VarX no lugar de σ2 Em relação ao primeiro questionamento a resposta é quase nunca Somente em raras situações isso ocorre Um exemplo inclusive descrito anteriormente é quando o IBGE a cada dez anos realiza um censo e obtém os verdadeiros parâmetros populacionais Se utilizamos no ano seguinte ao censo o valor de σ2 de certa forma estaremos lidando com um parâmetro real mas com um pequeno atraso devemos esperar que ele esteja desatualizado mas podemos supor que o verdadeiro valor seja próximo Essa mesma suposição teria de ser feita com cautela se utilizássemos σ2 muito tempo depois do censo A resposta para o segundo questionamento é sim desde que de forma adequada A distribuição normal padrão ou distribuição z é utilizada para os casos em que a variância populacional é conhecida ou quando temos grandes amostras Para pequenas amostras e variância populacional desconhecida o correto é utilizarmos a distribuição de Student ou distribuição t Para nos aprofundarmos nesse assunto iremos propor a mesma situaçãoproblema da seção anterior mas com uma pequena modificação supor as variâncias populacionais desconhecidas Desse modo questionamos novamente considerando que a empresa N tenha acesso aos dados amostrados na Tabela 21 ela consegue constatar se a afirmação da empresa M é verídica isto é que os funcionários possuem em média 80 kg e altura média maior ou igual a 170 cm Não pode faltar Distribuição de Student A distribuição t de Student é uma distribuição de probabilidade proposta pelo irlandês W S Gosset em 1908 Gosset era funcionário de uma cervejaria e escreveu sobre essa distribuição em um trabalho publicado com o pseudônimo Student daí a justificativa para o nome atribuído Nesse trabalho Student supôs que as amostras eram retiradas de populações normalmente distribuídas Mesmo sem essa suposição mais tarde se constatou que são obtidos resultados satisfatórios para quaisquer populações normais ou não quando são utilizadas grandes amostras Lembrese de que na seção anterior utilizamos para os testes de hipóteses a estatística z x μ σ² n a qual é normalmente distribuída com média 0 e variância 1 ou seja Z N01 Além disso segundo Johnson e Kuby 2013 quando um σ² conhecido é usado para fazer uma inferência sobre a média μ a amostra fornece um valor para aplicar nas fórmulas Esse valor é x Quando o desvio padrão da amostra Dpx também é usado esta fornece dois valores a média amostral x e o erro padrão estimado VarXn Como resultado a estatística z será substituída por uma estatística que representa o uso de um erro padrão estimado Essa nova estatística é conhecida como a estatística t de Student Desse modo substituindo σ² por VarX temos Estatística z z x μ σ² n Estatística t t x μ VarX n Diremos que uma variável T possui distribuição t de Student e denotaremos por tv e sua fdp é dada por ft v v 12 v2 π 1 t² v v 12 com t em que Γ é denominada função Gama e v são os graus de liberdade Veja na Figura 316 as distribuições normal padrão z e t Student com v 2 Para calcularmos os graus de liberdade efetuamos v n 1 em que n é o tamanho da amostra que estamos trabalhando O número de graus de liberdade é equivalente ao número de desvios em relação à média que não estão relacionados Para compreender melhor lembrese de que foi descrito na seção 24 que a soma dos desvios xi x é igual a zero Portanto quando temos n desvios xi x somente n 1 destes têm liberdade de valor pois o último desvio fica determinado pela relação xi x 0 Figura 316 Distribuição z e distribuição t Fonte Os autores 2015 Não entraremos em detalhes acerca da fdp da distribuição de Student ou da função Gama pois nosso intuito é utilizar valores tabelados para as probabilidades relacionadas a essa distribuição Graus de liberdade v número de desvios em relação à média que não estão relacionados entre si Para calcular os graus de liberdade efetuamos v n 1 Tabela para a distribuição t Diferente da distribuição z em que possuímos uma única tabela para a distribuição t teríamos de ter uma grande variedade uma para cada grau de liberdade Entretanto para o nosso trabalho não é necessária uma tabela tão completa quanto a tabela Z U3 Estatística inferencial parte I 169 disponível em httpwwwlegufprbrsilviaCE001tabelanormal pdf por exemplo Basta uma que possua probabilidadeschave as quais são muito utilizadas como mostra a Tabela 33 O cabeçalho dessa tabela fornece os níveis de significância ou em outras palavras as probabilidades de ocorrência A coluna da esquerda apresenta os graus de liberdade e o corpo da tabela apresenta os valores tc t calculado tais que a área à esquerda de tc abaixo da curva de densidade de probabilidade e acima do eixo horizontal é igual a a Essa tabela pode ser mais bem interpretada com o auxílio da Figura 317 Tabela 33 Distribuição t de Student valores de tc tais que Pt tc α ou Pt tc α Fonte Os autores 2015 6 5208 4524 3707 3143 2612 2447 1943 7 4785 4207 3499 2998 2517 2365 1895 8 4501 3991 3355 2896 2449 2306 1860 9 4297 3835 3250 2821 2398 2262 1833 10 4144 3716 3169 2764 2359 2228 1812 11 4025 3624 3106 2718 2328 2201 1796 12 3930 3550 3055 2681 2303 2179 1782 13 3852 3489 3012 2650 2282 2160 1771 14 3787 3438 2977 2624 2264 2145 1761 15 3733 3395 2947 2602 2249 2131 1753 16 3686 3358 2921 2583 2235 2120 1746 17 3646 3326 2898 2567 2224 2110 1740 18 3610 3298 2878 2552 2214 2101 1734 19 3579 3273 2861 2539 2205 2093 1729 20 3552 3251 2845 2528 2197 2086 1725 21 3527 3231 2831 2518 2189 2080 1721 22 3505 3214 2819 2508 2183 2074 1717 23 3485 3198 2807 2500 2177 2069 1714 24 3467 3183 2797 2492 2172 2064 1711 25 3450 3170 2787 2485 2167 2060 1708 26 3435 3158 2779 2479 2162 2056 1706 27 3421 3147 2771 2473 2158 2052 1703 28 3408 3136 2763 2467 2154 2048 1701 29 3396 3127 2756 2462 2150 2045 1699 30 3385 3118 2750 2457 2147 2042 1697 v Nível de significância a unilateral 01 02 05 1 2 25 5 1 318309 159153 63657 31821 15895 12706 6314 2 22327 15764 9925 6965 4849 4303 2920 3 10215 8053 5841 4541 3482 3182 2353 4 7173 5951 4604 3747 2999 2776 2132 5 5893 5030 4032 3365 2757 2571 2015 Figura 317 Área α correspondente a a Pt tₐ b Pt tₐ Fonte Os autores 2015 Alguns valores de probabilidades que não constam na tabela T também podem ser obtidos por meio das propriedades apresentadas na seção 31 também válidas para a distribuição t entre as quais destacamos Pa t b Pt b Pt a Pt μ 0 Pt μ 0 05 Pt t₀ 1 Pt t₀ Observe que a Tabela 33 tem valores de tₐ para graus de liberdade variando de 1 a 30 Algumas tabelas como a disponível no link httpwwwimeunicampbrcnaberTabela20tpdf apresentam valores de tₐ para graus de liberdade acima de 30 contudo de modo mais espaçado e até no máximo 130 graus de liberdade Pergunta por que não construir também uma tabela para v 130 A resposta é simples quanto mais graus de liberdade temos mais a curva de densidade da distribuição t se aproxima da curva normal padrão Logo quando tivermos muitos graus de liberdade podemos utilizar a tabela Z em vez da tabela T Veja um exemplo de aplicação da tabela T Com 95 de confiança qual é a verdadeira média da população μ₁ 55 ou μ₂ 50 Resolução Observe que este é o mesmo exemplo apresentado na Seção 33 com a diferença de que agora não conhecemos a variância populacional Apesar disso os passos a serem seguidos são os mesmos Vamos inicialmente testar se μ μ₁ 55 Passo 1 elaborar as hipóteses H₀ μ 55 H₁ μ 55 Passo 2 determinar a estatística de teste como a variância populacional é desconhecida a estatística será t x μ VarX n com v 11 graus de liberdade Passo 3 fixar o nível de significância α 100 95 5 Passo 4 calcular a estatística a partir da amostra a média amostral é x₀ 505 e VarX 7 Rejeitaremos a hipótese H₀ caso o valor x obtido a partir da amostra seja muito maior ou muito menor que μ₁ 55 ou ainda quando x pertencer à região crítica RC x ℝ x x₁ ou x x₂ Observando a tabela T na linha v 11 e coluna correspondente à probabilidade 25 pois o teste é bilateral temos t₁ 2201 22010583 x₁ 55 x₁ 533 t₂ 2201 22010583 x₂ 55 x₂ 567 RC x ℝ x 533 ou x 567 Passo 5 tomar uma decisão como x₀ RC decidimos rejeitar H₀ isto é há indícios suficientes que nos permitem refutar a possibilidade de a média populacional ser μ₁ 55 Vamos testar agora se μ μ₂ 50 Passo 1 elaborar as hipóteses H₀ μ 50 H₁ μ 50 Passo 2 determinar a estatística de teste como a variância populacional é desconhecida a estatística será t x μ VarX n com v 11 graus de liberdade Passo 3 fixar o nível de significância α 100 95 5 Passo 4 calcular a estatística a partir da amostra a média amostral é x₀ 505 e VarX 7 Logo tₐ 505 50 7 12 0655 Observe na tabela T que à medida que percorremos suas colunas da esquerda para a direita o valor α aumenta e os valores de tₐ diminuem Assim tₐ 0655 menor que todos os valores da tabela T deve corresponder a um valor de αₜ maior que 5 Em consequência disso temos valorp 2 Pt tₐ 2 αₜ 25 10 Mais precisamente podemos verificar utilizando o computador ou uma tabela T mais completa que o valorp nesse caso é igual a 5262 Passo 5 tomar uma decisão como o valorp é maior que o nível de significância α 5 estipulado não podemos rejeitar H₀ isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser μ₂ 50 Desse modo em concordância com o problema apresentado devemos concluir que a verdadeira média da população é μ₂ 50 Veja agora um exemplo de teste unilateral à direita Seja uma variável XN µσ² de dada população Foram levantadas duas hipóteses para a média populacional µx H₀ µ 15 H₁ µ 15 Para testar essas hipóteses foi coletada uma amostra de tamanho n 30 da qual se extraiu x 15265 e VarX 05 Com 95 de confiança é possível refutar a hipótese nula Resolução Passo 1 elaborar as hipóteses H₀ µ 15 H₁ µ 15 Passo 2 determinar a estatística de teste como a variância populacional é desconhecida a estatística será t x µ VarXn com v 29 graus de liberdade Passo 3 fixar o nível de significância α 10095 5 Passo 4 calcular a estatística a partir da amostra x 15265 e VarX 05 Logo tₕ 1526515 0530 2053 Observe na tabela T na linha correspondente a v 29 que o valor que mais se aproxima de tₕ 2053 é 2045 que corresponde a 25 Assim temos valorp Pt tₕ 25 Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 246 Passo 5 tomar uma decisão como o valorp é menor que o nível de significância α 5 estipulado podemos rejeitar H₀ isto é há indícios suficientes que nos permitem refutar a possibilidade de a média populacional ser µ 15 Sem medo de errar Observe que queremos novamente pôr à prova as afirmações feitas pela empresa M 1 o peso médio dos funcionários é 80 kg 2 a altura média é maior ou igual a 170 cm A principal diferença com relação aos testes da seção anterior se apresenta na distribuição que será utilizada pois não iremos mais supor que a variância populacional é conhecida Denotando por X e Y respectivamente temos as seguintes hipóteses a serem testadas Problema 1 H₀ µₓ 80 H₁ µₓ 80 Problema 2 H₀ µᵧ 170 H₁ µᵧ 170 Para ambos os problemas o passo 1 já foi realizado ou seja as hipóteses já foram fixadas Problema 1 testar µₓ 80 Passo 2 determinar a estatística de teste t x µ VarXn com v 19 graus de liberdade Passo 3 fixar o nível de significância α 2 Passo 4 calcular a estatística a partir da amostra x₀ 7605 e VarX 13794 tₕ 760580 1379420 1504 Observe na tabela T na linha correspondente a v 19 que o valor que mais se aproxima de tₕ 1504 é 1729 que corresponde a 5 Assim temos valorp 2Pt tₕ 25 10 Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 149 Passo 5 tomar uma decisão como o valorp é maior que o nível de significância estipulado não podemos rejeitar H₀ isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser µₓ 80 Problema 2 testar µᵧ 170 Passo 2 determinar a estatística de teste t y µ VarYn com v 19 graus de liberdade Passo 3 fixar o nível de significância α 2 Passo 4 calcular a estatística a partir da amostra y₀ 17285 e VarX 6045 tₕ 17285170 604520 1639 Observe na tabela T na linha correspondente a v 19 que o valor que mais se aproxima de tₕ 1639 é 1729 que corresponde a 5 Assim temos valorp Pt tₕ 5 Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 588 Passo 5 tomar uma decisão como o valorp é maior que o nível de significância estipulado não podemos rejeitar H₀ isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser µᵧ 170 Portanto considerando que a empresa N tenha acesso aos dados amostrados na Tabela 21 e o nível de significância α 2 não há indícios suficientes para que ela consiga refutar a afirmação da empresa M de que o peso médio de seus funcionários é 80 kg e que a altura média deles é maior ou igual a 170 cm Avançando na prática U3 Estatística inferencial parte I 177 valorp 2 2 2 4 P t tc Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 399 Passo 5 tomar uma decisão como valorp α 5 optamos por rejeitar H0 ou seja existem indícios suficientes de que a média populacional é diferente de μ 50 Concluímos que há indícios suficientes de que a suspeita dos funcionários pode ser confirmada Lembrese A distribuição normal padrão ou distribuição z é utilizada para os casos em que a variância populacional é conhecida ou quando temos grandes amostras geralmente n 120 Para pequenas amostras e variância populacional desconhecida o correto é utilizarmos a distribuição de Student ou distribuição t Graus de liberdade v número de desvios em relação à média que não estão relacionados entre si Para calcular os graus de liberdade efetuamos v n 1 Faça você mesmo Junto a um colega colete as informações sobre o peso de todos os alunos da turma Um de vocês primeiro irá calcular a média μ e a variância σ2 sem que o outro segundo veja os resultados O primeiro irá fazer ao segundo uma afirmação sobre a média por exemplo a média é μ 70 kg não necessariamente o verdadeiro valor de μ O segundo por sua vez irá coletar uma amostra e formular uma hipótese alternativa por exemplo a média μ é diferente de 70 kg Em seguida estipulando um nível de significância o segundo irá testar as hipóteses para refutar ou não a afirmação do primeiro Faça valer a pena 1 Em determinado teste de hipóteses temos H0 μ 20 e H1 μ 20 Sabendo que a partir de uma amostra de tamanho n 25 obtevese x 19 e VarX 4 assinale a alternativa que contém a região crítica para α 5 a RC x x R 19 3156 ou x 20 6844 b RC x x R 19 1760 ou x 20 8240 U3 Estatística inferencial parte I 178 c RC x x R 19 1744 ou x 20 8256 d RC x x R 19 3168 ou x 20 6832 e RC x x R 19 3156 ou x 20 6832 2 Desejase testar as hipóteses H0 μ 60 e H1 μ 60 Sabendo que a partir de uma amostra de tamanho n 30 obtevese x 61 e VarX 9 assinale a alternativa que contém a região crítica para α 25 a RC x x R 61 120 b RC x x R 61 118 c RC x x R 60 931 d RC x x R 60 929 e RC x x R 61 178 3 Para testar as hipóteses H0 μ 100 e H1 μ 100 coletouse uma amostra de tamanho n 20 e obtevese x 9884 e VarX 9 Assinale a alternativa que contém o valorp a 05 b 1 c 2 d 25 e 5 4 Suponha que para testar as hipóteses H0 μ 50 e H1 μ 50 tenhase coletado uma amostra de tamanho n 25 obtendo x 51 e VarX 16 Assinale a alternativa correta a 1 valorp 2 b 2 valorp 25 c 25 valorp 5 U3 Estatística inferencial parte I 179 d valorp 5 e valorp 5 5 Considere que para testar as hipóteses H0 μ 100 e H1 μ 80 tenha se coletado a seguinte amostra 83 83 82 80 79 81 80 79 84 80 82 82 Considerando α 5 assinale a alternativa correta a Não se pode rejeitar a hipótese nula pois valorp é menor que 5 b Devese rejeitar a hipótese nula pois valorp é menor que 5 c Não se pode rejeitar a hipótese nula pois valorp é maior que 5 d Devese rejeitar a hipótese nula pois valorp é menor que 1 e Não se pode rejeitar a hipótese nula pois valorp é maior que 1 6 Sejam as hipóteses H0 μ 500 e H1 μ 500 Determine a região crítica para α 5 sabendo que de uma amostra de tamanho n 28 obteve se x 498 e VarX 100 Por fim conclua se a hipótese nula deve ser rejeitada ou não 7 Para testar as hipóteses H0 μ 150 e H1 μ 150 coletouse uma amostra de tamanho n 200 obtendose x 15146 e VarX 64 Considerando α 2 verifique se a hipótese nula deve ser rejeitada ou não U3 Estatística inferencial parte I 180 Referências ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística aplicada à administração e economia 2 ed São Paulo Cengage Learning 2011 CLIMATEMPO Disponível em httpwwwclimatempocombr Acesso em 18 jun 2015 CRESPO Antônio A Estatística fácil 17 ed São Paulo Saraiva 2002 FREUND John E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2006 FUTPÉDIA Disponível em httpfutpediaglobocomcampeonatocopado mundo Acesso em 13 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística População presente e residente Disponível em wwwibgegovbr Acesso em 14 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística Produção vegetal Disponível em wwwibgegovbr Acesso em 14 maio 2015 JOHNSON Robert KUBY Patrícia Estatística São Paulo Cengage Learning 2013 MEDEIROS Valéria Z Coord Métodos quantitativos com Excel São Paulo Cengage Learning 2008 MORETTIN Luiz G Estatística básica probabilidade e inferência São Paulo Pearson Prentice Hall 2010 MORETTIN Luiz G BUSSAB Wilton O Estatística básica São Paulo Saraiva 2010 UOL Esporte Disponível em httpesporteuolcombrfutebolbiografias559 pele Acesso em 28 abr 2015 U4 Estatística inferencial parte II 181 Unidade 4 Estatística Inferencial parte II Muitas das pesquisas e investigações que realizamos têm o objetivo de verificar a existência de relação entre duas variáveis Você viu um exemplo disso na Unidade 1 quando foi descrita a lei da oferta e da demanda Lembrese de que o preço X e a quantidade ofertada Y possuem uma relação direta ou seja um aumento no preço implica um aumento na quantidade ofertada já o preço X e a quantidade demandada Z possuem uma relação inversa isto é um aumento no preço ocasiona uma redução na quantidade demandada A lei da oferta e da demanda indica que as variáveis X e Y estão relacionadas assim como as variáveis X e Z Uma vez cientes da existência de relação entre duas variáveis podemos fazer diversos questionamentos 1 a relação entre as duas variáveis é forte ou fraca 2 a relação é direta ou inversa 3 como medimos a relação entre duas variáveis 4 por que estudar a relação entre duas variáveis Para dar um direcionamento às possíveis respostas para essas perguntas vamos retomar duas situações abordadas anteriormente a da unidade 1 em que solicitamos que você se pusesse no papel de um vendedor que necessitava determinar a demanda de mercado de um produto e a da unidade 2 em que foi sugerido que você supusesse que era um funcionário de uma grande empresa e deveria descrever o perfil dos funcionários Se soubermos que duas variáveis estão relacionadas teremos a garantia de que ao haver uma modificação em uma delas a outra também será alterada Com isso saber se a relação é forte ou fraca direta ou inversa implica na modificação de uma variável Convite ao estudo U4 Estatística inferencial parte II 182 conhecer a magnitude da alteração que ocorrerá na outra variável e o sentido dessa alteração positivo ou negativo Vimos algo semelhante quando calculamos a elasticidade na Unidade 1 A principal motivação para estudarmos a relação entre duas variáveis é a possibilidade de prever resultados futuros ou inferir valores não amostrados de uma população Lembrese de que na Unidade 2 foi perguntado aos funcionários da empresa M qual era a avaliação deles em relação às condições de trabalho e à remuneração Imagine novamente que você é o funcionário citado na Unidade 2 será que essas variáveis estão relacionadas Quanto maior a remuneração maior a satisfação do funcionário U4 Estatística inferencial parte II 183 Seção 41 Correlação entre variáveis quantitativas Diálogo aberto Nesta seção você aprenderá a medir o grau de associação entre duas variáveis Mensuramos essa associação por meio do coeficiente de correlação Para ilustrar esse conceito imagine novamente que você é um funcionário da empresa M e que necessita avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Será que quanto maior é a satisfação em relação à remuneração mais satisfeitos ficam os funcionários em relação às condições de trabalho Para responder a essas perguntas você deverá elaborar um diagrama de dispersão e calcular o coeficiente de correlação Não pode faltar Bastante ênfase foi dada até o momento para o tratamento de cada variável separadamente estudada em dada população Análises com essa característica são denominadas univariadas O que ocorre é que nem sempre estamos interessados em estudar uma única variável de cada vez mas sim duas ou mais e a relação entre elas Tais análises são denominadas multivariadas Neste livro nos limitaremos a estudar o caso bivariado ou seja a análise de duas variáveis simultaneamente Veja como exemplo os dados da Tabela 41 amostrados a partir da população de crianças de 0 a 5 anos em determinada cidade Tabela 41 Idade e altura de uma amostra de 24 crianças Idade em meses 0 0 5 5 10 10 15 15 20 20 25 25 Altura em cm 491 497 524 510 616 612 571 504 716 670 636 707 Idade em meses 35 35 40 40 45 45 50 50 55 55 60 60 Altura em cm 853 775 870 828 835 841 865 1017 1013 1042 1101 1107 Fonte Os autores 2015 U4 Estatística inferencial parte II 184 Observe que há um total de 24 observações ou seja uma amostra de 24 crianças Além disso de cada criança foram coletadas duas informações a saber a idade em meses e a altura em centímetros Se denominarmos X a variável idade e Y a variável altura também podemos escrever as informações anteriores da forma X Y em que o primeiro valor se refere à idade e o segundo à altura 0 491 0 497 5 524 5 51 10 616 10 612 15 571 15 504 20 716 20 67 25 636 25 707 30 806 30 772 35 853 35 775 40 87 40 828 45 835 45 841 50 865 50 1017 55 1013 55 1042 60 1101 60 1107 A escrita em pares ordenados X Y ou também X Y é muito comum no âmbito da análise bivariada pois deixa bem clara a associação do valor de X com o seu Y correspondente na medida em que ambos foram coletados de um mesmo elemento da população no caso da mesma criança Podemos representar essas informações em um gráfico de dispersão como se observa na Figura 41 Você aprendeu anteriormente que um gráfico tem o objetivo de facilitar a leitura e a interpretação dos dados além de dar uma ideia da distribuição de uma variável Quando a análise é bivariada os gráficos também têm o objetivo de investigar a presença de uma relação entre as variáveis Observando a Figura 41 o que você imagina em relação às variáveis X e Y Esperamos que você tenha percebido que quanto maior a idade maior a altura Essa ideia nos parece óbvia mas nem sempre a relação de dependência entre duas variáveis é tão clara assim Uma vez aceita a hipótese de relação de dependência entre duas variáveis surgem duas perguntas básicas 1ª essa relação é forte ou fraca 2ª de que forma podemos mensurar essa relação Figura 41 Idade e altura de uma amostra de 24 crianças Fonte Os autores 2015 U4 Estatística inferencial parte II 185 Observando a Figura 41 imaginamos que se os pontos estivessem um pouco mais organizados quase daria para traçar uma linha reta passando por todos eles Essa nossa percepção indica que a relação de dependência entre X e Y é forte e além disso linear Quando isso ocorre dizemos que existe uma correlação linear entre as variáveis Veja mais alguns exemplos na Figura 42 em que no eixo horizontal é representada uma variável X e no eixo vertical uma variável Y Assimile Correlação dizse que duas variáveis estão correlacionadas quando existe uma relação de dependência entre elas Correlação linear duas variáveis estão correlacionadas linearmente quando a relação entre elas pode ser representada geometricamente por meio de uma reta Figura 42 Diagramas de dispersão e correlação linear a Sem correlação b Correlação positiva c Correlação altamente positiva d Correlação negativa e Correlação altamente negativa Fonte Os autores 2015 A Figura 42 a mostra um caso em que a variável X e a variável Y não estão correlacionadas isto é a variação de Y não é explicada pela variação de X Já na Figura 42 b e c há uma correlação linear positiva entre as duas variáveis e além disso a variação de Y é mais bem explicada pela variação de X em c Por fim na Figura 42 d e e há uma correlação linear negativa entre as duas variáveis e além disso a variação de Y é mais bem explicada pela variação de X em e Assimile Dizer que a correlação é positiva implica afirmar que quando X aumenta Y também aumenta quando X diminui Y também diminui Se a correlação é negativa ocorre o contrário se X aumenta Y diminui se X diminui Y aumenta Há ainda outros casos interessantes os quais podem ser observados na Figura 43 a seguir Na figura em a e b há a correlação linear perfeita Figura 43 Mais exemplos de diagrama de dispersão Tabela 42 Produtos dos desvios CovXY 5175921333017531213361 80 CovXZ 51751257167301750716761 445 CovXW 51759055673017543556761 0 Logo X e Y estão correlacionadas positivamente X e Z estão correlacionadas negativamente e X e W não estão correlacionadas Neste momento pode ter surgido uma dúvida quanto maior é a magnitude da covariância mais fortemente estão relacionadas as variáveis A resposta é não A covariância é influenciada pela escala logo quanto maiores os valores de um conjunto de dados maiores as chances de a covariância assumir valores mais elevados Uma maneira de corrigir isso é utilizar variáveis padronizadas xixDpX e yiyDpY e definir uma nova medida o coeficiente de correlação r ρXY ΣxixyiyDpXDpYn1 Σxixyiyn1DpXDpY CovXYDpXDpY Com essa transformação 1 r 1 Além disso se r 0 as variáveis estão correlacionadas positivamente r 0 as variáveis estão correlacionadas negativamente r 0 as variáveis não estão correlacionadas r 1 temos uma correlação positiva perfeita r 1 temos uma correlação negativa perfeita Quanto mais próximo de 1 se encontra o valor de r mais forte é a correlação quanto mais próximo de 0 se encontra o valor de r mais fraca é a correlação Além disso se rXY e rZW são os coeficientes de correlação das variáveis X e Y e das variáveis Z e W respectivamente rXY rZW implica que X e Y estão mais fortemente correlacionadas do que Z e W Utilizando as variáveis do exemplo anterior calcule os coeficientes de correlação ρXY ρXZ e ρXW e verifique quais variáveis estão mais fortemente correlacionadas Resolução Temos DpX 935 DpY 869 DpZ 4967 e DpW 4446 Logo ρXY CovXYDpXDpY 80935869 098 ρXZ CovXZDpXDpZ 4459354967 096 ρXW CovXWDpXDpW 09354446 0 Portanto as variáveis X e Y estão mais fortemente correlacionadas do que as variáveis X e Z e do que as variáveis X e W de correlação para as variáveis X e Y cujos dados amostrais foram apresentados na Tabela 41 e classifique as variáveis quanto à correlação Resolução SQx Σx2Σx2n 0²0²60²60²006060224 SQx 30700720²24 9100 SQy Σy²Σy2n 4912110724911107224 SQy 14730018201224 926862 SQxy Σxyn SQxy 0491601107060491110724 SQxy 6347957201820124 88765 r ρXY SQxySQxSQy 887659100926862 0967 Portanto as variáveis X e Y estão positivamente correlacionadas Sem medo de errar Observe a seguir os dados referentes às variáveis G satisfação em relação às condições de trabalho e H satisfação em relação à remuneração O diagrama de dispersão para os dados pode ser observado na Figura 45 Fonte Os autores 2015 Observase no diagrama que existe uma tendência positiva nos dados ou seja quanto maior a satisfação em relação à remuneração maior a satisfação em relação às condições de trabalho Vamos agora medir o grau de associação de H e G Temos SQh7²4²6²8²7468²20577204655 SQg8²5²10²9²85109²207372014295 SQhg619103109205765 rρHGSQhgSQhSQg57654655142950707 Portanto as variáveis H e G estão correlacionadas positivamente e além disso como r0707 essa correlação é forte Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competência de fundamentos de área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Mensurar a relação entre duas variáveis por meio do coeficiente de correlação linear 3 Conteúdos relacionados Correlação covariância coeficiente de correlação 4 Descrição da situaçãoproblema A seguir consta o valor gasto com propaganda e a quantidade vendida de um produto no mesmo mês Gastos com propaganda X R 1000 100 110 122 138 144 155 Unidades vendidas X 10000 98 97 126 144 136 162 Verifique se essas variáveis estão correlacionadas linearmente Considere X gasto com propaganda e Y unidades vendidas Temos SQx100²155²100155²61007897692622288 SQy98²162²98162²61003657633633368 SQxy1009815516210015598162626168 rρXYSQxySQxSQy2616822288333680960 Como r0960 as variáveis X e Y estão fortemente correlacionadas linearmente e positivamente U4 Estatística inferencial parte II 193 Lembrese Duas variáveis estão correlacionadas quando existe uma relação de dependência entre elas Dizer que a correlação é positiva implica afirmar que quando X aumenta Y também aumenta quando X diminui Y também diminui Se a correlação é negativa ocorre o contrário se X aumenta Y diminui se X diminui Y aumenta Duas variáveis podem ser classificadas como correlacionadas positivamente se r 0 correlacionadas negativamente se r 0 não correlacionadas se r 0 correlacionadas positiva e perfeitamente se r 1 e correlacionadas negativa e perfeitamente se r 1 Faça você mesmo Faça uma amostragem com os seus colegas de classe sobre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Em seguida verifique se essas variáveis estão correlacionadas Faça valer a pena 1 Considere o conjunto de dados bivariados X Y em que por amostragem coletouse 5 3 14 11 15 14 5 3 9 11 13 14 7 4 Assinale a alternativa que contém o valor aproximado de CovX Y a 2002 c 2222 e 2022 b 2202 d 2220 2 Assinale a alternativa que contém o coeficiente de correlação do conjunto 16 59 16 39 47 68 23 22 15 55 34 48 a 08543 c 03584 e 03845 b 05834 d 03485 U4 Estatística inferencial parte II 194 3 Considere o seguinte conjunto de dados obtidos por amostragem X 75 59 32 54 20 Y 78 63 39 59 26 Z 13 23 54 31 63 W 9 87 12 93 56 Assinale a alternativa correta a X e Y não estão correlacionadas b X e W estão correlacionadas positivamente c X e Z estão correlacionadas negativamente d X e Y estão positivamente correlacionadas assim como X e Z e X e Z não estão correlacionadas 4 Considere as variáveis X Y Z e W para as quais temos CovX Y 10 CovX Z 15 CovX W 18 DpX 2 DpY 6 DpZ 8 e DpW 10 Assinale a alternativa correta a ρX Y ρX Z ρX W d ρX Y ρX Z ρX W b ρX Y ρX Z ρX W e ρX Y ρX Z ρX W c ρX Y ρX W ρX Z 5 Considere as variáveis X Y e Z tais que CovX Y 50 CovX Z 60 DpX 10 DpY 15 e DpZ 10 Assinale a alternativa correta a ρX Y ρX Z o que indica que as variáveis X e Y estão mais fortemente relacionadas do que X e Z b ρX Z ρX Y o que indica que as variáveis X e Z estão mais fortemente relacionadas do que X e Y c ρX Z ρX Y d ρX Z ρX Y o que indica que as variáveis X e Y estão mais fortemente relacionadas do que X e Z e ρX Z ρX Y U4 Estatística inferencial parte II 195 6 Classifique as variáveis X e Y como correlacionadas positivamente correlacionadas negativamente ou não correlacionadas X 40 68 17 41 41 65 Y 51 19 73 55 45 32 7 Considere os valores amostrados para as variáveis X Y e Z a seguir X 118 122 139 119 127 Y 167 170 190 177 186 Z 189 193 177 191 190 Verifique quais variáveis estão mais fortemente correlacionadas X e Y ou X e Z U4 Estatística inferencial parte II 196 Seção 42 Teste de significância Diálogo aberto Você aprendeu na seção anterior a mensurar a correlação entre duas variáveis quantitativas por meio do coeficiente de correlação Vale ressaltar que esse coeficiente mede o grau de associação linear entre duas variáveis isto é mede o quanto os pontos X Y em um diagrama de dispersão se aproximam de uma reta As análises feitas para avaliar a força de associação entre as variáveis X e Y foram apenas subjetivas considerando quão próximo o coeficiente de correlação se encontrava de 1 ou 1 Entretanto em estatística a ferramenta utilizada para comprovar algo é o teste estatístico de hipóteses Logo além de calcularmos o coeficiente de correlação r precisamos verificar sua significância Para prosseguirmos com essa análise vamos relembrar a situação problema proposta na seção anterior imagine novamente que você é um funcionário da empresa M e que necessita avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Será que quanto maior é a satisfação em relação à remuneração mais satisfeitos ficam os funcionários em relação às condições de trabalho Verificamos na seção anterior que o coeficiente de correlação para a amostra apresentada na Tabela 21 é r 0707 e afirmamos que nesse caso a correlação é forte A fim de sustentarmos essa afirmação precisamos testála Para isso que procedimentos devemos adotar Não pode faltar Você aprendeu que o coeficiente de correlação r é calculado a partir de dados bivariados X Y e mede o grau de associação entre as variáveis X e Y O coeficiente r varia no intervalo 1 1 e além disso Assimile Se r 0 a correlação entre X e Y é positiva e quanto mais próximo r estiver de 1 mais forte será as variáveis estão correlacionadas Se r 0 a correlação entre X e Y é negativa e quanto mais próximo r estiver de 1 mais forte será as variáveis estão correlacionadas Se r 0 não há correlação entre X e Y Obviamente se r 0 mas não exatamente igual a zero temos indícios de que as variáveis não estão correlacionadas O teste de hipóteses utilizado para testar a força de uma correlação por meio do coeficiente r é denominado teste de significância Segundo Larson e Farber 2010 p 403 as hipóteses nula e alternativa para os testes são H0 ρ 0 não há correlação negativa significante H1 ρ 0 correlação negativa significante H0 ρ 0 não há correlação positiva significante H1 ρ 0 correlação positiva significante H0 ρ 0 não há correlação significativa H1 ρ 0 correlação significativa Além disso um teste t pode ser usado se a correlação entre duas variáveis for significativa A estatística de teste é r e a estatística de teste padronizada tcrσr r1r²n2 segue uma distribuição t com n2 graus de liberdade Para facilitar a compreensão vamos testar a significância do coeficiente de correlação para os dados apresentados na Figura 41 Na seção anterior apresentamos o diagrama de dispersão para os dados correspondentes à idade X e à altura Y de uma amostra de 24 crianças de 0 a 5 anos Ao final da seção obtivemos r 0967 para a correlação entre essas variáveis Com 95 de confiança o valor r 0967 indica que a correlação é significativa Resolução Para testar a significância da correlação executamos os seguintes passos Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação significativa H₁ ρ 0 correlação significativa Passo 2 determinar a estatística de teste tₑ r 1 r² com v n 2 graus de liberdade Passo 3 fixar o nível de significância α 100 95 5 Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₑ obtido a partir da amostra seja muito maior ou muito menor que ρ 0 ou ainda quando tₑ pertencer à região crítica RC T ℝ T t ou T t em que t é obtido na tabela T Observando a tabela na linha v 24 2 22 e na coluna correspondente à probabilidade 25 pois o teste é bilateral temos t 2074 Logo RC T ℝ T 2074 ou T 2074 Obtivemos r 0967 a partir de uma amostra de tamanho n 24 logo calculamos tₑ r 1 r² n 2 0967 10967² 242 17802 RC Passo 5 tomar uma decisão como tₑ RC decidimos rejeitar H₀ isto é há indícios suficientes que nos permitem considerar a correlação entre idade e altura significativa Vejamos agora o caso de um teste de hipóteses unilateral à esquerda Analise os dados bivariados na forma X Y a seguir e verifique para o nível de significância α 2 se a correlação entre X e Y é negativamente significativa 54 7 60 2 48 25 57 17 57 8 Resolução Temos SQx x² x² n 54² 57² 54 57² 5 15318 276² 5 SQx 828 SQy y² y² n 7² 8² 7 8² 5 1031 59² 5 SQy 3348 SQxy xy xy n SQxy 547 578 54 577 8 5 3123 27659 5 1338 r SQxy SQxSQy 1338 8283348 08036 Conhecendose o valor de r podemos agora testar a significância Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação negativa significativa H₁ ρ 0 correlação negativa significativa Passo 2 determinar a estatística de teste tₑ r 1 r² com v n 2 graus de liberdade Passo 3 fixar o nível de significância α 2 dado Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₑ obtido a partir da amostra seja muito menor que ρ 0 ou ainda quando tₑ pertencer à região crítica RC T ℝ T t em que t é obtido na tabela T Observando a tabela na linha v 5 2 3 e na coluna correspondente a probabilidade 2 temos t 3482 Logo RC T ℝ T 3482 Obtivemos r 08036 a partir de uma amostra de tamanho n 5 logo calculamos tₑ r 1 r² n 2 08036 1 08036² 5 2 2339 RC Passo 5 tomar uma decisão como tₑ RC decidimos não rejeitar H₀ isto é não há indícios suficientes que nos permitam considerar a correlação entre X e Y negativamente significativa Por fim vejamos o caso de um teste de hipóteses unilateral à direita Analise os dados bivariados na forma XY a seguir e verifique para o nível de significância α 2 se a correlação entre X e Y é positivamente significativa 54 49 27 35 15 6 59 64 32 42 Resolução Temos SQxΣx²Σx² n 54²32²5432² 8375187² 5 SQx 13812 SQyΣy²Σy² n 49²42²4942² 9522196² 5 SQy 18388 SQxyΣxyΣxΣy n SQxy5449324254324942 5 SQxy 8801187196 5 14706 r SQxy SQxSQy 14706 1381218388 0923 Conhecendose o valor de r podemos agora testar a significância Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação positiva significativa H₁ ρ 0 correlação positiva significativa Passo 2 determinar a estatística de teste tₐ r 1r² com v n2 graus de liberdade Passo 3 fixar o nível de significância α 2 dado Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₐ obtido a partir da amostra seja muito maior que ρ 0 ou ainda quando tₐ pertencer à região crítica RC T R T t em que t é obtido na tabela T Observando a tabela na linha v 52 3 e na coluna correspondente à probabilidade 2 temos t 3482 Logo RC T R T 3482 Obtivemos r 0923 a partir de uma amostra de tamanho n 5 logo calculamos tₐ r 1r² n2 0923 10923² 52 4155 RC Passo 5 tomar uma decisão como tₐ RC decidimos rejeitar H₀ isto é há indícios suficientes que nos permitem considerar a correlação entre X e Y positivamente significativa Sem medo de errar Vamos relembrar a situaçãoproblema proposta no início desta seção imagine novamente que você é um funcionário da empresa M e que precisa avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Será que quanto maior é a satisfação em relação à remuneração mais satisfeitos ficam os funcionários em relação às condições de trabalho Na seção anterior foi verificado que o coeficiente de correlação entre G satisfação em relação às condições de trabalho e H satisfação em relação à remuneração é r 0707 Além disso essa medida foi obtida a partir de uma amostra de tamanho n 20 apresentada na Tabela 21 Para testar a significância de r executamos os seguintes passos Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação positiva significativa H₁ ρ 0 correlação positiva significativa Passo 2 determinar a estatística de teste tₐ r 1r² com v n2 graus de liberdade Passo 3 fixar o nível de significância suponha α 5 Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₐ obtido a partir da amostra seja muito maior que ρ 0 ou ainda quando tₐ pertencer à região crítica RC T R T t em que t é obtido na tabela T Observando a tabela na linha v 202 18 e na coluna correspondente à probabilidade 5 temos RC T R T 1734 Obtivemos r 0707 a partir de uma amostra de tamanho n 20 logo calculamos tc r 1r² n2 0707 4241 RC U4 Estatística inferencial parte II 207 3 Considere as variáveis X e Y para as quais foi coletada a amostra a seguir X 20 80 40 Y 42 150 81 Assinale a alternativa que contém o menor valor de α para o qual em um teste de significância bilateral a hipótese nula seja rejeitada ou seja o menor α para o qual a correlação seja significante a 1 c 4 e 10 b 2 d 5 4 Observe as amostras coletadas para as variáveis X Y Z e W X 83 85 78 Y 93 95 61 Z 56 125 115 W 22 17 44 Existe um indicativo de correlação entre as variáveis X e Y X e Z X e W Com 90 de confiança é possível afirmar que a As variáveis X e Y e as variáveis X e Z possuem correlação significante b As variáveis X e Y e as variáveis X e W possuem correlação significante c Apenas X e W possuem correlação significante d Apenas X e Y possuem correlação significante e Apenas X e Z possuem correlação significante 5 Duas variáveis X e Y estão correlacionadas linearmente sendo r 07976 obtido a partir de uma amostra de tamanho n 9 Teste a significância de r por meio de um teste bilateral e assinale a alternativa que contém o valorp a 1 c 4 e 10 b 2 d 5 U4 Estatística inferencial parte II 208 6 O coeficiente de correlação entre as variáveis X e Y calculado a partir de uma amostra de tamanho n 20 é r 085 Construa a região crítica para o teste bilateral de significância para r com α 5 7 Há indícios de que a correlação entre as variáveis X e Y seja significante Para comprovar essa suspeita coletouse a amostra a seguir X 44 28 76 49 Y 62 41 92 60 Utilize a abordagem valorp para testar bilateralmente a significância da correlação entre essas variáveis com 98 de confiança U4 Estatística inferencial parte II 209 Seção 43 Regressão linear Diálogo aberto Você aprendeu nas seções anteriores a mensurar a correlação linear entre duas variáveis e a testar a significância dessa correlação por meio de um teste estatístico de hipóteses Vale lembrar que o índice que foi utilizado o coeficiente de correlação mede a correlação linear ou seja mede o quanto os pontos em um diagrama de dispersão se aproximam de uma reta Ressaltamos isso porque não existe somente a correlação linear mas sim uma grande variedade de associações entre duas variáveis tais como a polinomial a exponencial e a logarítmica Ao comprovarmos a significância da correlação linear entre duas variáveis alguns questionamentos podem surgir 1 há como estabelecer uma relação matemática uma regra de associação entre uma variável X e uma variável Y 2 é possível realizar uma previsão pontual de Y a partir de um valor de X não amostrado Para darmos continuidade a essa investigação considere a seguinte situação imagine novamente que você é um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários A partir da Tabela 21 é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho Um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará com qual pontuação a satisfação em relação às condições de trabalho Veremos nesta seção um método para relacionar matematicamente duas variáveis correlacionadas linearmente Vamos lá Não pode faltar Quando testamos a significância da correlação linear entre duas variáveis X e Y verificamos se os dados sustentam a hipótese de que a correlação entre elas é não nula ou seja de que as variações de Y são influenciadas pelas variações de X de modo linear Sabendo dessa influência algo natural é questionar se para um valor específico de X não amostrado é possível prever o valor correspondente de Y U4 Estatística inferencial parte II 215 a x b y 75 8375 0 9759 30 46 5605 ˆ ˆ Portanto y x 0 9759 46 5605 ˆ é a equação da reta de regressão que pode ser observada na Figura 46 Para prever a estatura de uma criança de 57 meses de idade substituímos x 57 na equação anterior Temos y 0 9759 57 46 5605 102 1868 102 ˆ Concluímos então que a estimativa para a estatura de uma criança de 57 meses de idade é y 102 ˆ centímetros Observe que esse valor é próximo do estimado visualmente 100 cm Existem fórmulas alternativas e equivalentes para calcular os coeficientes de regressão São elas ² ² a n xy x y n x x SQ xy SQ x ˆ a x b y y n a x n ˆ ˆ ˆ Pesquise mais Veja mais detalhes sobre a regressão linear nos links httpleg ufprbrpaulojusCE003ce003node9html httpwwwusp brfaucursosgraduacaoarqurbanismodisciplinasaut0516 ApostilaRegressaoLinearpdf httpwwwpucrsbrfamatrossana psicologiaAula18Analiseregressaopdf acesso em 21 jul 2015 Sem medo de errar Vamos retornar à situaçãoproblema proposta no início desta seção imagine novamente que você é um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários A partir da Tabela 21 é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho Um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará U4 Estatística inferencial parte II 222 um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários Vimos nas seções anteriores que a partir da Tabela 21 é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho Obtivemos a equação de regressão g h 1 238 0 926 ˆ em que H é a satisfação em relação à remuneração e G é a satisfação em relação às condições de trabalho Estimamos que um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará com a pontuação 10 a satisfação em relação às condições de trabalho Neste ponto surgem alguns questionamentos é possível estabelecer um intervalo de confiança para a estimativa g0 10 ˆ Quanto da variação de G é explicado pela variação de H e quanto é devido ao acaso e às características próprias de cada funcionário Não pode faltar Resíduos Quando realizamos uma regressão linear e obtemos os valores aˆ e bˆ tais que a reta y a x b ˆ ˆ ˆ é aquela que melhor se ajusta ao conjunto de pontos correspondentes aos valores amostrados para as variáveis X e Y sempre estamos sujeitos a erros Em Estatística tais erros são denominados resíduos Você aprendeu na seção anterior que a reta de regressão é determinada por meio da minimização de SQ a b ei ² ˆ ˆ em que e y y i i i ˆ é o erro também denominado desvio não explicado associado ao ésimo ponto no diagrama de dispersão O erro pode ser observado no diagrama da Figura 48 Figura 48 Resíduos em uma regressão linear Fonte Os autores 2015 U4 Estatística inferencial parte II 232 A variação total é igual à soma da variação explicada com a não explicada O coeficiente de determinação é uma medida que tem por finalidade mensurar em termos percentuais o quanto da variação de uma variável Y é devido à variação de X supondo que essas variáveis sejam correlacionadas Faça você mesmo Na seção anterior propusemos que você acessasse o link httpnbcgib uescbrlecdownloadmaterialdidaticocorrelacaopdf acesso em 21 jul 2015 e resolvesse o problema exposto na página 6 desse material Em seguida sugerimos que determinasse a equação da reta de regressão que relaciona o índice DJIA com o SP500 Por fim solicitamos que realizasse uma previsão para o SP500 quando o índice DJIA for 11000 Agora aproveitando o que você já desenvolveu e com 90 de confiança construa um intervalo de previsão para a estimativa realizada Faça valer a pena 1 Duas variáveis X e Y estão correlacionadas linearmente de modo que os valores de Y são previstos a partir de X por regressão linear Sabendo que r 0 75 assinale a alternativa que contém o percentual da variação de Y não explicado pela variação de X a 5625 c 4375 e 5652 b 5265 d 4735 2 Considere o seguinte conjunto de dados X 1 2 3 4 5 Y 4 7 4 8 9 Assinale a alternativa que contém o valor aproximado do coeficiente de determinação para essas variáveis a 755 c 650 e 714 b 570 d 512 U4 Estatística inferencial parte II 233 3 Duas variáveis X e Y estão correlacionadas de modo que quando os valores de X aumentam os valores de Y diminuem Sabendo que a variação não explicada pela correlação entre essas variáveis é igual a 19 assinale a alternativa que contém o valor do coeficiente de correlação r a 081 c 09 e 019 b 081 d 09 4 Duas variáveis X e Y estão correlacionadas positivamente sendo a equação da reta de regressão y x 1 33 4 35 ˆ Essa equação foi estimada a partir de uma amostra de tamanho n 4 sendo o erro padrão de estimativa Se 9 27 Sabendo que x2 4600 e x 120 assinale a alternativa que contém o valor da margem de erro de previsão E a um nível de confiança de 98 para a estimativa y0 20 31 ˆ a 64 c 78 e 81 b 75 d 80 5 Duas variáveis X e Y estão correlacionadas de modo que Y pode ser estimado a partir de X por meio da equação y x 1 07 12 07 ˆ Além disso o erro padrão de estimativa obtido a partir de uma amostra de tamanho n 5 é Se 9 00 Com essas informações assinale a alternativa que contém o intervalo de confiança de 96 para y0ˆ sendo x0 10 e dados n x x 0 2 19220 e n x x 2 2 34400 a 1879 6433 c 2879 5433 e 879 5433 b 1879 6433 d 879 4433 6 Considere as variáveis X Y correlacionadas e a amostra a seguir 100 134 150 183 200 207 250 229 300 316 Sabendo que a equação da reta de regressão para X Y é y x 0 82 49 8 ˆ construa uma tabela em que na primeira coluna sejam listados os valores xi na segunda coluna sejam listados os valores observados yi na terceira coluna sejam listados os valores estimados yiˆ e na quarta e última coluna sejam listados os desvios não explicados e y y i i iˆ 7 Duas variáveis X Y estão correlacionadas sendo y x 5 4 ˆ a equação da reta de regressão correspondente Sabendo que o desvio não explicado e y y 0 0 0ˆ é 3 com x0 4 determine o valor observado y0 U4 Estatística inferencial parte II 234 Referências ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística aplicada à administração e economia 2 ed São Paulo Cengage Learning 2011 CRESPO Antônio A Estatística fácil 17 ed São Paulo Saraiva 2002 FREUND John E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2006 JOHNSON Robert KUBY Patrícia Estatística São Paulo Cengage Learning 2013 LARSON R FARBER B Estatística aplicada 4 ed São Paulo Person Prentice Hall 2010 MEDEIROS Valéria Z Coord Métodos quantitativos com Excel São Paulo Cengage Learning 2008 MORETTIN Luiz G Estatística básica probabilidade e inferência São Paulo Pearson Prentice Hall 2010 MORETTIN Luiz G BUSSAB Wilton O Estatística básica São Paulo Saraiva 2010
Send your question to AI and receive an answer instantly
Recommended for you
1
Teste T Student Nicotina Cigarros - Estatistica do Teste
Métodos Matemáticos
UNIA
1
Probabilidade de Acidentes de Carro em Cidade do Campo - Exercício Resolvido
Métodos Matemáticos
UNIA
1
Questão Sobre Integração: Assinale a Alternativa Correta
Métodos Matemáticos
UNIA
1
Questão sobre Probabilidades em Dados de Pesquisa COVID-19
Métodos Matemáticos
UNIA
39
Processos Estocasticos e Processos de Renovacao iid - Sistemas Reparaveis
Métodos Matemáticos
UNIA
1
Probabilidade Olhos Azuis Feminino Administracao - Exercicios Resolvidos
Métodos Matemáticos
UNIA
1
Conteúdo Programático de Álgebra Linear, Cálculo Numérico e Estatística
Métodos Matemáticos
UNIA
52
Plano de Ensino - Métodos Matemáticos: Álgebra Linear, Cálculo Numérico, Probabilidade e Estatística
Métodos Matemáticos
UNIA
1
Distribuicao Normal Gaussiana - VVF Verdadeiro ou Falso
Métodos Matemáticos
UNIA
30
Polinomio Interpolador Metodos Matematicos - Guia Completo
Métodos Matemáticos
UNIA
Preview text
Métodos cuantitativos Junior Francisco Dias Métodos quantitativos Dados Internacionais de Catalogação na Publicação CIP Dias Junior Francisco ISBN 9788584823543 1 Funções 2 Pesquisa quantitativa 3 Estatística matemática 4 Matemática aplicada I Título CDD 518 Editora e Distribuidora Educacional SA 2016 240 p D541m Métodos quantitativos Junior Francisco Dias Londrina 2016 por Editora e Distribuidora Educacional SA Todos os direitos reservados Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer modo ou por qualquer outro meio eletrônico ou mecânico incluindo fotocópia gravação ou qualquer outro tipo de sistema de armazenamento e transmissão de informação sem prévia autorização por escrito da Editora e Distribuidora Educacional SA Presidente Rodrigo Galindo VicePresidente Acadêmico de Graduação Mário Ghio Júnior Conselho Acadêmico Dieter S S Paiva Camila Cardoso Rotella Emanuel Santana Alberto S Santana Regina Cláudia da Silva Fiorin Cristiane Lisandra Danna Danielly Nunes Andrade Noé Parecerista Rogério Siqueira Chiacchio Thiago Barroso Fonte Boa Editoração Emanuel Santana Cristiane Lisandra Danna André Augusto de Andrade Ramos Daniel Roggeri Rosa Adilson Braga Fontes Diogo Ribeiro Garcia eGTB Editora 2016 Editora e Distribuidora Educacional SA Avenida Paris 675 Parque Residencial João Piza CEP 86041100 Londrina PR email editoraeducacionalkrotoncombr Homepage httpwwwkrotoncombr Unidade 1 Função afim e função quadrática Seção 11 Função Seção 12 Função afim Seção 13 Função quadrática Seção 14 Sinal mínimo e máximo da função quadrática Unidade 2 Estatística descritiva Seção 21 Amostragem Seção 22 Métodos tabulares e métodos gráficos Seção 23 Medidas de posição Seção 24 Medidas de dispersão Unidade 3 Estatística inferencial parte I Seção 31 Noções de probabilidade Seção 32 Distribuição dos estimadores Seção 33 Testes de hipóteses para a média σ2 conhecido Seção 34 Testes de hipóteses para a média σ2 desconhecido Unidade 4 Estatística inferencial parte II Seção 41 Correlação entre variáveis quantitativas Seção 42 Teste de significância Seção 43 Regressão linear Seção 44 Estudando resíduos 7 8 22 34 45 55 57 75 94 108 123 124 137 151 166 181 183 196 209 221 Sumário Palavras do autor Caro aluno seja bemvindo Nesta unidade curricular estudaremos funções e noções de estatística Utilizamos esses dois temas o tempo todo mas nem sempre nos damos conta disso Observe um exemplo simples com relação à função no supermercado ao levarmos os produtos ao caixa o atendente passa o código de barras pelo leitor e o computador registra o preço do item Nesse caso o computador desempenha o papel de uma função que recebe a informação de um código de barras e como resposta registra o preço do produto Essa é a ideia básica de qualquer função ou seja dado certo elemento que pode ser um objeto um número uma pessoa etc a função o relaciona a outro podendo este ser tão diverso quanto o primeiro Exemplos como o anterior podem ser adaptados para mostrar a aplicação das funções em qualquer relação de comércio mas não é somente nesse contexto que as funções são utilizadas Ao andar de carro você já deve ter reparado a funcionalidade do velocímetro A ação desse mecanismo também pode ser associada a uma função pois ele recebe o sinal referente à frequência dos giros da roda do carro transformando essa informação em registro de velocidade Com relação à estatística também fazemos uso da mesma em nosso cotidiano com muita frequência Ao fazer um levantamento da quantidade de pessoas que moram em uma região estamos construindo uma estatística Quando se realiza uma pesquisa eleitoral ou ainda ao se comparar preços de itens de supermercado estamos usando a estatística Para que seu estudo ocorra de modo organizado este material didático foi dividido em 4 unidades de ensino cada qual subdividida em 4 seções de autoestudo totalizando 16 seções A primeira unidade trata das funções afim e quadrática A unidade 2 aborda a estatística descritiva As unidades 3 e 4 abordam a estatística inferencial Desejamoslhe sucesso nesta empreitada U1 Função afim e função quadrática 7 Unidade 1 Função afim e função quadrática Olá aluno Na Unidade 1 deste livro didático trataremos das funções afim e quadrática Essas duas classes de funções são muito utilizadas não somente na Matemática mas também na Física na Economia na Engenharia na Administração etc Na Física por exemplo a trajetória de um projétil pode ser descrita por uma função quadrática função essa também utilizada na Engenharia para modelar a geometria de algumas estruturas a exemplo da ponte Juscelino Kubitschek Figura 11 em Brasília cujos arcos lembram o gráfico dessa função A afim por sua vez é utilizada por exemplo na modelagem de alguns problemas nas áreas econômicas e de gestão em que a utilização de outro tipo de recurso tornaria o problema muito complexo para ser resolvido Para tornar o assunto desta unidade mais interessante veja uma situação em que o emprego de funções pode facilitar a gestão de um negócio Imagine que você seja o dono de uma empresa que fabrica bonés Para melhor analisar os custos e lucros você decidiu estudar esses números utilizando funções e gráficos matemáticos buscando uma melhor organização e maiores lucros bem como um planejamento de expansão da empresa No decorrer desta unidade você será convidado a desempenhar o papel de dono da empresa e resolver os desafios inerentes à administração dela mas para tanto precisará relacionar diversas grandezas presentes no dia a dia bem como interpretar números e gráficos Convite ao estudo U1 Função afim e função quadrática 8 Seção 11 Função Diálogo aberto Para gerir melhor sua empresa você deve analisar os custos as receitas e o lucro pois sem lucro a empresa não pode ser mantida O custo da produção dos bonés é contabilizado a partir de diversos gastos como matériaprima mão de obra energia elétrica entre outros Com isso há uma relação direta entre o custo e a quantidade de bonés produzida ou seja quanto mais bonés produzidos maior o custo de produção Além do custo outro item importante na gestão da empresa é a receita que é o valor recebido com a comercialização dos bonés Vamos imaginar que o preço de venda dos bonés seja de R 3000 por unidade Qual a receita obtida com a venda de 10 unidades Com um cálculo simples podemos notar que a receita é de R 30000 10 R 3000 R 30000 Mas e se quiséssemos escrever isso em uma planilha de modo que em uma coluna tivéssemos a quantidade vendida e em outra a receita correspondente como podemos agilizar esse cálculo para diversas quantidades comercializadas Pense um pouco Por fim o lucro é a diferença entre a receita e o custo de produção Vamos supor que a partir de balanços financeiros de anos anteriores chegouse à conclusão de que mensalmente o custo com a produção é composto por um custo fixo de R 900000 mais um custo variável de R 2000 por boné Nesse caso com a produção e venda de 750 bonés em um mês temse lucro ou prejuízo E se forem produzidos e comercializados 1200 bonés Para responder a essas e outras perguntas você deve empregar conceitos de funções Vamos lá FontehttpscommonswikimediaorgwikiFilePonteJKBrasC3ADliajpg Acesso em 19 out 2015 Figura 11 Ponte Juscelino Kubitschek em Brasília U1 Função afi m e função quadrática 9 Conjuntos Para compreender a ideia de função primeiramente é necessário relembrar alguns conceitos geralmente trabalhados no ensino médio entre eles conjunto elemento e pertinência Para uma melhor compreensão observe os seguintes exemplos Conjunto das vogais A a e i o u Conjunto dos planetas do sistema solar B Mercúrio Vênus Terra Netuno Conjunto dos meses do ano C janeiro fevereiro dezembro Não pode faltar Lembrese e 271828 r 314159 No primeiro exemplo A é o símbolo utilizado para representar o conjunto das vogais cada vogal é um elemento do conjunto Podemos dizer inclusive que a vogal u pertence ao conjunto A afirmação que pode ser expressa sinteticamente por lê se u pertence a A A consoante m não pertence ao conjunto A e escrevemos lêse m não pertence a A Os exemplos mais conhecidos de conjuntos são Números naturais N 1 2 3 4 5 6 99 100 101 Números inteiros Z 7 6 1 0 1 2 5 6 7 Números inteiros sem o zero 7 6 1 1 2 5 6 7 Números racionais a a d Z e b d Z Q b lêse Q é o conjunto dos números a b tais que a pertence a z e b pertence a z Números reais 50 37 e π 2 1 2 0 1 2 1 10 9 2 π 4 7π U1 Função afi m e função quadrática 10 Números irracionais I xx d R e x d Q lêse I é o conjunto dos números x tais que x pertence a R e x não pertence a Q Em relação aos conjuntos numéricos temos as seguintes inclusões Figura 12 lêse N está contido em Figura 12 Conjuntos numéricos Fonte O autor 2015 Ainda sobre esses conjuntos numéricos nenhum elemento de Q pertence a I e nenhum elemento de I pertence a Q ou seja na interseção desses dois conjuntos não há elementos e indicamos isso por Q I Q em que Q é o conjunto vazio Por fim ao reunir os dois conjuntos Q e I obtemos o conjunto dos números reais ou seja Q U I R ambos são subconjuntos de R Pesquise mais Para mais detalhes sobre a teoria de conjuntos acesse o link disponível em httpwwwuelbrprojetosmatessencialmedioconjuntosconjunto htm Acesso em 20 out 2015 Elaborado pelo professor Ulysses Sodré da Universidade Estadual de Londrina esse site possui alguns dos fundamentos da teoria de conjuntos notações mais utilizadas e exemplos numéricos com linguagem bastante acessível Vale a pena conferir Produto cartesiano Outro conceito importante para o entendimento de uma função é o de produto cartesiano Assimile Dados dois conjuntos A e B o produto cartesiano de A por B é o conjunto dos pares ordenados ab tais que a A e b B AxB ab aA e bB Produto cartesiano de A por B U1 Função afim e função quadrática 11 Veja um exemplo numérico de produto cartesiano Exemplificando Considerando os conjuntos A 023 e B 2037 escreva o produto cartesiano de A por B Resolução A x B ab a A e b B Para a 0 temos 0 2 00 03 07 Para a 2 temos 2 2 20 23 27 Para a 3 temos 3 2 3 0 33 37 Logo Relação Outro conceito muito importante para o entendimento de uma função é o de relação Assimile Dados dois conjuntos A e B uma relação R de A em B é qualquer subconjunto de A x B ou seja Exemplificando Considere os conjuntos A 023 e B 2 0 3 7 e escreva os elementos da relação R descrita pela equação yx22x em que x A e y B Resolução Para facilitar os cálculos dos elementos de R vamos utilizar um quadro como a seguir Elementos de A Elementos de B Elementos de R x yx22x xy 0 yx2 2x02 200 00 2 yx2 2x22 220 20 3 yx2 2x32 233 33 U1 Função afi m e função quadrática 12 Portanto R 00 20 33 Compare os elementos de R com os de A B e veja que Fonte O autor 2015 Na relação R 00 20 33 dizemos que o valor 0 A está associado ao valor 0 B 2 A está associado ao valor 0 B 3 A está associado ao valor 3 B Plano cartesiano Uma relação R pode ser visualizada graficamente em um diagrama denominado plano cartesiano Veja por exemplo a representação gráfica da relação R 00 20 33 no plano cartesiano da Figura 13 Figura 13 Representação gráfica Observe que a representação de R corresponde a três pontos no plano Em relação ao ponto p 20 o par ordenado 20 corresponde a suas coordenadas O primeiro valor 2 é denominado abscissa de P e o segundo 0 a ordenada O valor x 2 corresponde à distância a que o ponto P se encontra do eixo vertical eixo y ou eixo das ordenadas e o valor y 0 à distância a que o ponto se encontra do eixo horizontal eixo x ou eixo das abscissas O ponto de coordenadas 00 é denominado origem Em um plano cartesiano as abscissas são positivas se estiverem à direita da origem negativas se estiverem à esquerda da origem ordenadas são positivas se estiverem acima da origem negativas se estiverem abaixo da origem U1 Função afi m e função quadrática 13 Pesquise mais Veja mais detalhes sobre a construção de um plano cartesiano e a localização de pontos a partir de suas coordenadas no link disponível em httpsptkhanacademyorgmathalgebraintroductiontoalgebra overviewhistalgvdescartesandcartesiancoordinates Acesso em 22 out 2015 Função A partir dos conceitos aprendidos até agora podemos definir função Assimile Dados dois conjuntos A e B uma função f de A em B denotada é uma relação tal que para cada está associado um único O conjunto A é o domínio de f denotado por Df e o conjunto B é o contradomínio de f denotado por CDf Convencionase utilizar o símbolo x para representar um elemento qualquer de A e y para representar um elemento qualquer de B Além disso se x está relacionado a y por meio da função f escrevemos yfx para simbolizar essa associação e o par ordenado correspondente será xy ou xfx Imf yByfx e xA é denominado conjunto imagem de f Além disso se yfx então y é a imagem de x obtida por meio de f Para compreender melhor considere as relações R 00 20 33 e S 00 20 33 23 de A 023 em B2037 Temos que R é uma função e S não é uma função pois o valor 2A está associado por meio de S a dois elementos de B a saber 0 e 3 Essa constatação pode ser feita mais facilmente por meio de um diagrama de Venn como os apresentados na Figura 14 Figura 14 Diagrama de Venn a da relação R b da relação S a b Fonte O autor 2015 U1 Função afim e função quadrática 14 Observe que no caso da relação S há duas setas partindo do número 2A uma relacionandoo a 0 e outra relacionandoo a 3 e isso não se encaixa na definição de função Exemplificando Considerando os conjuntos A2 1 0 1 3 e B 012439 e e a função f AB de modo que y f x x2 identifique o domínio contradomínio e a imagem de f Resolução Como visto anteriormente A é o domínio de f e B é o contradomínio logo Df A 2 1013 CDf B 012439 Para escrevermos o conjunto imagem precisamos determinar os elementos xy pertencentes à relação vide quadro ao lado Logo Imf 0149 x y x2 xy 2 y 22 4 24 1 y 12 1 11 0 y 02 0 00 1 y 12 1 11 3 y 32 9 39 Faça você mesmo Represente graficamente e elabore um diagrama de Venn para a relação com A2 1013 B 012439 e y f x x2 Lei de formação e gráfico de uma função No exemplo anterior y f x x2 é o que denominamos lei de formação ou regra de associação da função f AB Em alguns problemas conhecemos a lei de formação da função e em outros não Quando não a conhecemos em alguns casos é possível determinála a partir de informações do problema Veja um exemplo considere que em determinado posto de combustíveis o preço do etanol seja de R 240 o litro Qual é a lei de formação da função que relaciona a quantidade de etanol abastecida x e o valor a pagar vx U1 Função afi m e função quadrática 15 Fonte O autor 2015 Figura 15 Representação gráfica de v 240x A B A primeira investigação da lei de formação pode ser feita por meio da Tabela 11 Observe que para encontrarmos o valor a ser pago por determinada quantidade de combustível multiplicamos essa quantidade pelo preço de um litro Logo ao adquirirmos x litros de etanol devemos pagar 240x reais Portanto a função v AB em que A é o conjunto das quantidades de etanol e B é o conjunto dos possíveis preços possui lei de formação vx 240x Os dados apresentados na Tabela 11 com o acréscimo de alguns valores podem ser representados de forma gráfica como na Figura 15 a Observe que todos os pontos estão alinhados e se utilizássemos inúmeros valores intermediários para x ou ainda se considerássemos x R teríamos uma linha reta como na Figura 15 b Para fazer essa constatação de forma mais dinâmica acesse o link disponível em httptubegeogebraorgm1886475 acesso em 23 out 2015 A linha reta da Figura 15 b é o que denominamos gráfico da função v Mais formalmente o gráfico de uma função f AB é o conjunto Gf xy x A y B e y f x U1 Função afi m e função quadrática 16 Exemplificando Uma empresa de táxi cobra pela corrida um valor fixo de R 485 bandeirada mais um valor variável de R 290 por quilômetro rodado Construa a lei de formação da função que retorna o preço fx para uma distância x percorrida Além disso escreva o domínio a imagem e esboce o gráfico de f Calcule também o valor a ser pago por uma corrida de 6 km Resolução A corrida é composta por um valor fixo de R 485 e um valor variável de R 290 por quilômetro rodado matematicamente essas informações podem ser traduzidas da seguinte forma fx 485 290 x em que x é a distância percorrida e fx é o preço Essa é a lei de formação A função f AB é tal que A domínio é o conjunto com todos os valores possíveis e adequados ao problema que pode ser qualquer quantidade maior ou igual a zero ou seja x 0 Logo A x d R x 0 A imagem de f é o conjunto Imf B que possui todos os possíveis preços a serem pagos cujo mínimo é R 485 não há valor máximo Logo Imf x R x 485 Para esboçar o gráfico de f montamos uma tabela com alguns valores de x fx e esboçamos os pares ordenados em um plano cartesiano Figura 16 Distância km Preço R 0 f04852900485 1 f14852901775 2 f248529021065 3 f348529031355 Fonte O autor 2015 Figura 16 Gráfico de f Por fim o valor a ser pago por uma corrida de 6 km é f 6 485 290 6 2225 R 2225 Pesquise mais Para esclarecer possíveis dúvidas leia mais sobre relações funções e seus gráficos em httpwwwuelbrprojetosmatessencialmedio funcoesfuncoeshtm Acesso em 23 out 2015 U1 Função afi m e função quadrática 17 Vamos retomar o problema proposto no início desta seção Um dos questionamentos feitos foi como agilizar os cálculos das receitas para diversas quantidades de bonés comercializados Como fazer isso em uma planilha por exemplo Lembrese de que o preço de venda de cada boné é R 3000 Se nenhum boné for vendido não há receita Se 1 boné for vendido a receita é R 3000 Se 2 bonés forem vendidos a receita é R 6000 Se x bonés forem vendidos a receita é x R3000 R3000 x Portanto a função receita é Rx 30x Esse cálculo pode ser agilizado em uma planilha como na Figura 17 Sem medo de errar Figura 17 Planilha de cálculo da receita de bonés vendidos a R 3000 por unidade a b c a b c a b c a b c Fonte O autor 2015 Observe que na Figura 17 os valores de x estão inseridos na coluna A os valores de yRx são calculados na coluna B sendo cada um U1 Função afim e função quadrática 18 calculado pela função R A sequência a b e c da Figura 17 apenas ilustra como agilizar os cálculos Outro questionamento feito foi em relação ao lucro mas para isso precisamos determinar a função custo traduzindo matematicamente a informação o custo com a produção é composto por um custo fixo de R 900000 mais um custo variável de R 2000 por boné Observe que esse problema é semelhante ao exemplo da corrida de táxi trabalhado nesta seção Por analogia podemos escrever a função custo da seguinte forma Cx 9000 20 x em que x é a quantidade de bonés produzida Como o lucroprejuízo é a diferença entre a receita e o custo podemos analisar o lucroprejuízo na produção e venda de 750 ou 1200 bonés em um mês 750 bonés receita custo lucro receita custo 22500 24000 1500 1200 bonés Rx 30 x R1200 30 1200 36000 receita Cx 9000 20 x C 1200 900020 1200 33000 custo lucro receita custo 36000 33000 3000 Portanto ao produzir e vender 750 bonés o prejuízo é de R 150000 no caso de 1200 bonés o lucro é de R 300000 Pesquise mais Veja mais detalhes de como utilizar funções e agilizar cálculos no Excel nos links a seguir Visão geral de fórmulas no Excel Disponível em httpssupportoffice comptbrarticleVisC3A3ogeraldefC3B3rmulasnoExcel ecfdc708916249e8b993c311f47ca173uiptBRrsptBRadBR Acesso em 26 out 2015 Preencher dados automaticamente nas células da planilha Disponível em httpssupportofficecomptbrarticlePreencherdados automaticamentenascC3A9lulasdaplanilha74e31bddd993 45daaa8235a236c5b5dbomktptBRuiptBRrsptBRadBR Acesso em 26 out 2015 U1 Função afi m e função quadrática 19 Avançando na prática Pratique mais Instrução Desafi amos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas Atualizando preços 1 Competências de Fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio logico e quantitativo 2 Objetivos de aprendizagem Aplicar o conceito de função na atualização de preços 3 Conteúdos relacionados Função Lei de formação de uma função 4 Descrição da SP Em determinado supermercado será realizada uma remarcação de preços para embutir o aumento da energia elétrica no preço de venda Após alguns cálculos foi decidido que cada produto deveria sofrer um aumento de 2 e para agilizar o trabalho os novos preços seriam calculados com a ajuda de uma planilha Veja na Figura 18 alguns preços a serem ajustados Figura 18 Tabela de preços Fonte O autor 2015 Qual função deve ser inserida na célula C2 para que o preço da célula B2 seja reajustado em 2 Qual o preço ajustado de cada produto U1 Função afim e função quadrática 20 5 Resolução da SP Suponha que o preço atual de um produto seja x e que o preço ajustado seja Px O preço atual corresponde a 100 já o preço ajustado 2 corresponde a 102 Logo por regra de três Ao calcular a função Px para determinado preço ela o reajusta em 2 Adaptando a função para a planilha temos que na célula C2 devemos inserir a função 102B2 Para os preços apresentados na Figura 18 temos Item Preço atual Preço ajustado Produto 1 R 2000 P2000 102 2000 2040R 2040 Produto 2 R 2200 P2200 102 2200 2244R 2244 Produto 3 R 1600 P1600 102 1600 1632R 1632 Produto 4 R 1800 P1800 102 1800 1836R 1836 Produto 5 R 2500 P2500 102 2500 2550R 2550 Lembrese Uma regra de três pode ser utilizada quando temos duas grandezas proporcionais sendo que de uma delas conhecemos dois valores e da outra um valor A regra de três é utilizada para determinar o quarto valor Veja um breve resumo sobre esse assunto em httpeducacaoglobo commatematicaassuntomatematicabasicaregradetreshtml Acesso em 27 out 2015 Faça valer a pena 1 Os conjuntos numéricos são de grande importância para a matemática principalmente no estudo das funções Os tipos mais utilizados são números naturais N número inteiros Z números inteiros exceto o zero Z números racionais Q números irracionais I números reais R Sobre os conjuntos numéricos e seus elementos é correto afirmar que U1 Função afim e função quadrática 21 a 1 N b 2 I c d 0Q e 0Z 2 A reunião do conjunto A com o conjunto B é definida como o conjunto C xx d A ou x d B e a simbolizamos por C A U B Sendo A 12346 e B 02458 assinale a alternativa que contém o conjunto A U B a 01234568 b 12346 c 02458 d 013458 e 24 3 O produto cartesiano de A por B é o conjunto dos pares ordenados ab tais que a d A e b d B De acordo com o trecho anterior assinale a alternativa que contém o produto cartesiano de A 125 por B 346 a 314161324262354565 b 131416 c 131416232426535456 d 232426 e 535456 U1 Função afim e função quadrática 22 Seção 12 Função afim Diálogo aberto Você se lembra de que na seção anterior estudou o lucro e a receita da sua fábrica de bonés E que para fazer isso foi necessário relembrar alguns conjuntos numéricos compreender a ideia de produto cartesiano estudar as relações que são subconjuntos dos produtos cartesianos e as funções que são casos específicos de relações além de representar esses conjuntos graficamente no plano cartesiano e no diagrama de Venn Pois bem tudo isso abriu caminho para outras possibilidades Imagine que você precise construir uma apresentação contendo um estudo sobre as finanças da empresa que será usada para convencer seu sócio a aumentar o investimento na fábrica e expandir o negócio Um gráfico mostrando os possíveis lucros com o aumento da produção poderia ser interessante e deixálo empolgado Além disso você poderia incrementar a apresentação com informações detalhadas sobre os lucros ou prejuízos e mostrar a ele que você entende do assunto Quanto mais informação maior o poder de convencimento concorda Pense um pouco Será possível determinar uma função que relacione a quantidade produzida e comercializada com o lucro Será que independentemente da quantidade produzida e comercializada há lucro ou para determinadas quantidades há prejuízo A partir de que quantidade há lucro Se aumentarmos a produção em 200 bonés ao mês nos próximos três meses indo dos atuais 600 para 1200 quanto lucro teremos no trimestre Essas são algumas das perguntas cujas respostas poderiam estar em sua apresentação Entretanto para realizar tudo isso temos que estudar mais a fundo as funções e mais especificamente a função afim e suas propriedades Vamos lá Não pode faltar A função afim é um tipo específico de função polinomial e por este motivo é também denominada função do 1 grau ou ainda função polinomial de grau 1 Mais rigorosamente definimos U1 Função afim e função quadrática 23 Assimile Uma função afim é uma função fRR cuja lei de formação é fx ax b em que a d R não nulo é denominado coeficiente angular e b d R é denominado coeficiente linear O domínio e contradomínio de uma função afim podem ser intervalos de números reais Pesquise mais Saiba mais sobre intervalos de números reais acessando o site disponível em httpwwwcasadascienciasorgdmdocumentsintervalo1011 pdf Acesso em 2 nov 2015 Uma característica interessante da função afim é a forma do seu gráfico que é uma reta IEZZI et al 1977 p 96A Veja um exemplo Exemplificando Dada a função afim fx 2x 1 escreva os pares ordenados xy tais que x d A 21012f Df e y fx Em seguida esboce o gráfico de f Resolução Para escrever os pares ordenados solicitados podemos fazer uso do quadro a seguir Para esboçar o gráfico da função primeiramente marcamos os pontos determinados no quadro e depois traçamos uma reta passando por eles como mostra a Figura 19 Para uma visualização mais dinâmica da construção do gráfico dessa função acesse httptubegeogebraorgm1980917 Acesso em 4 nov 2015 Fonte O autor 2015 Figura 19 Gráfico de fx 2x 1 x yfx 2x 1 xy 2 y f2 2 2 1 3 2 3 1 y f1 21 1 1 1 1 0 y f0 2 0 1 1 01 1 y f1 2 1 1 3 13 2 y f2 2 2 1 5 25 U1 Função afim e função quadrática 24 Da geometria sabese que para determinar uma reta bastam dois pontos Logo para esboçar o gráfico do exemplo anterior e o de qualquer função afim basta determinarmos dois pares ordenados e não mais que isso Faça você mesmo 1 Esboce o gráfico da função fx 3x 2 Assim como podemos esboçar o gráfico de uma função afim a partir de sua lei de formação também é possível determinar sua lei de formação a partir de seu gráfico Para executar essa tarefa é necessário determinar a e b de modo que a função fx ax b possua o gráfico desejado Veja um exemplo Exemplificando Com base no gráfico da função afim f representado na Figura 110 determine sua lei de formação Resolução O primeiro detalhe importante a ser observado é que a função é afim ou seja seu gráfico é uma reta e sua lei de formação é fx ax b Para determinar os valores de a e b em que o gráfico dessa função passe pelos pontos destacados na Figura 110 podemos escolher dois pontos quaisquer escolheremos os pontos de coordenadas 11 e 13 Lembrese de que o gráfico de uma função é formado pelos pontos xy em que y fx e x d Df Para o ponto de coordenadas 11 temos fx ax b f1 a1 b 1 a b 13 temos fx ax b f 1 a 1 b 3 a b Observe que temos duas equações lineares com duas incógnitas ou seja um sistema linear Neste caso podemos simplificar o sistema somando as duas equações como segue U1 Função afim e função quadrática 25 Fonte O autor 2015 Figura 110 Gráfico de f Como b 1 temos a b 1 a 1 1 a 11 2 Portanto a função procurada é fx 2x 1 Faça você mesmo 2 Determine a lei de formação da função afim cujo gráfico passa pelos pontos 28 e 24 Função afim crescente e função afim decrescente Uma característica interessante de ser observada em uma função afim é se ela é crescente ou decrescente Como essa característica é estudada para qualquer função podemos compreendêla de modo geral e depois ver como ela se aplica à função afim De acordo com Thomas Weir e Hass 2012 p 6 Assimile Seja f uma função definida em um intervalo I e sejam x1 e x2 dois pontos em I 1 Se fx2 fx1 sempre que x1x2 então f é crescente em I 2 Se fx2 fx1 sempre que x1x2 então f é decrescente em I Essa definição pode ser facilmente visualizada na Figura 111 No caso fx é crescente e gx é decrescente em I Decorre da definição anterior que dado x1x2 a função fx é crescente pois U1 Função afi m e função quadrática 26 gx é decrescente pois Fonte O autor 2015 Figura 111 Função crescente e função decrescente Simplificadamente fx é crescente porque seus valores aumentam com o aumento dos valores de x e gx é decrescente porque seus valores diminuem conforme os valores de x aumentam Observe as inclinações das funções fx e gx Podemos denotar Δy f x2 fx1 ou Δy gx2 gx1 variação de y e Δx x2 x1 variação de x e utilizar a razão Δy Δx para avaliar se a função é crescente ou decrescente Uma grande vantagem de utilizar a razão Δy Δx é que ela está diretamente relacionada à lei de formação da função afim sendo inclusive muito utilizada para determinar a lei de formação a partir do gráfico Mais precisamente dada uma função afim fx ax b em relação aos seus coeficientes temos Assimile a Δy Δx se a 0 a função é crescente e se a 0 a função é decrescente f 0 a 0 b b Você pode encontrar a demonstração da igualdade a 3y 3x disponível em httpwwwprofessoresuffbrhjbortol disciplinas20101gma00116aulasgma00116aula124upcolor pdf Acesso em 6 nov 2015 U1 Função afim e função quadrática 27 Exemplificando Sabendo que os pontos de coordenadas 13 e 25 pertencem ao gráfico de uma função afim qual é a lei de formação dessa função Resolução Primeiramente calculamos as diferenças Δy e Δx e o coeficiente a ΔyΔx Δy fx2 fx1 5 3 2 Δx x2 x1 2 1 1 a Δy Δx 21 2 Substituindo fx 2x b e além disso f 1 3 2 1 b 3 2 b 3 b 1 Portanto a lei de formação da função é f x 2x 1 Faça você mesmo 3 Volte ao exemplo da Figura 110 e determine a lei de formação da função f utilizando as igualdades a Δy Δx e b f0 Ângulo associado a uma função afim A toda função afim podemos associar um ângulo q que está diretamente relacionado ao seu gráfico Esse ângulo pode ser medido a partir da horizontal no sentido antihorário como ilustra a Figura 112 Fonte O autor 2015 Figura 112 Ângulo relacionado a uma função afim Dica Para visualizar a localização desse ângulo de forma mais dinâmica acesse httptubegeogebraorgm1995699 Acesso em 06 nov 2015 Quando o gráfico é de uma função afim há apenas duas possibilidades para o ângulo q formado com a horizontal 0o q 90o a exemplo U1 Função afi m e função quadrática 28 do ângulo α da Figura 112 ou 90o q 180o a exemplo do ângulo β da Figura 112 Se q 0o ou seja se o gráfico for horizontal a função é denominada constante e sua lei de formação é fx b em que b pertence a R R conjunto dos números reais Se q 90o ou seja se o gráfico for vertical não se trata de uma função mas de uma relação Zero e sinal da função afim Observe na Figura 113 que o gráfico de fx ax b cruza o eixo horizontal eixo x no ponto P É perceptível que a ordenada de P é igual a 0 ou seja y 0 Mas e a abscissa de P qual é seu valor A abscissa de P é o que denominamos zero da função Assimile O zero de uma função fx é o valor x0 tal que fx0 0 Atenção Alguns livros utilizam a denominação raiz no lugar de zero Contudo o mais comum é dizer que funções possuem zeros e equações possuem raízes Para uma função afim se x0 é o seu zero temos Na linguagem matemática para fx crescente temos a quando x0 x ou ainda fx fx0 0 fx fx0 0 b quando x x0 ou ainda f x0 f x 0 f x f x0 0 Simplificadamente se fx é crescente e fx0 0 fx 0 para x x0 e fx 0 para x x0 A mesma análise pode ser feita para o caso de fx decrescente e ambos os casos estão ilustrados na Figura 114 De modo mais simples para a região do plano cartesiano em que o gráfico de fx está acima do eixo das abscissas isto é fx tem valores maiores que zero dizse que o sinal da função é positivo E para regiões em que fx 0 dizse que a função tem sinal negativo Fonte O autor 2015 Figura 113 Ponto de interseção com o eixo x U1 Função afi m e função quadrática 29 Figura 114 Sinal da função afim a fx crescente b fx decrescente Fonte O autor 2015 Exemplificando Dada a função fx 5x 10 determine a o zero b os valores de x para os quais fx 0 c os valores de x para os quais fx 0 Resolução Lembrese de que o zero da função é um valor x0 tal que fx0 0 Além disso se a função é crescente fx 0 para x x0 e fx 0 para x x0 Aplicando estes conceitos temos a f x0 0 5x0 10 0 5x0 10 x0 105 2 Logo 2 é o zero de fx b Como a função é crescente pois a 5 0 fx 0 para todos os valores x x0 2 c fx 0 para todos os valores x x0 2 Dica Esboce o gráfico da função e verifique as respostas graficamente Pesquise mais Veja mais sobre funções e em especial funções afim emhttp cejarjcecierjedubrmaterialimpressomatematicacejamatematica unidade6pdf Acesso em 10 nov 2015 E acesse também este link httpcejarjcecierjedubrmaterialimpressomatematicaceja matematicaunidade9pdf Acesso em 10 nov 2015 U1 Função afim e função quadrática 30 Vamos retomar o problema proposto no início desta seção imaginese como o dono da fábrica de bonés e suponha que você deva convencer seu sócio a expandir o negócio Para isso você deve fazer uma apresentação contendo a Um gráfico com os lucrosprejuízos para cada quantidade produzida b Determinar intervalos de produção para os quais há lucro ou prejuízo c O lucro do trimestre com o aumento da produção dos atuais 600 bonés para 1200 bonés ao mês com acréscimo de produção de 200 bonés mensais Primeiramente para esboçar um gráfico com o lucroprejuízo é necessário construir a função lucro Lx Rx Cx ou seja a diferença entre a receita e o custo de produção Sem medo de errar Lembrese Na seção anterior Seção 11 você estudou que a função receita era Rx 30 x e a função custo Cx 9000 20 x em que x é a quantidade de bonés Logo dado Rx 30 x e Cx 9000 20x a função lucro é Lx 30 x 9000 20 x 10x 9000 Podemos construir uma tabela com alguns valores de x e os respectivos lucrosprejuízos para esboçar o gráfico como na Figura 115 Com isso resolvemos o item a Fonte O autor 2015 Figura 115 Gráfico de Lx 10x 9000 U1 Função afim e função quadrática 31 Foi traçada uma linha junto ao gráfico de Lx para melhorar a visualização Entretanto o correto nesse caso seriam somente pontos isolados pois só faz sentido para essa função a atribuição de valores inteiros para x pois se trata da quantidade de bonés produzida Observe que o gráfico de Lx cruza o eixo x no ponto de coordenadas x00 em que x0 é o zero da função Para este problema o zero da função indica a quantidade produzida para a qual não há lucro nem prejuízo Para quantidades maiores que x0 há lucro e para quantidades menores prejuízo Para determinar x0 resolvemos a equação Lx0 0 como segue Lx0 0 10x0 9000 0 10x0 9000 x0 900010 900 Portanto ao produzir 900 bonés o lucro é zero ao produzir menos de 900 há prejuízo e ao produzir mais há lucro ficando resolvido o item b Para chegar a 1200 bonés ao mês a produção deve aumentar 200 bonés por mês nos próximos três meses sendo produzidos um total de 800 bonés no primeiro mês 1000 bonés no segundo mês 1200 bonés no terceiro mês Logo o lucro no trimestre será dado pela expressão L800 L1000 L1200 Temos L800 L1000 L1200 10 800 9000 10 1000 9000 10 1200 9000 1000 1000 3000 3000 Portanto respondendo o item c haverá um lucro de R 300000 no trimestre Dica Pense no fato de um dia você estar em uma empresa e ter de convencer alguém a concordar com suas ideias Uma demonstração com embasamento matemático como a apresentada não seria muito mais convincente Pense em como mostrar suas ideias na forma de uma apresentação com dados tabelas e gráficos Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as ativi dades e depois as compare com as de seus colegas U1 Função afim e função quadrática 32 Melhor Negócio 1 Competências de fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio logico e quantitativo 2 Objetivos de aprendizagem Determinar uma função cuja análise de sinal resolva o problema proposto 3 Conteúdos relacionados Sinal da função afim 4 Descrição da SP Uma empresa de aluguel de veículos possui duas opções de locação 1ª R 9000 a diária livre de quilometragem 2ª R 4000 a diária mais R 050 por quilômetro rodado Um cliente vai até essa empresa para saber as seguintes informações a Para quais distâncias é mais vantajosa a 1ª opção E a 2ª opção b Para qual distância percorrida no dia ambas as opções geram o mesmo custo Imagine que você seja o funcionário dessa empresa Como orientar o cliente 5 Resolução da SP Perceba que há uma semelhança entre esse problema e o da fábrica de bonés A primeira pergunta que você deve se fazer é quais funções relacionam a distância percorrida e o preço a pagar para ambas as opções de locação Vamos denotar por f e g as funções para a 1ª e 2ª opções respectivamente e por x a distância percorrida Temos fx 9000 função constante pois independe da quilometragem gx 4000 050x custo fixo de R 4000 mais custo variável de R 050 Agora considere a função diferença dx fx gx 9000 4000 050x 050x 5000 Se para dado x a diferença for negativa é mais vantajosa a 1ª opção pois dx 0 fx gx 0 fx gx positiva é mais vantajosa a 2ª opção pois dx 0 fx gx 0 fx gx nula ou seja igual a zero ambas as opções geram o mesmo custo pois dx 0 fx gx 0 fx gx Sendo x0 o zero de dx temos dx0 0 050x0 5000 0 050x0 5000 Portanto para 100 quilômetros percorridos no dia o custo é o mesmo em ambas as opções ficando respondido o item b Como o coeficiente angular de dx é a 050 0 a função é decrescente e como consequência positiva à esquerda de x0 100 e negativa à direita desse mesmo valor Podemos concluir a partir disso que para distâncias menores que 100 quilômetros xx0 100 é mais vantajosa a 2ª opção e para distâncias maiores xx0 100 é mais vantajosa a 1ª opção ficando respondido o item a Essa conclusão pode ser observada na Figura 116 U1 Função afim e função quadrática 33 5 Resolução da SP Fonte O autor 2015 Figura 116 Gráfico de dx 050x 5000 Faça valer a pena 1 Estimouse que em 22 dias foram desperdiçados 572 litros de água por uma torneira pingando A partir dessa estimativa pode ser desejado saber o quanto é desperdiçado em 4 dias em 37 dias ou em x dias Pensando nisso assinale a alternativa que relaciona a quantidade de dias x e o volume de água Vx desperdiçado por essa torneira a Vx 4x b Vx 22x c Vx 26x 2 Lembrese de que função afim é aquela cuja lei de formação é fx ax b em que a e b são os coeficientes Sendo o coeficiente linear igual a 2 o coeficiente angular igual a 1 e dado x 4 assinale a alternativa que contém as coordenadas de um ponto pertencente ao gráfico de f a 43 b 43 c 41 3 O preço de uma corrida de táxi é composto pelo valor da bandeirada R 500 mais um valor variável que depende da distância percorrida R 300 km Considerando essas informações e que por determinada corrida foram pagos R 2900 qual foi a distância percorrida a 5 km b 8 km c 9 km d Vx 34x e Vx 37x d 42 e 40 d 10 km e 12 km U1 Função afi m e função quadrática 34 Seção 13 Função quadrática Diálogo aberto Lembrase que na aula anterior você precisava convencer seu sócio a aumentar o investimento na fábrica de bonés e ampliar os negócios Pois é o resultado foi melhor que o esperado Vocês saíram do prejuízo de quando produziam 600 bonés ao mês e começaram a ganhar dinheiro ao produzir 1200 Seu sócio ficou tão feliz que vocês aumentaram ainda mais a produção chegando a 2400 bonés por mês Com uma boa margem de lucro agora é seu sócio quem quer convencêlo a ampliar o negócio ainda mais aumentando o espaço físico indo dos atuais 300 m² como mostra a Figura 117 para 750 m² futuramente Devido aos equipamentos que estão instalados e o terreno onde o galpão se encontra o plano é aumentar tanto o comprimento quanto a largura em um valor x ainda desconhecido conforme Figura 118 Como seu sócio não entende tanto do assunto pediu para que você determinasse a medida x que deve ser acrescida e o custo desse investimento uma vez que se estima o valor de R 72585 por metro quadrado a ser construído Aqui vão algumas dicas para resolver este problema você precisa estudar um novo tipo de função a quadrática Além disso para facilitar todo o processo você pode se focar em responder as seguintes perguntas Fonte O autor Figura 117 Galpão Figura 118 Esboço do projeto Fonte O autor U1 Função afi m e função quadrática 35 a Que função relaciona a medida x e a área total do galpão incluindo a atual E qual função relaciona x com o valor do investimento Quais os gráficos dessas funções b Qual medida x proporcionará uma área total de 750 m² Bons estudos e sucesso neste planejamento As funções quadráticas são uma classe de funções muito utilizadas em problemas de cálculo de área em cálculos de erro no estudo do movimento de projéteis entre outros Assim como a função afim essa também é uma função polinomial mas de grau 2 motivo pelo qual é conhecida popularmente como de 2 grau Segundo Iezzi et al 1977 p 123 Não pode faltar Assimile Uma aplicação ou relação f de R em R recebe o nome de função quadrática ou do 2º grau quando associa a cada o elemento ax2 bx c d R em que a 0 Alternativamente podemos dizer que uma função quadrática é aquela cuja lei de formação é com a 0 Os valores a b e c são denominados coeficientes e ax2 é o termo dominante Reflita Por que para definir a função quadrática é especificado que a 0 Uma característica importante das funções quadráticas é seu gráfico que apresenta uma curva plana denominada parábola SODRÉ 2010 p 1 Para definir uma parábola são necessários dois objetos uma reta diretriz e um ponto que chamamos de foco conforme Figura 119 Não abordaremos aspectos formais da construção de uma parábola mas você pode se aprofundar neste assunto acessando httpmathworld wolframcomParabolahtml Acesso em 14 nov 2015 Para compreender melhor o gráfico de uma função quadrática veja o exemplo a seguir Fonte O autor 2015 Figura 119 Parábola U1 Função afi m e função quadrática 36 Exemplificando Esboce o gráfico da função fx x2 4x 5 Resolução Primeiramente construímos um quadro com alguns valores de x os respectivos y fx e as coordenadas xy Observe x y fx x2 4x 5 xy 3 32 43 5 2 32 4 42 44 5 5 45 5 52 45 5 10 510 x y fx x2 4x 5 xy 1 12 4 1 5 10 1 10 0 02 40 5 5 05 1 12 41 5 2 12 2 22 42 5 1 21 Fonte O autor 2015 Figura 120 Gráfico de fx x2 4x 5 Observando a Figura 120 há alguns elementos importantes o ponto de coordenadas 21 é o vértice e a linha vertical x 2 é o eixo de simetria da parábola No caso do exemplo anterior dizemos que a parábola tem concavidade para cima e isso é controlado pelo coeficiente do termo dominante ou seja o valor de a Veja a seguir alguns gráficos de funções quadráticas da forma para Figura 121 a e para Figura 121 b Fonte O autor 2015 Figura 121 Gráficos de fx ax2 4x 5 para vários valores de a a a0 b a0 Com base nas coordenadas calculadas marcamos os pontos e traçamos a parábola conforme Figura 120 U1 Função afi m e função quadrática 37 Perceba na Figura 121 que quanto mais próximo de zero está o valor de a mais aberta é a parábola e quanto mais distante mais fechada Além disso Assimile Assimile Se o valor de a é Positivo a 0 a concavidade da parábola é voltada para cima Negativo a 0 a concavidade da parábola é voltada para baixo O coeficiente c é igual à ordenada do ponto de interseção do gráfico de fx ax2 bx c com o eixo y Observe ainda na Figura 121 que em todos os casos o ponto de coordenadas 05 pertence ao gráfico de fx ax2 4x 5 e que isso se deve ao fato de o coeficiente c ser igual a 5 Veja se x 0 temos f0 a02 40 5 5 não importando o valor de a ou b Assim como podemos determinar a lei de formação de uma função afim observando seu gráfico também é possível fazer o mesmo com uma função quadrática Veja um exemplo Exemplificando Determine a lei de formação da função quadrática cujo gráfico é apresentado na Figura 122 Fonte O autor 2015 Figura 122 Gráfico de fx Resolução Observe que o ponto de interseção do gráfico de fx ax2 bx c com o eixo y possui coordenadas 03 Logo c 3 e fx ax2 bx 3 U1 Função afi m e função quadrática 38 Além disso como os pontos de coordenadas 10 e 12 pertencem ao gráfico de fx temos f10a12 b130a b30ab3 f12a12b132ab32ab32ab321 Segue que a e b são tais que Adicionando as equações temos a b a b 3 1 2a 4 a 4 2 2 Com a 2 obtemos a b 32 b 3 b 1 Por fim concluímos que fx 2x2 x 3 Para compreender melhor a relação entre os coeficientes da função quadrática e seu gráfico acesse o objeto disponível no link http tubegeogebraorgm2078515 Acesso em 16 nov 2015 Zeros da função quadrática Lembrese Na seção anterior você aprendeu que denominamos zero da função o valor da abscissa do ponto de interseção do gráfico com o eixo x No caso x0 será um zero de fx se fx0 0 Além disso para uma função afim fx ax b o único zero era x0 ba Observe agora na Figura 122 que o gráfico de fx 2x2 x 3 corta o eixo em dois pontos e não somente em um como na função afim Entretanto nem sempre isso ocorre O gráfico de uma função quadrática pode tocar o eixo das abscissas em dois em um ponto ou até não o tocar como mostra a Figura 123 Fonte O autor 2015 Figura 123 Zeros de uma função quadrática a dois zeros b um zero c nenhum zero U1 Função afim e função quadrática 39 Para obter os zeros de uma função quadrática quando existem utilizamos a fórmula do discriminante popularmente conhecida como Fórmula de Bhaskara Assimile Dada uma função quadrática os valores de x para os quais fx 0 são ou ainda O valor Δ b2 4ac é denominado discriminante ou delta Veja um exemplo de como utilizar a fórmula do discriminante Exemplificando Dada as funções a seguir determine seus zeros caso existam a fx x2 6x 5 b gx 2x2 12x 18 c hx x2 2x 3 Resolução a Para esta função os coeficientes são a 1 b 6 e c 5 Logo o discriminante será Δ b2 4ac 62 4 1 5 36 20 16 Substituindo o valor Δ 16 temos Portanto os zeros de f são x1 5 e x2 1 b No caso da função g os coeficientes são a 2 b 12 e c 18 Assim o discriminante será e U1 Função afim e função quadrática 40 Portanto g possui um único zero e este é x3 c Para a função h os coeficientes são a 1 b 2 e c 3 Com isso segue que Δ b2 4ac 22 4 1 3 4 12 8 e Como 8dR isto é não é um número real a expressão anterior não faz sentido para os números reais e em consequência a função h não possui zeros reais Atenção No exemplo anterior a função fx x2 6x 5 possui discriminante positivo Δ 16 0 e dois zeros Já a função gx 2x2 12x 18 possui discriminante nulo Δ 0 e um único zero Por fim o discriminante da função hx x2 2x 3 é negativo Δ 8 0 e esta não possui zeros reais Esta observação é válida para toda função quadrática e pode ser compreendida geometricamente com a Figura 123 Em a o discriminante é positivo b o discriminante é nulo c o discriminante é negativo Faça você mesmo 1 Determine os zeros e esboce o gráfico das funções a seguir a fx x2 8x 12 b gx x2 6x 12 Pesquise mais Para saber mais sobre as funções quadráticas acesse o material disponível no link httpbitprofmatsbmorgbrxmluibitstream handle123456789465201100355FABIOANTONIOLEAO SOUSApdfsequence1 Acesso em 17 nov 2015 Além disso você pode encontrar uma demonstração simples da fórmula do discriminante em httpwwwufrgsbrespmatdisciplinasfuncoes modelagemmoduloIVfundamentos4fhtm Acesso em 17 nov 2015 Agora que já tratamos de vários detalhes acerca da função quadrática vamos retomar o problema proposto no início desta seção Sem medo de errar U1 Função afi m e função quadrática 41 Uma das perguntas que você deveria responder era qual função relaciona a medida x e a área total do galpão incluindo a atual Para começar a área de um retângulo é obtida multiplicando as medidas de dois lados consecutivos No caso da área atual a medida 300 m² é obtida multiplicando 20 m por 15 m Para calcular a área futura multiplicamos 20 x m por 15 x m Logo a função que relaciona a medida x em metros e a área futura em metros quadrados é Ax 20 x 15 x 20 x 15 20 x x 20 15 x 15 20 x x x x2 35x 300 Você também deveria obter a função que relaciona a medida x com o valor do investimento Para construir determinada área o investimento realizado pode ser calculado multiplicando a área correspondente pelo valor do metro quadrado que é R 72585 Logo a função investimento Ix é obtida multiplicando 72585 valor do metro quadrado pela área que será acrescida Veja Para esboçar os gráficos de Ax e Ix calculamos alguns pares ordenados os marcamos no plano cartesiano e traçamos a parábola como na Figura 124 Figura 124 Área acrescida e investimento a quadro de valores b função Ax c função Ix a x Ax Ix 0 300 000 1 336 2613060 2 374 5371290 3 414 8274690 4 456 11323260 5 500 14517000 b c Fonte O autor 2015 U1 Função afi m e função quadrática 42 Por fim a última informação que você deveria obter é a medida x que proporcionará uma área total de 750 m² Como temos a função área Ax basta igualar Se definirmos fx x2 35x 450 determinar x para o qual Ax 450 é equivalente a calcular o zero de f Logo Observe que f possui dois zeros e portanto há também dois valores de x para os quais Ax 450 Contudo para o problema prático só faz sentido utilizarmos valores positivos pois x é uma medida de comprimento Concluímos deste modo que para a área futura do galpão ser de 750 m² tanto a largura quanto o comprimento devem ser acrescidos em 10 m Faça você mesmo 2 Para x 10 m qual é o valor do investimento na reforma do galpão Avançando na prática Pratique mais Instrução Desafi amos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas Movimento de projéteis 1 Competências de fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcio nar o desenvolvimento do raciocínio logico e quantitativo U1 Função afi m e função quadrática 43 2 Objetivos de aprendizagem Aplicar os conhecimentos sobre função quadrática no estudo do movimento de projéteis 3 Conteúdos rela cionados Função quadrática zero 4 Descrição da SP Determinado projétil é lançado para o alto e para frente descrevendo uma trajetória parabólica A equação que fornece a altura do projétil em função da distância hori zontal x a que ele se encontra do ponto de lançamento é Com base nessas informações que distân cia horizontal o projétil percorrerá até que toque o solo 5 Resolução da SP Vamos primeiramente observar o gráfi co dessa função na Figura 125 Fonte O autor 2015 Figura 125 Gráfico de fx Note que após o lançamento o objeto sobe até certa altu ra e cai novamente até atingir o solo num ponto P sendo a abscissa desse ponto o zero da função Calculando o zero temos O valor de x1corresponde ao ponto de partida e o valor de x2 é a abscissa do ponto P Portanto o projétil percorrerá 30 m até atingir o solo U1 Função afi m e função quadrática 44 Faça valer a pena 1 Um bloco retangular de concreto tem dimensões x 3 x 2 e x conforme Figura 126 A função Ax que fornece a área total da superfície do bloco é a Ax 4x2 4x 12 b Ax 6x2 4x 12 c Ax 6x2 4x 12 d Ax 4x2 4x 12 e Ax 8x2 4x 12 2 Uma caixa de papelão tem suas dimensões representadas na Figura 127 A função Vx que relaciona x com o volume da caixa e o respectivo volume para x 20 cm são a Vx 30x2 180x 1200 e 12400 cm³ b Vx 30x2 160x 1200 e 14400 cm³ c Vx 30x2 180x 1200 e 14400 cm³ d Vx 30x2 160x 1200 e 12400 cm³ e Vx 30x2 180x 1200 e 14400 cm³ Fonte O autor 2015 Figura 126 Bloco Fonte adaptada de httpspixabay comp152428 Acesso em 17 nov 2015 Figura 127 Caixa de papelão 3 Uma revendedora de cosméticos estima que para um preço de x reais são vendidas 5000 2x unidades de certo produto mensalmente Para este produto há um custo de R 1000 por unidade Nestas condições qual é o lucro obtido em um mês em que o preço de venda deste produto era R 1600 a R 2861800 b R 1616800 c R 5000000 d R 2980800 e R 4886100 U1 Função afim e função quadrática 45 Seção 14 Sinal mínimo e máximo da função quadrática Diálogo aberto Na seção anterior você estudou a função quadrática cuja aplicação proporcionou uma solução para o problema da ampliação do galpão da empresa Dos 300 m² que havia de espaço físico passouse para 750 m² com a ampliação sendo acrescidos 10 m tanto no comprimento quanto na largura O galpão atualmente possui 30 m de comprimento por 25 m de largura Você ainda pôde calcular o investimento com a reforma por meio da função I x 72585 x2 2540475 x Para o valor x acrescido nas dimensões do galpão temos I10 72585 102 2540475 10 72585 2540475 3266325 R 32663250 isto é o investimento com a reforma foi de R 32663250 Após todos esses gastos seu sócio quer agora recuperar parte do investimento aumentando o preço de venda dos bonés Atualmente são produzidos e comercializados 2400 bonés por mês vendidos por R 3000 cada Para que tudo ocorra de modo planejado ele se adiantou e fez uma pesquisa junto aos consumidores estimando que para cada x reais acrescidos no preço de cada boné são vendidas 2400 60x unidades por mês Considerando as informações anteriores qual deve ser o preço de cada boné para que a receita seja a maior possível Não pode faltar Máximos e mínimos Você viu na seção anterior alguns elementos da parábola entre eles o vértice como ilustrado na Figura 128 O ponto A é o vértice do gráfico de fx 075x2 45x 375 e o ponto B é o vértice do gráfico de gx 3x2 42x 145 Ambos os gráficos possuem eixo de simetria linha tracejada que passa pelo vértice U1 Função afi m e função quadrática 46 Fonte O autor 2015 Figura 128 Gráficos de f e g O fato de uma parábola ter eixo de simetria significa que o lado direito da curva é o reflexo do lado esquerdo ou seja se desenhássemos uma parábola em um papel e o dobrássemos sobre o eixo de simetria os lados da curva se sobreporiam Observe que o coeficiente do termo dominante de fx 075x2 45x 375 é negativo e que o coeficiente do termo dominante de gx 3x2 42x 145 é positivo Como já abordado na seção anterior isso influencia na concavidade da parábola o gráfico de f tem concavidade para baixo e o gráfico de g tem concavidade para cima Em decorrência disso há algo interessante em relação ao vértice no caso do gráfico de f o vértice A é o ponto mais alto da parábola e no caso do gráfico de g o vértice B é o ponto mais baixo da parábola Isso pode ser observado para toda função quadrática e está de acordo com o exposto a seguir Assimile Assimile Seja fx ax2 bx c uma função quadrática Se a 0 o gráfico tem concavidade voltada para cima e o vértice é seu ponto mais baixo a 0 o gráfico tem concavidade voltada para baixo e o vértice é seu ponto mais alto Uma função fx possui um máximo em xv pertencente a um intervalo I se fxv fx para todo x d I Nesse caso fxv será o maior valor alcançado valor máximo pela função nesse intervalo De modo semelhante uma função fx possui um mínimo em xv pertencente a um intervalo I se fxv fx para todo x d I Nesse caso fxv Essa percepção gráfica em relação à função quadrática auxilia no entendimento de um conceito estudado para qualquer função U1 Função afi m e função quadrática 47 será o menor valor alcançado valor mínimo pela função nesse intervalo Em ambos os casos dizemos que os valores são extremos da função No exemplo da Figura 128 A é um ponto de máximo e B é um ponto de mínimo Para uma função quadrática as coordenadas do vértice são xv yv em que xv é o x do vértice e yv o y do vértice Figura 129 Simetria da parábola Fonte O autor 2015 Como a parábola é simétrica em relação ao seu vértice segue que fxv1 fxv1 como mostra a Figura 129 Com base nessa igualdade temos Da última igualdade segue que Com essa propriedade e as observações anteriores podemos enunciar o seguinte Assimile Dada uma função quadrática fx ax2 bx c o vértice de seu gráfico tem coordenadas b 2a f b 2a Não entraremos em detalhes mas pode ser demonstrado que xv b 2a e yv Δ 4a Reflita Como podemos deduzir yv Δ 4a a partir de xv b2a e fx ax2 bx c U1 Função afim e função quadrática 48 Exemplificando Dada a função quadrática fx 2x2 4x 8 determine as coordenadas do vértice de seu gráfico e se este é um ponto de máximo ou de mínimo Resolução Para esta função temos a 2 b 4 e c 8 Logo Portanto as coordenadas do vértice são 16 Como a 2 0 o gráfico de f possui concavidade voltada para cima o que implica que seu vértice é um ponto de mínimo Nesse caso f1 6 é o menor valor mínimo assumido pela função Sinal da função quadrática Observe na Figura 130 as funções f g h p q r A partir do exposto na seção anterior e analisando os gráficos segue que as funções f e p possuem dois zeros reais cada Δ 0 as funções g e q possuem um único zero cada Δ 0 e as funções h e r não possuem zeros reais Δ 0 A partir de uma análise gráfica podemos ainda afirmar que hx 0 é positiva no intervalo 33 R pois seu gráfico está totalmente acima do eixo x r x 0 é negativa no intervalo 33 R pois seu gráfico está totalmente abaixo do eixo x gx 0 nos intervalos 3x1 e x1 3 em que gx1 0 na Figura 130 x1 7 qx 0 nos intervalos 3x1 e x1 3 em que qx1 0 na Figura 130 x1 7 fx 0 em 3x1 e x2 3 fx 0 em x1 x2 e fx1 fx2 0 na Figura 130 x1 1 e x2 3 px 0 em 3x1 e x2 3 px 0 em x1 x2 e px1 px2 0 na Figura 130 x1 1 e x2 3 U1 Função afi m e função quadrática 49 Figura 130 Funções quadráticas Fonte O autor 2015 Exemplificando Dada a função fx x2 2x 3 faça o estudo dos sinais e determine se f possui um valor máximo ou um mínimo e especifique esse valor Como para esta função a 1 0 a concavidade de seu gráfico é voltada para baixo Em consequência o vértice é o ponto mais alto do gráfico tornandoo um ponto de máximo Além disso como b 2 e c 3 temos Δ b2 4ac 22 4 1 3 4 12 16 Δ 16 0 Como o discriminante é positivo a função possui dois zeros reais além de seu gráfico interceptar o eixo da ordenadas no ponto de coordenadas 03 pois c 3 Com essas informações podemos inferir que o gráfico da função é semelhante ao esboço da Figura 131 Calculando os zeros de f temos Logo fx 0 em 3 1 e 3 3 fx 0 em 1 3 e f1 f3 0 Para determinar o máximo de f precisamos primeiramente do valor de xv Com isso o valor máximo de f será fxv f1 12 2 1 3 1 2 3 4 Fonte O autor 2015 Figura 131 Esboço U1 Função afim e função quadrática 50 Faça você mesmo 1 Dada a função fx x2 6x 5 faça o estudo dos sinais e determine se f possui um valor máximo ou um mínimo e especifique esse valor Pesquise mais Você pode investigar de forma mais dinâmica a relação entre os coeficientes da função quadrática e seu sinal com o objeto disponível no link httpswwwgeogebraorgm171465 Acesso em 24 nov 2015 Além disso para ver mais sobre as funções quadráticas principalmente quanto a máximos e mínimos e ao sinal acesse httpwwwfund198 ufbabraposcnffuncao4pdf Acesso em 24 nov 2015 Sem medo de errar Vamos retomar o problema proposto no início da seção atualmente são produzidos e comercializados 2400 bonés por mês e estes são vendidos por R 3000 cada Além disso seu sócio estimou que para cada x reais acrescidos no preço de cada boné são vendidas 2400 60x unidades por mês Com todas essas informações como calcular o preço de cada boné para que a receita seja a maior possível Vamos interpretar o problema obter a maior receita possível é o mesmo que obter a receita máxima Desse modo se conseguirmos construir uma função receita que modele toda essa dinâmica obter a receita máxima é o mesmo que calcular o valor máximo da função Considere que o preço do boné que atualmente é de R 3000 seja acrescido em x reais O novo preço será Com o boné nessa faixa de preço são vendidas 2400 60x unidades Lembrese de que a função receita é obtida multiplicando a quantidade vendida pelo preço logo U1 Função afim e função quadrática 51 Desenvolvendo os cálculos temos Rx 2400 60x 30 x 2400 60x 30 2400 60x x 72000 1800x 2400x 60x2 Portanto Rx 60x2 600x 72000 Depois de interpretar o problema podemos resolvêlo com o auxílio da função receita para essa função temos a 60 0 e consequentemente essa função possui um valor máximo atingido em xv b2a 600 2 60 600120 5 Esse é o valor que pode ser acrescido no preço atual do boné para alcançar a receita máxima Como o preço atual é R 3000 o novo valor será R 3500 ficando resolvido o problema Faça você mesmo 2 Qual será a receita máxima Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas Área máxima 1 Competências de fundamentos de Área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio logico e quantitativo 2 Objetivos de aprendizagem Utilizar o conceito de máximo e mínimo de uma função na resolução de problemas de otimização 3 Conteúdos relacionados Máximos e mínimos 4 Descrição da SP Uma área retangular será cercada com tela em três lados sendo que no quarto lado será utiliza do um muro já existente conforme Figura 132 U1 Função afi m e função quadrática 52 Se há 40 metros de tela disponível quais serão as dimensões do cercado que possui área máxima Fonte O autor 2015 Figura 132 Área a ser cercada Faça valer a pena 1 Um aspecto muito interessante em relação às funções consiste em seus valores extremos que podem ser mínimos ou máximos Para as funções quadráticas sabemos se um valor extremo será um mínimo ou um máximo apenas observando seus coeficientes Em relação aos valores extremos as funções e possuem respectivamente a máximo mínimo e máximo b mínimo máximo e mínimo c máximo máximo e mínimo d mínimo mínimo e máximo e mínimo máximo e máximo 2 Os gráficos das funções e possuem o mesmo vértice conforme Figura 133 Nesse caso qual é o valor do coeficiente c da função f a 4 b 2 c 1 d 3 e 5 Fonte O autor 2015 Figura 133 Funções f e g U1 Função afim e função quadrática 53 3 Determinado trecho de uma montanharussa tem seu trilho a uma altura fx 01x2 2x 14 com x pertencente ao intervalo 020 em metros Nesse trecho qual é a altura do trilho no seu ponto mais baixo considerando o eixo das abscissas como sendo o solo a 1 m b 2 m c 3 m d 4 m e 5 m U1 Função afim e função quadrática 54 Referências ANTON Howard BIVENS Irl DAVIS Stephen Cálculo 10 ed Porto Alegre Bookman 2014 IEZZI Gelson et al Fundamentos de matemática elementar conjuntos e funções 3 ed São Paulo Atual 1977 LARSON Ron Cálculo aplicado curso rápido 8 ed São Paulo Cengage Learning 2011 ROGAWSKI Jon Cálculo Porto Alegre Bookman 2009 SIMMONS George F Cálculo com geometria analítica São Paulo McGrawHill 1987 SODRÉ Ulysses Funções quadráticas 2010 Disponível em httpwwwuelbr projetosmatessencialsuperiormatzooquadraticapdf Acesso em 14 nov 2015 STEWART James Cálculo 7 ed São Paulo Cengage Learning 2013 1 v THOMAS George B WEIR Maurice D HASS Joel Cálculo 12 ed São Paulo Pearson 2012 U2 Estatística descritiva 55 Unidade 2 Estatística descritiva Você já tomou conhecimento na Unidade 1 de alguns termos utilizados na estatística entre eles a própria palavra estatística que simplificadamente nós poderíamos definir como a ciência que cuida da coleta descrição e interpretação de dados Contudo essa não é a única maneira de se definir estatística Segundo Johnson e Kuby 2013 a palavra estatística possui significados diferentes para pessoas de diferentes áreas e interesses Veja por exemplo a seguinte definição para estatística Convite ao estudo Reflita A estatística moderna é uma tecnologia quantitativa para a ciência experimental e observacional que permite avaliar e estudar as incertezas e os seus efeitos no planejamento e interpretação de experiências e de observações de fenômenos da natureza e da sociedade Raul Yukihiro Matsushita professor assistente do Departamento de Estatística da Universidade de Brasília Sugestão pesquise outras definições para estatística e faça um comparativo Ainda na Unidade 1 citamos a estatística descritiva e a estatística inferencial A primeira mais frequentemente utilizada cuida da coleta análise e sintetização de dados Já a segunda se utiliza dos resultados obtidos pela primeira para realizar a interpretação das informações e posteriormente auxiliar na tomada de decisão Para iniciar seus estudos em estatística descritiva imagine que você é um funcionário de uma grande empresa que U2 Estatística descritiva 56 denominaremos de M e foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários O relatório final dessa pesquisa deverá conter informações pessoais como idade peso altura sexo cor dos olhos raça e também informações sobre a satisfação em relação às condições de trabalho e à remuneração Considere que o prazo estipulado para a realização dessa tarefa seja uma semana Nesse ponto algumas dúvidas devem ter surgido Entre elas podemos mencionar O que exatamente devo pesquisar Como fazer essa pesquisa O tempo será suficiente para pesquisar todos os funcionários Em caso negativo o que fazer Como apresentar os resultados obtidos com a pesquisa No decorrer dessa unidade pouco a pouco algumas dessas perguntas serão respondidas e você poderá ter uma visão geral de todo o processo Ao final esperamos que você Compreenda as principais técnicas de amostragem Interprete informações apresentadas em tabelas e gráficos Entenda as medidas de posição e sua representatividade Compreenda as medidas de dispersão e sua representatividade Atenção Observe que o termo peso foi empregado incorretamente Nesse contexto o correto seria massa O peso é uma grandeza física mais especificamente uma força Apesar disso como esse termo é de uso frequente no dia a dia manteremos o sentido coloquial da palavra peso U2 Estatística descritiva 57 Seção 21 Amostragem Diálogo aberto Para iniciarmos os estudos em estatística vamos retomar a situação proposta anteriormente imagine que você é um funcionário da empresa M e que foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários O relatório final dessa pesquisa deverá conter informações pessoais como idade peso altura sexo cor dos olhos raça e também informações sobre a satisfação em relação às condições de trabalho e à remuneração Considere que o prazo estipulado para a realização dessa tarefa seja uma semana Para que essa tarefa seja executada o primeiro passo é planejar a coleta de dados assunto que será estudado nesta seção de autoestudo Não Pode Faltar Conceitos básicos Antes de iniciar o planejamento da coleta de dados é essencial que você consiga identificar alguns objetos de estudo da estatística tais como população e amostra Uma população é o conjunto de todos os elementos que possuem determinada característica em comum Para o nosso exemplo a população corresponde aos 30 mil funcionários da empresa M Além de pessoas populações podem ser compostas por animais objetos substâncias químicas etc Exemplificando Suponha que se queira analisar o Comportamento das formigas cortadeiras no Brasil Nesse caso a população corresponderia à totalidade das formigas dessa espécie no país Número de peças defeituosas fabricadas por determinada máquina Nesse caso a população corresponderia a todas as peças fabricadas por essa máquina U2 Estatística descritiva 58 A população pode ser finita quando é possível listar fisicamente todos os seus elementos ou infinita quando não há essa possibilidade No caso dos funcionários da empresa M a população é finita pois poderíamos por exemplo solicitar ao departamento de pessoal que fornecesse uma lista com os nomes de todos os funcionários que constam na folha de pagamento Para o exemplo do estudo do comportamento das formigas cortadeiras apesar de haver um número finito dessas formigas podemos considerar essa população como sendo infinita pois esse número é muito grande e jamais conseguiríamos observar todas elas Uma amostra é qualquer subconjunto de uma população Geralmente amostras são finitas e utilizadas quando a população é muito numerosa ou infinita o que dificulta ou até impossibilita a observação de todos os seus elementos Assimile População é o conjunto de todos os elementos que possuem determinada característica em comum Amostra é qualquer subconjunto de uma população Outros objetos de estudo da estatística são o censo e a amostragem Um censo corresponde ao processo de coleta de dados de toda a população enquanto que uma amostragem é o processo de coleta de dados de uma amostra ou seja de apenas parte da população Censos são raramente feitos pois são muito demorados e caros quando comparados a uma amostragem Pesquise mais No Brasil o IBGE Instituto Brasileiro de Geografia e Estatística se encarrega de realizar um censo a cada 10 anos Nele são coletadas diversas informações sobre a população e os domicílios Para mais informações acesse wwwibgegovbr Acesso em 8 jul 2015 Variáveis Quando estudamos uma população estamos interessados em suas v e nos possíveis valores que elas podem assumir Idade peso altura sexo cor dos olhos e raça são exemplos de variáveis U2 Estatística descritiva 59 Veja na Figura 21 algumas informações a respeito do jogador Pelé e mais alguns exemplos de variáveis Fontes 20102015 Graphic Resources LLC Disponível em httpbrfreepikcomfotosgratispele jogadordefutebollendas566595htm e httpesporteuolcombrfutebolbiografias559pele Acesso em 28 abr 2015 Figura 21 Dados pessoais do jogador Pelé em 2015 Nome completo Édson Arantes do Nascimento Posição Meiaatacante Ano de nascimento 1940 Idade anos 74 Nacionalidade Brasileira Local de nascimento Três Corações MG Altura metros 173 Peso kg 75 Formação acadêmica Superior completo Na Figura 21 podemos identificar as variáveis nome posição ano de nascimento idade nacionalidade local de nascimento altura peso e formação acadêmica Além disso Édson Arantes do Nascimento meiaatacante 1940 74 brasileira Três Corações MG 173 75 e superior completo são respectivamente os valores que elas assumem para o jogador Pelé Observe que algumas dessas variáveis retornaram valores numéricos e outras não numéricos Quando uma variável retorna valores numéricos nós a denominamos variável quantitativa Já aquela que retorna valores não numéricos nós a denominamos variável qualitativa Essa diferença é fácil de ser assimilada pois a palavra quantitativa lembra quantidade ou seja números enquanto a palavra qualitativa lembra qualidade isto é atributos As variáveis quantitativas e as qualitativas podem ainda ser subdivididas em dois subgrupos conforme ilustra a Figura 22 Figura 22 Tipos de variáveis Variáveis Quantitativas Qualitativas Discretas Contínuas Ordinais Nominais Fonte Os autores 2015 U2 Estatística descritiva 60 Uma variável quantitativa discreta é aquela que em geral assume valores inteiros ou um número finito de valores bem definidos Na Figura 21 podemos observar duas variáveis com essa característica ano de nascimento e idade Já uma variável quantitativa contínua é aquela que pode assumir qualquer valor inteiro ou não dentro de um intervalo Na Figura 21 podemos observar também duas variáveis com essa característica altura e peso Uma variável qualitativa ordinal é aquela não numérica que apresenta uma ordenação entre seus valores a exemplo da variável formação acadêmica Veja que Pelé possui ensino superior completo Entretanto caso observássemos os valores dessa variável para outras pessoas poderíamos ter como resposta ensino fundamental ou ensino médio por exemplo Uma ordenação natural para nós é que o ensino fundamental antecede o ensino médio que por sua vez antecede o ensino superior Por fim uma variável qualitativa nominal é aquela não numérica que não possui ordenação entre seus valores como nome posição nacionalidade e local de nascimento Assimile Variável quantitativa discreta aquela que em geral assume valores inteiros ou um número finito de valores bem definidos quantitativa contínua aquela que pode assumir qualquer valor inteiro ou não dentro de um intervalo qualitativa ordinal aquela não numérica que apresenta uma ordenação entre seus valores qualitativa nominal aquela não numérica que não possui ordenação entre seus valores Para verificar se você compreendeu as diferenças entre os diversos tipos de variáveis classifique as da Figura 23 em discretas contínuas nominais ou ordinais U2 Estatística descritiva 61 Figura 23 Exemplos de variáveis altura formação acadêmica peso cor dos olhos número de filhos doentesadio fumante não fumante estágio de uma doença inicial intermediário terminal sexo tempo número de bactérias por litro de leite número de cigarros fu mados por dia pressão arterial idade anos mês de observação ja neiro fevereiro dezembro Fonte O autor 2015 Confira sua classificação com a proposta no apêndice da Seção 21 Quando aferimos um valor a partir de uma análise de determinada variável em uma amostra o denominamos estatística Já se o referido valor é obtido a partir de uma análise de uma variável na população como um todo o denominamos parâmetro A média de altura dos funcionários do setor administrativo da empresa M por exemplo corresponde a uma estatística Tal estatística busca estimar a verdadeira média da altura de todos os funcionários da empresa M a qual corresponde a um parâmetro Grande parte das pesquisas é feita a partir de amostras Tais pesquisas obtêm estatísticas que buscam estimar os parâmetros da população Tipos de amostragem Antes de atingirmos o objetivo dessa seção de autoestudo que é o de planejar a coleta de dados precisamos ainda compreender os principais tipos de amostragem A escolha adequada do método é de fundamental importância para a confiabilidade dos dados a serem coletados Um grande desafio de quem está planejando fazer uma pesquisa é saber como coletar uma amostra confiável ou seja como conseguir selecionar na população um subconjunto que seja representativo do todo Observe que essa é uma etapa de grande importância já que pode impactar todo o restante do trabalho U2 Estatística descritiva 62 Uma coleta mal planejada pode provocar impressões erradas acerca da população fornecendo valores que não a representam A distorção de uma estatística em comparação com um parâmetro populacional é denominada viés Você poderá notar um exemplo clássico de amostragens enviesadas na época das eleições Vários candidatos apresentam resultados de pesquisas de intenção de voto sendo que cada uma tem um resultado diferente Fique atento Na literatura sobre o assunto são diversos os métodos de amostragem Dentre eles os mais conhecidos são Amostragem de conveniência Amostragem voluntária Amostragem aleatória simples Amostragem sistemática Amostragem aleatória estratificada Amostragem por conglomerado Uma amostragem por conveniência geralmente ocorre quando o indivíduo seleciona na população elementos que considera pertinentes os quais imagina serem representativos do todo Essa conduta estatisticamente falha muitas vezes é a causadora de resultados muito divergentes dos verdadeiros parâmetros da população Vide exemplo das pesquisas eleitorais Na amostragem voluntária a amostra é obtida por seleção de voluntários Frequentemente vemos esse tipo de pesquisa sendo feita pela internet ou por telefone Pense um pouco você já respondeu a alguma enquete realizada por esses canais Foi sincero na resposta dada à enquete Se suas respostas foram sim e não você acaba de perceber a origem de um dos problemas desse tipo de amostragem a saber o nível de confiança nos dados coletados Geralmente as pessoas não estão dispostas a responder a pesquisas Portanto quando estas são feitas com voluntários os resultados obtidos devem ser tratados com muito cuidado Pode parecer então que esse tipo de amostragem não deve nunca ser empregado contudo em muitos casos essa é a única opção Imagine que uma empresa farmacêutica queira testar um novo fármaco destinado à prevenção e ao tratamento do HIV Você concordaria em fazer parte da pesquisa considerando que não A amostragem aleatória simples é aquela realizada por meio de sorteio Esse tipo de amostragem tem a vantagem em relação às anteriores de garantir que todos os elementos da população tenham a mesma probabilidade de pertencer à amostra Para realizar uma amostragem desse tipo também se pode utilizar uma tabela de números aleatórios como a apresentada na página 146 do arquivo disponível em httpwwwestufprbrce003materialapostilace003pdf Acesso em 29 abr 2015 Para obter orientações de como utilizar uma tabela de números aleatórios assista ao vídeo disponível em httpswwwyoutubecomwatchvUgxLkkXuRQ Outra maneira de realizar uma amostragem aleatória simples é por meio de uma planilha eletrônica Leia um pequeno tutorial de como gerar números aleatórios em planilhas no link httpdicadeseexcelcombr20090526comogerarnumerosaleatorios Há ainda a possibilidade de utilizar uma calculadora científica Para outras orientações de como gerar números aleatórios em uma calculadora assista a um vídeo sobre o assunto em httpswwwyoutubecomwatchv2fW92PRPwfQ Acesso em 29 abr 2015 Uma amostra sistemática pode ser feita facilmente quando há uma ordenação natural dos elementos da população como a ordem alfabética ou a sequência de casas em uma rua Para retirar uma amostra sistemática de tamanho n de uma população com N elementos ordenados de 1 até N seguimos os seguintes passos 1 Dividimos a população em n subgrupos de tamanho k Nn 2 No primeiro grupo realizamos um sorteio amostragem aleatória simples para determinar o primeiro elemento pertencente à amostra Suponha que ele esteja na posição p k 3 A partir do sorteio do passo anterior os demais n 1 elementos pertencentes à amostra ficam determinados Serão aqueles que estiverem nas posições p k p 2k p 3k p n 1k U2 Estatística descritiva 64 Exemplificando Considere uma população de 20 alunos da disciplina de Métodos Quantitativos os quais estão listados a seguir em ordem alfabética 1 Alice 8 Isabella 15 Matheus 2 Arthur 9 Júlia 16 Miguel 3 Bernardo 10 Laura 17 Pedro 4 Davi 11 Lucas 18 Rafael 5 Gabriel 12 Luíza 19 Sophia 6 Giovanna 13 Manuela 20 Valentina 7 Heitor 14 Maria Selecione uma amostra sistemática de tamanho 4 dessa população Resolução Observe que essa população tem tamanho N 20 e a amostra solicitada tem tamanho n 4 Portanto devemos dividir a população em 4 subgrupos de tamanho k 204 5 como segue 1 Alice 6 Giovanna 11 Lucas 16 Miguel 2 Arthur 7 Heitor 12 Luíza 17 Pedro 3 Bernardo 8 Isabella 13 Manuela 18 Rafael 4 Davi 9 Júlia 14 Maria 19 Sophia 5 Gabriel 10 Laura 15 Matheus 20 Valentina Nessa etapa é necessário que façamos um sorteio no primeiro grupo para determinar o primeiro a pertencer à amostra Suponha que o sorteado tenha sido o número p 2 ou seja Arthur Desse modo os próximos a pertencerem à amostra serão p k 2 5 7 Heitor p 2k 2 2 5 12 Luíza p 3k 2 3 5 17 Pedro A amostragem aleatória estratificada difere das anteriores principalmente por envolver mais de uma etapa Esse tipo de amostragem é utilizado geralmente nos casos em que a população possui subgrupos com características próprias que podem ser pertinentes à pesquisa Imagine que se queira pesquisar o gênero U2 Estatística descritiva 65 musical preferido de uma população Convém supor que a preferência possa ser diferente de acordo com a idade da pessoa pois em épocas diferentes as tendências musicais são outras e considerar toda a população como um grupo homogêneo pode ser um erro para a coleta de dados Desse modo talvez seja prudente dividir a população em vários grupos por faixa etária por exemplo de 0 a 9 anos de 10 a 19 anos de 20 a 40 anos e mais de 40 anos Atenção essa é apenas uma sugestão Para determinar quais subdivisões da população devemos considerar é necessário um estudo mais aprofundado Cada subgrupo considerado na amostragem aleatória estratificada recebe o nome de estrato A definição desses estratos primeira etapa da amostragem é feita de modo a se obter maior homogeneidade entre os seus elementos e maior heterogeneidade entre os estratos Na segunda etapa retirase uma amostra em cada estrato podendo este procedimento ser realizado por amostragem aleatória simples sistemática ou outra que for mais adequada Geralmente na amostragem aleatória estratificada o tamanho da amostra retirada de cada estrato é correspondente ao percentual que o estrato representa em relação à população Exemplificando Suponha que para determinada pesquisa seja necessário dividir a população de 100 indivíduos em dois estratos os homens 45 indivíduos e as mulheres 55 indivíduos Se quisermos retirar uma amostra estratificada de tamanho 20 dessa população quantos homens e quantas mulheres teremos Resolução Inicialmente calculamos a porcentagem que cada estrato representa em relação ao total Estrato 1 mulheres 55 100 55 Estrato 2 homens 45 100 45 Desse modo a amostra deve ser composta em 55 de mulheres e 45 de homens ou seja U2 Estatística descritiva 66 Amostra do estrato 1 55 20 11 mulheres Amostra do estrato 2 45 20 9 homens Observe no exemplo anterior que pelo fato de termos dividido a população em dois estratos homens e mulheres dentro de cada um os elementos são homogêneos todos os elementos são do mesmo sexo e quando comparamos os estratos entre si eles são significativamente heterogêneos pois em um há só mulheres e no outro apenas homens A amostragem por conglomerado também denominada amostragem por cluster é um processo que assim como a amostragem estratificada envolve mais de uma etapa A diferença básica entre essas duas é que enquanto a estratificada busca dividir a população em subgrupos cujos elementos sejam homogêneos a por conglomerado divide a população em subgrupos cujos elementos sejam heterogêneos Cada subgrupo definido nesse tipo de amostragem denominado conglomerado ou cluster será semelhante à população o que implica a semelhança entre os conglomerados Após definir os conglomerados primeira etapa geralmente se utiliza amostragem aleatória simples para escolher quais farão parte da amostra segunda etapa Em seguida realizase um censo em cada conglomerado selecionado terceira etapa Exemplificando A amostragem por conglomerado pode ser utilizada no caso de uma empresa que possua várias filiais Esperase que as filiais sejam semelhantes entre si e semelhantes à empresa como um todo Considerando que dentro de cada filial possa ser observada a mesma heterogeneidade que no restante da empresa temos uma situação semelhante à teorizada para esse tipo de amostragem Um procedimento padrão seria considerar cada filial da empresa como um conglomerado realizandose uma amostragem aleatória simples para definir quais conglomerados serão recenseados Agora que você já conhece alguns métodos de amostragem elabore um roteiro para realizar a coleta de dados proposta na situaçãoproblema do tópico DIÁLOGO ABERTO dessa seção de U2 Estatística descritiva 67 autoestudo Após a elaboração do roteiro compare sua proposta com a apresentada a seguir Roteiro para uma coleta de dados Uma das etapas mais importantes de toda coleta de dados é o planejamento Geralmente ele pode ser feito por meio da determinação de um roteiro ou um checklist Para ter eficiência esse roteiro deve ser elaborado e revisado a fim de evitar falhas Ao final o pesquisador deve conferir se todas as etapas previstas no roteiro foram concluídas Veja a seguir um possível roteiro para uma coleta de dados exemplificado para o caso da empresa M apresentada no início dessa seção de autoestudo 1 Definir o objetivo da pesquisa Exemplo determinar o perfil dos funcionários da empresa M 2 Definir as variáveis e a população de interesse Exemplo idade peso altura sexo cor dos olhos raça satisfação em relação às condições de trabalho e à remuneração A população corresponde aos 30 mil funcionários da empresa M 3 Definir o sistema de coleta Exemplo será realizado um censo ou uma amostragem No caso de uma amostragem qual método será utilizado Qual é o tamanho da amostra Quais são os meios de obtenção dos dados telefonemas questionários entrevistas etc 4 Coletar os dados Nessa etapa é necessário que o pesquisador tome o cuidado de não criar um viés Exemplo é possível que se tenha respostas enviesadas realizando perguntas como você NÃO está feliz com o seu trabalho Você acha que está ganhando POUCO Perguntas com negativas ou com ênfase em determinados termos podem influenciar as respostas dos entrevistados 5 Revisar os dados coletados Essa etapa é muito importante para a coleta pois é possível que sejam identificados erros que podem impactar todo o restante do trabalho Exemplo determinado funcionário da empresa M pode ter respondido que seu nome é João da Silva e também que é do sexo feminino Será que U2 Estatística descritiva 68 essa resposta é verídica Vale a pena conferir o processo para verificar possíveis erros de coleta Esperamos que até o momento você tenha tido uma visão geral de como é feita a amostragem e sua importância para a realização de uma pesquisa Vale ressaltar que o explicitado aqui é apenas uma noção básica do processo Existem livros inteiros dedicados ao estudo desse tema e muitos materiais disponíveis na internet Pesquise mais Para se aprofundar nas técnicas de amostragem faça uma pesquisa sobre o assunto Algumas sugestões são Livros BOLFARINE Heleno BUSSAB Wilton de O Elementos de amostragem São Paulo Edgard Blucher 2005 SILVA Nilza N da Amostragem probabilística um curso introdutório 2 ed São Paulo Editora da Universidade de São Paulo 2004 Internet Receita Federal do Brasil httpwwwreceitafazendagov brmanuaiswebexportacaotopicosconferenciaaduaneira verificacaofisicaamostragemhtm Acesso em 29 abr 2015 Tribunal de Contas da União httpportal2tcugovbrportalpls portaldocs2064402PDF Acesso em 29 abr 2015 Sem Medo de Errar Vamos retomar a situaçãoproblema do início dessa seção de autoestudo e personalizar um roteiro para a coleta de dados incluindo detalhes específicos como os propostos no tópico ROTEIRO PARA UMA COLETA DE DADOS 1 Definir o objetivo da pesquisa O objetivo da pesquisa pode ser identificado na situação problema proposta no início dessa seção de autoestudo determinar o perfil dos 30 mil funcionários da empresa M U2 Estatística descritiva 69 2 Definir as variáveis e a população de interesse A tarefa à qual você foi incumbido especificava que o objetivo era determinar o perfil dos funcionários da empresa M Para realizar essa tarefa você deveria pesquisar idade peso altura sexo cor dos olhos raça satisfação em relação às condições de trabalho e à remuneração Portanto essas serão as variáveis de estudo Para cada uma delas você deve elaborar uma pergunta de forma imparcial por exemplo a Qual é a sua idade b Qual é o seu peso c Qual é a sua altura d Qual é o seu sexo e Qual é a cor de seus olhos f Qual é a sua raça g Qual é a sua satisfação em relação às condições de trabalho h Qual é a sua satisfação em relação à sua remuneração Observe que algumas das perguntas anteriores deixam espaço para respostas muito amplas a exemplo do item g Alguns funcionários poderiam responder me sinto bem outros poderiam dizer apenas nota 10 Como comparar essas respostas posteriormente Nessa etapa do planejamento é melhor incluir algumas restrições para as respostas para facilitar a análise a posteriori Algumas sugestões são a Qual é a sua idade anos b Qual é o seu peso kg coloque valores inteiros c Qual é a sua altura centímetros d Sexo Masculino Feminino e Cor dos olhos Castanhos Azuis Verdes f Raça Amarela Branca Indígena Parda Preta U2 Estatística descritiva 70 g De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação às condições de trabalho 0 1 2 3 4 5 6 7 8 9 10 h De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação à sua remuneração 0 1 2 3 4 5 6 7 8 9 10 A população corresponde aos 30 mil funcionários da empresa M 3 Definir o sistema de coleta Lembrese de que para a situação proposta no início dessa seção de autoestudo o prazo estipulado para a pesquisa é de uma semana Nesse caso consideramos que fazer uma amostragem é o mais prudente pois devido ao tempo de coleta e àquele que ainda será gasto no tratamento das informações realizar um censo seria inviável Entretanto essa escolha irá depender de quais recursos estão disponíveis ficando a cargo do pesquisador definir entre amostragem ou censo Em relação ao tipo de amostragem vamos supor que na empresa M 5 dos funcionários sejam gerentes 15 possuam cargos administrativos e os 80 restantes cargos operacionais Como a pesquisa pode ser influenciada pela variável cargo o mais adequado é realizar uma amostragem estratificada em que os estratos gerentes cargos administrativos e cargos operacionais possuam a mesma representatividade na amostra tal qual é observada na população Não entraremos em detalhes sobre o cálculo do tamanho da amostra pois ele envolve conceitos ainda não trabalhados Entretanto para este exemplo vamos utilizar uma sugestão disponível em httpsptsurveymonkeycommpsamplesize com uma margem de erro de 10 para os resultados obtidos Você poderá verificar nesse link que o tamanho sugerido para a amostra é 96 U2 Estatística descritiva 71 Resta ainda definir como serão coletados os dados Novamente isso irá depender de quais recursos estão disponíveis Uma sugestão para pequenas amostras é a utilização de um formulário a ser enviado via internet Um exemplo de ferramenta gratuita para criação desse tipo de formulário é o Formulários Google Veja mais informações sobre este recurso em httpswww googlecomintlptBRformsabout 4 Coletar os dados No caso da utilização da ferramenta sugerida anteriormente os formulários podem ser enviados por email Entretanto nessa etapa o pesquisador deve ficar atento se os indivíduos selecionados para a amostra realmente estão respondendo à pesquisa 5 Revisar os dados coletados Com a ferramenta sugerida anteriormente essa etapa tende a ser ágil visto também que o tamanho da amostra é pequeno Avançando na Prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com a de seus colegas 1 Competência de fundamentos de área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Elaborar um roteiro para a realização de uma pesquisa 3 Conteúdos relacionados Amostragem 4 Descrição da situação problema Suponha que uma companhia telefônica o contratou para elaborar uma pesquisa de satisfação com os clientes acerca do serviço prestado Elabore um roteiro para coleta de dados sabendo que a companhia possui 1 milhão de clientes e deseja realizar a pesquisa por amostragem com 1000 clientes U2 Estatística descritiva 72 5 Resolução da situação problema 1 Definir o objetivo da pesquisa Determinar a satisfação dos clientes acerca do serviço prestado pela companhia telefônica 2 Definir as variáveis e a população de interesse Como não foram indicadas restrições e o detalhamento acerca da pesquisa foi pequeno assumiremos que a empresa queira saber apenas a satisfação de seus clientes variável de interesse sem outras informações agregadas A população corresponde a um milhão de clientes da companhia 3 Definir o sistema de coleta Como os clientes devem constar na base de dados da empresa podemos considerar que é possível gerar uma lista em ordem alfabética com os nomes e os telefones de cada um Sendo assim uma amostragem sistemática pode atender às necessidades e o meio de coleta das informações será o contato por telefone algo natural para uma empresa de telefonia O tamanho da amostra já foi definido anteriormente 1000 indivíduos Resta determinar o que será perguntado aos clientes Novamente pela ausência de detalhes assumiremos que uma pergunta como Em uma escala de 0 a 10 sendo 0 ruim e 10 ótimo qual nota oa senhora atribuiria ao serviço prestado por esta companhia seja suficiente para obter as informações requeridas 4 Coletar os dados Empregar pessoal devidamente treinado para realizar os contatos por telefone Nessa etapa é interessante ressaltar que o treinamento dos entrevistadores é muito importante pois se pode causar um viés 5 Revisar os dados coletados Havendo peculiaridade nos dados coletados eles podem ser revisados com base nas gravações telefônicas das entrevistas caso esse recurso esteja disponível Lembrese População conjunto de todos os elementos que possuem determinada característica em comum Amostra qualquer subconjunto de uma população Variável determinada característica que se deseja estudar em uma população ou amostra Subdividese em quantitativa discreta quantitativa contínua qualitativa ordinal e qualitativa nominal U2 Estatística descritiva 73 Amostragem processo de coleta de dados em um subconjunto da população denominado amostra Os principais tipos são amostragem de conveniência amostragem voluntária amostragem aleatória simples amostragem sistemática amostragem aleatória estratificada e amostragem por conglomerado Faça você mesmo Reúnase com seus colegas e planejem a criação de uma eleição mesmo que fictícia para presidente de turma Após a definição dos candidatos elaborem roteiros para pesquisas de intenção de voto explorando vários métodos de amostragem Realizem pelos menos duas pesquisas por amostragem sistemática e aleatória simples por exemplo e depois realizem a eleição em que todos devem votar Ao final comparem o resultado da eleição com os obtidos nas pesquisas de intenção de voto verificando qual método obteve o resultado mais representativo Redijam um pequeno texto com as conclusões Faça Valer a Pena 1 Assinale a alternativa que apresenta características de censo a Em uma linha de produção uma em cada 50 peças é inspecionada para controle de qualidade b A contagem da população realizada pelo IBGE em 2007 por questões de custos envolveu a coleta de dados em municípios de até 170 mil habitantes e em mais 21 municípios com população acima desta quantidade c O Teste Rápido de HIV é feito com a retirada de uma gota de sangue do paciente O sangue é colocado em dois dispositivos de testagem Em caso de resultado positivo nos dois o diagnóstico já é dado como certo d Nas eleições municipais a cada quatro anos todos os eleitores são obrigados a ir às urnas para votar em dois representantes um candidato a vereador e um candidato a prefeito e Ultimamente algumas lojas têm instalado painéis eletrônicos ou urnas para que os clientes caso queiram possam deixar suas opiniões sobre o atendimento 2 Assinale a alternativa que apresenta uma variável quantitativa discreta a Altura b Sexo c Peso U2 Estatística descritiva 74 d Velocidade e Número de filhos 3 Assinale a alternativa que apresenta uma variável qualitativa nominal a Cor dos olhos b Escolaridade Ensino Fundamental Ensino Médio Ensino Superior c Idade d Classificação em uma corrida Primeiro Segundo Terceiro e Cor da faixa de um judoca Cinza Azul Amarela Laranja 4 Para controle de qualidade 10 das peças que saem de uma linha de produção são inspecionadas Para compor a amostra selecionase 1 em cada 10 sempre na ordem em que são produzidas ou seja produzemse 9 peças e retirase a décima produzemse mais 9 e a vigésima é selecionada para a amostra e assim por diante Essa amostragem é do tipo a conveniência b aleatória simples c sistemática d aleatória estratificada e conglomerado 5 Uma grande rede de lojas pretende consultar os consumidores de determinada região para determinar suas preferências na hora de comprar roupas O foco dessa rede é o mercado feminino que corresponde a 70 de seu faturamento Os 30 restantes correspondem ao público masculino Para fazer essa consulta que tipo de amostragem essa rede de lojas deve utilizar a Amostragem por conveniência b Amostragem aleatória simples c Amostragem sistemática d Amostragem aleatória estratificada e Amostragem por conglomerado 6 Conceitue população e amostra 7 Descreva as características de uma amostragem aleatória estratificada U2 Estatística descritiva 75 Seção 22 Métodos tabulares e métodos gráficos Diálogo aberto Nessa seção vamos dar continuidade ao estudo da estatística descritiva A primeira etapa foi trabalhada na Seção 21 em que você aprendeu alguns conceitos básicos de estatística e os principais tipos de amostragem Além disso foi abordada a seguinte situação problema imagine que você é um funcionário da empresa M e que foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários O relatório final dessa pesquisa deverá conter informações pessoais como idade peso altura sexo cor dos olhos raça e também informações sobre a satisfação em relação às condições de trabalho e à remuneração Considere que o prazo estipulado para a realização dessa tarefa seja uma semana Fizemos um planejamento da coleta de dados para a pesquisa da empresa M e elaboramos um roteiro para a realização de tal tarefa Para continuar o trabalho vamos considerar que os dados já foram coletados sendo a nossa tarefa agora organizálos resumilos e apresentálos Reflita Dados são fatos em si não trazem grande significado só depois que eles forem de alguma forma agrupados ou processados é que poderemos ver o significado ser revelado Marcello Martinelli professor associado da Universidade de São Paulo Não Pode Faltar Dados brutos A coleta de dados planejada na Seção 21 terá como resultado fichas como a exemplificada na Figura 24 U2 Estatística descritiva 76 Figura 24 Exemplo de ficharesposta da coleta de dados N 1 a Qual é a sua idade anos b Qual é o seu peso kg coloque valores inteiros c Qual é a sua altura centímetros d Sexo X Masculino Feminino e Cor dos olhos X Castanhos Azuis Verdes f Raça Amarela Branca Indígena X Parda Preta g De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação às condições de trabalho 0 1 2 3 4 5 6 7 X 8 9 10 h De 0 insatisfeito a 10 muito satisfeito qual é a sua satisfação em relação à sua remuneração 0 1 2 3 4 5 6 X 7 8 9 10 Fonte O autor 2015 Lembrese de que no planejamento da coleta de dados com os funcionários da empresa M o tamanho pretendido para a amostra era 96 Com essa quantidade de fichas em mãos fica difícil inferir algo sobre o perfil dos funcionários pois os dados não estão organizados ou seja estão de forma bruta Para facilitar a visualização precisamos agrupar os dados que se referem à mesma variável e dispor as informações de um modo mais agradável e intuitivo para leitura e apresentação Uma maneira interessante de organizar os dados registrados nas fichas é em uma planilha eletrônica pois ela permite uma manipulação simples e rápida dos dados Observe na Figura 25 uma possível maneira de registrar as respostas obtidas na ficha da Figura 21 Figura 25 Registro da ficha N 1 em uma planilha eletrônica Fonte O autor 2015 26 74 174 U2 Estatística descritiva 77 Observe na Figura 25 que indicamos o número da ficha para eventuais conferências pois em caso de dúvidas fica simples lo calizála Veja também que para ficar sucinto indicamos somente as letras para fazer correspondência às perguntas realizadas Outra tática utilizada foi registrar apenas as letras M e C para representar as respostas Masculino e Castanhos Note que na pergunta f não pudemos utilizar essa estratégia pois causaríamos confusão entre as respostas Parda e Preta Para tornar o processo de aprendizagem mais simples vamos supor que o tamanho da nossa amostra seja apenas 20 indivíduos cu jas respostas dadas ao questionário estão apresentadas na Tabela 21 Distribuição de frequências Geralmente quando se estuda determinado problema procu rase conhecer o comportamento das variáveis envolvidas obser vando a ocorrência de seus valores na amostra para poder inferir algo a respeito da população Figura 24 Exemplo de ficharesposta da coleta de dados1 apresenta os dados de forma bruta de modo Fonte O autor 2015 Tabela 21 Respostas recebidas na coleta de dados N Questão a b c d e f g h 1 21 74 174 M C Parda 8 7 2 21 93 176 F A Parda 5 4 3 25 86 171 F C Amarela 1 5 4 27 83 179 F C Preta 4 5 5 28 88 185 M C Preta 10 7 6 29 63 181 M C Amarela 5 4 7 31 60 177 M V Parda 5 5 8 35 58 163 F C Branca 5 4 9 37 84 180 F C Preta 4 4 10 37 81 165 M C Branca 5 4 11 39 74 175 M C Parda 9 8 12 42 85 162 M C Indígena 7 7 13 43 60 165 M C Parda 3 4 14 47 67 170 M C Parda 4 3 15 48 81 162 M A Branca 2 4 16 51 85 165 F C Preta 5 3 17 51 86 170 M A Branca 1 5 18 53 57 170 F C Branca 7 6 19 55 88 179 F C Parda 10 6 20 59 68 188 F A Branca 9 8 U2 Estatística descritiva 78 que não conseguimos extrair muita informação ao observála Dessa maneira para podermos fazer algum tipo de inferência pre cisamos organizar os valores obtidos para cada variável de forma mais simples e de modo que uma rápida leitura possa fornecer informações que ainda estão ocultas Uma das maneiras mais utilizadas para organizar dados são as tabe las de distribuição de frequências Veja na Tabela 22 como podemos dispor os dados relativos à idade da amostra de funcionários da empresa M A notação 20 30 indica que estão sendo considerados os valores maiores ou iguais a 20 e menores que 30 Os demais são interpretados de modo semelhante A coluna Frequência da Tabela 22 também denominada frequên cia absoluta é construída por contagem direta dos valores dispostos na coluna a da Tabela 21 As demais colunas exigem alguns cálcu los Para calcular as Proporções também conhecidas como frequências relativas dividimos as frequências absolutas pela soma de todas as frequências Exemplo 0 30 6 20 Porcentagens multiplicamos as proporções por 100 Exemplo 30 030 100 Ao observarmos a distribuição de frequências da variável idade conseguimos obter informações que antes não estavam visíveis Por exemplo podemos afirmar que a faixa etária de 20 anos ou mais e menos de 30 anos tem 30 dos funcionários ou ainda que mais da metade dos funcionários 3025 têm menos de 40 anos Fonte O autor 2015 Tabela 22 Distribuição de frequências da variável idade na amostra Faixa etária Frequência Proporção Porcentagem 20 30 6 030 30 30 40 5 025 25 40 50 4 020 20 50 60 5 025 25 Total 20 100 100 U2 Estatística descritiva 79 Assimile Para calcularmos uma proporção dividimos a frequência absoluta correspondente pela soma de todas as frequências Uma porcentagem é calculada multiplicando uma proporção por 100 A Tabela 22 está organizada em intervalos de classe Essa estratégia é bastante utilizada quando os valores obtidos são muito variados não há repetição Exemplificando Algumas vezes não é necessário agrupar os valores obtidos de uma variável em intervalos de classe como é o caso da variável número de títulos em mundiais de futebol Até 2015 os campeões das 20 edições do torneiro eram Brasil 5 títulos Itália 4 títulos Alemanha 4 títulos Uruguai 2 títulos Argentina 2 títulos França 1 título Inglaterra 1 título e Espanha 1 título A distribuição de frequências dessa variável pode ser observada na Tabela 23 Número de títulos Frequência Proporção Porcentagem 1 3 0375 375 2 2 0250 250 3 1 0125 125 4 1 0125 125 5 1 0125 125 Total 8 1000 1000 Fonte FUTPÉDIA 2015 Tabela 23 Distribuição de frequências da variável número de títulos em mundiais de futebol Desafio construa as distribuições de frequências das demais variáveis presentes na Tabela 21 e compare sua resposta com a esperada no apêndice da Seção 22 Rol Você deve ter tido um pouco mais de trabalho para construir a tabela de distribuição de frequências da variável peso se compararmos com o empenho que seria necessário para construir a Tabela 22 Isso se deve ao fato de os dados referentes a essa variável não estarem organizados do modo como estão os referentes à variável idade vide Tabela 21 Como já foi mencionado quando os dados estão desordenados dizemos que eles estão de forma bruta a exemplo dos dados referentes U2 Estatística descritiva 80 à variável peso Quando os dados estão organizados em uma ordem crescente ou decrescente dizemos que eles estão em rol como é o caso dos dados relativos à variável idade Gráficos estatísticos Além de tabelas também podemos representar informações em gráficos Esse tipo de representação tem forte apelo visual sendo atrativo aos olhos dos leitores e muitas vezes pode dar uma ideia melhor da variabilidade de um conjunto de dados do que uma tabela São inúmeros os tipos de representações gráficas tanto para variáveis qualitativas quanto para quantitativas Abordaremos apenas os tipos mais simples e caberá a você pesquisar outras representações e suas particularidades Gráficos para variáveis qualitativas Um tipo particular de gráfico é o de barras Observe na Figura 26 um exemplo desse tipo de gráfico elaborado a partir da Tabela 21 Exemplificando Organize o seguinte conjunto de dados em rol crescente e em rol decrescente 18 11 35 26 22 16 Resolução Rol crescente 11 16 18 22 26 35 Rol decrescente 35 26 22 18 16 11 Assimile Um rol é uma organização crescente ou decrescente de dados Figura 26 Cor dos olhos da amostra de funcionários da empresa M Fonte Os autores 2015 U2 Estatística descritiva 81 Num gráfico de barras o eixo horizontal é denominado eixo das categorias e o vertical eixo das quantidades Cada barra representa um dos valores assumidos pela variável uma categoria A altura da barra é proporcional à frequência com que determinada resposta aparece na amostra e a largura é constante para todas as barras A construção de gráficos de barras pode ser facilitada em papel milimetrado ou em uma planilha eletrônica Veja um vídeo tutorial de como utilizar uma planilha para construção de um gráfico de barras em httpswwwyoutubecomwatchvPrqDotQ7B54 Outro tipo bastante utilizado de gráfico é o de setores também conhecido como gráfico de pizza São muito úteis para visualizar a participação frequência de determinada categoria em relação ao todo Esse tipo de gráfico é construído com base em um círculo dividido a partir de seu centro em quantas partes for o número de valores possíveis para a variável em questão Na Figura 27 é apresentado um gráfico de setores construído a partir da tabela de distribuição de frequências para a variável raça cuja construção foi proposta anteriormente e que consta no apêndice da Seção 22 Cada setor de um gráfico de pizza corresponde a um possível valor da variável Esse setor terá tamanho proporcional à participação desse valor em relação ao todo Essa participação fica facilmente visualizável quando observamos a coluna Porcentagem da tabela de distribuição de frequências Veja que os valores percentuais calculados para essa coluna são apresentados no interior do gráfico de setores Em determinadas situações a participação de certas categorias em relação ao todo é tão pequena que convém agrupar seus valores em um único setor para facilitar a visualização Figura 27 Distribuição dos funcionários da empresa M Fonte O autor 2015 U2 Estatística descritiva 82 Exemplificando Observe na Tabela 24 a quantidade de mandioca em kg produzida pelos estados da região Nordeste em 2006 UF Quantidade em kg Porcentagem Pernambuco 2401684 30 Alagoas 1479204 18 Maranhão 1315186 16 Bahia 1246801 15 Sergipe 685133 8 Piauí 394665 5 Ceará 426183 5 Rio Grande do Norte 139452 2 Paraíba 82627 1 Fonte O autor 2015 Tabela 24 Produção de mandioca em kg na região Nordeste em 2006 Para construir um gráfico de setores a partir dessa tabela teríamos problemas de visualização pois alguns setores ficariam muito pequenos Em casos como este geralmente agrupamse os setores menores em um só denominado Outros Veja um exemplo na Figura 28 Figura 28 Participação dos estados na produção de mandioca da região Nordeste em 2006 Fonte IBGE Produção vegetal 2015 Gráficos para variáveis quantitativas Gráficos de barra também são bastante utilizados para representar variáveis quantitativas Veja um exemplo na Figura 29 construído a partir da Tabela 23 U2 Estatística descritiva 83 Vale ressaltar que quando se trata de variáveis quantitativas a variedade de representações gráficas é maior A mesma informação apresentada na Figura 29 também poderia ser representada de outras formas como mostra a Figura 210 Figura 29 Número de títulos em mundiais de futebol Fonte FUTPÉDIA 2015 Fonte FUTPÉDIA 2015 Figura 210 Número de títulos em mundiais de futebol a b c As representações da Figura 210 a e da Figura 210 b são denominadas gráficos de dispersão Nesses exemplos a variável em questão é discreta Quando trabalhamos com variáveis quantitativas contínuas precisamos fazer uma adaptação para construir representações semelhantes Considere a distribuição de frequências para a variável altura cuja construção foi proposta anteriormente e é apresentada na Tabela 25 com alguns acréscimos Veja na Tabela 25 que foi acrescentada a coluna Ponto médio Nessa coluna temos os U2 Estatística descritiva 84 pontos médios das classes que são obtidos somandose os valores extremos e dividindose por 2 O ponto médio da classe servirá como representante na hora de construir uma representação gráfica Veja na Figura 211 um gráfico de barras construído a partir da Tabela 25 Outra maneira de representar os dados da Tabela 25 é por meio de um histograma o qual pode ser visto na Figura 212 Em um histograma cada barra possui a largura do intervalo da classe e altura proporcional à frequência correspondente Uma das principais características do histograma é que suas barras são justapostas ou seja grudadas umas às outras Tabela 25 Distribuição de frequências da variável altura apresentada na Tabela 21 Altura em cm Ponto médio Frequência Proporção Porcentagem 160 165 1625 3 015 15 165 170 1675 3 015 15 170 175 1725 5 025 25 175 180 1775 5 025 25 180 185 1825 2 010 10 185 190 1875 2 010 10 Total 20 100 100 Fonte O autor 2015 Figura 211 Altura dos funcionários da amostra da empresa M Fonte O autor 2015 Figura 212 Altura dos funcionários da amostra da empresa M Fonte O autor 2015 U2 Estatística descritiva 85 Para criar um histograma de modo rápido e fácil acesse o site httpwwwsocscistatisticscomdescriptivehistogramsDefault aspx e insira os dados relativos às alturas da amostra disponíveis na Tabela 21 Ramosefolhas A ideia geral ao se construir um gráfico seja de barras dispersão ou histograma é determinar como os dados se distribuem A linguagem simplificada e resumida de um gráfico é de grande ajuda nessa tarefa Uma grande desvantagem ao construir uma representação gráfica é a perda de informação dos dados originais Para facilitar na visualização da distribuição dos dados e ainda não perder muita informação dos dados brutos podemos utilizar um diagrama de ramosefolhas Veja na Figura 213 um diagrama construído a partir da Tabela 21 para a variável altura Para compreender como é construído um diagrama como esse vamos repetir no quadro ao lado os dados relativos às alturas dos funcionários da amostra organizados em rol e destacado o último algarismo em cada observação Note que para construir o diagrama traçamos uma linha vertical e à esquerda dessa linha dispomos os dois primeiros algarismos das observações à direita dessa linha dispomos os últimos algarismos das observações separados por vírgula Analisando o diagrama da Figura 213 podemos observar a distribuição dos valores há prevalência de valores na classe do meio e ainda mantivemos as informações originais 162 162 163 165 165 165 170 170 170 171 174 175 176 177 179 179 180 181 185 188 U2 Estatística descritiva 86 Figura 213 Diagrama de ramosefolhas para a variável altura 16 223555 17 0001456799 18 0158 Fonte O autor 2015 Exemplificando Observe o diagrama de ramosefolhas da Figura 214 Como poderíamos escrever os dados desse diagrama por extenso Resolução 170 173 175 177 180 186 189 196 197 198 203 204 211 215 215 Figura 214 Peso de uma amostra de 15 novilhos Fonte O autor 2015 17 0357 18 069 19 678 20 34 21 155 Em estatística existem diversas normas para apresentação de dados em tabelas e gráficos Determinados elementos são considerados essenciais e quando compõem um desses objetos é preciso se atentar às normas Há também uma maneira padrão para a elaboração de uma tabela de distribuição de frequências agrupadas em intervalos de classe Veja no link httpwwweeuspbrgraduacaoens435 modulo4modulo4lhtml alguns dos elementos considerados essenciais na apresentação de tabelas e gráficos e no link httpwww fernandokbprobrp201 a forma padrão para a construção de uma tabela de distribuição de frequências Pesquise mais Além dos tipos de gráficos apresentados existem diversos outros sendo que cada um possui uma característica própria que o faz mais adequado para determinada situação Para se aprofundar nesse assunto segue uma sugestão de leitura Suporte Office Disponível em httpssupportofficecomptbr articleTiposdegrC3A1ficosdisponC3ADveisb22a8bb9 a6734d7fb481aa747c48eb3duiptBRrsptBRadBR Acesso em 15 jul 2015 U2 Estatística descritiva 87 Sem Medo de Errar Relembrando a situaçãoproblema proposta no início da seção vamos agora nos preocupar com a apresentação dos dados da amostra apresentada na Tabela 21 e para termos maior riqueza de detalhes vamos tratar apenas das variáveis sexo e peso As demais podem ser trabalhadas de modo semelhante Considerando essas duas variáveis qual seria a melhor forma de apresentálas Com um gráfico ou uma tabela Como seria essa apresentação Métodos tabulares são aplicáveis na maioria das vezes tanto para variáveis qualitativas quanto para quantitativas Têm a vantagem de em geral possuir maior riqueza de detalhes do que uma representação gráfica Contudo tabelas podem ser de difícil leitura trabalho que pode ser simplificado por meio de um gráfico Como a construção das tabelas de distribuição de frequências para essas variáveis já foi proposta anteriormente e consta no apêndice dessa seção vamos apresentar os dados de forma gráfica Para isso resta decidir qual tipo de gráfico é mais adequado para cada uma Primeiramente vamos tratar da variável sexo que é qualitativa nominal Nessa seção foram mostrados dois tipos de gráficos para apresentação de dados relativos a esse tipo de variável o de barras e o de setores Ambos estão representados na Figura 215 Figura 215 Distribuição dos funcionários da empresa M por sexo Fonte O autor 2015 a b U2 Estatística descritiva 88 Para que a representação gráfica seja adequada sempre devemos considerar o objetivo do pesquisador Não existe uma rigidez quanto à escolha do tipo de gráfico mas vale observar as sugestões apresentadas nas leituras sugeridas no Pesquise Mais Nesse exemplo por questões estéticas consideramos como mais adequado o gráfico de setores pois ele deixa visível a participação da cada categoria com relação ao todo Dando continuidade a variável peso é quantitativa contínua Para escolher uma entre as representações gráficas apresentadas são válidas algumas observações Gráfico de barras para elaborar um gráfico desse tipo temos que considerar a mesma estratégia utilizada para elaborar o gráfico da Figura 28 ou seja determinar o ponto médio de cada intervalo de classe Acreditamos que com isso perderíamos um pouco de informação Gráfico de dispersão como não há muitos valores repetidos para a variável peso um gráfico desse tipo poderia ser de difícil leitura Gráfico de setores os dados estão agrupados na tabela de distribuição de frequências veja apêndice em classes justapostas Logo um gráfico de setores pode não ser adequado ou pouco informativo para esse exemplo Figura 216 Peso dos funcionários da empresa M Fonte O autor 2015 Considerando as observações anteriores e a semelhança entre esse exemplo e o apresentado na Figura 212 concluímos que a representação gráfica mais adequada é um histograma que está representado na Figura 216 U2 Estatística descritiva 89 AVANÇANDO NA PRÁTICA Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competências de fundamentos de área Conhecer os conceitos matemáticos básicos e pro porcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Expor dados da amostra por meio de gráficos e tabelas 3 Conteúdos relacionados Métodos tabulares e métodos gráficos para apresentação de dados 4 Descrição da situação problema O IMC Índice de massa corpórea é um indicador reconhecido pela Organização Mundial da Saúde para dimensionar a relação entre peso e altura de um indivíduo Para calculálo dividimos o peso em kg pela altura em metros ao quadrado ou seja IMC Peso Altura 2 Conhecendose o IMC podemos utilizar a seguinte classificação1 Menos de 185 Abaixo do peso 185 250 Peso adequado 250 300 Sobrepeso 300 ou mais Obeso De acordo com essas informações e com base nos dados da Tabela 21 construa Um gráfico de barras duplas horizontais para as variáveis satisfação em relação às condições de trabalho e remuneração Uma tabela de distribuição de frequências para o IMC U2 Estatística descritiva 90 Estatística descritiva U2 96 5 Resolução da situação problema Para construir o gráfi co de barras vamos considerar os dados da tabela de distribuição de frequências para as variáveis satisfação em relação às condições de trabalho e remuneração cuja construção foi proposta anteriormente e cujos dados constam no apêndice da seção 22 Veja esse gráfi co na Figura 217 Figura 217 Satisfação em relação às condições de trabalho e remuneração da amostra de funcionários da empresa M Fonte O autor 2015 Para construir a tabela de distribuição de frequências primeiro precisamos calcular os IMCs N Peso em kg Altura em metros IMC N Peso em kg Altura em metros IMC 1 74 174 244 11 74 175 242 2 93 176 300 12 85 162 324 3 86 171 294 13 60 165 220 4 83 179 259 14 67 170 232 5 88 185 257 15 81 162 309 6 63 181 192 16 85 165 312 7 60 177 192 17 86 170 298 8 58 163 218 18 57 170 197 9 84 180 259 19 88 179 275 10 81 165 298 20 68 188 192 Agora a partir desses dados podemos construir a distribuição de frequências apresentada na Tabela 26 Tabela 26 Distribuição de frequências do IMC Classifi cação Frequência Proporção Porcentagem Abaixo do peso 0 000 0 Peso adequado 9 045 45 Sobrepeso 8 040 40 Obeso 3 015 15 Total 20 100 100 Fonte O autor 2015 Lembrese Dados brutos são aqueles que não estão ordenados Uma tabela de distribuição de frequências é uma organização tabular que busca relacionar os possíveis valores de uma variável às frequências com que aparecem numa amostra U2 Estatística descritiva 91 Rol é uma organização crescente ou decrescente dos dados de uma amostra Faça você mesmo Organizese com seus colegas e pesquisem por amostragem a altura dos alunos da turma Depois construa uma tabela de distribuição de frequências agrupadas em intervalos de classe e um histograma Por fim compare sua resposta com a dos colegas Faça valer a pena 1 Assinale a alternativa que contém dados organizados em rol a 71 88 56 65 99 b 95 92 75 60 44 c 20 56 67 53 70 d 32 81 59 17 38 e 87 62 37 76 61 2 Com base nas informações da Tabela 27 assinale a alternativa que contém a sequência de valores x y z w nessa ordem a 64 24 9 3 b 62 24 9 5 c 64 22 9 5 d 60 28 9 5 e 66 21 8 5 3 Em determinado hospital foram realizados exames em diversos pacientes com suspeita de uma doença Os resultados foram compilados no gráfico da Figura 218 U2 Estatística descritiva 92 Figura 218 Resultados dos exames realizados Fonte O autor 2015 Assinale a alternativa que contém os dados brutos que deram origem a esse gráfico a NNNNNNPPPPPPPPII b NNNNPPPPPI c NNNNNNNPPPPPPPPPPI d NNNNNNNPPPPPPPPIII e NNNNNNPPPPPPPPPIII 4 A Tabela 28 apresenta a distribuição da população brasileira em 2010 por faixa etária Fonte O autor 2015 Tabela 28 Distribuição da população brasileira em 2010 Faixa etária Frequência em milhões Porcentagem 0 20 6289 3310 20 40 x 3330 40 60 y 2260 60 ou mais z w Total 19000 10000 Com base nos dados da tabela assinale a alternativa correta a Metade da população tinha mais 40 anos b Aproximadamente 30 milhões de brasileiros tinham 60 anos ou mais c Um terço da população tinha menos de 40 anos d 18 da população tinha 60 anos ou mais e Mais de 63 milhões de brasileiros possuíam entre 20 e 40 anos U2 Estatística descritiva 93 5 O histograma da Figura 219 mostra a distribuição dos salários ganhos pelos funcionários de uma empresa Fonte O autor 2015 Tabela 29 População brasileira por região em 2010 Região População em milhões Norte 159 Nordeste 531 Sudeste 804 Sul 274 CentroOeste 141 Com base no histograma assinale a alternativa correta a Seis funcionários ganham até 3 salários mínimos b Sete funcionários ganham 5 salários mínimos ou mais c 10 dos funcionários ganham 6 salários mínimos ou mais d 25 dos funcionários ganham menos de 2 salários mínimos e Metade dos funcionários ganha mais de 4 salários mínimos 6 A Tabela 29 mostra a quantidade de habitantes no Brasil em 2010 Figura 219 Salários ganhos pelos funcionários de uma empresa Fonte O autor 2015 Elabore um gráfico de setores a partir da Tabela 29 e em cada setor indique a porcentagem correspondente 7 Elabore um diagrama de ramosefolhas a partir do conjunto de dados a seguir 132 259 188 573 540 458 663 780 614 937 872 170 312 223 601 559 535 687 782 645 953 895 U2 Estatística descritiva 94 Seção 23 Medidas de posição Diálogo aberto Na Seção 22 você aprendeu sobre diferentes formas de apresentar informações como as tabelas e os gráficos Vimos que as tabelas são úteis para organizar e resumir dados mas que em alguns casos podem ser de difícil leitura e interpretação Nesse sentido uma representação gráfica pode ser mais fácil de interpretar resume ainda mais os dados e dá uma ideia melhor da distribuição Existem ainda outras maneiras de resumir conjuntos de dados que vão além de uma tabela ou um gráfico Ferramentas para esse fim são denominadas medidas de posição as quais buscam sintetizar um conjunto com um único valor São exemplos de medidas de posição a média aritmética a mediana e a moda Considere a Tabela 21 e imagine maneiras de representar os dados referentes a cada variável por um único valor Como você faria isso Que valor seria mais adequado para cada conjunto Essas perguntas serão respondidas ao final dessa seção de autoestudo Leia o texto e se aprofunde no assunto com a sugestão de leitura do Pesquise mais Não deixe também de consultar outras bibliografias Reflita Estatística a ciência que diz que se eu comi um frango e tu não comeste nenhum teremos comido em média meio frango cada um Dino Segrè escritor italiano Não pode faltar Você aprendeu anteriormente que dados brutos são aqueles que se apresentam da maneira como foram coletados ou seja U2 Estatística descritiva 95 fora de ordem Também vimos que ao ordenar esses dados em ordem crescente ou decrescente estamos construindo um rol Veja um exemplo Dados brutos 18 42 31 26 21 24 20 90 Rol crescente 18 20 21 24 26 31 42 90 Rol decrescente 90 42 31 26 24 21 20 18 A construção de um rol é o primeiro passo para a confecção de tabelas e gráficos Entretanto essa não é sua única utilidade O rol será de grande ajuda na obtenção de algumas medidas de posição Estas por sua vez são valores que buscam resumir ainda mais um conjunto de dados mais até do que as tabelas e os gráficos As medidas mais conhecidas que possuem essa finalidade são a média aritmética a mediana e a moda Trataremos de cada uma mais adiante mas antes temos que adotar algumas notações para simplificar a escrita Na Seção 22 atribuímos valores às variáveis estudadas na amostra de funcionários Eram elas idade peso altura sexo cor dos olhos raça satisfação em relação às condições de trabalho e satisfação em relação à remuneração Para não ser necessário reescrever repetidamente os nomes dessas variáveis utilizamos letras maiúsculas para representálas como a seguir A idade B peso C altura D sexo E cor dos olhos F raça G satisfação em relação às condições de trabalho H satisfação em relação à remuneração Com essa padronização sempre que quisermos nos referir à variável satisfação em relação às condições de trabalho por exemplo podemos escrever simplesmente variável G Bem mais simples não concorda Outro procedimento bastante utilizado é enumerar os elementos de um conjunto de dados geralmente quando eles já estão organizados em rol Para exemplificarmos considere a variável definida a seguir U2 Estatística descritiva 96 X idade dos leitores de uma revista Admita que em uma pesquisa realizada para estudar a variável X se tenham sido obtidos os seguintes valores já organizados em rol Dados da amostra 18 20 21 24 26 31 42 90 Como os dados se referem à variável X comumente simbolizamos cada um pela letra x minúscula acompanhada do índice i que indica a posição que o valor aparece no rol O quadro a seguir resume essa associação Posição no rol i 1 2 3 4 5 6 7 8 xi 18 20 21 24 26 31 42 90 Ao escrevermos o símbolo x3 por exemplo estamos nos referindo ao valor obtido para a variável X que ocupa a posição i 3 terceira posição do rol isto é x3 21 No quadro anterior foram apresentados oito valores obtidos a partir de uma amostra Essa quantidade geralmente é simbolizada pela letra n minúscula Nesse caso temos que n 8 é o tamanho da amostra Atenção Na continuidade dessa seção com frequência os conjuntos de dados serão apresentados em rol crescente para facilitar a compreensão das medidas de posição Entretanto fique atento ao trabalhar com os dados brutos em outras situações pois você terá primeiro que organizálos em ordem crescente ou decrescente para calcular algumas dessas medidas Média aritmética A média aritmética ou simplesmente média corresponde à divisão da soma de todos os valores de um conjunto de dados pela quantidade de valores desse conjunto Se um conjunto tiver n valores x1 x2 x3 xn sua média será simbolizada por x x n x x x x n n 1 2 3 Calcule a média do seguinte conjunto de dados 18 20 21 24 26 31 42 90 Resolução x Σxn x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈8 18 20 21 24 26 31 42 908 2728 34 Leitura dos símbolos x x barra Σx soma dos valores de x A média é uma das mais importantes medidas de posição Veja que o conjunto de dados do exemplo anterior corresponde ao da amostra da variável X apresentada anteriormente O resultado obtido nesse exemplo nos indica que em média os leitores da referida revista possuem 34 anos Pergunta o valor 34 descreveu bem o conjunto de dados Por quê A resposta esperada para essa pergunta seria não A média aritmética é uma medida fortemente influenciada por valores extremos muito baixos ou muito altos motivo que nos leva quase sempre a não a utilizar sozinha para descrever um conjunto Em inúmeros casos essa medida é utilizada conjuntamente com outras como a mediana e medidas de dispersão que medem a variabilidade de um conjunto Quando o conjunto de valores é mais homogêneo a média cumpre eficientemente o papel de descrevêlo como no exemplo a seguir Conjunto 82 82 83 83 83 84 84 Média x 83 Dizer que nesse conjunto os valores são em média 83 não é longe do esperado Como determinar a média final do aluno visto que cada avaliação tem importância diferente Em situações como essa em que alguns elementos de um conjunto têm mais importância do que outros costumase utilizar a média ponderada para resumir os dados A média aritmética ponderada xp de um conjunto de dados é calculada ao multiplicarmos os números por seus respectivos pesos e dividirmos a soma desses produtos pela soma dos pesos Para o exemplo anterior temos xp 90038078547063746 15920 795 Portanto a média final do aluno na disciplina é 795 pontos Simbolicamente representamos a média ponderada de x₁ x₂ xn valores cujos pesos são respectivamente p₁ p₂ pn por xp x₁p₁ x₂p₂ xnpnp₁ p₂ pn Resolução Efetuamos os cálculos das médias Marcio xp Σxp Σp 1002 505 903 2 5 3 72 Lucas xp Σxp Σp 802 905 703 2 5 3 82 Portanto o candidato aprovado é Lucas Mediana Considere a variável Y como sendo os salários dos funcionários de uma empresa e que os valores amostrados para essa variável foram 840 860 790 780 1800 880 2800 A média dos salários é y 1250 contudo ao afirmar isso não descrevemos o quadro de salários satisfatoriamente visto que grande parte dos valores é próxima de 800 reais Em casos como este a mediana pode ser uma boa opção para descrever o conjunto A mediana ou valor mediano de um conjunto de dados corresponde ao valor central de um rol Para calculála temos de considerar dois casos 1º quantidade ímpar de valores no conjunto 2º quantidade par de valores no conjunto 1º caso quantidade ímpar de valores no conjunto No caso da amostra colhida para a variável Y considere o seguinte rol i 1 2 3 4 5 6 7 yi 780 790 840 860 880 1800 2800 Como n 7 ímpar a mediana simbolizada por Md corresponde ao valor que ocupa a posição i n 12 7 12 4 ou seja Md 860 Veja que abaixo e acima de 860 temos 3 valores isto é a mediana divide o rol ao meio em que metade dos valores é menor ou igual à mediana e a outra metade é maior ou igual à mediana Afirmação que o salário mediano dos trabalhadores da empresa é 860 reais corresponde melhor a uma descrição do conjunto do que a média 2º caso quantidade par de valores no conjunto Considere Z o número diário de visitantes em um museu e a amostra coletada para essa variável como sendo o conjunto 80 73 92 98 160 77 Nesse caso temos n 6 par elementos na amostra Ao organizar os dados em rol obtemos i 1 2 3 4 5 6 zi 73 77 80 92 98 160 Observe que agora não temos um único valor no centro do rol mas dois deles Um dos valores está localizado na posição i n2 62 3 e o outro na posição i n2 1 62 1 3 1 4 Para representar a mediana nesse caso utilizamos a média aritmética dos dois valores centrais ou seja Md z3 z42 80 922 86 Calcule a mediana dos valores amostrados das variáveis X e Y apresentados a seguir i 1 2 3 4 5 6 7 8 xi 102 103 135 144 148 159 160 166 yi 413 484 495 543 558 565 580 O símbolo indica que o dado é ausente Resolução Observe que o tamanho da amostra da variável X é nx 8 par e o tamanho da amostra para Y é ny 7 ímpar Assim para calcular a mediana de X MdX temos que utilizar o 2º caso e para a mediana de Y MdY o 1º caso como segue mediana de X i n2 82 4 primeira posição central i n2 1 82 1 4 1 5 segunda posição central MdX x4 x52 144 1482 146 mediana de Y i n 12 7 12 82 4 posição central MdY y4 543 Moda O que lhe vem à cabeça quando falamos a palavra moda Aquela roupa descolada que bastante gente está usando Pois bem em estatística essa palavra tem um sentido semelhante A moda simbolizada por Mo é o valor com maior frequência em um conjunto de dados Lembrase da tabela apresentada na seção 22 que continha os dados referentes à amostra de 20 funcionários da empresa M veja Tabela 21 Os dados referentes à variável raça F estão reproduzidos a seguir Parda Parda Amarela Preta Preta Amarela Parda Branca Preta Branca Parda Parda Branca Preta Branca Branca Parda Branca A distribuição de frequências desse conjunto de dados é apresentada na Tabela 211 Como pode ser observado na coluna Frequência o valor que teve a maior frequência foi Parda Portanto para este exemplo Mo Parda Tabela 212 Distribuição de frequências da variável F Raça Frequência Proporção Percentagem Amarela 2 010 10 Branca 6 030 30 Indígena 1 005 5 Parda 7 035 35 Preta 4 020 20 Total 20 100 100 A moda é uma medida de posição indicada tanto para variáveis quantitativas quanto para qualitativas como é o caso da variável raça Isso não ocorre por exemplo com a média e a mediana que são medidas indicadas somente para variáveis quantitativas Quando os possíveis valores de uma variável aparecem em igual número de vezes em uma amostra têm a mesma frequên U2 Estatística descritiva 102 cia dizemos que o conjunto é amodal isto é não possui moda Também podemos classificar os conjuntos em unimodais uma moda bimodais duas modas trimodais três modas e multimo dais quatro ou mais modas Assimile A média aritmética a mediana e a moda são medidas que buscam resumir um conjunto de dados em um único valor Para calcular a média aritmética adicionamos todos os valores e dividimos o resultado pela quantidade de valores adicionados Se a média aritmética for ponderada devemos levar em consideração os respectivos pesos A mediana divide o conjunto de dados ao meio Ela corresponde ao valor central em um rol se a quantidade de valores for ímpar e à média aritmética dos dois valores centrais se a quantidade for par A moda é o valor com maior frequência em um conjunto Pesquise mais Apresentamos aqui os cálculos de algumas medidas de posição para dados não agrupados em classes Essas mesmas medidas podem ser utilizadas também para dados agrupados em tabelas de distribuição de frequências Para conhecer o cálculo dessas medidas para dados agrupados e outras medidas de posição como as separatrizes sugerimos a seguinte leitura complementar Descrição de amostras Disponível em httpwwwufpabrdicas biomebioamoshtm Acesso em 15 jul 2015 Sem Medo de Errar Vamos relembrar as questões feitas no início dessa seção de autoestudo considerando a Tabela 21 como representar os dados referentes a cada variável por um único valor Que valor seria mais adequado para cada conjunto Trataremos aqui das variáveis A idade e D sexo O tratamento das demais será proposto na seção AVANÇANDO NA PRÁTICA Variável A Iremos utilizar a média aritmética e a mediana para descrever as idades Para calcular a média efetuamos a a n 21 21 25 53 55 59 20 779 20 3895 39 Logo os funcionários da empresa têm em média 39 anos aproximadamente Para o cálculo da mediana observe que o conjunto possui n 20 par valores Portanto a mediana corresponderá à média aritmética dos elementos nas posições i n 2 20 2 10 i n 2 1 20 2 1 10 1 11 Assim Md a10 a11 2 37 39 2 38 Concluímos então que a mediana das idades é 38 anos Observe que a mediana e a média sozinhas não descrevem muito bem o conjunto de dados Isso ocorre porque há muita variabilidade Temos funcionários com 21 anos e outros com 59 Veremos na seção 24 que há ferramentas que auxiliam as medidas de posição a descrever o conjunto Por enquanto nos limitaremos a apresentar estes valores como descrição Variável D Para descrever os dados referentes à variável D não podemos utilizar a média e a mediana visto que essa variável é qualitativa Nos resta então utilizar a moda Repetimos aqui os dados para contabilizar as frequências M F F F M F M M F F M M M M M M M F M F F Observe que temos 11 funcionários do sexo masculino e 9 resultando em Mo M ou seja a maioria dos funcionários é do sexo masculino Avançando na Prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competências de fundamentos de área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Resumir dados por meio de uma medida de posição 3 Conteúdos relacionados Medidas de posição 4 Descrição da situação problema Considerando os dados apresentados na Tabela 21 calcule o peso médio a altura mediana a cor dos olhos e a raça de maior frequência a moda dos dados referentes às variáveis G e H Peso médio Para calcular a média dos pesos efetuamos b b n 74 93 86 57 88 68 20 1521 20 7605 76 Portanto o peso médio dos funcionários é aproximadamente 76 quilogramas Altura mediana Para calcular a mediana primeiro precisamos construir um rol como a seguir 162 162 163 165 165 165 170 170 170 171 174 175 176 177 179 179 180 181 185 188 Como n20 par a mediana corresponderá à média dos valores nas posições i n 2 20 2 10 i n 2 1 20 2 1 10 1 11 Assim Md c10 c11 2 171 174 2 1725 173 Concluímos que a altura mediana é aproximadamente 173 centímetros Cor dos olhos e raça de maior frequência U2 Estatística descritiva 105 Para determinar a moda de cada conjunto de dados utilizaremos as tabelas de distribuição de frequências cuja construção foi proposta na seção 22 e cujo gabarito consta no apêndice O valor modal para a cor dos olhos foi Castanhos com porcentagem igual a 75 raça foi Parda com porcentagem igual a 35 Moda dos dados referentes às variáveis G e H Para determinarmos a moda de cada conjunto primeiro construímos um rol como a seguir Variável G 1 1 2 3 4 4 4 5 5 5 5 5 5 7 7 8 9 9 10 10 Variável H 3 3 4 4 4 4 4 4 4 5 5 5 5 6 6 7 7 7 8 8 Com o rol disponível podemos observar que o valor de maior frequência em cada caso é 5 e 4 para as variáveis G e H respectivamente Lembrese Para calcular a média aritmética adicionamos todos os valores e dividimos o resultado pela quantidade de valores adicionados Se a média aritmética for ponderada devemos levar em consideração os respectivos pesos A mediana divide o conjunto de dados ao meio Ela corresponde ao valor central em um rol se a quantidade de valores for ímpar e à média aritmética dos dois valores centrais se a quantidade for par A moda é o valor com maior frequência em um conjunto Faça você mesmo Na Seção 22 no tópico Faça você mesmo foi proposto que junto com seus colegas você pesquisasse a altura dos alunos da turma Aproveite os dados coletados nessa pesquisa e calcule a média e a mediana do conjunto Também classifique o conjunto com relação à quantidade de modas e indique os valores modais U2 Estatística descritiva 106 Faça Valer a Pena 1 Assinale a alternativa que contém o conjunto com a maior média a 409 337 104 b 131 115 302 c 395 404 369 d 250 432 1562 e 258 156 223 2 Assinale a alternativa que contém a média aritmética do conjunto de dados sintetizado no diagrama de ramosefolhas ao lado a 138 b 139 c 140 d 141 e 142 3 Observe o seguinte conjunto de dados 12 27 16 42 16 23 41 25 Com relação à média à mediana e à moda do conjunto anterior assinale a alternativa correta a Mo x Md b Mo Md x c Md Mo x d Md x Mo e x Mo Md 4 Observe a Tabela 213 em que constam as idades de 20 crianças que participam de um projeto social Assinale a alternativa que contém a média e a mediana das idades das crianças 10 88 11 6 12 07 13 11 14 4 15 08899 16 47 U2 Estatística descritiva 107 Dica escreva o rol correspondente à distribuição de frequências a x 9 e Md 7 b x 9 e Md 8 c x 9 e Md 9 d x 8 e Md 9 e x 7 e Md 9 5 Em uma turma de 40 alunos há alguns com 20 anos 21 anos 24 anos e ainda outros com 28 anos A quantidade de alunos com cada uma dessas idades é apresentada na Figura 220 Assinale a alternativa que contém a média das idades dos alunos dessa turma a 242 anos b 240 anos c 220 anos d 244 anos e 224 anos 6 Calcule a média a mediana e a moda do seguinte conjunto de dados 1 1 2 2 2 3 3 3 3 4 4 4 5 5 6 6 6 6 6 7 7 7 7 7 8 8 9 9 9 9 Depois classifique o conjunto com relação à quantidade de modas 7 Considere o seguinte conjunto de dados 1932 y 1596 1649 1597 Calcule o valor de y sabendo que a média do conjunto é 1646 Figura 220 Distribuição das idades Fonte O autor 2015 Figura 220 Distribuição das idades Fonte O autor 2015 Tabela 213 Distribuição de frequências Idade Frequência Proporção Porcentagem 7 4 020 20 8 4 020 20 9 5 025 25 10 3 015 15 11 3 015 15 12 1 005 5 Total 20 100 100 U2 Estatística descritiva 108 Seção 24 Medidas de dispersão Diálogo aberto Vimos na unidade anterior que existem maneiras ainda mais sintéticas de resumir um conjunto de dados do que as tabelas e os gráficos Tais métodos envolvem a obtenção de um único valor ou poucos valores para representar todo o conjunto valor esse que denominamos medida de posição As medidas que estudamos foram a média aritmética a média aritmética ponderada a mediana e a moda No exemplo apresentado na seção SEM MEDO DE ERRAR constatamos que nem sempre uma medida como a média representa significativamente um conjunto Isso também pode ser observado nos conjuntos a seguir 1 conjunto 90 90 90 90 90 2 conjunto 86 88 90 92 94 3 conjunto 30 60 90 120 150 Os conjuntos possuem média e mediana iguais a 90 calcule entretanto apenas para os dois primeiros esse valor é representativo Aqui surgem alguns questionamentos quando uma média é representativa em um conjunto Quais ferramentas podem ser utilizadas para auxiliar as medidas de posição na descrição de um conjunto de dados Para auxiliar as medidas de posição na descrição de um conjunto utilizamos as medidas de dispersão Essas medidas buscam dimensionar quanto os dados estão distantes da média por exemplo Com o auxílio delas podemos decidir por exemplo se a média pode ser utilizada como representante de um conjunto No decorrer dessa seção buscaremos responder aos questionamentos anteriores e mais especificamente decidir se a média é adequada para resumir os dados referentes aos funcionários da empresa M apresentados na Tabela 21 e quantificar a variabilidade de cada conjunto de dados Dispersão ou variabilidade de um conjunto referese à maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação Carlos Augusto de Medeiros chefe da Unidade de Administração Geral da Fundação Universidade Aberta do Distrito Federal Não Pode Faltar Desvio Vamos considerar os dados do 1 2 e 3 conjuntos apresentados anteriormente como sendo provenientes de censo das variáveis X Y e Z respectivamente Denominamos desvio a diferença de um valor do conjunto com relação à média Para os conjuntos de dados apresentados anteriormente temos os desvios calculados na Tabela 214 lembrese de que x y z 90 Tabela 214 Desvios dos conjuntos de dados i Valores do conjunto Desvios 1 90 86 30 90 90 0 86 90 4 30 90 60 2 90 88 60 90 90 0 88 90 2 60 90 30 3 90 90 90 90 90 0 90 90 0 90 90 0 4 90 92 120 90 90 0 92 90 2 120 90 30 5 90 94 150 90 90 0 94 90 4 150 90 60 Total Σx 450 Σy 450 Σz 450 Σxi x 0 Σyi y 0 Σzi z 0 Observe que para as amostras das variáveis X Y e Z a soma de todos os desvios é igual a zero Isso não ocorre somente para estes conjuntos mas para todos os conjuntos de dados Desse modo qualquer tentativa de utilizar a soma dos desvios Σxi x para dimensionar a variabilidade dos dados será frustrada Isso ocorre pois os desvios negativos neutralizam os positivos tornando o total igual a zero Para driblar esse contratempo os estatísticos se utilizam de um artifício matemático o valor absoluto O valor absoluto de um número corresponde à distância que este se encontra do 0 zero A distância é sempre um valor positivo ou zero Outra maneira de neutralizar o efeito do sinal negativo ocorrido na Tabela 214 é elevar cada desvio ao quadrado como mostra a Tabela 216 O desvio padrão simbolizado por Dp é uma medida de dispersão definida como a raiz quadrada da variância VarB b b² 3 959 1038² 1065 1038² 1090 1038² 3 6241 729 2704 3 322467 relatório são definidas determinadas regrasnormas as quais o pesquisador segue fielmente deixandoas explícitas para os leitores De modo semelhante para adotarmos certa padronização iremos recorrer à Tabela 217 Consideraremos a média representativa de um conjunto de dados quando este tiver baixa dispersão U2 Estatística descritiva 116 A mediana seria representativa nos casos em que apenas poucos valores do conjunto se distanciam consideravelmente da média Quando isso ocorre geralmente esses valores são denominados outliers ou valores atípicos Avançando na Prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois ascompare com as de seus colegas 1 Competências de fundamentos de área Conhecer os conceitos matemáticos básicos e pro porcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Compreender a utilização das medidas de dispersão 3 Conteúdos relacionados Variância Desvio padrão Coeficiente de variação 4 Descrição da situação problema Uma área em que a estatística está muito presente é a de controle de qualidade Geralmente processos industriais procuram uniformidade nos produtos que saem de uma linha de produção Imagine que uma fábrica de refrigerantes que envasa embalagens de 1 litro e de 600 mililitros utilize os seguintes critérios para realizar o controle de qualidade Serão amostradas sistematicamente para controle de qualidade 5 da produção a cada 20 embalagens de cada tipo será retirada 1 para conferência do volume de refrigerante Se uma amostra de tamanho n 20 apresentar coeficiente de variação superior a 4 todo o lote de 400 embalagens correspondente a essa amostra será rejeitado Com base nesses critérios analise as amostras a seguir e decida a Qual das amostras é mais homogênea b Qual das amostras causará rejeição do lote de refrigerantes Amostra de embalagens de 1 litro 0983 1025 1047 1027 1013 0958 0996 0991 0960 1036 0987 0971 0972 1016 Amostra de embalagens de 600 mililitros 627 641 556 591 590 613 646 565 614 592 584 627 600 597 Sejam X volume das embalagens de 1 litro Y volume das embalagens de 600 mililitros Temos x X nx 0983 1025 1050 0969 20 0999 VarX Xx2 nx1 0983 09992 096909992 201 0000912 DpX 0000912 0030199 CVX DpX x 0030199 0999 003 3 y Y ny 627 641 586 578 20 60575 VarY Yy2 ny1 627605752 578605752 201 73893 2718 DpY 73893 2718 CVY DpY y 2718 60575 0045 45 Em relação à pergunta a como CVY CVX segue que a amostra de X é mais homogênea ou seja a amostra de refrigerantes de 1 litro é mais homogênea que a de 600 mililitros Com relação à pergunta b como CVX 4 CVY a amostra de Y causará rejeição do lote enquanto a amostra de X está dentro das conformidades O desvio é a diferença de um valor do conjunto com relação à média O desvio médio simbolizado por Dm é uma medida de dispersão calculada por meio da média aritmética dos valores absolutos dos desvios A variância simbolizada por Var é uma medida de dispersão calculada por meio da média aritmética dos quadrados dos desvios O desvio padrão simbolizado por Dp é uma medida de dispersão definida como a raiz quadrada da variância O coeficiente de variação simbolizado por CV é uma medida de dispersão definida como a razão entre o desvio padrão e a média de um conjunto de dados Um conjunto de dados é classificado como baixa dispersão se CV 15 média dispersão se 15 CV 30 alta dispersão se CV 30 Na seção 22 no tópico Faça você mesmo foi proposto que junto com seus colegas você pesquisasse a altura dos alunos da turma Verifique se a média é representativa do conjunto de dados de acordo com os critérios estabelecidos nesta seção O conjunto de dados a seguir obtido a partir da população possui média x 33 Assinale a alternativa que contém o desvio padrão do conjunto y 20 40 60 a 1844 b 1846 c 1863 d 1802 e 1774 4 Observe os conjuntos A123 B234 e C567 Assinale a alternativa que apresenta respectivamente a classificação desses conjuntos quanto à dispersão a alta dispersão média dispersão média dispersão b média dispersão média dispersão baixa dispersão c alta dispersão alta dispersão média dispersão d alta dispersão baixa dispersão média dispersão e alta dispersão média dispersão baixa dispersão 5 Considerando o apresentado nessa seção e os conjuntos A123 B234 e C567 assinale a alternativa que completa a frase A média é uma medida representativa U2 Estatística descritiva 120 6 Os dados a seguir referemse às alturas dos atletas das seleções masculina e feminina do vôlei brasileiro que participaram das Olimpíadas de Atenas em 2004 Seleção masculina X 199 199 201 184 192 196 203 184 195 191 205 190 Seleção feminina Y 177 179 184 180 194 180 173 188 179 180 185 190 Calcule a média a variância o desvio padrão e o coeficiente de variação de cada conjunto e conclua em qual deles há maior variabilidade na altura dos atletas 7 Observe os dados a seguir 1000 1260 1320 1380 1410 1645 1980 2106 2230 2239 2379 2760 3060 3120 3460 4030 4260 5050 5120 6460 Esse conjunto referese aos salários amostrados de alguns funcionários de uma grande empresa Calcule a média e justifique por que ela não é representativa para esse conjunto Em seguida construa um histograma para sintetizar os dados Os intervalos de classes devem ser 1000 2000 2000 30003000 40004000 50005000 60006000 7000 U2 Estatística descritiva 121 Referências ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística aplicada à administração e economia Trad José Carlos Barbosa dos Santos 2 ed São Paulo Cengage Learning 2011 CRESPO Antônio A Estatística fácil 17 ed São Paulo Saraiva 2002 FREUND John E Estatística aplicada economia administração e contabilidade Trad Claus Ivo Doering 11 ed Porto Alegre Bookman 2006 FUTPÉDIA Disponível em httpfutpediaglobocomcampeonatocopado mundo Acesso em 13 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística População presente e residente Disponível em wwwibgegovbr Acesso em 14 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística Produção vegetal Disponível em wwwibgegovbr Acesso em 14 maio 2015 JOHNSON Robert KUBY Patrícia Estatística São Paulo Cengage Learning 2013 MEDEIROS Valéria Z Coord Métodos quantitativos com excel São Paulo Cengage Learning 2008 MORETTIN Luiz G Estatística básica probabilidade e inferência São Paulo Pearson Prentice Hall 2010 UOL Esporte Disponível em httpesporteuolcombrfutebolbiografias559 pele Acesso em 28 abr 2015 U3 Estatística inferencial parte I 123 Unidade 3 Estatística inferencial parte I Tomamos nossas decisões com base em conhecimentos prévios e experiências vivenciadas em situações semelhantes Fazemos isso com o objetivo de potencializar os benefícios ou minimizar os efeitos negativos entretanto sempre estamos sujeitos a erros Sabendo disso uma área da estatística denominada estatística inferencial tenta mensurar as chances de ocorrerem erros e acertos nas tomadas de decisão Você aprendeu na unidade anterior a coletar classificar organizar e apresentar dados No que se refere à apresentação foram discutidos métodos pontuais que denominamos medidas de posição e vimos que nem sempre uma medida como a média é capaz de representar um conjunto Mais adiante você verá que a chance de uma média estimada corresponder exatamente ao parâmetro populacional é muito pequena ou até impossível de ocorrer Desse modo o que a estatística inferencial tenta fazer por exemplo é mensurar a chance de determinado estimador pertencer a um intervalo Outro objeto de estudo da estatística inferencial é o levantamento e o teste de hipóteses Por exemplo podemos considerar como hipótese a afirmativa o produto A pertence ao lote 1 O que a estatística inferencial irá fazer nesse caso é aceitar ou refutar essa afirmação com certa margem de incerteza algo que sempre está presente na estatística Para trabalharmos todas essas ideias fazse necessário abordar alguns pontos importantes probabilidade distribuições amostrais intervalos de confiança e testes de hipóteses Um a um esses pontos serão discutidos no decorrer desta unidade e ao final esperamos que você seja capaz de estimar probabilidades construir intervalos de confiança para estimadores e testar hipóteses estatísticas objetivando a tomada de decisão Bons estudos Convite ao estudo U3 Estatística inferencial parte I 124 Seção 31 Noções de probabilidade Diálogo aberto Qual é a chance de você ser atingido por um raio E de ganhar na Mega Sena Pode parecer piada mas é mais fácil ocorrer o primeiro do que o segundo acontecimento As chances de acertar as seis dezenas são de uma para cada 50 milhões aproximadamente Já as chances de ser atingido por um raio durante sua vida são de uma para cada 6250 de acordo com a National Oceanic and Atmosferic Administration A chance de ocorrência de determinado acontecimento é mensurada pela probabilidade uma subárea da matemática que se tornou o pilar da estatística inferencial Com base nessa mensuração podemos tomar decisões apoiados em certos níveis de segurança do que pode vir a ocorrer Lembrase de que na Unidade 2 fizemos uma coleta de dados com base em uma amostra de funcionários da empresa M Com base nessa amostra é possível medir a chance de sortear um funcionário na empresa e este ser do sexo masculino Ou então qual é a chance de ele pesar 70 quilogramas ou mais Essas e outras questões serão respondidas ao longo desta seção Bons estudos Noção de probabilidade Para ilustrarmos a ideia de probabilidade considere o diagrama de dispersão representado na Figura 31 o qual se refere a uma amostragem de funcionários da empresa M Nesse diagrama pontos marcados sobre as marcas de escala no eixo horizontal referemse àquele valor específico por exemplo exatamente 1 funcionário declarou ter exatamente 155 m Já os pontos marcados entre duas marcas de escala referemse a funcionários que declararam ter altura entre esses valores e não Não pode faltar U3 Estatística inferencial parte I 125 iguais a eles por exemplo exatamente 4 funcionários declararam ter mais de 155 m e menos de 160 m Como já foi descrito na Unidade 2 o diagrama de dispersão tenta dar uma ideia da distribuição dos valores de uma variável Observando a Figura 31 por exemplo podemos perceber que os valores estão concentrados em torno de 175 m e as frequências diminuem conforme nos afastamos desse valor Intuitivamente temos a impressão de que ao selecionarmos aleatoriamente um funcionário dessa amostra as chances de que ele tenha por volta de 175 m são maiores que as chances de que ele tenha por volta de 155 m Antes de continuarmos fazse necessário introduzir alguns conceitos Figura 31 Frequência das alturas de uma amostra de 167 da empresa M Fonte Os autores 2015 Assimile Denominamos experimento todo e qualquer ato de experimentação ou experiência e investigação de determinado fenômeno sob condições controladas a fim de observálo e classificálo Como exemplo de experimento temos a investigação da altura dos funcionários da empresa M O conjunto de todos os resultados possíveis na investigação de uma variável em um experimento é denominado espaço amostral o qual denotamos por Ω ômega O espaço amostral da variável altura é o intervalo 0 0 t R t Ω que contempla os valores maiores que zero Um valor específico pertencente a um espaço amostral é denominado ponto amostral A altura 175 m é um exemplo de ponto amostral de Ω Qualquer subconjunto de um espaço amostral é denominado evento As alturas compreendidas entre 155 m e 175 m por exemplo compõem um evento Medimos a chance de ocorrência de determinado evento utilizando a probabilidade Simplificadamente a probabilidade é um valor numérico compreendido no intervalo 01 t ℝ 0 t 1 e calculado por meio da razão entre o número de resultados favoráveis ao evento em questão pelo total de resultados possíveis no espaço amostral Quanto mais próximo de 0 menor é a chance de ocorrência de um evento quanto mais próximo de 1 maior é a chance de ocorrência Vamos compreender melhor o conceito de probabilidade por meio do exemplo a seguir Considerando a Figura 31 qual é a probabilidade de em um sorteio ao acaso selecionarmos um funcionário da empresa M que possua altura maior ou igual a 185 m e menor que 190 m Resolução Considere o evento A faltas maiores ou iguais a 185 m e menores que 190 m Denotamos por nA o número de elementos do conjunto A ou seja o número de ocorrências de alturas no intervalo citado Observando o diagrama de dispersão vemos que nA 17 10 7 Além disso o espaço amostral Ω possui 167 elementos ou seja nΩ 167 Dessa forma a probabilidade de ocorrência do evento A é igual a PA nA nΩ 17 167 0102 102 No exemplo anterior denotando por X a variável altura e por x um ponto amostral qualquer podemos simbolizar a probabilidade de ocorrência do evento A por PA P185 X 190 Dados dois eventos B e C sendo PB 1 100 e PC 0 0 dizemos que B é um evento certo e que C é um evento impossível Ainda considerando a Figura 31 calcule a P160 X 170 c PX 200 U3 Estatística inferencial parte I 127 b P165 X 190 d P150 X 200 Curva normal Observando a Figura 31 você notou alguma peculiaridade A forma como os pontos se distribuem se assemelha a algum objeto conhecido do mundo real Esperamos que você tenha notado que a forma como os pontos se distribuem se assemelha a um sino Observe novamente esse diagrama na Figura 32 na qual adicionamos uma linha contínua contornando os pontos A linha contornando os pontos denominada curva normal obedece a uma regra matemática dada por uma função do tipo exponencial descrita por µ σ f x e x σ π µ σ 2 2 1 2 2 2 x em que x corresponde a um ponto amostral μ mu é a média da população σ2 é a variância populacional e σ sigma é o desvio padrão populacional Figura 32 Frequência das alturas de uma amostra de 167 da empresa M Curva normal Fonte Os autores 2015 Atenção Na Unidade 2 com exceção da variância e do desvio padrão não fizemos distinção simbólica entre medidas calculadas a partir de uma amostra e medidas calculadas a partir de dados populacionais Naquele momento não havia necessidade de abordar essa diferença Entretanto agora podemos ampliar a simbologia U3 Estatística inferencial parte I 128 média amostral VarX variância amostral1 DpX desvio padrão amostral μ média populacional σ2 variância populacional σ desvio padrão populacional As demais medidas por serem utilizadas em menor frequência não serão simbolizadas de forma diferente para amostras ou populações 1 Alguns autores também denotam a variância amostral por s2 e o desvio padrão amostral por s A função f descrita anteriormente chamada de função densidade de probabilidade fdp é determinada pelos valores de μ e σ2 Sendo X uma variável que possui distribuição dos dados com formato de sino caracterizada por μ e σ2 simbolizamos X N μ σ2 para descrever que X possui distribuição normal com média μ e variância σ2 Variáveis com distribuição normal são muito comuns na natureza Um dos principais estudiosos a observálas foi Carl Friedrich Gauss 17771855 em seus trabalhos sobre astronomia por volta de 1810 Motivo pelo qual alguns autores também denominam gaussiana essa distribuição A probabilidade de ocorrência de um evento está diretamente ligada aos parâmetros μ e σ2 provenientes da população Conhecendo esses valores considerando dada variável com distribuição normal e um evento A podemos calcular a probabilidade de ocorrência de A por meio do cálculo de uma área Exemplificando Identifique a área correspondente à probabilidade de ocorrência de A Z 05 e Z 21 sendo ZN 01 Resolução Observe que para esse exemplo μ 0 e σ2 1 e σ 1 Com isso a fdp fica 0 1 f z e z 1 2 2 2 π cujo gráfico está representado na Figura 33 A área R destacada corresponde à probabilidade de ocorrência de A ou seja PA R Figura 33 Distribuição da variável Z Fonte Os autores 2015 U3 Estatística inferencial parte I 129 No exemplo anterior temos ZN 01 Pelo fato de μ 0 e σ2 1 essa distribuição recebe uma denominação especial normal padrão ou normal padronizada Veja outras curvas normais em httpwwwufpabrdicasbiomebiofigcurnor02gif para diferentes valores dos parâmetros μ e σ2 O cálculo da área R destacada no exemplo é feito por meio de técnicas que não serão detalhadas aqui pois não é o objetivo do nosso estudo Uma maneira alternativa e mais simples para o cálculo dessa área é a utilização da Tabela da Distribuição Normal Padrão ou tabela Z Para compreendermos a utilização dessa tabela fazemse necessárias algumas observações A área limitada pela curva normal e pelo eixo horizontal fz 0 de Z até Z é igual a 1 no exemplo anterior temos P Z PΩ 1 Pa X b PX b PX a área sob a curva entre a e b no exemplo anterior temos P05 Z 21 R PX x0 0 para x0 fixo Na prática a probabilidade de ocorrência de um valor específico é igual a zero o que nos força a calcular a probabilidade para intervalos e não para valores particulares No exemplo anterior temos PZ 05 0 0 PX μ PX μ 05 ou seja a probabilidade de X ser menor que a média é igual a 50 assim como a probabilidade de X ser maior que a média no exemplo anterior temos PZ 0 PZ 0 05 PX x 1 PX x Entendidas essas observações vamos então ao cálculo da área R A Tabela 31 apresenta o valor da área abaixo da curva fz acima do eixo horizontal fz 0 entre Z e Z z como mostra a Figura 34 Simbolizamos o valor dessa área por PZ z ou PZ z Figura 34 Área representada por PZ z Fonte Os autores 2015 Para calcularmos PA P05 Z 21 efetuaremos P05 Z 21 Z 21 Z 05 pois os valores à direita da igualdade podem ser consultados na Tabela 31 em destaque Para calcularmos PZ 21 consultamos a primeira coluna da tabela onde há o valor z 2 Em seguida percorremos essa linha até alcançarmos a coluna z 01 Como 21 2 01 temos que PZ 21 0982 De modo semelhante chegamos a PZ 05 0691 Logo PA P05 Z 21 PZ 21 PZ 05 0982 0691 0291 291 Portanto o evento A Z 05 e Z 21 tem 291 de chance de ocorrência Normalização de variáveis Como você deve ter notado na indicação que fizemos anteriormente uma distribuição normal depende dos parâmetros μ e σ² Se formos considerar todas as possibilidades de μ e σ² teríamos que ter infinitas tabelas para consultar as probabilidades correspondentes Para contornar essa dificuldade normalizamos a variável em questão Considere XNμσ² e a transformação Z X μσ Nessas condições é possível demonstrar que ZN01 ou seja Z é uma variável normal padronizada PX x PZ z em que z x μ σ Com o auxílio dessa transformação podemos utilizar a Tabela 31 para calcularmos PX x para quaisquer μ e σ² Sendo XN104 calcule a PX 64 b P88 X 116 Resolução a PX 64 1 PX 64 1 PZ z em que z 64 10 4 36 2 18 Consultando a Tabela 31 vemos que PZ 18 0036 linha z 1 coluna z 08 Logo PX 64 1 PZ 18 1 0036 0964 964 b P88 X 116 PX 116 PX 88 Calculamos separadamente PX 116 e PX 88 PX 116 PZ z em que z 116 10 4 16 2 08 Consultando a tabela vemos que PX 116 PZ 08 0788 788 PX 88 PZ z em que z 88 10 4 12 2 06 Consultando a tabela vemos que PZ 06 0274 linha z 0 coluna z 06 Logo PX 88 PZ 06 0274 274 Portanto P88 X 116 PX 116 PX 88 0788 0274 0514 514 Para consultar uma tabela de distribuição normal mais completa que a Tabela 31 acesse o link a seguir Tabela normal padrão Disponível em httpwwwlegufprbrsilviaCE001tabelanormalpdf ² No decorrer deste livro sempre serão utilizados os valores desta tabela Sem medo de errar Vamos relembrar a situaçãoproblema proposta no início desta seção Com base na amostra de funcionários apresentada na Tabela 21 é possível medir a chance de sortear um funcionário na empresa e este ser do sexo masculino Ou então qual é a chance de ele pesar 70 quilogramas ou mais Para responder a essas questões vamos representar as variáveis sexo e peso respectivamente por X e Y e considerar os eventos A funcionário sorteado ser do sexo masculino e B funcionário sorteado ter 70 quilogramas ou mais As perguntas anteriores podem ser representadas simbolicamente por PA PX masculino e PB PY 70 respectivamente Para o cálculo de PA e PB vamos utilizar os dados amostrais e supor que os verdadeiros parâmetros populacionais sejam próximos O número de homens na amostra é igual a 11 e o total de elementos amostrados foi 20 Logo PA 1120 055 55 Para o cálculo de PB vamos supor que YNμσ² Você pode verificar a partir da Tabela 21 que ȳ 7605 VarY 1379 e DpY 117 Sendo assim consideraremos μ ȳ 7605 σ² VarY 1379 e σ DpY 117 Assim PB PY 70 1 PY 70 1 PZ z em que z 70 7605 117 05 Consultando a tabela Z temos PZ 05 0309 Logo PB 1 PZ z 1 0309 0691 691 Para finalizar a probabilidade de sortear um funcionário do sexo masculino na empresa M é de 55 e a de ele ter 70 quilogramas ou mais é de 691 Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competências técnicas Não se aplica 2 Objetivos de aprendizagem Compreender o conceito de probabilidade e suas aplicações 3 Conteúdos relacionados Probabilidade Distribuição normal 4 Descrição da SP Em uma indústria para garantir a qualidade são inspecionadas amostras de 15 unidades a cada lote de 200 produzidas A seguir constam as medições em mililitros dos conteúdos de duas amostras uma do lote 1 e outra do lote 2 Lote 1 104 95 96 104 96 104 101 104 104 103 100 100 100 102 95 Lote 2 105 104 100 96 97 105 100 100 94 97 99 97 104 102 101 O lote deve ser descartado se a probabilidade de nele conter uma unidade do produto com menos de 95 mililitros for maior que 6 Pergunta qual lote deve ser descartado 1 ou 2 Utilize os estimadores como aproximações para os parâmetros populacionais Fazemos algumas considerações X quantidade em mililitros de cada unidade do produto no lote 1 Y quantidade em mililitros de cada unidade do produto no lote 2 A uma unidade do produto conter menos de 95 mililitros Você pode verificar que x 10067 DpX 352 y 10007 DpY 345 Assim Lote 1 PA PX 95 PZ z em que z 9510067 352 16 Consultando a tabela Z temos PX 95 PZ 16 0055 55 Lote 2 PA PY 95 PZ z em que z 9510007 345 15 Consultando a tabela Z temos PY 95 PZ 15 0067 67 Como PX 95 6 PY 95 segue que o lote 2 deve ser descartado Experimento todo e qualquer ato de experimentação ou experiência e investigação de determinado fenômeno sob condições controladas a fim de observálo e classificálo Espaço amostral conjunto de todos os resultados possíveis na investigação de uma variável em um experimento o qual denominamos por Ω Ponto amostral valor específico pertencente a um espaço amostral Evento qualquer subconjunto de um espaço amostral U3 Estatística inferencial parte I 135 Probabilidade valor numérico compreendido no intervalo 01 t ℝ 0 t 1 e calculado por meio da razão entre o número de resultados favoráveis a um evento pelo total de resultados possíveis no espaço amostral Faça você mesmo Sendo X a altura em metros dos alunos de graduação no Brasil faça uma estimativa para PX 145 Para isso calcule as estatísticas x e DpX a partir da sua turma e utilize esses valores como aproximação para os verdadeiros parâmetros populacionais Faça valer a pena 1 Assinale a alternativa INCORRETA a A probabilidade é igual à razão entre o número de resultados favoráveis a um evento pelo total de resultados possíveis no espaço amostral b Denominamos evento qualquer subconjunto de um espaço amostral c Um ponto amostral é um valor específico de Ω d Quando a probabilidade de ocorrência de um evento é igual a zero dizemos que o evento é certo e Quanto mais próxima de 1 maior a probabilidade de ocorrência de um evento 2 Considere Ω a b c d e f g h i j k l e um evento A b d f Assinale a alternativa que contém PA a 020 b 025 c 030 d 035 e 040 3 Sendo YN01 assinale a alternativa que contém o valor de PY 16 a 0945 U3 Estatística inferencial parte I 136 b 0055 c 1000 d 0000 e 0726 4 Considere ZN01 e um ponto amostral z 0 tal que Pz Z z 954 Assinale a alternativa que contém o valor de z a 10 b 15 c 20 d 25 e 30 5 Sendo XN159 assinale a alternativa que contém o valor de P12 X 18 a 159 b 841 c 628 d 429 e 682 6 Considerando XN5016 e YN10025 qual o evento mais provável sortear um valor de X menor que 48 ou um valor de Y maior que 102 7 Em determinada linha de produção um produto é descartado se seu peso for menor que 49 kg Sabese que a variável peso X nessa linha de produção possui distribuição normal com média de 5 kg e desvio padrão de 006 kg Nessas condições qual é a probabilidade de se descartar um produto U3 Estatística inferencial parte I 137 Seção 32 Distribuição dos estimadores Diálogo aberto Você aprendeu na seção anterior o conceito de probabilidade e como ele pode ser aplicado a situações reais tais como no exemplo do controle de qualidade Nesse exemplo e em outros momentos utilizamos os valores x e VarX para estimar os verdadeiros parâmetros μ e σ2 e solicitamos a você que fizesse o mesmo Como é de se esperar sempre que utilizamos x e VarX para estimar μ e σ2 estamos cometendo erros Muitas vezes esses erros são tão importantes quanto o valor que se pretende estimar Você confiaria por exemplo em uma estimativa para a altura média da população brasileira de 190 m considerando que o dado não seja acompanhado de nenhuma informação sobre os erros de estimativa Essa informação é um tanto quanto suspeita Quando apresentamos estimadores como a média e a variância seja em relatórios artigos obrigatoriamente temos de apresentar informações acerca dos erros de estimativa pois isso dá credibilidade Nesse contexto podemos nos perguntar fixada certa probabilidade de acerto e dado x calculado a partir de uma amostra qual é o erro que estamos cometendo ao aproximar μ por x Ou ainda fixada uma probabilidade de acerto qual é o tamanho da amostra que temos de coletar para cometer um erro máximo predeterminado Essa última pergunta nos faz relembrar uma informação dada na Unidade 2 de que quanto maior a amostra melhor a estimativa feita dos verdadeiros parâmetros Nesta seção você verá uma justificativa concreta para essa afirmação Entretanto para iniciarmos os estudos propomos a seguinte situaçãoproblema com uma probabilidade de 95 de acerto qual é o erro máximo que estamos cometendo ao aproximar a média do peso dos funcionários da empresa M por y 7605 Qual deveria ser o tamanho da amostra para que o erro fosse de no máximo 2 kg Para que possamos responder a essas perguntas precisamos entender melhor a distribuição de probabilidade da média amostral Não pode faltar Teorema do Limite Central Para entendermos o que significa distribuição de probabilidade da média considere que ao observar uma variável X na população tenhamos obtido Ω 1234 Qual o valor de µ Lembrese de que µ é a média populacional e um cálculo simples mostra que µ 1234 4 25 Ao retirar uma amostra de tamanho 2 dessa população conseguiríamos estimar precisamente µ por x Ou ainda em todas as amostras o valor de x seria o mesmo As respostas para essas perguntas são respectivamente pouco provável e não Veja a seguir todas amostras possíveis de tamanho 2 e suas respectivas médias Amostra x Amostra x Amostra x 11 10 21 15 31 20 41 25 12 15 22 20 32 25 42 30 13 20 23 25 33 30 43 35 14 25 24 30 34 35 44 40 Podemos montar um diagrama de dispersão com os valores das médias amostrais como na Figura 35 Figura 35 Frequências das médias amostrais Fonte Os autores 2015 Observou algo de curioso na forma como os dados se distribuíram A linha ajudou mas esperamos que você tenha notado que os dados se distribuíram de forma semelhante a uma curva normal A média amostral também pode ser considerada uma variável Vamos calcular a média das médias amostrais µ x e a variância das médias amostrais σ² x para termos uma ideia quantitativa da distribuição µ x 101520303540 16 40 16 25 σ² x 1025²1525²3525²4025² 16 10 16 0625 Observe que a média das médias amostrais é exatamente igual à média da população ou seja µ x µ E quanto à variância será que σ² x σ² Vejamos σ² 1025²2025²3025²4025² 4 5 4 125 Note que σ² x σ² resultado que pode ser mais bem compreendido com a leitura do Teorema do Limite Central TLC De acordo com Morettin 2010 o TLC diz que para n amostras aleatórias simples retiradas de uma população com média µ e variância σ² finita a distribuição amostral da média aproximase para n grande de uma distribuição normal com média µ e variância σ²n O TLC é de extrema importância para a estatística inferencial e tem implicações muito interessantes Observe que apesar de ele não dizer nada a respeito da distribuição da população afirma que a distribuição amostral da média aproximase de uma curva normal e além disso essa distribuição tem a mesma média que a população e variância σ²n isto é a mesma variância que a população mas dividida por n A partir desse resultado concluímos que quanto maior o número de amostras mais precisão teremos para a média pois σ²n diminui conforme n aumenta Podemos visualizar esse resultado na Figura 36 Figura 36 Distribuição amostral da média x de uma população XN01 para vários valores de n n 10 fx fx n 40 fx fx n 70 fx fx n 100 fx fx Fonte Os autores 2015 Se X N01 a fdp da variável x pode ser escrita como fx01n n2π enx²2 Com base no TLC há ainda dois resultados interessantes que podemos enunciar De acordo com Morettin 2010 sendo X uma variável com média μ e variância σ² finita e x a variável média amostral então a variável Z xμσn nxμσ tem distribuição normal com média 0 e variância 1 ou seja Z N01 Podemos ainda definir a variável e como a diferença entre o estimador x e o parâmetro μ ou seja e xμ Determinando o tamanho de uma amostra Vamos relembrar um questionamento feito no início desta seção fixada certa probabilidade de acerto e dado x calculada a partir de uma amostra qual é o erro que estamos cometendo ao aproximar μ por x Ou ainda fixada uma probabilidade de acerto qual é o tamanho da amostra que temos de coletar para cometer um erro máximo predeterminado Vamos supor que o erro máximo que estimulamos para estimar a média populacional seja ε Desse modo qualquer valor x no intervalo μεμε nos deixará satisfeitos para essa estimativa Para assimilar melhor suponha que queiramos estimar a verdadeira média populacional μ 170 m da altura de certo grupo de atletas e para isso queiramos cometer um erro máximo de ε 2 cm Portanto qualquer valor de x pertencente ao intervalo 168 m 172 m servirá Além disso para acompanhar essa estimativa suponha que queiramos ter uma probabilidade de acerto de γ 95 por exemplo uma margem de segurança Matematicamente afirmar que x pertence ao intervalo μεμε implica με x με ou xμ ε Além disso ter uma probabilidade de acerto de γ que xμ ε pode ser traduzido matematicamente por Pxμ ε γ Com base nos resultados obtidos do TLC temos Pxμ ε γ Pε xμ ε γ Pnεσ xμnσ nεσ γ Lembrese de que Z nxμσ logo Pnεσ xμ nεσ γ Pnεσ Z nεσ γ Dado um valor y podemos obter na tabela Z um valor zy tal que Pzy Z zy γ e ainda zy nεσ zyσ nε n zyσ²ε² Observe que se tivermos o conhecimento de σ² podemos estimar n em função de y e ε prefixados ou estimar ε em função de y e n Com base na última igualdade podemos justificar a afirmativa feita na Unidade 2 de que o erro diminui à medida que o tamanho da amostra aumenta pois n zyσ²ε² ε² zyσ²n ε zyσ²n Podemos agora observando a última igualdade ver claramente que se n aumenta n o erro diminui ε 0 Seja uma variável XNμ4 observada em dada população Com precisão de 95 qual o erro máximo que cometemos ao estimar a verdadeira média dessa população com base em uma amostra de tamanho n 30 90 qual o tamanho da amostra que deve ser coletada para que o erro seja de no máximo ε 1 Resolução a Observe que a fórmula do erro ε zy²σ²n depende de zy σ² e n O parâmetro σ² 4 foi dado e n 30 Resta determinar zy em que γ 95 095 para que tenhamos Pzy Z zy γ 095 Observe a Figura 37 Figura 37 Região correspondente a Pzy Z zy 095 Fonte Os autores 2015 Veja que o valor zy deve ser tal que PZ zy 0025 095 0975 Consultando a tabela Z temos zy 196 Logo ε zy²σ²n 196²430 072 Portanto com precisão de 95 o erro máximo que cometemos ao estimar a verdadeira média dessa população com base em uma amostra de tamanho n 30 é ε 072 Figura 38 Região correspondente a Pzy Z zy 090 Pε x μ ε γ Px ε μ x ε γ Px ε μ x ε γ Sem medo de errar Se com 98 de probabilidade de acerto o erro amostral da média for superior a 005 L a linha de produção é pausada para verificações nos equipamentos Como ε 005 L a decisão seria diferente ou seja se γ 901 a linha de produção não seria pausada U3 Estatística inferencial parte I 148 Faça valer a pena 1 Seja uma variável XNμ9 observada em dada população Com precisão de 90 assinale a alternativa que contém o erro máximo que cometemos ao estimar a verdadeira média dessa população com base em uma amostra de tamanho n 25 a 1099 b 0099 c 2909 d 2970 e 0990 2 Seja uma variável XNμ 16 observada em dada população Supondo que queiramos um erro amostral da média máximo de ε 1 com 94 de probabilidade entre as alternativas a seguir assinale aquela que contém o menor tamanho de amostra que possibilite esse erro máximo estabelecido a 46 b 55 c 59 d 62 e 68 3 Os conjuntos de dados a seguir são obtidos a partir de amostragem Eles representam as idades de determinado grupo de frequentadores de um estabelecimento Grupo 1 X1 31 27 33 33 24 25 28 29 24 31 Grupo 2 X2 31 28 28 30 29 31 31 28 Grupo 3 X3 30 28 31 28 31 30 28 31 29 32 Sendo ε1 ε2 e ε3 os erros amostrais dos grupos 1 2 e 3 respectivamente assinale a alternativa correta a ε1 ε2 ε3 b ε1 ε2 ε3 c ε1 ε2 ε3 U3 Estatística inferencial parte I 149 d ε1 ε2 ε3 e ε1 ε2 ε3 4 As variáveis XNμx49 YNμY45 e WNμw30 são observadas em uma população Desejase coletar uma única amostra para estimar a média populacional de ambas as variáveis Para os estudos que serão realizados é necessário que o erro amostral da média seja no máximo ε 2 com confiança de 9030 8812 e 9796 para as variáveis X Y e Z respectivamente Desse modo assinale a alternativa que contém o menor tamanho de amostra que atenda a essas exigências a n 41 b n 34 c n 28 d n 26 e n 49 5 Para a realização de certo estudo coletouse a seguinte amostra 1075 979 1034 1090 904 920 908 1026 963 Foi constatado com 95 de probabilidade que o erro amostral da média era de no máximo 4638 valor que foi considerado alto Com base nisso estabeleceuse um novo erro máximo tolerado ε 15 sendo necessário coletar uma nova amostra que será dimensionada com base na variância VarX da amostra que será descartada Assinale a alternativa que contém a dimensão da nova amostra a 43 b 94 c 72 d 87 e 112 6 Enuncie o Teorema do Limite Central e elenque duas de suas consequências U3 Estatística inferencial parte I 150 7 As duas amostras a seguir foram retiradas de uma mesma população e são referentes a uma mesma variável XN μσ2 Amostra 1 X1 616 638 617 597 665 641 586 590 Amostra 2 X2 594 594 630 588 636 596 592 645 616 603 Faça uma estimativa pontual para μ calculando x a partir da amostra que apresentar o menor erro amostral para a média Calcule o erro amostral com precisão de 9386 U3 Estatística inferencial parte I 151 Seção 33 Testes de hipóteses para a média σ2 conhecido Diálogo aberto Você aprendeu anteriormente sobre o Teorema do Limite Central TLC e algumas de suas implicações Esse teorema é de extrema importância para a estatística inferencial e existem diversas situações em que pode ser utilizado sendo que uma delas é no teste estatístico de hipóteses Mas o que significa isso Segundo Morettin e Bussab 2010 p 330 feita determinada afirmação sobre uma população usualmente sobre um parâmetro dessa desejamos saber se os resultados experimentais provenientes de uma amostra contrariam ou não tal afirmação Muitas vezes essa afirmação sobre a população é derivada de teorias desenvolvidas no campo substantivo do conhecimento A adequação ou não dessa teoria ao universo real pode ser verificada ou refutada pela amostra O objetivo do teste estatístico de hipóteses é então fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apoiem ou não uma hipótese estatística formulada Para avançarmos um pouco neste assunto considere a seguinte situaçãoproblema suponha que a empresa M seja uma prestadora de serviços e que irá concorrer com outras para ser contratada para determinado projeto A empresa contratante empresa N afirma que para a execução das tarefas pertinentes ao projeto é desejável que os funcionários possuam em média 80 kg e altura média maior ou igual a 170 cm para utilizarem os Equipamentos de Proteção Individual EPIs de que a empresa dispõe Em vista disso a empresa M declara que seus funcionários se encaixam nesses padrões e acrescenta que em medições feitas recentemente constatouse que o desvio padrão do peso de seus funcionários era 12 kg e que o desvio padrão da altura era 8 cm Considerando que a empresa N tenha acesso aos dados U3 Estatística inferencial parte I 152 amostrados na Tabela 21 ela consegue constatar se a afirmação da empresa M é verídica Para que possamos verificar essas afirmações precisamos compreender melhor como formular hipóteses adotar algumas simbologias que nos auxiliarão no processo e compreender os erros a que estamos sujeitos No decorrer desta seção apresentaremos um roteiro para que você possa testar as hipóteses apresentadas e ao final verificaremos as afirmações Formulando hipóteses As situações abordadas em testes estatísticos de hipóteses podem nos parecer bem familiares Considere por exemplo a afirmação A vai chover hoje Essa afirmação pode ser considerada uma hipótese cuja negativa é outra hipótese B não vai chover hoje Observe que as duas hipóteses levantadas são complementares isto é ocorre a primeira ou ocorre a segunda não há outra possibilidade Como verificar a veracidade da hipótese A É possível ter certeza absoluta da ocorrência de A ou B Para respondermos a essas perguntas observe a Figura 39 Veja que a previsão do tempo para Natal traz uma informação muito importante a probabilidade de precipitação ou seja a chance de chover Para facilitar nossa discussão vamos denotar as hipóteses A e B como a seguir H0 vai chover hoje H1 não vai chover hoje Não pode faltar Temperatura mínima 21 C Temperatura máxima 29 C Probabilidade de precipitação 60 Sol e aumento de nuvens de manhã Pancadas de chuva à tarde e à noite Figura 39 Previsão do Tempo em Natal RN para o dia 18062015 Fonte Climatempo Assimile A hipótese H0 denominada hipótese nula geralmente é afirmativa ou no caso de uma variável quantitativa uma hipótese de igualdade Ela é nossa principal hipótese o foco da nossa análise e a que queremos U3 Estatística inferencial parte I 153 pôr à prova A hipótese H1 denominada hipótese alternativa é aquela que será aceita se rejeitarmos a hipótese nula Atenção Alguns autores também denotam a hipótese alternativa por Ha Em relação a nossa decisão de aceitar ou rejeitar H0 podemos ter quatro resultados possíveis elencados na Tabela 32 Para o nosso exemplo a ocorrência do erro tipo I seria rejeitar a hipótese vai chover hoje e ao final do dia constatarmos que choveu Denotamos por a a probabilidade de ocorrência desse erro e nesse caso a 60 A ocorrência do erro tipo II nesse caso seria não rejeit ar a hipótese vai chover hoje e no final do dia constatarmos que não choveu A probabilidade de ocorrência desse erro é β 40 Podem os escrever Perro tipo I a e Perro tipo II β Portanto respon dendo às perguntas feitas anteriormente para verificar a veracidade da hipótese A temos de realizar um teste de hipóteses Contudo nunca teremos certeza absoluta da ocorrência de uma hipótese pois sempre estamos sujeitos a cometer um dos erros apresentados na Tabela 32 Testando hipóteses Para fixarmos um procedimento para o teste de uma hipótese nula considere o seguinte exemplo Decisão Possibilidades para H0 Verdadeira Falsa Não rejeitar H0 Decisão correta Erro tipo II Rejeitar H0 Erro tipo I Decisão correta Tabela 32 Resultados possíveis para um teste de hipóteses Fonte Morettin 2010 Exemplificando Uma variável X N µ 18 é estudada em determinada população Parte dos pesquisadores suspeita que µ µ 1 55 e outros que µ µ 2 50 No intuito de pôr à prova essas suspeitas eles decidiram fazer testes para identificar qual delas é a correta Para isso foi retirada U3 Estatística inferencial parte I 154 uma amostra da população a qual é apresentada a seguir 49 50 48 51 47 48 55 50 55 49 51 53 Com 95 de confiança qual é a verdadeira média da população µ1 55 ou µ2 50 Resolução Vamos inicialmente testar se µ µ 1 55 Passo 1 elaborar as hipóteses precisamos estipular duas hipóteses a nula e a alternativa Como a hipótese nula é sempre de igualdade como foi descrito anteriormente determinamos H0 µ 55 H1 µ 55 Passo 2 determinar a estatística de teste Como nosso objetivo é testar a média populacional da variável X N µ 18 pelo TLC nossa estatística de teste será x N 55 18 12 ou x N 55 1 5 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância Como queremos 95 de confiança a probabilidade de cometermos o erro tipo I deve ser α 100 95 5 Essa probabilidade também é denominada nível de significância Figura 310 Região crítica para H0 µ 55 e H1 µ 55 com α 5 Fonte Os autores 2015 Rejeitaremos a hipótese H0 caso o valor x obtido a partir da amostra seja muito maior ou muito menor que µ1 55 ou ainda quando x pertencer à região crítica RC ilustrada na Figura 310 A região crítica pode ser denotada por RC x x xc R 1 ou x xc 2 Observando a tabela Z e lembrando que z x n µ σ 2 temos U3 Estatística inferencial parte I 155 z x x x z c c c 1 2 1 96 55 1 5 1 96 1 5 55 55 1 96 1 5 52 6 1 1 1 1 96 55 1 5 1 96 1 5 55 55 1 96 1 5 57 4 2 2 2 x x x c c c RC x x R 52 6 ou x 57 4 Passo 4 calcular a estatística a partir da amostra a média amostral é x0 50 5 Passo 5 tomar uma decisão como x 0 RC decidimos rejeitar H0 isto é há indícios suficientes que nos permitem refutar a possibilidade de a média populacional ser µ1 55 Vamos testar agora se µ µ2 50 Passo 1 elaborar as hipóteses H0 µ 50 H1 μ 50 Passo 2 determinar a estatística de teste x N 50 18 12 ou x N 50 1 5 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância α 5 Rejeitaremos a hipótese H0 caso o valor x obtido a partir da amostra pertença à região crítica RC ilustrada na Figura 311 Observando a tabela Z e lembrando que z x n µ σ 2 temos Figura 311 Região crítica para H0 μ 50 e H1 μ 50 com α 5 Fonte Os autores 2015 U3 Estatística inferencial parte I 156 z x x x z c c c 1 1 96 50 1 5 1 96 1 5 50 50 1 96 1 5 47 6 1 1 1 2 1 96 50 1 5 1 96 1 5 50 50 1 96 1 5 52 4 2 2 2 x x x c c c RC x x R 47 6 ou x 52 4 Passo 4 calcular a estatística a partir da amostra a média amostral é x0 50 5 Passo 5 tomar uma decisão como x 0 RC não podemos rejeitar H0 isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser µ2 50 Desse modo em concordância com o problema apresentado devemos concluir que a verdadeira média da população é µ2 50 Assimile Região crítica região de rejeição da hipótese nula Atenção Testes de hipóteses como o do exemplo anterior são ditos bilaterais pois a região crítica tem parte à esquerda e parte à direita do valor que está sendo testado Caso a região crítica estivesse somente à esquerda do valor que está sendo testado o teste seria unilateral à esquerda caso estivesse somente à direita o teste seria unilateral à direita Veja a seguir um exemplo de teste unilateral à esquerda Exemplificando Uma empresa de telefonia fixa oferece um pacote de acesso à internet com franquia ilimitada e velocidade média mensal de μ 50 Mbps com σ2 6 Mbps² Paulo contratou o serviço e anda desconfiado de que a velocidade média é menor que a anunciada Para testar se está sendo trapaceado pela empresa de telefonia ele mediu a velocidade de sua Passo 1 elaborar as hipóteses H0 μ 50 H1 μ 50 Passo 2 determinar a estatística de teste x N5004 Passo 3 fixar o nível de significância suponha α 5 Como nos interessa H1 μ 50 a região crítica é RC x ℝ x xc com Px xc 5 como mostra a Figura 312 Valorp Se efetuarmos zc fracoverlinex musigmasqrtn obtemos um valor denominado z calculado ou ainda z estrela z como alguns autores preferem denotar Retomando o exemplo anterior temos zc frac489 50sqrt04 approx 174 Veja a representação de zc 174 e de z 164 determinado a partir do nível de significância alpha 5 na Figura 313 Lembrese de que ao fixarmos o nível de significância alpha 5 obtemos z 164 a partir da tabela Z Além disso com a relação PZ leq z Poverlinex leq overlinexc calculamos o valor de overlinexc que serviu de base para analisar a hipótese nula Além dessa metodologia de análise existe outra bastante utilizada a qual envolve o cálculo do valorp No caso do exemplo anterior representado pela Figura 313 o valorp corresponde à área que se apresenta à esquerda de zc abaixo da curva normal e acima do eixo horizontal região hachurada Mais formalmente se o teste de hipóteses for unilateral à esquerda o valorp é igual a PZ leq zc unilateral à direita o valorp é igual a PZ geq zc bilateral o valorp é igual a PZ leq zc PZ geq zc 2 PZ leq zc De acordo com Robert Johnson e Patrícia Kuby 2013 uma vez calculado o valorp podemos adotar a seguinte regra de decisão Se o valorp é menor ou igual ao nível de significância alpha então a decisão deve ser rejeitar H0 Se o valorp é maior que o nível de significância alpha então a decisão deve ser não rejeitar H0 U3 Estatística inferencial parte I 159 Pesquise mais Leia mais sobre os testes de hipóteses no Capítulo 5 do material disponível em httpwwwestufprbrce003materialapostilace003pdf Sem medo de errar Observe que cada afirmação feita pela empresa M trata de uma suposição 1 o peso médio dos funcionários é 80 kg 2 a altura média é maior ou igual a 170 cm Denotando por X e Y respectivamente o peso e a altura temos que as afirmações anteriores podem ser traduzidas matematicamente como μX 80 e μY 170 Sendo assim temos duas hipóteses nulas a serem testadas Problema 1 Problema 2 H0 μX 80 H0 μY 170 H1 μX 80 H1 μY 170 Para ambos os problemas o passo 1 já foi realizado ou seja as hipóteses já foram fixadas Problema 1 testar μX 80 Passo 2 determinar a estatística de teste x N 80 12 2 20 ou x N 80 7 2 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância suponha a 2 e RC como mostra a Figura 314 Consultando a tabela Z e lembrando que z x n µ σ 2 temos Figura 314 Região crítica para H0 μX 80 e H1 μX 80 com a 2 Fonte Os autores 2015 z x x x z c c c 1 2 2 33 80 7 2 2 33 7 2 80 80 2 33 7 2 73 7 1 1 1 2 33 80 7 2 2 33 7 2 80 80 2 33 7 2 86 3 2 2 2 x x x c c c RC x in mathbbR overlinex leq 737 ext ou overlinex geq 863 Passo 4 calcular a estatística a partir da amostra overlinex0 7605 Passo 5 tomar uma decisão como overlinex0 otin RC não podemos rejeitar H0 isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser mux 80 Problema 2 testar muy 170 Passo 2 determinar a estatística de teste overliney sim N170 82 ou overliney sim N170 32 caso a hipótese nula seja verdadeira Passo 3 fixar o nível de significância suponha alpha 2 e RC como mostra a Figura 315 Consultando a tabela Z e lembrando que z fracoverlinex musigmasqrtn temos z 205 Rightarrow fracoverlineyc 170sqrt32 205 Rightarrow overlineyc 170 205sqrt32 approx 1663 RC y in mathbbR overliney leq 1663 Passo 4 calcular a estatística a partir da amostra overliney0 17285 Passo 5 tomar uma decisão como overliney0 otin RC não podemos rejeitar H0 isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser muy 170 Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois compare com as de seus colegas 1 Competências técnicas Não se aplica 2 Objetivos de aprendizagem Realizar testes de hipóteses pela abordagem valorp 3 Conteúdos relacionados Testes de hipóteses para a média com variância conhecida 4 Descrição da SituaçãoProblema Determinada máquina corta barras de metal com 50 cm em média sendo o comprimento dessas barras uma variável X sim Nmu 252 Caso a média dos comprimentos seja superior a 50 cm há prejuízo para a empresa Alguns funcionários suspeitam que a máquina esteja desregelada e que isso tem causado prejuízo Para verificarem a suspeita coletaram uma amostra de tamanho n 36 e obtiveram overlinex 52 cm Utilizando a abordagem valorp e o nível de significância alpha 2 verifique se há indícios suficientes para confirmar a suspeita dos funcionários Passo 1 elaborar as hipóteses H0 mu 50 H1 mu 50 Passo 2 determinar a estatística de teste overlinex sim N50 25236 ou overlinex sim N50 069 Passo 3 fixar o nível de significância alpha 2 dado Passo 4 calcular a estatística a partir da amostra overlinex 52 zc fracoverlinex musigma2n frac52 50sqrt2536 24 valorp PZ z PZ 24 1 PZ 24 082 Passo 5 tomar uma decisão como valorp a optamos por rejeitar H₀ ou seja existem indícios suficientes de que a média populacional é maior que µ 50 Concluímos que há indícios suficientes de que a suspeita dos funcionários pode ser confirmada 1 Considere as hipóteses H₀ µ 100 e H₁ µ 100 elaboradas para a média de uma variável X Nµ9 Para testar essas hipóteses coletouse uma amostra de tamanho n 36 e obtevese x 98 Supondo um nível de significância α 5 assinale a alternativa que contém a região crítica ou seja a região de rejeição da hipótese nula a RC x ℝ x 9918 ou x 10082 b RC x ℝ x 9902 ou x 10098 c RC x ℝ x 99175 ou x 100825 d RC x ℝ x 950 ou x 1050 e RC x ℝ x 975 ou x 1025 c 75 d 50 e 25 e A probabilidade de se selecionar um funcionário desse setor da indústria e este receber mais de R 150000 é menor que 10 6 Considere uma fábrica de refrigerantes que envasam embalagens de 2 L sendo a quantidade de refrigerante nas garrafas uma variável X Nμ 001 Para controle de qualidade são coletadas periodicamente amostras de 20 unidades e mensuradas respectivas quantidades Se ao nível de significância de 2 a hipótese de a média das quantidades ser igual a 2 L for refutada a linha de produção é pausada para verificações e ajustes nos equipamentos Com base na amostra a seguir a linha de produção deve ser pausada 190 209 207 201 189 194 189 215 210 206 213 205 203 204 211 212 215 186 210 198 190 7 Os parafusos fabricados por uma empresa têm resistência média à tração de 120 kg com desvio padrão de 5 kg Um depósito possui uma caixa com parafusos que o proprietário afirma ser desse fabricante Entretanto a informação não pode ser confirmada pois algum funcionário descuidado estragou a embalagem e perdeuse a informação sobre a origem Na tentativa de vender para um comprador interessado nos parafusos desse fabricante ou de melhor qualidade o proprietário do depósito disse que faria um desconto no produto e daria 15 unidades para que o comprador pudesse testar a resistência média à tração e confirmar a origem Da amostra testada o comprador constatou que a resistência média foi de 1175 kg Com essas informações e um nível de significância de 2 é possível confirmar a informação dada pelo proprietário do depósito U3 Estatística inferencial parte I 166 Seção 34 Testes de hipóteses para a média σ2 desconhecido Diálogo aberto Na seção anterior você aprendeu a formular e testar hipóteses Entretanto há um detalhe que deve ser acrescentado nós supusemos que a variância populacional era conhecida Essa suposição também foi feita nas seções 31 e 32 e em alguns casos utilizamos VarX como aproximação de σ2 Diante disso surgem alguns questionamentos 1 em situações reais com que frequência conhecemos o verdadeiro valor de σ2 2 é correto utilizarmos VarX no lugar de σ2 Em relação ao primeiro questionamento a resposta é quase nunca Somente em raras situações isso ocorre Um exemplo inclusive descrito anteriormente é quando o IBGE a cada dez anos realiza um censo e obtém os verdadeiros parâmetros populacionais Se utilizamos no ano seguinte ao censo o valor de σ2 de certa forma estaremos lidando com um parâmetro real mas com um pequeno atraso devemos esperar que ele esteja desatualizado mas podemos supor que o verdadeiro valor seja próximo Essa mesma suposição teria de ser feita com cautela se utilizássemos σ2 muito tempo depois do censo A resposta para o segundo questionamento é sim desde que de forma adequada A distribuição normal padrão ou distribuição z é utilizada para os casos em que a variância populacional é conhecida ou quando temos grandes amostras Para pequenas amostras e variância populacional desconhecida o correto é utilizarmos a distribuição de Student ou distribuição t Para nos aprofundarmos nesse assunto iremos propor a mesma situaçãoproblema da seção anterior mas com uma pequena modificação supor as variâncias populacionais desconhecidas Desse modo questionamos novamente considerando que a empresa N tenha acesso aos dados amostrados na Tabela 21 ela consegue constatar se a afirmação da empresa M é verídica isto é que os funcionários possuem em média 80 kg e altura média maior ou igual a 170 cm Não pode faltar Distribuição de Student A distribuição t de Student é uma distribuição de probabilidade proposta pelo irlandês W S Gosset em 1908 Gosset era funcionário de uma cervejaria e escreveu sobre essa distribuição em um trabalho publicado com o pseudônimo Student daí a justificativa para o nome atribuído Nesse trabalho Student supôs que as amostras eram retiradas de populações normalmente distribuídas Mesmo sem essa suposição mais tarde se constatou que são obtidos resultados satisfatórios para quaisquer populações normais ou não quando são utilizadas grandes amostras Lembrese de que na seção anterior utilizamos para os testes de hipóteses a estatística z x μ σ² n a qual é normalmente distribuída com média 0 e variância 1 ou seja Z N01 Além disso segundo Johnson e Kuby 2013 quando um σ² conhecido é usado para fazer uma inferência sobre a média μ a amostra fornece um valor para aplicar nas fórmulas Esse valor é x Quando o desvio padrão da amostra Dpx também é usado esta fornece dois valores a média amostral x e o erro padrão estimado VarXn Como resultado a estatística z será substituída por uma estatística que representa o uso de um erro padrão estimado Essa nova estatística é conhecida como a estatística t de Student Desse modo substituindo σ² por VarX temos Estatística z z x μ σ² n Estatística t t x μ VarX n Diremos que uma variável T possui distribuição t de Student e denotaremos por tv e sua fdp é dada por ft v v 12 v2 π 1 t² v v 12 com t em que Γ é denominada função Gama e v são os graus de liberdade Veja na Figura 316 as distribuições normal padrão z e t Student com v 2 Para calcularmos os graus de liberdade efetuamos v n 1 em que n é o tamanho da amostra que estamos trabalhando O número de graus de liberdade é equivalente ao número de desvios em relação à média que não estão relacionados Para compreender melhor lembrese de que foi descrito na seção 24 que a soma dos desvios xi x é igual a zero Portanto quando temos n desvios xi x somente n 1 destes têm liberdade de valor pois o último desvio fica determinado pela relação xi x 0 Figura 316 Distribuição z e distribuição t Fonte Os autores 2015 Não entraremos em detalhes acerca da fdp da distribuição de Student ou da função Gama pois nosso intuito é utilizar valores tabelados para as probabilidades relacionadas a essa distribuição Graus de liberdade v número de desvios em relação à média que não estão relacionados entre si Para calcular os graus de liberdade efetuamos v n 1 Tabela para a distribuição t Diferente da distribuição z em que possuímos uma única tabela para a distribuição t teríamos de ter uma grande variedade uma para cada grau de liberdade Entretanto para o nosso trabalho não é necessária uma tabela tão completa quanto a tabela Z U3 Estatística inferencial parte I 169 disponível em httpwwwlegufprbrsilviaCE001tabelanormal pdf por exemplo Basta uma que possua probabilidadeschave as quais são muito utilizadas como mostra a Tabela 33 O cabeçalho dessa tabela fornece os níveis de significância ou em outras palavras as probabilidades de ocorrência A coluna da esquerda apresenta os graus de liberdade e o corpo da tabela apresenta os valores tc t calculado tais que a área à esquerda de tc abaixo da curva de densidade de probabilidade e acima do eixo horizontal é igual a a Essa tabela pode ser mais bem interpretada com o auxílio da Figura 317 Tabela 33 Distribuição t de Student valores de tc tais que Pt tc α ou Pt tc α Fonte Os autores 2015 6 5208 4524 3707 3143 2612 2447 1943 7 4785 4207 3499 2998 2517 2365 1895 8 4501 3991 3355 2896 2449 2306 1860 9 4297 3835 3250 2821 2398 2262 1833 10 4144 3716 3169 2764 2359 2228 1812 11 4025 3624 3106 2718 2328 2201 1796 12 3930 3550 3055 2681 2303 2179 1782 13 3852 3489 3012 2650 2282 2160 1771 14 3787 3438 2977 2624 2264 2145 1761 15 3733 3395 2947 2602 2249 2131 1753 16 3686 3358 2921 2583 2235 2120 1746 17 3646 3326 2898 2567 2224 2110 1740 18 3610 3298 2878 2552 2214 2101 1734 19 3579 3273 2861 2539 2205 2093 1729 20 3552 3251 2845 2528 2197 2086 1725 21 3527 3231 2831 2518 2189 2080 1721 22 3505 3214 2819 2508 2183 2074 1717 23 3485 3198 2807 2500 2177 2069 1714 24 3467 3183 2797 2492 2172 2064 1711 25 3450 3170 2787 2485 2167 2060 1708 26 3435 3158 2779 2479 2162 2056 1706 27 3421 3147 2771 2473 2158 2052 1703 28 3408 3136 2763 2467 2154 2048 1701 29 3396 3127 2756 2462 2150 2045 1699 30 3385 3118 2750 2457 2147 2042 1697 v Nível de significância a unilateral 01 02 05 1 2 25 5 1 318309 159153 63657 31821 15895 12706 6314 2 22327 15764 9925 6965 4849 4303 2920 3 10215 8053 5841 4541 3482 3182 2353 4 7173 5951 4604 3747 2999 2776 2132 5 5893 5030 4032 3365 2757 2571 2015 Figura 317 Área α correspondente a a Pt tₐ b Pt tₐ Fonte Os autores 2015 Alguns valores de probabilidades que não constam na tabela T também podem ser obtidos por meio das propriedades apresentadas na seção 31 também válidas para a distribuição t entre as quais destacamos Pa t b Pt b Pt a Pt μ 0 Pt μ 0 05 Pt t₀ 1 Pt t₀ Observe que a Tabela 33 tem valores de tₐ para graus de liberdade variando de 1 a 30 Algumas tabelas como a disponível no link httpwwwimeunicampbrcnaberTabela20tpdf apresentam valores de tₐ para graus de liberdade acima de 30 contudo de modo mais espaçado e até no máximo 130 graus de liberdade Pergunta por que não construir também uma tabela para v 130 A resposta é simples quanto mais graus de liberdade temos mais a curva de densidade da distribuição t se aproxima da curva normal padrão Logo quando tivermos muitos graus de liberdade podemos utilizar a tabela Z em vez da tabela T Veja um exemplo de aplicação da tabela T Com 95 de confiança qual é a verdadeira média da população μ₁ 55 ou μ₂ 50 Resolução Observe que este é o mesmo exemplo apresentado na Seção 33 com a diferença de que agora não conhecemos a variância populacional Apesar disso os passos a serem seguidos são os mesmos Vamos inicialmente testar se μ μ₁ 55 Passo 1 elaborar as hipóteses H₀ μ 55 H₁ μ 55 Passo 2 determinar a estatística de teste como a variância populacional é desconhecida a estatística será t x μ VarX n com v 11 graus de liberdade Passo 3 fixar o nível de significância α 100 95 5 Passo 4 calcular a estatística a partir da amostra a média amostral é x₀ 505 e VarX 7 Rejeitaremos a hipótese H₀ caso o valor x obtido a partir da amostra seja muito maior ou muito menor que μ₁ 55 ou ainda quando x pertencer à região crítica RC x ℝ x x₁ ou x x₂ Observando a tabela T na linha v 11 e coluna correspondente à probabilidade 25 pois o teste é bilateral temos t₁ 2201 22010583 x₁ 55 x₁ 533 t₂ 2201 22010583 x₂ 55 x₂ 567 RC x ℝ x 533 ou x 567 Passo 5 tomar uma decisão como x₀ RC decidimos rejeitar H₀ isto é há indícios suficientes que nos permitem refutar a possibilidade de a média populacional ser μ₁ 55 Vamos testar agora se μ μ₂ 50 Passo 1 elaborar as hipóteses H₀ μ 50 H₁ μ 50 Passo 2 determinar a estatística de teste como a variância populacional é desconhecida a estatística será t x μ VarX n com v 11 graus de liberdade Passo 3 fixar o nível de significância α 100 95 5 Passo 4 calcular a estatística a partir da amostra a média amostral é x₀ 505 e VarX 7 Logo tₐ 505 50 7 12 0655 Observe na tabela T que à medida que percorremos suas colunas da esquerda para a direita o valor α aumenta e os valores de tₐ diminuem Assim tₐ 0655 menor que todos os valores da tabela T deve corresponder a um valor de αₜ maior que 5 Em consequência disso temos valorp 2 Pt tₐ 2 αₜ 25 10 Mais precisamente podemos verificar utilizando o computador ou uma tabela T mais completa que o valorp nesse caso é igual a 5262 Passo 5 tomar uma decisão como o valorp é maior que o nível de significância α 5 estipulado não podemos rejeitar H₀ isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser μ₂ 50 Desse modo em concordância com o problema apresentado devemos concluir que a verdadeira média da população é μ₂ 50 Veja agora um exemplo de teste unilateral à direita Seja uma variável XN µσ² de dada população Foram levantadas duas hipóteses para a média populacional µx H₀ µ 15 H₁ µ 15 Para testar essas hipóteses foi coletada uma amostra de tamanho n 30 da qual se extraiu x 15265 e VarX 05 Com 95 de confiança é possível refutar a hipótese nula Resolução Passo 1 elaborar as hipóteses H₀ µ 15 H₁ µ 15 Passo 2 determinar a estatística de teste como a variância populacional é desconhecida a estatística será t x µ VarXn com v 29 graus de liberdade Passo 3 fixar o nível de significância α 10095 5 Passo 4 calcular a estatística a partir da amostra x 15265 e VarX 05 Logo tₕ 1526515 0530 2053 Observe na tabela T na linha correspondente a v 29 que o valor que mais se aproxima de tₕ 2053 é 2045 que corresponde a 25 Assim temos valorp Pt tₕ 25 Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 246 Passo 5 tomar uma decisão como o valorp é menor que o nível de significância α 5 estipulado podemos rejeitar H₀ isto é há indícios suficientes que nos permitem refutar a possibilidade de a média populacional ser µ 15 Sem medo de errar Observe que queremos novamente pôr à prova as afirmações feitas pela empresa M 1 o peso médio dos funcionários é 80 kg 2 a altura média é maior ou igual a 170 cm A principal diferença com relação aos testes da seção anterior se apresenta na distribuição que será utilizada pois não iremos mais supor que a variância populacional é conhecida Denotando por X e Y respectivamente temos as seguintes hipóteses a serem testadas Problema 1 H₀ µₓ 80 H₁ µₓ 80 Problema 2 H₀ µᵧ 170 H₁ µᵧ 170 Para ambos os problemas o passo 1 já foi realizado ou seja as hipóteses já foram fixadas Problema 1 testar µₓ 80 Passo 2 determinar a estatística de teste t x µ VarXn com v 19 graus de liberdade Passo 3 fixar o nível de significância α 2 Passo 4 calcular a estatística a partir da amostra x₀ 7605 e VarX 13794 tₕ 760580 1379420 1504 Observe na tabela T na linha correspondente a v 19 que o valor que mais se aproxima de tₕ 1504 é 1729 que corresponde a 5 Assim temos valorp 2Pt tₕ 25 10 Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 149 Passo 5 tomar uma decisão como o valorp é maior que o nível de significância estipulado não podemos rejeitar H₀ isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser µₓ 80 Problema 2 testar µᵧ 170 Passo 2 determinar a estatística de teste t y µ VarYn com v 19 graus de liberdade Passo 3 fixar o nível de significância α 2 Passo 4 calcular a estatística a partir da amostra y₀ 17285 e VarX 6045 tₕ 17285170 604520 1639 Observe na tabela T na linha correspondente a v 19 que o valor que mais se aproxima de tₕ 1639 é 1729 que corresponde a 5 Assim temos valorp Pt tₕ 5 Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 588 Passo 5 tomar uma decisão como o valorp é maior que o nível de significância estipulado não podemos rejeitar H₀ isto é não há indícios suficientes que nos permitam refutar a possibilidade de a média populacional ser µᵧ 170 Portanto considerando que a empresa N tenha acesso aos dados amostrados na Tabela 21 e o nível de significância α 2 não há indícios suficientes para que ela consiga refutar a afirmação da empresa M de que o peso médio de seus funcionários é 80 kg e que a altura média deles é maior ou igual a 170 cm Avançando na prática U3 Estatística inferencial parte I 177 valorp 2 2 2 4 P t tc Mais precisamente podemos verificar utilizando o computador que o valorp nesse caso é igual a 399 Passo 5 tomar uma decisão como valorp α 5 optamos por rejeitar H0 ou seja existem indícios suficientes de que a média populacional é diferente de μ 50 Concluímos que há indícios suficientes de que a suspeita dos funcionários pode ser confirmada Lembrese A distribuição normal padrão ou distribuição z é utilizada para os casos em que a variância populacional é conhecida ou quando temos grandes amostras geralmente n 120 Para pequenas amostras e variância populacional desconhecida o correto é utilizarmos a distribuição de Student ou distribuição t Graus de liberdade v número de desvios em relação à média que não estão relacionados entre si Para calcular os graus de liberdade efetuamos v n 1 Faça você mesmo Junto a um colega colete as informações sobre o peso de todos os alunos da turma Um de vocês primeiro irá calcular a média μ e a variância σ2 sem que o outro segundo veja os resultados O primeiro irá fazer ao segundo uma afirmação sobre a média por exemplo a média é μ 70 kg não necessariamente o verdadeiro valor de μ O segundo por sua vez irá coletar uma amostra e formular uma hipótese alternativa por exemplo a média μ é diferente de 70 kg Em seguida estipulando um nível de significância o segundo irá testar as hipóteses para refutar ou não a afirmação do primeiro Faça valer a pena 1 Em determinado teste de hipóteses temos H0 μ 20 e H1 μ 20 Sabendo que a partir de uma amostra de tamanho n 25 obtevese x 19 e VarX 4 assinale a alternativa que contém a região crítica para α 5 a RC x x R 19 3156 ou x 20 6844 b RC x x R 19 1760 ou x 20 8240 U3 Estatística inferencial parte I 178 c RC x x R 19 1744 ou x 20 8256 d RC x x R 19 3168 ou x 20 6832 e RC x x R 19 3156 ou x 20 6832 2 Desejase testar as hipóteses H0 μ 60 e H1 μ 60 Sabendo que a partir de uma amostra de tamanho n 30 obtevese x 61 e VarX 9 assinale a alternativa que contém a região crítica para α 25 a RC x x R 61 120 b RC x x R 61 118 c RC x x R 60 931 d RC x x R 60 929 e RC x x R 61 178 3 Para testar as hipóteses H0 μ 100 e H1 μ 100 coletouse uma amostra de tamanho n 20 e obtevese x 9884 e VarX 9 Assinale a alternativa que contém o valorp a 05 b 1 c 2 d 25 e 5 4 Suponha que para testar as hipóteses H0 μ 50 e H1 μ 50 tenhase coletado uma amostra de tamanho n 25 obtendo x 51 e VarX 16 Assinale a alternativa correta a 1 valorp 2 b 2 valorp 25 c 25 valorp 5 U3 Estatística inferencial parte I 179 d valorp 5 e valorp 5 5 Considere que para testar as hipóteses H0 μ 100 e H1 μ 80 tenha se coletado a seguinte amostra 83 83 82 80 79 81 80 79 84 80 82 82 Considerando α 5 assinale a alternativa correta a Não se pode rejeitar a hipótese nula pois valorp é menor que 5 b Devese rejeitar a hipótese nula pois valorp é menor que 5 c Não se pode rejeitar a hipótese nula pois valorp é maior que 5 d Devese rejeitar a hipótese nula pois valorp é menor que 1 e Não se pode rejeitar a hipótese nula pois valorp é maior que 1 6 Sejam as hipóteses H0 μ 500 e H1 μ 500 Determine a região crítica para α 5 sabendo que de uma amostra de tamanho n 28 obteve se x 498 e VarX 100 Por fim conclua se a hipótese nula deve ser rejeitada ou não 7 Para testar as hipóteses H0 μ 150 e H1 μ 150 coletouse uma amostra de tamanho n 200 obtendose x 15146 e VarX 64 Considerando α 2 verifique se a hipótese nula deve ser rejeitada ou não U3 Estatística inferencial parte I 180 Referências ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística aplicada à administração e economia 2 ed São Paulo Cengage Learning 2011 CLIMATEMPO Disponível em httpwwwclimatempocombr Acesso em 18 jun 2015 CRESPO Antônio A Estatística fácil 17 ed São Paulo Saraiva 2002 FREUND John E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2006 FUTPÉDIA Disponível em httpfutpediaglobocomcampeonatocopado mundo Acesso em 13 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística População presente e residente Disponível em wwwibgegovbr Acesso em 14 maio 2015 IBGE Instituto Brasileiro de Geografia e Estatística Produção vegetal Disponível em wwwibgegovbr Acesso em 14 maio 2015 JOHNSON Robert KUBY Patrícia Estatística São Paulo Cengage Learning 2013 MEDEIROS Valéria Z Coord Métodos quantitativos com Excel São Paulo Cengage Learning 2008 MORETTIN Luiz G Estatística básica probabilidade e inferência São Paulo Pearson Prentice Hall 2010 MORETTIN Luiz G BUSSAB Wilton O Estatística básica São Paulo Saraiva 2010 UOL Esporte Disponível em httpesporteuolcombrfutebolbiografias559 pele Acesso em 28 abr 2015 U4 Estatística inferencial parte II 181 Unidade 4 Estatística Inferencial parte II Muitas das pesquisas e investigações que realizamos têm o objetivo de verificar a existência de relação entre duas variáveis Você viu um exemplo disso na Unidade 1 quando foi descrita a lei da oferta e da demanda Lembrese de que o preço X e a quantidade ofertada Y possuem uma relação direta ou seja um aumento no preço implica um aumento na quantidade ofertada já o preço X e a quantidade demandada Z possuem uma relação inversa isto é um aumento no preço ocasiona uma redução na quantidade demandada A lei da oferta e da demanda indica que as variáveis X e Y estão relacionadas assim como as variáveis X e Z Uma vez cientes da existência de relação entre duas variáveis podemos fazer diversos questionamentos 1 a relação entre as duas variáveis é forte ou fraca 2 a relação é direta ou inversa 3 como medimos a relação entre duas variáveis 4 por que estudar a relação entre duas variáveis Para dar um direcionamento às possíveis respostas para essas perguntas vamos retomar duas situações abordadas anteriormente a da unidade 1 em que solicitamos que você se pusesse no papel de um vendedor que necessitava determinar a demanda de mercado de um produto e a da unidade 2 em que foi sugerido que você supusesse que era um funcionário de uma grande empresa e deveria descrever o perfil dos funcionários Se soubermos que duas variáveis estão relacionadas teremos a garantia de que ao haver uma modificação em uma delas a outra também será alterada Com isso saber se a relação é forte ou fraca direta ou inversa implica na modificação de uma variável Convite ao estudo U4 Estatística inferencial parte II 182 conhecer a magnitude da alteração que ocorrerá na outra variável e o sentido dessa alteração positivo ou negativo Vimos algo semelhante quando calculamos a elasticidade na Unidade 1 A principal motivação para estudarmos a relação entre duas variáveis é a possibilidade de prever resultados futuros ou inferir valores não amostrados de uma população Lembrese de que na Unidade 2 foi perguntado aos funcionários da empresa M qual era a avaliação deles em relação às condições de trabalho e à remuneração Imagine novamente que você é o funcionário citado na Unidade 2 será que essas variáveis estão relacionadas Quanto maior a remuneração maior a satisfação do funcionário U4 Estatística inferencial parte II 183 Seção 41 Correlação entre variáveis quantitativas Diálogo aberto Nesta seção você aprenderá a medir o grau de associação entre duas variáveis Mensuramos essa associação por meio do coeficiente de correlação Para ilustrar esse conceito imagine novamente que você é um funcionário da empresa M e que necessita avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Será que quanto maior é a satisfação em relação à remuneração mais satisfeitos ficam os funcionários em relação às condições de trabalho Para responder a essas perguntas você deverá elaborar um diagrama de dispersão e calcular o coeficiente de correlação Não pode faltar Bastante ênfase foi dada até o momento para o tratamento de cada variável separadamente estudada em dada população Análises com essa característica são denominadas univariadas O que ocorre é que nem sempre estamos interessados em estudar uma única variável de cada vez mas sim duas ou mais e a relação entre elas Tais análises são denominadas multivariadas Neste livro nos limitaremos a estudar o caso bivariado ou seja a análise de duas variáveis simultaneamente Veja como exemplo os dados da Tabela 41 amostrados a partir da população de crianças de 0 a 5 anos em determinada cidade Tabela 41 Idade e altura de uma amostra de 24 crianças Idade em meses 0 0 5 5 10 10 15 15 20 20 25 25 Altura em cm 491 497 524 510 616 612 571 504 716 670 636 707 Idade em meses 35 35 40 40 45 45 50 50 55 55 60 60 Altura em cm 853 775 870 828 835 841 865 1017 1013 1042 1101 1107 Fonte Os autores 2015 U4 Estatística inferencial parte II 184 Observe que há um total de 24 observações ou seja uma amostra de 24 crianças Além disso de cada criança foram coletadas duas informações a saber a idade em meses e a altura em centímetros Se denominarmos X a variável idade e Y a variável altura também podemos escrever as informações anteriores da forma X Y em que o primeiro valor se refere à idade e o segundo à altura 0 491 0 497 5 524 5 51 10 616 10 612 15 571 15 504 20 716 20 67 25 636 25 707 30 806 30 772 35 853 35 775 40 87 40 828 45 835 45 841 50 865 50 1017 55 1013 55 1042 60 1101 60 1107 A escrita em pares ordenados X Y ou também X Y é muito comum no âmbito da análise bivariada pois deixa bem clara a associação do valor de X com o seu Y correspondente na medida em que ambos foram coletados de um mesmo elemento da população no caso da mesma criança Podemos representar essas informações em um gráfico de dispersão como se observa na Figura 41 Você aprendeu anteriormente que um gráfico tem o objetivo de facilitar a leitura e a interpretação dos dados além de dar uma ideia da distribuição de uma variável Quando a análise é bivariada os gráficos também têm o objetivo de investigar a presença de uma relação entre as variáveis Observando a Figura 41 o que você imagina em relação às variáveis X e Y Esperamos que você tenha percebido que quanto maior a idade maior a altura Essa ideia nos parece óbvia mas nem sempre a relação de dependência entre duas variáveis é tão clara assim Uma vez aceita a hipótese de relação de dependência entre duas variáveis surgem duas perguntas básicas 1ª essa relação é forte ou fraca 2ª de que forma podemos mensurar essa relação Figura 41 Idade e altura de uma amostra de 24 crianças Fonte Os autores 2015 U4 Estatística inferencial parte II 185 Observando a Figura 41 imaginamos que se os pontos estivessem um pouco mais organizados quase daria para traçar uma linha reta passando por todos eles Essa nossa percepção indica que a relação de dependência entre X e Y é forte e além disso linear Quando isso ocorre dizemos que existe uma correlação linear entre as variáveis Veja mais alguns exemplos na Figura 42 em que no eixo horizontal é representada uma variável X e no eixo vertical uma variável Y Assimile Correlação dizse que duas variáveis estão correlacionadas quando existe uma relação de dependência entre elas Correlação linear duas variáveis estão correlacionadas linearmente quando a relação entre elas pode ser representada geometricamente por meio de uma reta Figura 42 Diagramas de dispersão e correlação linear a Sem correlação b Correlação positiva c Correlação altamente positiva d Correlação negativa e Correlação altamente negativa Fonte Os autores 2015 A Figura 42 a mostra um caso em que a variável X e a variável Y não estão correlacionadas isto é a variação de Y não é explicada pela variação de X Já na Figura 42 b e c há uma correlação linear positiva entre as duas variáveis e além disso a variação de Y é mais bem explicada pela variação de X em c Por fim na Figura 42 d e e há uma correlação linear negativa entre as duas variáveis e além disso a variação de Y é mais bem explicada pela variação de X em e Assimile Dizer que a correlação é positiva implica afirmar que quando X aumenta Y também aumenta quando X diminui Y também diminui Se a correlação é negativa ocorre o contrário se X aumenta Y diminui se X diminui Y aumenta Há ainda outros casos interessantes os quais podem ser observados na Figura 43 a seguir Na figura em a e b há a correlação linear perfeita Figura 43 Mais exemplos de diagrama de dispersão Tabela 42 Produtos dos desvios CovXY 5175921333017531213361 80 CovXZ 51751257167301750716761 445 CovXW 51759055673017543556761 0 Logo X e Y estão correlacionadas positivamente X e Z estão correlacionadas negativamente e X e W não estão correlacionadas Neste momento pode ter surgido uma dúvida quanto maior é a magnitude da covariância mais fortemente estão relacionadas as variáveis A resposta é não A covariância é influenciada pela escala logo quanto maiores os valores de um conjunto de dados maiores as chances de a covariância assumir valores mais elevados Uma maneira de corrigir isso é utilizar variáveis padronizadas xixDpX e yiyDpY e definir uma nova medida o coeficiente de correlação r ρXY ΣxixyiyDpXDpYn1 Σxixyiyn1DpXDpY CovXYDpXDpY Com essa transformação 1 r 1 Além disso se r 0 as variáveis estão correlacionadas positivamente r 0 as variáveis estão correlacionadas negativamente r 0 as variáveis não estão correlacionadas r 1 temos uma correlação positiva perfeita r 1 temos uma correlação negativa perfeita Quanto mais próximo de 1 se encontra o valor de r mais forte é a correlação quanto mais próximo de 0 se encontra o valor de r mais fraca é a correlação Além disso se rXY e rZW são os coeficientes de correlação das variáveis X e Y e das variáveis Z e W respectivamente rXY rZW implica que X e Y estão mais fortemente correlacionadas do que Z e W Utilizando as variáveis do exemplo anterior calcule os coeficientes de correlação ρXY ρXZ e ρXW e verifique quais variáveis estão mais fortemente correlacionadas Resolução Temos DpX 935 DpY 869 DpZ 4967 e DpW 4446 Logo ρXY CovXYDpXDpY 80935869 098 ρXZ CovXZDpXDpZ 4459354967 096 ρXW CovXWDpXDpW 09354446 0 Portanto as variáveis X e Y estão mais fortemente correlacionadas do que as variáveis X e Z e do que as variáveis X e W de correlação para as variáveis X e Y cujos dados amostrais foram apresentados na Tabela 41 e classifique as variáveis quanto à correlação Resolução SQx Σx2Σx2n 0²0²60²60²006060224 SQx 30700720²24 9100 SQy Σy²Σy2n 4912110724911107224 SQy 14730018201224 926862 SQxy Σxyn SQxy 0491601107060491110724 SQxy 6347957201820124 88765 r ρXY SQxySQxSQy 887659100926862 0967 Portanto as variáveis X e Y estão positivamente correlacionadas Sem medo de errar Observe a seguir os dados referentes às variáveis G satisfação em relação às condições de trabalho e H satisfação em relação à remuneração O diagrama de dispersão para os dados pode ser observado na Figura 45 Fonte Os autores 2015 Observase no diagrama que existe uma tendência positiva nos dados ou seja quanto maior a satisfação em relação à remuneração maior a satisfação em relação às condições de trabalho Vamos agora medir o grau de associação de H e G Temos SQh7²4²6²8²7468²20577204655 SQg8²5²10²9²85109²207372014295 SQhg619103109205765 rρHGSQhgSQhSQg57654655142950707 Portanto as variáveis H e G estão correlacionadas positivamente e além disso como r0707 essa correlação é forte Avançando na prática Pratique mais Instrução Desafiamos você a praticar o que aprendeu transferindo seus conhecimentos para novas situações que pode encontrar no ambiente de trabalho Realize as atividades e depois as compare com as de seus colegas 1 Competência de fundamentos de área Conhecer os conceitos matemáticos básicos e proporcionar o desenvolvimento do raciocínio lógico e quantitativo 2 Objetivos de aprendizagem Mensurar a relação entre duas variáveis por meio do coeficiente de correlação linear 3 Conteúdos relacionados Correlação covariância coeficiente de correlação 4 Descrição da situaçãoproblema A seguir consta o valor gasto com propaganda e a quantidade vendida de um produto no mesmo mês Gastos com propaganda X R 1000 100 110 122 138 144 155 Unidades vendidas X 10000 98 97 126 144 136 162 Verifique se essas variáveis estão correlacionadas linearmente Considere X gasto com propaganda e Y unidades vendidas Temos SQx100²155²100155²61007897692622288 SQy98²162²98162²61003657633633368 SQxy1009815516210015598162626168 rρXYSQxySQxSQy2616822288333680960 Como r0960 as variáveis X e Y estão fortemente correlacionadas linearmente e positivamente U4 Estatística inferencial parte II 193 Lembrese Duas variáveis estão correlacionadas quando existe uma relação de dependência entre elas Dizer que a correlação é positiva implica afirmar que quando X aumenta Y também aumenta quando X diminui Y também diminui Se a correlação é negativa ocorre o contrário se X aumenta Y diminui se X diminui Y aumenta Duas variáveis podem ser classificadas como correlacionadas positivamente se r 0 correlacionadas negativamente se r 0 não correlacionadas se r 0 correlacionadas positiva e perfeitamente se r 1 e correlacionadas negativa e perfeitamente se r 1 Faça você mesmo Faça uma amostragem com os seus colegas de classe sobre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Em seguida verifique se essas variáveis estão correlacionadas Faça valer a pena 1 Considere o conjunto de dados bivariados X Y em que por amostragem coletouse 5 3 14 11 15 14 5 3 9 11 13 14 7 4 Assinale a alternativa que contém o valor aproximado de CovX Y a 2002 c 2222 e 2022 b 2202 d 2220 2 Assinale a alternativa que contém o coeficiente de correlação do conjunto 16 59 16 39 47 68 23 22 15 55 34 48 a 08543 c 03584 e 03845 b 05834 d 03485 U4 Estatística inferencial parte II 194 3 Considere o seguinte conjunto de dados obtidos por amostragem X 75 59 32 54 20 Y 78 63 39 59 26 Z 13 23 54 31 63 W 9 87 12 93 56 Assinale a alternativa correta a X e Y não estão correlacionadas b X e W estão correlacionadas positivamente c X e Z estão correlacionadas negativamente d X e Y estão positivamente correlacionadas assim como X e Z e X e Z não estão correlacionadas 4 Considere as variáveis X Y Z e W para as quais temos CovX Y 10 CovX Z 15 CovX W 18 DpX 2 DpY 6 DpZ 8 e DpW 10 Assinale a alternativa correta a ρX Y ρX Z ρX W d ρX Y ρX Z ρX W b ρX Y ρX Z ρX W e ρX Y ρX Z ρX W c ρX Y ρX W ρX Z 5 Considere as variáveis X Y e Z tais que CovX Y 50 CovX Z 60 DpX 10 DpY 15 e DpZ 10 Assinale a alternativa correta a ρX Y ρX Z o que indica que as variáveis X e Y estão mais fortemente relacionadas do que X e Z b ρX Z ρX Y o que indica que as variáveis X e Z estão mais fortemente relacionadas do que X e Y c ρX Z ρX Y d ρX Z ρX Y o que indica que as variáveis X e Y estão mais fortemente relacionadas do que X e Z e ρX Z ρX Y U4 Estatística inferencial parte II 195 6 Classifique as variáveis X e Y como correlacionadas positivamente correlacionadas negativamente ou não correlacionadas X 40 68 17 41 41 65 Y 51 19 73 55 45 32 7 Considere os valores amostrados para as variáveis X Y e Z a seguir X 118 122 139 119 127 Y 167 170 190 177 186 Z 189 193 177 191 190 Verifique quais variáveis estão mais fortemente correlacionadas X e Y ou X e Z U4 Estatística inferencial parte II 196 Seção 42 Teste de significância Diálogo aberto Você aprendeu na seção anterior a mensurar a correlação entre duas variáveis quantitativas por meio do coeficiente de correlação Vale ressaltar que esse coeficiente mede o grau de associação linear entre duas variáveis isto é mede o quanto os pontos X Y em um diagrama de dispersão se aproximam de uma reta As análises feitas para avaliar a força de associação entre as variáveis X e Y foram apenas subjetivas considerando quão próximo o coeficiente de correlação se encontrava de 1 ou 1 Entretanto em estatística a ferramenta utilizada para comprovar algo é o teste estatístico de hipóteses Logo além de calcularmos o coeficiente de correlação r precisamos verificar sua significância Para prosseguirmos com essa análise vamos relembrar a situação problema proposta na seção anterior imagine novamente que você é um funcionário da empresa M e que necessita avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Será que quanto maior é a satisfação em relação à remuneração mais satisfeitos ficam os funcionários em relação às condições de trabalho Verificamos na seção anterior que o coeficiente de correlação para a amostra apresentada na Tabela 21 é r 0707 e afirmamos que nesse caso a correlação é forte A fim de sustentarmos essa afirmação precisamos testála Para isso que procedimentos devemos adotar Não pode faltar Você aprendeu que o coeficiente de correlação r é calculado a partir de dados bivariados X Y e mede o grau de associação entre as variáveis X e Y O coeficiente r varia no intervalo 1 1 e além disso Assimile Se r 0 a correlação entre X e Y é positiva e quanto mais próximo r estiver de 1 mais forte será as variáveis estão correlacionadas Se r 0 a correlação entre X e Y é negativa e quanto mais próximo r estiver de 1 mais forte será as variáveis estão correlacionadas Se r 0 não há correlação entre X e Y Obviamente se r 0 mas não exatamente igual a zero temos indícios de que as variáveis não estão correlacionadas O teste de hipóteses utilizado para testar a força de uma correlação por meio do coeficiente r é denominado teste de significância Segundo Larson e Farber 2010 p 403 as hipóteses nula e alternativa para os testes são H0 ρ 0 não há correlação negativa significante H1 ρ 0 correlação negativa significante H0 ρ 0 não há correlação positiva significante H1 ρ 0 correlação positiva significante H0 ρ 0 não há correlação significativa H1 ρ 0 correlação significativa Além disso um teste t pode ser usado se a correlação entre duas variáveis for significativa A estatística de teste é r e a estatística de teste padronizada tcrσr r1r²n2 segue uma distribuição t com n2 graus de liberdade Para facilitar a compreensão vamos testar a significância do coeficiente de correlação para os dados apresentados na Figura 41 Na seção anterior apresentamos o diagrama de dispersão para os dados correspondentes à idade X e à altura Y de uma amostra de 24 crianças de 0 a 5 anos Ao final da seção obtivemos r 0967 para a correlação entre essas variáveis Com 95 de confiança o valor r 0967 indica que a correlação é significativa Resolução Para testar a significância da correlação executamos os seguintes passos Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação significativa H₁ ρ 0 correlação significativa Passo 2 determinar a estatística de teste tₑ r 1 r² com v n 2 graus de liberdade Passo 3 fixar o nível de significância α 100 95 5 Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₑ obtido a partir da amostra seja muito maior ou muito menor que ρ 0 ou ainda quando tₑ pertencer à região crítica RC T ℝ T t ou T t em que t é obtido na tabela T Observando a tabela na linha v 24 2 22 e na coluna correspondente à probabilidade 25 pois o teste é bilateral temos t 2074 Logo RC T ℝ T 2074 ou T 2074 Obtivemos r 0967 a partir de uma amostra de tamanho n 24 logo calculamos tₑ r 1 r² n 2 0967 10967² 242 17802 RC Passo 5 tomar uma decisão como tₑ RC decidimos rejeitar H₀ isto é há indícios suficientes que nos permitem considerar a correlação entre idade e altura significativa Vejamos agora o caso de um teste de hipóteses unilateral à esquerda Analise os dados bivariados na forma X Y a seguir e verifique para o nível de significância α 2 se a correlação entre X e Y é negativamente significativa 54 7 60 2 48 25 57 17 57 8 Resolução Temos SQx x² x² n 54² 57² 54 57² 5 15318 276² 5 SQx 828 SQy y² y² n 7² 8² 7 8² 5 1031 59² 5 SQy 3348 SQxy xy xy n SQxy 547 578 54 577 8 5 3123 27659 5 1338 r SQxy SQxSQy 1338 8283348 08036 Conhecendose o valor de r podemos agora testar a significância Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação negativa significativa H₁ ρ 0 correlação negativa significativa Passo 2 determinar a estatística de teste tₑ r 1 r² com v n 2 graus de liberdade Passo 3 fixar o nível de significância α 2 dado Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₑ obtido a partir da amostra seja muito menor que ρ 0 ou ainda quando tₑ pertencer à região crítica RC T ℝ T t em que t é obtido na tabela T Observando a tabela na linha v 5 2 3 e na coluna correspondente a probabilidade 2 temos t 3482 Logo RC T ℝ T 3482 Obtivemos r 08036 a partir de uma amostra de tamanho n 5 logo calculamos tₑ r 1 r² n 2 08036 1 08036² 5 2 2339 RC Passo 5 tomar uma decisão como tₑ RC decidimos não rejeitar H₀ isto é não há indícios suficientes que nos permitam considerar a correlação entre X e Y negativamente significativa Por fim vejamos o caso de um teste de hipóteses unilateral à direita Analise os dados bivariados na forma XY a seguir e verifique para o nível de significância α 2 se a correlação entre X e Y é positivamente significativa 54 49 27 35 15 6 59 64 32 42 Resolução Temos SQxΣx²Σx² n 54²32²5432² 8375187² 5 SQx 13812 SQyΣy²Σy² n 49²42²4942² 9522196² 5 SQy 18388 SQxyΣxyΣxΣy n SQxy5449324254324942 5 SQxy 8801187196 5 14706 r SQxy SQxSQy 14706 1381218388 0923 Conhecendose o valor de r podemos agora testar a significância Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação positiva significativa H₁ ρ 0 correlação positiva significativa Passo 2 determinar a estatística de teste tₐ r 1r² com v n2 graus de liberdade Passo 3 fixar o nível de significância α 2 dado Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₐ obtido a partir da amostra seja muito maior que ρ 0 ou ainda quando tₐ pertencer à região crítica RC T R T t em que t é obtido na tabela T Observando a tabela na linha v 52 3 e na coluna correspondente à probabilidade 2 temos t 3482 Logo RC T R T 3482 Obtivemos r 0923 a partir de uma amostra de tamanho n 5 logo calculamos tₐ r 1r² n2 0923 10923² 52 4155 RC Passo 5 tomar uma decisão como tₐ RC decidimos rejeitar H₀ isto é há indícios suficientes que nos permitem considerar a correlação entre X e Y positivamente significativa Sem medo de errar Vamos relembrar a situaçãoproblema proposta no início desta seção imagine novamente que você é um funcionário da empresa M e que precisa avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração Será que quanto maior é a satisfação em relação à remuneração mais satisfeitos ficam os funcionários em relação às condições de trabalho Na seção anterior foi verificado que o coeficiente de correlação entre G satisfação em relação às condições de trabalho e H satisfação em relação à remuneração é r 0707 Além disso essa medida foi obtida a partir de uma amostra de tamanho n 20 apresentada na Tabela 21 Para testar a significância de r executamos os seguintes passos Passo 1 elaborar as hipóteses H₀ ρ 0 não há correlação positiva significativa H₁ ρ 0 correlação positiva significativa Passo 2 determinar a estatística de teste tₐ r 1r² com v n2 graus de liberdade Passo 3 fixar o nível de significância suponha α 5 Passo 4 calcular a estatística a partir da amostra Rejeitaremos a hipótese H₀ caso o valor tₐ obtido a partir da amostra seja muito maior que ρ 0 ou ainda quando tₐ pertencer à região crítica RC T R T t em que t é obtido na tabela T Observando a tabela na linha v 202 18 e na coluna correspondente à probabilidade 5 temos RC T R T 1734 Obtivemos r 0707 a partir de uma amostra de tamanho n 20 logo calculamos tc r 1r² n2 0707 4241 RC U4 Estatística inferencial parte II 207 3 Considere as variáveis X e Y para as quais foi coletada a amostra a seguir X 20 80 40 Y 42 150 81 Assinale a alternativa que contém o menor valor de α para o qual em um teste de significância bilateral a hipótese nula seja rejeitada ou seja o menor α para o qual a correlação seja significante a 1 c 4 e 10 b 2 d 5 4 Observe as amostras coletadas para as variáveis X Y Z e W X 83 85 78 Y 93 95 61 Z 56 125 115 W 22 17 44 Existe um indicativo de correlação entre as variáveis X e Y X e Z X e W Com 90 de confiança é possível afirmar que a As variáveis X e Y e as variáveis X e Z possuem correlação significante b As variáveis X e Y e as variáveis X e W possuem correlação significante c Apenas X e W possuem correlação significante d Apenas X e Y possuem correlação significante e Apenas X e Z possuem correlação significante 5 Duas variáveis X e Y estão correlacionadas linearmente sendo r 07976 obtido a partir de uma amostra de tamanho n 9 Teste a significância de r por meio de um teste bilateral e assinale a alternativa que contém o valorp a 1 c 4 e 10 b 2 d 5 U4 Estatística inferencial parte II 208 6 O coeficiente de correlação entre as variáveis X e Y calculado a partir de uma amostra de tamanho n 20 é r 085 Construa a região crítica para o teste bilateral de significância para r com α 5 7 Há indícios de que a correlação entre as variáveis X e Y seja significante Para comprovar essa suspeita coletouse a amostra a seguir X 44 28 76 49 Y 62 41 92 60 Utilize a abordagem valorp para testar bilateralmente a significância da correlação entre essas variáveis com 98 de confiança U4 Estatística inferencial parte II 209 Seção 43 Regressão linear Diálogo aberto Você aprendeu nas seções anteriores a mensurar a correlação linear entre duas variáveis e a testar a significância dessa correlação por meio de um teste estatístico de hipóteses Vale lembrar que o índice que foi utilizado o coeficiente de correlação mede a correlação linear ou seja mede o quanto os pontos em um diagrama de dispersão se aproximam de uma reta Ressaltamos isso porque não existe somente a correlação linear mas sim uma grande variedade de associações entre duas variáveis tais como a polinomial a exponencial e a logarítmica Ao comprovarmos a significância da correlação linear entre duas variáveis alguns questionamentos podem surgir 1 há como estabelecer uma relação matemática uma regra de associação entre uma variável X e uma variável Y 2 é possível realizar uma previsão pontual de Y a partir de um valor de X não amostrado Para darmos continuidade a essa investigação considere a seguinte situação imagine novamente que você é um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários A partir da Tabela 21 é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho Um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará com qual pontuação a satisfação em relação às condições de trabalho Veremos nesta seção um método para relacionar matematicamente duas variáveis correlacionadas linearmente Vamos lá Não pode faltar Quando testamos a significância da correlação linear entre duas variáveis X e Y verificamos se os dados sustentam a hipótese de que a correlação entre elas é não nula ou seja de que as variações de Y são influenciadas pelas variações de X de modo linear Sabendo dessa influência algo natural é questionar se para um valor específico de X não amostrado é possível prever o valor correspondente de Y U4 Estatística inferencial parte II 215 a x b y 75 8375 0 9759 30 46 5605 ˆ ˆ Portanto y x 0 9759 46 5605 ˆ é a equação da reta de regressão que pode ser observada na Figura 46 Para prever a estatura de uma criança de 57 meses de idade substituímos x 57 na equação anterior Temos y 0 9759 57 46 5605 102 1868 102 ˆ Concluímos então que a estimativa para a estatura de uma criança de 57 meses de idade é y 102 ˆ centímetros Observe que esse valor é próximo do estimado visualmente 100 cm Existem fórmulas alternativas e equivalentes para calcular os coeficientes de regressão São elas ² ² a n xy x y n x x SQ xy SQ x ˆ a x b y y n a x n ˆ ˆ ˆ Pesquise mais Veja mais detalhes sobre a regressão linear nos links httpleg ufprbrpaulojusCE003ce003node9html httpwwwusp brfaucursosgraduacaoarqurbanismodisciplinasaut0516 ApostilaRegressaoLinearpdf httpwwwpucrsbrfamatrossana psicologiaAula18Analiseregressaopdf acesso em 21 jul 2015 Sem medo de errar Vamos retornar à situaçãoproblema proposta no início desta seção imagine novamente que você é um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários A partir da Tabela 21 é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho Um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará U4 Estatística inferencial parte II 222 um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários Vimos nas seções anteriores que a partir da Tabela 21 é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho Obtivemos a equação de regressão g h 1 238 0 926 ˆ em que H é a satisfação em relação à remuneração e G é a satisfação em relação às condições de trabalho Estimamos que um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará com a pontuação 10 a satisfação em relação às condições de trabalho Neste ponto surgem alguns questionamentos é possível estabelecer um intervalo de confiança para a estimativa g0 10 ˆ Quanto da variação de G é explicado pela variação de H e quanto é devido ao acaso e às características próprias de cada funcionário Não pode faltar Resíduos Quando realizamos uma regressão linear e obtemos os valores aˆ e bˆ tais que a reta y a x b ˆ ˆ ˆ é aquela que melhor se ajusta ao conjunto de pontos correspondentes aos valores amostrados para as variáveis X e Y sempre estamos sujeitos a erros Em Estatística tais erros são denominados resíduos Você aprendeu na seção anterior que a reta de regressão é determinada por meio da minimização de SQ a b ei ² ˆ ˆ em que e y y i i i ˆ é o erro também denominado desvio não explicado associado ao ésimo ponto no diagrama de dispersão O erro pode ser observado no diagrama da Figura 48 Figura 48 Resíduos em uma regressão linear Fonte Os autores 2015 U4 Estatística inferencial parte II 232 A variação total é igual à soma da variação explicada com a não explicada O coeficiente de determinação é uma medida que tem por finalidade mensurar em termos percentuais o quanto da variação de uma variável Y é devido à variação de X supondo que essas variáveis sejam correlacionadas Faça você mesmo Na seção anterior propusemos que você acessasse o link httpnbcgib uescbrlecdownloadmaterialdidaticocorrelacaopdf acesso em 21 jul 2015 e resolvesse o problema exposto na página 6 desse material Em seguida sugerimos que determinasse a equação da reta de regressão que relaciona o índice DJIA com o SP500 Por fim solicitamos que realizasse uma previsão para o SP500 quando o índice DJIA for 11000 Agora aproveitando o que você já desenvolveu e com 90 de confiança construa um intervalo de previsão para a estimativa realizada Faça valer a pena 1 Duas variáveis X e Y estão correlacionadas linearmente de modo que os valores de Y são previstos a partir de X por regressão linear Sabendo que r 0 75 assinale a alternativa que contém o percentual da variação de Y não explicado pela variação de X a 5625 c 4375 e 5652 b 5265 d 4735 2 Considere o seguinte conjunto de dados X 1 2 3 4 5 Y 4 7 4 8 9 Assinale a alternativa que contém o valor aproximado do coeficiente de determinação para essas variáveis a 755 c 650 e 714 b 570 d 512 U4 Estatística inferencial parte II 233 3 Duas variáveis X e Y estão correlacionadas de modo que quando os valores de X aumentam os valores de Y diminuem Sabendo que a variação não explicada pela correlação entre essas variáveis é igual a 19 assinale a alternativa que contém o valor do coeficiente de correlação r a 081 c 09 e 019 b 081 d 09 4 Duas variáveis X e Y estão correlacionadas positivamente sendo a equação da reta de regressão y x 1 33 4 35 ˆ Essa equação foi estimada a partir de uma amostra de tamanho n 4 sendo o erro padrão de estimativa Se 9 27 Sabendo que x2 4600 e x 120 assinale a alternativa que contém o valor da margem de erro de previsão E a um nível de confiança de 98 para a estimativa y0 20 31 ˆ a 64 c 78 e 81 b 75 d 80 5 Duas variáveis X e Y estão correlacionadas de modo que Y pode ser estimado a partir de X por meio da equação y x 1 07 12 07 ˆ Além disso o erro padrão de estimativa obtido a partir de uma amostra de tamanho n 5 é Se 9 00 Com essas informações assinale a alternativa que contém o intervalo de confiança de 96 para y0ˆ sendo x0 10 e dados n x x 0 2 19220 e n x x 2 2 34400 a 1879 6433 c 2879 5433 e 879 5433 b 1879 6433 d 879 4433 6 Considere as variáveis X Y correlacionadas e a amostra a seguir 100 134 150 183 200 207 250 229 300 316 Sabendo que a equação da reta de regressão para X Y é y x 0 82 49 8 ˆ construa uma tabela em que na primeira coluna sejam listados os valores xi na segunda coluna sejam listados os valores observados yi na terceira coluna sejam listados os valores estimados yiˆ e na quarta e última coluna sejam listados os desvios não explicados e y y i i iˆ 7 Duas variáveis X Y estão correlacionadas sendo y x 5 4 ˆ a equação da reta de regressão correspondente Sabendo que o desvio não explicado e y y 0 0 0ˆ é 3 com x0 4 determine o valor observado y0 U4 Estatística inferencial parte II 234 Referências ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística aplicada à administração e economia 2 ed São Paulo Cengage Learning 2011 CRESPO Antônio A Estatística fácil 17 ed São Paulo Saraiva 2002 FREUND John E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2006 JOHNSON Robert KUBY Patrícia Estatística São Paulo Cengage Learning 2013 LARSON R FARBER B Estatística aplicada 4 ed São Paulo Person Prentice Hall 2010 MEDEIROS Valéria Z Coord Métodos quantitativos com Excel São Paulo Cengage Learning 2008 MORETTIN Luiz G Estatística básica probabilidade e inferência São Paulo Pearson Prentice Hall 2010 MORETTIN Luiz G BUSSAB Wilton O Estatística básica São Paulo Saraiva 2010