·

Comunicação Social ·

Métodos Quantitativos Aplicados

Send your question to AI and receive an answer instantly

Ask Question

Preview text

1 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO MÉTODOS QUANTITATIVOS APLICADOS 2 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO A Faculdade Multivix está presente de norte a sul do Estado do Espírito Santo com unidades em Cachoeiro de Itapemirim Cariacica Castelo Nova Venécia São Mateus Serra Vila Velha e Vitória Desde 1999 atua no mercado capixaba des tacandose pela oferta de cursos de gradua ção técnico pósgraduação e extensão com qualidade nas quatro áreas do conhecimen to Agrárias Exatas Humanas e Saúde sem pre primando pela qualidade de seu ensino e pela formação de profissionais com cons ciência cidadã para o mercado de trabalho Atualmente a Multivix está entre o seleto grupo de Instituições de Ensino Superior que possuem conceito de excelência junto ao Ministério da Educação MEC Das 2109 institui ções avaliadas no Brasil apenas 15 conquistaram notas 4 e 5 que são consideradas conceitos de excelência em ensino Estes resultados acadêmicos colocam todas as unidades da Multivix entre as melhores do Estado do Espírito Santo e entre as 50 melhores do país MissÃo Formar profissionais com consciência cida dã para o mercado de trabalho com ele vado padrão de qualidade sempre mantendo a credibilidade segurança e modernidade visando à satisfação dos clientes e colaboradores visÃo Ser uma Instituição de Ensino Superior reconheci da nacionalmente como referência em qualidade educacional GRUPO MULTIVIX 3 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO BiBliotEca MultiviX dados de publicação na fonte As imagens e ilustrações utilizadas nesta apostila foram obtidas no site httpbrfreepikcom Oliveira Janaína Giovani Noronha de Métodos Quantitativos Aplicados Janaína Giovani Noronha de Oliveira Serra Multivix 2018 EditoRial FaculdadE capiXaBa da sERRa MultiviX Catalogação Biblioteca Central Anisio Teixeira Multivix Serra 2018 Proibida a reprodução total ou parcial Os infratores serão processados na forma da lei Diretor Executivo Tadeu Antônio de Oliveira Penina Diretora Acadêmica Eliene Maria Gava Ferrão Penina Diretor Administrativo Financeiro Fernando Bom Costalonga Diretor Geral Helber Barcellos da Costa Diretor da Educação a Distância Pedro Cunha Conselho Editorial Eliene Maria Gava Ferrão Penina presidente do Conselho Editorial Kessya Penitente Fabiano Costalonga Carina Sabadim Veloso Patrícia de Oliveira Penina Roberta Caldas Simões Revisão de Língua Portuguesa Leandro Siqueira Lima Revisão Técnica Alexandra Oliveira Alessandro Ventorin Graziela Vieira Carneiro Design Editorial e Controle de Produção de Conteúdo Carina Sabadim Veloso Maico Pagani Roncatto Ednilson José Roncatto Aline Ximenes Fragoso Genivaldo Félix Soares Multivix Educação a Distância Gestão Acadêmica Coord Didático Pedagógico Gestão Acadêmica Coord Didático Semipresencial Gestão de Materiais Pedagógicos e Metodologia Direção EaD Coordenação Acadêmica EaD 4 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Aluno a Multivix Estamos muito felizes por você agora fazer parte do maior grupo educacional de Ensino Superior do Espírito Santo e principalmente por ter escolhido a Multivix para fazer parte da sua trajetória profissional A Faculdade Multivix possui unidades em Cachoei ro de Itapemirim Cariacica Castelo Nova Venécia São Mateus Serra Vila Velha e Vitória Desde 1999 no mercado capixaba destacase pela oferta de cursos de graduação pósgraduação e extensão de qualidade nas quatro áreas do conhecimento Agrárias Exatas Humanas e Saúde tanto na mo dalidade presencial quanto a distância Além da qualidade de ensino já comprova da pelo MEC que coloca todas as unidades do Grupo Multivix como parte do seleto grupo das Instituições de Ensino Superior de excelência no Brasil contando com sete unidades do Grupo en tre as 100 melhores do País a Multivix preocupa se bastante com o contexto da realidade local e com o desenvolvimento do país E para isso pro cura fazer a sua parte investindo em projetos so ciais ambientais e na promoção de oportunida des para os que sonham em fazer uma faculdade de qualidade mas que precisam superar alguns obstáculos Buscamos a cada dia cumprir nossa missão que é Formar profissionais com consciência cidadã para o mercado de trabalho com elevado padrão de quali dade sempre mantendo a credibilidade segurança e modernidade visando à satisfação dos clientes e colaboradores Entendemos que a educação de qualidade sempre foi a melhor resposta para um país crescer Para a Multivix educar é mais que ensinar É transformar o mundo à sua volta Seja bemvindo APRESENTAÇÃO DA DIREÇÃO EXECUTIVA Prof Tadeu Antônio de Oliveira Penina diretor Executivo do Grupo Multivix 5 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO FIGURA 1 Mão com diversos dados 15 FIGURA 2 Lápis no bilhete de loteria 16 lista dE FiGuRas 6 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO lista dE taBElas QUADRO 1 Sumarização 27 QUADRO 2 Sumarização 28 QUADRO 3 Sumarização 34 QUADRO 4 Sumarização 35 QUADRO 5 Produtos Disponibilizado 45 QUADRO 6 Distribuição Discreta 55 QUADRO 7 Área sob a curva da Normal Padrão 64 QUADRO 8 Área sob a curva da Normal Padrão 71 7 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO suMÁRio 1 UNIDADE 2 UNIDADE 1 MEtodoloGia dE pEsQuisa Quantitativa aplicada 11 11 CONCEITOS BÁSICOS 11 111 MÉTODOS ESTATÍSTICOS 12 112 DEFINIR O PROBLEMA 13 113 COLETAR OS DADOS 14 114 ORGANIZAÇÃO DOS DADOS 18 115 TRATAMENTO E APRESENTAÇÃO DOS DADOS 18 conclusÃo 20 2 EstatÍstica dEscRitiva 22 21 MEDIDAS DE TENDÊNCIA CENTRAL 22 211 MÉDIA 22 212 MEDIANA 27 213 MODA 29 22 MEDIDAS DE DISPERSÃO 30 221 AMPLITUDE 30 222 DESVIOPADRÃO 31 223 VARIÂNCIA 34 224 COEFICIENTE DE VARIAÇÃO 34 conclusÃo 36 3 noÇÕEs dE pRoBaBilidadE 38 31 INTRODUÇÃO À TEORIA DAS PROBABILIDADES 38 311 CONCEITOS PROBABILÍSTICOS 38 312 ESPAÇO AMOSTRAL 38 32 PROBABILIDADE 40 321 TABELA DE CONTINGÊNCIA 43 322 EVENTOS INDEPENDENTES 45 323 TEOREMA DE BAYES 45 conclusÃo 49 UNIDADE 3 8 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO 4 vaRiÁvEis alEatÓRias discREtas E contÍnuas distRiBuiÇÃo dE pRoBaBilidadE valoR EspERado E vaRiÂncia 51 41 VARIÁVEIS ALEATÓRIAS 51 411 VARIÁVEIS ALEATÓRIAS DISCRETAS 52 4111 DISTRIBUIÇÃO BINOMIAL 55 4112 DISTRIBUIÇÃO POISSON 57 42 VARIÁVEIS ALEATÓRIAS CONTÍNUAS 58 421 DISTRIBUIÇÃO NORMAL 61 conclusÃo 65 5 intERvalo dE conFianÇa E tEstE dE HipÓtEsEs 67 51 INTRODUÇÃO 67 52 INTERVALO DE CONFIANÇA 67 521 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL 68 522 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO POPULACIONAL 73 523 INTERVALO DE CONFIANÇA PARA DUAS MÉDIAS POPULACIONAIS 74 524 INTERVALO DE CONFIANÇA PARA DUAS PROPORÇÕES POPULACIO NAIS 75 53 TESTE DE HIPÓTESES 77 531 TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 78 532 TESTE DE HIPÓTESES PARA A PROPORÇÃO POPULACIONAL 81 conclusÃo 83 6 anÁlisE dE coRRElaÇÃo E REGREssÃo 85 61 INTRODUÇÃO DA UNIDADE 85 62 COEFICIENTE DE CORRELAÇÃO 85 63 COEFICIENTE DE DETERMINAÇÃO 89 64 RETA DE REGRESSÃO LINEAR 89 conclusÃo 92 GlossÁRio 93 REFERÊncias 94 4 UNIDADE 5 UNIDADE UNIDADE 6 9 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO iconoGRaFia ATENÇÃO PARA SABER SAIBA MAIS ONDE PESQUISAR DICAS LEITURA COMPLEMENTAR GLOSSÁRIO ATIVIDADES DE APRENDIZAGEM CURIOSIDADES QUESTÕES ÁUDIOS MÍDIAS INTEGRADAS ANOTAÇÕES EXEMPLOS CITAÇÕES DOWNLOADS 10 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO OBJETIVO Ao final desta unidade esperamos que possa Definir as etapas para realização de uma pesquisa Analisar se um problema é coerente ou não para a aplicação das ferramentas estatísticas Identificar se os dados foram coletados de maneira adequada Explicar como apresentar uma análise estatística UNIDADE 1 11 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 1 MEtodoloGia dE pEsQuisa Quantitativa aplicada 11 CONCEITOS BÁSICOS A metodologia de pesquisa pode ser entendida como a aplicação das ferramentas estatísticas na compreensão da população em estudo Podemos definir a estatística como um conjunto de ferramentas e técnicas destinadas a coletar sintetizar orga nizar sumarizar analisar e interpretar dados oriundos de estudos ou experimentos realizados em qualquer área do conhecimento humano Um ponto importante ao se trabalhar com a estatística é entender o seu significado e a sua área de atuação Assim sendo a estatística pode definida segundo o Dicioná rio Aurélio como o ramo das matemáticas aplicadas cujos princípios decorrem da teoria das probabilidades e que tem por objeto o estudo bem como o agrupamento metódico de séries de fatos ou de dados numéricos Martins 2017 por sua vez define a estatística como a ciência dos dados uma ciên cia para o produtor e o consumidor de informações numéricas Ela envolve coleta classificação sumarização organização análise e interpretação de dados Portanto é possível inferir que a estatística atua diretamente na disciplina de méto dos quantitativos fornecendo métodos para coleta organização descrição análise e interpretação de dados almejando a utilização deles no processo de tomada de de cisão Assim a estatística também compreende um conjunto de métodos utilizados para a obtenção de dados sua organização em tabelas e gráficos e a análise destes a fim de inferir sobre a população em estudo minimizando gastos e tempo além de manter a precisão 12 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO O vocábulo estatística teve origem da palavra status ou seja estado em latim A data precisa do seu surgimento não é indicada todavia sabese que era amplamente utilizada pelo Imperador César Augusto na taxação de impostos e alistamento militar Há indícios da estatística desde 3000 anos aC com a realização de censos como o citado no quarto livro do Antigo Testamento quando é feita uma referência a uma instrução dada a Moisés para que realizasse um levantamento dos homens de Israel que fossem aptos a guerrear Mesmo sendo prática coletar dados sobre colheitas delimitar impostos devido ao es paço ocupado e dimensionar a população humana e de animais desde os egípcios hebreus caldeus e gregos só em 1797 a palavra statistics apareceu na Enciclopédia Britânica cunhada pelo acadêmico alemão Gotfried Achenwall 17191772 111 MÉTODOS ESTATÍSTICOS Após entender o que estatística pode significar é preciso saber como aplicála de forma eficiente almejando obter ao final do processo de pesquisação uma estima tiva condizente com a realidade minimizando os custos e mantendo a precisão da informação Para a realização de uma pesquisa eficaz é necessário seguir algumas etapas por exemplo 1 definir o problema 2 coletar os dados 3 organizar e tratar os dados 4 sumarizar e apresentar os dados 13 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 112 DEFINIR O PROBLEMA Essa é a primeira fase do processo de aplicação de uma pesquisa estatística Ela surge da necessidade de o profissional no mercado de trabalho solucionar um problema emergente ou mesmo da curiosidade em estimar ou inferir sobre alguma variável de interesse Nesse ponto é imprescindível que o pesquisador tenha ciência de que a variável é a característica determinante para o foco da análise estatística ou seja é possível estu dar por exemplo o número de gols que um time fará na próxima partida qual a esti mativa da nota dos alunos na próxima prova ou se o lançamento de uma marca terá sucesso imediato no mercado atual Assim definir a variável isto é a característica a ser estudada é tão importante quanto definir o que será estudado dela Variável é o nome atribuído à característica abordada no estudo estatístico podendo variar de uma pessoa para a outra de um item para o outro e de um momento para o outro As variáveis normalmente são abreviadas ou denotadas por uma letra do alfabeto ou seja x y etc Elas se dividem de acordo com a sua característica predominante em 1 qualitativas e 2 quantitativas variáveis qualitativas São as variáveis cujos valores são expressos por atributos ou seja qualidades Exem plo a cor da pele o estado civil o sexo etc As variáveis qualitativas podem ser subdi vidas em nominais e ordinais variáveis quantitativas São aquelas cujos valores são expressos por números indicando a mensuração de alguma quantidade específica Por exemplo o peso a altura a idade etc As variáveis quantitativas podem ser subdivididas em contínuas são aquelas por meio das quais é obtido como resposta um intervalo ou seja permite a utilização de números decimais discretas são aquelas por meio das quais é obtido como resposta um número inteiro 14 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Projeto é um esforço temporário empreendido para criar um produto serviço ou resultado exclusivo Para saber se uma variável é contínua ou discreta pergunte se ela pode ter metade Por exemplo peso é uma variável contínua pois entre 5 e 6 quilos existem os gra mas E computador é discreta pois entre 1 e 2 computadores não há nada ou seja não existe meio computador VARIÁVEL QUALITATIVA Nominal Ordinal Discreta Contínua QUANTITATIVA 113 COLETAR OS DADOS Após definir o problema de pesquisação é imprescindível uma coleta de dados cons ciente e íntegra Essa coleta pode se dar por meio de questionários aplicados obser vação experimentação ou pesquisa bibliográfica 15 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO FIGURA 1 MÃO COM DIVERSOS DADOS Fonte SHUTTERSTOCK 2018 Como é extremamente raro se ter acesso a toda a população base do estudo é im portante selecionar uma amostra representativa dela mantendo suas características A amostragem pode ser realizada por meio de várias técnicas diferentes Dentre elas destacamse a 1 Amostragem Casual ou Aleatória Simples 2 Amostragem Estrati ficada e 3 a Sistemática A Amostragem Aleatória Simples é aquela na qual todos os elementos da popula ção têm a mesma chance de compor a amostra É a mais utilizada dentre as técnicas de amostragem O sorteio de qualquer loteria é um exemplo de amostragem aleatória simples na qual todos os possíveis números possuem a mesma probabilidade de serem sorteados 16 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO FIGURA 2 LÁPIS NO BILHETE DE LOTERIA Fonte SHUTTERSTOCK 2018 Para esse tipo de amostragem é essencial ter uma amostra pequena e moderada pois quando o número de elementos é muito grande esse tipo de sorteio tornase muito trabalhoso Nesse caso utilizase uma tabela de números aleatórios construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas A Amostragem Estratificada é aquela na qual a população base da pesquisação é subdividida em estratos ou seja subpopulações Nesse tipo de amostragem é im prescindível considerar todos os estratos extraindo uma amostra com elementos proporcionais ao número de elementos contidos nos estratos da população 17 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Para formar uma amostra com 10 dos elementos de uma população composta por 64 homens e 36 mulheres temse que selecionar aleatoriamente 6 homens e 4 mulheres conforme ilustrado na tabela sEXo populacÃo 10 aMostRa Masc 64 64 6 Femin 36 36 4 total 100 100 10 É importante salientar que os componentes da população são numerados de 01 a 100 sendo de 01 a 64 homens e de 65 a 100 mulheres para posteriormente realizar o sorteio casual com urna ou tabela de números aleatórios A Amostragem Sistemática é realizada quando os elementos da população já estão ordenados não havendo a necessidade de construir um sistema de referência Nesse tipo de amostragem a seleção dos elementos que a compõem fica a critério do pes quisador como os prédios de uma rua prontuários médicos etc Suponhamos uma rua com 80 casas das quais desejamos obter uma amostra formada por 20 casas para uma pesquisa de opinião Podemos nesse caso usar o seguinte procedimento como 80 40 4 escolhemos por sorteio casual um número de 1 a 4 o qual indicaria o primeiro elemento sorteado para a amostra os demais elementos seriam periodicamente considerados de 4 em 4 Assim suponhamos que o número sorteado fosse 2 a amostra seria 2ª casa 6ª casa 10ª casa 14ª casa etc 18 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO 114 ORGANIZAÇÃO DOS DADOS Após a coleta dos dados é essencial organizálos a fim de se realizar corretamente uma análise estatística Essa organização dos dados pode ser feita por meio de grá ficos ou tabelas não sendo preciso necessariamente escolher um entre os tipos de apresentação dos dados uma vez que na maioria das análises estatísticas é impor tante a exploração de mais de um método A coleta dos dados que sustentam os gráficos e tabelas em qualquer análise esta tística pode se dar de forma direta ou indireta Sendo a coleta direta aquela na qual os dados são obtidos por meio de elementos informativos de registro obrigatório ou seja decorrentes de registros escolares médicos ou dados gerados pelo próprio pes quisador por meio de questionários E a coleta é indireta quando provém de inferên cias ou seja conclusões com base em elementos previamente conhecidos Esse tipo de coleta normalmente tem como referência uma coleta direta 115 TRATAMENTO E APRESENTAÇÃO DOS DADOS Para se trabalhar com grandes conjuntos de dados é necessário inicialmente agru pálos organizandoos em tabelas visando à melhor apresentação e explanação da variável pesquisada A essa tabela damos o nome de tabela de frequências uma vez que nela é possível sintetizar os dados coletados de forma direta ou indireta incluin do tanto o número de vezes que eles aparecem na pesquisa quanto o percentual que representam no conjunto da obra As tabelas de frequências podem resumir dados oriundos de variáveis contínuas ou discretas nas quais são apresentados os dados agrupados em classes ou apresenta dos de modo pontual respectivamente Essa representação não é rígida e engessada dependendo basicamente dos dados considerados e do interesse da pesquisa As tabelas de frequências podem ser utilizadas na sumarização das variáveis qualita tivas ou quantitativas dependendo do foco da pesquisa 19 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Podese construir uma tabela de frequências dos dados distribuídos em classes mesmo quando a variável é discreta Segundo a ABNT Associação Brasileira de Normas e Técnicas para apresentar os dados depois de dispostos em uma tabela esta deve conter 1 Título 2 Cabeçalho 3 Coluna Indicadora 4 Corpo e 5 Fonte O Título precede a tabela e explica suscintamente o dado em estudo podendo também indicar o tempo ou lugar a que os dados se referem No Cabeçalho e na Coluna indicadora são especificados o conteúdo de cada coluna e os valores que os dados podem assumir respectivamente No Corpo da tabela são apresentadas as frequências de ocorrência dos dados de acordo com cada conteúdo E a Fonte explicita a entidade eou o pesquisadores que forneceram os dados 20 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO CONCLUSÃO Nesta unidade vimos algumas técnicas de análise e elaboração de uma pesquisa além de conceitos como variáveis e estatística Foi possível concluir que a organização correta assim como a tabulação dos dados são imprescindíveis para a apresentação e análise deles Também vimos que para a realização de qualquer pesquisação esta tística e fundamentação de análise de dados é essencial o conhecimento prévio do tipo de variável abordada além de saber como e quais tipos de análises são possíveis extrair desses dados Portanto é possível pela compreensão dos temas abordados neste capítulo funda mentar as teorias e conceitos estudados na disciplina de Métodos Quantitativos 21 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO OBJETIVO Ao final desta unidade esperamos que possa Identificar as medidas de tendência central e de dispersão Aplicar as ferramentas que auxiliam no processo de otimização organização e apresentação dos dados UNIDADE 2 22 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO 2 ESTATÍSTICA DESCRITIVA A estatística descritiva é a mais conhecida das subdivisões da disciplina de métodos de previsão por ser responsável pela sumarização e apresentação dos dados visan do facilitar o estudo da população por meio de gráficos tabelas médias e índices É responsável pelas estatísticas que circulam em jornais revistas e mídia em geral Essa área da estatística é responsável por tratar dos procedimentos utilizados na organiza ção sumarização e apresentação dos dados numéricos Becker 2015 afirma que quase sempre estaremos tratando de estatísticas amos trais ou seja calculadas em amostras concretas embora nosso interesse informacio nal seja o de generalização A estatística descritiva pode ser resumida nas etapas de 1 definição do problema 2 planejamento 3 coleta de dados 4 apresentação dos dados e 5 descrição dos dados 21 MEDIDAS DE TENDÊNCIA CENTRAL São medidas estatísticas que possibilitam estimar a localização de uma variável por meio do banco de dados que a compõe ou seja medidas capazes de sintetizar a tendência central em torno de um único valor Essas medidas são distribuídas em 1 média 2 mediana e 3 moda Martins Domingues 2017 afirmam que as medidas de tendência central visam a determinação e o cálculo de medidas que ofereçam o posicionamento da distribui ção dos valores de uma variável que desejamos analisar 211 MÉDIA A média aritmética é a ideia que ocorre à maioria das pessoas quando se fala em média É a mais importante entre as medidas de tendência central tanto pelas pro priedades matemáticas que possui única medida de tendência central que considera todos os elementos do banco de dados no que tange à quantidade e magnitude quanto por ser capaz de indicar o equilíbrio entre os elementos do banco de dados A média aritmética comumente chamada apenas de média pode ser assimilada a uma balança analógica ou seja quando inserimos ou retiramos valores em uma das 23 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO bandejas temos que recalcular um novo ponto de equilíbrio em outros termos uma nova média Porém se inserimos valores ou retiramos valores no centro da ba lança o equilíbrio se mantém e não há necessidade de novos cálculos Quando alguém fala sobre um conjunto de dados tanto pode estar se referindo a uma amostra como a uma população conforme abordado no capítulo 1 Utilizamos o símbolo µ para indicar a média de uma população e o símbolo para representar a média de uma amostra A média da população também é obtida dividindo a soma dos dados pelo núme ro de elementos da população Não calculamos µ porque em geral temos apenas uma amostra da população Mas a média da amostra é uma estimativa da média da população Às vezes a média pode ser um número diferente de todos os da série de dados que ela representa por isso costumase dizer que a média aritmética não tem existência concreta Existem diversas conotações para o cálculo da média Autores como Castro 2003 e Meyer 1983 apresentam as médias aritmética geométrica harmônica quadrática e ponderada esta última podendo ser aritmética harmônica ou geométrica É possível ainda estabelecer uma relação entre essas medidas sendo a média aritmética menor que a geométrica que por sua vez é menor que a harmônica quando todas elas são positivas Nesta disciplina abordaremos apenas a média aritmética por ser a mais aplicada A média ponderada é abordada como um caso particular da média aritmética A média aritmética é a mais comum entre as médias Para estimála basta somar todos os elementos do banco de dados e dividir pela quantidade de elementos soma dos Ela é amplamente utilizada nas mais diversas áreas do conhecimento e aplicada em qualquer área do mercado de trabalho pois apesar da simplicidade dos cálculos permite realizar uma estimativa real do equilíbrio entre os elementos do banco de dados É dada por x x n i i l n sendo x a notação atribuída à média xi i l n a soma dos iésimos elementos do banco de dados o número de elementos do banco de dados 24 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Martins Domingues 2017 apresentam em sua literatura que a média é a mais co mum e a mais intuitiva das medidas de posição Além da facilidade apresentada em seus cálculos a média possui propriedades bastante interessantes As principais são 1 a média aritmética de um conjunto de números sempre pode ser calculada sejam os dados oriundos de variáveis contínuas ou discretas 2 para um determinado conjunto de dados a média aritmética é única 3 a média é sensível a ou afetada por todos os elementos do banco de dados portanto se um valor é modificado a média tam bém se modifica 4 Somando ou subtraindo uma constante em todos os elementos do banco de dados a média também fica aumentada ou diminuída dessa mesma constante e 4 Multiplicando ou dividindo por uma constante todos os elementos do banco de dados a média também fica multiplicada ou dividida dessa constante Exemplo 1 2 4 6 8 2 4 6 8 4 5 e substituindo o 8 pelo 80 2 4 6 80 2 4 6 80 4 23 e x Exemplo 2 2 4 6 e 8 x 2 4 6 8 4 5 somando 1 unidade em cada número 3 5 7 e 9 x 3 5 7 9 4 6 Exemplo 3 2 4 6 e 8 x 2 4 6 8 4 5 multiplicando por 2 cada número 4 8 12 e 16 x 4 8 12 16 4 10 25 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO A média ponderada é a ordenação da média aritmética ou seja é a soma do produto entre os elementos do banco de dados e o número de vezes que cada um deles ocorre dividido pelo total de elementos Formalmente é dada por x x f f p i i l n i i i l n sendo xp a notação atribuída à média ponderada e fi a frequência do iésimo elemento do banco de dados ou seja o número de vezes que ele aparece 2 2 2 2 4 4 4 6 8 e 8 x x p 4 2 3 4 1 6 2 8 10 4 2 2 2 2 2 4 4 4 6 8 8 10 e 44 2 Média ponderada Média aritmética Ao organizarmos os dados em tabelas a média aritmética e a média ponderada se confundem muito não havendo nessa literatura distinção entre elas pois a ponde rada é tratada apenas como uma organização da aritmética Portanto para os dados organizados em tabelas de frequências a média é dada por x x f f i i l n i i i l n 26 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Os resultados dos lançamentos de um dado 25 vezes foram organizados na tabela 21 QUADRO 1 SUMARIZAÇÃO CLASSES DADOS FA FR FA FR 1 1 6 24 6 24 2 2 2 8 8 32 3 3 4 16 12 48 4 4 4 16 16 64 5 5 4 16 20 80 6 6 5 20 25 100 total 25 100 Fonte Elaborada pelo autor 2018 A partir dessa tabela é possível calcular a média por x x x x x x x 1 6 2 2 3 4 4 4 5 4 6 5 25 3 52 Quando os dados estão agrupados em classes temos que primeiramente calcular o ponto médio de cada classe indicado por xi e dado por maior menor 2 da classe como apresentado no próximo exemplo 27 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Vinte amigos resolveram participar da MiniMaratona do Brasil A distância que os atletas têm de percorrer é de 20 km tendo realizado para tal vários treinos No último as distâncias percorridas foram as seguintes em km organizadas na tabela 22 QUADRO 2 SUMARIZAÇÃO CLASSES DADOS FA FR FA FR XI 1 0 5 3 15 3 15 25 2 5 10 7 35 10 50 75 3 10 15 6 30 16 80 125 4 15 20 4 20 20 100 175 total 20 100 Fonte Elaborada pelo autor 2018 A partir dessa tabela é possível calcular a média por x 2 5 3 7 5 7 12 5 6 17 5 4 20 10 25 212 MEDIANA A mediana de um conjunto ordenado de valores indicada por x1 é definida como o valor que divide o banco de dados em dois subconjuntos do mesmo tamanho ou seja com a mesma quantidade de elementos em cada lado Portanto se n núme ro de elementos é ímpar a mediana é o valor central do conjunto Caso contrário a mediana é a média dos valores centrais do conjunto 28 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Exemplo 1 Para um banco de dados com o número total de elementos ímpar ou seja 3 5 8 4 6 a mediana é dada por Primeiro ordenamse os dados 3 4 5 6 8 Posteriormente basta selecionar o elemento central ou seja a mediana neste caso é o número 5 Exemplo 2 Para um banco de dados com o número total de elementos par ou seja 3 5 2 8 4 6 a mediana é dada por Primeiro ordenamse os dados 2 3 4 5 6 8 Posteriormente basta calcular a média dos elementos centrais ou seja a mediana neste caso é dada por x 4 5 2 4 5 Para os dados agrupados em classes a mediana é dada por x l h md fa anterior fa da classe i i sendo li o limite inferior da classe mediana h a amplitude da classe mediana md o elemento mediano dado por 0 5 vezes o número de elementos do banco de dados Fa anterior a frequência acumulada da classe anterior e Fa da classe a frequência sim ples da classe mediana De acordo com a tabela 22 a mediana é dada por número de elementos do banco de dados elemento 2 20 2 100 FACULDADE D METODOS QUANTITATIVOS APLICADOS MULTIVIX ENSINO A DISTANCIA Como a quantidade de elementos do banco de dados é par a mediana é dada pela média entre o 10 eo 11 elementos que esta entre a segunda e a terceira classe portanto 2 5 10 7 35 10 50 75 3 10 15 6 30 16 80 125 1010 x 105 6 x 10 A moda de um conjunto de valores indicada por mo é definida como sendo o valor ou os valores do conjunto que mais se repete ou seja os elementos em maior evidéncia com maior frequéncia E importante ressaltar que a moda ao contrario da mediana e da média nao necessariamente 6 Unica ou seja UM Conjunto pode ter mais de uma moda ou mesmo ser amodal isto 6 sem moda Se ela existir sera representada por mo Exemplo 1 Para os dados 3 5 8 4 6 Nao ha moda ou seja amodal Exemplo 2 Para os dados 3 5 2 3 4 6 Primeiro ordenamse os dados 23 3 4 5 6 A moda é 0 numero 3 pois aparece mais que os demais Exemplo 3 Na tabela 21 a moda 6 o numero 1 pois aparece 6 vezes ou seja tem a maior frequéncia FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 29 30 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO 22 MEDIDAS DE DISPERSÃO São medidas estatísticas que possibilitam estimar a organização de uma variável com base no banco de dados que a compõe ou seja medidas capazes de sintetizar a dispersão dos dados em torno de um único valor Essas medidas são distribuídas em 1 amplitude 2 desviopadrão 3 variância e 4 coeficiente de variação Com essas medidas podemos inferir se os valores estão relativamente próximos ou distantes 221 AMPLITUDE A mais simples das medidas de dispersão é a amplitude indicada por h e definida como sendo a diferença entre os valores extremos do conjunto ou seja o maior me nos o menor elemento do banco de dados Exemplo 1 Para os dados 3 5 8 4 6 A amplitude é dada por h 8 3 5 Exemplo 2 Na tabela 21 a amplitude é dada por h 20 0 20 Essa medida apesar da facilidade e de ser muito utilizada na construção de tabelas de frequências não explica a organização dos dados uma vez que apenas é capaz de exprimir o comprimento dos elementos do banco de dados não fazendo qualquer inferência sobre a quantidade de elementos ou mesmo sobre a relevância destes na dispersão dos dados 31 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 222 DESVIOPADRÃO É a mais utilizada entre as medidas de dispersão pois indica a oscilação média de cada elemento do banco de dados até a média ou seja até o ponto de equilíbrio entre todos os elementos do banco de dados Portanto o desviopadrão pode ser entendido como a média das médias das distâncias de cada elemento até a média O desviopadrão é indicado por s quando é amostral e σ quando é populacional e estimado por s x x n i i l n 2 1 e σ x x n i i l n 2 para a amostra e a população res pectivamente O desviopadrão possui propriedades bastante úteis como 1 ele está sempre na mesma unidade de medida da média que por sua vez é a mesma unidade de medi da dos dados que compõem a variável em estudo 2 quanto menor o desviopadrão melhor é a organização dos dados ou seja mais regular mais estável mais homogê nea e confiável é a variável estudada 3 se o desviopadrão é zero então não exis te variabilidade no processo ou seja todos os dados são iguais 4 somandose ou subtraindose uma constante qualquer em todos os elementos do banco de dados não há nenhum impacto no desviopadrão ou seja ele não se altera e 5 multipli candose ou dividindose todos os valores do banco de dados por uma constante diferente de zero o desviopadrão fica multiplicado ou dividido por essa constante 32 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Exemplo 1 Para o dados 2 4 6 e 8 vimos anteriormente que a média é 5 portanto o desviopadrão é dado por s 3 6 5 6 7 6 9 6 4 1 2 58 2 2 2 2 somando 1 unidade em cada número 3 5 7 e 9 s 3 6 5 6 7 6 9 6 4 1 2 58 2 2 2 2 Exemplo 2 2 4 6 e 8 s 2 5 4 5 6 5 8 5 4 1 2 58 2 2 2 2 multiplicando por 2 cada número 4 8 12 e 16 s 4 10 8 10 12 10 16 10 4 1 5 16 2 2 2 2 Para os dados organizados em tabelas de frequências o desviopadrão é dado por s f x x f i l n i l n 1 1 2 1 1 33 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Exemplo 1 Os resultados dos lançamentos de um dado 25 vezes foram organizados na tabela 21 QUADRO 3 SUMARIZAÇÃO CLASSES DADOS FA FR FA FR 1 1 6 24 6 24 2 2 2 8 8 32 3 3 4 16 12 48 4 4 4 16 16 64 5 5 4 16 20 80 46 6 5 20 25 100 total 25 100 Fonte Elaborada pelo autor 2018 A partir dessa tabela é possível calcular o desvio por s 6 1 3 52 2 2 3 52 4 3 3 52 4 4 3 52 4 5 3 52 2 2 2 2 2 2 5 6 3 52 25 1 1 87 Quando os dados estão agrupados em classes temos que primeiramente calcular o ponto médio de cada classe indicado por xi e dado por maior menor 2 da classe como apresentado na tabela 32 Exemplo 2 Vinte amigos resolveram participar da MiniMaratona do Brasil A distân cia que os atletas têm de percorrer é de 20 km tendo realizado para tal vários treinos No último as distâncias percorridas foram as seguintes em km organizadas na ta bela 22 34 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO QUADRO 4 SUMARIZAÇÃO CLASSES DADOS FA FR FA FR X1 1 0 5 3 15 3 15 25 2 5 10 7 35 10 50 75 3 10 15 6 30 16 80 125 4 15 20 4 20 20 100 175 Total 20 100 Fonte Elaborada pelo autor 2018 A partir dessa tabela é possível calcular o desvio por s 3 2 5 10 25 7 7 5 10 25 6 12 5 10 25 4 17 5 10 2 2 2 25 20 1 4 99 2 223 VARIÂNCIA A Variância é definida como a média dos quadrados dos desvios em relação à média aritmética indicada por s2 quando é amostral e σ 2 quando é populacional e esti mada por s x x n i i n 2 2 1 1 e σ 2 2 1 x x n i i n para a amostra e a população respecti vamente Como medida de dispersão a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados ou seja se os dados apresentados estão em metros a variância retorna a resposta em metros ao quadrado 224 COEFICIENTE DE VARIAÇÃO O coeficiente de variação indicado por CV e dado por CV s x ou seja pelo quo ciente entre o desviopadrão e a média aritmética expressa a variabilidade presente 35 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO no banco de dados excluindo a influência da ordem de grandeza da variável Essa é a melhor medida de dispersão no que tange à comparação entre dois ou mais grupos justamente por ser capaz de analisar a dispersão em termos relativos a seu valor mé dio Becher 2015 apresenta em sua bibliografia que o coeficiente de variação é po sitivo e adimensional ou seja ele analisa as variáveis na mesma ordem de grandeza Um determinado banco está precisando comparar dois fundos de aplicação Sabendo que o fundo A apresenta média de aplicação em torno de 100 reais e desviopadrão equivalente a 10 reais e o fundo B apresenta média e desvio padrão de aplicação em torno de 1000 e 100 respectivamente é possível afirmar que os dois fundos são igualmente confiáveis para o banco uma vez que o coeficiente de variação de ambos é o mesmo ou seja CVA 10 100 0 1 e CVB 100 1000 0 1 36 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO CONCLUSÃO As medidas da Estatística Descritiva permitem organizar os dados e buscar informa ções sobre a sua localização e organização em relação ao todo As medidas de ten dência central indicam a localização do banco de dados e as medidas de dispersão indicam a organização dele em relação ao seu centro 37 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO OBJETIVO Ao final desta unidade esperamos que possa Relacionar eventos probabilísticos Calcular as chances de ocorrência de um determinado evento Definir o que é probabilidade e como ela se aplica UNIDADE 3 38 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO 3 NOÇÕES DE PROBABILIDADE 31 INTRODUÇÃO À TEORIA DAS PROBABILIDADES A teoria das probabilidades é uma importante área da ciência que permite ao pro fissional no mercado de trabalho calcular percentuais trabalhar com estimativas e realizar predições em toda e qualquer área do conhecimento Essa teoria nasce na Idade Média com os tradicionais jogos de azar existentes na Corte Fenômenos trata dos como eventos probabilísticos são aqueles cujas chances de incertezas podem ser mensuradas ou seja jogos de cartas e dados lançamentos de moedas assim como a maioria dos jogos esportivos 311 CONCEITOS PROBABILÍSTICOS Antes de começar a realizar os cálculos probabilísticos é necessário entender alguns conceitos que envolvem os estudos das probabilidades A princípio é importante reconhecer o que é um espaço amostral ou seja um conjunto formado por todos os resultados possíveis a ser analisado em um experimento aleatório Com o reconhe cimento do espaço amostral é possível definir um evento aleatório considerando como experimento todo e qualquer resultado que sugere a incerteza antes da obser vação ou seja fenômenos que mesmo repetidos várias vezes sob condições seme lhantes apresentam resultados imprevisíveis acaso Podendo definir com o evento enfim esses resultados dos experimentos 312 ESPAÇO AMOSTRAL Para realizar um cálculo probabilístico é essencial entender o que é o espaço amos tral Ω pois ele limita o espaço de interesse da investigação permitindo ao pesqui sador de toda e qualquer área do conhecimento fazer inferências sobre o todo com 39 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO base na parte estudada A definição do espaço amostral varia de acordo com o even to de interesse da investigação podendo ser caracterizado por 1 mesmo evento repetidas vezes ou 2 eventos distintos ou 3 eventos aleatórios Se tivermos o mesmo evento repetidas vezes como no lançamento de um dado ou de uma moeda ou mesmo nas possibilidades de filhos de um casal ou de peças defeituosas em uma linha de produção o espaço amostral Ω é dado pelas possibili dades do evento elevado ao número de repetições realizadas por exemplo No lançamento de uma moeda quatro vezes temos duas possibilidades sendo k indicando que o lançamento da moeda resultou em cara e c resultou em coroa portanto o espaço amostral Ω é dado por c c c c c k k c k c c c k k k c c c c k c k c k k c c k k k c k c c k c c k k k k c k c k k k k c k c c c c k k k k c c k c k k Ou seja Ω possibilidades repetições 2 16 4 Entretanto se tivermos eventos distintos como no lançamento de um dado e uma moeda o espaço amostral Ω é dado pelo produto da quantidade de possibilidades de cada evento por exemplo No lançamento de uma moeda e um dado temos duas possibilidades da moeda cara ou coroa e seis possibilidades do dado os números inteiros de 1 a 6 portanto o espaço amostral Ω é dado por k 1 k 2 k 3 k 4 k 5 k 6 c 1 c 2 c 3 c 4 c 5 c 6 Ou seja Ω possibilidades possibilidades 2 6 12 Se tivermos eventos aleatórios como o número de funcionários ausentes em um dia de trabalho ou mesmo o número de caminhões presentes em uma determinada rota não há um modelo matemático que simplifique a mensuração dos elementos 40 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO que compõem esse espaço amostral é preciso utilizar o princípio fundamental da contagem Os eventos que compõem o espaço amostral podem ser classificados de acordo com a sua ocorrência Os eventos nos quais cada elemento do banco de dados pode ocor rer com a mesma probabilidade são chamados de eventos equiprováveis Os eventos são classificados como mutuamente exclusivos se eles não puderem ocor rer simultaneamente ou seja AB Conjunto é uma coleção de objetos itens ou serviços que possuem características comumns Espaço Amostral Ω é qualquer conjunto de todos os possíveis resultados de um experimento aleatório Experimento é todo e qualquer resultado que sugere a incerteza antes da obser vação Evento Aleatório E é qualquer subconjunto de um espaço amostral Eventos Equiprováveis são aqueles eventos nos quais todos os elementos do banco de dados têm a mesma probabilidade de ocorrência 32 PROBABILIDADE A probabilidade de realização de um evento A é dada pelo quociente entre o núme ro de ocorrências de A pelo número de eventos possíveis ou seja P A número de ocorrência de A espaço amostral Ω 41 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Portanto a probabilidade pode ser resumida como o quociente entre o que se quer e o que se tem Nela primeiro determinase o que é possível ter e depois retirase o que se quer do que se tem não podendo querer mais do que se tem ou seja Martins Domingues 2017 definem a probabilidade como a teoria que provê re gula a possibilidade de acerto de que os resultados obtidos com a amostra refletem os resultados da população Assim é possível inferir que a probabilidade é uma esti mativa para a população com base na amostra em estudo Existem duas restrições à aplicação da definição da probabilidade clássica 1 todos os eventos possíveis devem ter a mesma probabilidade de ocorrência ou seja os eventos devem ser equiprováveis e 2 devese ter um número finito de eventos pos síveis Para qualquer evento E de um espaço amostral Ω 0 P E 1 P Ω 1 P AC 1P A sendo AC o evento complementar ao evento A As operações com os eventos utilizam as mesmas propriedades matemáticas ou seja Associativa A B CA B C A B C A B Cw 42 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Comutativa A B B A A B B A Distributiva A B CA C B C A B C A C B C Absorção A B A B A A B A B B Modulares A A Ω A A Ω A A A A Lei de De Morgan A A A B A B Dupla negação A A Portanto a união de dois eventos A e B indicada por A B é o evento que contém todos os elementos de A e todos os elementos de B P A B P A P B P AB P A B P A P B se A e B são mutuamente exclusivos A interseção de dois eventos A e B indicada por A B é o evento que contém todos os elementos comuns a A e B PA B P B P AB Sendo PAB a probabilidade condicional ou seja a probabilidade de A ocorrer sabendo que o evento B ocorreu 43 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Dois ou mais eventos podem ser classificados como mutuamente exclusivos quando a realização de um exclui a realização dos outros Por exemplo no lançamento de uma moeda o evento tirar cara e o evento tirar coroa são mutuamente exclusivos já que a realização de um deles implica necessariamente a não realização do outro Portanto em eventos mutuamente exclusivos a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize Eventos mutuamente exclusivos não é a mesma coisa de eventos independentes uma vez o primeiro é utilizado quando apenas um dos eventos pode ocorrer excluin do qualquer probabilidade de ocorrência do outro e o segundo é utilizado quando a ocorrência de um dos eventos não afeta a ocorrência do outro 321 TABELA DE CONTINGÊNCIA As tabelas de contingência são aplicadas na avaliação do relacionamento das cate gorias com respeito aos grupos de acordo com dois modos independência ou ho mogeneidade ou seja eventos com dupla entrada A aplicação de tabela de contingência dois por dois é dada quando n elementos selecionados aleatoriamente de uma população são classificados em duas catego rias Depois de os elementos serem classificados um tratamento é aplicado e alguns elementos são examinados novamente e classificados nas duas categorias O que al mejase saber é O tratamento alterou significativamente a proporção de objetos em cada uma das duas categorias FACULDADE MULTIVIX METODOS QUANTITATIVOS APLICADOS q ENSINO A DISTANCIA Suponha que em uma amostra de 2000 produtos disponibilizados ao mercado sejam 800 refrigerantes e 1200 cervejas dos quais 5e 10 apresentaram algum tipo de defeito respectivamente no rdtulo da embalagem no volume liquido ou qualquer outro tipo de avaria A segui uma tabela de contingencia para melhor visualizar estes dados CERVEJA REFRIGERANTE TOTAL DB O 10 5 15 TOTAL 1200 800 2000 Fonte Elaborada pelo autor 2018 Tendo como base essa tabela é possivel estimar que a probabilidade de essa empre sa disponibilizar um produto dentre cervejas eou refrigerantes no mercado com algum tipo de defeito é dada por 15 Pdefeito 2 00075 2000 Logo apenas 075 dos produtos disponibilizados por essa empresa apresentam al gum tipo de defeito De maneira geral portanto uma tabela de contingéncia é uma representaao dos dados um processo de organizar a informagao correspondente a dados bivariados isto é podem ser classificados segundo dois critérios FACULDADE CAPIXABA DA SERRAEAD 44 Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 q 45 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 322 EVENTOS INDEPENDENTES Um ou mais eventos podem ser classificados como independentes quando a rea lização de um dos eventos não afeta a probabilidade de ocorrência do outro e vice versa Quando dois eventos são independentes a P A B P A P B 323 TEOREMA DE BAYES A probabilidade condicional ou seja as chances de um evento A ocorrer dado que outro evento B ocorreu é dada por P A B P A B P B para P B 0 O Teorema de Bayes propõe que se os eventos E1E2En são partições do espaço amostral Ω então P E B P B E P E P B i i i Recorrendo à lei de probabilidade total é possível inferir que P E B P B E P E P B E P E i i i j j Seja B1B2Bn um conjunto de eventos mutuamente exclusivos cuja união forma o espaço amostral Ω Seja E outro evento no mesmo espaço amostral Ω tal que PE 0 então P E P E B P E B P E B P E B P E P B P E B N 1 2 3 1 1 P B P E B P B P E B P E B P B B n n n 2 2 3 3 46 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Portanto P E P B P E B i i Suponha que você é o responsável pela qualidade na linha de produção de uma grande marca de bebidas Você está ciente de que não é possível experimentar todos os produtos antes de disponibilizálo ao mercado uma vez que ninguém compraria uma bebida já provada e que o processo de fabricação é composto por etapas por interferências dos funcionários por equipamentos que podem estar ou não muito bem regulados e por uma série de outros fatores controláveis ou não como até uma simples umidade excessiva no ambiente de fabricação devido ao período chuvoso Com isso você é capaz de suspeitar que um determinado lote devido à variabilidade inerente ao processo apresente um percentual de itens não conformes maior que o permitido pelos órgãos fiscalizadores Se a empresa aqui citada produzir dois lotes com duas mil unidades em cada lote por semana distribuídas entre 1000 cervejas 600 refrigerantes e 400 sucos por lote com aproximadamente 02 01 e 015 de itens defeituosos por lote respectiva mente podemos utilizar a teoria das probabilidades para responder questões como a Qual o percentual de refrigerantes distribuídos semanalmente b Qual a probabilidade de o consumidor adquirir um suco c Dentre as cervejas qual a probabilidade de o consumidor adquirir uma cerveja com defeito d Dentre os sucos qual a probabilidade de o consumidor adquirir um suco sem defeito do primeiro lote e Sabendo que foi adquirido um produto com defeito qual a probabilidade de ser um suco D METODOS QUANTITATIVOS APLICADOS MULTIVIX ENSINO A DISTANCIA Para responder a essas questoes utilizamos a probabilidade classica para o item a a uniao de probabilidades para o item b a probabilidade condicional para o item c e o Teorema de Bayes para o item d ou seja 1200 a Prefrigerante 030 30 4000 400 400 b Psuco 04040 2000 2000 Observe que neste caso tanto faz se o consumidor adquirir um suco do primeiro ou do segundo lote independentemente da ordem de ocorréncia do evento c P defeitocerveja Pcerveja ftom lefeito 021000021000 400 02020 Pcerveja 1000 1000 2000 d PsucoemUefeito Wo frimeirobbtesuco 02 Defeito 05 Cerveja os Boa 7 01 Defeito 05 12 Lote 03 Refrigerante ee Boa 02 Suco 08 Defeto 085 Boa 02 Defeito 05 Cerveja A Boa a 01 Defeito 05 22 Lote dad Refrigerante Lx 09 Boa 02 Suco 05 Defeto 085 Boa 0502085 00850 05 05020850502085 01700 FACULDADE CAPIXABA DA SERRAEAD D Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 47 48 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO e P sucodefeito 2 0 5 0 2 0 15 2 0 5 0 2 0 15 0 5 0 3 0 1 0 5 0 5 0 2 0 0150 0 0800 0 1875 49 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO CONCLUSÃO A probabilidade pode ser resumida como o quociente entre o que se quer e o que se tem Nela primeiro determinase o que é possível ter e depois retirase o que se quer do que se tem não podendo querer mais do que se tem ou seja 50 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO OBJETIVO Ao final desta unidade esperamos que possa Descrever distribuições estatísticas suas aplicações e diferenças Aplicar as distribuições estatísticas de forma consciente no mercado de trabalho Discutir a aplicabilidade das medidas de tendência central e dispersão de acordo com a classificação da distribuição em estudo UNIDADE 4 51 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 4 VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS DISTRIBUIÇÃO DE PROBABILIDADE VALOR ESPERADO E VARIÂNCIA Ao realizar um estudo estatístico ou mesmo utilizar as ferramentas disponíveis na disciplina Métodos Quantitativos Aplicados é preciso primeiramente reconhecer o tipo de variável abordada no estudo para então saber quais procedimentos estatísti cos são coerentes e válidos Assim saber reconhecer o tipo de variável analisada é de suma importância para a realização de inferências coerentes com a realidade Por tanto nessa unidade iremos abordar o estudo dessas variáveis e como o comporta mento de cada uma delas afeta nas medidas de localização e organização dos dados 41 VARIÁVEIS ALEATÓRIAS Antes de realizar qualquer tipo de estudo é preciso primeiramente definir a natureza da variável à qual se almeja fazer inferências pois cada variável aleatória se enquadra em um determinado modelo estatístico Ou seja assim como na matemática temos as funções para nortear o comportamento das variáveis que estudamos como as retas as parábolas e as hipérboles e outras na estatística temos os modelos probabi lísticos que suprem a mesma característica ou seja norteiam o comportamento das variáveis estudadas A estes modelos damos o nome de funções paramétricas pois eles parametrizam o comportamento das variáveis envolvidas no estudo estatístico Saber reconhecer o tipo de variável que está sendo abordado no estudo é de suma importância nas mais diversas áreas do conhecimento científico e social uma vez que no âmbito da disciplina Métodos Quantitativos nem sempre podemos garan tir que os dados analisados são numéricos Assim é imprescindível primeiramente analisar o banco de dados para verificar a viabilidade de transformálos em dados numéricos visando facilitar a estimativa das medidas estatísticas 52 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Segundo Becker 2015 uma variável aleatória é tão somente uma medida numéri ca associada a eventos aleatórios Assim um evento aleatório para qualquer x real é uma função real definida no espaço amostral Ω tal que X x sendo Ω um espaço amostra e p a probabilidade de ocorrência deste evento Loesch 2012 afirma que os modelos de distribuições teóricas são classificados em discretas e contínuas de acordo com o seu domínio Portanto é possível definir como variáveis aleatórias discretas as funções para as quais é possível associar um único número real a cada evento de uma partição do espaço amostral E uma variável alea tória contínua as funções para as quais é possível associar infinitos valores a um inter valo a b sendo que para valores que não pertencem ao intervalo no qual se limita o experimento a probabilidade de ocorrência é zero 411 VARIÁVEIS ALEATÓRIAS DISCRETAS São variáveis aleatórias discretas aquelas variáveis cujos dados podem ser mensura dos apenas dentro do conjunto dos números naturais Se desejamos estudar a qui lometragem rodada por um determinado veículo este tipo de variável não pode ser tratado como variável discreta uma vez que entre percorrer 1 quilômetro ou dois quilômetros o veículo pode percorrer metros e centímetros Ou seja há inúmeras unidades de medidas entre 1 e 2 quilômetros Por outro lado se o estudo almeja estudar o número de veículos nas estradas este tipo de variável é classificado como variável aleatória discreta pois não existe meio carro na via Assim ou temos um dois ou três veículos não sendo possível dividir um veículo ao meio Portanto é possível definir uma variável aleatória discreta como uma variável na qual são atribuídas probabilidades a eventos cujo espaço amostral não permite subunidades Sendo a função acumulada da variável aleatória discreta indicada por Fx PX xi ou seja a probabilidade da variável aleatória assumir valores menor ou igual a xi É possível ainda estudar o comportamento desta variável de acordo com a sua locali zação média Assim valor esperado ou seja a esperança matemática de uma variável discreta indicado por Ex μ definidas por uma PX é igual ao valor médio da va riável ou seja D METODOS QUANTITATIVOS APLICADOS MULTIVIX ENSINO A DISTANCIA Ex XPX XqP Xp X30X3 Xp PX n Ex xPX il O valor esperado indicado por Ex yu a média de uma variavel discreta A variancia ou seja a medida estatistica que concentra as probabilidades em torno da média é indicada por Varx ou o7 e dada por Varx ExEx Sendo Ex o valor esperado e Ex dada por Exx0x x0xx70x X0X n Ex yx Px il O desviopadrao indicado por DPxo é a raiz da variancia ou seja DPxVarx Realizar analises estatisticas so é possivel sobre distribuioes que sejam uma funao densidade de probabilidade fdp Uma ou mais variaveis sao uma fdp quando a soma de todas as probabilidades que compoem o evento em estudo é igual a 1 ou seja 100 Nesse sentido uma ou mais variaveis podem ser classificadas como fdp quando n SP POG PX P3 X 1 il FACULDADE CAPIXABA DA SERRAEAD D Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 53 MULTIVIX METODOS QUANTITATIVOS APLICADOS q ENSINO A DISTANCIA Existem situagoes no cotidiano das analises sobre Métodos Quantitativos Aplicados nas quais o interesse da investigaao se concentra na abordagem de variaveis bidi mensionais ou seja variaveis aleatorias nas quais pode haver a interseao de duas variaveis para descrever 0 comportamento conjuntamente A este tipo de variaveis indicadas pelo par ordenado X Y com respectivas probabilidades em px y pode mos estimar o valor esperado Assim 0 valor esperado da distribuigao conjunta indicado por Ex Y dado pela multiplicaao entre cada valor atribuido a variavel X com cada valor associado a va riavel Y e sua respectiva probabilidade conjunta ou seja nm EXYSDXV PX Y i1 jl Portanto EXYadpadbdpbdcdpcdaepaebepbe cepceafpafbfpbfcfpcf Para a tabela de distribuiao a seguir x a b Cc PY Y d Pad Pbd Pcd Pd e Pae Pbe Pice Pe f Paf Pbf Pcf Pf PX Pa Pb Pc 1 Fonte Elaborado pelo autor Seja o vetor aleatdrio X Y representado pela tabela a seguir A priori temos que completar a tabela de distribuioes de modo que as somas das probabilidades con juntas sejam equivalentes as probabilidades marginais FACULDADE CAPIXABA DA SERRAEAD 54 Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 q 55 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO XY 0 1 2 Total 1 000 000 010 0 020 020 1 010 Total 050 030 100 Assim XY 0 1 2 Total 1 000 000 010 010 0 010 020 020 050 1 010 030 000 040 Total 020 050 030 100 Calculando então a Varx temos que Ex 1010 0050 1040 Ex 030 Ex2 12010 02050 12040 Ex2 050 Como Varx Ex2 Ex2 Varx 050 0302 Varx 041 4111 DISTRIBUIÇÃO BINOMIAL A distribuição Binomial é aquela cujos eventos acontecem ou não ou seja eventos para os quais existem apenas duas probabilidades de respostas possíveis Esse tipo de evento é classificado como dicotômico ou seja evento para o qual as probabilidades de respostas se restringem a sim ou não Portanto em uma distribuição binomial na qual os eventos possuem apenas a probabilidade de sucesso ou falha são denotadas por XBinnp onde n é o número de amostragens tentativas e p é a probabilidade de sucesso do experimento 56 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Para eventos aleatórios quaisquer na distribuição binomial não é diferente Portanto é possível estimar o ponto de equilíbrio e a oscilação média da distribuição ou seja o seu valor esperado Logo o valor esperado ou média da distribuição binomial e a variância são dados por Ex μ np e Varx σ2 np1 p respectivamente sendo n a quantidade de elementos da amostra e p a probabilidade de interesse do evento Assim a probabilidade de ocorrência de um determinado evento na distribuição bi nomial é dada por P X x n x p p x n x 1 sendo n x a combinação de n elementos x a x ou seja n x n n x x e p a pro babilidade de sucesso Suponha que historicamente 10 dos alunos de uma determinada instituição de ensino superior são reprovados na disciplina Métodos Quantitativos Aplicados Admi tindo que este percentual é real correto para determinar a probabilidade de que dois alunos entre 10 selecionados ao acaso sejam reprovados temos n10 p010 x2 P X x n x p p x n x 1 P X 2 13 2 0 1 0 9 2 11 PX202448 Portanto a probabilidade de selecionarmos aleatoriamente dois alunos entre os 10 que venham a ser reprovados na disciplina é de aproximadamente 25 D METODOS QUANTITATIVOS APLICADOS MULTIVIX ENSINO A DISTANCIA Uma outra distribuiao amplamente conhecida no ambito do estudo estatistico é a distribuiao Poisson Essa distribuigao comumente denotada por XPoissonA sendo A a taxa média Portanto quando a natureza da variavel envolvida na analise estatistica tem como interesse uma variavel aleatoria Cujo nUMero de sucessos Observados num intervalo continuo como por exemplo no tempo no espaco ou Mesmo em uma determina da regiao delimitada tais como pessoas por metro quadrado chamada por minuto quantidade de defeitos por dia etc estamos trabalhando com variaveis distribuidas dentro das caracteristicas da Poisson Assim a probabilidade de ocorréncia de um determinado evento com distribuigao Poisson é dada por A 4X eA PX x x Tambeém é possivel aplicar a distribuiao Poisson quando a amostra é considerada suficientemente grande ou seja com n 30 e tenhamos um evento de natureza bi nomial sendo A np Um posto de gasolina recebe em média 10 carros por hora Para estimar a probabili dade de que em uma hora selecionada aleatoriamente sejam recebidos exatamen e Ax te 5 carros basta aplicar a formula PX x sendo A 10 e x 5 entao x 10 195 e 10 PX 5 5 PX 5 00378 FACULDADE CAPIXABA DA SERRAEAD D Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 57 58 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Portanto 378 é a probabilidade de que em uma hora selecionada aleatoriamente sejam recebidos exatamente 5 carros neste posto 42 VARIÁVEIS ALEATÓRIAS CONTÍNUAS Ao contrário da distribuição discreta uma variável aleatória qualquer pode ser classi ficada como contínua se seu espaço amostral é composto por infinitos valores dentro de um limite ou seja se os seus resultados podem ser classificados dentro do con junto dos números reais Assim uma função fx à qual são associadas probabilidades aos infinitos valores da variável aleatória X abordada no estudo estatístico é classifi cada como variável aleatória contínua Ou seja uma variável aleatória é classificada como contínua quando uma variável aleatória X assume infinitos valores em um de terminado intervalo a b sendo a probabilidade igual a zero para valores fora deste intervalo e a soma de todas as possíveis probabilidades contidas neste intervalo é igual a um Assim para as variáveis contínuas temos fx 0 x R f x dx 1 P a x b f x dx a b O valor esperado ou seja a esperança matemática de uma variável aleatória contínua X assumir os infinitos valores do intervalo ab é indicado por Exμ Assim E x x f x dx a b D METODOS QUANTITATIVOS APLICADOS MULTIVIX ENSINO A DISTANCIA E a variancia ou seja a medida estatistica que concentra as probabilidades em torna da média é indicada por Varx ou 07 e dada por Varx Ex Ex sendo Ex o valor esperado e Ex dada por b Ex fx Ff xax a Entretanto é necessario que as variaveis aleatorias continuas com funao densidade de probabilidade conjunta fx y satisfagam fxy20 para todo x yeR fx yaxady RR Sendo o valor esperado da distribuiao conjunta indicado por EX Y 6 dado por EXY J J xy f xy dxdy RR E a covariancia tanto para as variaveis continuas quanto para as variaveis discretas 6 indicada por Cov xX Y e indica a relacao estatistica presente entre as variaveis anali sadas Assim a covariancia é dada por CovXY EX Y EXEY Além do fato que o coeficiente de correlaao das variaveis continuas ou discretas indicado por p dado por CovXY Pxy Oy Oy Sendo 1 p 1 e indica a medida estatistica que mensura a relagao entre as varia veis X e Y FACULDADE CAPIXABA DA SERRAEAD D Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 59 MULTIVIX METODOS QUANTITATIVOS APLICADOS q ENSINO A DISTANCIA Independente da classificagao da variavel aleatoria como discreta ou continua sendo aebconstantes e x e y variaveis aleatorias valem as propriedades Varx07 Vara0 Varax a7 Varx Vara bx b Varx Varax bya Varx b2 Varly 2abCovxy Uma outra relagao importante de se verificar ao se estudar duas variaveis aleatorias continuas ou nao é a independéncia entre elas Duas variaveis aleatorias sao inde pendentes se a multiplicaao das distribuioes marginais for equivalente a distribui ao conjunta ou seja pxply px y para distribuiao discreta fxfy fxy para distribuigao continua O tempo de processamento de uma chamada telef6nica uma variavel aleatoria continua com fungao densidade de probabilidade dada por 14x O0x4 fx48 0 CC FACULDADE CAPIXABA DA SERRAEAD 60 Credenciada pela portaria MEC n 767 de 22062017 Publicada no DOU em 23062017 q 61 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO O tempo é mensurado em minutos Assim para determinar o tempo médio de uma chamada telefônica basta resolver 0 4 1 8 4 1 33 x x dx Portanto o tempo médio de duração de uma chamada telefônica é 133 minutos 421 DISTRIBUIÇÃO NORMAL Para alguns a distribuição mais importante da família de distribuições paramétricas para outros a distribuição mais usada mas sem dúvida para todos a distribuição que fundamenta as análises estatísticas mais comumente utilizadas é a distribuição Normal Denotada por XNormalμσ2 sendo o valor esperado ou seja a média da distribuição Normal e a variância são dadas por Ex μ e Varx σ2 respectivamente a distribui ção Normal fundamenta a grande maioria das análises que conhecemos no dia a dia Por exemplo é comum escutar dois estudantes resumindo a média como o quocien te entre a soma de todos os elementos e a quantidade de elementos todavia esse fato só é válido se estivermos trabalhando com variáveis que seguem uma distribui ção Normal A distribuição Normal faz parte da família das distribuições contínuas e é determina da por f x e x 1 2 2 1 2 2 πσ µ σ para x A distribuição Normal apresenta estas propriedades 1 possui a forma de um sino 2 é simétrica em relação à média μ 3 é assintótica em relação ao eixo de x 4 é unimodal e tem achatamento proporcional ao desvio padrão ou variância 5 a média a moda e a mediana são iguais 62 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO FIGURA 3 DISTRIBUIÇÃO NORMAL Fonte SHUTTERSTOCK 2018 Uma vez que o cálculo da área abaixo da curva é a integral da fdp nos limites dese jados e este cálculo normalmente é longo a área sob a curva pode ser simplificada pela transformação z x µ σ sendo z uma variável aleatória com distribuição Normal com média zero e variância 1 e x uma variável aleatória com distribuição Normal com média μ e variância σ2 A área total limitada pela curva normal e pelo eixo das abscissas é 1ua uma unidade de área ou seja 100 sendo as áreas sob a curva limitadas pela distância entre o desvio padrão e a média Observe essa área na tabela a seguir 63 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO QUADRO 7 ÁREA SOB A CURVA DA NORMAL PADRÃO Fonte Costa 2012 64 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Assim a parte interna da tabela indica a probabilidade de ocorrência do evento e a primeira coluna indica o número inteiro e a primeira casa decimal do escore calcu lado a partir da estatística de teste da distribuição Normal A primeira linha indica a segunda casa decimal da mesma estatística de teste ou seja z x µ σ O salário semanal manicures segue uma distribuição normal com média de 5000 com desvio padrão de 500 Para estimar a probabilidade de uma manicure selecio nada aleatoriamente ter salário semanal entre 4000 e 5500 temos que P40x55 P z 40 50 5 55 50 5 P2z1 04772 03413 08185 Portanto aproximadamente 8185 das manicures têm salários semanais entre 4000 e 5500 65 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO CONCLUSÃO As distribuições de probabilidade descrevem o comportamento do banco de dados podendo elas serem de natureza contínua ou discreta Classificamos como discre tas as variáveis aleatórias cujos comportamento são pontuais e como contínuas as variáveis aleatórias cujos comportamentos são intervalar As distribuições discretas ainda podem ser classificadas como binomiais ou Poisson sendo a binomial quan do o evento ocorre ou não e a Poisson quando estamos interessados em estimar a quantidade em um determinado período Em relação às distribuições contínuas vimos a distribuição Normal que é centrada na média e oscila de acordo com o des viopadrão da variável abordada no estudo 66 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO OBJETIVO Ao final desta unidade esperamos que possa UNIDADE 5 Construir intervalos de confiança para a média e para a proporção tanto para uma quanto para duas populações envolvidas no estudo Testar as conjecturas sobre a média e a proporção tanto para uma quanto para duas populações envolvidas no estudo 67 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 5 INTERVALO DE CONFIANÇA E TESTE DE HIPÓTESES Olá Nesta unidade veremos como fazer conjecturas sobre uma determinada variável podendo manter a precisão da análise estatística ou seja utilizaremos as ferramen tas disponíveis em Métodos Quantitativos para estimar valores que predizem o com portamento de uma determinada população Imagine a possibilidade de que você nunca erre em fazer uma estimativa sobre uma determinada variável de interesse Então a partir da construção de intervalos de confiança você conseguirá manter a confiabilidade no processo e controlar a probabilidade de erro além de poder fazer inferências sobre a variável estudada 51 INTRODUÇÃO Você já parou para observar que nas prateleiras dos supermercados nem todas as bebidas que deveriam vir com 1 litro têm exatamente 1 litro Isso acontece porque o processo e enchimento é automatizado e às vezes fica uma gotinha a mais ou a me nos no tubo de enchimento Assim para não cometer erros de estimação construí mos intervalos de confiança que nos permitem estar sempre certos acerca de uma determinada análise estatística Portanto se afirmarmos que com confiança de 95 por exemplo as bebidas rotuladas com 1 litro têm de 095 a 105 litros em média es taremos 100 certos Pois todos as bebidas que estiverem dentro deste intervalo nós já havíamos estimado e se alguma estiver fora desses limites nós também já havía mos previsto Nesta unidade veremos como construir esses intervalos e muito mais 52 INTERVALO DE CONFIANÇA O intervalo de confiança é a metodologia dentro da disciplina Métodos Quantitativos Aplicados que nos permite construir estimativas intervalares a partir da estimativa pontual ou seja do dado obtido a partir da análise da amostragem somando e sub traindo o que chamamos de margem de erro Segundo Costa 2012 a margem de 68 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO erro pode ser entendida como o produto entre o erro padrão e a confiança estipulada pela responsável pela investigação Assim podemos construir intervalos de confiança para os parâmetros de investigação no estudo ou seja para a média para a proporção e para o desviopadrão a partir do conhecimento da amostra e estabelecendo uma margem de erro dentro dos pa drões de estimação Nesta unidade iremos abordar os intervalos mais aplicáveis à disciplina Métodos Quantitativos ou seja intervalos para a média e a proporção da população investigada 521 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL Podemos definir o intervalo de confiança para a média populacional como a inferên cia realizada para a população em estudo a partir da amostra representativa da po pulação em estudo Assim o intervalo com 1 α de confiança a verdadeira estima tiva intervalar para a média é dada por IC μ1 α x Zα2σn quando o desviopadrão é populacional e IC μ1 α x tα2n1sn quando o desviopadrão é amostral com x xi n conforme relata Becker 2015 em sua literatura Sendo μ a média populacional x a média amostral α o nível de significância Zα2 o escore obtido na tabela de distribuição Normal σ o desviopadrão populacional tα2n1 o valor tabelado obtido da distribuição tStudent s o desviopadrão amostral n o tamanho da amostra 69 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO É importante frisar que a construção do intervalo de confiança é diretamente rela cionada a escolha correta do desvio padrão pois é o desvio quem direciona a distri buição que será utilizada na estimativa da margem de erro Assim quando o desvio padrão é populacional utilizamos a tabela da distribuição Normal para construir o intervalo para a média populacional Caso contrário optamos pela tabela da distri buição tStudent FIGURA 4 CURVA DA DISTRIBUIÇÃO NORMAL SHUTTERSTOCK 2018 70 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO QUADRO 8 ÁREA SOB A CURVA DA NORMAL PADRÃO Fonte Costa 2012 Sendo a primeira coluna e a primeira linha o número inteiro mais a primeira casa decimal e a segunda casa decimal respectivamente do número z calculado pela es tatística de teste z x μσ e no centro da tabela as probabilidades correspondentes a área entre zero e este ponto conforme cita Costa 2012 em sua literatura 71 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO O diretor de uma escola precisa estimar a média aritmética da altura dos alunos do maternal para solicitar nova remessa de uniformes O desviopadrão das alturas corresponde a 100 centímetros Uma amostra aleatória contendo 64 alunos indicou uma média aritmética de 300 centímetros para as alturas da amostra Para construir uma estimativa para o intervalo de confiança de 95 para a verdadeira média aritmética da população relativa à altura destes alunos do maternal temos que x 300 α005 Z0052196 σ100 n 64 Portanto IC μ1 α x Zα2σn IC μ95 300 19610064 IC μ95 300 19610064 IC μ95 300 245 2756 μ 3245 Logo com 95 de confiança a verdadeira média aritmética da população relativa à altura dos alunos do maternal desta escola vai de 2756 a 3245 centímetros Observe que para resolver estimar o intervalo de confiança para a média da altura dos alunos foi utilizado o valor tabelado pela distribuição Normal uma vez que o des viopadrão era conhecido e independe da amostragem realizada no estudo Todavia se esse mesmo desviopadrão fosse um dado decorrente da amostragem realizada seria necessária a utilização da tabela tStudent para estimar o intervalo para a média 72 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO populacional Assim como na distribuição Normal a distribuição tStudent tem uma curva em for ma de sino centrada na média e simétrica em relação a mesma Esta distribuição porém possui caldas mais pesadas ou seja é mais achatada em relação a distribui ção Normal gerando estimativas menos precisas FIGURA 5 DISTRIBUIÇÃO TSTUDENT SHUTTERSTOCK 2018 Assim como na distribuição Normal a distribuição tStudent possui valores tabela dos sendo a primeira coluna referente aos graus de liberdade da distribuição ou seja n1 enquanto que a primeira linha da tabela se refere ao nível de significância adotado ou seja α2 73 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO ODe acordo com Martins 2017 mesmo o desviopadrão não sendo populacional é possível a utilização da distribuição Normal caso o tamanho da amostra a ser estudada seja suficientemente grande Assim respaldado pelo Teorema Central do Limite quando n 30 pode ser utilizada a distribuição Normal independentemente da origem do desviopadrão 522 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO POPULACIONAL Um outro tipo de estimativa cabível na análise de questões que envolvem os Métodos Quantitativos Aplicados é a construção de intervalos de confiança para a proporção populacional a partir do estudo da amostra Portanto para inferir sobre a proporção populacional é preciso a priori realizar uma amostragem e obter os dados sobre a proporção amostral e o tamanho da amostra estudada Portanto com 1 α de confiança a verdadeira estimativa intervalar para a proporção é dada por IC p1 α p Zα2p 1 p n sendo p a proporção amostral no tamanho da amostra e Zα2 o escore obtido na tabela da distribuição Normal conforme cita Costa 2012 em sua literatura 74 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Suponha que o diretor da escola maternal precisa estimar a proporção de alunos cujas alturas são muito discrepantes Para isso ele seleciona uma amostra de 64 alunos encontrando 9 destes muito abaixo da média Para construir uma estimativa para o intervalo de confiança de 99 para a proporção da população relativa à altura dos alunos que estão muito discrepantes temos que p 964014 α001 Z0012257 n 64 Portanto IC p1 α p Zα2p 1 p n IC p99 014 257014101464 IC p99 014 25700434 IC p99 014 01115 00285 p 02515 Logo com 99 de confiança a verdadeira proporção da população de alunos cujas alturas estão muito discrepantes vai de 285 a 2515 523 INTERVALO DE CONFIANÇA PARA DUAS MÉDIAS POPULACIONAIS Uma outra abordagem para as estimativas intervalares é quando almejamos com parar dois grupos Assim é possível construir estimativas que nos permitem verificar se há ou não diferença significativa entre as populações em estudo Todavia assim 75 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO como abordado para uma única população é essencial verificar a priori se os respec tivos desvios são oriundos da população ou resultado da amostragem Neste estudo é abordado apenas a construção de estimativas intervalares para a diferença entre a médias populacionais considerando o desviopadrão conhecido ou seja decorrente da população base do estudo Costa 2012 salienta que com 1 α de confiança a verdadeira estimativa interva lar para a diferença entre as médias populacionais é dada por IC μ1 μ21 α x 1 x 2 Zα2x 1n1 x 2n2 sendo x 1 e x 2 s respectivas médias amostrais das populações em estudo n1 e n2 os tamanhos das amostras e Zα2 o escore obtido na tabela da dis tribuição 524 INTERVALO DE CONFIANÇA PARA DUAS PROPORÇÕES POPULACIONAIS Ao construirmos intervalo de confiança para a diferença entre duas proporções po pulacionais é preciso inicialmente verificar qual dentre as populações em estudo é maior sendo p 1 a maior proporção conforme afirma Costa 2012 Assim com 1 α de confiança a verdadeira estimativa intervalar para a diferença entre as proporções populacionais é dada por IC p1 p21 α p 1 p 2 Zα2p 11 p1n1 p 21 p 2n2 sendo p 1 e p 2 as respectivas proporções amostrais das popu lações em estudo n1 e n2 os tamanhos das amostras e Zα2 o escore obtido na tabela da distribuição 76 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Suponha que o diretor da escola maternal aqui abordada precisa estimar se há diferença significativa entre as proporções da altura dos alunos que estão em não conformidade dentre dois turnos distintos Uma amostra aleatória contendo 100 alunos do primeiro turno indicou 10 com alturas inferiores ao estabelecido pelos padrões e uma amostra aleatória contendo 90 alunos do segundo turno indicou 10 com alturas inferiores ao estabelecido pelos padrões Para construir uma estimativa para o intervalo de 90 de confiança para a diferença entre as proporções da população relativa à altura dos alunos que estão inferiores ao estabelecido pelos padrões temos que p 210100010 p 11090011 α010 Z0102164 n2 100 n1 90 Portanto IC p1 p21 α p 1 p 2 Zα2p 11 p 1 n1 p 21 p 2 n2 IC p1 p290 011 010 1640111 01190 0101 010100 IC p1 p290 001 16400011 00009 IC p1 p290 001 16400447 IC p1 p290 001 00733 00633 p1 p2 00833 Logo com 90 de confiança a verdadeira diferença entre as proporções da popula ção de alturas dos alunos dos dois turnos vai de 633 a 833 77 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Segundo Sharpe 2011 não há diferença significativa entre as proporções populacionais se o intervalo de confiança construído a partir da diferença das proporções amostrais incluir o zero 53 TESTE DE HIPÓTESES O teste de hipóteses é uma técnica estatística que compõe a metodologia de Mé todos Quantitativos Aplicados utilizada para avaliar alguma afirmação sobre uma determinada população de interesse através de dados amostrais Uma hipótese es tatística é construída a partir de alguma teoria sobre determinado assunto ou atra vés de alguma afirmação sobre certo parâmetro da população em análise Um teste estatístico tem como objetivo o fornecimento de evidências para subsidiar a decisão de rejeitar ou não rejeitar uma hipótese sobre algum parâmetro de uma população através de dados obtidos por uma amostra Para a realização do teste é preciso iden tificar corretamente as hipóteses nula e alternativa Becker 2015 define a Hipótese nula como a igualdade da afirmação do que quere mos provar sobre algum parâmetro geralmente representada por H0 e a Hipótese alternativa como o questionamento abordado no estudo geralmente representada por H1 ou Ha Para realizar um teste de hipóteses devemos seguir as seguintes etapas 1ª etapa Estabeleça as hipóteses de interesse 2ª etapa Obtenção da estatística de teste 3ª etapa Obtenção da região de rejeição 4ª etapa Conclusão 78 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO 531 TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL Assim como no intervalo de confiança é possível construir testes de hipóteses para inferir sobre a média populacional utilizando a tabela da distribuição Normal ou a tabela da distribuição tStudent de acordo com a origem da variância dos dados analisados Costa 2012 explica que se a variância utilizada na análise é amostral é utilizada a distribuição tStudent para inferir sobre as médias populacionais Todavia se a variân cia é oriunda da população e independe da amostragem é utilizada a distribuição Normal para a realização das inferências necessárias Seguindo os passos aqui apresentados para a realização de um teste de hipóteses é possível adotar como 1º Passo H H 0 0 1 0 µ µ µ µ para verificar se a média é igual ou não a um determinado valor μ0 H H 0 0 1 0 µ µ µ µ para verificar se a média é maior ou não a um determinado valor μ0 H H 0 0 1 0 µ µ µ µ para verificar se a média é menor ou não a um determinado valor μ0 Sendo o teste da diferença classificado como teste bilateral pois a região de rejeição é dividida entre os dois extremos da curva e os testes e classificados como testes unilaterais pois a região de rejeição é concentrada em uma única extremidade da curva 2º Passo A estatística de teste utilizada para testes cujo interesse é fazer inferências sobre a média população é dada por x μσn quando comparada com a tabela da dis tribuição Normal e x μsn quando comparada com a tabela da distribuição tStudent 79 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Sendo μ a média populacional x a média amostral Zα2 o escore obtido na tabela de distribuição Normal σ o desviopadrão populacional tα2n1 o valor tabelado obtido da distribuição tStudent s o desviopadrão amostral n o tamanho da amostra Essa fórmula permite que a média amostral obtida passe de qualquer escala para número de desvios padrão Isso possibilita traçar comparações com os valores de probabilidade da distribuição normal padronizada onde a unidade de medida é a quantidade de desvios padrão 80 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO O diretor da escola maternal desconfia que a altura dos alunos não chega ao especificado pelos padrões nacionais ou seja inferior a 300 centímetros Sabendo que o desviopadrão das alturas corresponde a 100 horas e que foi selecionada uma amostra aleatória contendo 64 alunos o que o diretor pode concluir ao nível de 5 de significância Coletando os dados μ300 x 280 α005 Z005165 σ100 n 64 Como o diretor desconfia que a altura dos alunos é inferior a 300 centímetros temos que H H 0 1 300 300 µ µ Calculando a estatística de teste temos que x μσn 28030010064 160 Como este teste é unilateral com toda a área de rejeição localizada na extremidade esquerda da curva rejeitamos a hipótese nula se o valor calculado pela estatística de teste for inferior ao valor tabelado ou seja a hipótese nula é rejeitada se 160 165 Portanto a hipótese nula não é rejeitada ao nível de 5 de significância ou seja temos fortes evidências de que o diretor pode estar enganado ao desconfiar que a altura dos alunos não chega ao especificado pelos padrões nacionais 81 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 532 TESTE DE HIPÓTESES PARA A PROPORÇÃO POPULACIONAL Fazendo inferências sobre a proporção populacional Martins 2017 afirma que para obter a estatística de teste basta fazer o quociente entre a diferença entre a diferença entre as proporções amostral e populacional e o erro padrão ou seja z p pp 1pn Sendo p a proporção populacional p a proporção amostral n o tamanho da amostra e Zα2 o escore obtido na tabela da distribuição Normal conforme cita Costa 2012 em sua literatura Seguindo os passos aqui apresentados para a realização de um teste de hipóteses é possível adotar como 1º Passo H p p H p p 0 0 1 0 para verificar se a proporção é igual ou não a um determinado valor p0 H p p H p p 0 0 1 0 para verificar se a proporção é maior ou não a um determinado valor p0 H p p H p p 0 0 1 para verificar se a proporção é menor ou não a um determinado valor p0 Sendo o teste da diferença classificado como teste bilateral pois a região de rejeição é dividida entre os dois extremos da curva e os testes e classificados como testes unilaterais pois a região de rejeição é concentrada em uma única extremidade da curva 2º Passo A estatística de teste utilizada para testes cujo interesse é fazer inferências sobre a proporção populacional é dada por z p pp1pn e comparada com a tabe la da distribuição Normal Sendo p a proporção populacional p a proporção amostral 82 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Zα2 o escore obtido na tabela de distribuição Normal n o tamanho da amostra Suponha que o diretor da escola acredita que a proporção de alunos cuja altura não chega ao especificado pelos padrões nacionais é de 10 Uma amostra aleatória contendo 64 alunos indicou 9 com altura diferente do especificado Para verificar ao nível de 1 de significância se o diretor está correto temos que p010 p 964014 α001 Z0012257 n 64 Portanto Como o diretor desconfia que a 10 dos alunos estão com a altura diferente do especificado temos que H p H p 0 1 0 10 0 10 Calculando a estatística de teste temos que z p pp1pn z 014010010101064 z 00400375 z 1067 83 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO Como este teste é bilateral com a área de rejeição dividida entre as duas extremida des da curva rejeitamos a hipótese nula se o valor calculado pela estatística de teste for inferior a Zα2 ou superior a Zα2 ou seja a hipótese nula é rejeitada se 1067 257 ou 257 Portanto a hipótese nula não é rejeitada ao nível de 1 de significância ou seja temos fortes evidências de que o diretor pode estar correto em desconfiar que a proporção de alunos cuja altura está diferente do especificado é 10 CONCLUSÃO Nesta unidade vimos como construir estimativas por intervalo de confiança para in ferir sobre as populações no que tange a média a proporção e os respectivos estudos abordando duas populações Foram apresentadas as teorias que sustentam a realiza ção de um teste de hipóteses para a média e a proporção focando apenas em uma população É possível concluir a partir do estudo desta unidade que ao realizar um estudo para a média populacional a partir de uma amostra é preciso verificar se o desviopadrão é fruto da amostra ou da população base do estudo para que possamos definir a ta bela a ser utilizada na estimativa Em relação à proporção basta apenas verificar se a proporção de interesse é a mesma fornecida na pesquisação ou seja se desejamos estudar o percentual de alunos aprovados em uma determinada disciplina e a amos tra nos fornece a estimativa de reprovados basta fazer 100 menos o percentual que não está sendo abordado no estudo 84 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO OBJETIVO Ao final desta unidade esperamos que possa Identificar as variáveis envolvidas em uma análise Verificar se existe relação entre duas variáveis Mensurar a relação existente entre duas variáveis Estimar a equação da reta que permite mensurar valores futuros UNIDADE 6 85 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 6 ANÁLISE DE CORRELAÇÃO E REGRESSÃO Você já se perguntou como podemos estimar a relação existente entre duas variá veis Ou se as variáveis com as quais trabalhamos estão mesmo relacionadas Como exemplo imagine a possibilidade de verificar ou mesmo estimar se mascar chiclete ou não durante uma prova interfere em seu resultado Essa e outras relações são abordadas nesta unidade na qual abordaremos as ferramentas estatísticas que fun damentam a disciplina Métodos Quantitativos Aplicados que nos permitem verificar se existe ou não relação entre duas variáveis e a partir daí mensurar essa relação além de estimar a equação que nos permite predizer valores futuros 61 INTRODUÇÃO DA UNIDADE Nesta unidade serão apresentados os conceitos que permitem definir comparar re lacionar e estimar a relação existente ou não entre duas variáveis Assim imagine que você consiga predizer o consumo de um veículo de acordo com a aceleração do mesmo ou que você consiga estimar o número de horas que deve dedicar para os estudos de uma determinada disciplina para alcançar a nota desejada Por meio das análises de correlação e regressão linear conseguimos predizer o futuro a partir da análise estatística dos dados passados Nesse sentido poderemos vislumbrar o futuro e estimar quantas horas você precisa trabalhar para conseguir obter o ganho almejado 62 COEFICIENTE DE CORRELAÇÃO O coeficiente de correlação é a ferramenta estatística que nos permite verificar se existe ou não relação entre duas variáveis Todavia é prudente primeiramente cons truir um diagrama de dispersão entre as variáveis abordadas no estudo para visualizar a existência ou não entre estas variáveis Assim como definido em Costa 2012 o dia grama de dispersão é o gráfico que permite plotar os pares ordenados das variáveis X e Y de modo que possamos visualizar a relação entre elas 86 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO FIGURA 6 DIAGRAMA DE DISPERSÃO Fonte Shutterstock 2018 A construção do diagrama de dispersão ajuda a visualizar a relação existente entre as variáveis abordadas no estudo caso exista relação Assim é possível perceber se as variáveis são diretamente ou inversamente proporcionais de acordo com o layout apresentado pelo gráfico de dispersão Ou seja caso o desenho ilustrado apresente uma tendência crescente entre as variáveis é possível inferir que estas são diretamen te proporcionais Caso contrário podese deduzir que esta relação é inversamente proporcional ou seja a medida em que uma variável cresce a outra diminui caso a relação ilustração apresente uma tendência decrescente entre as variáveis Após verificado se visualmente existe relação entre as variáveis X e Y é necessário mensurar matematicamente a existência desta relação Assim o cálculo do coefi ciente de correlação indicado por ρXY é dado pelo quociente entre a covariância e o produto das raízes das variâncias das variáveis X e Y ou seja ρX Y Cov X Y Var X Var Y que equivale a 87 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO ρX Y xy x y n x x n y y n 2 2 2 2 para as variáveis discretas sendo xy a soma do produto de cada elemento de x com o respectivo elemento de y x a soma de todos os elementos de x y a soma de todos os elementos de y x2 a soma dos quadrados de todos os elementos de x y2 a soma dos quadrados de todos os elementos de y n a quantidade de pares ordenados XY Suponha que precisamos estudar a relação existente entre a nota dos alunos na dis ciplina Métodos Quantitativos Aplicados e o tempo dedicado ao estudo desta disci plina Assim foram coletados 10 dados do último semestre conforme ilustrado na tabela a seguir considerando que as notas variam de 0 a 10 tempo de Estudo 2 4 6 8 7 5 6 8 8 7 nota na prova 5 6 6 9 9 8 9 8 10 9 Portanto ao plotar no próprio software Excel os dados coletados obtemos o diagrama FIGURA 7 DIAGRAMA DE DISPERSÃO Fonte Elaborado pelo autor 88 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO A partir deste diagrama gerado para analisar o comportamento entre as variáveis Nota na Prova e Tempo de Estudo é possível inferir que há uma relação diretamen te proporcional entre estas variáveis Assim é possível deduzir que quanto maior o Tempo de Estudo maior será a Nota na Prova Para comprovar esta estimativa vamos calcular o coeficiente de correlação entre es tas variáveis xy 254666897958698881079 506 x 24 68756887 61 y 56699898109 79 x2 4163664492536646449 407 y2 253636818164816410081 649 n 10 ρ ρ X Y X Y xy x y n x x n y y n 2 2 2 2 506 61 79 10 407 61 10 649 79 10 24 1 34 9 24 9 0 8175 2 2 ρ ρ X Y X Y Portanto é possível comprovar através do cálculo do coeficiente de correlação a exis tência de uma relação positiva entre as variáveis Tempo de Estudo e Nota na Prova Ou seja as variáveis Tempo de Estudo e Nota na Prova são diretamente proporcio nais uma vez que o coeficiente de correlação resultou em um valor positivo 89 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO É importante ressaltar que o coeficiente de correlação aqui indicado por ρXY resulta em um valor pertencente ao conjunto dos números reais no intervalo de 11 sendo o extremo negativo a indicação de uma correlação 100 inversamente proporcional e o extremo positivo a indicação de uma correlação 100 diretamente proporcional Qualquer valor dentro deste intervalo diferente de zero indica uma relação entre estas variáveis podendo ela ser muito fraca ou muito forte de acordo com o módulo do valor obtido Segundo Sharpe 2011 quando o coeficiente de correlação resulta em 1 ou 1 as variáveis estudadas apresentam uma relação perfeita entre si podendo esta ser diretamente ou inversamente proporcional de acordo com o sinal obtido na análise de correlação 63 COEFICIENTE DE DETERMINAÇÃO Uma outra medida muito interessante ao se analisar o comportamento entre duas variáveis é o cálculo do Coeficiente de Determinação aqui indicado por R2 De acor do com Costa 2012 o Coeficiente de Determinação mensura a relação existente entre duas variáveis aleatórias Ou seja através do seu cálculo é possível estimar o percentual de variabilidade presente em uma determinada variável aleatória a partir da variabilidade presente na outra variável em estudo Assim o coeficiente de deter minação pode ser estimado pelo quadrado do coeficiente de correlação ou seja R2 ρXY2 64 RETA DE REGRESSÃO LINEAR Um dos maiores objetivos ao verificar se existe ou não relação entre duas variáveis aleatórias e se caso exista se essa relação é significativa é poder predizer o compor tamento de uma variável em função do conhecimento de outra Ou seja imagina que possamos predizer o quanto um aluno deva estudar para poder tirar uma deter minada nota na prova 90 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Então a partir da validação da existência de relação entre duas variáveis aleatórias é possível construir uma reta de regressão linear que permita estimar valores futuros de uma das variáveis envolvidas na análise estatística Costa 2012 salienta que a relação matemática entre duas variáveis lineares pode ser descrita pelo modelo y β0 β1x Sendo y a variável resposta ou seja a variável dependente x a variável explicativa ou seja a variável independente β0 o intercepto ou seja o ponto no qual há interseção com o eixo y β1 o coeficiente angular ou seja o intercepto da reta de regressão linear Com β β β 0 1 1 2 2 y x xy x y n x x n onde ˉy e ˉx são as respectivas médias das variáveis aleatórias y e x Para o exemplo abordado nesta unidade referente ao estudo da relação existente entre a nota dos alunos na disciplina Métodos Quantitativos Aplicados e o tempo dedicado ao estudo desta disciplina uma vez que identificamos a relação entre as variáveis é possível construir a reta de regressão linear como 91 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO 7 9 β β β 1 2 2 1 2 1 506 61 79 10 407 61 10 24 xy x y n x x n 1 34 9 0 6905 79 10 61 10 6 1 1 0 β β y y n y y x x n x x y β β β 1 0 0 7 0 0 6905 6 1 3 6877 x 92 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO Portanto a reta de regressão linear que permite estimar a nota na prova a partir do conhecimento das horas de estudos é dada por y β0 β1x y 36877 06905x Assim para um aluno que estudou 8 horas esperase que a sua nota na disciplina seja em torno de 921 pontos CONCLUSÃO A partir do conhecimento de alguns dados de duas variáveis aleatórias é possível verificar se existe relação entre estas variáveis seja através da visualização de um grá fico de dispersão ou mesmo a partir de uma análise matemática destes dados Após validada a suposição de relação entre as variáveis é possível construir uma reta de regressão linear que permita estimar o valo de uma das variáveis a partir do conheci mento da outra 93 FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 Métodos Quantitativos aplicados SUMÁRIO GLOSSÁRIO Se E Ω E é chamado de evento certo Se E Ø E é chamado de evento impossível 94 Métodos Quantitativos aplicados FACULDADE CAPIXABA DA SERRAEAD Credenciada pela portaria MEC nº 767 de 22062017 Publicada no DOU em 23062017 SUMÁRIO REFERÊNCIAS BECKER João Luiz Estatística Básica transformando dados em informação Bookman Porto Alegre2015 Costa Giovani Glaucio de Oliveira curso de Estatística inferencial e probabilidades Teoria e Prática São Paulo Atlas 2012 SHARPE Norean R De VEAUX Richard D VELLEMAN Paul F Estatística aplicada Administração Economia e Negócios Porto Alegre Bookman 2011 MARTINS Gilberto de Andrade DOMINGUES Osmar Estatística Geral e Aplicada 5ª edição São Paulo Atlas 2017 BECKER João Luiz Estatística Básica transformando dados em informação Bookman Porto Alegre2015 MOORE David S A estatística básica e sua prática 7 ed Rio de Janeiro LTC 2017 OLIVEIRA Francisco Estevam Martins de Estatística e Probabilidade Exercícios Re solvidos e Propostos 3ª edição Rio de Janeiro LTC 2017 MORETTIN Pedro Alberto Estatística básica 9 ed São Paulo Saraiva 2017 LOCK Robin H Estatística revelando o poder dos dados 1 ed Rio de Janeiro LTC 2017 TRIOLA Mario F Introdução à estatística12 ed Rio de Janeiro LTC 2017 VIRGILLITO Salvatore Benito Estatística aplicada1 ed São Paulo Saraiva 2017 EADMULTIVIXEDUBR CONHEÇA TAMBÉM NOSSOS CURSOS DE PÓSGRADUAÇÃO A DISTÂNCIA NAS ÁREAS DE SAÚDE EDUCAÇÃO DIREITO GESTÃO E NEGÓCIOS