·

Engenharia da Mobilidade ·

Probabilidade e Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Recomendado para você

Texto de pré-visualização

Estatística e Probabilidade Análise e Desenvolvimento de Sistemas Aula 1 Coleta e organização de dados Prof Dr Samuel Sanches 1 APRESENTAÇÃO E CONTATO Prof Dr Samuel Sanches email samuelmsjuniorspsenacbr 2 APRESENTAÇÃO DA DISCIPLINA Conteúdo Apresenta noções de estatística descritiva probabilidade variáveis aleatórias inferência estatística interpretar os principais procedimentos estatísticos descritivos estabelecer relações entre a estatística e as atividades ligadas à área de atuação Objetivo Geral utilizar conceitos de estatística e teoria da probabilidade para explorar resumir estimar e analisar dados para apoio à tomada de decisão Específicos capacitar o aluno a descrever dados e reconhecer as principais distribuições para realizar inferências e predições de modo a obter conclusões utilizando ferramentas de mercado 3 BIBLIOGRAFIA Básica BUSSAB W de O MORETTIN P A Estatística básica São Paulo Saraiva 2002 LARSON R FARBER B Estatística aplicada São Paulo Pearson Education do Brasil 2015 Ebook MAGALHÃES M N LIMA C P de Noções de probabilidade e estatística São Paulo Edusp 2002 Complementar BERTHOUEX P M BROWN L C Statistics for environmental engineers Boca Raton Lewis Publishers 2002 FONSECA J S da MARTINS G A Curso de estatística São Paulo Atlas 1982 LEVINE D M BERENSON M L STEPHAN D Estatística teoria e aplicações Rio de Janeiro LTC 2000 LOPES P A Probabilidades estatística conceitos modelos e aplicações em Excel Rio de Janeiro Reichmann Affonso Editores 1999 MARTINS G de A Estatística geral e aplicada São Paulo Atlas 2002 4 AVALIAÇÕES Composição da nota semestral MF 06 MP 03 MA 01 PI MF média final MP média aritmética das avaliações individuais P1P22 A nota da avaliação substitutiva poderá ser usada no lugar de uma das avaliações individuais MA média aritmética de atividades ADOs PI nota de Projeto Integrador 5 ESTATÍSTICA 6 Quando surgiu É importante Onde a encontramos Devemos conhecer estudar e utilizar ESTATÍSTICA 7 Quando de fato começa a utilização da estatística em uma pesquisa Exemplo Para determinar a reação do público à continuação de certo programa governamental o pesquisador pergunta Você acha que esse programa esbanjador deve ser continuado Existe algum problema nessa pergunta ESTATÍSTICA 8 Quando de fato começa a utilização da estatística em uma pesquisa Exemplo Para determinar a reação do público à continuação de certo programa governamental o pesquisador pergunta Você acha que esse programa esbanjador deve ser continuado Existe algum problema nessa pergunta Na pergunta já está implícito que esse programa é esbanjador ou seja estamos induzindo o entrevistado provavelmente a resposta não será respondida com honestidade ESTATÍSTICA 9 Quando de fato começa a utilização da estatística em uma pesquisa Exemplo Para estudar a reação do consumidor a um novo tipo de alimento congelado fazse uma pesquisa de casa em casa durante as manhãs dos dias úteis sem previsão de retornar no caso de ninguém atender Existe algum problema nesse estudo ESTATÍSTICA 10 Quando de fato começa a utilização da estatística em uma pesquisa Exemplo Para estudar a reação do consumidor a um novo tipo de alimento congelado fazse uma pesquisa de casa em casa durante as manhãs dos dias úteis sem previsão de retornar no caso de ninguém atender Existe algum problema nesse estudo A pesquisa provavelmente não irá atingir os possíveis consumidores já que o público alvo provavelmente são pessoas que trabalham o dia inteiro e não tem tempo para cozinhar ou seja não estarão em casa nesse horário ESTATÍSTICA DESCRITIVA 11 Governos recenseamentos atualização de dados Descrever resumir e analisar Utilização dos valores centrais e de tabelas e gráficos Exemplo Conjunto de 6 carros de todos importados constatouse que eles aceleram de 0 a 60 kmh em 129 165 113 152 182 e 177 segundos ou seja metade acelera em menos de 16 s calculando a média desses valores temos 153 s mas não podemos concluir que metade deles aceleram em menos que 16 s INFERÊNCIA ESTATÍSTICA 12 Utilizamos para fazer generalizações Exemplo Estimar o tempo de vida de um equipamento eletrônico Qual será o tráfego em uma rodovia que será construída Qual a melhor dosagem de certo medicamento etc Todos possuem incertezas chances Jogos de azar Teoria de Probabilidade NATUREZA DOS DADOS 13 Dados numéricos quantitativos e Dados categóricos qualitativos que normalmente são codificados estado civil 0 1 2 etc Dados nominais como o estado civil em que os dados nominais são nomes de números ou seja não podemos dizer 0 1 devese sempre estar atento ao tratamento matemático Dados ordinais somente podemos atribuir desigualdades Dados intervalares somente diferenças desigualdades e igualdades podem não podemos multiplicar nem dividir exemplo temperaturas Dados de razão podese formar quociente entram quaisquer medidas comprimento densidade etc RESUMINDO DADOS 14 Domo infográfico sobre a quantidade mundial de dados gerados e na sua última versão foi estimado 31 mil terabytes gerados por segundo Tabelas ou gráficos que eram muito de um curso Muito utilizada hoje em dia temos isso a todo instante Não saber interpretar pode te enganar Problema Correlação X Causalidade Domo httpswwwdomocomdataneversleeps Como as estatísticas podem ser enganosas httpsyoutubesxYrzzy3cq8 Como mentir com estatísticas httpsestatjrcombr20211119comomentircomestatistica Diferença correlação e causalidade httpsgecproecufabcedubroquequeacienciatemqualadiferencaentrecorrelacaoecausalidadelangen LISTANDO DADOS 15 Após a coleta dos dados é necessária sua organização para melhor compreensão Como exemplo veja os dados abaixo que são as massas em kg de 60 malas despachadas em uma companhia aérea Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink LISTANDO DADOS 16 Uma informação interessante são os extremos nesse exemplo são 166 e 235 Assim a ordem crescente ou decrescente pode ser útil organizar manualmente é trabalhoso com uma planilha selecionar Dados Classificar intervalo Classificar de A a Z LISTANDO DADOS 17 Exemplo Uma auditoria de 20 declarações de imposto de renda revelou 0 2 0 0 1 3 0 0 0 1 0 1 0 0 2 1 0 0 1 e 0 erros de cálculos a Construa uma tabela mostrando o número de declarações com 0 1 2 e 3 erros de cálculos b Esboce um diagrama de pontos exibindo a mesma informação LISTANDO DADOS 18 Exemplo solução Contando o número de números 0 1 2 e 3 temos 12 5 2 e 1 respectivamente Podemos montar uma tabela e uma forma gráfica LISTANDO DADOS 19 Exemplo solução Contando o número de números 0 1 2 e 3 temos 12 5 2 e 1 respectivamente Também podemos montar um gráfico de barras LISTANDO DADOS 20 Exemplo O corpo docente do departamento de Economia de uma universidade consiste em três professores titulares seis professores adjuntos doze professores assistentes e oito professores substitutos Disponha essa informação na forma de diagrama de pontos alinhados horizontalmente DIAGRAMA DE RAMOS E FOLHAS 21 Quando temos muitos valores ou diferentes categorias ou valores muito altos podese utilizar esse diagrama que acaba perdendo a informação da ordem em que os dados foram obtidos Como exemplo veja os dados de quartos ocupados em um hotel de praia em janeiro DIAGRAMA DE RAMOS E FOLHAS 22 Podemos agrupálos pelas dezenas ou seja os que começam com 3 4 e assim por diante DIAGRAMA DE RAMOS E FOLHAS 23 Então para melhor adequar separamos as dezenas assim cada linha é denominada ramo e cada número à esquerda da linha vertical é o rótulo do ramo e cada número à direita é denominado folha ainda organizamos em ordem crescente DIAGRAMA DE RAMOS E FOLHAS 24 Podemos dividir os que possuem muitas folhas assim temos o diagrama de ramos e folhas duplos DIAGRAMA DE RAMOS E FOLHAS 25 Rótulos podem ter 2 dígitos valores 240 242 245 248 e 249 Ou só 1 valores 231 245 270 e 288 DISTRIBUIÇÃO DE FREQUÊNCIA 26 Quando temos muitos dados crus um tratamento é organizálos pela frequência de vezes em que ele aparece Exemplo Num levantamento foram obtidas as movimentações financeiras de 4757 escritórios distribuição numérica ou quantitativa DISTRIBUIÇÃO DE FREQUÊNCIA 27 Exemplo Quantidade de queixas de passageiros contra companhias aéreas distribuição categórica ou qualitativa DISTRIBUIÇÃO DE FREQUÊNCIA 28 Para construção 1 Escolher as classes intervalos ou categorias 2 Separar ou enquadrar os dados nessas classes 3 Contar o número de itens de cada classe Raramente temos menos do que 5 ou mais do que 15 classes o valor exato depende de cada situação ou seja de quantos dados existem Ter certeza de que cada dado se enquadre somente em 1 classe Sempre que possível as classes devem cobrir amplitudes iguais de valores As classes abertas como menos de ou menos ou ou mais quando temos valores muito pequenos ou muito grandes do que a maioria Mas devemos utilizar com cuidado e evitar sempre que possível DISTRIBUIÇÃO DE FREQUÊNCIA 29 Exemplo Usando a informação fornecida pela direção de um parque florestal temos os dados de 110 tempos de espera simulados em minutos entre erupções de um gêiser famoso do local O menor valor ali é 33 e o maior 118 uma escolha para as classes pode ser com as dezenas começando em 30 39 40 49 com a última 110 119 Elas cobrem todos os valores não se sobrepõe e possuem mesmo tamanho DISTRIBUIÇÃO DE FREQUÊNCIA 30 Exemplo Desta maneira podemos montar a tabela Coluna da direita frequência de classe Menor como 30 e maior valor como o 39 limites de classe Limites inferiores de classe 30 40 etc Limites superiores de classe 39 49 etc Se tivéssemos valores decimais o agrupamento seria feito o valor 30 acomodaria valores entre 295 até 305 então a classe 30 39 incluiria os valores de 295 até 395 Fronteiras de classe 295 395 496 etc Fronteira superior 395 1º classe Fronteira inferior 395 2º classe As fronteiras são sempre valores impossíveis DISTRIBUIÇÃO DE FREQUÊNCIA 31 Pontos médios de classe média simples do valor inferior e superior caso da classe 30 39 o ponto médio é 30 392 345 Intervalo de classe ou intervalo de classe da distribuição comprimento da classe ou amplitude dos valores que pode conter dado pela diferença das fronteiras caso da classe 30 39 intervalo é 395 295 10 Mais usual apresentar a distribuição de frequências como distribuição percentual para tanto dividimos cada frequência de classe pelo número total de itens agrupados e então multiplicar por 100 caso da classe 30 39 temos 2 de frequência então 2110100 1818 182 DISTRIBUIÇÃO DE FREQUÊNCIA 32 Exemplo Vamos montar a tabela anterior com distribuição percentual 1º classe 2110100 182 2º classe 2110100 182 3º classe 4110100 364 4º classe 19110100 1727 5º classe 24110100 2182 6º classe 39110100 3545 7º classe 15110100 1364 8º classe 3110100 273 9º classe 2110100 182 Veja se somarmos todas percentagens chegamos em 10101 o correto é sempre 100 essa diferença é devido aos arredondamentos feitos DISTRIBUIÇÃO DE FREQUÊNCIA 33 Uma outra maneira de apresentar a tabela é utilizando a distribuição cumulativa com menos de ou menos mais de ou ou mais Para isso somamos as frequências de classe partindo do topo ou da base Menos de 30 poderia ser 29 ou menos e assim por diante nesse caso chamamos de distribuição cumulativa do tipo ou menos DISTRIBUIÇÃO DE FREQUÊNCIA 34 No caso anterior utilizamos a frequência dos dados podese fazer o mesmo cumulativo utilizando as frequências em porcentagem assim teríamos uma distribuição percentual cumulativa somando as porcentagens das frequências Se nossa distribuição for categórica qualitativa seguimos o mesmo método para as classes quantas categorias muitas vezes é prudente neste tipo de pesquisa ter a categoria outros ou diversos Muito cuidado com ambiguidades classificar artigos em supermercados como carnes congelados assados onde entraria o item torta de carne congelada Pensando em profissões onde colocar administrador de fazenda se tivéssemos na tabela fazendeiros e administradores APRESENTAÇÕES GRÁFICAS 35 Apresentar dados em forma de gráficos é interessante Qual estilo utilizar Um gráfico irá sempre ajudar na compreensão da informação APRESENTAÇÕES GRÁFICAS 40 Histogramas muito usado para as distribuições de frequência nele ficam agrupadas medidas ou observações na escala horizontal com retângulos que tem base igual ao intervalo de classe e alturas iguais às frequências de classe na horizontal podemos utilizar os pontos médios das classes os limites da classe as fronteiras ou outros valores Se tivermos classes abertas não podemos utilizar e cuidado quando se tem classes com intervalos diferentes APRESENTAÇÕES GRÁFICAS 41 Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink APRESENTAÇÕES GRÁFICAS 42 Gráficos de barras algumas vezes também denominados histogramas a diferença fica na escala horizontal que acaba sendo contínua Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink APRESENTAÇÕES GRÁFICAS 43 Polígonos de frequência ou Gráfico de linhas frequências de classe fazem par com os pontos médios das classes e então unidos por uma reta colocase classes com frequência 0 nas duas extremidades para que saia da reta horizontal Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink APRESENTAÇÕES GRÁFICAS 44 Ogiva de frequência ou Gráfico de linhas com frequência acumulada frequências acumuladas fazem par com as fronteiras de classes e então unidos por uma reta colocase fronteira com frequência 0 na extremidade esquerda para que saia da reta horizontal Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink APRESENTAÇÕES GRÁFICAS 45 Pictogramas APRESENTAÇÕES GRÁFICAS 46 Gráficos de setores pizza muito utilizado para distribuições categóricas Utilizase distribuição percentual e a relação que um círculo possui 360º então 360º100 36º para cada 1 APRESENTAÇÕES GRÁFICAS 47 Exemplo A tabela mostra em milhares a escolaridade de pessoas com filhos em determinado ano Construa um gráfico de setores 1º Passar para porcentagem APRESENTAÇÕES GRÁFICAS 48 2º Passar para graus multiplicase a porcentagem por 36 Então 2075 36 747º 3252 36 1171º 2119 36 763º 679 36 244º 1394 36 502º 480 36 173º Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink DADOS COM DUAS VARIÁVEIS 49 Chamaremos os valores de x e y são os dados emparelhados par ordenado x y como o ponto no plano cartesiano gráfico de dispersão ou diagrama de dispersão para procurar relações entre as variáveis x e y se existir ou seja verificar se temos padrões DADOS COM DUAS VARIÁVEIS 50 Exemplo Uma matériaprima utilizada na produção de fibra sintética está armazenada em um local sem controle de umidade na tabela temos as medidas x de umidade relativa do local e y de conteúdo de água em uma amostra da matériaprima Construa um gráfico de dispersão Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink DADOS COM DUAS VARIÁVEIS 51 Exemplo Os dados foram obtidos num estudo sobre a relação entre a resistência em ohms e o tempo em minutos que certos resistores sobrecarregados levam para falhar Construa um gráfico de dispersão Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink DADOS COM DUAS VARIÁVEIS 52 Exemplo As notas na tabela foram obtidas por 40 alunos em ambas partes de um teste com as notas de problemas pares denotadas por x e as notas de problemas ímpares por y Escolhendo as 5 classes 26 30 31 35 36 40 41 45 e 46 50 para x e as 6 classes 21 25 26 30 31 35 36 40 41 45 e 46 50 para y agrupe os dados em uma distribuição de frequência dupla e esboce um histograma tridimensional Planilha Aula 1 httpsdocsgooglecomspreadsheetsd1rlYh7EBnYYUD0Nr7IPMkwGevbmdlgfVEftxAvLz4edituspsharelink DADOS COM DUAS VARIÁVEIS 53 Fazendo a contagem montamos a tabela