·
Engenharia de Controle e Automação ·
Estatística e Probabilidade
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
13
Slide - Medidas de Tendência Central - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
5
Lista 1 - Estatística e Probabilidade - 2023-1
Estatística e Probabilidade
UFOP
1
Lista - Bayes - 2023-1
Estatística e Probabilidade
UFOP
13
Questões - Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
48
Slide - Probabilidade - Estatística e Probabilidade 2020-2
Estatística e Probabilidade
UFOP
5
Lista - Estatística e Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
24
Slide - Classificação de Variáveis e Distribuição de Frequências - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
19
Slide - Introdução e Amostragem 2022-2
Estatística e Probabilidade
UFOP
29
Slide - Medidas de Variabilidade - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
4
Lista 2 - Estatística e Probabilidade - 2023-1
Estatística e Probabilidade
UFOP
Texto de pré-visualização
Estatística June 16, 2021 UFOP June 16, 2021 1 / 44 NOME 1 ESTATÍSTICA Definições importantes O Método Estatístico Coleta de dados 2 Tipos de variáveis Variáveis Qualitativas Variáveis Quantitativas UFOP June 16, 2021 2 / 44 Introdução A estatística é uma ciência que se interessa em obter conclusões a partir de dados observados e no método cientifico para coleta, organização, resumo, apresentação, análise e interpretação de dados amostrais. A estatística iniciou-se como método cientifico a partir de 1925 com o trabalho de R. A. Fisher, embora o trabalhos pioneiros de Gauss no fim do século anterior e dos trabalhos de Gosset de 1908, publicado com o pseudônimo de “Student”, foram de extrema importância. UFOP June 16, 2021 3 / 44 De um modo geral, podemos dividir a estatística em três áreas: Estatística descritiva, Probabilidade e Inferência Estatística. A estatística descritiva pode ser definida como um conjunto de técnicas destinadas a descrever e resumir os dados, a fim de que possamos tirar conclusões a respeito de características de interesse. A probabilidade pode ser pensada como a teoria matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório. A inferência estatística é o estudo de técnicas que possibilitam a extrapolação, a um grande numero de dados, das informações e conclusões obtidas a partir de um subconjunto de valores. UFOP June 16, 2021 4 / 44 Definições importantes População: é uma coleção completa de todos os elementos a serem estudados. (valores, pessoas, medidas, etc). Amostra: é uma subcoleção de elementos extraídos de uma população. A amostra deve ser selecionada seguindo certas regras e deve ser representativa. A representatividade é obtida quando apresenta tamanho suficiente e é composta de forma aleatória (probabilística). Censo: atividade de inspecionar (observar) todos os elementos de uma população, objetivando conhecer, com certeza suas características. Amostragem: É o processo de retirada de informações dos n elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). UFOP June 16, 2021 5 / 44 Parâmetro é uma medida numérica que descreve uma característica de uma população. Estatística é uma medida numérica que descreve uma característica de uma amostra. Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. UFOP June 16, 2021 6 / 44 O Método Estatístico O Método Estatístico pode ser descrito pelas etapas a seguir: Definição do problema Consiste na: formulação correta do problema; examinar outros levantamentos realizados no mesmo campo (revisão da literatura); saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) UFOP June 16, 2021 7 / 44 Planejamento Determinar o procedimento necessário para resolver o problema: Como levantar informações; Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). Cronograma, Custos, etc. UFOP June 16, 2021 8 / 44 Coleta da dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer: A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). UFOP June 16, 2021 9 / 44 Apuração e apresentação dos dados Consiste em resumir os dados, através de uma contagem e agrupamento. É a fase em que vamos mostrar os resultados obtidos na coleta e na organização. É um trabalho de coordenação e de tabulação. A apresentação dos dados pode ser: – Tabular (apresentação numérica) – Gráfica (apresentação geométrica) UFOP June 16, 2021 10 / 44 Análise e interpretação dos dados É a fase mais importante e também a mais delicada. Aqui são tiradas as conclusões que auxiliam o pesquisador a resolver seu problema. UFOP June 16, 2021 11 / 44 Coleta de dados Amostragem Aleatória Simples Dentre as mais diversas maneiras para coletar dados, a amostragem é mais frequente, particularmente sobre fenômenos sociais e econômicos. Apresentamos aqui o processo mais comum e útil para a condução de investigações empíricas: seleção de uma amostra aleatória simples UFOP June 16, 2021 12 / 44 Uma amostra é probabilística quando os elementos amostrais são escolhidos com probabilidades conhecidas. Na Amostragem aleatória simples, todos os elementos da população têm igual probabilidade de compor a amostra. Uma amostra em que a probabilidade de escolher qualquer um dos n elementos em uma prova única é igual a 1 n é uma amosta aleatória. UFOP June 16, 2021 13 / 44 Tipos de variáveis Antes de definir o problema a ser estudado, devemos ter em mente quais as características dos elementos de uma população deverão ser estudados. Ou seja, não trabalharemos com os elementos existentes, mas com algumas características desses elementos. Por exemplo, os elementos a serem estudados podem ser a população de uma cidade, mas estaremos interessados em alguma característica como renda, idade, sexo, tipo de moradia, etc. Trabalharemos, portanto com os valores de uma VARIAVEL, que é a característica de interesse, e não com os elementos originalmente considerados. A escolha da variável, ou variáveis de interesse dependerá dos objetivos do estudo estatístico em questão. UFOP June 16, 2021 14 / 44 As variáveis podem ser classificadas como qualitativas ou quantitativas. A variável será QUALITATIVA quando resultar de uma classificação por tipos ou atributos. As variáveis qualitativas ainda podem ser subdivididas em qualitativa nominal e qualitativa ordinal. Se tais variáveis têm uma ordenação natural, indicando intensidades crescentes de realização, então, elas serão classificadas como qualitativas ordinais. Caso contrário, quando não é possível estabelecer uma ordem natural entre seus valores, elas são classificadas como qualitativas nominais. UFOP June 16, 2021 15 / 44 Exemplos: • Variável qualitativa nominal. - sexo (feminino ou masculino) - tipo de habitação (casa, apartamento, kitnet, barraco, etc) • Variável qualitativa ordinal. - qualidade de um programa de TV (ruim regular, boa, ótima) - grau de instrução: ensino fundamental, ensino médio e ensino superior. UFOP June 16, 2021 16 / 44 A variável será QUANTITATIVA quando seus valores forem expressos por números. As variáveis quantitativas podem ser subdivididas em quantitativas discretas, quando temos números resultantes de uma contagem e quantitativas continuas, quando temos números resultantes de uma mensuração. UFOP June 16, 2021 17 / 44 Exemplos: • Variável quantitativa discreta - Numero de filhos (0,1,2...) - Numero de peças defeituosas numa produção de pregos • Variável quantitativa continua - Comprimento (em centímetros, metros, etc) - Peso (em quilogramas) UFOP June 16, 2021 18 / 44 variavel qualitativa nominal ordinal quantitativa discreta continua UFOP June 16, 2021 19 / 44 Variáveis Qualitativas Para resumir dados qualitativos, utilizam-se contagens, proporções, porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Freqüentemente o primeiro passo da descrição de dados é criar uma tabela de freqüências. Antes de montar a tabela de distribuição de freqüências temos algumas definições: UFOP June 16, 2021 20 / 44 Freqüência - medida que quantifica a ocorrência dos valores de uma variável a um dado conjunto de dados. As freqüências podem ser: Absoluta (fi) - contagem das observações de uma variável. Relativa (fr) - divisão da freqüência absoluta pelo total de observações. fr = fi n Percentual (fp) - é a frequência relativa multiplicada por 100. fp = 100xfr UFOP June 16, 2021 21 / 44 Exemplo Foi observado a atividade agropecuária predominante em 20 propriedades de um município. Como se observa, a atividade predominante corresponde a uma variável qualitativa nominal, pois não é passível de ordenação. café leite leite milho café milho soja leite leite café milho café olericultura leite café laranja café milho café café UFOP June 16, 2021 22 / 44 Tabelas simples como esta são na maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem poucas categorias. Atividade fi fr fp café 8 0,40 40 leite 5 0,25 25 olericultura 1 0,05 5 soja 1 0,05 5 milho 4 0,20 20 laranja 1 0,05 5 UFOP June 16, 2021 23 / 44 Representação gráfica Os dados qualitativos podem ser bem representados pelos gráficos de disco ou pizza e também pelo gráfico de barras. O gráfico de disco ou pizza, ou ainda, diagrama circular se adapta muito bem às variáveis qualitativas nominais. Consiste em repartir um disco em setores circulares correspondentes à porcentagem de cada valor, multiplicando-se por 100, a freqüência relativa fi. O gráfico de barras utiliza o plano cartesiano com os valores da variável no eixo das abcissas e as freqüências ou porcentagens no eixo das ordenadas. Para cada valor da variavel desenha-se uma barra com uma altura correspondendo à sua freqüência ou porcentagem. Este gráfico se adapta muito bem às variáveis discretas ou qualitativas ordinais. UFOP June 16, 2021 24 / 44 Construção de gráficos Automóveis nacionais masi vendidos - janeiro/agosto de 2000 veiculos quantidades vendidas gol 166.158 uno 58.556 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 UFOP June 16, 2021 25 / 44 aula_1 - Microsoft Excel uso não comercial Inicio Inserir Layout da Página Fórmulas Dados Revisão Exibição quantidades vendidas A2 gol veiculos quantidades vendidas 1 veiculos quantidades vendidas 2 gol 166.158 3 uno 58.556 4 palio 86.776 5 astra 22.006 6 corsa 66.065 7 vectra 23.162 8 palio weekend 18.997 9 fiesta 24.586 10 corsa sedan 55.334 11 parati 18.765 Colunas Linhas Pizza Barras Área Dispersão Outros Gráficos Ilustrações Imagem Clip-art Formas SmartArt Ortogonal Tabela Tabela Texto Caixa de Texto WordArt Cabeçalho e Rodapé Linha de Assinatura Objeto Símbolo Colunas 2D Colunas 3D Cilindro Cone 19/03/2013 13:54 Todos os Tipos de Gráfico... Pronto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Plano A Plano B Plano C Plano D Plano E UFOP June 16, 2021 26 / 44 aula_1 - Microsoft Excel uso não comercial Ferramentas de Gráfico Inico Tipo Altera Tipo Salvar como Modelo Layout de Página Dados Alterar Linha/Coluna Selecionar Dados Revisão Exibição Layout de Gráfico Design Formatar Serie 1 veiculos quantidades vendidas gol uno palio astra corsa vectra palio weekend fiesta corsa sedan Graficos 1 veiculos quantidades vendidas 1 veiculos quantidades vendidas 2 gol 166.158 uno 58.556 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 Estilos de Gráfico UFOP June 16, 2021 27 / 44 Os passos seguintes podem melhorar o gráfico: Clicar sobre a legenda (Série 1) e Delete para que o gráfico automaticamente se ajuste ao espaço da figura. Para incluir títulos, clicar no gráfico e utilizar o menu Layout que aparece na barra de ferramenta principal do Excel. Retirar as linhas horizontais no gráfico, clicando nas mesmas e em seguida Delete. Para alterar o tipo de gráfico, utilize o menu Inserir. Ao clicar sobre o novo tipo de gráfico, a figura automaticamente sofrerá alterações. UFOP June 16, 2021 28 / 44 veiculos quantidades vendidas gol 166.158 uno 56.356 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 veiculos quantidades vendidas gol 166.158 uno 56.356 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 Gráfico final - Exemplo UFOP June 16, 2021 31 / 44 Variáveis Quantitativas Para os dados quantitativos a forma de representação mais simples é a distribuição de freqüência. A distribuição de freqüência é a distribuição dos dados em classes ou categorias, onde o número de elementos pertencentes a cada classe é determinado e representa a freqüência de classe. Uma das formas mais comuns de se construir uma tabela de distribuição de freqüência é a seguinte: UFOP June 16, 2021 32 / 44 1o Passo: Construir o Rol (dados em ordem crescente) e determinar a Amplitude Total ou Range A = Maior valor na amostra – Menor valor na amostra A = X(n) − X(1) UFOP June 16, 2021 33 / 44 2o Passo: Determinar o número de classes (k): geralmente o número de classes é escolhido por muitos autores em um valor entre 5 e 20, de uma forma empírica. A familiaridade do pesquisador com os dados é que deve indicar quantas classes devem ser construídas. Uma maneira de se determinar um número razoável, k, de classes consiste em aplicar a fórmula de Sturges, que sugere o cálculo de k mediante a expressão: k = 1 + 3, 32 · logn Outra forma de se calcular o valor de k consiste em tomar a raiz quadrada de n, assim, k = √n UFOP June 16, 2021 34 / 44 3o Passo: De posse do valor k e de A, iremos encontrar a amplitude de classe (c), dada por c = A k . 4o Passo: Definir o limite inferior da primeira classe: Li = X(1) Quanto aos limites das classes, usaremo o seguinte critério: a ⊢ b (incluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b) UFOP June 16, 2021 35 / 44 Temos ainda que: x̄_i é o ponto médio da i-ésima classe, é a média dos pontos extremos da classe, f_i é a quantidade de observações, ou frequência, da i-ésima clase, n é a quantidade total de observações n = Σf_i, f_r é a frequência relativa da classe f_r = \frac{f_i}{n}, F_A é a frequência acumulada até a i-ésima classe e indica a quantidade de observações inferiores ao limite superior da classe. F_{rA} é a frequência relativa acumulada até a i-ésima classe e indica a quantidade de observações relativas inferiores ao limite superior da classe. Exemplo Construa uma tabela de distribuição, para as seguintes alturas, expressas em centímetros, de 30 atletas do sexo masculino de uma universidade: 168 172 170 181 169 173 164 175 182 177 176 173 170 186 183 170 168 166 169 180 175 164 181 179 172 169 174 171 178 166 UFOP June 16, 2021 37 / 44 Ordenar os dados 164 164 166 166 168 168 169 169 169 170 170 170 171 172 172 173 173 174 175 175 176 177 178 179 180 181 181 182 183 186 Calcular da amplitude total (maior valor - menor valor): A = X(n) − X(1) = 186 − 164 = 22 Calcular do número de classes: k = √ 30 ∼= 5 UFOP June 16, 2021 38 / 44 Calcular da amplitude da classe: c = amplitudetotal nmerodeclasses = A k = 22 5 = 4, 40 Definir o limite inferior da primeira classe: LI1 = X(1) = 164 UFOP June 16, 2021 39 / 44 Distribuição de frequência das alturas de atletas Classe (cm) x̄ᵢ fᵢ fᵣ Fₐ Fᵣₐ 164,0 ⟼ 168,4 166,2 6 0,20 6 0,20 168,4 ⟼ 172,8 170,6 9 0,30 15 0,50 172,8 ⟼ 177,2 175,0 7 0,23 22 0,73 177,2 ⟼ 181,6 179,4 5 0,17 27 0,90 181,6 ⟼ 186,0 183,8 3 0,10 30 1,00 Fonte: Dados Hipotéticos Representação gráfica Os dados quantitativos podem ser bem representados pelo histograma e polígono de freqüência. Histograma é um gráfico representado por retângulos (barras) contíguos (que toca em alguma coisa) no qual os extremos da base do retângulo i são definidos pelos limites da classe i e a altura é proporcional à freqüência. A área total do histograma deve ser igual a 1 ou 100%. Polígono de frequências: consideramos a poligonal que une os pontos médios das bases superiores dos retângulos dos histogramas (pontos médios das classes). UFOP June 16, 2021 41 / 44 Histograma de Altura Histograma e Polígono de Frequência de Altura Poligono de frequencia de Altura Frequencia Altura UFOP June 16, 2021 44 / 44
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
13
Slide - Medidas de Tendência Central - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
5
Lista 1 - Estatística e Probabilidade - 2023-1
Estatística e Probabilidade
UFOP
1
Lista - Bayes - 2023-1
Estatística e Probabilidade
UFOP
13
Questões - Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
48
Slide - Probabilidade - Estatística e Probabilidade 2020-2
Estatística e Probabilidade
UFOP
5
Lista - Estatística e Probabilidade - 2023-2
Estatística e Probabilidade
UFOP
24
Slide - Classificação de Variáveis e Distribuição de Frequências - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
19
Slide - Introdução e Amostragem 2022-2
Estatística e Probabilidade
UFOP
29
Slide - Medidas de Variabilidade - Estatística e Probabilidade 2022-2
Estatística e Probabilidade
UFOP
4
Lista 2 - Estatística e Probabilidade - 2023-1
Estatística e Probabilidade
UFOP
Texto de pré-visualização
Estatística June 16, 2021 UFOP June 16, 2021 1 / 44 NOME 1 ESTATÍSTICA Definições importantes O Método Estatístico Coleta de dados 2 Tipos de variáveis Variáveis Qualitativas Variáveis Quantitativas UFOP June 16, 2021 2 / 44 Introdução A estatística é uma ciência que se interessa em obter conclusões a partir de dados observados e no método cientifico para coleta, organização, resumo, apresentação, análise e interpretação de dados amostrais. A estatística iniciou-se como método cientifico a partir de 1925 com o trabalho de R. A. Fisher, embora o trabalhos pioneiros de Gauss no fim do século anterior e dos trabalhos de Gosset de 1908, publicado com o pseudônimo de “Student”, foram de extrema importância. UFOP June 16, 2021 3 / 44 De um modo geral, podemos dividir a estatística em três áreas: Estatística descritiva, Probabilidade e Inferência Estatística. A estatística descritiva pode ser definida como um conjunto de técnicas destinadas a descrever e resumir os dados, a fim de que possamos tirar conclusões a respeito de características de interesse. A probabilidade pode ser pensada como a teoria matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório. A inferência estatística é o estudo de técnicas que possibilitam a extrapolação, a um grande numero de dados, das informações e conclusões obtidas a partir de um subconjunto de valores. UFOP June 16, 2021 4 / 44 Definições importantes População: é uma coleção completa de todos os elementos a serem estudados. (valores, pessoas, medidas, etc). Amostra: é uma subcoleção de elementos extraídos de uma população. A amostra deve ser selecionada seguindo certas regras e deve ser representativa. A representatividade é obtida quando apresenta tamanho suficiente e é composta de forma aleatória (probabilística). Censo: atividade de inspecionar (observar) todos os elementos de uma população, objetivando conhecer, com certeza suas características. Amostragem: É o processo de retirada de informações dos n elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). UFOP June 16, 2021 5 / 44 Parâmetro é uma medida numérica que descreve uma característica de uma população. Estatística é uma medida numérica que descreve uma característica de uma amostra. Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. UFOP June 16, 2021 6 / 44 O Método Estatístico O Método Estatístico pode ser descrito pelas etapas a seguir: Definição do problema Consiste na: formulação correta do problema; examinar outros levantamentos realizados no mesmo campo (revisão da literatura); saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) UFOP June 16, 2021 7 / 44 Planejamento Determinar o procedimento necessário para resolver o problema: Como levantar informações; Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). Cronograma, Custos, etc. UFOP June 16, 2021 8 / 44 Coleta da dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer: A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). UFOP June 16, 2021 9 / 44 Apuração e apresentação dos dados Consiste em resumir os dados, através de uma contagem e agrupamento. É a fase em que vamos mostrar os resultados obtidos na coleta e na organização. É um trabalho de coordenação e de tabulação. A apresentação dos dados pode ser: – Tabular (apresentação numérica) – Gráfica (apresentação geométrica) UFOP June 16, 2021 10 / 44 Análise e interpretação dos dados É a fase mais importante e também a mais delicada. Aqui são tiradas as conclusões que auxiliam o pesquisador a resolver seu problema. UFOP June 16, 2021 11 / 44 Coleta de dados Amostragem Aleatória Simples Dentre as mais diversas maneiras para coletar dados, a amostragem é mais frequente, particularmente sobre fenômenos sociais e econômicos. Apresentamos aqui o processo mais comum e útil para a condução de investigações empíricas: seleção de uma amostra aleatória simples UFOP June 16, 2021 12 / 44 Uma amostra é probabilística quando os elementos amostrais são escolhidos com probabilidades conhecidas. Na Amostragem aleatória simples, todos os elementos da população têm igual probabilidade de compor a amostra. Uma amostra em que a probabilidade de escolher qualquer um dos n elementos em uma prova única é igual a 1 n é uma amosta aleatória. UFOP June 16, 2021 13 / 44 Tipos de variáveis Antes de definir o problema a ser estudado, devemos ter em mente quais as características dos elementos de uma população deverão ser estudados. Ou seja, não trabalharemos com os elementos existentes, mas com algumas características desses elementos. Por exemplo, os elementos a serem estudados podem ser a população de uma cidade, mas estaremos interessados em alguma característica como renda, idade, sexo, tipo de moradia, etc. Trabalharemos, portanto com os valores de uma VARIAVEL, que é a característica de interesse, e não com os elementos originalmente considerados. A escolha da variável, ou variáveis de interesse dependerá dos objetivos do estudo estatístico em questão. UFOP June 16, 2021 14 / 44 As variáveis podem ser classificadas como qualitativas ou quantitativas. A variável será QUALITATIVA quando resultar de uma classificação por tipos ou atributos. As variáveis qualitativas ainda podem ser subdivididas em qualitativa nominal e qualitativa ordinal. Se tais variáveis têm uma ordenação natural, indicando intensidades crescentes de realização, então, elas serão classificadas como qualitativas ordinais. Caso contrário, quando não é possível estabelecer uma ordem natural entre seus valores, elas são classificadas como qualitativas nominais. UFOP June 16, 2021 15 / 44 Exemplos: • Variável qualitativa nominal. - sexo (feminino ou masculino) - tipo de habitação (casa, apartamento, kitnet, barraco, etc) • Variável qualitativa ordinal. - qualidade de um programa de TV (ruim regular, boa, ótima) - grau de instrução: ensino fundamental, ensino médio e ensino superior. UFOP June 16, 2021 16 / 44 A variável será QUANTITATIVA quando seus valores forem expressos por números. As variáveis quantitativas podem ser subdivididas em quantitativas discretas, quando temos números resultantes de uma contagem e quantitativas continuas, quando temos números resultantes de uma mensuração. UFOP June 16, 2021 17 / 44 Exemplos: • Variável quantitativa discreta - Numero de filhos (0,1,2...) - Numero de peças defeituosas numa produção de pregos • Variável quantitativa continua - Comprimento (em centímetros, metros, etc) - Peso (em quilogramas) UFOP June 16, 2021 18 / 44 variavel qualitativa nominal ordinal quantitativa discreta continua UFOP June 16, 2021 19 / 44 Variáveis Qualitativas Para resumir dados qualitativos, utilizam-se contagens, proporções, porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Freqüentemente o primeiro passo da descrição de dados é criar uma tabela de freqüências. Antes de montar a tabela de distribuição de freqüências temos algumas definições: UFOP June 16, 2021 20 / 44 Freqüência - medida que quantifica a ocorrência dos valores de uma variável a um dado conjunto de dados. As freqüências podem ser: Absoluta (fi) - contagem das observações de uma variável. Relativa (fr) - divisão da freqüência absoluta pelo total de observações. fr = fi n Percentual (fp) - é a frequência relativa multiplicada por 100. fp = 100xfr UFOP June 16, 2021 21 / 44 Exemplo Foi observado a atividade agropecuária predominante em 20 propriedades de um município. Como se observa, a atividade predominante corresponde a uma variável qualitativa nominal, pois não é passível de ordenação. café leite leite milho café milho soja leite leite café milho café olericultura leite café laranja café milho café café UFOP June 16, 2021 22 / 44 Tabelas simples como esta são na maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem poucas categorias. Atividade fi fr fp café 8 0,40 40 leite 5 0,25 25 olericultura 1 0,05 5 soja 1 0,05 5 milho 4 0,20 20 laranja 1 0,05 5 UFOP June 16, 2021 23 / 44 Representação gráfica Os dados qualitativos podem ser bem representados pelos gráficos de disco ou pizza e também pelo gráfico de barras. O gráfico de disco ou pizza, ou ainda, diagrama circular se adapta muito bem às variáveis qualitativas nominais. Consiste em repartir um disco em setores circulares correspondentes à porcentagem de cada valor, multiplicando-se por 100, a freqüência relativa fi. O gráfico de barras utiliza o plano cartesiano com os valores da variável no eixo das abcissas e as freqüências ou porcentagens no eixo das ordenadas. Para cada valor da variavel desenha-se uma barra com uma altura correspondendo à sua freqüência ou porcentagem. Este gráfico se adapta muito bem às variáveis discretas ou qualitativas ordinais. UFOP June 16, 2021 24 / 44 Construção de gráficos Automóveis nacionais masi vendidos - janeiro/agosto de 2000 veiculos quantidades vendidas gol 166.158 uno 58.556 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 UFOP June 16, 2021 25 / 44 aula_1 - Microsoft Excel uso não comercial Inicio Inserir Layout da Página Fórmulas Dados Revisão Exibição quantidades vendidas A2 gol veiculos quantidades vendidas 1 veiculos quantidades vendidas 2 gol 166.158 3 uno 58.556 4 palio 86.776 5 astra 22.006 6 corsa 66.065 7 vectra 23.162 8 palio weekend 18.997 9 fiesta 24.586 10 corsa sedan 55.334 11 parati 18.765 Colunas Linhas Pizza Barras Área Dispersão Outros Gráficos Ilustrações Imagem Clip-art Formas SmartArt Ortogonal Tabela Tabela Texto Caixa de Texto WordArt Cabeçalho e Rodapé Linha de Assinatura Objeto Símbolo Colunas 2D Colunas 3D Cilindro Cone 19/03/2013 13:54 Todos os Tipos de Gráfico... Pronto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Plano A Plano B Plano C Plano D Plano E UFOP June 16, 2021 26 / 44 aula_1 - Microsoft Excel uso não comercial Ferramentas de Gráfico Inico Tipo Altera Tipo Salvar como Modelo Layout de Página Dados Alterar Linha/Coluna Selecionar Dados Revisão Exibição Layout de Gráfico Design Formatar Serie 1 veiculos quantidades vendidas gol uno palio astra corsa vectra palio weekend fiesta corsa sedan Graficos 1 veiculos quantidades vendidas 1 veiculos quantidades vendidas 2 gol 166.158 uno 58.556 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 Estilos de Gráfico UFOP June 16, 2021 27 / 44 Os passos seguintes podem melhorar o gráfico: Clicar sobre a legenda (Série 1) e Delete para que o gráfico automaticamente se ajuste ao espaço da figura. Para incluir títulos, clicar no gráfico e utilizar o menu Layout que aparece na barra de ferramenta principal do Excel. Retirar as linhas horizontais no gráfico, clicando nas mesmas e em seguida Delete. Para alterar o tipo de gráfico, utilize o menu Inserir. Ao clicar sobre o novo tipo de gráfico, a figura automaticamente sofrerá alterações. UFOP June 16, 2021 28 / 44 veiculos quantidades vendidas gol 166.158 uno 56.356 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 veiculos quantidades vendidas gol 166.158 uno 56.356 palio 86.776 astra 22.006 corsa 66.065 vectra 23.162 palio weekend 18.997 fiesta 24.586 corsa sedan 55.334 parati 18.765 Gráfico final - Exemplo UFOP June 16, 2021 31 / 44 Variáveis Quantitativas Para os dados quantitativos a forma de representação mais simples é a distribuição de freqüência. A distribuição de freqüência é a distribuição dos dados em classes ou categorias, onde o número de elementos pertencentes a cada classe é determinado e representa a freqüência de classe. Uma das formas mais comuns de se construir uma tabela de distribuição de freqüência é a seguinte: UFOP June 16, 2021 32 / 44 1o Passo: Construir o Rol (dados em ordem crescente) e determinar a Amplitude Total ou Range A = Maior valor na amostra – Menor valor na amostra A = X(n) − X(1) UFOP June 16, 2021 33 / 44 2o Passo: Determinar o número de classes (k): geralmente o número de classes é escolhido por muitos autores em um valor entre 5 e 20, de uma forma empírica. A familiaridade do pesquisador com os dados é que deve indicar quantas classes devem ser construídas. Uma maneira de se determinar um número razoável, k, de classes consiste em aplicar a fórmula de Sturges, que sugere o cálculo de k mediante a expressão: k = 1 + 3, 32 · logn Outra forma de se calcular o valor de k consiste em tomar a raiz quadrada de n, assim, k = √n UFOP June 16, 2021 34 / 44 3o Passo: De posse do valor k e de A, iremos encontrar a amplitude de classe (c), dada por c = A k . 4o Passo: Definir o limite inferior da primeira classe: Li = X(1) Quanto aos limites das classes, usaremo o seguinte critério: a ⊢ b (incluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b) UFOP June 16, 2021 35 / 44 Temos ainda que: x̄_i é o ponto médio da i-ésima classe, é a média dos pontos extremos da classe, f_i é a quantidade de observações, ou frequência, da i-ésima clase, n é a quantidade total de observações n = Σf_i, f_r é a frequência relativa da classe f_r = \frac{f_i}{n}, F_A é a frequência acumulada até a i-ésima classe e indica a quantidade de observações inferiores ao limite superior da classe. F_{rA} é a frequência relativa acumulada até a i-ésima classe e indica a quantidade de observações relativas inferiores ao limite superior da classe. Exemplo Construa uma tabela de distribuição, para as seguintes alturas, expressas em centímetros, de 30 atletas do sexo masculino de uma universidade: 168 172 170 181 169 173 164 175 182 177 176 173 170 186 183 170 168 166 169 180 175 164 181 179 172 169 174 171 178 166 UFOP June 16, 2021 37 / 44 Ordenar os dados 164 164 166 166 168 168 169 169 169 170 170 170 171 172 172 173 173 174 175 175 176 177 178 179 180 181 181 182 183 186 Calcular da amplitude total (maior valor - menor valor): A = X(n) − X(1) = 186 − 164 = 22 Calcular do número de classes: k = √ 30 ∼= 5 UFOP June 16, 2021 38 / 44 Calcular da amplitude da classe: c = amplitudetotal nmerodeclasses = A k = 22 5 = 4, 40 Definir o limite inferior da primeira classe: LI1 = X(1) = 164 UFOP June 16, 2021 39 / 44 Distribuição de frequência das alturas de atletas Classe (cm) x̄ᵢ fᵢ fᵣ Fₐ Fᵣₐ 164,0 ⟼ 168,4 166,2 6 0,20 6 0,20 168,4 ⟼ 172,8 170,6 9 0,30 15 0,50 172,8 ⟼ 177,2 175,0 7 0,23 22 0,73 177,2 ⟼ 181,6 179,4 5 0,17 27 0,90 181,6 ⟼ 186,0 183,8 3 0,10 30 1,00 Fonte: Dados Hipotéticos Representação gráfica Os dados quantitativos podem ser bem representados pelo histograma e polígono de freqüência. Histograma é um gráfico representado por retângulos (barras) contíguos (que toca em alguma coisa) no qual os extremos da base do retângulo i são definidos pelos limites da classe i e a altura é proporcional à freqüência. A área total do histograma deve ser igual a 1 ou 100%. Polígono de frequências: consideramos a poligonal que une os pontos médios das bases superiores dos retângulos dos histogramas (pontos médios das classes). UFOP June 16, 2021 41 / 44 Histograma de Altura Histograma e Polígono de Frequência de Altura Poligono de frequencia de Altura Frequencia Altura UFOP June 16, 2021 44 / 44