• Home
  • Chat IA
  • Recursos
  • Guru IA
  • Professores
Home
Recursos
Chat IA
Professores

·

Agronomia ·

Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Teste de Hipóteses para Médias - Populações Normais com Variância Conhecida e Desconhecida

4

Teste de Hipóteses para Médias - Populações Normais com Variância Conhecida e Desconhecida

Estatística 1

UFU

Exercícios Resolvidos-Iniciação-Estatística-Regressão-e-Correlação

1

Exercícios Resolvidos-Iniciação-Estatística-Regressão-e-Correlação

Estatística 1

UFU

Lista de Exercícios - Amostragem e Inferência Estatística

5

Lista de Exercícios - Amostragem e Inferência Estatística

Estatística 1

UFU

Analise Estatística Descritiva - Chuvas em Jataí 1980-2009 - Abril Maio e Dezembro

1

Analise Estatística Descritiva - Chuvas em Jataí 1980-2009 - Abril Maio e Dezembro

Estatística 1

UFU

Calculo-Amostral-e-Nivel-de-Confianca-em-Pesquisa-de-Doenca

1

Calculo-Amostral-e-Nivel-de-Confianca-em-Pesquisa-de-Doenca

Estatística 1

UFU

Trabalho Estatística

33

Trabalho Estatística

Estatística 1

UFU

Estatistica Descritiva Probabilidade e Amostragem - Resumo Completo

1

Estatistica Descritiva Probabilidade e Amostragem - Resumo Completo

Estatística 1

UFU

Lista 6 - Teoria da Estimação 2021-2

3

Lista 6 - Teoria da Estimação 2021-2

Estatística

UFU

Lista 4 - Inferência - Estatística 2022-1

2

Lista 4 - Inferência - Estatística 2022-1

Estatística

UFU

Lista 2 - Estatística 2022-1

2

Lista 2 - Estatística 2022-1

Estatística

UFU

Texto de pré-visualização

ESTATÍSTICA DESCRITIVA E ANÁLISE EXPLORATÓRIA Disciplina: Estatística Profa Patrícia Viana da Silva patriciaviana@ufu.br Estatística Descritiva e Análise Exploratória • Realizadas nas etapas iniciais. • Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou estas áreas da Estatística. 2 Estatística População Características Técnicas de amostragem Planejamento de experimentos Amostra Análise descritiva Inferência estatística Informações contidas nos dados Conclusões sobre as características da população Estatística População Amostra Coleta Análise Exploratória Estatística Descritiva Inferência Estatística O que é Estatística ? Para muitos, Estatística não passa de conjuntos de tabelas de dados numéricos e os estatísticos são pessoas que coletam esses dados. A Estatística originou-se com a coleta de dados e a construção de tabelas para os governos. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. Definição de Estatística A Estatística é uma ciência baseada na Teoria da Probabilidade, cujo objetivo principal é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de dados. População: conjunto de todas as unidades que são de interesse em um certo estudo. Amostra: qualquer subconjunto da população selecionado de acordo com certas regras. Censo: estudo que inclui todos os elementos da população. 1a etapa: Estatística Descritiva e Análise Exploratória Medidas resumo, tabelas e gráficos. Obs. Se x representa uma variável, uma amostra com valores x1,x2,...,xn (valor da variável para cada observação ou indivíduo) é chamada de conjunto de dados. n é o tamanho da amostra. O que fazer com os dados coletados? 5 Variável Qualquer característica de interesse associada aos elementos de uma população que varia e pode ser medida. Atributos dos pacientes e eventos clínicos. Classificação de variáveis e Escalas de medição Quantitativa ou intervalar Qualitativas ou categóricas Nominal Gênero, partido político, etc. Ordinal Status socioeconômico, grau de escolaridade, etc. Contínua Discreta Preço, renda, peso, etc. Número de dependentes, número de sintomas de um paciente 6 Classificação de variáveis e Escalas de medição Variáveis Qualitativas Denominamos variáveis qualitativas (ou categóricas) características observadas na amostra que apenas identifica um atributo, classe, qualidade, etc, da unidade de observação. Qualitativas Nominais Apenas determinam um atributo à unidade experimental sem qualquer outra propriedade. Qualitativas Ordinais Identificam um atributo que estabelece uma estrutura de ordem nas unidades de observação. 7 Classificação de variáveis e Escalas de medição Variáveis Quantitativas Denominamos variáveis quantitativas aquelas que medem intensidade de características observadas na amostra. Além de possuir ordem inerente são adequadas para comparações de intensidade, ex. essa pessoa possui duas vezes mais dessa característica que a outra. Quantitativas Discretas Assumem um conjunto de valores contáveis (inteiros), um número finito de valores num intervalo finito. Quantitativas Contínuas Podem assumir infinitos valores num intervalo finito. 8 Observações Para cada tipo de variável existem técnicas apropriadas para organizar e resumir a informação, embora em muitos casos se verifique que as técnicas usadas em um caso podem ser adaptadas para outros. Uma variável quantitativa pode ser categorizada, porém a recíproca não é possível. É importante, porém, considerar a perda de informação que ocorre nesses casos, apesar do possível ganho em clareza. Exemplo: IDADE X FAIXA ETÁRIA 9 É a exploração da informação de cada variável separadamente. Faz-se a síntese de cada variável para descrever o perfil dos indivíduos da amostra. Facilita a identificação de padrões (comportamentos semelhantes) nos dados. Análise univariada 10 Adaptado de Montgomery, D. C. (2005), Design and Analysis of Experiments, 6th Edition, Wiley: New York Exemplo. Estudo de resistência. 11 Medidas de posição ou locação: Medidas relacionadas à “posição” dos dados, ou ainda valores em torno dos quais as observações da amostra tendem a se agrupar (tendência central). Medidas de dispersão: Variáveis podem apresentar o mesmo valor para uma medida de posição (média, por exemplo), apesar dos dados apresentarem comportamentos completamente diferentes. Esses diferentes comportamentos são consequência de dados com diferentes graus de dispersão. Medidas resumo 12 Medidas resumo Medidas de posição: moda, média, medidas de tendência central mediana, quantis: percentis, quartis, tercis, etc. Medidas de dispersão: amplitude, intervalo interquartil, variância e desvio padrão, coeficiente de variação. 13 Medidas de posição Moda (Mo): É o valor (ou atributo) que ocorre com maior freqüência. Ex. Dados: 4,5,4,6,5,8,4,4 Mo = 4 Obs. 1. Nem sempre a moda existe. 2. Pode haver mais de uma moda. Vantagem: Pode ser obtida para qualquer tipo de variável, porém é mais apropriada para dados qualitativos. 14 Mediana (Md) A mediana é o valor que ocupa a posição central de um conjunto de n valores ordenados. 50% das observações da amostra são inferiores a esse valor e 50% são superiores. Posição da mediana: pm = (n+1)/2 Medidas de posição Obs.: Para obtenção da mediana, a variável em estudo deve ser pelo menos qualitativa ordinal. 15 Mediana (Md) Ex. 1 Dados: 2, 26, 3, 7, 8 (n = 5), n ímpar. Dados ordenados: pm = => Md = Ex. 2 Dados: 2, 15, 2, 1, 8, 5 (n = 6), n par. Dados ordenados: pm = => Md = Medidas de posição 16 Mediana (Md) Ex. 1 Dados: 2, 26, 3, 7, 8 (n = 5), n ímpar. Dados ordenados: 2,3,7,8, 26 pm = (5+1)/2=3 => Md = 7 Ex. 2 Dados: 2, 15, 2, 1, 8, 5 (n = 6), n par. Dados ordenados: 1, 2, 2, 5, 8, 15 pm = (6+1)/2=3,5 => Md = (2+5) / 2 = 3,5 É a média dos elementos nas posições 3 e 4. Medidas de posição 16 Quantis (quantiles) O quantil ou separatriz de ordem p (0 < p < 1), em um conjunto de dados com n observações, é o valor que ocupa a posição p x (n+1) nos dados ordenados. O quantil de ordem p deixa px100% das observações abaixo dele na amostra ordenada. Casos particulares: Quantil 0,5 = mediana ou segundo quartil (md) (deixa 0,50x100%=50% das observações abaixo) Quantil 0,25 = primeiro quartil (Q1) (deixa 0,25x100%=25% das observações abaixo) Quantil 0,75 = terceiro quartil (Q3) (deixa 0,75x100%=75% das observações abaixo) Medidas de posição 17 Ex. 1. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 (n = 10) Posição da Md: 0,5(n+1)= => Md = Posição de Q1: 0,25(11)= => Q1 = Posição de Q3: 0,75(11)= => Q3 = Ex. 2. 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 (n = 11) Md = Q1 = Q3 = Quartis Medidas de posição 18 Ex. 1. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 (n = 10) Posição da Md: 0,5(n+1)=0,5x11=5,5 => Md =(3+3,1)/2 = 3,05 Posição de Q1: 0,25(11)=2,75 => Q1 = (2+2,1)/2 = 2,05 Posição de Q3: 0,75(11)=8,25 => Q3 = (3,7+6,1)/2 = 4,9 Ex. 2. 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 (n = 11) Md = 5,3 Q1 = 1,7 Q3 = 12,9 Quartis Medidas de posição 18 Média: Soma de todos os valores das observações para a variável em questão dividida por n. Interpretação: Ponto de Equilíbrio ou “Centro de Massa” da distribuição dos dados. Obs: Adequada apenas para dados quantitativos. Medidas de posição 19 Média: Ex. Dados: 2,5,3,7,11 = (2+5+3+7+11)/5 = 5,6 Sejam x1, x2, x3, ..., xn os valores de uma variável observada na amostra: significa a soma de todos os n valores de amostra (de 1 até n) da variável X. Medidas de posição 20 Se multiplicamos todas as observações por uma mesma constante, a média também fica multiplicada deste valor. Se adicionamos uma mesma constante a todas as observações, a média também fica adicionada deste valor. A média de uma constante é a própria constante. PROPRIEDADES Da MÉDIA 21 A soma dos desvios em torno da média é zero: Consequência imediata do fato da média ser o ponto de equilíbrio da distribuição. Propriedades da Média 22 Ex. Identificação e Comparação de Grupos A distribuição da altura de plantas parece irregular. Por quê? Existe no conjunto de dados mais de uma espécie de plantas ou fenótipo? UTILIZANDO a MÉDIA 23 Uma medida resumo única não faz sentido. Médias de altura diferentes indica tipos de plantas diferentes. UTILIZANDO a MÉDIA 24 A moda não é útil para variáveis quantitativas. Se a variável for qualitativa nominal, a moda é a única medida de aplicável. A mediana é mais resistente (robusta) do que a média, pois é menos afetada pela presença de valores extremos. Os quantis também são chamados de separatrizes. Moda, Mediana e Média 25 Considere as notas de uma prova aplicada a três grupos de alunos: Grupo 1: 3, 4, 5, 6, 7; Grupo 2: 1, 3, 5, 7,9; e Grupo 3: 5,5,5,5,5. Grupo 1 0 10 0 10 0 10 5 Grupo 2 Grupo 3 Exemplo 26 Medidas de dispersão Finalidade: Encontrar um valor que resuma a variabilidade de um conjunto de dados. Verificar o quanto os valores observados estão “dispersos”, ou ainda o quanto “variam” os dados. Variáveis podem apresentar o mesmo valor para uma medida de posição, apesar dos dados mostrarem comportamentos completamente diferentes. Esses diferentes comportamentos são consequência de dados com diferentes graus de dispersão. 27 Medidas de dispersão Amplitude (A): Diferença entre o maior (máximo) e o menor valor (mínimo) dos dados observados. A = MAX – min Para os grupos anteriores, temos Grupo 1: A = 4 Grupo 2: A = 8 Grupo 3: A = 0 Medida sensível à influência da presença de valores extremos. 28 Intervalo ou amplitude interquartil (dq) É a diferença entre o terceiro quartil e o primeiro quartil: dq = Q3 - Q1. Ex. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Q1 = 2,05 e Q3 = 4,9. dq = Q3- Q1 = 4,9-2,05 = 2,85. Obs.: 1 - dq é uma medida mais resistente ou robusta do que A. 2 - Define os 50% dos valores centrais observados. 29 Variância (s2) e Desvio padrão (s) A VARIÂNCIA é uma medida de variabilidade dos dados em torno da média, ou seja, ela quantifica a variabilidade ou o espalhamento ao redor do valor médio. E o DESVIO PADRÃO é a raiz quadrada da variância. 30 Problema: A soma dos desvios em torno da média é zero: O natural seria uma medida de dispersão que dependesse dos desvios de cada observação em relação à média (xi – ), e considerar a soma destes. Quanto maior forem os desvios, maior é a variabilidade. Solução: Soma dos quadrados dos desvios em relação à média. Variância (s2) e Desvio padrão (s) (variance and standard deviation) 31 Variância (s2) (variance) Por que (n-1)? Quando dividimos por n-1 temos que S2 é um estimador não viciado, importante propriedade. Significa que a variância amostral tende a ser a igual a variância da população. Obs.: Se a amostra é grande, os valores obtidos dividindo por n ou n-1 são praticamente iguais. 32 Propriedades da Variância A variância de uma constante é zero. Se dividirmos ou multiplicarmos cada valor da variável por uma constante, a variância original será dividida ou multiplicada por pela constante ao quadrado, isto é: Se Y = a X, então Var(Y) = Var (a X) = a2 Var(x). Ou Y = X/a, então Var(Y) = Var (X/a) = Var(x)/(a2). Se somarmos ou subtrairmos de cada valor da variável uma constante, a variância não se altera. Se Y = X + a, então Var(Y) = Var (X + a) = Var(X). 33 Desvio padrão (s) (standard deviation) Obs. O desvio padrão tem a mesma unidade da variável X. Problema: A variância, S2, tem como unidade de medida o quadrado da escala original da variável em estudo. Como relacionar a medida de variabilidade com a variável na sua escala original? Solução: Extrair a raiz quadrada da variância S2 dando origem ao... Desvio Padrão? 34 Propriedades do Desvio Padrão: S mede a dispersão em torno da média e só deve ser calculado quando a média é tomada como medida de locação. S ≥ 0. Logo, quanto maior a dispersão em torno da média, maior o valor do desvio padrão, ou seja, maior o valor de S. 35 Cálculo da variância para o grupo 1 (Ex. notas da prova) Grupo 1: 3, 4, 5, 6, 7: Vimos que Desvio padrão: 36 Grupo 1 0 10 Cálculo da variância para o grupo 1 (Ex. notas da prova) Grupo 1: 3, 4, 5, 6, 7: Vimos que Desvios padrão: 36 Grupo 1 0 10 Propriedades (Resumo) Multiplicando por uma constante cada valor da amostra, a média e o desvio padrão ficam multiplicados pela constante e a variância fica multiplicada pela constante ao quadrado. 37 Somando-se a cada valor da amostra uma constante, a nova média também será somada dessa constante, já a variância e o desvio padrão permanecerão os mesmos. Coeficiente de variação (CV) É uma medida de dispersão ou variação relativa. Objetivo: comparar a variabilidade de variáveis observadas com diferentes unidades de medidas Exprime a variabilidade em relação à média em percentual. se Obs.: 1. Quanto mais homogênea é a amostra em relação à média menor é seu valor. 2. O Coeficiente de Variação é admensional. 38 Exemplo 1 Altura (cm) e peso (kg) de alunos Conclusão. O peso dos alunos apresenta variabilidade relativa aproximadamente duas vezes maior do que a altura. Média Desvio padrão Coeficiente de variação Altura 1,143m 0,063m 5,5% Peso 50Kg 6kg 12% 39 Exemplo 2 Altura (cm) de uma amostra de recém-nascidos e outra de adolescentes Conclusão. As alturas dos adolescentes e dos recém-nascidos apresentam variabilidade quase igual em relação as suas respectivas médias. Média Desvio padrão Coeficiente de variação Altura 50 6 12% Peso 160 16 10% 40 Organização e representação dos dados Tabela de frequências. Tabela com os diferentes valores de uma variável (ou intervalos de valores) e suas respectivas frequências. Uma das formas de organizar e resumir a informação contida em dados observados é por meio de tabelas de frequências e gráficos. A frequência de um valor da variável é o número de vezes que este valor ocorre no conjunto de dados. 41 Organização e representação dos dados 1. Variáveis qualitativas. Tabela de frequências dos diferentes valores da variável. Representação gráfica: gráfico de barras, gráfico de Pareto e gráfico de setores (“de pizza”). 42 Exemplo 3 Variável “Grau de instrução” (variável qualitativa ordinal) Grau de instrução 1o Grau 2o Grau Superior Total Contagem 12 18 6 n = 36 0,3333 0,5000 0,1667 : frequência absoluta do valor i (número de indivíduos com grau de instrução i) , i ∈ {1o Grau, 2o Grau, Superior}. : frequência relativa do valor i. 1,0000 43 SEXO fi fri (%) Masculino 108 67,50 Feminino 52 32,50 Total 160 100,00 Sendo: fi = frequência da i-ésima categoria. fri (%) = frequência relativa percentual Exemplo 4 Variável “sexo” (variável qualitativa nominal) 44 Figura 1. Descrição do gráfico. Elementos de um gráfico 45 Representação gráfica variáveis qualitativas Grau de instrução Gráfico de barras: retângulos verticais (ou horizontais) espaçados com alturas (ou bases) iguais às frequências dos valores da variável. 46 Gráfico de barras com os valores da variável em ordem decrescente de frequências e com as frequências relativas acumuladas no segundo eixo vertical. Gráfico de Pareto 47 Gráficos de setores (“de pizza”) Gráfico circular utilizado para destacar a composição das partes de um todo. O ângulo central de cada setor é proporcional à frequência representada (usualmente em %). 48 Diagrama circular para a variável grau de instrução Organização e representação variáveis quantitativas 2.1 Discretas. Organizam-se mediante tabelas de frequências e a representação gráfica é mediante gráfico de pontos, de barras ou de linha. Frequência acumulada do valor xi: Frequência relativa do valor xi: 49 Organização e representação variáveis quantitativas discretas Exemplo. Número de defeitos por lote. Distribuição de frequências do número de defeitos por lotes de produtos. 49 Representação gráfica Variáveis quantitativas discretas 50 Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: Média: Exemplo. Determine o número médio de defeitos por lote. Mediana: n = 20: pm = Md = Moda = 51 Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: Média: Exemplo. Determine o número médio de defeitos por lote. Mediana: n = 20: pm = (20+1) / 2 = 10,5 => média dos valores com frequências acumuladas iguais a 10 e 11 Md = (2 + 2) / 2 = 2. Moda = ? 51 Variância: Exemplo. Desvio padrão: Coeficiente de variação: Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: 52 Exemplo. Desvio padrão: Coeficiente de variação: Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: 52 •Escolha o número de intervalos de classe (k) •Identifique o menor valor (min) e o valor máximo (MAX) dos dados. •Calcule a amplitude (A): A = MAX – min. •Calcule a amplitude de classe (h): h = A / k. •Obtenha os limites inferior (LI) e superior (LS) de cada classe. Prossiga até que seja obtido um intervalo que contenha o valor máximo (MAX). Tabelas de frequências Variáveis contínuas 53 Tabelas de frequências Variáveis contínuas Obs. Muitas vezes, por conveniência, arredondamos os valores de h e/ou LI1. Colunas da Tabela de frequências: Número de ordem de cada intervalo (i) Limites de cada intervalo: Os intervalos são fechados à esquerda e abertos à direita. Notação: Ponto médio (ou marca de classe) de cada classe: Frequência absoluta de uma classe (fi): número de observações pertencentes à classe i. Frequência relativa de uma classe: fri = fi / n. Frequência acumulada absoluta de uma classe: Frequência acumulada relativa de uma classe: Tabelas de frequências Variáveis contínuas 55 Exemplo Vamos construir uma tabela de frequências para a variável viscosidade com 5 intervalos de classes. Variável: viscosidade (em u.v.) de um líquido a uma certa temperatura 13.9 14.9 15.9 15.8 14.8 15.1 15.8 15.0 15.1 14.6 14.7 16.6 13.6 15.9 13.1 15.2 14.7 16.0 15.6 17.4 15.3 14.2 15.9 15.1 15.9 16.1 16.2 13.8 14.6 16.0 15.8 15.5 16.5 17.1 15.3 15.5 17.8 15.4 15.4 14.6 n = 40 Min. Median Mean Max. 13.10 15.40 15.39 17.80 Amostra ordenada: 13.1 13.6 13.8 13.9 14.2 14.6 14.6 14.6 14.7 14.7 14.8 14.9 15.0 15.1 15.1 15.1 15.2 15.3 15.3 15.4 15.4 15.5 15.5 15.6 15.8 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.0 16.1 16.2 16.5 16.6 17.1 17.4 17.8 56 Exemplo Procedimento: Adotamos k = 5. A = MAX – min = ? h = ? LI1 = ? Limites das classses? n = 40 Min. Median Mean Max. 13.10 15.40 15.39 17.80 Amostra ordenada: 13.1 13.6 13.8 13.9 14.2 14.6 14.6 14.6 14.7 14.7 14.8 14.9 15.0 15.1 15.1 15.1 15.2 15.3 15.3 15.4 15.4 15.5 15.5 15.6 15.8 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.0 16.1 16.2 16.5 16.6 17.1 17.4 17.8 56 Exemplo Procedimento: k = 5. A = MAX – min = 17,8 – 13,10 = 4,7e h = A/k = 4,7 / 5 = 0,94. Podemos aproximar h = 1 e LI1 = 13 para facilitar os cálculos. Limites das classses: LI1 = 13, LS1 = LI1 + h = 14, LI2 = LS1 = 14, LS2 = LI2 + h = 15, …, …, LI5 = LS4 = 17 e LS5 = LI5 + h = 18. Amostra ordenada: 13.1 13.6 13.8 13.9 14.2 14.6 14.6 14.6 14.7 14.7 14.8 14.9 15.0 15.1 15.1 15.1 15.2 15.3 15.3 15.4 15.4 15.5 15.5 15.6 15.8 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.0 16.1 16.2 16.5 16.6 17.1 17.4 17.8 56 n = 40 Min. Median Mean Max. 13.10 15.40 15.39 17.80 Pontos médios: Tabela. Distribuição de frequências da variável concentração. Nesta organização de dados temos perda de informação. Em um gráfico de pontos não há perda de informação, mas se n for “grande”, pode haver perda de clareza. Densidade de freqüência (ou densidade): Exemplo 57 Histograma Gráfico de barras adjacentes com bases iguais às amplitudes das classes e alturas iguais às densidades. Obs. Se as classes tiverem amplitude constante, as alturas das barras usualmente são iguais às frequências. Propriedade. Se utilizarmos densidades, soma das áreas dos retângulos = 1, pois Obs. 1. A amplitude das classes pode variar. 2. Na construção de um histograma, quanto maior for n, melhor. Representação gráfica: Variáveis quantitativas contínuas 58 Exemplo. Escolha do número de classes (geralmente, 5 ≤ k ≤ 15) 60 Medidas Resumo: Variáveis contínuas agrupadas em classes Média: Variância: 61 Medidas Resumo: Variáveis contínuas agrupadas em classes Este resultado difere do valor obtido anteriormente. Por quê? Média dos dados não agrupados (dados brutos) : Exemplo. Variável concentração 61 Representação dos dados por meio de um retângulo construído com os quartis. Fornece informação sobre a variabilidade (dq = Q3 – Q1) e valores extremos. Gráfico de caixas (boxplot) 62 1º quartil (Q1) = 14,775. Mediana (Md ou Q2) = 15,4. 3º quartil (Q3) = 15,9. dq = intervalo interquartil = Q3 – Q1 = 1,125. Lnhas auxiliares passam por Q1 – 1,5 dq = 13,0875 e Q3 +1,5 dq = 17,5875. Exemplo. Variável viscosidade. 63 Análise de mais de uma variável Objetivos: → Geralmente estuda-se a influência das variáveis explicativas ou independentes (ex. fatores de risco) em uma variável resposta ou dependente (ex. desfecho). → Estuda-se também a relação das variáveis explicativas entre si (confundimento e interação). → Levantam-se hipóteses a serem verificadas. 64 Análise Bivariada, Múltipla e Multivariada A análise que explora a relação entre duas variáveis é chamada Bivariada. A que avalia a relação entre uma variável principal, resposta, e várias outras secundárias, explicativas, é chamada Múltipla. A avaliação da relação entre várias variáveis entre si chama-se Multivariada. Análise Bivariada: v. qualitativa vs v. qualitativa 66 São apresentadas duas formas de observar a relação do óbito neonatal com o pré-natal O que conseguimos perceber?. Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal segundo a realização de pré-natal. Nascido vivo Óbito Total Pré-natal n %* n %* n %* Pré-natal 155 54,2 131 45,8 286 100,0 Sem pré-natal 30 28,6 75 71,4 105 100,0 Total 185 47,3 206 52,7 391 100,0 *Percentual por linha. 66 Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal segundo a realização de pré-natal. Nascido vivo Óbito Total Pré-natal n %* n %* n %* Pré-natal 155 54,2 131 45,8 286 100,0 Sem pré-natal 30 28,6 75 71,4 105 100,0 Total 185 47,3 206 52,7 391 100,0 *Percentual por linha. Distribuição marginal do óbito neonatal. 66 Nascido vivo Óbito Total n %* n %* n %* 185 47,3 206 52,7 391 100,0 Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal, segundo a realização de pré-natal Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 83,8 131 63,6 286 73,1 Não 30 16,2 75 36,4 105 26,9 Total 185 100,0 206 100,0 391 100,0 *Percentual por coluna. 67 Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal, segundo a realização de pré-natal Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 83,8 131 63,6 286 73,1 Não 30 16,2 75 36,4 105 26,9 Total 185 100,0 206 100,0 391 100,0 *Percentual por coluna. 67 Pré-natal n %* Sim 286 73,1 Não 105 26,9 Total 391 100,0 Distribuição marginal do pré-natal. Análise Bivariada: v. qualitativa vs v. qualitativa 66 Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 83,8 131 63,6 286 73,1 Não 30 16,2 75 36,4 105 26,9 Total 185 100,0 206 100,0 391 100,0 Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 54,2 131 45,8 286 100,0 Não 30 28,6 75 71,4 105 100,0 Total 185 47,3 206 52,7 391 100,0 Exemplo: Viscosidade em duas temperaturas (n = 40). Temperatura 1. 13.9 14.9 15.9 15.8 14.8 15.1 15.8 15.0 15.1 14.6 14.7 16.6 13.6 15.9 13.1 15.2 14.7 16.0 15.6 17.4 15.3 14.2 15.9 15.1 15.9 16.1 16.2 13.8 14.6 16.0 15.8 15.5 16.5 17.1 15.3 15.5 17.8 15.4 15.4 14.6 Temperatura 2. 13.3 14.5 15.3 15.3 14.3 14.8 15.2 14.5 14.6 14.1 14.3 16.1 13.1 15.5 12.6 14.6 14.3 15.4 15.2 16.8 14.9 13.7 15.2 14.5 15.3 15.6 15.8 13.3 14.1 15.4 15.2 15.2 15.9 16.5 14.8 15.1 17.0 14.9 14.8 14.0 Análise Bivariada: V. qualitativa vs V. quantitativa 68 Exemplo. Viscosidade em duas temperaturas. Alimento 1 Alimento 2 Alimento 1 Alimento 2 69 Exemplo Boxplot: V. qualitativa vs V. quantitativa Análise exploratória: Redução versus tipo. Variabilidade. Simetria. Valores extremos. 70 Gráfico de linha (usado para variação no tempo) O Estado de S. Paulo, 28/2/2010. Exemplo: Categorias de peso segundo o sexo de recém-nascidos com menos de 1500g Análise Bivariada: V. qualitativa vs V. quantitativa Peso Sexo Baixíssimo (<800g) Muito baixo (800g a 1199g) Baixo (≥ 1200g) Total n %* n %* n %* n %* Masculino 24 11,6 (44,4) 112 54,1 (48,9) 71 34,3 (41,0) 207 100,0 (45,4) Feminino 30 12,0 (55,6) 117 47,0 (51,1) 102 41,0 (59,0) 249 100,0 (54,6) Total 54 11,8 (100,0) 229 50,2 (100,0) 173 37,9 (100,0) 456 100,0 (100,0) *Percentual por linha (coluna). 72 Análise Bivariada: V. qualitativa vs V. quantitativa Média de peso segundo o sexo de recém-nascidos Sexo Média dp Masculino 1162,4 271,3 Feminino 1135,4 257,6 72 Variável quantitativas vs variável quantitativas (x1,y1), ..., (xn,yn): amostra bivariada. Representação gráfica: gráfico de dispersão (scatter plot) Medida de associação: coeficiente de correlação linear de Pearson. Propriedades: (1) –1 ≤ r ≤ 1 e (2) |r| = 1 se, e somente se, a relação entre x e y for linear (y = a + bx, b ≠ 0 e o sinal de r é o sinal de b. Numerador: covariância entre x e y. 73 Associação entre variáveis quantitativas 74 Associação entre variáveis quantitativas 75 Associação entre variáveis quantitativas 76 Associação entre variáveis quantitativas Correlações: Exemplo 1: 0,8164 Exemplo 2: 0,8162 Exemplo 3: 0,8163 Exemplo 4: 0,8165 77 Associação entre variáveis quantitativas (Exemplo) Paciente Idade (anos) Estatura(cm) Paciente Idade (anos) Estatura (cm) 1 59 142 16 74 162 2 74 148 17 68 162 3 58 150 18 94 162 4 59 150 19 87 162 5 62 150 20 93 165 6 76 150 21 56 165 7 71 150 22 21 165 8 56 152 23 53 166 9 57 153 24 52 166 10 41 157 25 53 167 11 56 157 26 44 167 12 76 158 27 69 167 13 75 160 28 82 168 14 68 160 29 98 168 15 89 161 30 76 169 78 Associação entre variáveis quantitativas (Gráfico de dispersão) 79 Associação entre variáveis quantitativas (Gráfico de dispersão) 80 Exemplo de cálculo (para os cinco primeiros indivíduos) Paciente Idade Estatura Desvios Produto (anos) (cm) Idade Estatura Desvios 1 59 142 2 74 148 3 58 150 4 59 150 5 62 150 Média 62,4 148 DP 6,7 3,5 Calcular a média e o desvio padrão para cada variável. Calcular os desvios em torno da média (diferença) para cada indivíduo. Calcular produtos dos desvios para cada indivíduo. Soma do produto dos desvios e dividir essa soma por (n-1), obtendo a covariância. Dividir esse resultado pelo produto dos desvios padrão. Exemplo de cálculo (para os cinco primeiros indivíduos) Paciente | Idade | Estatura | Desvios | Produto | (anos)| (cm) | Idade | Estatura | Desvios ----------------------------------------------------- 1 | 59 | 142 | -3,4 | -6 | 20,4 2 | 74 | 148 | 11,6 | 0 | 0,0 3 | 58 | 150 | -4,4 | 2 | -8,8 4 | 59 | 150 | -3,4 | 2 | -6,8 5 | 62 | 150 | -0,4 | 2 | -0,8 ----------------------------------------------------- Média | 62,4 | 148 | -- | -- | Cov = 1,0 DP | 6,7 | 3,5 | -- | -- | r = 0,043 1 - Calcular a média e o desvio padrão para cada variável. 2 - Calcular os desvios em torno da média (diferença) para cada indivíduo. 3- Calcular produtos dos desvios para cada indivíduo. 4 - Soma do produto dos desvios e dividir essa soma por (n-1), obtendo a covariância. 5 - Dividir esse resultado pelo produto dos desvios padrão, obtendo a correlação.

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Teste de Hipóteses para Médias - Populações Normais com Variância Conhecida e Desconhecida

4

Teste de Hipóteses para Médias - Populações Normais com Variância Conhecida e Desconhecida

Estatística 1

UFU

Exercícios Resolvidos-Iniciação-Estatística-Regressão-e-Correlação

1

Exercícios Resolvidos-Iniciação-Estatística-Regressão-e-Correlação

Estatística 1

UFU

Lista de Exercícios - Amostragem e Inferência Estatística

5

Lista de Exercícios - Amostragem e Inferência Estatística

Estatística 1

UFU

Analise Estatística Descritiva - Chuvas em Jataí 1980-2009 - Abril Maio e Dezembro

1

Analise Estatística Descritiva - Chuvas em Jataí 1980-2009 - Abril Maio e Dezembro

Estatística 1

UFU

Calculo-Amostral-e-Nivel-de-Confianca-em-Pesquisa-de-Doenca

1

Calculo-Amostral-e-Nivel-de-Confianca-em-Pesquisa-de-Doenca

Estatística 1

UFU

Trabalho Estatística

33

Trabalho Estatística

Estatística 1

UFU

Estatistica Descritiva Probabilidade e Amostragem - Resumo Completo

1

Estatistica Descritiva Probabilidade e Amostragem - Resumo Completo

Estatística 1

UFU

Lista 6 - Teoria da Estimação 2021-2

3

Lista 6 - Teoria da Estimação 2021-2

Estatística

UFU

Lista 4 - Inferência - Estatística 2022-1

2

Lista 4 - Inferência - Estatística 2022-1

Estatística

UFU

Lista 2 - Estatística 2022-1

2

Lista 2 - Estatística 2022-1

Estatística

UFU

Texto de pré-visualização

ESTATÍSTICA DESCRITIVA E ANÁLISE EXPLORATÓRIA Disciplina: Estatística Profa Patrícia Viana da Silva patriciaviana@ufu.br Estatística Descritiva e Análise Exploratória • Realizadas nas etapas iniciais. • Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou estas áreas da Estatística. 2 Estatística População Características Técnicas de amostragem Planejamento de experimentos Amostra Análise descritiva Inferência estatística Informações contidas nos dados Conclusões sobre as características da população Estatística População Amostra Coleta Análise Exploratória Estatística Descritiva Inferência Estatística O que é Estatística ? Para muitos, Estatística não passa de conjuntos de tabelas de dados numéricos e os estatísticos são pessoas que coletam esses dados. A Estatística originou-se com a coleta de dados e a construção de tabelas para os governos. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. Definição de Estatística A Estatística é uma ciência baseada na Teoria da Probabilidade, cujo objetivo principal é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de dados. População: conjunto de todas as unidades que são de interesse em um certo estudo. Amostra: qualquer subconjunto da população selecionado de acordo com certas regras. Censo: estudo que inclui todos os elementos da população. 1a etapa: Estatística Descritiva e Análise Exploratória Medidas resumo, tabelas e gráficos. Obs. Se x representa uma variável, uma amostra com valores x1,x2,...,xn (valor da variável para cada observação ou indivíduo) é chamada de conjunto de dados. n é o tamanho da amostra. O que fazer com os dados coletados? 5 Variável Qualquer característica de interesse associada aos elementos de uma população que varia e pode ser medida. Atributos dos pacientes e eventos clínicos. Classificação de variáveis e Escalas de medição Quantitativa ou intervalar Qualitativas ou categóricas Nominal Gênero, partido político, etc. Ordinal Status socioeconômico, grau de escolaridade, etc. Contínua Discreta Preço, renda, peso, etc. Número de dependentes, número de sintomas de um paciente 6 Classificação de variáveis e Escalas de medição Variáveis Qualitativas Denominamos variáveis qualitativas (ou categóricas) características observadas na amostra que apenas identifica um atributo, classe, qualidade, etc, da unidade de observação. Qualitativas Nominais Apenas determinam um atributo à unidade experimental sem qualquer outra propriedade. Qualitativas Ordinais Identificam um atributo que estabelece uma estrutura de ordem nas unidades de observação. 7 Classificação de variáveis e Escalas de medição Variáveis Quantitativas Denominamos variáveis quantitativas aquelas que medem intensidade de características observadas na amostra. Além de possuir ordem inerente são adequadas para comparações de intensidade, ex. essa pessoa possui duas vezes mais dessa característica que a outra. Quantitativas Discretas Assumem um conjunto de valores contáveis (inteiros), um número finito de valores num intervalo finito. Quantitativas Contínuas Podem assumir infinitos valores num intervalo finito. 8 Observações Para cada tipo de variável existem técnicas apropriadas para organizar e resumir a informação, embora em muitos casos se verifique que as técnicas usadas em um caso podem ser adaptadas para outros. Uma variável quantitativa pode ser categorizada, porém a recíproca não é possível. É importante, porém, considerar a perda de informação que ocorre nesses casos, apesar do possível ganho em clareza. Exemplo: IDADE X FAIXA ETÁRIA 9 É a exploração da informação de cada variável separadamente. Faz-se a síntese de cada variável para descrever o perfil dos indivíduos da amostra. Facilita a identificação de padrões (comportamentos semelhantes) nos dados. Análise univariada 10 Adaptado de Montgomery, D. C. (2005), Design and Analysis of Experiments, 6th Edition, Wiley: New York Exemplo. Estudo de resistência. 11 Medidas de posição ou locação: Medidas relacionadas à “posição” dos dados, ou ainda valores em torno dos quais as observações da amostra tendem a se agrupar (tendência central). Medidas de dispersão: Variáveis podem apresentar o mesmo valor para uma medida de posição (média, por exemplo), apesar dos dados apresentarem comportamentos completamente diferentes. Esses diferentes comportamentos são consequência de dados com diferentes graus de dispersão. Medidas resumo 12 Medidas resumo Medidas de posição: moda, média, medidas de tendência central mediana, quantis: percentis, quartis, tercis, etc. Medidas de dispersão: amplitude, intervalo interquartil, variância e desvio padrão, coeficiente de variação. 13 Medidas de posição Moda (Mo): É o valor (ou atributo) que ocorre com maior freqüência. Ex. Dados: 4,5,4,6,5,8,4,4 Mo = 4 Obs. 1. Nem sempre a moda existe. 2. Pode haver mais de uma moda. Vantagem: Pode ser obtida para qualquer tipo de variável, porém é mais apropriada para dados qualitativos. 14 Mediana (Md) A mediana é o valor que ocupa a posição central de um conjunto de n valores ordenados. 50% das observações da amostra são inferiores a esse valor e 50% são superiores. Posição da mediana: pm = (n+1)/2 Medidas de posição Obs.: Para obtenção da mediana, a variável em estudo deve ser pelo menos qualitativa ordinal. 15 Mediana (Md) Ex. 1 Dados: 2, 26, 3, 7, 8 (n = 5), n ímpar. Dados ordenados: pm = => Md = Ex. 2 Dados: 2, 15, 2, 1, 8, 5 (n = 6), n par. Dados ordenados: pm = => Md = Medidas de posição 16 Mediana (Md) Ex. 1 Dados: 2, 26, 3, 7, 8 (n = 5), n ímpar. Dados ordenados: 2,3,7,8, 26 pm = (5+1)/2=3 => Md = 7 Ex. 2 Dados: 2, 15, 2, 1, 8, 5 (n = 6), n par. Dados ordenados: 1, 2, 2, 5, 8, 15 pm = (6+1)/2=3,5 => Md = (2+5) / 2 = 3,5 É a média dos elementos nas posições 3 e 4. Medidas de posição 16 Quantis (quantiles) O quantil ou separatriz de ordem p (0 < p < 1), em um conjunto de dados com n observações, é o valor que ocupa a posição p x (n+1) nos dados ordenados. O quantil de ordem p deixa px100% das observações abaixo dele na amostra ordenada. Casos particulares: Quantil 0,5 = mediana ou segundo quartil (md) (deixa 0,50x100%=50% das observações abaixo) Quantil 0,25 = primeiro quartil (Q1) (deixa 0,25x100%=25% das observações abaixo) Quantil 0,75 = terceiro quartil (Q3) (deixa 0,75x100%=75% das observações abaixo) Medidas de posição 17 Ex. 1. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 (n = 10) Posição da Md: 0,5(n+1)= => Md = Posição de Q1: 0,25(11)= => Q1 = Posição de Q3: 0,75(11)= => Q3 = Ex. 2. 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 (n = 11) Md = Q1 = Q3 = Quartis Medidas de posição 18 Ex. 1. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 (n = 10) Posição da Md: 0,5(n+1)=0,5x11=5,5 => Md =(3+3,1)/2 = 3,05 Posição de Q1: 0,25(11)=2,75 => Q1 = (2+2,1)/2 = 2,05 Posição de Q3: 0,75(11)=8,25 => Q3 = (3,7+6,1)/2 = 4,9 Ex. 2. 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 (n = 11) Md = 5,3 Q1 = 1,7 Q3 = 12,9 Quartis Medidas de posição 18 Média: Soma de todos os valores das observações para a variável em questão dividida por n. Interpretação: Ponto de Equilíbrio ou “Centro de Massa” da distribuição dos dados. Obs: Adequada apenas para dados quantitativos. Medidas de posição 19 Média: Ex. Dados: 2,5,3,7,11 = (2+5+3+7+11)/5 = 5,6 Sejam x1, x2, x3, ..., xn os valores de uma variável observada na amostra: significa a soma de todos os n valores de amostra (de 1 até n) da variável X. Medidas de posição 20 Se multiplicamos todas as observações por uma mesma constante, a média também fica multiplicada deste valor. Se adicionamos uma mesma constante a todas as observações, a média também fica adicionada deste valor. A média de uma constante é a própria constante. PROPRIEDADES Da MÉDIA 21 A soma dos desvios em torno da média é zero: Consequência imediata do fato da média ser o ponto de equilíbrio da distribuição. Propriedades da Média 22 Ex. Identificação e Comparação de Grupos A distribuição da altura de plantas parece irregular. Por quê? Existe no conjunto de dados mais de uma espécie de plantas ou fenótipo? UTILIZANDO a MÉDIA 23 Uma medida resumo única não faz sentido. Médias de altura diferentes indica tipos de plantas diferentes. UTILIZANDO a MÉDIA 24 A moda não é útil para variáveis quantitativas. Se a variável for qualitativa nominal, a moda é a única medida de aplicável. A mediana é mais resistente (robusta) do que a média, pois é menos afetada pela presença de valores extremos. Os quantis também são chamados de separatrizes. Moda, Mediana e Média 25 Considere as notas de uma prova aplicada a três grupos de alunos: Grupo 1: 3, 4, 5, 6, 7; Grupo 2: 1, 3, 5, 7,9; e Grupo 3: 5,5,5,5,5. Grupo 1 0 10 0 10 0 10 5 Grupo 2 Grupo 3 Exemplo 26 Medidas de dispersão Finalidade: Encontrar um valor que resuma a variabilidade de um conjunto de dados. Verificar o quanto os valores observados estão “dispersos”, ou ainda o quanto “variam” os dados. Variáveis podem apresentar o mesmo valor para uma medida de posição, apesar dos dados mostrarem comportamentos completamente diferentes. Esses diferentes comportamentos são consequência de dados com diferentes graus de dispersão. 27 Medidas de dispersão Amplitude (A): Diferença entre o maior (máximo) e o menor valor (mínimo) dos dados observados. A = MAX – min Para os grupos anteriores, temos Grupo 1: A = 4 Grupo 2: A = 8 Grupo 3: A = 0 Medida sensível à influência da presença de valores extremos. 28 Intervalo ou amplitude interquartil (dq) É a diferença entre o terceiro quartil e o primeiro quartil: dq = Q3 - Q1. Ex. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Q1 = 2,05 e Q3 = 4,9. dq = Q3- Q1 = 4,9-2,05 = 2,85. Obs.: 1 - dq é uma medida mais resistente ou robusta do que A. 2 - Define os 50% dos valores centrais observados. 29 Variância (s2) e Desvio padrão (s) A VARIÂNCIA é uma medida de variabilidade dos dados em torno da média, ou seja, ela quantifica a variabilidade ou o espalhamento ao redor do valor médio. E o DESVIO PADRÃO é a raiz quadrada da variância. 30 Problema: A soma dos desvios em torno da média é zero: O natural seria uma medida de dispersão que dependesse dos desvios de cada observação em relação à média (xi – ), e considerar a soma destes. Quanto maior forem os desvios, maior é a variabilidade. Solução: Soma dos quadrados dos desvios em relação à média. Variância (s2) e Desvio padrão (s) (variance and standard deviation) 31 Variância (s2) (variance) Por que (n-1)? Quando dividimos por n-1 temos que S2 é um estimador não viciado, importante propriedade. Significa que a variância amostral tende a ser a igual a variância da população. Obs.: Se a amostra é grande, os valores obtidos dividindo por n ou n-1 são praticamente iguais. 32 Propriedades da Variância A variância de uma constante é zero. Se dividirmos ou multiplicarmos cada valor da variável por uma constante, a variância original será dividida ou multiplicada por pela constante ao quadrado, isto é: Se Y = a X, então Var(Y) = Var (a X) = a2 Var(x). Ou Y = X/a, então Var(Y) = Var (X/a) = Var(x)/(a2). Se somarmos ou subtrairmos de cada valor da variável uma constante, a variância não se altera. Se Y = X + a, então Var(Y) = Var (X + a) = Var(X). 33 Desvio padrão (s) (standard deviation) Obs. O desvio padrão tem a mesma unidade da variável X. Problema: A variância, S2, tem como unidade de medida o quadrado da escala original da variável em estudo. Como relacionar a medida de variabilidade com a variável na sua escala original? Solução: Extrair a raiz quadrada da variância S2 dando origem ao... Desvio Padrão? 34 Propriedades do Desvio Padrão: S mede a dispersão em torno da média e só deve ser calculado quando a média é tomada como medida de locação. S ≥ 0. Logo, quanto maior a dispersão em torno da média, maior o valor do desvio padrão, ou seja, maior o valor de S. 35 Cálculo da variância para o grupo 1 (Ex. notas da prova) Grupo 1: 3, 4, 5, 6, 7: Vimos que Desvio padrão: 36 Grupo 1 0 10 Cálculo da variância para o grupo 1 (Ex. notas da prova) Grupo 1: 3, 4, 5, 6, 7: Vimos que Desvios padrão: 36 Grupo 1 0 10 Propriedades (Resumo) Multiplicando por uma constante cada valor da amostra, a média e o desvio padrão ficam multiplicados pela constante e a variância fica multiplicada pela constante ao quadrado. 37 Somando-se a cada valor da amostra uma constante, a nova média também será somada dessa constante, já a variância e o desvio padrão permanecerão os mesmos. Coeficiente de variação (CV) É uma medida de dispersão ou variação relativa. Objetivo: comparar a variabilidade de variáveis observadas com diferentes unidades de medidas Exprime a variabilidade em relação à média em percentual. se Obs.: 1. Quanto mais homogênea é a amostra em relação à média menor é seu valor. 2. O Coeficiente de Variação é admensional. 38 Exemplo 1 Altura (cm) e peso (kg) de alunos Conclusão. O peso dos alunos apresenta variabilidade relativa aproximadamente duas vezes maior do que a altura. Média Desvio padrão Coeficiente de variação Altura 1,143m 0,063m 5,5% Peso 50Kg 6kg 12% 39 Exemplo 2 Altura (cm) de uma amostra de recém-nascidos e outra de adolescentes Conclusão. As alturas dos adolescentes e dos recém-nascidos apresentam variabilidade quase igual em relação as suas respectivas médias. Média Desvio padrão Coeficiente de variação Altura 50 6 12% Peso 160 16 10% 40 Organização e representação dos dados Tabela de frequências. Tabela com os diferentes valores de uma variável (ou intervalos de valores) e suas respectivas frequências. Uma das formas de organizar e resumir a informação contida em dados observados é por meio de tabelas de frequências e gráficos. A frequência de um valor da variável é o número de vezes que este valor ocorre no conjunto de dados. 41 Organização e representação dos dados 1. Variáveis qualitativas. Tabela de frequências dos diferentes valores da variável. Representação gráfica: gráfico de barras, gráfico de Pareto e gráfico de setores (“de pizza”). 42 Exemplo 3 Variável “Grau de instrução” (variável qualitativa ordinal) Grau de instrução 1o Grau 2o Grau Superior Total Contagem 12 18 6 n = 36 0,3333 0,5000 0,1667 : frequência absoluta do valor i (número de indivíduos com grau de instrução i) , i ∈ {1o Grau, 2o Grau, Superior}. : frequência relativa do valor i. 1,0000 43 SEXO fi fri (%) Masculino 108 67,50 Feminino 52 32,50 Total 160 100,00 Sendo: fi = frequência da i-ésima categoria. fri (%) = frequência relativa percentual Exemplo 4 Variável “sexo” (variável qualitativa nominal) 44 Figura 1. Descrição do gráfico. Elementos de um gráfico 45 Representação gráfica variáveis qualitativas Grau de instrução Gráfico de barras: retângulos verticais (ou horizontais) espaçados com alturas (ou bases) iguais às frequências dos valores da variável. 46 Gráfico de barras com os valores da variável em ordem decrescente de frequências e com as frequências relativas acumuladas no segundo eixo vertical. Gráfico de Pareto 47 Gráficos de setores (“de pizza”) Gráfico circular utilizado para destacar a composição das partes de um todo. O ângulo central de cada setor é proporcional à frequência representada (usualmente em %). 48 Diagrama circular para a variável grau de instrução Organização e representação variáveis quantitativas 2.1 Discretas. Organizam-se mediante tabelas de frequências e a representação gráfica é mediante gráfico de pontos, de barras ou de linha. Frequência acumulada do valor xi: Frequência relativa do valor xi: 49 Organização e representação variáveis quantitativas discretas Exemplo. Número de defeitos por lote. Distribuição de frequências do número de defeitos por lotes de produtos. 49 Representação gráfica Variáveis quantitativas discretas 50 Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: Média: Exemplo. Determine o número médio de defeitos por lote. Mediana: n = 20: pm = Md = Moda = 51 Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: Média: Exemplo. Determine o número médio de defeitos por lote. Mediana: n = 20: pm = (20+1) / 2 = 10,5 => média dos valores com frequências acumuladas iguais a 10 e 11 Md = (2 + 2) / 2 = 2. Moda = ? 51 Variância: Exemplo. Desvio padrão: Coeficiente de variação: Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: 52 Exemplo. Desvio padrão: Coeficiente de variação: Medidas Resumo: tabelas de freqüências Variáveis quantitativas discretas: 52 •Escolha o número de intervalos de classe (k) •Identifique o menor valor (min) e o valor máximo (MAX) dos dados. •Calcule a amplitude (A): A = MAX – min. •Calcule a amplitude de classe (h): h = A / k. •Obtenha os limites inferior (LI) e superior (LS) de cada classe. Prossiga até que seja obtido um intervalo que contenha o valor máximo (MAX). Tabelas de frequências Variáveis contínuas 53 Tabelas de frequências Variáveis contínuas Obs. Muitas vezes, por conveniência, arredondamos os valores de h e/ou LI1. Colunas da Tabela de frequências: Número de ordem de cada intervalo (i) Limites de cada intervalo: Os intervalos são fechados à esquerda e abertos à direita. Notação: Ponto médio (ou marca de classe) de cada classe: Frequência absoluta de uma classe (fi): número de observações pertencentes à classe i. Frequência relativa de uma classe: fri = fi / n. Frequência acumulada absoluta de uma classe: Frequência acumulada relativa de uma classe: Tabelas de frequências Variáveis contínuas 55 Exemplo Vamos construir uma tabela de frequências para a variável viscosidade com 5 intervalos de classes. Variável: viscosidade (em u.v.) de um líquido a uma certa temperatura 13.9 14.9 15.9 15.8 14.8 15.1 15.8 15.0 15.1 14.6 14.7 16.6 13.6 15.9 13.1 15.2 14.7 16.0 15.6 17.4 15.3 14.2 15.9 15.1 15.9 16.1 16.2 13.8 14.6 16.0 15.8 15.5 16.5 17.1 15.3 15.5 17.8 15.4 15.4 14.6 n = 40 Min. Median Mean Max. 13.10 15.40 15.39 17.80 Amostra ordenada: 13.1 13.6 13.8 13.9 14.2 14.6 14.6 14.6 14.7 14.7 14.8 14.9 15.0 15.1 15.1 15.1 15.2 15.3 15.3 15.4 15.4 15.5 15.5 15.6 15.8 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.0 16.1 16.2 16.5 16.6 17.1 17.4 17.8 56 Exemplo Procedimento: Adotamos k = 5. A = MAX – min = ? h = ? LI1 = ? Limites das classses? n = 40 Min. Median Mean Max. 13.10 15.40 15.39 17.80 Amostra ordenada: 13.1 13.6 13.8 13.9 14.2 14.6 14.6 14.6 14.7 14.7 14.8 14.9 15.0 15.1 15.1 15.1 15.2 15.3 15.3 15.4 15.4 15.5 15.5 15.6 15.8 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.0 16.1 16.2 16.5 16.6 17.1 17.4 17.8 56 Exemplo Procedimento: k = 5. A = MAX – min = 17,8 – 13,10 = 4,7e h = A/k = 4,7 / 5 = 0,94. Podemos aproximar h = 1 e LI1 = 13 para facilitar os cálculos. Limites das classses: LI1 = 13, LS1 = LI1 + h = 14, LI2 = LS1 = 14, LS2 = LI2 + h = 15, …, …, LI5 = LS4 = 17 e LS5 = LI5 + h = 18. Amostra ordenada: 13.1 13.6 13.8 13.9 14.2 14.6 14.6 14.6 14.7 14.7 14.8 14.9 15.0 15.1 15.1 15.1 15.2 15.3 15.3 15.4 15.4 15.5 15.5 15.6 15.8 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.0 16.1 16.2 16.5 16.6 17.1 17.4 17.8 56 n = 40 Min. Median Mean Max. 13.10 15.40 15.39 17.80 Pontos médios: Tabela. Distribuição de frequências da variável concentração. Nesta organização de dados temos perda de informação. Em um gráfico de pontos não há perda de informação, mas se n for “grande”, pode haver perda de clareza. Densidade de freqüência (ou densidade): Exemplo 57 Histograma Gráfico de barras adjacentes com bases iguais às amplitudes das classes e alturas iguais às densidades. Obs. Se as classes tiverem amplitude constante, as alturas das barras usualmente são iguais às frequências. Propriedade. Se utilizarmos densidades, soma das áreas dos retângulos = 1, pois Obs. 1. A amplitude das classes pode variar. 2. Na construção de um histograma, quanto maior for n, melhor. Representação gráfica: Variáveis quantitativas contínuas 58 Exemplo. Escolha do número de classes (geralmente, 5 ≤ k ≤ 15) 60 Medidas Resumo: Variáveis contínuas agrupadas em classes Média: Variância: 61 Medidas Resumo: Variáveis contínuas agrupadas em classes Este resultado difere do valor obtido anteriormente. Por quê? Média dos dados não agrupados (dados brutos) : Exemplo. Variável concentração 61 Representação dos dados por meio de um retângulo construído com os quartis. Fornece informação sobre a variabilidade (dq = Q3 – Q1) e valores extremos. Gráfico de caixas (boxplot) 62 1º quartil (Q1) = 14,775. Mediana (Md ou Q2) = 15,4. 3º quartil (Q3) = 15,9. dq = intervalo interquartil = Q3 – Q1 = 1,125. Lnhas auxiliares passam por Q1 – 1,5 dq = 13,0875 e Q3 +1,5 dq = 17,5875. Exemplo. Variável viscosidade. 63 Análise de mais de uma variável Objetivos: → Geralmente estuda-se a influência das variáveis explicativas ou independentes (ex. fatores de risco) em uma variável resposta ou dependente (ex. desfecho). → Estuda-se também a relação das variáveis explicativas entre si (confundimento e interação). → Levantam-se hipóteses a serem verificadas. 64 Análise Bivariada, Múltipla e Multivariada A análise que explora a relação entre duas variáveis é chamada Bivariada. A que avalia a relação entre uma variável principal, resposta, e várias outras secundárias, explicativas, é chamada Múltipla. A avaliação da relação entre várias variáveis entre si chama-se Multivariada. Análise Bivariada: v. qualitativa vs v. qualitativa 66 São apresentadas duas formas de observar a relação do óbito neonatal com o pré-natal O que conseguimos perceber?. Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal segundo a realização de pré-natal. Nascido vivo Óbito Total Pré-natal n %* n %* n %* Pré-natal 155 54,2 131 45,8 286 100,0 Sem pré-natal 30 28,6 75 71,4 105 100,0 Total 185 47,3 206 52,7 391 100,0 *Percentual por linha. 66 Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal segundo a realização de pré-natal. Nascido vivo Óbito Total Pré-natal n %* n %* n %* Pré-natal 155 54,2 131 45,8 286 100,0 Sem pré-natal 30 28,6 75 71,4 105 100,0 Total 185 47,3 206 52,7 391 100,0 *Percentual por linha. Distribuição marginal do óbito neonatal. 66 Nascido vivo Óbito Total n %* n %* n %* 185 47,3 206 52,7 391 100,0 Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal, segundo a realização de pré-natal Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 83,8 131 63,6 286 73,1 Não 30 16,2 75 36,4 105 26,9 Total 185 100,0 206 100,0 391 100,0 *Percentual por coluna. 67 Análise Bivariada: v. qualitativa vs v. qualitativa Óbito neonatal, segundo a realização de pré-natal Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 83,8 131 63,6 286 73,1 Não 30 16,2 75 36,4 105 26,9 Total 185 100,0 206 100,0 391 100,0 *Percentual por coluna. 67 Pré-natal n %* Sim 286 73,1 Não 105 26,9 Total 391 100,0 Distribuição marginal do pré-natal. Análise Bivariada: v. qualitativa vs v. qualitativa 66 Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 83,8 131 63,6 286 73,1 Não 30 16,2 75 36,4 105 26,9 Total 185 100,0 206 100,0 391 100,0 Nascido vivo Óbito Total Pré-natal n %* n %* n %* Sim 155 54,2 131 45,8 286 100,0 Não 30 28,6 75 71,4 105 100,0 Total 185 47,3 206 52,7 391 100,0 Exemplo: Viscosidade em duas temperaturas (n = 40). Temperatura 1. 13.9 14.9 15.9 15.8 14.8 15.1 15.8 15.0 15.1 14.6 14.7 16.6 13.6 15.9 13.1 15.2 14.7 16.0 15.6 17.4 15.3 14.2 15.9 15.1 15.9 16.1 16.2 13.8 14.6 16.0 15.8 15.5 16.5 17.1 15.3 15.5 17.8 15.4 15.4 14.6 Temperatura 2. 13.3 14.5 15.3 15.3 14.3 14.8 15.2 14.5 14.6 14.1 14.3 16.1 13.1 15.5 12.6 14.6 14.3 15.4 15.2 16.8 14.9 13.7 15.2 14.5 15.3 15.6 15.8 13.3 14.1 15.4 15.2 15.2 15.9 16.5 14.8 15.1 17.0 14.9 14.8 14.0 Análise Bivariada: V. qualitativa vs V. quantitativa 68 Exemplo. Viscosidade em duas temperaturas. Alimento 1 Alimento 2 Alimento 1 Alimento 2 69 Exemplo Boxplot: V. qualitativa vs V. quantitativa Análise exploratória: Redução versus tipo. Variabilidade. Simetria. Valores extremos. 70 Gráfico de linha (usado para variação no tempo) O Estado de S. Paulo, 28/2/2010. Exemplo: Categorias de peso segundo o sexo de recém-nascidos com menos de 1500g Análise Bivariada: V. qualitativa vs V. quantitativa Peso Sexo Baixíssimo (<800g) Muito baixo (800g a 1199g) Baixo (≥ 1200g) Total n %* n %* n %* n %* Masculino 24 11,6 (44,4) 112 54,1 (48,9) 71 34,3 (41,0) 207 100,0 (45,4) Feminino 30 12,0 (55,6) 117 47,0 (51,1) 102 41,0 (59,0) 249 100,0 (54,6) Total 54 11,8 (100,0) 229 50,2 (100,0) 173 37,9 (100,0) 456 100,0 (100,0) *Percentual por linha (coluna). 72 Análise Bivariada: V. qualitativa vs V. quantitativa Média de peso segundo o sexo de recém-nascidos Sexo Média dp Masculino 1162,4 271,3 Feminino 1135,4 257,6 72 Variável quantitativas vs variável quantitativas (x1,y1), ..., (xn,yn): amostra bivariada. Representação gráfica: gráfico de dispersão (scatter plot) Medida de associação: coeficiente de correlação linear de Pearson. Propriedades: (1) –1 ≤ r ≤ 1 e (2) |r| = 1 se, e somente se, a relação entre x e y for linear (y = a + bx, b ≠ 0 e o sinal de r é o sinal de b. Numerador: covariância entre x e y. 73 Associação entre variáveis quantitativas 74 Associação entre variáveis quantitativas 75 Associação entre variáveis quantitativas 76 Associação entre variáveis quantitativas Correlações: Exemplo 1: 0,8164 Exemplo 2: 0,8162 Exemplo 3: 0,8163 Exemplo 4: 0,8165 77 Associação entre variáveis quantitativas (Exemplo) Paciente Idade (anos) Estatura(cm) Paciente Idade (anos) Estatura (cm) 1 59 142 16 74 162 2 74 148 17 68 162 3 58 150 18 94 162 4 59 150 19 87 162 5 62 150 20 93 165 6 76 150 21 56 165 7 71 150 22 21 165 8 56 152 23 53 166 9 57 153 24 52 166 10 41 157 25 53 167 11 56 157 26 44 167 12 76 158 27 69 167 13 75 160 28 82 168 14 68 160 29 98 168 15 89 161 30 76 169 78 Associação entre variáveis quantitativas (Gráfico de dispersão) 79 Associação entre variáveis quantitativas (Gráfico de dispersão) 80 Exemplo de cálculo (para os cinco primeiros indivíduos) Paciente Idade Estatura Desvios Produto (anos) (cm) Idade Estatura Desvios 1 59 142 2 74 148 3 58 150 4 59 150 5 62 150 Média 62,4 148 DP 6,7 3,5 Calcular a média e o desvio padrão para cada variável. Calcular os desvios em torno da média (diferença) para cada indivíduo. Calcular produtos dos desvios para cada indivíduo. Soma do produto dos desvios e dividir essa soma por (n-1), obtendo a covariância. Dividir esse resultado pelo produto dos desvios padrão. Exemplo de cálculo (para os cinco primeiros indivíduos) Paciente | Idade | Estatura | Desvios | Produto | (anos)| (cm) | Idade | Estatura | Desvios ----------------------------------------------------- 1 | 59 | 142 | -3,4 | -6 | 20,4 2 | 74 | 148 | 11,6 | 0 | 0,0 3 | 58 | 150 | -4,4 | 2 | -8,8 4 | 59 | 150 | -3,4 | 2 | -6,8 5 | 62 | 150 | -0,4 | 2 | -0,8 ----------------------------------------------------- Média | 62,4 | 148 | -- | -- | Cov = 1,0 DP | 6,7 | 3,5 | -- | -- | r = 0,043 1 - Calcular a média e o desvio padrão para cada variável. 2 - Calcular os desvios em torno da média (diferença) para cada indivíduo. 3- Calcular produtos dos desvios para cada indivíduo. 4 - Soma do produto dos desvios e dividir essa soma por (n-1), obtendo a covariância. 5 - Dividir esse resultado pelo produto dos desvios padrão, obtendo a correlação.

Sua Nova Sala de Aula

Sua Nova Sala de Aula

Empresa

Contato Blog

Legal

Termos de uso Política de privacidade Política de cookies Código de honra

Baixe o app

4,8
(35.000 avaliações)
© 2026 Meu Guru® • 42.269.770/0001-84