·

Agronomia ·

Probabilidade e Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Aula 1 Levantamento de dados e apresentacao tabular ESTATISTICA é 0 conjunto de procedimentos e principios que permitem juntar e processar informacoes com o objetivo de tomar decisoOes quando existir incerteza Utts 1999 Estatistica aplicada a problemas bioldgicos é chamada de BIOESTATISTICA ou BIOMETRIA ANALISE ESTATISTICA Descritiva Inferéncia Estatistica Estatistica Descritiva analise exploratoria dos dados tabelas e graficos medidas de tendéncia central média mediana quartil decil percentil medidas de dispersdo variancia e desvio padrao Inferéncia Estatistica como fazer afirmacdes sobre caracteristicas de uma populacao baseandose em resultados de uma amostra amostragem estimacao por ponto intervalo de confianga testes de hipdteses teste de uma proporcao populacional teste de uma média populacional teste de associacao pelo quiquadrado teste de diferenca de duas médias amostras independentes teste de diferenca de duas médias amostras dependentes FSPUSP Departamento de Epidemiologia HEP5732 Bioestatistica1200322CéAUSSOOSzd Denise Pimentel Bergamaschi Aula 1 FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 2 Níveis de mensuração Escala nominal Os indivíduos são classificados em categorias segundo uma característica Ex sexo masculino feminino hábito de fumar fumante não fumante Não existe ordem entre as categorias e suas representações se numéricas são destituídas de significado numérico Ex sexo masculino1 sexo feminino 2 Os valores 1 e 2 são apenas rótulos Escala ordinal Os indivíduos são classificados em categorias que possuem algum tipo de ordem inerente Neste caso uma categoria pode ser maior ou menor do que outra Ex classificação de tumor de cervix 0 a IV onde IV é o pior prognóstico Embora exista ordem entre as categorias a diferença entre categorias adjacentes não tem o mesmo significado em toda a escala Escala numérica intervalar Este nível de mensuração possui um valor zero arbitrário Ex temperatura em graus Celsius Escala numérica de razões Escala de razões discreta o resultado numérico da mensuração é um valor inteiro Ex número de filhos número de ataques de angina Escala de razões contínua o resultado numérico é um valor fracionário pertencente ao conjunto dos números reais R 0 02 073 1 248 Ex idade anos peso g altura cm pressão arterial mmHg FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 3 Níveis de mensuração resumo Nível Sumário Exemplo Nominal Categorias sem ordem natural condição do ambiente contaminado não contaminado Ordinal As categorias são ordenadas mas não podemos estabelecer diferenças entre elas contaminação ambiental leve moderada alta Intervalar Podemos determinar diferenças entre valores mas não há ponto de partida inerente As razões não têm sentido temperatura do ambiente 270 C 30 0C etc Razões Como na intervalar mas com ponto de partida inerente As razões têm sentido quantidade de monóxido de carbono no ar mgm3 65 120 32 etc De acordo com os níveis de mensuração as variáveis podem ser classificadas em VARIÁVEL qualitativa nominal ordinal quantitativa discreta contínua Classificar quanto a natureza as seguintes variáveis Variável tipo condição de saúde doente não doente tipo de parto normal cesário nível de colesterol sérico mg100cc tempo de um procedimento cirúrgico minutos número de praias consideradas poluídas custo do procedimento reais FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 4 Apuração de dados Processo no qual contase o número de vezes que a variável assumiu um determinado valor freqüência de ocorrência Pode ser manual ou mecânica programas estatísticos Epiinfo Stata Excel SPSS SAS Distribuição de freqüências correspondência entre categorias valores e freqüência de ocorrência Distribuição de freqüências valores pontuais valores em intervalos de classe Notação X variável xi valor observado para o indivíduo i Apresentação pontual Ex 10 indivíduos X número de filhos x 0 0 0 1 2 2 2 2 5 6 Apuração número de filhos freqüência 0 3 1 1 2 4 5 1 6 1 X idade x 5 5 15 20 20 20 21 21 22 22 idade freqüência 5 2 15 1 20 3 21 2 22 2 Como idade é variável quantitativa contínua a melhor forma de apresentala em tabelas é utilizando intervalos de valores intervalos de classe FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 5 Intervalos de classe idade freqüência 5 10 2 10 15 0 15 20 1 20 25 7 Intervalos de classe conjunto de observações contidas entre dois valores limite limite inferior e limite superior Representação 5 10 intervalo fechado no limite inferior e aberto no limite superior contém o valor 5 mas não contém o valor 10 5 10 intervalo aberto nos limites inferior e superior não contém os valores 5 e 10 5 10 intervalo fechado nos limites inferior e superior contém os valores 5 e 10 OBS Representar o intervalo 0 11 meses é equivalente a representálo como 0 12 meses Os intervalos de classe devem ser mutuamente exclusivos um indivíduo não pode ser classificado em dois intervalos ao mesmo tempo e exaustivos nenhum indivíduo pode ficar sem classificação A amplitude do intervalo é o tamanho do intervalo de classe A amplitude do intervalo e o número de intervalos dependem basicamente do problema específico e da literatura existente sobre o assunto O ponto médio do intervalo é calculado somandose o limite inferior e limite superior dividindose o resultado por dois FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 6 Apresentação tabular Elementos essenciais título corpo cabeçalho e coluna indicadora Tabela 1 Título o que natureza do fato estudadocomo variáveisonde quando Variável n Categoria 1 Categoria 2 Categoria 3 Total Fonte notas chamadas OBS nenhuma casela intersecção entre linha e coluna deve ficar em branco uniforme quanto ao número de casas decimais utilizar o símbolo quando o valor numérico é nulo utilizar o símbolo quando não se dispõe do dado Tabela de dupla entrada ou de contingência Distribuição de pacientes segundo ronco noturno e doença cardíaca Ronco noturno Doença cardíaca Sim Não Total n n n Não 24 17 1355 983 1379 100 Ocasional 35 55 603 945 638 100 Quase todas as noites 21 99 192 901 213 100 Sempre 30 118 224 882 254 100 Total 110 44 2374 956 2484 100 Fonte Hand DJ et al A handbook of small data sets ChapmanHall 1994 FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 7 Exercício 1 Os dados a seguir são relativos ao peso ao nascer g de recém nascidos com síndrome de desconforto idiopático grave Algumas crianças foram a óbito e outras sobrevieram 1030 1300 1720 2090 2570 1050 1310 1750 2200 2600 1100 1410 1760 2200 2700 1130 1500 1770 2270 2730 1175 1550 1820 2275 2830 1185 1575 1890 2400 2950 1225 1600 1930 2440 3005 1230 1680 1940 2500 3160 1262 1715 2015 2550 3400 1295 1720 2040 2560 3640 Fonte Hand DJ et al A handbook of small data sets ChapmanHall 1994 a Apresente as variáveis em tabelas unidimensionais b Classifique a variável peso ao nascer em duas categorias baixo peso abaixo de 2500 g e não baixo peso 2500 g e mais e faça uma tabela bidimensional cruzando as variáveis condição do recémnascido sobrevivente ou não sobrevivente e peso ao nascer baixo peso e não baixo peso c Interprete os resultados Exercício 2 Os dados a seguir foram publicados pela Unidade de recuperação de Alcoólatras em Camberwell Reino Unido A tabela mostra o número de pessoas condenadas por embriaguez nos tribunais de Tower Bridge e Lambeth Londres durante 6 meses de 1 de janeiro a 27 de junho de 1970 classificados segundo idade e sexo A distribuição etária é a mesma segundo sexo Discuta os resultados Idade Número de homens Número de mulheres 0 29 185 4 30 39 207 13 40 49 260 10 50 59 180 7 60 e 71 10 total 903 44 Fonte Hand DJ et al A handbook of small data sets ChapmanHall 1994 FSPUSP Departamento de Epidemiologia HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aula 1 8 Exercício 3 Os dados a seguir são de altura de uma amostra de 351 mulheres idosas selecionadas aleatoriamente de uma comunidade para um estudo de osteoporose Faça uma apuração dos dados e representeos em uma tabela Interprete os resultados 156 163 169 161 154 156 163 164 156 166 177 158 150 164 159 157 166 163 153 161 170 159 170 157 156 156 153 178 161 164 158 158 162 160 150 162 155 161 158 163 158 162 163 152 173 159 154 155 164 163 164 157 152 154 173 154 162 163 163 165 160 162 155 160 151 163 160 165 166 178 153 160 156 151 165 169 157 152 164 166 160 165 163 158 153 162 163 162 164 155 155 161 162 156 169 159 159 159 158 160 165 152 157 149 169 154 146 156 157 163 166 165 155 151 157 156 160 170 158 165 167 162 153 156 163 157 147 163 161 161 153 155 166 159 157 152 159 166 160 157 153 159 156 152 151 171 162 158 152 157 162 168 155 155 155 161 157 158 153 155 161 160 160 170 163 153 159 169 155 161 156 153 156 158 164 160 157 158 157 156 160 161 167 162 158 163 147 153 155 159 156 161 158 164 163 155 155 158 165 176 158 155 150 154 164 145 153 169 160 159 159 163 148 171 158 158 157 158 168 161 165 167 158 158 161 160 163 163 169 163 164 150 154 165 158 161 156 171 163 170 154 158 162 164 158 165 158 156 162 160 164 165 157 167 142 166 163 163 151 163 153 157 159 152 169 154 155 167 164 170 174 155 157 170 159 170 155 168 152 165 158 162 173 154 167 158 159 152 158 167 164 170 164 166 170 160 148 168 151 153 150 165 165 147 162 165 158 145 150 164 161 157 163 166 162 163 160 162 153 168 163 160 165 156 158 155 168 160 153 163 161 145 161 166 154 147 161 155 158 161 163 157 156 152 156 165 159 170 160 152 153 Fonte Hand DJ et al A handbook of small data sets ChapmanHall 1994