·
Ciências Biológicas ·
Bioestatística
· 2021/2
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
119
Slide Noções de Probabilidade 2021 2
Bioestatística
UFES
34
Slide Distribuição Normal 2021 2
Bioestatística
UFES
34
Slide Variáveis Aleatórias Contínuas 2021 2
Bioestatística
UFES
9
Lista Bioestatística 2021 1
Bioestatística
UFES
6
Lista Bioestatística b 2021 1
Bioestatística
UFES
3
Lista Bioestatística d 2021 1
Bioestatística
UFES
4
Lista Bioestatística c 2021 1
Bioestatística
UFES
25
Slide Noções de Somatório 2021 2
Bioestatística
UFES
1
Avaliação Parcial 4 - Testes de Hipótese e Análise de Variância
Bioestatística
IFMA
1
Questões - Bioestatística - 2023-1
Bioestatística
UERJ
Texto de pré-visualização
08112021 1 E S T A T Í S T I C A D E S C R I T I V A E n s i n o a p r e n d i z a g e m r e m o t o e E m e r g e n c i a l E A R T E PA RT E 1 Estatística descritiva ou análise exploratória dos dados Parte da estatística que lida com a organização resumo e apresentação de dados por meio de uso de tabelas de gráficos e de medidas de posição dispersão e pela natureza da distribuição em que ocorrem I N T R O D U Ç Ã O Profa Gisele R Moreira Bioestatística Estatística básica 2 Profa Gisele R Moreira Bioestatística Estatística básica 2 1 2 08112021 2 ETAPAS 1a Coleta ou levantamento dos dados 2a Organização dos dados 3a Apresentação e representação dos dados Apresentação em tabelas e gráficos Medidas de posição ou tendência central Medidas de dispersão ou variabilidade Estatísticas descritivas de distribuição 3 I N T R O D U Ç Ã O Profa Gisele R Moreira Bioestatística Estatística básica 4 COLETA DOS DADOS Tipos de variáveis Dados primários e secundários Profa Gisele R Moreira Bioestatística Estatística básica 3 4 08112021 3 QUALITATIVA QUANTITATIVA NOMINAL CLASSIFICAÇÃO ORDINAL ORDENADAÇÃO DISCRETA CONTAGEM CONTÍNUA MENSURAÇÃO Fator RH RH e RH Satisfação com um produto Insatisfeito neutro satisfeito Número de folhas por planta Estatura de pessoas cm 5 Tipos de variáveis Profa Gisele R Moreira Bioestatística Estatística básica I M P O R T A N T E A forma que os dados são coletados e os procedimentos para organizá los e apresentálos depende do tipo de variável 6 Profa Gisele R Moreira Bioestatística Estatística básica 5 6 08112021 4 7 DADOS PRIMÁRIOS oriundos de sua própria análise DADOS SECUNDÁRIOS coletados de outra fonte Dados primários e secundários Profa Gisele R Moreira Bioestatística Estatística básica DADOS BRUTOS forma sem ordenação e sem nenhum tipo de arranjo sistemático DADOS ELABORADOS forma ordenada e com algum tipo de arranjo sistemático seqüência crescente decrescente ou outra O R G A N I Z A Ç Ã O D O S D A D O S 8 Profa Gisele R Moreira Bioestatística Estatística básica 7 8 08112021 5 Dados brutos Variável quantitativa contínua Peso ao nascer de nascidos vivos em kg n 30 2522 3200 1900 4100 4600 3400 2720 3720 3600 2400 1720 3400 3125 2800 3200 2700 2750 1570 2250 2900 3300 2450 4200 3800 3220 2950 2900 3400 2100 2700 9 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 10 Dados elaborados Variável quantitativa contínua Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 9 10 08112021 6 11 Tabelas Gráficos Medidas de posição e dispersão Estatísticas de distribuição A P R E S E N T A Ç Ã O E R E P R E S E N T A Ç Ã O D O S D A D O S Profa Gisele R Moreira Bioestatística Estatística básica TA B E L A S 12 Objetivam resumir dados que tiveram tratamento estatístico Permitem totalizar linhas e colunas e estabelecer proporções em várias direções conforme a necessidade do estudo OBS Quadro Tabela Quadro é composto por linhas e colunas com uma moldura um quadrado em torno São empregados para apresentar conteúdo teórico como classificações comparações e dados numéricos sem tratamento estatístico Profa Gisele R Moreira Bioestatística Estatística básica 11 12 08112021 7 C A R A C T E R Í S T I C A S D E U M A T A B E L A Mais informações Normas de apresentação Tabular IBGE 1993 13 NÃO HÁ linhas verticais fechando as laterais da tabela Profa Gisele R Moreira Bioestatística Estatística básica Tabelas Uso e características Série estatística Tabelas de contingência Tabelas de distribuição de frequências 14 Profa Gisele R Moreira Bioestatística Estatística básica 13 14 08112021 8 15 A tabela deve ser suficientemente completa para ser entendida dispensando consulta ao texto ser auto explicativa com estruturação simples e objetiva Deve conter somente os dados necessários ao seu entendimento A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica 16 Deve incluir os dados logicamente ordenados com unidades e símbolos consistentes com o texto E apresentar todas as células preenchidas usandose o hífen quando o valor numérico for nulo e reticência quando não se dispõe do dado ou seja é desconhecido A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica 15 16 08112021 9 17 O título deve aparecer na parte SUPERIOR precedida da palavra Tabela seguida de seu número de ordem de ocorrência no texto em algarismos arábicos usando a mesma tipologia de fonte utilizada para as seções primárias do trabalho Deve indicar a natureza e as abrangências geográfica e temporal dos dados numéricos tipo de série estatística A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica Indicar obrigatoriamente a fonte ainda que seja produção do próprio autor utilizando fonte tamanho 10 estilo regular e espaçamento simples 18 A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica 17 18 08112021 10 19 Quando uma tabela ocupar mais de uma folha não será delimitada na parte inferior repetindose o cabeçalho e o título na folha seguinte Cada folha deve ter as seguintes indicações continua na primeira conclusão na última e continuação nas demais As indicações de fontes e notas devem aparecer na folha de conclusão da tabela Mais informações em httpwwwbibliotecafspuspbrbibliotecaguiaicap04htm A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica S É R I E E S T A T Í S T I C A 20 É u m a s u c e s s ã o d e d a d o s e s t a t í s t i c o s r e f e r e n t e s a q u a l q u e r v a r i á v e l Profa Gisele R Moreira Bioestatística Estatística básica 19 20 08112021 11 TIPOS Série temporal histórica ou cronológica época a que se refere o fenômeno analisado Série geográfica territorial ou de localidade onde o fenômeno ocorre Série específica ou categórica o fenômeno que é descrito Série mista 21 Profa Gisele R Moreira Bioestatística Estatística básica Ano Número de alfabetizados 2000 93839744 2010 147385581 Tabela 1 Número de alfabetizados com idade de 10 ou mais anos nos censos de 2000 e 2010 Brasil Fonte IBGE censos demográficos 2000 e 2010 22 S É R I E T E M P O R A L H I S T Ó R I C A O U C R O N O L Ó G I C A Profa Gisele R Moreira Bioestatística Estatística básica 21 22 08112021 12 Situação de domicílio Número de alfabetizados Urbana 128091166 Rural 19294415 Fonte IBGE censo demográfico 2010 Tabela 2 Número de alfabetizados na idade de 10 anos ou mais por situação de domicílio de acordo com o censo brasileiro de 2010 Brasil 23 S É R I E G E O G R Á F I C A T E R R I T O R I A L O U D E L O C A L I D A D E Profa Gisele R Moreira Bioestatística Estatística básica S É R I E E S P E C Í F I C A O U C A T E G Ó R I C A Gênero Número de alfabetizados Homens 71361117 Mulheres 76024464 Tabela 3 Número de alfabetizados segundo o gênero na idade de 10 anos ou mais de acordo com o censo brasileiro de 2010 Brasil Fonte IBGE censo demográfico 2010 24 Profa Gisele R Moreira Bioestatística Estatística básica 23 24 08112021 13 Série temporal histórica ou cronológica Série geográfica territorial ou de localidade Série específica ou categórica 25 S É R I E M I S T A Profa Gisele R Moreira Bioestatística Estatística básica Gênero 2000 2010 Homem 45990282 71361117 Mulher 47849462 76024464 Tabela 4 Número de alfabetizados segundo o gênero na idade de 10 anos ou mais de acordo com o censo brasileiro de 2000 e 2010 Brasil Fonte IBGE censos demográficos 2000 e 2010 26 S É R I E M I S T A Profa Gisele R Moreira Bioestatística Estatística básica 25 26 08112021 14 T A B E L A D E C O N T I N G Ê N C I A 27 U s a d a p a r a f a z e r c o r r e s p o n d ê n c i a d a s r e s p o s t a s d e d u a s o u m a i s v a r i á v e i s q u a l i t a t i v a s Profa Gisele R Moreira Bioestatística Estatística básica COMO É A TABELA Variáveis Linhas e colunas Interseções entre linhas e colunas células Células frequência porcentagem do total geral porcentagem do total por linha ou por coluna dependendo do tipo de tabela que está sendo elaborada 28 Profa Gisele R Moreira Bioestatística Estatística básica 27 28 08112021 15 29 Foram feitos diagnósticos de depressão em 500 estudantes com idades entre 10 e 17 anos metade de cada gênero Foram identificados 98 casos de depressão sendo 62 do gênero feminino Sem depressão foram 214 do gênero masculino Abaixo a tabela de contingência para os dados da variável Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 100 EXEMPLO VIEIRA S Introdução à Bioestatística 4 ed Rio de Janeiro Elsevier 2008 pág 30 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica Colunas Linhas Tabela 2 X 2 30 Gênero Depressão TOTAL Sim Não Masculino 72 428 50 Feminino 124 376 50 TOTAL 196 804 100 Por total geral É possível ainda a partir da tabela de contingência pela frequências absolutas construir as tabelas de contingência baseadas nas porcentagens total por linha e por coluna Tabela 6 Tabela de contingência em porcentagem por total geral para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica 29 30 08112021 16 31 31 Profa Gisele R Moreira Bioestatística Estatística básica Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes Gênero Depressão TOTAL Sim Não Masculino Feminino TOTAL 72 124 196 428 376 804 50 50 100 Tabela 6 Tabela de contingência em porcentagem por total geral para os diagnósticos de depressão segundo o gênero em 500 estudantes 500 100 98 𝑥 𝑥 196 500 100 36 𝑥 𝑥 72 500 100 62 𝑥 𝑥 124 500 100 214 𝑥 𝑥 428 500 100 188 𝑥 𝑥 376 500 100 402 𝑥 𝑥 804 32 Por total por linha Gênero Depressão TOTAL Sim Não Masculino 144 856 100 Feminino 248 752 100 TOTAL 196 804 100 Tabela 7 Tabela de contingência em porcentagem por total de linha para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica 31 32 08112021 17 33 Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes 250 100 36 𝑥 𝑥 144 250 100 214 𝑥 𝑥 856 250 100 62 𝑥 𝑥 248 250 100 188 𝑥 𝑥 752 Gênero Depressão TOTAL Sim Não Masculino Feminino TOTAL Tabela 7 Tabela de contingência em porcentagem por total de linha para os diagnósticos de depressão segundo o gênero em 500 estudantes 144 248 194 856 752 804 100 100 100 Profa Gisele R Moreira Bioestatística Estatística básica 34 Por total por coluna Gênero Depressão TOTAL Sim Não Masculino 367 532 50 Feminino 633 468 50 TOTAL 100 100 100 Tabela 8 Tabela de contingência em porcentagem por total de coluna para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica 33 34 08112021 18 35 Profa Gisele R Moreira Bioestatística Estatística básica Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes Gênero Depressão TOTAL Sim Não Masculino Feminino TOTAL Tabela 8 Tabela de contingência em porcentagem por total de coluna para os diagnósticos de depressão segundo o gênero em 500 estudantes 100 100 100 98 100 36 𝑥 𝑥 367 98 100 62 𝑥 𝑥 633 402 100 214 𝑥 𝑥 532 402 100 188 𝑥 𝑥 468 367 633 532 468 50 50 T A B E L A S D E D I S T R I B U I Ç Ã O D E F R E Q U Ê N C I A S 36 U s a d a s p a r a s i n t e t i z a r v a l o r e s n u m é r i c o s d e v a r i á v e i s q u a n t i t a t i v a s c o r r e s p o n d e n d o o s v a l o r e s o b s e r v a d o s e m e s t u d o c o m a s r e s p e c t i v a s f r e q u ê n c i a s Profa Gisele R Moreira Bioestatística Estatística básica 35 36 08112021 19 T I P O S D E T A B E L A S D E D I S T R I B U I Ç Ã O D E F R E Q U Ê N C I A S 37 DISCRETA ou PONTUAL dados quantitativos discretos CONTÍNUA OU INTERVALAR dados quantitativos contínuos 37 Profa Gisele R Moreira Bioestatística Estatística básica 38 DISCRETA ou PONTUAL dados quantitativos discretos 38 Profa Gisele R Moreira Bioestatística Estatística básica 37 38 08112021 20 39 Tabela de distribuição de freqüências DISCRETA OU PONTUAL EXEMPLO Supondo que desejamos apresentar em uma tabela de distribuição de frequências pontual os dados hipotéticos de valores da variável número de animais contaminados por determinada doença obtidos a partir de 20 propriedades rurais quais sejam 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 5 Profa Gisele R Moreira Bioestatística Estatística básica 40 Tabela de distribuição de freqüências DISCRETA OU PONTUAL EXEMPLO 10 PASSO Obter as frequências absolutas Fi dadas pela contagem do número de ocorrência de cada resultado 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 5 0 4 1 7 2 5 3 2 4 1 5 1 Profa Gisele R Moreira Bioestatística Estatística básica 39 40 08112021 21 41 20 PASSO Obter as demais frequências frequência relativa Fri frequência relativa percentual Fpi frequência acumulada Fci e frequência acumulada percentual Fci 30 PASSO Montar a tabela de distribuição de frequências Profa Gisele R Moreira Bioestatística Estatística básica 42 No animais contaminados Fi Fri Fpi Fci Fci 0 4 020 20 4 20 1 7 035 35 11 55 2 5 025 25 16 80 3 2 010 10 18 90 4 1 005 5 19 95 5 1 005 5 20 100 Total n 20 100 100 Fri frequência absoluta Fri frequência relativa Fpi frequência relativa percentual Fci frequência acumulada Fci frequência acumulada percentual Profa Gisele R Moreira Bioestatística Estatística básica Tabela 9 Tabela de distribuição de frequências pontual para o número de animais contaminados para um grupo de 20 propriedades 41 42 08112021 22 43 CONTÍNUA OU INTERVALAR dados quantitativos contínuos 43 Profa Gisele R Moreira Bioestatística Estatística básica 44 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Tabela de distribuição de frequências CONTÍNUA OU INTERVALAR 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 43 44 08112021 23 45 EXEMPLO 10 PASSO número de classes k 5 20 PASSO amplitude de classe c 0758 30 PASSO limite inferior da primeira classe Li1a 1191 40 PASSO obter as frequências absolutas Fi dadas pela contagem do número de ocorrência de resultado em cada classe Tabela de distribuição de frequências CONTÍNUA OU INTERVALAR Profa Gisele R Moreira Bioestatística Estatística básica 46 Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Número de classes 𝑘 𝑛 30 5477 5 45 46 08112021 24 47 Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Comprimento de classe 𝑐 𝐴 𝑘 1 4600 1570 5 1 07575 0758 Em que 𝐴 𝑋𝑛 𝑋1 OBS Justificase o k 1 e não apenas k no denominador da expressão do comprimento de classe devido à suposição de que a amostra de tamanho n tem grande chance de não conter o valor mínimo da população FERREIRA 2005 48 Limite inferior da primeira classe 𝐿𝑖1𝑎 𝑋1 𝑐 2 𝐿𝑖1𝑎 𝑋1 𝑐 2 1570 0758 2 1191 Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 47 48 08112021 25 1ª classe 1191 1949 2ª classe 1949 2707 3ª classe 2707 3465 4ª classe 3465 4223 5ª classe 4223 4981 Obtenção das classes Se K é igual a 5 então são cinco classes ou seja intervalos O limite inferior da primeira classe começa é o valor 1191 LI1a E cada classe tem o comprimento c de 0758 49 Profa Gisele R Moreira Bioestatística Estatística básica 50 40 PASSO Obter as frequências absolutas Fi dadas pela contagem do número de ocorrência de resultado em cada classe Profa Gisele R Moreira Bioestatística Estatística básica 49 50 08112021 26 51 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 3 7 14 5 1 1ª classe 1191 1949 2ª classe 1949 2707 3ª classe 2707 3465 4ª classe 3465 4223 5ª classe 4223 4981 Profa Gisele R Moreira Bioestatística Estatística básica 52 50 PASSO Obter as demais frequências frequência relativa Fri frequência relativa percentual Fpi frequência acumulada Fci e frequência acumulada percentual Fci 60 PASSO Montar a tabela de distribuição de frequências Profa Gisele R Moreira Bioestatística Estatística básica 51 52 08112021 27 53 Tabela 10 Tabela de distribuição de frequências intervalar do peso ao nascer de nascidos vivos em kg Profa Gisele R Moreira Bioestatística Estatística básica Classes Fi Fri Fpi Fci Fci 1191 1949 3 010 10 3 10 1949 2707 7 023 23 10 33 2707 3465 14 047 47 24 80 3465 4223 5 017 17 29 97 4223 4981 1 003 3 30 100 Total n 30 10 100 Fri frequência absoluta Fri frequência relativa Fpi frequência relativa percentual Fci frequência acumulada Fci frequência acumulada percentual 54 FÓRMULAS frequência relativa 𝐹𝑟𝑖 𝐹𝑖 𝑛 frequência relativa percentual 𝐹𝑝𝑖 𝐹𝑟𝑖100 frequência acumulada 𝐹𝑐𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 frequência acumulada percentual Profa Gisele R Moreira Bioestatística Estatística básica 𝐹𝑐𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 53 54 08112021 28 G R Á F I C O S 55 Objetiva resumir dados que tiveram tratamento estatístico Possibilita rápida impressão visual da distribuição dos valores ou das frequências observadas Profa Gisele R Moreira Bioestatística Estatística básica A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E G R Á F I C O Os gráficos devem ser inseridos o mais próximo possível do trecho a que se refere Escolher aquele mais informativo e apropriado para o tipo de variável em estudo 56 Profa Gisele R Moreira Bioestatística Estatística básica Assim como as tabelas devem ser auto explicativos contendo todas as informações necessárias ao seu entendimento 55 56 08112021 29 A identificação do gráfico deve aparecer na parte SUPERIOR precedida da palavra Gráfico ou Figura seguida de seu número de ordem de ocorrência no texto em algarismos arábicos e do respectivo título usando a mesma tipologia de fonte utilizada para as seções primárias do trabalho A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E G R Á F I C O 57 Profa Gisele R Moreira Bioestatística Estatística básica Na parte inferior indicar obrigatoriamente a fonte ainda que seja produção do próprio autor utilizando fonte tamanho 10 estilo regular e espaçamento simples Gráficos Barras verticais colunas Barras horizontais Linha Setores ou pizza Diagrama de dispersão Histograma e polígono de frequência 58 Profa Gisele R Moreira Bioestatística Estatística básica 57 58 08112021 30 GRÁFICO DE BARRAS VERTICAIS OU COLUNAS Usado para apresentar especialmente dados de variáveis qualitativas nominais ou ordinais Ou seja é usado para comparar a quantidade ou a percentagem de valores em diversas categorias 59 Profa Gisele R Moreira Bioestatística Estatística básica Também usado para apresentar dados de variáveis quantitativas discretas organizadas em tabela de distribuição de frequências pontual E X G R Á F I C O D E B A R R A S V E R T I C A I S Fonte VIEIRA S Introdução à Bioestatística 4 ed Elsevier 2008 0 10 20 30 40 50 60 70 Sim Em parte Não Sem resposta Figura 1 Resposta de 100 pessoas submetidas a uma cirurgia estética reparadora quando perguntadas se consideravam que a cirurgia plástica havia melhorado a aparência delas Resposta Frequência relativa percentual 60 Profa Gisele R Moreira Bioestatística Estatística básica 59 60 08112021 31 GRÁFICO DE BARRAS HORIZONTAIS Também usado para apresentar dados de variáveis quantitativas discretas organizadas em tabela de distribuição de frequências pontual 61 Profa Gisele R Moreira Bioestatística Estatística básica Também usado para apresentar dados de variáveis qualitativas nominais ou ordinais sendo o melhor tipo para comparar múltiplos valores categóricos E X G R Á F I C O D E B A R R A S H O R I Z O N T A L 0 2000 4000 6000 8000 Dengue Tuberculose Hepatite AIDSHIV Diarréia Rubéola Intoxicação alimentar Meinigite Número de casos Doenças de notificação compulsória Fonte httpwwwhserjsaudegovbrprofissionalboletimbol30epvigiasp Figura 3 Doenças de notificação compulsória no Hospital Federal dos servidores do Estado do Rio de Janeiro no período de 1990 a 2004 62 Profa Gisele R Moreira Bioestatística Estatística básica 61 62 08112021 32 GRÁFICO DE LINHAS Usado para exibir tendências ao longo do tempo tanto para variáveis qualitativas e quantitativas 63 Profa Gisele R Moreira Bioestatística Estatística básica Ex GRÁFICO DE LINHAS 64 Profa Gisele R Moreira Bioestatística Estatística básica Fontehttpspoliticaestadaocombreleicoes2018pesquisaseleitoraisprimeiroturnopresidenteibope Figura 5 Pesquisa eleitoral IBOPE de intenção de voto para presidente do Brasil 1º turno eleições 2018 no período de 2008 a 06102020 63 64 08112021 33 GRÁFICO DE SETORES OU PIZZA Especialmente usado para apresentar variáveis qualitativas nominais ou ordinais de modo a visualizar o todo que está compreendido em cada uma das categorias Usado quando existe apenas poucas categorias 65 Profa Gisele R Moreira Bioestatística Estatística básica 1971 2091 2467 3471 Aranha Serpente Outros animais Escorpião Figura 6 Casos de intoxicação humana por animal peçonhento ocorridos no Brasil em 2005 de acordo com o animal E X G R Á F I C O D E S E T O R E S O U P I Z Z A Fonte VIEIRA S Introdução à Bioestatística 4 ed Elsevier 2008 66 Profa Gisele R Moreira Bioestatística Estatística básica 65 66 08112021 34 DIAGRAMA DE DISPERSÃO Usado para analisar visualmente a relação entre duas variáveis quantitativas obtidas nas mesmas unidades de observação Se os pontos estiverem espalhados em torno de uma linha reta imaginária é indício de que a relação entre as variáveis é linear 67 Profa Gisele R Moreira Bioestatística Estatística básica Ex DIAGRAMA DE DISPERSÃO Sejam as notas de oito alunos nas disciplinas de Cálculo e Física sorteados ao acaso em uma turma de Engenharia COSTA NETO P L O Estatística São Paulo Blücher 2002 pág 222 Aluno 1 2 3 4 5 6 7 8 Cálculo X 45 60 30 25 50 55 15 70 Física Y 35 45 30 20 55 50 15 60 68 Profa Gisele R Moreira Bioestatística Estatística básica 67 68 08112021 35 Ex DIAGRAMA DE DISPERSÃO Aluno 1 2 3 4 5 6 7 8 Cálculo X 45 60 30 25 50 55 15 70 Física Y 35 45 30 20 55 50 15 60 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 Figura 7 Notas de oito alunos em Cálculo e Física Alegre 2017 Existe uma tendência de relação linear crescente entre as variáveis 45 35 15 15 25 20 30 30 70 60 60 45 55 50 50 55 69 Profa Gisele R Moreira Bioestatística Estatística básica Usados para dados quantitativos contínuos apresentados em tabelas de distribuição de frequência intervalar H I S T O G R A M A E P O L Í G O N O D E F R E Q U Ê N C I A IMPORTÂNCIA Verificar a forma de distribuição dos dados 70 Profa Gisele R Moreira Bioestatística Estatística básica 69 70 08112021 36 Gráfico de coluna utilizado para representar distribuições de frequências com dados agrupados em classes Especialmente indicado para dados em tabela de distribuição de frequências intervalar 71 Profa Gisele R Moreira Bioestatística Estatística básica Gráfico obtido pela união de pontos dos lados superiores pontos médios das classes dos retângulos de um histograma por meio de segmentos de reta consecutivos 72 Profa Gisele R Moreira Bioestatística Estatística básica 71 72 08112021 37 EXERCÍCIO Obter o histograma e o polígono de frequência a partir dos dados agrupados na Tabela de distribuição de frequências INTERVALAR abaixo Classes Fi Fri Fpi Fci Fci 1191 1949 3 010 10 3 10 1949 2707 7 023 23 10 33 2707 3465 14 047 47 24 80 3465 4223 5 017 17 29 97 4223 4981 1 003 3 30 100 Total 30 10 100 Tabela 10 Tabela de distribuição de frequências intervalar do peso ao nascer de nascidos vivos em kg 73 Profa Gisele R Moreira Bioestatística Estatística básica Figura 9 Histograma para o peso ao nascer de nascidos vivos em kg Frequência absoluta Fi Classes de valores 0 2 4 6 8 10 12 14 16 1191 1949 1949 2707 2707 3465 3465 4223 4223 4981 74 Profa Gisele R Moreira Bioestatística Estatística básica 73 74 08112021 38 Frequência absoluta Fi Pontos médios das classes 0 2 4 6 8 10 12 14 16 0812 1570 2328 3086 3844 4602 5360 Figura 10 Polígono de frequência para o peso ao nascer de nascidos vivos em kg 75 Profa Gisele R Moreira Bioestatística Estatística básica 0 2 4 6 8 10 12 14 16 0812 1570 2328 3086 3844 4602 5360 Classes c 0758 Ponto médio 1191 1949 1570 1949 2707 2328 2707 3465 3086 3465 4223 3844 4223 4981 4602 𝑃𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 ത𝑋𝑖 𝐿𝑠 𝐿𝑖 2 1570 0758 4602 0758 76 Profa Gisele R Moreira Bioestatística Estatística básica 75 76 08112021 39 Figura 11 Histograma e polígono de frequência para o peso ao nascer de nascidos vivos em kg Frequência absoluta Fi Classes de valores 0 2 4 6 8 10 12 14 16 1191 1949 1949 2707 2707 3465 3465 4223 4223 4981 Histograma Polígono de frequência 77 Profa Gisele R Moreira Bioestatística Estatística básica EXERCÍCIO Figura 12 Variação de anticorpos para a doença X em relação a uma corte populacional específica área endêmica ENADE 2010 Biomedicina 78 Profa Gisele R Moreira Bioestatística Estatística básica 77 78 08112021 40 A B C D E Resposta B 79 Profa Gisele R Moreira Bioestatística Estatística básica EXERCÍCIO Tabela 11 Altura cm de 40 alunos do curso de Estatística da UFES dados hipotéticos Classes Fi Fri Fpi Fci Fci 150 158 7 018 18 7 18 158 166 5 012 12 12 30 166 174 10 025 25 22 55 174 182 12 031 31 34 86 182 190 5 012 12 39 98 190 198 1 002 2 40 100 Total 40 100 100 Fazer o histograma e o polígono de frequência a partir das frequências relativas percentuais 80 Profa Gisele R Moreira Bioestatística Estatística básica 79 80 08112021 41 E S T A T Í S T I C A D E S C R I T I V A E n s i n o a p r e n d i z a g e m r e m o t o e E m e r g e n c i a l E A R T E PA RT E 2 M E D I D A S D E P O S I Ç Ã O O U T E N D Ê N C I A C E N T R A L 82 Representar o ponto central de um conjunto de dados média mediana e moda Estabelecer em torno de que valores representativos os dados se distribuem Dividir o conjunto de dados em partes iguais separatrizes mediana Objetivos Profa Gisele R Moreira Bioestatística Estatística básica 81 82 08112021 42 83 Média aritmética Soma das observações dividida pelo número delas Em que é cada valor da variável n é o número de elementos amostrais i X n X X X X n X X n n i i 3 2 1 1 Profa Gisele R Moreira Bioestatística Estatística básica 84 kg n X X n i i 2 987 30 4 600 1720 1570 1 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 83 84 08112021 43 85 Figura 13 Distribuição dos pesos em kg de bebês nascidos vivos em torno da média aritmética 2 987 X Frequência absoluta Peso ao nascer 0 1 2 3 1570 2070 2570 3070 3570 4070 4570 Profa Gisele R Moreira Bioestatística Estatística básica 86 Multiplicandose ou dividindose todos os valores de uma variável por uma constante a média do conjunto fica multiplicada ou dividida por esta constante Somandose ou subtraindose uma constante a todos os valores de uma variável a média do conjunto fica acrescida ou diminuída dessa constante 1 Propriedades da média Profa Gisele R Moreira Bioestatística Estatística básica 85 86 08112021 44 87 Vantagens Facilidade de interpretação e cálculo Tem potencial de uso para propósitos de inferências Desvantagens É afetada por valores extremos Só pode ser usada para variáveis quantitativas 2 Vantagens e desvantagens Profa Gisele R Moreira Bioestatística Estatística básica 88 Mediana É o valor que ocupa a posição central da série de dados quando estes são colocados em ordem crescente ou decrescente i X Profa Gisele R Moreira Bioestatística Estatística básica 87 88 08112021 45 2 1 n X 2 2 2 2 n n X X Md Se n for PAR Se n for ÍMPAR 89 O B T E N Ç Ã O D A M E D I A N A Profa Gisele R Moreira Bioestatística Estatística básica 90 2 2 2 16 15 2 30 2 2 30 2 2 2 X X X X X X Md n n kg Md 2 925 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 𝑀𝑑 2900 2950 2 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Profa Gisele R Moreira Bioestatística Estatística básica 89 90 08112021 46 91 Multiplicandose ou dividindose todos os valores de uma variável por uma constante a mediana do conjunto fica multiplicada ou dividida por esta constante Somandose ou subtraindose uma constante a todos os valores de uma variável a mediana do conjunto fica acrescida ou diminuída dessa constante 1 Propriedades da mediana Profa Gisele R Moreira Bioestatística Estatística básica 92 Vantagens Não é afetada por valores extremos Pode ser obtida para variáveis quantitativas e qualitativas ordinais com n ímpar Pode ser obtida em amostras em que alguns valores ainda não foram registrados 2 Vantagens e desvantagem da mediana Profa Gisele R Moreira Bioestatística Estatística básica 91 92 08112021 47 93 Desvantagem Menos informativa que a média pois só considera as posições das observações e não todos os valores 2 Vantagens e desvantagem da mediana Profa Gisele R Moreira Bioestatística Estatística básica 94 Moda É o resultado que ocorre com maior frequência numa série de dados Classificações das distribuições Amodal o conjunto de dados não possui moda Unimodal o conjunto de dados possui uma moda Bimodal o conjunto de dados possui duas modas Multimodal o conjunto de dados possui mais de duas modas Profa Gisele R Moreira Bioestatística Estatística básica 93 94 08112021 48 R E P R E S E N T A Ç Õ E S G R Á F I C A S P A R A D I S T R I B U I Ç Õ E S D E A C O R D O C O M A M O D A 95 Profa Gisele R Moreira Bioestatística Estatística básica Unimodal 96 kg Mo 3 400 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Profa Gisele R Moreira Bioestatística Estatística básica 95 96 08112021 49 1 Propriedades da moda Se somarmos ou subtrairmos um valor constante a cada um dos elementos de uma série a moda ficará somada ou subtraída por essa constante Se multiplicarmos ou dividirmos um valor constante a cada um dos elementos de uma série a moda ficará multiplicada ou dividida por essa constante Profa Gisele R Moreira Bioestatística Estatística básica 97 98 Vantagens Rápida obtenção como medida de posição Pode ser obtida para variáveis quantitativas e qualitativas nominais e ordinais Desvantagem Menos informativa que a média pois só considera as frequências das observações e não todos os valores 2 Vantagens e desvantagem da moda 97 98 08112021 50 99 EXERCÍCIO 1 Classe fenotípica Frequência absoluta Fi AL 7 AR 3 VL 3 VR 1 Calcule média aritmética e a moda classifique Tabela 14 Distribuição de frequências absolutas para a variável cor e textura da semente de ervilha referente à análise da geração F2 do cruzamento de uma planta de ervilha com sementes amarelas e lisas AL com outras verdes e rugosas VR Profa Gisele R Moreira Bioestatística Estatística básica 100 Em um experimento o número de carrapatos observados em cada um dos animais de um grupo foram os seguintes 19 7 4 9 7 17 13 10 17 15 11 15 15 20 19 EXERCÍCIO 2 Profa Gisele R Moreira Bioestatística Estatística básica Após terem sido calculadas a média aritmética a mediana e a moda um erro foi descoberto um dos animais com 15 carrapatos tinha na realidade 17 É correto afirmar que nessa situação apenas a média aritmética se altera após a correção dos dados Justifique 99 100 08112021 51 101 EXERCÍCIO 1 resposta 14 1 3 3 7 14 14 1 VR VL AR AL X X i i Média aritmética Moda A classe que possui maior frequência é AL Fi 7 Assim Mo AL Unimodal Como a variável é qualitativa nominal não tem como calcular a média pois não tem como proceder o cálculo Profa Gisele R Moreira Bioestatística Estatística básica Medidas de dispersão Amplitude total Desvio médio Variância Desvio padrão Coeficiente de variação Erro padrão da média 102 Profa Gisele R Moreira Bioestatística Estatística básica 101 102 08112021 52 M E D I D A S D E D I S P E R S Ã O O U V A R I A B I L I D A D E Quantificar a dispersão dos dados em torno do ponto central Caracterizar e diferenciar a dispersão espacial dos dados Objetivos Profa Gisele R Moreira Bioestatística Estatística básica 103 X1 X A n 104 Em que Xn e X1 são respectivamente o último e o primeiro valor nos dados ordenados Profa Gisele R Moreira Bioestatística Estatística básica Amplitude total É a diferença entre a observação de maior valor e aquela de menor valor 103 104 08112021 53 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 𝐴 𝑋𝑛 𝑋1 4600 1570 303𝑘𝑔 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 105 1 Propriedades da amplitude Se somarmos ou subtrairmos um valor constante a cada um dos elementos de uma série a amplitude não se alterará Se multiplicarmos ou dividirmos um valor constante a cada um dos elementos de uma série a amplitude ficará multiplicada ou dividida por essa constante Profa Gisele R Moreira Bioestatística Estatística básica 106 105 106 08112021 54 Vantagem Rápida obtenção como medida de dispersão Profa Gisele R Moreira Bioestatística Estatística básica 2 Vantagem e desvantagens da amplitude 107 Desvantagens Pouco informativa como medida de dispersão pois uma vez que depende apenas dos valores extremos não identifica possíveis variações entre esses limites Fornece uma subestimativa da amplitude populacional já que dificilmente a amostra vai apresentar tanto o valor mais baixo quanto o mais alto geralmente os mais raros da população Profa Gisele R Moreira Bioestatística Estatística básica 108 107 108 08112021 55 n X X n i i X 1 ˆ Profa Gisele R Moreira Bioestatística Estatística básica Desvio médio É a média dos desvios absolutos em relação à média ou mediana da amostra 109 Suponha que tenham sido encontrados os seguintes valores de uma variável qualquer em cm 208 203 202 200 198 197 192 200cm aritmética Média Em que Xi valores ou dados observados m média no conjunto de dados ei desvios em relação a média xi m ei Profa Gisele R Moreira Bioestatística Estatística básica 110 109 110 08112021 56 203 208 198 200 202 192 197 200 X e1 8 e2 3 e3 2 e4 0 e5 2 e6 3 e7 8 mˆ eˆ X i i Obtenção dos desvios ei 0 ˆ 7 1 i ie 0 1 X X n i i Profa Gisele R Moreira Bioestatística Estatística básica 111 n X X n i i X 1 ˆ 0 1 X X n i i Módulo da soma dos desvios Número de elementos na amostra Se Então o desvio médio é Profa Gisele R Moreira Bioestatística Estatística básica 112 111 112 08112021 57 𝜎 ሜ𝑋 σ𝑖1 𝑛 𝑋𝑖 ሜ𝑋 𝑛 σ𝑖1 30 𝑋𝑖 2987 30 𝜎 ሜ𝑋 1570 2987 1720 2987 4600 2987 30 533 30 0564𝑘𝑔 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 113 1 Propriedades do desvio médio Se somarmos ou subtrairmos um valor constante a cada um dos elementos de uma série o desvio médio não se alterará Se multiplicarmos ou dividirmos um valor constante a cada um dos elementos de uma série o desvio médio ficará multiplicado ou dividido por essa constante Profa Gisele R Moreira Bioestatística Estatística básica 114 113 114 08112021 58 1 ˆ 1 2 2 n X X n i i Profa Gisele R Moreira Bioestatística Estatística básica Variância amostral É a média dos quadrados das diferenças dos valores em relação à média quadrado médio OBS Se a variância for obtida para dados coletados na população o denominador será N e não n 1 115 1 ˆ 1 2 2 n X X n i i VARIÂNCIA 𝑆𝑂𝑀𝐴 𝐷𝐸 𝑄𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝑂𝑆 𝐷𝐸𝑆𝑉𝐼𝑂𝑆 𝐺𝑅𝐴𝑈𝑆 𝐷𝐸 𝐿𝐼𝐵𝐸𝑅𝐷𝐴𝐷𝐸 0 1 X X n i i Se Então a variância amostral é Profa Gisele R Moreira Bioestatística Estatística básica 116 115 116 08112021 59 1 ˆ 1 2 2 n X X n i i 1 ˆ 1 1 2 2 2 n n X X n i n i i i Profa Gisele R Moreira Bioestatística Estatística básica 117 2 2 2 2 2 2 30 1 30 1 2 2 1 1 2 2 2 0 516 29 30 4 600 1 720 1570 4 600 1 720 1570 ˆ 1 30 30 1 ˆ kg X X n n X X i i i i n i n i i i 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 118 117 118 08112021 60 1 Propriedades da variância Profa Gisele R Moreira Bioestatística Estatística básica Multiplicandose todos os valores de uma variável por uma constante a variância fica multiplicada pelo quadrado da constante Somandose ou subtraindose uma constante a todos os valores de uma variável a variância não se altera 119 2 Vantagem e desvantagem da variância Profa Gisele R Moreira Bioestatística Estatística básica Vantagem É a medida mais usada em interferência estatística Desvantagem Não tem interpretação prática para quantificar a dispersão dos dados em torno da média uma vez que o resultado fica em unidade quadrática 120 119 120 08112021 61 2ˆ ˆ Tem a vantagem em relação à variância de estar na mesma unidade dos dados originais Profa Gisele R Moreira Bioestatística Estatística básica Desvio padrão amostral É a raiz quadrática da variância 121 2 2 0 516 ˆ Variância kg kg kg 0 719 0 516 ˆ Desvio padrão 2 2 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 122 121 122 08112021 62 Figura 14 Dispersão em termos de desvio padrão dos pesos de nascidos vivos em torno da média aritmética 0 719 2 987 ˆ X ˆ 2 268 X ˆ 3 706 X Frequência absoluta Peso ao nascer kg 0 1 2 3 1570 2070 2570 3070 3570 4070 4570 Profa Gisele R Moreira Bioestatística Estatística básica 123 Interpretação do desvio padrão A maioria dos valores dos pesos dos bebês nascidos vivos estão concentrados entre 2268 e 3706 kg 0 719 2 987 ˆ X 3 706 ˆ 2 268 X De fato 333 dos valores 1570 1720 1900 2100 2250 3720 3800 4100 4200 e 4600 estão fora dos limites desse intervalo Profa Gisele R Moreira Bioestatística Estatística básica 124 123 124 08112021 63 1 Propriedades do desvio padrão Profa Gisele R Moreira Bioestatística Estatística básica Multiplicandose todos os valores de uma variável por uma constante o desvio padrão fica multiplicado pela constante Somandose ou subtraindose uma constante a todos os valores de uma variável o desvio padrão não se altera 125 2 Vantagens e desvantagem do desvio padrão Profa Gisele R Moreira Bioestatística Estatística básica Vantagens Está na mesma unidade de medida dos dados originais Tem fácil interpretação como medida de dispersão Por ser obtido a partir da variância é muito usado na inferência estatística 126 125 126 08112021 64 2 Vantagem e desvantagem do desvio padrão Profa Gisele R Moreira Bioestatística Estatística básica Desvantagem É necessário obter anteriormente a variância para que seja obtido o desvio padrão Geralmente é um pouco superior à média dos desvios em absoluto desvio médio 127 ˆ 100 X CV Em que X ˆ Desvio padrão amostral Média amostral CV Profa Gisele R Moreira Bioestatística Estatística básica Coeficiente de variação É a medida de variabilidade RELATIVA ao valor médio do conjunto de dados 128 127 128 08112021 65 2407 2 987 100 0 719 CV kg X kg 987 2 0 719 ˆ Sejam Quanto menor o CV maior a concentração dos dados em torno do valor central e maior homogeneidade 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 129 Medida adimensional Compara a variabilidade de conjuntos de dados com diferentes unidades de medida Compara conjuntos de dados com mesma unidade mas com médias de diferentes magnitudes Profa Gisele R Moreira Bioestatística Estatística básica 2 Vantagens do coeficiente de variação 130 129 130 08112021 66 Temse uma amostra de 4 sementes de uma espécie E dados fictícios no qual se obtém os dados para a espessura do endosperma milímetros e peso em gramas EXEMPLO Espessura do endosperma Peso 2 4 5 3 0012 0021 0018 0016 ሜ𝑋 35𝑚𝑚 𝜎 129𝑚𝑚 Variável Espessura X Variável Peso Y ሜ𝑌 002𝑔 𝜎 0004𝑔 OBS Endosperma é tecido nutritivo que envolve o embrião em certos tipos de plantas 131 𝐶𝑉𝑋 129 35 100 𝐶𝑉𝑋 37 𝐶𝑉𝑌 004 002 100 𝐶𝑉𝑌 225 A espessura do endosperma possui MAIOR variabilidade que o peso das sementes pois possui maior CV Então é a variável MAIS HETEROGÊNEA ሜ𝑋 35𝑚𝑚 𝜎 129𝑚𝑚 Variável Espessura X Variável Peso Y ሜ𝑌 002𝑔 𝜎 0004𝑔 Profa Gisele R Moreira Bioestatística Estatística básica 132 131 132 08112021 67 n X ˆ ˆ É um estimador da precisão da estimativa de uma média populacionall Profa Gisele R Moreira Bioestatística Estatística básica Erro padrão da média Medida de dispersão das médias amostrais em torno da média populacional Ou seja é o desvio padrão da distribuição amostral de uma estatística 133 kg n X 131 0 30 0 719 ˆ ˆ Quanto menor o valor do erro padrão da média mais provável será a chance de se obter a média amostral nas proximidades da média populacional 30 0 719 ˆ n kg Sejam 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 134 133 134 08112021 68 Algumas observações sobre as medidas de dispersão Quanto maior a dispersão dos dados maiores são a amplitude o desvio médio a variância o desvio padrão e o coeficiente de variação Quanto maior a concentração dos dados em torno do valor central menores são a amplitude o desvio médio a variância o desvio padrão e o coeficiente de variação Se os valores forem todos iguais a amplitude o desvio médio a variância o desvio padrão e o coeficiente de variação serão iguais a zero Não existe estimativas negativas de amplitude desvio médio variância desvio padrão e erro padrão da média É possível valor negativo e acima de 100 para o coeficiente de variação Profa Gisele R Moreira Bioestatística Estatística básica 135 CONCURSO PÚBLICO Prefeitura de Aracajú SE 2004 2ª edição Cargo Técnico de Vigilância em Saúde Área BiologiaQuestão 66 Banca Centro de Seleção e de Promoção de Eventos UnB CESPE Nível Superior Um agricultor precisa decidir entre duas variedades de milho Amos possuem espigas de cumprimento uniforme A análise do comprimento de 100 espigas revelou que a variedade A apresenta as seguintes características média 1875 desvio padrão 045 e erro padrão da média 005 e a variedade B apresenta as seguintes características média 1889 desvio padrão 140 e erro padrão da média 025 Acerca da situaçãoproblema dos itens acima julgue os itens que se seguem em Certo C ou Errado E 1 Embora a variedade B produza em média espigas ligeiramente maiores as espigas da variedade A têm uma variância menor 2 As médias de diferentes amostras refletem sua dispersão Resposta 1 C 2 E Profa Gisele R Moreira Bioestatística Estatística básica 136 135 136 08112021 69 Os dados abaixo foram extraídos do site do ministério da Saúde https covidsaúdegovbr bem no início da pandemia e referemse ao número de óbitos por semana epidemiológica Profa Gisele R Moreira Bioestatística Estatística básica 137 Obtenha a Média mediana e moda b Amplitude total c Desvio médio d Variância e Desvio padrão interpreteo f Coeficiente de variação g Erro padrão da média Respostas a 335 9 0 b 96 c 3867 d 20751 e 4555 f 136 g 1860 Estatísticas de distribuição Assimetria Curtose 138 Profa Gisele R Moreira Bioestatística Estatística básica 137 138 08112021 70 Simétrica ou Normal Assimétrica positiva Assimétrica negativa Profa Gisele R Moreira Bioestatística Estatística básica 139 Assimetria É a distribuição da assimetria em torno do ponto central Simétrica Assimétrica positiva Assimétrica negativa Mo Md X Mo Md X X Md Mo POSIÇÃO RELATIVA DA MÉDIA MEDIANA E MODA NUMA DISTRIBUIÇÃO Figura 15 Posição relativa da média mediana e moda numa distribuição Profa Gisele R Moreira Bioestatística Estatística básica 140 139 140 08112021 71 Se As 0 a distrib será Assimétrica Positiva Se As 0 a distrib será Simétrica ou Normal Se As 0 a distrib será Assimétrica Negativa ˆ Mo X As ˆ 3 Md X As COEFICIENTE DE ASSIMETRIA Profa Gisele R Moreira Bioestatística Estatística básica 141 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 kg M M kg X d o 0 719 ˆ 925 2 3 400 987 2 Sejam 0 26 719 0 2 925 2 987 3 ˆ 3 Md X As As 0 Assimetria positiva EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 0 574 719 0 3 400 987 2 ˆ 0 M X As As 0 Assimetria negativa Profa Gisele R Moreira Bioestatística Estatística básica 142 141 142 08112021 72 Figura 16 Histograma e polígono de frequência para o peso ao nascer de nascidos vivos em kg Como no conjunto de dados a moda foi maior que a mediana e a média pressupõese que a assimetria seja negativa e não positiva apesar da relação entre a média e a mediana não ter correspondido exatamente ao esperado para esse tipo de assimetria Profa Gisele R Moreira Bioestatística Estatística básica 143 0 5 10 15 20 25 30 35 40 45 50 1191 1949 1949 2707 2707 3465 3465 4223 4223 4981 Frequência relativa Classe Histograma Polígono de frequência Profa Gisele R Moreira Bioestatística Estatística básica 144 Curtose É o grau de achatamento da distribuição Quando a distribuição apresenta uma curva de frequência mais fechada mais aguda em sua parte superior é denominada Leptocúrtica A distribuição de referência Distribuição Normal é denominada Mesocúrtica Quando a distribuição apresenta uma curva de frequência mais aberta mais achatada em sua parte superior é denominada Platicúrtica 143 144 08112021 73 Profa Gisele R Moreira Bioestatística Estatística básica 145 Figura 18 Curvas de distribuição de acordo com a curtose Curtose 30 platicúrtica Curtose 30 mesocúrtica distribuição Normal Curtose 30 leptocúrtica 3 2 1 3 ˆ 3 2 1 1 2 1 4 n n n X X n n n n n Curtose n i i C O E F I C I E N T E D E C U R T O S E Profa Gisele R Moreira Bioestatística Estatística básica 146 145 146 08112021 74 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 kg kg X n 0 719 ˆ 987 2 30 056 0 3 230 30 1 30 3 719 0 987 2 3 230 130 30 1 30 30 3 2 1 3 ˆ 3 2 1 1 2 30 1 4 2 1 4 Curtose X Curtose n n n X X n n n n n Curtose i i n i i Curtose 30 Platicúrtica Sejam Profa Gisele R Moreira Bioestatística Estatística básica 147 Sejam os dados do consumo diário de sal em gramas por dia EXERCÍCIO 6 9 6 8 7 6 4 10 6 8 6 8 a Construa o histograma e o polígono de frequências a partir das frequências relativas e discuta sobre a assimetria da distribuição b Obtenha média moda classifique e mediana c Obtenha a variância e o desvio padrão Interprete o desvio padrão d Calcule o coeficiente de assimetria classifique e compare as posições relativas da média mediana e moda na distribuição e Obtenha a amplitude e o coeficiente de variação Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 82 Profa Gisele R Moreira Bioestatística Estatística básica 148 147 148 08112021 75 52 3 3 1 Li a c k a 0 01 02 03 04 05 06 07 08 25 55 55 85 85 115 Figura 19 Histograma e polígono de frequência para o consumo diário de sal em gramas por dia Classes Frequência relativa Profa Gisele R Moreira Bioestatística Estatística básica 149 56 6 Unimodal 7 Md Mo X b Respostas 65 1 2 73 2 c A maioria dos dados do consumo diário de sal está disperso em torno da média entre 7 165 e 7 165 ou seja 535 865 X Profa Gisele R Moreira Bioestatística Estatística básica 150 149 150 08112021 76 65 1 56 6 7 Md Mo X 0 91 65 1 56 7 3 ˆ 3 0 61 65 1 6 7 ˆ d o M X As M X As d As 0 Assimetria positiva Respostas X Md Logo Mo Profa Gisele R Moreira Bioestatística Estatística básica 151 1 65 7 X e 23 6 7 100 165 100 X CV 6 4 10 1 X X A n Respostas Profa Gisele R Moreira Bioestatística Estatística básica 152 151 152 08112021 77 Profa Gisele R Moreira Bioestatística Estatística básica 153 Literatura recomendada BLAYR R C TAYLOR R A Bioestatística para ciências da saúde São Paulo Pearson Education do Brasil 2013 469p CALLEGARIJACQUES S M Bioestatística princípios e aplicações Porto Alegre Artmed 2003 255p FERREIRA D F Estatística básica Lavras UFLA 2005 664p LEVINE D M et al Estatística teoria e aplicações 6 ed Rio de Janeiro LTC 2012 804p TOLEDO GL OVALLE II Estatística básica 2ed São Paulo Atlas 1982 459p VIEIRA S Introdução à Bioestatística Rio de Janeiro Elsevier 2008 345p 153
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
119
Slide Noções de Probabilidade 2021 2
Bioestatística
UFES
34
Slide Distribuição Normal 2021 2
Bioestatística
UFES
34
Slide Variáveis Aleatórias Contínuas 2021 2
Bioestatística
UFES
9
Lista Bioestatística 2021 1
Bioestatística
UFES
6
Lista Bioestatística b 2021 1
Bioestatística
UFES
3
Lista Bioestatística d 2021 1
Bioestatística
UFES
4
Lista Bioestatística c 2021 1
Bioestatística
UFES
25
Slide Noções de Somatório 2021 2
Bioestatística
UFES
1
Avaliação Parcial 4 - Testes de Hipótese e Análise de Variância
Bioestatística
IFMA
1
Questões - Bioestatística - 2023-1
Bioestatística
UERJ
Texto de pré-visualização
08112021 1 E S T A T Í S T I C A D E S C R I T I V A E n s i n o a p r e n d i z a g e m r e m o t o e E m e r g e n c i a l E A R T E PA RT E 1 Estatística descritiva ou análise exploratória dos dados Parte da estatística que lida com a organização resumo e apresentação de dados por meio de uso de tabelas de gráficos e de medidas de posição dispersão e pela natureza da distribuição em que ocorrem I N T R O D U Ç Ã O Profa Gisele R Moreira Bioestatística Estatística básica 2 Profa Gisele R Moreira Bioestatística Estatística básica 2 1 2 08112021 2 ETAPAS 1a Coleta ou levantamento dos dados 2a Organização dos dados 3a Apresentação e representação dos dados Apresentação em tabelas e gráficos Medidas de posição ou tendência central Medidas de dispersão ou variabilidade Estatísticas descritivas de distribuição 3 I N T R O D U Ç Ã O Profa Gisele R Moreira Bioestatística Estatística básica 4 COLETA DOS DADOS Tipos de variáveis Dados primários e secundários Profa Gisele R Moreira Bioestatística Estatística básica 3 4 08112021 3 QUALITATIVA QUANTITATIVA NOMINAL CLASSIFICAÇÃO ORDINAL ORDENADAÇÃO DISCRETA CONTAGEM CONTÍNUA MENSURAÇÃO Fator RH RH e RH Satisfação com um produto Insatisfeito neutro satisfeito Número de folhas por planta Estatura de pessoas cm 5 Tipos de variáveis Profa Gisele R Moreira Bioestatística Estatística básica I M P O R T A N T E A forma que os dados são coletados e os procedimentos para organizá los e apresentálos depende do tipo de variável 6 Profa Gisele R Moreira Bioestatística Estatística básica 5 6 08112021 4 7 DADOS PRIMÁRIOS oriundos de sua própria análise DADOS SECUNDÁRIOS coletados de outra fonte Dados primários e secundários Profa Gisele R Moreira Bioestatística Estatística básica DADOS BRUTOS forma sem ordenação e sem nenhum tipo de arranjo sistemático DADOS ELABORADOS forma ordenada e com algum tipo de arranjo sistemático seqüência crescente decrescente ou outra O R G A N I Z A Ç Ã O D O S D A D O S 8 Profa Gisele R Moreira Bioestatística Estatística básica 7 8 08112021 5 Dados brutos Variável quantitativa contínua Peso ao nascer de nascidos vivos em kg n 30 2522 3200 1900 4100 4600 3400 2720 3720 3600 2400 1720 3400 3125 2800 3200 2700 2750 1570 2250 2900 3300 2450 4200 3800 3220 2950 2900 3400 2100 2700 9 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 10 Dados elaborados Variável quantitativa contínua Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 9 10 08112021 6 11 Tabelas Gráficos Medidas de posição e dispersão Estatísticas de distribuição A P R E S E N T A Ç Ã O E R E P R E S E N T A Ç Ã O D O S D A D O S Profa Gisele R Moreira Bioestatística Estatística básica TA B E L A S 12 Objetivam resumir dados que tiveram tratamento estatístico Permitem totalizar linhas e colunas e estabelecer proporções em várias direções conforme a necessidade do estudo OBS Quadro Tabela Quadro é composto por linhas e colunas com uma moldura um quadrado em torno São empregados para apresentar conteúdo teórico como classificações comparações e dados numéricos sem tratamento estatístico Profa Gisele R Moreira Bioestatística Estatística básica 11 12 08112021 7 C A R A C T E R Í S T I C A S D E U M A T A B E L A Mais informações Normas de apresentação Tabular IBGE 1993 13 NÃO HÁ linhas verticais fechando as laterais da tabela Profa Gisele R Moreira Bioestatística Estatística básica Tabelas Uso e características Série estatística Tabelas de contingência Tabelas de distribuição de frequências 14 Profa Gisele R Moreira Bioestatística Estatística básica 13 14 08112021 8 15 A tabela deve ser suficientemente completa para ser entendida dispensando consulta ao texto ser auto explicativa com estruturação simples e objetiva Deve conter somente os dados necessários ao seu entendimento A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica 16 Deve incluir os dados logicamente ordenados com unidades e símbolos consistentes com o texto E apresentar todas as células preenchidas usandose o hífen quando o valor numérico for nulo e reticência quando não se dispõe do dado ou seja é desconhecido A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica 15 16 08112021 9 17 O título deve aparecer na parte SUPERIOR precedida da palavra Tabela seguida de seu número de ordem de ocorrência no texto em algarismos arábicos usando a mesma tipologia de fonte utilizada para as seções primárias do trabalho Deve indicar a natureza e as abrangências geográfica e temporal dos dados numéricos tipo de série estatística A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica Indicar obrigatoriamente a fonte ainda que seja produção do próprio autor utilizando fonte tamanho 10 estilo regular e espaçamento simples 18 A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica 17 18 08112021 10 19 Quando uma tabela ocupar mais de uma folha não será delimitada na parte inferior repetindose o cabeçalho e o título na folha seguinte Cada folha deve ter as seguintes indicações continua na primeira conclusão na última e continuação nas demais As indicações de fontes e notas devem aparecer na folha de conclusão da tabela Mais informações em httpwwwbibliotecafspuspbrbibliotecaguiaicap04htm A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E TA B E L A Profa Gisele R Moreira Bioestatística Estatística básica S É R I E E S T A T Í S T I C A 20 É u m a s u c e s s ã o d e d a d o s e s t a t í s t i c o s r e f e r e n t e s a q u a l q u e r v a r i á v e l Profa Gisele R Moreira Bioestatística Estatística básica 19 20 08112021 11 TIPOS Série temporal histórica ou cronológica época a que se refere o fenômeno analisado Série geográfica territorial ou de localidade onde o fenômeno ocorre Série específica ou categórica o fenômeno que é descrito Série mista 21 Profa Gisele R Moreira Bioestatística Estatística básica Ano Número de alfabetizados 2000 93839744 2010 147385581 Tabela 1 Número de alfabetizados com idade de 10 ou mais anos nos censos de 2000 e 2010 Brasil Fonte IBGE censos demográficos 2000 e 2010 22 S É R I E T E M P O R A L H I S T Ó R I C A O U C R O N O L Ó G I C A Profa Gisele R Moreira Bioestatística Estatística básica 21 22 08112021 12 Situação de domicílio Número de alfabetizados Urbana 128091166 Rural 19294415 Fonte IBGE censo demográfico 2010 Tabela 2 Número de alfabetizados na idade de 10 anos ou mais por situação de domicílio de acordo com o censo brasileiro de 2010 Brasil 23 S É R I E G E O G R Á F I C A T E R R I T O R I A L O U D E L O C A L I D A D E Profa Gisele R Moreira Bioestatística Estatística básica S É R I E E S P E C Í F I C A O U C A T E G Ó R I C A Gênero Número de alfabetizados Homens 71361117 Mulheres 76024464 Tabela 3 Número de alfabetizados segundo o gênero na idade de 10 anos ou mais de acordo com o censo brasileiro de 2010 Brasil Fonte IBGE censo demográfico 2010 24 Profa Gisele R Moreira Bioestatística Estatística básica 23 24 08112021 13 Série temporal histórica ou cronológica Série geográfica territorial ou de localidade Série específica ou categórica 25 S É R I E M I S T A Profa Gisele R Moreira Bioestatística Estatística básica Gênero 2000 2010 Homem 45990282 71361117 Mulher 47849462 76024464 Tabela 4 Número de alfabetizados segundo o gênero na idade de 10 anos ou mais de acordo com o censo brasileiro de 2000 e 2010 Brasil Fonte IBGE censos demográficos 2000 e 2010 26 S É R I E M I S T A Profa Gisele R Moreira Bioestatística Estatística básica 25 26 08112021 14 T A B E L A D E C O N T I N G Ê N C I A 27 U s a d a p a r a f a z e r c o r r e s p o n d ê n c i a d a s r e s p o s t a s d e d u a s o u m a i s v a r i á v e i s q u a l i t a t i v a s Profa Gisele R Moreira Bioestatística Estatística básica COMO É A TABELA Variáveis Linhas e colunas Interseções entre linhas e colunas células Células frequência porcentagem do total geral porcentagem do total por linha ou por coluna dependendo do tipo de tabela que está sendo elaborada 28 Profa Gisele R Moreira Bioestatística Estatística básica 27 28 08112021 15 29 Foram feitos diagnósticos de depressão em 500 estudantes com idades entre 10 e 17 anos metade de cada gênero Foram identificados 98 casos de depressão sendo 62 do gênero feminino Sem depressão foram 214 do gênero masculino Abaixo a tabela de contingência para os dados da variável Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 100 EXEMPLO VIEIRA S Introdução à Bioestatística 4 ed Rio de Janeiro Elsevier 2008 pág 30 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica Colunas Linhas Tabela 2 X 2 30 Gênero Depressão TOTAL Sim Não Masculino 72 428 50 Feminino 124 376 50 TOTAL 196 804 100 Por total geral É possível ainda a partir da tabela de contingência pela frequências absolutas construir as tabelas de contingência baseadas nas porcentagens total por linha e por coluna Tabela 6 Tabela de contingência em porcentagem por total geral para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica 29 30 08112021 16 31 31 Profa Gisele R Moreira Bioestatística Estatística básica Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes Gênero Depressão TOTAL Sim Não Masculino Feminino TOTAL 72 124 196 428 376 804 50 50 100 Tabela 6 Tabela de contingência em porcentagem por total geral para os diagnósticos de depressão segundo o gênero em 500 estudantes 500 100 98 𝑥 𝑥 196 500 100 36 𝑥 𝑥 72 500 100 62 𝑥 𝑥 124 500 100 214 𝑥 𝑥 428 500 100 188 𝑥 𝑥 376 500 100 402 𝑥 𝑥 804 32 Por total por linha Gênero Depressão TOTAL Sim Não Masculino 144 856 100 Feminino 248 752 100 TOTAL 196 804 100 Tabela 7 Tabela de contingência em porcentagem por total de linha para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica 31 32 08112021 17 33 Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes 250 100 36 𝑥 𝑥 144 250 100 214 𝑥 𝑥 856 250 100 62 𝑥 𝑥 248 250 100 188 𝑥 𝑥 752 Gênero Depressão TOTAL Sim Não Masculino Feminino TOTAL Tabela 7 Tabela de contingência em porcentagem por total de linha para os diagnósticos de depressão segundo o gênero em 500 estudantes 144 248 194 856 752 804 100 100 100 Profa Gisele R Moreira Bioestatística Estatística básica 34 Por total por coluna Gênero Depressão TOTAL Sim Não Masculino 367 532 50 Feminino 633 468 50 TOTAL 100 100 100 Tabela 8 Tabela de contingência em porcentagem por total de coluna para os diagnósticos de depressão segundo o gênero em 500 estudantes Profa Gisele R Moreira Bioestatística Estatística básica 33 34 08112021 18 35 Profa Gisele R Moreira Bioestatística Estatística básica Gênero Depressão TOTAL Sim Não Masculino 36 214 250 Feminino 62 188 250 TOTAL 98 402 500 Tabela 5 Tabela de contingência para os diagnósticos de depressão segundo o gênero em 500 estudantes Gênero Depressão TOTAL Sim Não Masculino Feminino TOTAL Tabela 8 Tabela de contingência em porcentagem por total de coluna para os diagnósticos de depressão segundo o gênero em 500 estudantes 100 100 100 98 100 36 𝑥 𝑥 367 98 100 62 𝑥 𝑥 633 402 100 214 𝑥 𝑥 532 402 100 188 𝑥 𝑥 468 367 633 532 468 50 50 T A B E L A S D E D I S T R I B U I Ç Ã O D E F R E Q U Ê N C I A S 36 U s a d a s p a r a s i n t e t i z a r v a l o r e s n u m é r i c o s d e v a r i á v e i s q u a n t i t a t i v a s c o r r e s p o n d e n d o o s v a l o r e s o b s e r v a d o s e m e s t u d o c o m a s r e s p e c t i v a s f r e q u ê n c i a s Profa Gisele R Moreira Bioestatística Estatística básica 35 36 08112021 19 T I P O S D E T A B E L A S D E D I S T R I B U I Ç Ã O D E F R E Q U Ê N C I A S 37 DISCRETA ou PONTUAL dados quantitativos discretos CONTÍNUA OU INTERVALAR dados quantitativos contínuos 37 Profa Gisele R Moreira Bioestatística Estatística básica 38 DISCRETA ou PONTUAL dados quantitativos discretos 38 Profa Gisele R Moreira Bioestatística Estatística básica 37 38 08112021 20 39 Tabela de distribuição de freqüências DISCRETA OU PONTUAL EXEMPLO Supondo que desejamos apresentar em uma tabela de distribuição de frequências pontual os dados hipotéticos de valores da variável número de animais contaminados por determinada doença obtidos a partir de 20 propriedades rurais quais sejam 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 5 Profa Gisele R Moreira Bioestatística Estatística básica 40 Tabela de distribuição de freqüências DISCRETA OU PONTUAL EXEMPLO 10 PASSO Obter as frequências absolutas Fi dadas pela contagem do número de ocorrência de cada resultado 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 5 0 4 1 7 2 5 3 2 4 1 5 1 Profa Gisele R Moreira Bioestatística Estatística básica 39 40 08112021 21 41 20 PASSO Obter as demais frequências frequência relativa Fri frequência relativa percentual Fpi frequência acumulada Fci e frequência acumulada percentual Fci 30 PASSO Montar a tabela de distribuição de frequências Profa Gisele R Moreira Bioestatística Estatística básica 42 No animais contaminados Fi Fri Fpi Fci Fci 0 4 020 20 4 20 1 7 035 35 11 55 2 5 025 25 16 80 3 2 010 10 18 90 4 1 005 5 19 95 5 1 005 5 20 100 Total n 20 100 100 Fri frequência absoluta Fri frequência relativa Fpi frequência relativa percentual Fci frequência acumulada Fci frequência acumulada percentual Profa Gisele R Moreira Bioestatística Estatística básica Tabela 9 Tabela de distribuição de frequências pontual para o número de animais contaminados para um grupo de 20 propriedades 41 42 08112021 22 43 CONTÍNUA OU INTERVALAR dados quantitativos contínuos 43 Profa Gisele R Moreira Bioestatística Estatística básica 44 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Tabela de distribuição de frequências CONTÍNUA OU INTERVALAR 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 43 44 08112021 23 45 EXEMPLO 10 PASSO número de classes k 5 20 PASSO amplitude de classe c 0758 30 PASSO limite inferior da primeira classe Li1a 1191 40 PASSO obter as frequências absolutas Fi dadas pela contagem do número de ocorrência de resultado em cada classe Tabela de distribuição de frequências CONTÍNUA OU INTERVALAR Profa Gisele R Moreira Bioestatística Estatística básica 46 Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Número de classes 𝑘 𝑛 30 5477 5 45 46 08112021 24 47 Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Comprimento de classe 𝑐 𝐴 𝑘 1 4600 1570 5 1 07575 0758 Em que 𝐴 𝑋𝑛 𝑋1 OBS Justificase o k 1 e não apenas k no denominador da expressão do comprimento de classe devido à suposição de que a amostra de tamanho n tem grande chance de não conter o valor mínimo da população FERREIRA 2005 48 Limite inferior da primeira classe 𝐿𝑖1𝑎 𝑋1 𝑐 2 𝐿𝑖1𝑎 𝑋1 𝑐 2 1570 0758 2 1191 Peso ao nascer de nascidos vivos em kg n 30 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 47 48 08112021 25 1ª classe 1191 1949 2ª classe 1949 2707 3ª classe 2707 3465 4ª classe 3465 4223 5ª classe 4223 4981 Obtenção das classes Se K é igual a 5 então são cinco classes ou seja intervalos O limite inferior da primeira classe começa é o valor 1191 LI1a E cada classe tem o comprimento c de 0758 49 Profa Gisele R Moreira Bioestatística Estatística básica 50 40 PASSO Obter as frequências absolutas Fi dadas pela contagem do número de ocorrência de resultado em cada classe Profa Gisele R Moreira Bioestatística Estatística básica 49 50 08112021 26 51 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 3 7 14 5 1 1ª classe 1191 1949 2ª classe 1949 2707 3ª classe 2707 3465 4ª classe 3465 4223 5ª classe 4223 4981 Profa Gisele R Moreira Bioestatística Estatística básica 52 50 PASSO Obter as demais frequências frequência relativa Fri frequência relativa percentual Fpi frequência acumulada Fci e frequência acumulada percentual Fci 60 PASSO Montar a tabela de distribuição de frequências Profa Gisele R Moreira Bioestatística Estatística básica 51 52 08112021 27 53 Tabela 10 Tabela de distribuição de frequências intervalar do peso ao nascer de nascidos vivos em kg Profa Gisele R Moreira Bioestatística Estatística básica Classes Fi Fri Fpi Fci Fci 1191 1949 3 010 10 3 10 1949 2707 7 023 23 10 33 2707 3465 14 047 47 24 80 3465 4223 5 017 17 29 97 4223 4981 1 003 3 30 100 Total n 30 10 100 Fri frequência absoluta Fri frequência relativa Fpi frequência relativa percentual Fci frequência acumulada Fci frequência acumulada percentual 54 FÓRMULAS frequência relativa 𝐹𝑟𝑖 𝐹𝑖 𝑛 frequência relativa percentual 𝐹𝑝𝑖 𝐹𝑟𝑖100 frequência acumulada 𝐹𝑐𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 𝐹𝑖 frequência acumulada percentual Profa Gisele R Moreira Bioestatística Estatística básica 𝐹𝑐𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 𝐹𝑝𝑖 53 54 08112021 28 G R Á F I C O S 55 Objetiva resumir dados que tiveram tratamento estatístico Possibilita rápida impressão visual da distribuição dos valores ou das frequências observadas Profa Gisele R Moreira Bioestatística Estatística básica A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E G R Á F I C O Os gráficos devem ser inseridos o mais próximo possível do trecho a que se refere Escolher aquele mais informativo e apropriado para o tipo de variável em estudo 56 Profa Gisele R Moreira Bioestatística Estatística básica Assim como as tabelas devem ser auto explicativos contendo todas as informações necessárias ao seu entendimento 55 56 08112021 29 A identificação do gráfico deve aparecer na parte SUPERIOR precedida da palavra Gráfico ou Figura seguida de seu número de ordem de ocorrência no texto em algarismos arábicos e do respectivo título usando a mesma tipologia de fonte utilizada para as seções primárias do trabalho A L G U M A S N O R M A S PA R A E L A B O R A Ç Ã O D E G R Á F I C O 57 Profa Gisele R Moreira Bioestatística Estatística básica Na parte inferior indicar obrigatoriamente a fonte ainda que seja produção do próprio autor utilizando fonte tamanho 10 estilo regular e espaçamento simples Gráficos Barras verticais colunas Barras horizontais Linha Setores ou pizza Diagrama de dispersão Histograma e polígono de frequência 58 Profa Gisele R Moreira Bioestatística Estatística básica 57 58 08112021 30 GRÁFICO DE BARRAS VERTICAIS OU COLUNAS Usado para apresentar especialmente dados de variáveis qualitativas nominais ou ordinais Ou seja é usado para comparar a quantidade ou a percentagem de valores em diversas categorias 59 Profa Gisele R Moreira Bioestatística Estatística básica Também usado para apresentar dados de variáveis quantitativas discretas organizadas em tabela de distribuição de frequências pontual E X G R Á F I C O D E B A R R A S V E R T I C A I S Fonte VIEIRA S Introdução à Bioestatística 4 ed Elsevier 2008 0 10 20 30 40 50 60 70 Sim Em parte Não Sem resposta Figura 1 Resposta de 100 pessoas submetidas a uma cirurgia estética reparadora quando perguntadas se consideravam que a cirurgia plástica havia melhorado a aparência delas Resposta Frequência relativa percentual 60 Profa Gisele R Moreira Bioestatística Estatística básica 59 60 08112021 31 GRÁFICO DE BARRAS HORIZONTAIS Também usado para apresentar dados de variáveis quantitativas discretas organizadas em tabela de distribuição de frequências pontual 61 Profa Gisele R Moreira Bioestatística Estatística básica Também usado para apresentar dados de variáveis qualitativas nominais ou ordinais sendo o melhor tipo para comparar múltiplos valores categóricos E X G R Á F I C O D E B A R R A S H O R I Z O N T A L 0 2000 4000 6000 8000 Dengue Tuberculose Hepatite AIDSHIV Diarréia Rubéola Intoxicação alimentar Meinigite Número de casos Doenças de notificação compulsória Fonte httpwwwhserjsaudegovbrprofissionalboletimbol30epvigiasp Figura 3 Doenças de notificação compulsória no Hospital Federal dos servidores do Estado do Rio de Janeiro no período de 1990 a 2004 62 Profa Gisele R Moreira Bioestatística Estatística básica 61 62 08112021 32 GRÁFICO DE LINHAS Usado para exibir tendências ao longo do tempo tanto para variáveis qualitativas e quantitativas 63 Profa Gisele R Moreira Bioestatística Estatística básica Ex GRÁFICO DE LINHAS 64 Profa Gisele R Moreira Bioestatística Estatística básica Fontehttpspoliticaestadaocombreleicoes2018pesquisaseleitoraisprimeiroturnopresidenteibope Figura 5 Pesquisa eleitoral IBOPE de intenção de voto para presidente do Brasil 1º turno eleições 2018 no período de 2008 a 06102020 63 64 08112021 33 GRÁFICO DE SETORES OU PIZZA Especialmente usado para apresentar variáveis qualitativas nominais ou ordinais de modo a visualizar o todo que está compreendido em cada uma das categorias Usado quando existe apenas poucas categorias 65 Profa Gisele R Moreira Bioestatística Estatística básica 1971 2091 2467 3471 Aranha Serpente Outros animais Escorpião Figura 6 Casos de intoxicação humana por animal peçonhento ocorridos no Brasil em 2005 de acordo com o animal E X G R Á F I C O D E S E T O R E S O U P I Z Z A Fonte VIEIRA S Introdução à Bioestatística 4 ed Elsevier 2008 66 Profa Gisele R Moreira Bioestatística Estatística básica 65 66 08112021 34 DIAGRAMA DE DISPERSÃO Usado para analisar visualmente a relação entre duas variáveis quantitativas obtidas nas mesmas unidades de observação Se os pontos estiverem espalhados em torno de uma linha reta imaginária é indício de que a relação entre as variáveis é linear 67 Profa Gisele R Moreira Bioestatística Estatística básica Ex DIAGRAMA DE DISPERSÃO Sejam as notas de oito alunos nas disciplinas de Cálculo e Física sorteados ao acaso em uma turma de Engenharia COSTA NETO P L O Estatística São Paulo Blücher 2002 pág 222 Aluno 1 2 3 4 5 6 7 8 Cálculo X 45 60 30 25 50 55 15 70 Física Y 35 45 30 20 55 50 15 60 68 Profa Gisele R Moreira Bioestatística Estatística básica 67 68 08112021 35 Ex DIAGRAMA DE DISPERSÃO Aluno 1 2 3 4 5 6 7 8 Cálculo X 45 60 30 25 50 55 15 70 Física Y 35 45 30 20 55 50 15 60 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 Figura 7 Notas de oito alunos em Cálculo e Física Alegre 2017 Existe uma tendência de relação linear crescente entre as variáveis 45 35 15 15 25 20 30 30 70 60 60 45 55 50 50 55 69 Profa Gisele R Moreira Bioestatística Estatística básica Usados para dados quantitativos contínuos apresentados em tabelas de distribuição de frequência intervalar H I S T O G R A M A E P O L Í G O N O D E F R E Q U Ê N C I A IMPORTÂNCIA Verificar a forma de distribuição dos dados 70 Profa Gisele R Moreira Bioestatística Estatística básica 69 70 08112021 36 Gráfico de coluna utilizado para representar distribuições de frequências com dados agrupados em classes Especialmente indicado para dados em tabela de distribuição de frequências intervalar 71 Profa Gisele R Moreira Bioestatística Estatística básica Gráfico obtido pela união de pontos dos lados superiores pontos médios das classes dos retângulos de um histograma por meio de segmentos de reta consecutivos 72 Profa Gisele R Moreira Bioestatística Estatística básica 71 72 08112021 37 EXERCÍCIO Obter o histograma e o polígono de frequência a partir dos dados agrupados na Tabela de distribuição de frequências INTERVALAR abaixo Classes Fi Fri Fpi Fci Fci 1191 1949 3 010 10 3 10 1949 2707 7 023 23 10 33 2707 3465 14 047 47 24 80 3465 4223 5 017 17 29 97 4223 4981 1 003 3 30 100 Total 30 10 100 Tabela 10 Tabela de distribuição de frequências intervalar do peso ao nascer de nascidos vivos em kg 73 Profa Gisele R Moreira Bioestatística Estatística básica Figura 9 Histograma para o peso ao nascer de nascidos vivos em kg Frequência absoluta Fi Classes de valores 0 2 4 6 8 10 12 14 16 1191 1949 1949 2707 2707 3465 3465 4223 4223 4981 74 Profa Gisele R Moreira Bioestatística Estatística básica 73 74 08112021 38 Frequência absoluta Fi Pontos médios das classes 0 2 4 6 8 10 12 14 16 0812 1570 2328 3086 3844 4602 5360 Figura 10 Polígono de frequência para o peso ao nascer de nascidos vivos em kg 75 Profa Gisele R Moreira Bioestatística Estatística básica 0 2 4 6 8 10 12 14 16 0812 1570 2328 3086 3844 4602 5360 Classes c 0758 Ponto médio 1191 1949 1570 1949 2707 2328 2707 3465 3086 3465 4223 3844 4223 4981 4602 𝑃𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 ത𝑋𝑖 𝐿𝑠 𝐿𝑖 2 1570 0758 4602 0758 76 Profa Gisele R Moreira Bioestatística Estatística básica 75 76 08112021 39 Figura 11 Histograma e polígono de frequência para o peso ao nascer de nascidos vivos em kg Frequência absoluta Fi Classes de valores 0 2 4 6 8 10 12 14 16 1191 1949 1949 2707 2707 3465 3465 4223 4223 4981 Histograma Polígono de frequência 77 Profa Gisele R Moreira Bioestatística Estatística básica EXERCÍCIO Figura 12 Variação de anticorpos para a doença X em relação a uma corte populacional específica área endêmica ENADE 2010 Biomedicina 78 Profa Gisele R Moreira Bioestatística Estatística básica 77 78 08112021 40 A B C D E Resposta B 79 Profa Gisele R Moreira Bioestatística Estatística básica EXERCÍCIO Tabela 11 Altura cm de 40 alunos do curso de Estatística da UFES dados hipotéticos Classes Fi Fri Fpi Fci Fci 150 158 7 018 18 7 18 158 166 5 012 12 12 30 166 174 10 025 25 22 55 174 182 12 031 31 34 86 182 190 5 012 12 39 98 190 198 1 002 2 40 100 Total 40 100 100 Fazer o histograma e o polígono de frequência a partir das frequências relativas percentuais 80 Profa Gisele R Moreira Bioestatística Estatística básica 79 80 08112021 41 E S T A T Í S T I C A D E S C R I T I V A E n s i n o a p r e n d i z a g e m r e m o t o e E m e r g e n c i a l E A R T E PA RT E 2 M E D I D A S D E P O S I Ç Ã O O U T E N D Ê N C I A C E N T R A L 82 Representar o ponto central de um conjunto de dados média mediana e moda Estabelecer em torno de que valores representativos os dados se distribuem Dividir o conjunto de dados em partes iguais separatrizes mediana Objetivos Profa Gisele R Moreira Bioestatística Estatística básica 81 82 08112021 42 83 Média aritmética Soma das observações dividida pelo número delas Em que é cada valor da variável n é o número de elementos amostrais i X n X X X X n X X n n i i 3 2 1 1 Profa Gisele R Moreira Bioestatística Estatística básica 84 kg n X X n i i 2 987 30 4 600 1720 1570 1 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 83 84 08112021 43 85 Figura 13 Distribuição dos pesos em kg de bebês nascidos vivos em torno da média aritmética 2 987 X Frequência absoluta Peso ao nascer 0 1 2 3 1570 2070 2570 3070 3570 4070 4570 Profa Gisele R Moreira Bioestatística Estatística básica 86 Multiplicandose ou dividindose todos os valores de uma variável por uma constante a média do conjunto fica multiplicada ou dividida por esta constante Somandose ou subtraindose uma constante a todos os valores de uma variável a média do conjunto fica acrescida ou diminuída dessa constante 1 Propriedades da média Profa Gisele R Moreira Bioestatística Estatística básica 85 86 08112021 44 87 Vantagens Facilidade de interpretação e cálculo Tem potencial de uso para propósitos de inferências Desvantagens É afetada por valores extremos Só pode ser usada para variáveis quantitativas 2 Vantagens e desvantagens Profa Gisele R Moreira Bioestatística Estatística básica 88 Mediana É o valor que ocupa a posição central da série de dados quando estes são colocados em ordem crescente ou decrescente i X Profa Gisele R Moreira Bioestatística Estatística básica 87 88 08112021 45 2 1 n X 2 2 2 2 n n X X Md Se n for PAR Se n for ÍMPAR 89 O B T E N Ç Ã O D A M E D I A N A Profa Gisele R Moreira Bioestatística Estatística básica 90 2 2 2 16 15 2 30 2 2 30 2 2 2 X X X X X X Md n n kg Md 2 925 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 𝑀𝑑 2900 2950 2 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Profa Gisele R Moreira Bioestatística Estatística básica 89 90 08112021 46 91 Multiplicandose ou dividindose todos os valores de uma variável por uma constante a mediana do conjunto fica multiplicada ou dividida por esta constante Somandose ou subtraindose uma constante a todos os valores de uma variável a mediana do conjunto fica acrescida ou diminuída dessa constante 1 Propriedades da mediana Profa Gisele R Moreira Bioestatística Estatística básica 92 Vantagens Não é afetada por valores extremos Pode ser obtida para variáveis quantitativas e qualitativas ordinais com n ímpar Pode ser obtida em amostras em que alguns valores ainda não foram registrados 2 Vantagens e desvantagem da mediana Profa Gisele R Moreira Bioestatística Estatística básica 91 92 08112021 47 93 Desvantagem Menos informativa que a média pois só considera as posições das observações e não todos os valores 2 Vantagens e desvantagem da mediana Profa Gisele R Moreira Bioestatística Estatística básica 94 Moda É o resultado que ocorre com maior frequência numa série de dados Classificações das distribuições Amodal o conjunto de dados não possui moda Unimodal o conjunto de dados possui uma moda Bimodal o conjunto de dados possui duas modas Multimodal o conjunto de dados possui mais de duas modas Profa Gisele R Moreira Bioestatística Estatística básica 93 94 08112021 48 R E P R E S E N T A Ç Õ E S G R Á F I C A S P A R A D I S T R I B U I Ç Õ E S D E A C O R D O C O M A M O D A 95 Profa Gisele R Moreira Bioestatística Estatística básica Unimodal 96 kg Mo 3 400 Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Profa Gisele R Moreira Bioestatística Estatística básica 95 96 08112021 49 1 Propriedades da moda Se somarmos ou subtrairmos um valor constante a cada um dos elementos de uma série a moda ficará somada ou subtraída por essa constante Se multiplicarmos ou dividirmos um valor constante a cada um dos elementos de uma série a moda ficará multiplicada ou dividida por essa constante Profa Gisele R Moreira Bioestatística Estatística básica 97 98 Vantagens Rápida obtenção como medida de posição Pode ser obtida para variáveis quantitativas e qualitativas nominais e ordinais Desvantagem Menos informativa que a média pois só considera as frequências das observações e não todos os valores 2 Vantagens e desvantagem da moda 97 98 08112021 50 99 EXERCÍCIO 1 Classe fenotípica Frequência absoluta Fi AL 7 AR 3 VL 3 VR 1 Calcule média aritmética e a moda classifique Tabela 14 Distribuição de frequências absolutas para a variável cor e textura da semente de ervilha referente à análise da geração F2 do cruzamento de uma planta de ervilha com sementes amarelas e lisas AL com outras verdes e rugosas VR Profa Gisele R Moreira Bioestatística Estatística básica 100 Em um experimento o número de carrapatos observados em cada um dos animais de um grupo foram os seguintes 19 7 4 9 7 17 13 10 17 15 11 15 15 20 19 EXERCÍCIO 2 Profa Gisele R Moreira Bioestatística Estatística básica Após terem sido calculadas a média aritmética a mediana e a moda um erro foi descoberto um dos animais com 15 carrapatos tinha na realidade 17 É correto afirmar que nessa situação apenas a média aritmética se altera após a correção dos dados Justifique 99 100 08112021 51 101 EXERCÍCIO 1 resposta 14 1 3 3 7 14 14 1 VR VL AR AL X X i i Média aritmética Moda A classe que possui maior frequência é AL Fi 7 Assim Mo AL Unimodal Como a variável é qualitativa nominal não tem como calcular a média pois não tem como proceder o cálculo Profa Gisele R Moreira Bioestatística Estatística básica Medidas de dispersão Amplitude total Desvio médio Variância Desvio padrão Coeficiente de variação Erro padrão da média 102 Profa Gisele R Moreira Bioestatística Estatística básica 101 102 08112021 52 M E D I D A S D E D I S P E R S Ã O O U V A R I A B I L I D A D E Quantificar a dispersão dos dados em torno do ponto central Caracterizar e diferenciar a dispersão espacial dos dados Objetivos Profa Gisele R Moreira Bioestatística Estatística básica 103 X1 X A n 104 Em que Xn e X1 são respectivamente o último e o primeiro valor nos dados ordenados Profa Gisele R Moreira Bioestatística Estatística básica Amplitude total É a diferença entre a observação de maior valor e aquela de menor valor 103 104 08112021 53 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 𝐴 𝑋𝑛 𝑋1 4600 1570 303𝑘𝑔 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 105 1 Propriedades da amplitude Se somarmos ou subtrairmos um valor constante a cada um dos elementos de uma série a amplitude não se alterará Se multiplicarmos ou dividirmos um valor constante a cada um dos elementos de uma série a amplitude ficará multiplicada ou dividida por essa constante Profa Gisele R Moreira Bioestatística Estatística básica 106 105 106 08112021 54 Vantagem Rápida obtenção como medida de dispersão Profa Gisele R Moreira Bioestatística Estatística básica 2 Vantagem e desvantagens da amplitude 107 Desvantagens Pouco informativa como medida de dispersão pois uma vez que depende apenas dos valores extremos não identifica possíveis variações entre esses limites Fornece uma subestimativa da amplitude populacional já que dificilmente a amostra vai apresentar tanto o valor mais baixo quanto o mais alto geralmente os mais raros da população Profa Gisele R Moreira Bioestatística Estatística básica 108 107 108 08112021 55 n X X n i i X 1 ˆ Profa Gisele R Moreira Bioestatística Estatística básica Desvio médio É a média dos desvios absolutos em relação à média ou mediana da amostra 109 Suponha que tenham sido encontrados os seguintes valores de uma variável qualquer em cm 208 203 202 200 198 197 192 200cm aritmética Média Em que Xi valores ou dados observados m média no conjunto de dados ei desvios em relação a média xi m ei Profa Gisele R Moreira Bioestatística Estatística básica 110 109 110 08112021 56 203 208 198 200 202 192 197 200 X e1 8 e2 3 e3 2 e4 0 e5 2 e6 3 e7 8 mˆ eˆ X i i Obtenção dos desvios ei 0 ˆ 7 1 i ie 0 1 X X n i i Profa Gisele R Moreira Bioestatística Estatística básica 111 n X X n i i X 1 ˆ 0 1 X X n i i Módulo da soma dos desvios Número de elementos na amostra Se Então o desvio médio é Profa Gisele R Moreira Bioestatística Estatística básica 112 111 112 08112021 57 𝜎 ሜ𝑋 σ𝑖1 𝑛 𝑋𝑖 ሜ𝑋 𝑛 σ𝑖1 30 𝑋𝑖 2987 30 𝜎 ሜ𝑋 1570 2987 1720 2987 4600 2987 30 533 30 0564𝑘𝑔 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 113 1 Propriedades do desvio médio Se somarmos ou subtrairmos um valor constante a cada um dos elementos de uma série o desvio médio não se alterará Se multiplicarmos ou dividirmos um valor constante a cada um dos elementos de uma série o desvio médio ficará multiplicado ou dividido por essa constante Profa Gisele R Moreira Bioestatística Estatística básica 114 113 114 08112021 58 1 ˆ 1 2 2 n X X n i i Profa Gisele R Moreira Bioestatística Estatística básica Variância amostral É a média dos quadrados das diferenças dos valores em relação à média quadrado médio OBS Se a variância for obtida para dados coletados na população o denominador será N e não n 1 115 1 ˆ 1 2 2 n X X n i i VARIÂNCIA 𝑆𝑂𝑀𝐴 𝐷𝐸 𝑄𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝑂𝑆 𝐷𝐸𝑆𝑉𝐼𝑂𝑆 𝐺𝑅𝐴𝑈𝑆 𝐷𝐸 𝐿𝐼𝐵𝐸𝑅𝐷𝐴𝐷𝐸 0 1 X X n i i Se Então a variância amostral é Profa Gisele R Moreira Bioestatística Estatística básica 116 115 116 08112021 59 1 ˆ 1 2 2 n X X n i i 1 ˆ 1 1 2 2 2 n n X X n i n i i i Profa Gisele R Moreira Bioestatística Estatística básica 117 2 2 2 2 2 2 30 1 30 1 2 2 1 1 2 2 2 0 516 29 30 4 600 1 720 1570 4 600 1 720 1570 ˆ 1 30 30 1 ˆ kg X X n n X X i i i i n i n i i i 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 118 117 118 08112021 60 1 Propriedades da variância Profa Gisele R Moreira Bioestatística Estatística básica Multiplicandose todos os valores de uma variável por uma constante a variância fica multiplicada pelo quadrado da constante Somandose ou subtraindose uma constante a todos os valores de uma variável a variância não se altera 119 2 Vantagem e desvantagem da variância Profa Gisele R Moreira Bioestatística Estatística básica Vantagem É a medida mais usada em interferência estatística Desvantagem Não tem interpretação prática para quantificar a dispersão dos dados em torno da média uma vez que o resultado fica em unidade quadrática 120 119 120 08112021 61 2ˆ ˆ Tem a vantagem em relação à variância de estar na mesma unidade dos dados originais Profa Gisele R Moreira Bioestatística Estatística básica Desvio padrão amostral É a raiz quadrática da variância 121 2 2 0 516 ˆ Variância kg kg kg 0 719 0 516 ˆ Desvio padrão 2 2 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 122 121 122 08112021 62 Figura 14 Dispersão em termos de desvio padrão dos pesos de nascidos vivos em torno da média aritmética 0 719 2 987 ˆ X ˆ 2 268 X ˆ 3 706 X Frequência absoluta Peso ao nascer kg 0 1 2 3 1570 2070 2570 3070 3570 4070 4570 Profa Gisele R Moreira Bioestatística Estatística básica 123 Interpretação do desvio padrão A maioria dos valores dos pesos dos bebês nascidos vivos estão concentrados entre 2268 e 3706 kg 0 719 2 987 ˆ X 3 706 ˆ 2 268 X De fato 333 dos valores 1570 1720 1900 2100 2250 3720 3800 4100 4200 e 4600 estão fora dos limites desse intervalo Profa Gisele R Moreira Bioestatística Estatística básica 124 123 124 08112021 63 1 Propriedades do desvio padrão Profa Gisele R Moreira Bioestatística Estatística básica Multiplicandose todos os valores de uma variável por uma constante o desvio padrão fica multiplicado pela constante Somandose ou subtraindose uma constante a todos os valores de uma variável o desvio padrão não se altera 125 2 Vantagens e desvantagem do desvio padrão Profa Gisele R Moreira Bioestatística Estatística básica Vantagens Está na mesma unidade de medida dos dados originais Tem fácil interpretação como medida de dispersão Por ser obtido a partir da variância é muito usado na inferência estatística 126 125 126 08112021 64 2 Vantagem e desvantagem do desvio padrão Profa Gisele R Moreira Bioestatística Estatística básica Desvantagem É necessário obter anteriormente a variância para que seja obtido o desvio padrão Geralmente é um pouco superior à média dos desvios em absoluto desvio médio 127 ˆ 100 X CV Em que X ˆ Desvio padrão amostral Média amostral CV Profa Gisele R Moreira Bioestatística Estatística básica Coeficiente de variação É a medida de variabilidade RELATIVA ao valor médio do conjunto de dados 128 127 128 08112021 65 2407 2 987 100 0 719 CV kg X kg 987 2 0 719 ˆ Sejam Quanto menor o CV maior a concentração dos dados em torno do valor central e maior homogeneidade 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 129 Medida adimensional Compara a variabilidade de conjuntos de dados com diferentes unidades de medida Compara conjuntos de dados com mesma unidade mas com médias de diferentes magnitudes Profa Gisele R Moreira Bioestatística Estatística básica 2 Vantagens do coeficiente de variação 130 129 130 08112021 66 Temse uma amostra de 4 sementes de uma espécie E dados fictícios no qual se obtém os dados para a espessura do endosperma milímetros e peso em gramas EXEMPLO Espessura do endosperma Peso 2 4 5 3 0012 0021 0018 0016 ሜ𝑋 35𝑚𝑚 𝜎 129𝑚𝑚 Variável Espessura X Variável Peso Y ሜ𝑌 002𝑔 𝜎 0004𝑔 OBS Endosperma é tecido nutritivo que envolve o embrião em certos tipos de plantas 131 𝐶𝑉𝑋 129 35 100 𝐶𝑉𝑋 37 𝐶𝑉𝑌 004 002 100 𝐶𝑉𝑌 225 A espessura do endosperma possui MAIOR variabilidade que o peso das sementes pois possui maior CV Então é a variável MAIS HETEROGÊNEA ሜ𝑋 35𝑚𝑚 𝜎 129𝑚𝑚 Variável Espessura X Variável Peso Y ሜ𝑌 002𝑔 𝜎 0004𝑔 Profa Gisele R Moreira Bioestatística Estatística básica 132 131 132 08112021 67 n X ˆ ˆ É um estimador da precisão da estimativa de uma média populacionall Profa Gisele R Moreira Bioestatística Estatística básica Erro padrão da média Medida de dispersão das médias amostrais em torno da média populacional Ou seja é o desvio padrão da distribuição amostral de uma estatística 133 kg n X 131 0 30 0 719 ˆ ˆ Quanto menor o valor do erro padrão da média mais provável será a chance de se obter a média amostral nas proximidades da média populacional 30 0 719 ˆ n kg Sejam 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 Profa Gisele R Moreira Bioestatística Estatística básica 134 133 134 08112021 68 Algumas observações sobre as medidas de dispersão Quanto maior a dispersão dos dados maiores são a amplitude o desvio médio a variância o desvio padrão e o coeficiente de variação Quanto maior a concentração dos dados em torno do valor central menores são a amplitude o desvio médio a variância o desvio padrão e o coeficiente de variação Se os valores forem todos iguais a amplitude o desvio médio a variância o desvio padrão e o coeficiente de variação serão iguais a zero Não existe estimativas negativas de amplitude desvio médio variância desvio padrão e erro padrão da média É possível valor negativo e acima de 100 para o coeficiente de variação Profa Gisele R Moreira Bioestatística Estatística básica 135 CONCURSO PÚBLICO Prefeitura de Aracajú SE 2004 2ª edição Cargo Técnico de Vigilância em Saúde Área BiologiaQuestão 66 Banca Centro de Seleção e de Promoção de Eventos UnB CESPE Nível Superior Um agricultor precisa decidir entre duas variedades de milho Amos possuem espigas de cumprimento uniforme A análise do comprimento de 100 espigas revelou que a variedade A apresenta as seguintes características média 1875 desvio padrão 045 e erro padrão da média 005 e a variedade B apresenta as seguintes características média 1889 desvio padrão 140 e erro padrão da média 025 Acerca da situaçãoproblema dos itens acima julgue os itens que se seguem em Certo C ou Errado E 1 Embora a variedade B produza em média espigas ligeiramente maiores as espigas da variedade A têm uma variância menor 2 As médias de diferentes amostras refletem sua dispersão Resposta 1 C 2 E Profa Gisele R Moreira Bioestatística Estatística básica 136 135 136 08112021 69 Os dados abaixo foram extraídos do site do ministério da Saúde https covidsaúdegovbr bem no início da pandemia e referemse ao número de óbitos por semana epidemiológica Profa Gisele R Moreira Bioestatística Estatística básica 137 Obtenha a Média mediana e moda b Amplitude total c Desvio médio d Variância e Desvio padrão interpreteo f Coeficiente de variação g Erro padrão da média Respostas a 335 9 0 b 96 c 3867 d 20751 e 4555 f 136 g 1860 Estatísticas de distribuição Assimetria Curtose 138 Profa Gisele R Moreira Bioestatística Estatística básica 137 138 08112021 70 Simétrica ou Normal Assimétrica positiva Assimétrica negativa Profa Gisele R Moreira Bioestatística Estatística básica 139 Assimetria É a distribuição da assimetria em torno do ponto central Simétrica Assimétrica positiva Assimétrica negativa Mo Md X Mo Md X X Md Mo POSIÇÃO RELATIVA DA MÉDIA MEDIANA E MODA NUMA DISTRIBUIÇÃO Figura 15 Posição relativa da média mediana e moda numa distribuição Profa Gisele R Moreira Bioestatística Estatística básica 140 139 140 08112021 71 Se As 0 a distrib será Assimétrica Positiva Se As 0 a distrib será Simétrica ou Normal Se As 0 a distrib será Assimétrica Negativa ˆ Mo X As ˆ 3 Md X As COEFICIENTE DE ASSIMETRIA Profa Gisele R Moreira Bioestatística Estatística básica 141 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 kg M M kg X d o 0 719 ˆ 925 2 3 400 987 2 Sejam 0 26 719 0 2 925 2 987 3 ˆ 3 Md X As As 0 Assimetria positiva EXEMPLO Sejam os dados do peso ao nascer de bebês nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 0 574 719 0 3 400 987 2 ˆ 0 M X As As 0 Assimetria negativa Profa Gisele R Moreira Bioestatística Estatística básica 142 141 142 08112021 72 Figura 16 Histograma e polígono de frequência para o peso ao nascer de nascidos vivos em kg Como no conjunto de dados a moda foi maior que a mediana e a média pressupõese que a assimetria seja negativa e não positiva apesar da relação entre a média e a mediana não ter correspondido exatamente ao esperado para esse tipo de assimetria Profa Gisele R Moreira Bioestatística Estatística básica 143 0 5 10 15 20 25 30 35 40 45 50 1191 1949 1949 2707 2707 3465 3465 4223 4223 4981 Frequência relativa Classe Histograma Polígono de frequência Profa Gisele R Moreira Bioestatística Estatística básica 144 Curtose É o grau de achatamento da distribuição Quando a distribuição apresenta uma curva de frequência mais fechada mais aguda em sua parte superior é denominada Leptocúrtica A distribuição de referência Distribuição Normal é denominada Mesocúrtica Quando a distribuição apresenta uma curva de frequência mais aberta mais achatada em sua parte superior é denominada Platicúrtica 143 144 08112021 73 Profa Gisele R Moreira Bioestatística Estatística básica 145 Figura 18 Curvas de distribuição de acordo com a curtose Curtose 30 platicúrtica Curtose 30 mesocúrtica distribuição Normal Curtose 30 leptocúrtica 3 2 1 3 ˆ 3 2 1 1 2 1 4 n n n X X n n n n n Curtose n i i C O E F I C I E N T E D E C U R T O S E Profa Gisele R Moreira Bioestatística Estatística básica 146 145 146 08112021 74 1570 2400 2720 2950 3300 3720 1720 2450 2750 3125 3400 3800 1900 2522 2800 3200 3400 4100 2100 2700 2900 3200 3400 4200 2250 2700 2900 3220 3600 4600 EXEMPLO Sejam os dados do peso ao nascer de nascidos vivos em kg Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 34 kg kg X n 0 719 ˆ 987 2 30 056 0 3 230 30 1 30 3 719 0 987 2 3 230 130 30 1 30 30 3 2 1 3 ˆ 3 2 1 1 2 30 1 4 2 1 4 Curtose X Curtose n n n X X n n n n n Curtose i i n i i Curtose 30 Platicúrtica Sejam Profa Gisele R Moreira Bioestatística Estatística básica 147 Sejam os dados do consumo diário de sal em gramas por dia EXERCÍCIO 6 9 6 8 7 6 4 10 6 8 6 8 a Construa o histograma e o polígono de frequências a partir das frequências relativas e discuta sobre a assimetria da distribuição b Obtenha média moda classifique e mediana c Obtenha a variância e o desvio padrão Interprete o desvio padrão d Calcule o coeficiente de assimetria classifique e compare as posições relativas da média mediana e moda na distribuição e Obtenha a amplitude e o coeficiente de variação Adaptado de VIEIRA S Introdução à estatística Rio de Janeiro Elsevier 2008 pág 82 Profa Gisele R Moreira Bioestatística Estatística básica 148 147 148 08112021 75 52 3 3 1 Li a c k a 0 01 02 03 04 05 06 07 08 25 55 55 85 85 115 Figura 19 Histograma e polígono de frequência para o consumo diário de sal em gramas por dia Classes Frequência relativa Profa Gisele R Moreira Bioestatística Estatística básica 149 56 6 Unimodal 7 Md Mo X b Respostas 65 1 2 73 2 c A maioria dos dados do consumo diário de sal está disperso em torno da média entre 7 165 e 7 165 ou seja 535 865 X Profa Gisele R Moreira Bioestatística Estatística básica 150 149 150 08112021 76 65 1 56 6 7 Md Mo X 0 91 65 1 56 7 3 ˆ 3 0 61 65 1 6 7 ˆ d o M X As M X As d As 0 Assimetria positiva Respostas X Md Logo Mo Profa Gisele R Moreira Bioestatística Estatística básica 151 1 65 7 X e 23 6 7 100 165 100 X CV 6 4 10 1 X X A n Respostas Profa Gisele R Moreira Bioestatística Estatística básica 152 151 152 08112021 77 Profa Gisele R Moreira Bioestatística Estatística básica 153 Literatura recomendada BLAYR R C TAYLOR R A Bioestatística para ciências da saúde São Paulo Pearson Education do Brasil 2013 469p CALLEGARIJACQUES S M Bioestatística princípios e aplicações Porto Alegre Artmed 2003 255p FERREIRA D F Estatística básica Lavras UFLA 2005 664p LEVINE D M et al Estatística teoria e aplicações 6 ed Rio de Janeiro LTC 2012 804p TOLEDO GL OVALLE II Estatística básica 2ed São Paulo Atlas 1982 459p VIEIRA S Introdução à Bioestatística Rio de Janeiro Elsevier 2008 345p 153