·

Administração ·

Métodos Quantitativos Aplicados

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Dicionário definições População conjunto de todos os elementos de interesse em estudo Amostra subconjunto representativo da população que será estudado para tirar conclusões para a população toda Variável toda característica que observada em uma unidade experimental pode variar de uma unidade para outra Parâmetro medida que descreve alguma característica da população Estimador ou estatística medida que descreve alguma característica da amostra População x Amostra etapas de uma análise de dados Para inferir deduzir certas características de uma população pessoas entrevistadas peças repetições de um processo etc devese trabalhar com uma amostra que seja representativa dessa população População Estatística descritiva Consistência dos dados Interpretações iniciais Amostra amostragem sorteio Tratase da organização apresentação e descrição de um conjunto de dados para uma ou mais variáveis Os resumos descritivos podem ser organizados em tabelas apresentados graficamente ou a partir de estimadores ou estatísticas de parâmetros da população Quando o resumo é de 1 variável por vez análise univariada Quando cruzamos 2 variáveis por vez análise bivariada Estatística descritiva estatística ou análise descritiva Gráficos e Tabelas Medidas de posição Medidas de dispersão São valores calculados que tendem a representar melhor a distribuição de um conjunto de dados em um valor central São medidas que indicam a dispersão dos dados em torno de algum valor central Medidas de posição Medidas de dispersão Gráficos e Tabelas Resumos visuais Classificação das variáveis Discreta Ex No defeitos por peça No de filhos Contínua Ex Salário R Peso kg Estatura m Qualitativa Exs Sexo Classe social Qualidade da peça boa ou defeituosa Escolaridade Quantitativa Exs Salário R No defeitos por peça Volume mL Estatura m No filhos Classificar corretamente cada tipo de variável facilita saber quais as técnicas estatísticas mais adequadas para o resumo dos dados Qualitativa as respostas representam diferentes categorias que se distinguem por alguma característica não numérica Quantitativa as respostas consistem em números que representam em geral contagem discretas ou medidas provenientes de alguma mensuração contínuas Exercício Classifique as variáveis do exemplo abaixo De acordo com a Organização Mundial da Saúde o AVC é a 2ª causa de morte no mundo responsável por aproximadamente 11 do total de mortes O conjunto de dados AVC é usado para prever se um paciente tem probabilidade de desenvolver AVC com base em parâmetros de entrada como sexo idade várias doenças e tabagismo Cada linha nos dados fornece informações relevantes sobre o paciente Na planilha AVC do arquivo Aula02xlsx são apresentadas as informações de 5110 pessoas parte do arquivo é apresentado no quadro abaixo id gender age hypertension heartdisease evermarried worktype residencetype avgglucoselevel bmi smokingstatus stroke 9046 Male 67 0 1 Yes Private Urban 22869 366 formerly smoked 1 51676 Female 61 0 0 Yes Selfemployed Rural 20221 NA never smoked 1 31112 Male 80 0 1 Yes Private Rural 10592 325 never smoked 1 60182 Female 49 0 0 Yes Private Urban 17123 344 smokes 1 1665 Female 79 1 0 Yes Selfemployed Rural 17412 24 never smoked 1 hipertensão doença cardíaca e avc 0 não e 1 sim id gender age hypertension heartdisease evermarried worktype residencetype avgglucoselevel bmi smokingstatus stroke 9046 Male 67 0 1 Yes Private Urban 22869 366 formerly smoked 1 51676 Female 61 0 0 Yes Selfemployed Rural 20221 NA never smoked 1 31112 Male 80 0 1 Yes Private Rural 10592 325 never smoked 1 60182 Female 49 0 0 Yes Private Urban 17123 344 smokes 1 1665 Female 79 1 0 Yes Selfemployed Rural 17412 24 never smoked 1 44873 Female 81 0 0 Yes Selfemployed Urban 1252 40 never smoked 0 19723 Female 35 0 0 Yes Selfemployed Rural 8299 306 never smoked 0 37544 Male 51 0 0 Yes Private Rural 16629 256 formerly smoked 0 44679 Female 44 0 0 Yes Govtjob Urban 8528 262 Unknown 0 Classificação das variáveis Não é variável qualitativa qualitativas qualitativa quantitativa contínua quantitativa contínua Classificação das variáveis Qualitativa Exs Sexo Classe social Qualidade da peça boa ou defeituosa Escolaridade Quantitativa Exs Salário R No defeitos por peça Volume mL Estatura m No filhos Para cada tipo de variável existem técnicas estatísticas adequadas para resumir os dados Resumos estatísticos que são mais adequados tabelas com a frequência absoluta de cada categoria tabelas com a frequência relativa de cada categoria construir gráficos de pizza coluna barras Resumos estatísticos que são mais adequados cálculo de medidas de posição ou de localização cálculo de medidas de dispersão ou variabilidade cálculo de medidas da forma dos dados construir gráficos boxplot histograma linha dispersão Exemplo QUALITATIVAS Resumos univariados para Sexo e Classe Social Resumo numérico Resumos gráficos Resumo numérico ou Resumos gráficos Obs Quando a var qualitativa tem 4 ou mais categorias é preferível usar o gráfico de colunas ou barras ou Exemplo QUANTITATIVAS Resumos univariados para Idade e Distância Resumo numérico obs estudaremos esses gráficos histograma e boxplot com mais detalhes na próxima aula Resumos gráficos Exercício De acordo com a Organização Mundial da Saúde o AVC é a 2ª causa de morte no mundo responsável por aproximadamente 11 do total de mortes O conjunto de dados AVC é usado para prever se um paciente tem probabilidade de desenvolver AVC com base em parâmetros de entrada como sexo idade várias doenças e tabagismo Cada linha nos dados fornece informações relevantes sobre o paciente Na planilha AVC do arquivo Aula02xlsx são apresentadas as informações de 5110 pessoas a Calcule os principais resumos univariados para as variáveis analisadas Quais aspectos podem ser observados b Construa resumos gráficos para as variáveis qualitativas Medidas de posição Média da amostra n x x x n x x n n i i 2 1 1 Moda Mo É o valor ou valores de maior frequência na amostra OBS não tão usada na prática É o valor que ocupa a posição central quando os dados estão ordenados Mediana Md 5 4 3 2 1 x n x x x x x menor valor da variável X maior valor da variável X xi valor da iésima observação da variável X n tamanho da amostra 𝑀𝑑 𝑥 𝑛1 2 se n for ímpar 𝑥 𝑛 2 𝑥 𝑛2 2 2 se n for par Estatísticas que tendem a representar melhor a distribuição dos dados de uma variável X em um único valor central Fornecem uma ideia do centro de gravidade dos dados Medidas de dispersão ou variabilidade Variância amostral s2 n x x n n x x s n i i n i i n i i 2 1 1 2 2 1 2 1 1 1 Desvio padrão s O desvio padrão é definido pela raiz quadrada positiva da variância 2s s Coeficiente de variação CV Indica a dispersão de um conjunto de dados em relação à sua média 100 x s CV ou Não existe um consenso mas na prática uma variável com CV superior a 30 ou 40 é considerada como tendo alta variabilidade São medidas que indicam a dispersão dos dados em torno de algum valor central Para pensar Média x Mediana Na planilha bônus do arquivo Aula02xlsx são apresentados quatro cenários A B C e D de valores de bônus de Natal pagos a uma amostra de estagiários Calcule a média e mediana da variável bônus de final de ano de estagiário e compare os resultados dessas duas medidas de posição para cada cenário médiaAxxAxx medAxxAxx Média aritmética dos dados Mediana dos dados Para pensar Variância x Desvio padrão Na planilha bônus do arquivo Aula02xlsx são apresentados quatro cenários A B C e D de valores de bônus de Natal pagos a uma amostra de estagiários Calcule o desvio padrão e o coeficiente de variação e avalie em quais situações a variabilidade dos dados é maior varaAxxAxx desvpadaAxxAxx OBSERVAÇÕES Com as fórmulas acima obtemos a variância e o desvio padrão amostrais de uma variável de interesse O Excel oferece calcular a variância e o desvio padrão populacionais varp e desvpadp respectivamente Na prática não são muito utilizadas Não existe uma fórmula pronta no Excel para calcular o CV Variância da amostra Desvio padrão da amostra Média e Mediana com Distribuição de Frequências Número de defeitos Freqüência 0 13 1 11 2 9 3 8 4 6 5 1 6 2 Quando os dados estão dispostos em uma tabela de frequências com k classes calculase a média amostral pela expressão n f x x k i i i 1 Exercício Uma amostra de 50 peças foi selecionada pelo controle de qualidade de uma empresa A variável X de interesse é o número de defeitos por peça Em média quantos defeitos por peça há nessa amostra defeitos Pense em como calcular a mediana nesse caso Quanto ela vale 7 classes Md defeitos não tem fórmula pronta no Excel Numa tabela de frequências composta de k classes a variância amostral pode ser calculada por k i i k i i i i i k i i n f x x f n n f x x s 1 2 1 2 1 2 2 1 1 1 ou 17 defeitos Variância e DP com uma Distribuição de Frequências não tem fórmula pronta no Excel Número de defeitos Freqüência 0 13 1 11 2 9 3 8 4 6 5 1 6 2 7 classes Exercício Uma amostra de 50 peças foi selecionada pelo controle de qualidade de uma empresa A variável X de interesse é o número de defeitos por peça Quanto vale o desvio padrão de X Rendimento mensal Freqüência 060 070 4 070 080 2 080 090 4 090 100 2 Nesse caso cada xi representa o ponto médio da classe i Quando os dados estão dispostos em uma tabela de frequências com k classes porém com valores agrupados utilizase as mesmas expressões apresentadas nos dois slides anteriores Como calcular a média e a variância da amostra agora 𝑥 0783 𝑠2 0013 2 𝑠0115 Exercício Uma amostra do rendimentos mensais de certa aplicação financeira foi selecionada e os dados foram apresentados consolidados numa tabela de frequência agrupada Quais os valores da média e do desvio padrão do retorno financeiro Calcule Distribuição de Frequências com Dados Agrupados