Texto de pré-visualização
1 ESTATÍSTICA DESCRITIVA 11 POPULAÇÃO E AMOSTRA População é um conjunto de indivíduos que possuem uma ou mais características em comum Pode ser finita ou infinita dependerá do número de elementos que possue ser finito ou infinito Para definir quais indivíduos compõem a população é necessário estar claro qual é o objetivo da pesquisa que será realizada O tamanho de uma população será representado por N Exemplos A Alunos dos cursos de graduação da UFGD B Estudantes de uma escola pública de DouradosMS C Acadêmicos matriculados em uma disciplina D Moradores de uma determinada cidade Amostra é uma parte ou subconjunto finito da população Exemplo Se a população é formada pelos acadêmicos dos cursos de graduação da UFGD uma amostra seria composta pelos acadêmicos do curso de Matemática O tamanho de uma amostra ou tamanho amostral será representado por n Exercício Com base nas populações definidas acima defina um exemplo de amostra de cada caso Sugestões de vídeos sobre definição de população e amostra httpswwwyoutubecomwatchvLVta8opBCWU httpswwwyoutubecomwatchvaTdQ2lGSekfeatureyoutube httpswwwyoutubecomwatchvH7OeNxZvBlIfeatureyoutube 12 TIPOS DE VARIÁVEIS Leia as definições disponíveis em httplegufprbrsilviaCE055node8html 121 Variável é uma característica da população em estudo podendo assumir valores numéricos ou não numéricos 122 TIPOS DE VARIÁVEIS Aula 1 População amostra variáveis e seus tipos Tabelas e Gráficos Professores Alessandra Querino da Silva e Luciano Antonio de Oliveira As variáveis podem ser classificadas como Variáveis qualitativas são aquelas que referemse a categorias ou qualidades Exemplos Grau de instrução Candidato a prefeito de uma cidade cor de olhos estágio da doença gênero masculino ou feminino cor do cabelo cor de um veiculo dentre outros E se dividem em i Variáveis qualitativas ordinais apresentam sentido de ordenação Exemplos Grau de instrução estágio da doença inicial intermediário ou terminal entre outras ii Variáveis qualitativas nominais não apresentam sentido de ordenação Exemplos Candidato a prefeito de uma cidade cor de olhos gênero masculino ou feminino e outros Variáveis quantitativas referemse a contagens ou medições Exemplos número de filhos de um casal número de carros em uma casa temperatura nota na disciplina de Probabilidade e Estatística Altura área circunferência do abdômen de uma pessoa etc E se dividem em i Variáveis quantitativas discretas referemse a contagens e assumem números naturais Exemplos número de filhos de um casal número de carros em uma casa etc ii Variáveis quantitativas contínuas referemse a medições assumindo números reais Exemplos temperatura nota na disciplina de Probabilidade e Estatística Altura área circunferência do abdômen de uma pessoa etc Sugestões de vídeos sobre variáveis httpswwwyoutubecomwatchvfBQVdJRI7XIlistPLN0ZrxDaBfhgc5G2crtZFmU79BQYxUL cmindex19 13 Distribuição de Frequências Frequência Absoluta Frequência Relativa Frequência Percentual Frequência acumulada crescente e decrescente De posse de um conjunto de dados é interessante resummir as informações ali contidas utilizando ferramentas adequadas para apresentalas e descrevêlas de forma eficiente Nesse sentido vamos aprender como utilizar duas poderosas ferramentas para atingir tais objetivos que são as Tabelas e os gráficos de distribuições de frequencias 131 Descrição de dados em tabelas de distribuição de frequencia Inicialmente consideramos um conjunto de dados como apresentado no Quadro 1 Iremos nos referir a esses dados como dados brutos ou seja sem qualquer organização a não a disposição das observações em um qaudro na ordem em que foram coletadas Consideramos primeiramente o caso em que a variável analisada é qualitativa Variável qualitativa Exemplo 1 Quadro1 Atividades exercidas por 20 empresários em Dourados Agricultura Agricultura Comércio Lazer Indústria Comércio Comércio Agricultura Lazer Comércio Comércio Comércio Comércio Agricultura Indústria Comércio Agricultura Agricultura Comércio Comércio Com base no Quadro 1 construimos a Tabela 1 que como podemos ver possuem alguns compnentes Toda tabela deve ter um título associado depois um cabeçalho contendo a variável considerada no caso Atividades No corpo da tabela primeira coluna consideramos os níveis da variável e os componentes fi fri e fpi são as frequencias por isso o nome tabela de distribuição de frequencias que são descritas abaixo Veja que a Tabela apresentada ainda contem uma barra de totais Tabela de distribuição de frequencias para variáveis qualitativas Tabela 1 Atividades econêmicas desenvolvidas por 20 empresários em Dourados Atividades fi fri fpi Agricultura 6 03 30 Comércio 10 05 50 Indústria 2 01 10 Lazer 2 01 10 Total 20 1 100 Componentes da tabela fi ou fa é a frequencia absoluta que é número de valores observado em cada classe fri é a frequencia relativa obtida pela razão entre a frequencia absoluta e o número total de elementos n fi n no conjunto de dados fpi é a frequencia percentual obtida multiplicando a frequencia relativa por 100 Outros componentes e maiores detalhes podem ser consultados no livro Fundamentos de Estatística Sonia Vieira no link abaixo httpbibliotecaUFGDphpisbn9788597019315 Variável quantitativa discreta Exemplo 2 Número de filhos de 30 alunos do curso de engenharia Da mesma forma que no exemplo anterior considerase o Quadro 2 Esses dados poderiam ser organizados em um rol que é o nome dado ao conjunto de dados quando os valos estão dispostos em ordem crescente ou decrescente de magnitude Quadro 2 Número de filhos de uma amostra de 30 alunos do curso de engenharia 1 0 0 0 0 0 0 1 1 0 0 0 2 1 0 0 0 0 2 1 1 0 0 0 1 0 0 0 0 1 A Tabela 2 é obtida ordenando os valores assumidos pela variável no corpo da tabela e obtendo as ferquencias Quando a variável é quantitativa podemos também calcular frequencias acumuladas como Fac Fri e Fpi Tabela 2 Numero de filhos de 30 alunos do curso de engenharia Número de filhos fi fpi Fac Fri Fpi 0 20 67 20 067 67 1 8 27 28 094 94 2 2 6 30 1 100 Total 30 100 Fac Fri e Fpi são respectivamente as frequencias acumuladas absoluta relativa e percentual Para calcular Fac por exemplo devemos registrar a frequencia acumulada em cada classe assim 1ª classe 0 Fac20 2ª classe 1 Fac20828 2ª classe 2 Fac28230 Repare que quando falamos em classes estamos nos referindo aos valores que a variável pode assumir no caso 0 1 2 O cálculo de Fri e Fpi é realizado de forma semelhante ao da Fac Outros componentes e maiores detalhes podem ser consultados no livro Fundamentos de Estatística Sonia Vieira no link httpbibliotecaUFGDphpisbn9788597019315 Variável quantitativa contínua Como uma variável contínua assume qualquer valor em um intervalo de números reais a construção de uma tabela é um processo um pouco mais complexo Vamos construir uma tabela para variável contínua passo a passo no exemplo Exemplo 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Quadro 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Passos para construir uma tabela em que as classes são intervalos 1 Cálculo do número de intervalo de classes Usar a regra de Sturges ou outra regra que possibilite uma análise adequada de acordo com a natureza dos dados Aqui utilizaremos a regra de Sturges como abaixo Identificar o maior e o menor valor coletado 7294 e 5577 7294 6684 6616 6478 6314 6189 6032 5667 7146 6443 6601 6471 6269 6149 6022 5603 7152 6417 6570 6581 6257 6096 6014 5589 7008 6329 6508 6415 6192 6074 5936 5577 Observação 1 O limite superior da primeira classe coincide com o limite inferior da segunda classe Ls157 487 e assim por diante O limite superior da ultima classe é obtido por ls6 li6c712233 43474657 Observação 2 Repare que não utilizamos o menor valor como o limite inferior Fazemos isso para evitar que algum valor fique fora da última classe Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri Fac 54053 57487 4 0125 4 57487 60921 5 0156 9 60921 64355 10 0313 19 64355 67789 9 0281 28 67789 71 223 1 0031 29 71 223 74657 3 0094 32 Total 32 1 Fonte Prefeitura de São Paulo 2015 Obs Essas fórmulas apenas auxiliam na determinação do número de classes e não substituem o uso do bom senso como evitar classe com frequência nula ou frequência relativa exagerada Outros componentes e maiores detalhes podem ser consultados no livro Fundamentos de Estatística Sonia Vieira httpbibliotecaUFGDphpisbn9788597019315 14 Representações Gráficas Gráfico em Barras Colunas e linhas Gráfico em setores Polígonos de Frequências Histograma A representação gráfica é muito utilizada para descrever o comportamento de uma variável e pode ser utilizada como opção à representação tabular Abaixo apresentamos alguns dos principais tipos de gráficos utilizados para variáveis qualitativas ou quantitativas 141 Variável qualitativa Vamos considerar o exemplo da Tabela 1 que cosidera as atividades economicas exercidas por 20 empresários como apresentada novamente abaixo Tabela 1 Atividades econômicas desenvolvidas por 20 empresários em Dourados Atividades fi fri fpi Agricultura 6 03 30 Comércio 10 05 50 Industria 2 01 10 Lazer 2 01 10 Total 20 1 100 Um dos gráficos mais utilizados para representar variáveis qualitativas é o gráfico de barra Figura 1 Repare que na horizontal o eixo não é numérico Nesse eixo as classes ou níveis da variável são dispostas e estão igualmente espaçadas O eixo vertical é numérico e nesse exemplo estamos representando a frequencia absoluta Outras opções seriam considerar no eixo vertical as frequencia relativa ou percentual conforme a conveniência de cada situação Observe que os retângulos possuem bases do mesmo tamanho Gráfico de barras Figura 1 Atividades econômicas desenvolvidas por 20 empresários em Dourados Outro gráfico muito utilizado para variáveis qualitativas é o gráfico de setores como apresentado na Figura 2 Abaixo do gráfico são dados detalhes de como construir e interpretar esse tipo de gráfico Gráfico de setores Figura 2 Atividades econêmicas desenvolvidas por 20 empresários em Dourados Como construir o grafico de setores 6 10 2 2 0 2 4 6 8 10 12 Agricultura Comércio Industria Lazer Trace uma circunferência lembrese que a mesma tem 360 A área do círculo representará o total ou seja 100 Use a regra de três se 100 correspondem a 360 300 Agricultura correspondem a um setor cujo ângulo central x é dado por 360 100 𝑥 30 𝑥 30 360 100 108 e assim por diante até encontar cada um dos setores Outra versão de gráfico de setor é dado na Figura 3 Figura 3 Atividades econêmicas desenvolvidas por 20 empresários em Dourados Observações 1 Existe uma grande quantidade de gráficos que podem ser utilizados para representar uma variável quantitativa demos apenas dois exemplos 2 Observe que gráficos a exemplo de tabelas possuem alguns componentes como as legendas que são importantes Outro aspecto importante ao utilizar gráfico como ferramentas descritivas é o título Em trabalhos acadêmicos ou artigos científicos são seguidas algumas normas dependendo das instituições de ensino ou de periódicos científicos É comum que os títulos dos gráficos diferentemente das Tabelas sejam apresentados abaixo da Figura e com numeração mas isso não é um consenso Consideraremos agora gráficos para variáveis quantitativas que como veremos são diferente daqueles apresentados para variáveis qualitativas Além disso existem diferenças também entre as representações gráficas para variáveis discretas e variáveis contínuas como veremos a seguir 142 Variável quantitativa i Variável quantitativa discreta Vamos utilizar o mesmo exemplo Tabela 2 abordado para a representação tabular Tabela 2 Numero de filhos de 30 alunos do curso de engenharia Número de filhos fi fpi Fac Fri Fpi 0 20 67 20 067 67 1 8 27 28 094 94 2 2 6 30 1 100 Total 30 100 Existem vários tipos de gráficos para representar o comportamento de uma variável quantitativa discreta sendo que o gráfico de bastões ou linha é um dos mais populares Uma diferença marcante entre gráficos para variáveis qualitativas e quantitativas é que para variáveis quantitativas o primeiro eixo eixo das abcissas é numérico No caso de variáveis discretas o primeiro eixo representa o conjunto dos números naturais Abaixo está a representação gráfica gráfico de bastões da Tabela 2 Repare que no eixo das ordenadas foram registradas as frequências percentuais alternativamente poderiam ser registradas as frequências absolutas ou relativas Gráfico de bastões Figura 3 Número de filhos de 30 estudantes da engenharia Outro exemplo de gráfico para variáveis discretas é o diagrama de pontos como representado na Figura 4 Diagrama de pontos O diagrama de pontos é recomendado para os casos em que os dados são poucos menos do que 25 Se o número de dados for grande você poderá fazer um diagrama de pontos em que cada ponto represente um conjunto específico de observações por exemplo 10 Isso deve ser indicado em uma nota Figura 4 Número de filhos de 30 estudantes da engenharia iii Variável quantitativa contínua Uma das principais formas de representar variáveis contínuas é o Histograma Para fazer um histograma quando os intervalos de classe são iguais siga os passos Trace o sistema de eixos cartesianos Marque os extremos de classes no eixo das abscissas No eixo das ordenadas escreva as frequências ou as frequências relativas Para cada classe da distribuição de frequências trace um retângulo com base igual ao intervalo de classe e altura igual à frequência ou à frequência relativa da classe Coloque título e fonte se houver Vamos construir o histograma da variável ruído em áreas residenciais de São Paulo Para tanto consideraremos novamente o exemplo da Tabela 3 Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri Fac 54053 57487 4 0125 4 57487 60921 5 0156 9 60921 64355 10 0313 19 64355 67789 9 0281 28 67789 71 223 1 0031 29 71 223 74657 3 0094 32 Total 32 1 Fonte Prefeitura de São Paulo 2015 Histograma Figura 5 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Observações i Repare que para representar o comportamento de uma variável contínua por meio de um histograma basta dispor os intervalos classes da tabela consecutivamente no primeiro eixo e as frequências no segundo ii No eixo das ordenadas podem ser consideradas as frequências absoluta relativa percentual ou densidades Densidades serão tratadas mais adiante Outra representação gráfica comumente utilizada para representar uma variável contínua é o polígono de frequências Para explicar a construção de um polígono de frequências utilizaremos ainda a Tabela 3 Para construir essa representação gráfica precisaremos calcular o ponto médio de cada intervalo ou classes que está disposto na última coluna da tabela abaixo Polígono de frequências Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri pmi 54053 57487 4 0125 55770 57487 60921 5 0156 59204 60921 64355 10 0313 62638 64355 67789 9 0281 66072 67789 71 223 1 0031 69506 71 223 74657 3 0094 72940 Total 32 1 Fonte Prefeitura de São Paulo 2015 Passos para desenhar o polígono de frequências Trace o sistema de eixos cartesianos Marque os pontos centrais de cada classe no eixo das abscissas No eixo das ordenadas coloque as frequências Faça um ponto para representar cada classe ponto médiopmi Esses pontos terão abscissa igual ao ponto central de classe A ordenada será igual à frequência da classe Marque no eixo das abscissas um ponto que corresponda ao ponto central de uma classe anterior à primeira Ponto médio da classe anterior li1 c2 No nosso exemplo Ponto médio da classe anterior 54053 34342 52336 Marque também no eixo das abscissas um ponto que corresponda ao ponto central de uma classe posterior à última Ponto médio da classe anterior lsu c2 lsu é o limite superior da última classe No nosso exemplo Ponto médio da classe anterior 74657 34342 76374 Una todos esses pontos por segmentos de reta Coloque um título e está pronto o gráfico Figura 6 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Observações i Anteriormente quando tratávamos de histogramas mencionamos a possibilidade de registrar as densidades das classes sem no entanto definir o que seria densidade Nesse sentido vamos construir um histograma para densidades de classes para exemplificar o método Histograma construído com densidades Para construir esse histograma devemos calcular a densidade da frequencia relativa DE que é dada por 𝑫𝑬 𝑭𝒓𝒆𝒒𝒖𝒆𝒏𝒄𝒊𝒂 𝒓𝒆𝒍𝒂𝒕𝒊𝒗𝒂 𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒇𝒓𝒊 𝒄 e seguir os passos para construção listados anteriormente Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri DE pmi 54053 57487 4 0125 0037 55770 57487 60921 5 0156 0046 59204 60921 64355 10 0313 009 62638 64355 67789 9 0281 0084 66072 67789 71 223 1 0031 0009 69506 71 223 74657 3 0094 0028 72940 Total 32 1 Fonte Prefeitura de São Paulo 2015 Figura 7 Níveis de ruído em db em áreas residenciais da cidade de São Paulo ii Aqui consideramos tabelas e gráficos para variáveis contínuas em que as amplitudes de classes são sempre as mesmas É possível também de forma conveniente considerar amplitudes diferentes o que não abordaremos Maiores informações sobre isso e os demais conteúdos visto nessa apostila podem ser consultados nos materiais abaixo Os links desses materiais estão na nossa sala do moodle livro Fundamentos de Estatística Sonia Vieira Disponível em httpbibliotecaUFGDphpisbn9788597019315 Apostila Estatística LOPES L F D Disponível em httpswwwinfufscbrveracarmoLIVROSLIVROSLuis20Felipe20Dias20Lopespdf Calcular a Amplitude Total A A Valor máximo Valor mínimo 72 94 5577 1717 2 Cálculo da amplitude do intervalo Dividimos a Amplitude Total pelo número de intervalos que desejamos Temos como sugestão o uso de 6 intervalos de classe A razão obtida entre a Amplitude Total e o número de classes k é a Amplitude do Intervalo ou da classe indicada por c c Ak 1 17175 3434 3 Definindo os limites da classe em que li é o limite inferior e ls é o limite inferior Limite inferior da primeira classe li1 li1 mínimo c2 5577 34342 54053 Calculo dos demais limites inferiores li2 li1 c 54053 3434 57487 li3 li2 c 57487 3434 60921 li4 li3 c 60921 3434 64355 li5 li4 c 64355 3434 67789 li6 li5 c 67789 3434 71223 ANÁLISE ESTATÍSTICA DESCRITIVA DE DADOS ORGANIZACIONAIS ESTUDO DE CASO DOS FUNCIONÁRIOS DA EMPRESA MILSA 1 INTRODUÇÃO A estatística descritiva constitui ferramenta fundamental para a compreensão e síntese de conjuntos de dados permitindo a identificação de padrões e características relevantes através de tabelas de frequência e representações gráficas O presente trabalho aplica métodos estatísticos descritivos a dados reais de uma organização demonstrando a utilização adequada de técnicas específicas para cada tipo de variável Objetivo Geral Analisar estatisticamente as características dos funcionários da empresa Milsa através da construção de tabelas de distribuição de frequências completas e gráficos apropriados seguindo os fundamentos teóricos da estatística descritiva Objetivos Específicos Caracterizar o perfil demográfico dos funcionários através de variáveis qualitativas e quantitativas Construir distribuições de frequência completas para diferentes tipos de variáveis Aplicar técnicas gráficas apropriadas para cada tipo de variável Interpretar os resultados estatísticos no contexto organizacional Temas Estudados Este trabalho aborda os seguintes tópicos da estatística descritiva distribuições de frequência absoluta e relativa análise de variáveis qualitativas nominais variáveis quantitativas discretas e contínuas regra de Sturges para agrupamento de dados representações gráficas barras setores bastões histogramas polígonos de frequências e técnicas de análise descritiva 2 METODOLOGIA 21 Fonte dos Dados Os dados utilizados neste estudo foram obtidos do repositório acadêmico da Universidade Federal do Paraná UFPR disponíveis publicamente no endereço eletrônico httpwwwlegufprbrfernandomayerdatamilsacsv Este conjunto de dados foi originalmente apresentado no livro Estatística Básica dos professores Wilton de Oliveira Bussab e Pedro Alberto Morettin constituindo um exemplo clássico na literatura estatística brasileira 22 Caracterização da Amostra População e Amostragem Populaçãoalvo Funcionários de uma empresa fictícia denominada Milsa Tamanho amostral 𝑛 36 funcionários Tipo de amostragem Não probabilística por conveniência dados secundários 23 Variáveis Analisadas As variáveis selecionadas para análise foram classificadas segundo sua natureza estatística 1 Estado Civil Variável qualitativa nominal categorias casado solteiro 2 Número de Filhos Variável quantitativa discreta valores 01235 3 Salário Variável quantitativa contínua valores em reais 24 Tratamento dos Dados Para a variável Número de Filhos foram identificados valores ausentes NA em 16 observações resultando numa amostra efetiva de 𝑛 20 funcionários para esta análise Para as demais variáveis não foram identificados valores ausentes Técnica de Exclusão Utilizada Aplicouse o procedimento de listwise deletion para garantir a consistência das análises excluindose 444 dos registros com valores faltantes na variável número de filhos 3 RESULTADOS E ANÁLISE 31 Análise da Variável Qualitativa Estado Civil Para variáveis qualitativas utilizouse a distribuição de frequências simples calculandose as frequências absoluta 𝑓𝑖 relativa 𝑓𝑟𝑖 e percentual 𝑓𝑝𝑖 Fundamentação Matemática As medidas de frequência foram calculadas segundo as seguintes fórmulas Frequência Relativa 𝑓𝑟𝑖 𝑓𝑖 𝑛 Frequência Percentual 𝑓𝑝𝑖 𝑓𝑟𝑖 100 onde 𝑓𝑖 representa a frequência absoluta da categoria 𝑖 e 𝑛 o tamanho total da amostra Tabela 1 Distribuição de Frequências Estado Civil dos Funcionários Categoria 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑝𝑖 Casado 20 0556 556 Solteiro 16 0444 444 Total 36 1000 1000 Legenda 𝑓𝑖 frequência absoluta 𝑓𝑟𝑖 frequência relativa 𝑓𝑝𝑖 frequência relativa percentual Interpretação dos Resultados Os resultados indicam uma distribuição relativamente equilibrada entre os estados civis com ligeira predominância de funcionários casados 556 em relação aos solteiros 444 A diferença de 112 pontos percentuais sugere uma composição diversificada no quadro de funcionários característica comum em organizações consolidadas 32 Análise da Variável Quantitativa Discreta Número de Filhos Para variáveis quantitativas discretas além das frequências simples calcularamse as frequências acumuladas 𝐹𝑎𝑐 𝐹𝑟𝑖𝑎𝑐𝑢𝑚 𝐹𝑝𝑖𝑎𝑐𝑢𝑚 fundamentais para análises de distribuição cumulativa Fundamentação Matemática As medidas acumuladas foram calculadas segundo as seguintes fórmulas Frequência Absoluta Acumulada 𝐹𝑎𝑐𝑖 𝑓𝑗 𝑖 𝑗1 Frequência Relativa Acumulada 𝐹𝑟𝑖𝑎𝑐𝑢𝑚𝑖 𝐹𝑎𝑐𝑖 𝑛 Frequência Percentual Acumulada 𝐹𝑝𝑖𝑎𝑐𝑢𝑚𝑖 𝐹𝑟𝑖𝑎𝑐𝑢𝑚𝑖 100 Tabela 2 Distribuição de Frequências Número de Filhos dos Funcionários Número de Filhos 𝑓𝑖 𝑓𝑝𝑖 𝐹𝑎𝑐 𝐹𝑟𝑖𝑎𝑐𝑢𝑚 𝐹𝑝𝑖𝑎𝑐𝑢𝑚 0 4 200 4 0200 200 1 5 250 9 0450 450 2 7 350 16 0800 800 3 3 150 19 0950 950 5 1 50 20 1000 1000 Total 20 1000 Legenda 𝑓𝑖 frequência absoluta 𝑓𝑝𝑖 frequência percentual 𝐹𝑎𝑐 frequência absoluta acumulada 𝐹𝑟𝑖𝑎𝑐𝑢𝑚 frequência relativa acumulada 𝐹𝑝𝑖𝑎𝑐𝑢𝑚 frequência percentual acumulada Fonte Elaboração própria com base nos dados da empresa Milsa 2024 Nota Amostra efetiva de 𝑛 20 funcionários excluídos valores ausentes Análise Descritiva A análise revela que 350 dos funcionários possuem 2 filhos constituindo a moda da distribuição Observase que 800 dos funcionários têm até 2 filhos indicando um perfil predominante de famílias pequenas A ausência de funcionários com 4 filhos e a presença de apenas um caso com 5 filhos 50 sugerem uma distribuição concentrada nos valores menores característica de populações urbanas modernas 33 Análise da Variável Quantitativa Contínua Salários Para variáveis quantitativas contínuas aplicouse o agrupamento em classes de intervalos utilizando a Regra de Sturges para determinação do número de classes Procedimento Metodológico para Construção das Classes 1 Cálculo do número de classes 𝑘 pela Regra de Sturges 𝑘 1 3322 log10𝑛 𝑘 1 3322 log1036 1 3322 1556 617 6 classes 2 Cálculo da amplitude total 𝐴 𝐴 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 2330 400 1930 3 Cálculo da amplitude da classe 𝑐 𝑐 𝐴 𝑘 1930 6 322 4 Determinação dos limites das classes o Limite inferior da primeira classe 𝑙𝑖1 𝑥𝑚𝑖𝑛 𝑐 2 400 161 239 o Demais limites 𝑙𝑖𝑖1 𝑙𝑖𝑖 𝑐 5 Cálculo da densidade de frequência 𝐷𝐸𝑖 𝑓𝑟𝑖 𝑐 6 Cálculo do ponto médio do intervalo 𝑃𝑀𝐼𝑖 𝑙𝑖𝑖 𝑙𝑠𝑖 2 onde 𝑙𝑖𝑖 e 𝑙𝑠𝑖 representam os limites inferior e superior da classe 𝑖 respectivamente Tabela 3 Distribuição de Frequências por Classes Salários dos Funcionários Classes Salariais R 𝑃𝑀𝐼𝑖 𝑓𝑖 𝑓𝑟𝑖 𝐹𝑎𝑐 𝐷𝐸 239 561 400 3 0083 3 00259 561 882 722 10 0278 13 00864 882 1204 1043 10 0278 23 00864 1204 1526 1365 6 0167 29 00518 1526 1848 1687 4 0111 33 00345 1848 2169 2008 2 0056 35 00173 Total 36 1000 Legenda 𝑃𝑀𝐼𝑖 Ponto Médio do Intervalo da classe 𝑖 𝑓𝑖 frequência absoluta 𝑓𝑟𝑖 frequência relativa 𝐹𝑎𝑐 frequência absoluta acumulada 𝐷𝐸 Densidade de Frequência Parâmetros Estatísticos da Distribuição Número de classes 𝑘 6 Amplitude total 𝐴 R 1930 Amplitude da classe 𝑐 R 322 Salário médio estimado 𝑥 R 1112 Salário mediano estimado 𝑥 R 947 Análise das Classes Modais A distribuição salarial apresenta característica bimodal com concentração nas segunda e terceira classes R 561 882 e R 882 1204 que agregam conjuntamente 556 dos funcionários Esta concentração indica uma estrutura salarial típica de organizações com predominância de cargos operacionais e técnicos A assimetria positiva evidenciada pela cauda à direita indica a presença de salários elevados em menor frequência padrão característico de estruturas hierárquicas organizacionais onde poucos ocupam posições de alta remuneração 4 DISCUSSÃO DOS RESULTADOS 41 Perfil Demográfico Organizacional A análise do estado civil revela uma composição equilibrada com discreta predominância de funcionários casados 556 Este perfil demográfico pode influenciar políticas organizacionais relacionadas a benefícios familiares programas de qualidade de vida e estratégias de retenção de talentos 42 Estrutura Familiar dos Funcionários O padrão observado no número de filhos indica predominância de famílias pequenas com 800 dos funcionários tendo até dois filhos Esta característica sugere um perfil demográfico alinhado às tendências nacionais de redução da taxa de fecundidade típico de populações urbanas escolarizadas A concentração modal em dois filhos 350 reflete o padrão familiar brasileiro contemporâneo enquanto a baixa incidência de famílias numerosas 50 com cinco filhos confirma a transição demográfica observada no país 43 Análise da Estrutura Salarial A distribuição salarial evidencia uma estrutura com amplitude significativa R 1930 sugerindo diferentes níveis hierárquicos ou especializações funcionais A concentração na faixa intermediária R 561 a R 1204 indica uma base sólida de funcionários em posições operacionais e técnicas A presença de apenas 167 dos funcionários nas faixas salariais superiores acima de R 1526 é característica de organizações com estrutura piramidal onde posições de maior remuneração são limitadas 5 CONCLUSÕES Este estudo demonstrou a aplicação sistemática de técnicas de estatística descritiva a dados organizacionais reais evidenciando a importância da escolha adequada de métodos conforme o tipo de variável analisada Principais Descobertas Estatísticas 1 Distribuição demográfica equilibrada entre estados civis com ligeira predominância de casados 556 2 Perfil de famílias pequenas com 800 dos funcionários tendo até dois filhos 3 Estrutura salarial concentrada com 556 dos funcionários nas faixas intermediárias 4 Aplicação bemsucedida da Regra de Sturges para agrupamento de dados contínuos em 𝑘 6 classes 51 Contribuições Metodológicas A pesquisa demonstrou a eficácia da aplicação de diferentes técnicas estatísticas conforme a natureza das variáveis Variáveis qualitativas Distribuições de frequência simples com representações em barras e setores Variáveis quantitativas discretas Frequências acumuladas com gráficos de bastões e diagramas de pontos Variáveis quantitativas contínuas Agrupamento em classes com histogramas e polígonos de frequências 52 Limitações do Estudo Utilização de dados secundários sem controle sobre o processo de coleta Presença significativa de valores ausentes na variável número de filhos 444 dos casos Natureza transversal dos dados impedindo análises de tendências temporais Limitação a três variáveis não contemplando outras dimensões organizacionais relevantes 53 Recomendações para Estudos Futuros Para pesquisas posteriores recomendase Coleta de dados primários com protocolo estruturado de amostragem Ampliação da amostra para maior representatividade estatística Inclusão de variáveis socioeconômicas e ocupacionais adicionais Implementação de estudos longitudinais para análise de tendências temporais Aplicação de técnicas de estatística inferencial para testes de hipóteses Considerações Finais A análise estatística descritiva revelouse ferramenta valiosa para compreensão do perfil organizacional fornecendo subsídios quantitativos para tomada de decisões gerenciais Os padrões identificados contribuem para o desenvolvimento de políticas de recursos humanos baseadas em evidências empíricas 6 REFERÊNCIAS BIBLIOGRÁFICAS BUSSAB W O MORETTIN P A Estatística básica 9 ed São Paulo Saraiva 2017 MILSA Dataset Dados dos Funcionários da Empresa Milsa Universidade Federal do Paraná Disponível em httpwwwlegufprbrfernandomayerdatamilsacsv Acesso em 18 set 2024 ANÁLISE ESTATÍSTICA DESCRITIVA DE DADOS ORGANIZACIONAIS ESTUDO DE CASO DOS FUNCIONÁRIOS DA EMPRESA MILSA 1 INTRODUÇÃO A estatística descritiva constitui ferramenta fundamental para a compreensão e síntese de conjuntos de dados permitindo a identificação de padrões e características relevantes através de tabelas de frequência e representações gráficas O presente trabalho aplica métodos estatísticos descritivos a dados reais de uma organização demonstrando a utilização adequada de técnicas específicas para cada tipo de variável Objetivo Geral Analisar estatisticamente as características dos funcionários da empresa Milsa através da construção de tabelas de distribuição de frequências completas e gráficos apropriados seguindo os fundamentos teóricos da estatística descritiva Objetivos Específicos Caracterizar o perfil demográfico dos funcionários através de variáveis qualitativas e quantitativas Construir distribuições de frequência completas para diferentes tipos de variáveis Aplicar técnicas gráficas apropriadas para cada tipo de variável Interpretar os resultados estatísticos no contexto organizacional Temas Estudados Este trabalho aborda os seguintes tópicos da estatística descritiva distribuições de frequência absoluta e relativa análise de variáveis qualitativas nominais variáveis quantitativas discretas e contínuas regra de Sturges para agrupamento de dados representações gráficas barras setores bastões histogramas polígonos de frequências e técnicas de análise descritiva 2 METODOLOGIA 21 Fonte dos Dados Os dados utilizados neste estudo foram obtidos do repositório acadêmico da Universidade Federal do Paraná UFPR disponíveis publicamente no endereço eletrônico httpwwwlegufprbrfernandomayerdatamilsacsv Este conjunto de dados foi originalmente apresentado no livro Estatística Básica dos professores Wilton de Oliveira Bussab e Pedro Alberto Morettin constituindo um exemplo clássico na literatura estatística brasileira 22 Caracterização da Amostra População e Amostragem Populaçãoalvo Funcionários de uma empresa fictícia denominada Milsa Tamanho amostral n36 funcionários Tipo de amostragem Não probabilística por conveniência dados secundários 23 Variáveis Analisadas As variáveis selecionadas para análise foram classificadas segundo sua natureza estatística 1 Estado Civil Variável qualitativa nominal categorias casado solteiro 2 Número de Filhos Variável quantitativa discreta valores 01235 3 Salário Variável quantitativa contínua valores em reais 24 Tratamento dos Dados Para a variável Número de Filhos foram identificados valores ausentes NA em 16 observações resultando numa amostra efetiva de n20 funcionários para esta análise Para as demais variáveis não foram identificados valores ausentes Técnica de Exclusão Utilizada Aplicouse o procedimento de listwise deletion para garantir a consistência das análises excluindose 44 4 dos registros com valores faltantes na variável número de filhos 3 RESULTADOS E ANÁLISE 31 Análise da Variável Qualitativa Estado Civil Para variáveis qualitativas utilizouse a distribuição de frequências simples calculandose as frequências absoluta f i relativa f ri e percentual f pi Fundamentação Matemática As medidas de frequência foram calculadas segundo as seguintes fórmulas Frequência Relativa f rif i n Frequência Percentual f pif ri100 onde f i representa a frequência absoluta da categoria i e n o tamanho total da amostra Tabela 1 Distribuição de Frequências Estado Civil dos Funcionários Categori a f i f ri f pi Casado 20 0556 556 Solteiro 16 0444 44 4 Total 3 6 100 0 1000 Legenda f i frequência absoluta f ri frequência relativa f pi frequência relativa percentual Interpretação dos Resultados Os resultados indicam uma distribuição relativamente equilibrada entre os estados civis com ligeira predominância de funcionários casados 556 em relação aos solteiros 44 4 A diferença de 112 pontos percentuais sugere uma composição diversificada no quadro de funcionários característica comum em organizações consolidadas 32 Análise da Variável Quantitativa Discreta Número de Filhos Para variáveis quantitativas discretas além das frequências simples calcularamse as frequências acumuladas Fac Fri acum F pi acum fundamentais para análises de distribuição cumulativa Fundamentação Matemática As medidas acumuladas foram calculadas segundo as seguintes fórmulas Frequência Absoluta Acumulada Fac i j1 i f j Frequência Relativa Acumulada Fri acumi Fac i n Frequência Percentual Acumulada F pi acumiFri acum i100 Tabela 2 Distribuição de Frequências Número de Filhos dos Funcionários Número de Filhos f i f pi Fac Fri acum F pi acum 0 4 200 4 0200 200 1 5 250 9 0450 45 0 2 7 350 16 0800 800 3 3 150 19 0950 950 5 1 50 20 1000 1000 Total 20 1000 Legenda f i frequência absoluta f pi frequência percentual Fac frequência absoluta acumulada Fri acum frequência relativa acumulada F pi acum frequência percentual acumulada Fonte Elaboração própria com base nos dados da empresa Milsa 2024 Nota Amostra efetiva de n20 funcionários excluídos valores ausentes Análise Descritiva A análise revela que 350 dos funcionários possuem 2 filhos constituindo a moda da distribuição Observase que 800 dos funcionários têm até 2 filhos indicando um perfil predominante de famílias pequenas A ausência de funcionários com 4 filhos e a presença de apenas um caso com 5 filhos 50 sugerem uma distribuição concentrada nos valores menores característica de populações urbanas modernas 33 Análise da Variável Quantitativa Contínua Salários Para variáveis quantitativas contínuas aplicouse o agrupamento em classes de intervalos utilizando a Regra de Sturges para determinação do número de classes Procedimento Metodológico para Construção das Classes 1 Cálculo do número de classes k pela Regra de Sturges k13322log10n k13322log1036 1332215566176 classes 2 Cálculo da amplitude total A Axmaxxmin23304001930 3 Cálculo da amplitude da classe c c A k 1930 6 322 4 Determinação dos limites das classes o Limite inferior da primeira classe l i1xminc 24 00161239 o Demais limites l ii1liic 5 Cálculo da densidade de frequência D Eif ri c 6 Cálculo do ponto médio do intervalo PM I iliil si 2 onde l ii e l si representam os limites inferior e superior da classe i respectivamente Tabela 3 Distribuição de Frequências por Classes Salários dos Funcionários Classes Salariais R PM I i f i f ri Fac DE 239561 4 00 3 0083 3 00259 561882 722 10 0278 13 00864 8821204 1043 10 0278 23 00864 12041526 1365 6 0167 29 00518 15261848 1687 4 0111 33 00345 18482169 2008 2 0056 35 00173 Total 36 1000 Legenda PM I i Ponto Médio do Intervalo da classe i f i frequência absoluta f ri frequência relativa Fac frequência absoluta acumulada DE Densidade de Frequência Parâmetros Estatísticos da Distribuição Número de classes k6 Amplitude total AR1930 Amplitude da classe cR322 Salário médio estimado xR1112 Salário mediano estimado xR947 Análise das Classes Modais A distribuição salarial apresenta característica bimodal com concentração nas segunda e terceira classes R 561882 e R 8821204 que agregam conjuntamente 556 dos funcionários Esta concentração indica uma estrutura salarial típica de organizações com predominância de cargos operacionais e técnicos A assimetria positiva evidenciada pela cauda à direita indica a presença de salários elevados em menor frequência padrão característico de estruturas hierárquicas organizacionais onde poucos ocupam posições de alta remuneração 4 DISCUSSÃO DOS RESULTADOS 41 Perfil Demográfico Organizacional A análise do estado civil revela uma composição equilibrada com discreta predominância de funcionários casados 556 Este perfil demográfico pode influenciar políticas organizacionais relacionadas a benefícios familiares programas de qualidade de vida e estratégias de retenção de talentos 42 Estrutura Familiar dos Funcionários O padrão observado no número de filhos indica predominância de famílias pequenas com 800 dos funcionários tendo até dois filhos Esta característica sugere um perfil demográfico alinhado às tendências nacionais de redução da taxa de fecundidade típico de populações urbanas escolarizadas A concentração modal em dois filhos 350 reflete o padrão familiar brasileiro contemporâneo enquanto a baixa incidência de famílias numerosas 50 com cinco filhos confirma a transição demográfica observada no país 43 Análise da Estrutura Salarial A distribuição salarial evidencia uma estrutura com amplitude significativa R 1930 sugerindo diferentes níveis hierárquicos ou especializações funcionais A concentração na faixa intermediária R 561 a R 1204 indica uma base sólida de funcionários em posições operacionais e técnicas A presença de apenas 167 dos funcionários nas faixas salariais superiores acima de R 1526 é característica de organizações com estrutura piramidal onde posições de maior remuneração são limitadas 5 CONCLUSÕES Este estudo demonstrou a aplicação sistemática de técnicas de estatística descritiva a dados organizacionais reais evidenciando a importância da escolha adequada de métodos conforme o tipo de variável analisada Principais Descobertas Estatísticas 1 Distribuição demográfica equilibrada entre estados civis com ligeira predominância de casados 556 2 Perfil de famílias pequenas com 800 dos funcionários tendo até dois filhos 3 Estrutura salarial concentrada com 556 dos funcionários nas faixas intermediárias 4 Aplicação bemsucedida da Regra de Sturges para agrupamento de dados contínuos em k6 classes 51 Contribuições Metodológicas A pesquisa demonstrou a eficácia da aplicação de diferentes técnicas estatísticas conforme a natureza das variáveis Variáveis qualitativas Distribuições de frequência simples com representações em barras e setores Variáveis quantitativas discretas Frequências acumuladas com gráficos de bastões e diagramas de pontos Variáveis quantitativas contínuas Agrupamento em classes com histogramas e polígonos de frequências 52 Limitações do Estudo Utilização de dados secundários sem controle sobre o processo de coleta Presença significativa de valores ausentes na variável número de filhos 44 4 dos casos Natureza transversal dos dados impedindo análises de tendências temporais Limitação a três variáveis não contemplando outras dimensões organizacionais relevantes 53 Recomendações para Estudos Futuros Para pesquisas posteriores recomendase Coleta de dados primários com protocolo estruturado de amostragem Ampliação da amostra para maior representatividade estatística Inclusão de variáveis socioeconômicas e ocupacionais adicionais Implementação de estudos longitudinais para análise de tendências temporais Aplicação de técnicas de estatística inferencial para testes de hipóteses Considerações Finais A análise estatística descritiva revelouse ferramenta valiosa para compreensão do perfil organizacional fornecendo subsídios quantitativos para tomada de decisões gerenciais Os padrões identificados contribuem para o desenvolvimento de políticas de recursos humanos baseadas em evidências empíricas 6 REFERÊNCIAS BIBLIOGRÁFICAS BUSSAB W O MORETTIN P A Estatística básica 9 ed São Paulo Saraiva 2017 MILSA Dataset Dados dos Funcionários da Empresa Milsa Universidade Federal do Paraná Disponível em httpwwwlegufprbrfernandomayerdatamilsacsv Acesso em 18 set 2024
Texto de pré-visualização
1 ESTATÍSTICA DESCRITIVA 11 POPULAÇÃO E AMOSTRA População é um conjunto de indivíduos que possuem uma ou mais características em comum Pode ser finita ou infinita dependerá do número de elementos que possue ser finito ou infinito Para definir quais indivíduos compõem a população é necessário estar claro qual é o objetivo da pesquisa que será realizada O tamanho de uma população será representado por N Exemplos A Alunos dos cursos de graduação da UFGD B Estudantes de uma escola pública de DouradosMS C Acadêmicos matriculados em uma disciplina D Moradores de uma determinada cidade Amostra é uma parte ou subconjunto finito da população Exemplo Se a população é formada pelos acadêmicos dos cursos de graduação da UFGD uma amostra seria composta pelos acadêmicos do curso de Matemática O tamanho de uma amostra ou tamanho amostral será representado por n Exercício Com base nas populações definidas acima defina um exemplo de amostra de cada caso Sugestões de vídeos sobre definição de população e amostra httpswwwyoutubecomwatchvLVta8opBCWU httpswwwyoutubecomwatchvaTdQ2lGSekfeatureyoutube httpswwwyoutubecomwatchvH7OeNxZvBlIfeatureyoutube 12 TIPOS DE VARIÁVEIS Leia as definições disponíveis em httplegufprbrsilviaCE055node8html 121 Variável é uma característica da população em estudo podendo assumir valores numéricos ou não numéricos 122 TIPOS DE VARIÁVEIS Aula 1 População amostra variáveis e seus tipos Tabelas e Gráficos Professores Alessandra Querino da Silva e Luciano Antonio de Oliveira As variáveis podem ser classificadas como Variáveis qualitativas são aquelas que referemse a categorias ou qualidades Exemplos Grau de instrução Candidato a prefeito de uma cidade cor de olhos estágio da doença gênero masculino ou feminino cor do cabelo cor de um veiculo dentre outros E se dividem em i Variáveis qualitativas ordinais apresentam sentido de ordenação Exemplos Grau de instrução estágio da doença inicial intermediário ou terminal entre outras ii Variáveis qualitativas nominais não apresentam sentido de ordenação Exemplos Candidato a prefeito de uma cidade cor de olhos gênero masculino ou feminino e outros Variáveis quantitativas referemse a contagens ou medições Exemplos número de filhos de um casal número de carros em uma casa temperatura nota na disciplina de Probabilidade e Estatística Altura área circunferência do abdômen de uma pessoa etc E se dividem em i Variáveis quantitativas discretas referemse a contagens e assumem números naturais Exemplos número de filhos de um casal número de carros em uma casa etc ii Variáveis quantitativas contínuas referemse a medições assumindo números reais Exemplos temperatura nota na disciplina de Probabilidade e Estatística Altura área circunferência do abdômen de uma pessoa etc Sugestões de vídeos sobre variáveis httpswwwyoutubecomwatchvfBQVdJRI7XIlistPLN0ZrxDaBfhgc5G2crtZFmU79BQYxUL cmindex19 13 Distribuição de Frequências Frequência Absoluta Frequência Relativa Frequência Percentual Frequência acumulada crescente e decrescente De posse de um conjunto de dados é interessante resummir as informações ali contidas utilizando ferramentas adequadas para apresentalas e descrevêlas de forma eficiente Nesse sentido vamos aprender como utilizar duas poderosas ferramentas para atingir tais objetivos que são as Tabelas e os gráficos de distribuições de frequencias 131 Descrição de dados em tabelas de distribuição de frequencia Inicialmente consideramos um conjunto de dados como apresentado no Quadro 1 Iremos nos referir a esses dados como dados brutos ou seja sem qualquer organização a não a disposição das observações em um qaudro na ordem em que foram coletadas Consideramos primeiramente o caso em que a variável analisada é qualitativa Variável qualitativa Exemplo 1 Quadro1 Atividades exercidas por 20 empresários em Dourados Agricultura Agricultura Comércio Lazer Indústria Comércio Comércio Agricultura Lazer Comércio Comércio Comércio Comércio Agricultura Indústria Comércio Agricultura Agricultura Comércio Comércio Com base no Quadro 1 construimos a Tabela 1 que como podemos ver possuem alguns compnentes Toda tabela deve ter um título associado depois um cabeçalho contendo a variável considerada no caso Atividades No corpo da tabela primeira coluna consideramos os níveis da variável e os componentes fi fri e fpi são as frequencias por isso o nome tabela de distribuição de frequencias que são descritas abaixo Veja que a Tabela apresentada ainda contem uma barra de totais Tabela de distribuição de frequencias para variáveis qualitativas Tabela 1 Atividades econêmicas desenvolvidas por 20 empresários em Dourados Atividades fi fri fpi Agricultura 6 03 30 Comércio 10 05 50 Indústria 2 01 10 Lazer 2 01 10 Total 20 1 100 Componentes da tabela fi ou fa é a frequencia absoluta que é número de valores observado em cada classe fri é a frequencia relativa obtida pela razão entre a frequencia absoluta e o número total de elementos n fi n no conjunto de dados fpi é a frequencia percentual obtida multiplicando a frequencia relativa por 100 Outros componentes e maiores detalhes podem ser consultados no livro Fundamentos de Estatística Sonia Vieira no link abaixo httpbibliotecaUFGDphpisbn9788597019315 Variável quantitativa discreta Exemplo 2 Número de filhos de 30 alunos do curso de engenharia Da mesma forma que no exemplo anterior considerase o Quadro 2 Esses dados poderiam ser organizados em um rol que é o nome dado ao conjunto de dados quando os valos estão dispostos em ordem crescente ou decrescente de magnitude Quadro 2 Número de filhos de uma amostra de 30 alunos do curso de engenharia 1 0 0 0 0 0 0 1 1 0 0 0 2 1 0 0 0 0 2 1 1 0 0 0 1 0 0 0 0 1 A Tabela 2 é obtida ordenando os valores assumidos pela variável no corpo da tabela e obtendo as ferquencias Quando a variável é quantitativa podemos também calcular frequencias acumuladas como Fac Fri e Fpi Tabela 2 Numero de filhos de 30 alunos do curso de engenharia Número de filhos fi fpi Fac Fri Fpi 0 20 67 20 067 67 1 8 27 28 094 94 2 2 6 30 1 100 Total 30 100 Fac Fri e Fpi são respectivamente as frequencias acumuladas absoluta relativa e percentual Para calcular Fac por exemplo devemos registrar a frequencia acumulada em cada classe assim 1ª classe 0 Fac20 2ª classe 1 Fac20828 2ª classe 2 Fac28230 Repare que quando falamos em classes estamos nos referindo aos valores que a variável pode assumir no caso 0 1 2 O cálculo de Fri e Fpi é realizado de forma semelhante ao da Fac Outros componentes e maiores detalhes podem ser consultados no livro Fundamentos de Estatística Sonia Vieira no link httpbibliotecaUFGDphpisbn9788597019315 Variável quantitativa contínua Como uma variável contínua assume qualquer valor em um intervalo de números reais a construção de uma tabela é um processo um pouco mais complexo Vamos construir uma tabela para variável contínua passo a passo no exemplo Exemplo 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Quadro 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Passos para construir uma tabela em que as classes são intervalos 1 Cálculo do número de intervalo de classes Usar a regra de Sturges ou outra regra que possibilite uma análise adequada de acordo com a natureza dos dados Aqui utilizaremos a regra de Sturges como abaixo Identificar o maior e o menor valor coletado 7294 e 5577 7294 6684 6616 6478 6314 6189 6032 5667 7146 6443 6601 6471 6269 6149 6022 5603 7152 6417 6570 6581 6257 6096 6014 5589 7008 6329 6508 6415 6192 6074 5936 5577 Observação 1 O limite superior da primeira classe coincide com o limite inferior da segunda classe Ls157 487 e assim por diante O limite superior da ultima classe é obtido por ls6 li6c712233 43474657 Observação 2 Repare que não utilizamos o menor valor como o limite inferior Fazemos isso para evitar que algum valor fique fora da última classe Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri Fac 54053 57487 4 0125 4 57487 60921 5 0156 9 60921 64355 10 0313 19 64355 67789 9 0281 28 67789 71 223 1 0031 29 71 223 74657 3 0094 32 Total 32 1 Fonte Prefeitura de São Paulo 2015 Obs Essas fórmulas apenas auxiliam na determinação do número de classes e não substituem o uso do bom senso como evitar classe com frequência nula ou frequência relativa exagerada Outros componentes e maiores detalhes podem ser consultados no livro Fundamentos de Estatística Sonia Vieira httpbibliotecaUFGDphpisbn9788597019315 14 Representações Gráficas Gráfico em Barras Colunas e linhas Gráfico em setores Polígonos de Frequências Histograma A representação gráfica é muito utilizada para descrever o comportamento de uma variável e pode ser utilizada como opção à representação tabular Abaixo apresentamos alguns dos principais tipos de gráficos utilizados para variáveis qualitativas ou quantitativas 141 Variável qualitativa Vamos considerar o exemplo da Tabela 1 que cosidera as atividades economicas exercidas por 20 empresários como apresentada novamente abaixo Tabela 1 Atividades econômicas desenvolvidas por 20 empresários em Dourados Atividades fi fri fpi Agricultura 6 03 30 Comércio 10 05 50 Industria 2 01 10 Lazer 2 01 10 Total 20 1 100 Um dos gráficos mais utilizados para representar variáveis qualitativas é o gráfico de barra Figura 1 Repare que na horizontal o eixo não é numérico Nesse eixo as classes ou níveis da variável são dispostas e estão igualmente espaçadas O eixo vertical é numérico e nesse exemplo estamos representando a frequencia absoluta Outras opções seriam considerar no eixo vertical as frequencia relativa ou percentual conforme a conveniência de cada situação Observe que os retângulos possuem bases do mesmo tamanho Gráfico de barras Figura 1 Atividades econômicas desenvolvidas por 20 empresários em Dourados Outro gráfico muito utilizado para variáveis qualitativas é o gráfico de setores como apresentado na Figura 2 Abaixo do gráfico são dados detalhes de como construir e interpretar esse tipo de gráfico Gráfico de setores Figura 2 Atividades econêmicas desenvolvidas por 20 empresários em Dourados Como construir o grafico de setores 6 10 2 2 0 2 4 6 8 10 12 Agricultura Comércio Industria Lazer Trace uma circunferência lembrese que a mesma tem 360 A área do círculo representará o total ou seja 100 Use a regra de três se 100 correspondem a 360 300 Agricultura correspondem a um setor cujo ângulo central x é dado por 360 100 𝑥 30 𝑥 30 360 100 108 e assim por diante até encontar cada um dos setores Outra versão de gráfico de setor é dado na Figura 3 Figura 3 Atividades econêmicas desenvolvidas por 20 empresários em Dourados Observações 1 Existe uma grande quantidade de gráficos que podem ser utilizados para representar uma variável quantitativa demos apenas dois exemplos 2 Observe que gráficos a exemplo de tabelas possuem alguns componentes como as legendas que são importantes Outro aspecto importante ao utilizar gráfico como ferramentas descritivas é o título Em trabalhos acadêmicos ou artigos científicos são seguidas algumas normas dependendo das instituições de ensino ou de periódicos científicos É comum que os títulos dos gráficos diferentemente das Tabelas sejam apresentados abaixo da Figura e com numeração mas isso não é um consenso Consideraremos agora gráficos para variáveis quantitativas que como veremos são diferente daqueles apresentados para variáveis qualitativas Além disso existem diferenças também entre as representações gráficas para variáveis discretas e variáveis contínuas como veremos a seguir 142 Variável quantitativa i Variável quantitativa discreta Vamos utilizar o mesmo exemplo Tabela 2 abordado para a representação tabular Tabela 2 Numero de filhos de 30 alunos do curso de engenharia Número de filhos fi fpi Fac Fri Fpi 0 20 67 20 067 67 1 8 27 28 094 94 2 2 6 30 1 100 Total 30 100 Existem vários tipos de gráficos para representar o comportamento de uma variável quantitativa discreta sendo que o gráfico de bastões ou linha é um dos mais populares Uma diferença marcante entre gráficos para variáveis qualitativas e quantitativas é que para variáveis quantitativas o primeiro eixo eixo das abcissas é numérico No caso de variáveis discretas o primeiro eixo representa o conjunto dos números naturais Abaixo está a representação gráfica gráfico de bastões da Tabela 2 Repare que no eixo das ordenadas foram registradas as frequências percentuais alternativamente poderiam ser registradas as frequências absolutas ou relativas Gráfico de bastões Figura 3 Número de filhos de 30 estudantes da engenharia Outro exemplo de gráfico para variáveis discretas é o diagrama de pontos como representado na Figura 4 Diagrama de pontos O diagrama de pontos é recomendado para os casos em que os dados são poucos menos do que 25 Se o número de dados for grande você poderá fazer um diagrama de pontos em que cada ponto represente um conjunto específico de observações por exemplo 10 Isso deve ser indicado em uma nota Figura 4 Número de filhos de 30 estudantes da engenharia iii Variável quantitativa contínua Uma das principais formas de representar variáveis contínuas é o Histograma Para fazer um histograma quando os intervalos de classe são iguais siga os passos Trace o sistema de eixos cartesianos Marque os extremos de classes no eixo das abscissas No eixo das ordenadas escreva as frequências ou as frequências relativas Para cada classe da distribuição de frequências trace um retângulo com base igual ao intervalo de classe e altura igual à frequência ou à frequência relativa da classe Coloque título e fonte se houver Vamos construir o histograma da variável ruído em áreas residenciais de São Paulo Para tanto consideraremos novamente o exemplo da Tabela 3 Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri Fac 54053 57487 4 0125 4 57487 60921 5 0156 9 60921 64355 10 0313 19 64355 67789 9 0281 28 67789 71 223 1 0031 29 71 223 74657 3 0094 32 Total 32 1 Fonte Prefeitura de São Paulo 2015 Histograma Figura 5 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Observações i Repare que para representar o comportamento de uma variável contínua por meio de um histograma basta dispor os intervalos classes da tabela consecutivamente no primeiro eixo e as frequências no segundo ii No eixo das ordenadas podem ser consideradas as frequências absoluta relativa percentual ou densidades Densidades serão tratadas mais adiante Outra representação gráfica comumente utilizada para representar uma variável contínua é o polígono de frequências Para explicar a construção de um polígono de frequências utilizaremos ainda a Tabela 3 Para construir essa representação gráfica precisaremos calcular o ponto médio de cada intervalo ou classes que está disposto na última coluna da tabela abaixo Polígono de frequências Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri pmi 54053 57487 4 0125 55770 57487 60921 5 0156 59204 60921 64355 10 0313 62638 64355 67789 9 0281 66072 67789 71 223 1 0031 69506 71 223 74657 3 0094 72940 Total 32 1 Fonte Prefeitura de São Paulo 2015 Passos para desenhar o polígono de frequências Trace o sistema de eixos cartesianos Marque os pontos centrais de cada classe no eixo das abscissas No eixo das ordenadas coloque as frequências Faça um ponto para representar cada classe ponto médiopmi Esses pontos terão abscissa igual ao ponto central de classe A ordenada será igual à frequência da classe Marque no eixo das abscissas um ponto que corresponda ao ponto central de uma classe anterior à primeira Ponto médio da classe anterior li1 c2 No nosso exemplo Ponto médio da classe anterior 54053 34342 52336 Marque também no eixo das abscissas um ponto que corresponda ao ponto central de uma classe posterior à última Ponto médio da classe anterior lsu c2 lsu é o limite superior da última classe No nosso exemplo Ponto médio da classe anterior 74657 34342 76374 Una todos esses pontos por segmentos de reta Coloque um título e está pronto o gráfico Figura 6 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Observações i Anteriormente quando tratávamos de histogramas mencionamos a possibilidade de registrar as densidades das classes sem no entanto definir o que seria densidade Nesse sentido vamos construir um histograma para densidades de classes para exemplificar o método Histograma construído com densidades Para construir esse histograma devemos calcular a densidade da frequencia relativa DE que é dada por 𝑫𝑬 𝑭𝒓𝒆𝒒𝒖𝒆𝒏𝒄𝒊𝒂 𝒓𝒆𝒍𝒂𝒕𝒊𝒗𝒂 𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 𝒇𝒓𝒊 𝒄 e seguir os passos para construção listados anteriormente Tabela 3 Níveis de ruído em db em áreas residenciais da cidade de São Paulo Níveis de ruído db fi fri DE pmi 54053 57487 4 0125 0037 55770 57487 60921 5 0156 0046 59204 60921 64355 10 0313 009 62638 64355 67789 9 0281 0084 66072 67789 71 223 1 0031 0009 69506 71 223 74657 3 0094 0028 72940 Total 32 1 Fonte Prefeitura de São Paulo 2015 Figura 7 Níveis de ruído em db em áreas residenciais da cidade de São Paulo ii Aqui consideramos tabelas e gráficos para variáveis contínuas em que as amplitudes de classes são sempre as mesmas É possível também de forma conveniente considerar amplitudes diferentes o que não abordaremos Maiores informações sobre isso e os demais conteúdos visto nessa apostila podem ser consultados nos materiais abaixo Os links desses materiais estão na nossa sala do moodle livro Fundamentos de Estatística Sonia Vieira Disponível em httpbibliotecaUFGDphpisbn9788597019315 Apostila Estatística LOPES L F D Disponível em httpswwwinfufscbrveracarmoLIVROSLIVROSLuis20Felipe20Dias20Lopespdf Calcular a Amplitude Total A A Valor máximo Valor mínimo 72 94 5577 1717 2 Cálculo da amplitude do intervalo Dividimos a Amplitude Total pelo número de intervalos que desejamos Temos como sugestão o uso de 6 intervalos de classe A razão obtida entre a Amplitude Total e o número de classes k é a Amplitude do Intervalo ou da classe indicada por c c Ak 1 17175 3434 3 Definindo os limites da classe em que li é o limite inferior e ls é o limite inferior Limite inferior da primeira classe li1 li1 mínimo c2 5577 34342 54053 Calculo dos demais limites inferiores li2 li1 c 54053 3434 57487 li3 li2 c 57487 3434 60921 li4 li3 c 60921 3434 64355 li5 li4 c 64355 3434 67789 li6 li5 c 67789 3434 71223 ANÁLISE ESTATÍSTICA DESCRITIVA DE DADOS ORGANIZACIONAIS ESTUDO DE CASO DOS FUNCIONÁRIOS DA EMPRESA MILSA 1 INTRODUÇÃO A estatística descritiva constitui ferramenta fundamental para a compreensão e síntese de conjuntos de dados permitindo a identificação de padrões e características relevantes através de tabelas de frequência e representações gráficas O presente trabalho aplica métodos estatísticos descritivos a dados reais de uma organização demonstrando a utilização adequada de técnicas específicas para cada tipo de variável Objetivo Geral Analisar estatisticamente as características dos funcionários da empresa Milsa através da construção de tabelas de distribuição de frequências completas e gráficos apropriados seguindo os fundamentos teóricos da estatística descritiva Objetivos Específicos Caracterizar o perfil demográfico dos funcionários através de variáveis qualitativas e quantitativas Construir distribuições de frequência completas para diferentes tipos de variáveis Aplicar técnicas gráficas apropriadas para cada tipo de variável Interpretar os resultados estatísticos no contexto organizacional Temas Estudados Este trabalho aborda os seguintes tópicos da estatística descritiva distribuições de frequência absoluta e relativa análise de variáveis qualitativas nominais variáveis quantitativas discretas e contínuas regra de Sturges para agrupamento de dados representações gráficas barras setores bastões histogramas polígonos de frequências e técnicas de análise descritiva 2 METODOLOGIA 21 Fonte dos Dados Os dados utilizados neste estudo foram obtidos do repositório acadêmico da Universidade Federal do Paraná UFPR disponíveis publicamente no endereço eletrônico httpwwwlegufprbrfernandomayerdatamilsacsv Este conjunto de dados foi originalmente apresentado no livro Estatística Básica dos professores Wilton de Oliveira Bussab e Pedro Alberto Morettin constituindo um exemplo clássico na literatura estatística brasileira 22 Caracterização da Amostra População e Amostragem Populaçãoalvo Funcionários de uma empresa fictícia denominada Milsa Tamanho amostral 𝑛 36 funcionários Tipo de amostragem Não probabilística por conveniência dados secundários 23 Variáveis Analisadas As variáveis selecionadas para análise foram classificadas segundo sua natureza estatística 1 Estado Civil Variável qualitativa nominal categorias casado solteiro 2 Número de Filhos Variável quantitativa discreta valores 01235 3 Salário Variável quantitativa contínua valores em reais 24 Tratamento dos Dados Para a variável Número de Filhos foram identificados valores ausentes NA em 16 observações resultando numa amostra efetiva de 𝑛 20 funcionários para esta análise Para as demais variáveis não foram identificados valores ausentes Técnica de Exclusão Utilizada Aplicouse o procedimento de listwise deletion para garantir a consistência das análises excluindose 444 dos registros com valores faltantes na variável número de filhos 3 RESULTADOS E ANÁLISE 31 Análise da Variável Qualitativa Estado Civil Para variáveis qualitativas utilizouse a distribuição de frequências simples calculandose as frequências absoluta 𝑓𝑖 relativa 𝑓𝑟𝑖 e percentual 𝑓𝑝𝑖 Fundamentação Matemática As medidas de frequência foram calculadas segundo as seguintes fórmulas Frequência Relativa 𝑓𝑟𝑖 𝑓𝑖 𝑛 Frequência Percentual 𝑓𝑝𝑖 𝑓𝑟𝑖 100 onde 𝑓𝑖 representa a frequência absoluta da categoria 𝑖 e 𝑛 o tamanho total da amostra Tabela 1 Distribuição de Frequências Estado Civil dos Funcionários Categoria 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑝𝑖 Casado 20 0556 556 Solteiro 16 0444 444 Total 36 1000 1000 Legenda 𝑓𝑖 frequência absoluta 𝑓𝑟𝑖 frequência relativa 𝑓𝑝𝑖 frequência relativa percentual Interpretação dos Resultados Os resultados indicam uma distribuição relativamente equilibrada entre os estados civis com ligeira predominância de funcionários casados 556 em relação aos solteiros 444 A diferença de 112 pontos percentuais sugere uma composição diversificada no quadro de funcionários característica comum em organizações consolidadas 32 Análise da Variável Quantitativa Discreta Número de Filhos Para variáveis quantitativas discretas além das frequências simples calcularamse as frequências acumuladas 𝐹𝑎𝑐 𝐹𝑟𝑖𝑎𝑐𝑢𝑚 𝐹𝑝𝑖𝑎𝑐𝑢𝑚 fundamentais para análises de distribuição cumulativa Fundamentação Matemática As medidas acumuladas foram calculadas segundo as seguintes fórmulas Frequência Absoluta Acumulada 𝐹𝑎𝑐𝑖 𝑓𝑗 𝑖 𝑗1 Frequência Relativa Acumulada 𝐹𝑟𝑖𝑎𝑐𝑢𝑚𝑖 𝐹𝑎𝑐𝑖 𝑛 Frequência Percentual Acumulada 𝐹𝑝𝑖𝑎𝑐𝑢𝑚𝑖 𝐹𝑟𝑖𝑎𝑐𝑢𝑚𝑖 100 Tabela 2 Distribuição de Frequências Número de Filhos dos Funcionários Número de Filhos 𝑓𝑖 𝑓𝑝𝑖 𝐹𝑎𝑐 𝐹𝑟𝑖𝑎𝑐𝑢𝑚 𝐹𝑝𝑖𝑎𝑐𝑢𝑚 0 4 200 4 0200 200 1 5 250 9 0450 450 2 7 350 16 0800 800 3 3 150 19 0950 950 5 1 50 20 1000 1000 Total 20 1000 Legenda 𝑓𝑖 frequência absoluta 𝑓𝑝𝑖 frequência percentual 𝐹𝑎𝑐 frequência absoluta acumulada 𝐹𝑟𝑖𝑎𝑐𝑢𝑚 frequência relativa acumulada 𝐹𝑝𝑖𝑎𝑐𝑢𝑚 frequência percentual acumulada Fonte Elaboração própria com base nos dados da empresa Milsa 2024 Nota Amostra efetiva de 𝑛 20 funcionários excluídos valores ausentes Análise Descritiva A análise revela que 350 dos funcionários possuem 2 filhos constituindo a moda da distribuição Observase que 800 dos funcionários têm até 2 filhos indicando um perfil predominante de famílias pequenas A ausência de funcionários com 4 filhos e a presença de apenas um caso com 5 filhos 50 sugerem uma distribuição concentrada nos valores menores característica de populações urbanas modernas 33 Análise da Variável Quantitativa Contínua Salários Para variáveis quantitativas contínuas aplicouse o agrupamento em classes de intervalos utilizando a Regra de Sturges para determinação do número de classes Procedimento Metodológico para Construção das Classes 1 Cálculo do número de classes 𝑘 pela Regra de Sturges 𝑘 1 3322 log10𝑛 𝑘 1 3322 log1036 1 3322 1556 617 6 classes 2 Cálculo da amplitude total 𝐴 𝐴 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 2330 400 1930 3 Cálculo da amplitude da classe 𝑐 𝑐 𝐴 𝑘 1930 6 322 4 Determinação dos limites das classes o Limite inferior da primeira classe 𝑙𝑖1 𝑥𝑚𝑖𝑛 𝑐 2 400 161 239 o Demais limites 𝑙𝑖𝑖1 𝑙𝑖𝑖 𝑐 5 Cálculo da densidade de frequência 𝐷𝐸𝑖 𝑓𝑟𝑖 𝑐 6 Cálculo do ponto médio do intervalo 𝑃𝑀𝐼𝑖 𝑙𝑖𝑖 𝑙𝑠𝑖 2 onde 𝑙𝑖𝑖 e 𝑙𝑠𝑖 representam os limites inferior e superior da classe 𝑖 respectivamente Tabela 3 Distribuição de Frequências por Classes Salários dos Funcionários Classes Salariais R 𝑃𝑀𝐼𝑖 𝑓𝑖 𝑓𝑟𝑖 𝐹𝑎𝑐 𝐷𝐸 239 561 400 3 0083 3 00259 561 882 722 10 0278 13 00864 882 1204 1043 10 0278 23 00864 1204 1526 1365 6 0167 29 00518 1526 1848 1687 4 0111 33 00345 1848 2169 2008 2 0056 35 00173 Total 36 1000 Legenda 𝑃𝑀𝐼𝑖 Ponto Médio do Intervalo da classe 𝑖 𝑓𝑖 frequência absoluta 𝑓𝑟𝑖 frequência relativa 𝐹𝑎𝑐 frequência absoluta acumulada 𝐷𝐸 Densidade de Frequência Parâmetros Estatísticos da Distribuição Número de classes 𝑘 6 Amplitude total 𝐴 R 1930 Amplitude da classe 𝑐 R 322 Salário médio estimado 𝑥 R 1112 Salário mediano estimado 𝑥 R 947 Análise das Classes Modais A distribuição salarial apresenta característica bimodal com concentração nas segunda e terceira classes R 561 882 e R 882 1204 que agregam conjuntamente 556 dos funcionários Esta concentração indica uma estrutura salarial típica de organizações com predominância de cargos operacionais e técnicos A assimetria positiva evidenciada pela cauda à direita indica a presença de salários elevados em menor frequência padrão característico de estruturas hierárquicas organizacionais onde poucos ocupam posições de alta remuneração 4 DISCUSSÃO DOS RESULTADOS 41 Perfil Demográfico Organizacional A análise do estado civil revela uma composição equilibrada com discreta predominância de funcionários casados 556 Este perfil demográfico pode influenciar políticas organizacionais relacionadas a benefícios familiares programas de qualidade de vida e estratégias de retenção de talentos 42 Estrutura Familiar dos Funcionários O padrão observado no número de filhos indica predominância de famílias pequenas com 800 dos funcionários tendo até dois filhos Esta característica sugere um perfil demográfico alinhado às tendências nacionais de redução da taxa de fecundidade típico de populações urbanas escolarizadas A concentração modal em dois filhos 350 reflete o padrão familiar brasileiro contemporâneo enquanto a baixa incidência de famílias numerosas 50 com cinco filhos confirma a transição demográfica observada no país 43 Análise da Estrutura Salarial A distribuição salarial evidencia uma estrutura com amplitude significativa R 1930 sugerindo diferentes níveis hierárquicos ou especializações funcionais A concentração na faixa intermediária R 561 a R 1204 indica uma base sólida de funcionários em posições operacionais e técnicas A presença de apenas 167 dos funcionários nas faixas salariais superiores acima de R 1526 é característica de organizações com estrutura piramidal onde posições de maior remuneração são limitadas 5 CONCLUSÕES Este estudo demonstrou a aplicação sistemática de técnicas de estatística descritiva a dados organizacionais reais evidenciando a importância da escolha adequada de métodos conforme o tipo de variável analisada Principais Descobertas Estatísticas 1 Distribuição demográfica equilibrada entre estados civis com ligeira predominância de casados 556 2 Perfil de famílias pequenas com 800 dos funcionários tendo até dois filhos 3 Estrutura salarial concentrada com 556 dos funcionários nas faixas intermediárias 4 Aplicação bemsucedida da Regra de Sturges para agrupamento de dados contínuos em 𝑘 6 classes 51 Contribuições Metodológicas A pesquisa demonstrou a eficácia da aplicação de diferentes técnicas estatísticas conforme a natureza das variáveis Variáveis qualitativas Distribuições de frequência simples com representações em barras e setores Variáveis quantitativas discretas Frequências acumuladas com gráficos de bastões e diagramas de pontos Variáveis quantitativas contínuas Agrupamento em classes com histogramas e polígonos de frequências 52 Limitações do Estudo Utilização de dados secundários sem controle sobre o processo de coleta Presença significativa de valores ausentes na variável número de filhos 444 dos casos Natureza transversal dos dados impedindo análises de tendências temporais Limitação a três variáveis não contemplando outras dimensões organizacionais relevantes 53 Recomendações para Estudos Futuros Para pesquisas posteriores recomendase Coleta de dados primários com protocolo estruturado de amostragem Ampliação da amostra para maior representatividade estatística Inclusão de variáveis socioeconômicas e ocupacionais adicionais Implementação de estudos longitudinais para análise de tendências temporais Aplicação de técnicas de estatística inferencial para testes de hipóteses Considerações Finais A análise estatística descritiva revelouse ferramenta valiosa para compreensão do perfil organizacional fornecendo subsídios quantitativos para tomada de decisões gerenciais Os padrões identificados contribuem para o desenvolvimento de políticas de recursos humanos baseadas em evidências empíricas 6 REFERÊNCIAS BIBLIOGRÁFICAS BUSSAB W O MORETTIN P A Estatística básica 9 ed São Paulo Saraiva 2017 MILSA Dataset Dados dos Funcionários da Empresa Milsa Universidade Federal do Paraná Disponível em httpwwwlegufprbrfernandomayerdatamilsacsv Acesso em 18 set 2024 ANÁLISE ESTATÍSTICA DESCRITIVA DE DADOS ORGANIZACIONAIS ESTUDO DE CASO DOS FUNCIONÁRIOS DA EMPRESA MILSA 1 INTRODUÇÃO A estatística descritiva constitui ferramenta fundamental para a compreensão e síntese de conjuntos de dados permitindo a identificação de padrões e características relevantes através de tabelas de frequência e representações gráficas O presente trabalho aplica métodos estatísticos descritivos a dados reais de uma organização demonstrando a utilização adequada de técnicas específicas para cada tipo de variável Objetivo Geral Analisar estatisticamente as características dos funcionários da empresa Milsa através da construção de tabelas de distribuição de frequências completas e gráficos apropriados seguindo os fundamentos teóricos da estatística descritiva Objetivos Específicos Caracterizar o perfil demográfico dos funcionários através de variáveis qualitativas e quantitativas Construir distribuições de frequência completas para diferentes tipos de variáveis Aplicar técnicas gráficas apropriadas para cada tipo de variável Interpretar os resultados estatísticos no contexto organizacional Temas Estudados Este trabalho aborda os seguintes tópicos da estatística descritiva distribuições de frequência absoluta e relativa análise de variáveis qualitativas nominais variáveis quantitativas discretas e contínuas regra de Sturges para agrupamento de dados representações gráficas barras setores bastões histogramas polígonos de frequências e técnicas de análise descritiva 2 METODOLOGIA 21 Fonte dos Dados Os dados utilizados neste estudo foram obtidos do repositório acadêmico da Universidade Federal do Paraná UFPR disponíveis publicamente no endereço eletrônico httpwwwlegufprbrfernandomayerdatamilsacsv Este conjunto de dados foi originalmente apresentado no livro Estatística Básica dos professores Wilton de Oliveira Bussab e Pedro Alberto Morettin constituindo um exemplo clássico na literatura estatística brasileira 22 Caracterização da Amostra População e Amostragem Populaçãoalvo Funcionários de uma empresa fictícia denominada Milsa Tamanho amostral n36 funcionários Tipo de amostragem Não probabilística por conveniência dados secundários 23 Variáveis Analisadas As variáveis selecionadas para análise foram classificadas segundo sua natureza estatística 1 Estado Civil Variável qualitativa nominal categorias casado solteiro 2 Número de Filhos Variável quantitativa discreta valores 01235 3 Salário Variável quantitativa contínua valores em reais 24 Tratamento dos Dados Para a variável Número de Filhos foram identificados valores ausentes NA em 16 observações resultando numa amostra efetiva de n20 funcionários para esta análise Para as demais variáveis não foram identificados valores ausentes Técnica de Exclusão Utilizada Aplicouse o procedimento de listwise deletion para garantir a consistência das análises excluindose 44 4 dos registros com valores faltantes na variável número de filhos 3 RESULTADOS E ANÁLISE 31 Análise da Variável Qualitativa Estado Civil Para variáveis qualitativas utilizouse a distribuição de frequências simples calculandose as frequências absoluta f i relativa f ri e percentual f pi Fundamentação Matemática As medidas de frequência foram calculadas segundo as seguintes fórmulas Frequência Relativa f rif i n Frequência Percentual f pif ri100 onde f i representa a frequência absoluta da categoria i e n o tamanho total da amostra Tabela 1 Distribuição de Frequências Estado Civil dos Funcionários Categori a f i f ri f pi Casado 20 0556 556 Solteiro 16 0444 44 4 Total 3 6 100 0 1000 Legenda f i frequência absoluta f ri frequência relativa f pi frequência relativa percentual Interpretação dos Resultados Os resultados indicam uma distribuição relativamente equilibrada entre os estados civis com ligeira predominância de funcionários casados 556 em relação aos solteiros 44 4 A diferença de 112 pontos percentuais sugere uma composição diversificada no quadro de funcionários característica comum em organizações consolidadas 32 Análise da Variável Quantitativa Discreta Número de Filhos Para variáveis quantitativas discretas além das frequências simples calcularamse as frequências acumuladas Fac Fri acum F pi acum fundamentais para análises de distribuição cumulativa Fundamentação Matemática As medidas acumuladas foram calculadas segundo as seguintes fórmulas Frequência Absoluta Acumulada Fac i j1 i f j Frequência Relativa Acumulada Fri acumi Fac i n Frequência Percentual Acumulada F pi acumiFri acum i100 Tabela 2 Distribuição de Frequências Número de Filhos dos Funcionários Número de Filhos f i f pi Fac Fri acum F pi acum 0 4 200 4 0200 200 1 5 250 9 0450 45 0 2 7 350 16 0800 800 3 3 150 19 0950 950 5 1 50 20 1000 1000 Total 20 1000 Legenda f i frequência absoluta f pi frequência percentual Fac frequência absoluta acumulada Fri acum frequência relativa acumulada F pi acum frequência percentual acumulada Fonte Elaboração própria com base nos dados da empresa Milsa 2024 Nota Amostra efetiva de n20 funcionários excluídos valores ausentes Análise Descritiva A análise revela que 350 dos funcionários possuem 2 filhos constituindo a moda da distribuição Observase que 800 dos funcionários têm até 2 filhos indicando um perfil predominante de famílias pequenas A ausência de funcionários com 4 filhos e a presença de apenas um caso com 5 filhos 50 sugerem uma distribuição concentrada nos valores menores característica de populações urbanas modernas 33 Análise da Variável Quantitativa Contínua Salários Para variáveis quantitativas contínuas aplicouse o agrupamento em classes de intervalos utilizando a Regra de Sturges para determinação do número de classes Procedimento Metodológico para Construção das Classes 1 Cálculo do número de classes k pela Regra de Sturges k13322log10n k13322log1036 1332215566176 classes 2 Cálculo da amplitude total A Axmaxxmin23304001930 3 Cálculo da amplitude da classe c c A k 1930 6 322 4 Determinação dos limites das classes o Limite inferior da primeira classe l i1xminc 24 00161239 o Demais limites l ii1liic 5 Cálculo da densidade de frequência D Eif ri c 6 Cálculo do ponto médio do intervalo PM I iliil si 2 onde l ii e l si representam os limites inferior e superior da classe i respectivamente Tabela 3 Distribuição de Frequências por Classes Salários dos Funcionários Classes Salariais R PM I i f i f ri Fac DE 239561 4 00 3 0083 3 00259 561882 722 10 0278 13 00864 8821204 1043 10 0278 23 00864 12041526 1365 6 0167 29 00518 15261848 1687 4 0111 33 00345 18482169 2008 2 0056 35 00173 Total 36 1000 Legenda PM I i Ponto Médio do Intervalo da classe i f i frequência absoluta f ri frequência relativa Fac frequência absoluta acumulada DE Densidade de Frequência Parâmetros Estatísticos da Distribuição Número de classes k6 Amplitude total AR1930 Amplitude da classe cR322 Salário médio estimado xR1112 Salário mediano estimado xR947 Análise das Classes Modais A distribuição salarial apresenta característica bimodal com concentração nas segunda e terceira classes R 561882 e R 8821204 que agregam conjuntamente 556 dos funcionários Esta concentração indica uma estrutura salarial típica de organizações com predominância de cargos operacionais e técnicos A assimetria positiva evidenciada pela cauda à direita indica a presença de salários elevados em menor frequência padrão característico de estruturas hierárquicas organizacionais onde poucos ocupam posições de alta remuneração 4 DISCUSSÃO DOS RESULTADOS 41 Perfil Demográfico Organizacional A análise do estado civil revela uma composição equilibrada com discreta predominância de funcionários casados 556 Este perfil demográfico pode influenciar políticas organizacionais relacionadas a benefícios familiares programas de qualidade de vida e estratégias de retenção de talentos 42 Estrutura Familiar dos Funcionários O padrão observado no número de filhos indica predominância de famílias pequenas com 800 dos funcionários tendo até dois filhos Esta característica sugere um perfil demográfico alinhado às tendências nacionais de redução da taxa de fecundidade típico de populações urbanas escolarizadas A concentração modal em dois filhos 350 reflete o padrão familiar brasileiro contemporâneo enquanto a baixa incidência de famílias numerosas 50 com cinco filhos confirma a transição demográfica observada no país 43 Análise da Estrutura Salarial A distribuição salarial evidencia uma estrutura com amplitude significativa R 1930 sugerindo diferentes níveis hierárquicos ou especializações funcionais A concentração na faixa intermediária R 561 a R 1204 indica uma base sólida de funcionários em posições operacionais e técnicas A presença de apenas 167 dos funcionários nas faixas salariais superiores acima de R 1526 é característica de organizações com estrutura piramidal onde posições de maior remuneração são limitadas 5 CONCLUSÕES Este estudo demonstrou a aplicação sistemática de técnicas de estatística descritiva a dados organizacionais reais evidenciando a importância da escolha adequada de métodos conforme o tipo de variável analisada Principais Descobertas Estatísticas 1 Distribuição demográfica equilibrada entre estados civis com ligeira predominância de casados 556 2 Perfil de famílias pequenas com 800 dos funcionários tendo até dois filhos 3 Estrutura salarial concentrada com 556 dos funcionários nas faixas intermediárias 4 Aplicação bemsucedida da Regra de Sturges para agrupamento de dados contínuos em k6 classes 51 Contribuições Metodológicas A pesquisa demonstrou a eficácia da aplicação de diferentes técnicas estatísticas conforme a natureza das variáveis Variáveis qualitativas Distribuições de frequência simples com representações em barras e setores Variáveis quantitativas discretas Frequências acumuladas com gráficos de bastões e diagramas de pontos Variáveis quantitativas contínuas Agrupamento em classes com histogramas e polígonos de frequências 52 Limitações do Estudo Utilização de dados secundários sem controle sobre o processo de coleta Presença significativa de valores ausentes na variável número de filhos 44 4 dos casos Natureza transversal dos dados impedindo análises de tendências temporais Limitação a três variáveis não contemplando outras dimensões organizacionais relevantes 53 Recomendações para Estudos Futuros Para pesquisas posteriores recomendase Coleta de dados primários com protocolo estruturado de amostragem Ampliação da amostra para maior representatividade estatística Inclusão de variáveis socioeconômicas e ocupacionais adicionais Implementação de estudos longitudinais para análise de tendências temporais Aplicação de técnicas de estatística inferencial para testes de hipóteses Considerações Finais A análise estatística descritiva revelouse ferramenta valiosa para compreensão do perfil organizacional fornecendo subsídios quantitativos para tomada de decisões gerenciais Os padrões identificados contribuem para o desenvolvimento de políticas de recursos humanos baseadas em evidências empíricas 6 REFERÊNCIAS BIBLIOGRÁFICAS BUSSAB W O MORETTIN P A Estatística básica 9 ed São Paulo Saraiva 2017 MILSA Dataset Dados dos Funcionários da Empresa Milsa Universidade Federal do Paraná Disponível em httpwwwlegufprbrfernandomayerdatamilsacsv Acesso em 18 set 2024