·

Saúde Coletiva ·

Bioestatística

Send your question to AI and receive an answer instantly

Ask Question

Preview text

1 UNIVERSIDADE FEDERAL DA BAHIA Instituto de Saúde Coletiva Programa de PósGraduação em Saúde Coletiva PPGSC0543 Estatística de Saúde Docente Prof Dra Dandara de Oliveira Ramos Tirocinantes Me Karla Nicole Ramos de Oliveira e Me Rijone do Rosário Avaliação 1 Instruções gerais Esta avaliação pode ser realizada de forma individual ou em duplas Envie suas respostas no formato de script R arquivo com extensão R eou do file Stata arquivo com extensão do Ao preparar o material lembrese de Registrar seu nome e de sua dupla no início do arquivo como comentário comentário no R script ou comentário no do file Stata Certifiquese de que funções pertencentes a pacotes adicionais sejam antecedidas do comando para instalação de tal pacote Respostas e comentários devem ser incluídos no próprio arquivo R ou do Usem adequadamente os comentários comentários Não utilize outros softwares para a execução da tarefa As análises devem ser feitas exclusivamente com o R eou Stata Para as questões respondidas no Stata é permitido não obrigatório enviar um arquivo adicional em formato doc ou pdf registrando os comandos resultados e gráficos A data limite para postagem no Moodle é 19072024 até às 2359hs Envios posteriores a esta datahorário limites não serão permitidos a exceção daqueles formalmente justificados por atestado médico ou outras condições de excepcionalidade Pedidos de envio fora do prazo devem ser feitos em até no máximo 2 dois dias úteis após o prazo final indicado acima para o email dandararamosufbabr Boa prova 2 Questão 1 50 pontos A Pesquisa Nacional de Saúde do Escolar PeNSE investiga informações que permitem conhecer e dimensionar os fatores de risco e proteção à saúde dos adolescentes É realizada por amostragem utilizando como referência para seleção o cadastro das escolas públicas e privadas do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira INEP A PeNSE teve início em 2009 fruto de parceria com o Ministério da Saúde e apoio do Ministério da Educação A pesquisa fornece informações sobre as características básicas da população de estudo incluindo aspectos socioeconômicos como escolaridade dos pais inserção no mercado de trabalho e posse de bens e serviços contextos social e familiar fatores de risco comportamentais relacionados a hábitos alimentares sedentarismo tabagismo consumo de álcool e outras drogas saúde sexual e reprodutiva exposição a acidentes e violências hábitos de higiene saúde bucal saúde mental e percepção da imagem corporal entre outros tópicos O banco de dados pense2019csv contém os dados completos da edição 2019 da PeNSE O arquivo possui 165838 observações e 306 variáveis o dicionário da base de dados pode ser encontrado neste link Conduza os procedimentos estatísticos necessários para responder às questões abaixo detalhando em seu script ou dofile os passos de sua análise seguidos da resposta final em forma de comentário R ou comentário Stata a Considerando os casos em que a pessoa sentiu que seus colegas de escolas esculacharam zoaram mangoaram intimidaram ou caçoaram tanto que a pessoa se sentiu magoada incomodada aborrecida ofendida ou humilhada pelo menos uma vez indicador binário qual a prevalência de bullying entre os escolares entrevistados na pesquisa variável b07007a vale 10 ponto b Qual foi a causa mais frequente de bullying entre os escolares entrevistados na pesquisa variável b07008 Notase diferença nas causas de bullying entre escolares do sexo feminino e masculino vale 10 ponto c Qual o tempo médio a mediana e o desvio padrão de deslocamento até a escola declarado pelos escolares entrevistados variável tempodesloc1 Notase diferença na média do tempo de deslocamento entre as regiões do país vale 10 ponto d Notase diferença no tempo médio e na mediana do tempo de deslocamento até a escola variável tempodesloc¹ dos estudantes considerando a frequência com que se ausentaram da escola por motivo de insegurança no trajeto variável b09001 vale 10 ponto e Demonstre graficamente i O tempo de deslocamento até a escola entre as cinco regiões do país vale 05 ii As causas mais prevalentes de bullying entre escolares do sexo feminino e masculino vale 05 1 Observe atentamente o dicionário e lembrese de adequar sua análise para incluir apenas os valores válidos desta variável 3 Questão 2 50 pontos O banco de dados homicidiosatlascsv contém dados da série histórica de homicídios nos municípios brasileiros por sexo de 2000 a 2021 extraídos do Atlas da Violência do IPEA 2 Os bancos pophomenslongcsv e popmulhereslongcsv contém dados da população residente por municípios brasileiros por sexo de 2000 a 2021 extraídos do Estudo de estimativas populacionais estimativas preliminares elaboradas pelo Ministério da SaúdeSVSADAENTCGIAE acessados via TABNETDATASUS Faça as manipulações necessárias e a Calcule as taxas de homicídios por 100 mil habitantes nos municípios brasileiros para cada ano da série histórica disponível vale 125 b Calcule as taxas de homicídios por 100 mil habitantes na população masculina e na população feminina nos municípios brasileiros para cada ano da série histórica disponível vale 125 c Indique qual a região do país com maior taxa média de homicídios por 100 mil habitantes para cada ano da série histórica disponível vale 125 d Demonstre graficamente a variação anual das taxas de homicídios por 100 mil habitantes nas regiões do Brasil considerando os anos da série histórica vale 125 2 httpswwwipeagovbratlasviolenciafiltrosseries1homicidios Avaliação 1 Questão 01 letra a data readcsvpense2019csv if requiredplyr installpackagesdplyr if requireggplot2 installpackagesggplot2 librarydplyr libraryggplot2 Converter B07007A para fator para facilitar a análise dataB07007A factordataB07007A levels c2 1 2 3 9 labels cAbandono Nenhuma vez 1 vez 2 ou mais vezes Sem resposta tabledataB07007A Abandono Nenhuma vez 1 vez 2 ou mais vezes Sem resposta 182 95689 26443 36334 597 Calcular a prevalência de bullying excluindo Abandono e Sem resposta Casos de bullying são quando b07007a é 1 vez ou 2 ou mais vezes bullyingcasesexcl sumdataB07007A in c1 vez 2 ou mais vezes Total de respostas válidas excluindo Abandono e Sem resposta totalresponsesexcl sumdataB07007A in cNenhuma vez 1 vez 2 ou mais vezes Calcular a prevalência excluindo Abandono e Sem resposta prevalenceexcl bullyingcasesexcltotalresponsesexcl Calcular a prevalência de bullying incluindo todas as respostas Total de respostas incluindo todas as categorias totalresponsesincl lengthdataB07007A Calcular a prevalência incluindo todas as respostas prevalenceincl bullyingcasesexcltotalresponsesincl Criar uma tabela comparando ambas as prevalências prevalencetable dataframeMetodo cExcluindo Abandono e Sem resposta Incluindo todas as respostas Prevalencia cprevalenceexcl prevalenceincl 1 Tabela de Prevalências Método Prevalência Excluindo Abandono e Sem resposta 03961544 Incluindo todas as respostas 03785441 1 Excluindo Abandono e Sem resposta Prevalência 3962 Interpretação Esta prevalência considera apenas as respostas válidas excluindo os que aban donaram o questionário e os que não responderam a esta pergunta específica Este método fornece uma estimativa mais precisa da prevalência de bullying entre os estudantes que realmente responderam à pergunta sobre bullying 2 Incluindo todas as respostas Prevalência 3785 Interpretação Esta prevalência considera todas as respostas incluindo aqueles que abandonaram o questionário e os que não responderam à pergunta específica Este método pode subestimar a prevalência real de bullying pois inclui no denominador respostas que não contribuem com informações válidas sobre bullying A prevalência de bullying é ligeiramente menor quando todas as respostas são incluídas comparado com quando apenas as respostas válidas são consideradas Isso ocorre porque a inclusão de respostas inválidas abandono e sem resposta aumenta o denominador sem aumentar o numerador resultando em uma menor proporção de casos de bullying letra b librarydplyr libraryggplot2 Converter B07008 e B01001a para fator para facilitar a análise datab07008 factordataB07008 levels c2 1 1 2 3 4 5 6 7 9 labels cAbandono Pulo do questionário Minha cor ou raça Minha religião Aparência do meu rosto Aparência do meu corpo Minha orientação sexual Minha região de origem Outros motivoscausas Sem resposta datab01001a factordataB01001A levels c1 2 9 labels cHomem Mulher Sem resposta Verificar a distribuição das causas de bullying causasbullying tabledatab07008 printcausasbullying Abandono Pulo do questionário Minha cor ou raça 185 96286 2124 Minha religião Aparência do meu rosto Aparência do meu corpo 1345 6571 9734 Minha orientação sexual Minha região de origem Outros motivoscausas 2 1492 517 40471 Sem resposta 520 Encontrar a causa mais frequente de bullying causamaisfrequente namessortcausasbullying39 decreasing TRUE1 printpasteA causa mais frequente de bullying é causamaisfrequente 1 A causa mais frequente de bullying é Outros motivoscausas Filtrar apenas as respostas válidas para análise de bullying por sexo datavalid data filterb07008 in cMinha cor ou raça Minha religião Aparência do meu rosto Aparência do meu corpo Minha orientação sexual Minha região de origem Outros motivoscausas b01001a in cHomem Mulher Comparar as causas de bullying entre os sexos causasporsexo datavalid groupbyb01001a b07008 summarisecontagem n mutateproporcao contagemsumcontagem Plotar gráfico comparativo das causas de bullying por sexo ggplotcausasporsexo aesx b07008 y proporcao fill b01001a geombarstat identity position positiondodgewidth 09 color black alpha 07 geomtextaeslabel scalespercentproporcao accuracy 01 position positiondodgewidth 09 vjust 05 size 3 scalefillmanualvalues cgrey70 grey40 labstitle Causas de Bullying por Sexo x Causa y Proporção fill Sexo themeplottitle elementtexthjust 05 size 14 face bold axistextx elementtextangle 45 hjust 1 size 10 axistitlex elementtextsize 12 axistitley elementtextsize 12 legendposition top panelbackground elementrectfill white colour white plotbackground elementrectfill white colour white ylim0 08 3 49 22 116 147 28 10 629 22 21 97 164 21 07 668 00 02 04 06 08 Minha cor ou raça Minha religião Aparência do meu rosto Aparência do meu corpo Minha orientação sexual Minha região de origem Outros motivoscausas Causa Proporção Sexo Homem Mulher Causas de Bullying por Sexo 1 Causa Mais Frequente de Bullying Causa Mais Frequente A causa mais frequente de bullying entre os escolares entrevistados na pesquisa é Outros motivoscausas 2 Diferença nas Causas de Bullying entre Sexos A comparação entre as causas de bullying entre escolares do sexo feminino e masculino pode ser visualizada no gráfico gerado onde Outros motivoscausas e Aparência do meu corpo são as causas mais frequentes em ambos os sexos mas com proporções diferentes Para verificar se há uma diferença significativa entre os sexos em relação ao bullying podemos realizar um teste quiquadrado de independência Esse teste avalia se há uma associação significativa entre duas variáveis categóricas Teste QuiQuadrado de Independência removendo colunas e linhas desnecessárias tabelacontingencia tabledatavalidb01001a datavalidb07008 Remover colunas e linhas desnecessárias tabelacontingencia tabelacontingencia colnamestabelacontingencia Abandono tabelacontingencia tabelacontingencia colnamestabelacontingencia Pulo do questionário tabelacontingencia tabelacontingencia colnamestabelacontingencia Sem resposta tabelacontingencia tabelacontingenciarownamestabelacontingencia Sem resposta 4 Realizar o teste quiquadrado testequiquadrado chisqtesttabelacontingencia Resultado do teste printtestequiquadrado Pearsons Chisquared test data tabelacontingencia Xsquared 49749 df 6 pvalue 22e16 Valor do Teste Estatístico Xsquared 49749 Este valor representa a soma das diferenças ao quadrado entre as frequências observadas e esperadas ajustadas pelas frequências esperadas Um valor alto indica que há uma grande diferença entre as frequências observadas e esperadas Graus de Liberdade df 6 Os graus de liberdade são calculados como número de linhas 1 número de colunas 1 Neste caso 21 71 6 Valorp pvalue 22e16 O valorp é muito menor que 005 o que indica que rejeitamos a hipótese nula Como o valorp é menor que 005 rejeitamos a hipótese nula de que não há associação entre o sexo e as causas de bullying Portanto concluímos que há uma associação significativa entre o sexo dos escolares e as causas de bullying Em outras palavras as causas de bullying diferem significativamente entre meninos e meninas Tabela de Contingência Ajustada Sexo Minha cor ou raça Minha religião Aparência do meu rosto Aparência do meu corpo Minha orientação sexual Minha região de origem Outros mo tivoscausas Homem1368 613 3231 4100 769 281 17537 Mulher746 726 3325 5613 716 232 22816 letra c Filtrar apenas valores válidos da variável TEMPODESLOC 0 a 840 datavalidtempodesloc data filterTEMPODESLOC 0 TEMPODESLOC 840 Calcular estatísticas descritivas para o tempo de deslocamento mediatempodesloc meandatavalidtempodeslocTEMPODESLOC narm TRUE medianatempodesloc mediandatavalidtempodeslocTEMPODESLOC narm TRUE desviopadraotempodesloc sddatavalidtempodeslocTEMPODESLOC narm TRUE 5 printpasteMédia do tempo de deslocamento roundmediatempodesloc 2 1 Média do tempo de deslocamento 5875 printpasteMediana do tempo de deslocamento roundmedianatempodesloc 2 1 Mediana do tempo de deslocamento 15 printpasteDesvio padrão do tempo de deslocamento rounddesviopadraotempodesloc 2 1 Desvio padrão do tempo de deslocamento 9505 Converter REGIAO para fator com rótulos adequados datavalidtempodeslocREGIAO factordatavalidtempodeslocREGIAO levels 15 labels cNorte Nordeste Sudeste Sul CentroOeste Calcular a média do tempo de deslocamento por região mediaporregiao datavalidtempodesloc groupbyREGIAO summarisemediatempodesloc meanTEMPODESLOC narm TRUE Exibir média do tempo de deslocamento por região printmediaporregiao A tibble 5 x 2 REGIAO mediatempodesloc fct dbl 1 Norte 614 2 Nordeste 584 3 Sudeste 603 4 Sul 547 5 CentroOeste 566 Realizar teste ANOVA para verificar se há diferença significativa entre as médias das regiões anovaresult aovTEMPODESLOC REGIAO data datavalidtempodesloc summaryanovaresult Df Sum Sq Mean Sq F value PrF REGIAO 4 7074e05 176847 1958 396e16 Residuals 158378 1430e09 9030 Signif codes 0 0001 001 005 01 1 Plotar gráfico comparativo das médias de tempo de deslocamento por região ggplotmediaporregiao aesx REGIAO y mediatempodesloc fill REGIAO geombarstat identity color black 6 alpha 07 geomtextaeslabel roundmediatempodesloc 1 vjust 05 size 3 labstitle Média do Tempo de Deslocamento por Região x Região y Tempo Médio de Deslocamento minutos thememinimal themeplottitle elementtexthjust 05 size 14 face bold axistextx elementtextangle 45 hjust 1 size 10 axistitlex elementtextsize 12 axistitley elementtextsize 12 legendposition none panelgridmajor elementblank panelgridminor elementblank scalefillmanualvalues cNorte red Nordeste orange Sudeste green Sul blue CentroOeste purple 614 584 603 547 566 0 20 40 60 Norte Nordeste Sudeste Sul CentroOeste Região Tempo Médio de Deslocamento minutos Média do Tempo de Deslocamento por Região 1 Estatísticas Descritivas do Tempo de Deslocamento Média 5875 minutos Mediana 15 minutos Desvio Padrão 9505 minutos Interpretação A média de 5875 minutos sugere que em média os estudantes levam cerca de uma hora para se deslocar até a escola A mediana de 15 minutos indica que a metade dos estudantes leva até 15 minutos o que sugere que a distribuição do tempo de deslocamento é assimétrica possivelmente com alguns valores extremos outliers que aumentam a média O desvio padrão alto 9505 minutos reforça a presença de uma grande variabilidade nos tempos de deslocamento indicando que há muitos estudantes com tempos de deslocamento significativamente diferentes da média As médias de tempo de deslocamento variam entre as regiões com o Nordeste apresentando a 7 maior média 624 minutos e o Sul a menor 532 minutos O valorp é muito menor que 005 indicando que rejeitamos a hipótese nula de que as médias de tempo de deslocamento são iguais entre as regiões Portanto há uma diferença significativa no tempo de deslocamento entre as regiões do país letra d Converter B09001 para fator com rótulos adequados datavalidtempodesloc data filterTEMPODESLOC 0 TEMPODESLOC 840 B09001 in 16 Converter B09001 para fator com rótulos adequados datavalidtempodeslocB09001 factordatavalidtempodeslocB09001 levels 16 labels cNenhum dia 1 dia 2 dias 3 dias 4 dias 5 dias ou mais Analisar a diferença no tempo de deslocamento média e mediana considerando a variável b09001 estatisticasb09001 datavalidtempodesloc groupbyB09001 summarisemediatempodesloc meanTEMPODESLOC narm TRUE medianatempodesloc medianTEMPODESLOC narm TRUE desviopadraotempodesloc sdTEMPODESLOC narm TRUE Exibir estatísticas descritivas considerando b09001 printestatisticasb09001 A tibble 6 x 4 B09001 mediatempodesloc medianatempodesloc desviopadraotempodesloc fct dbl dbl dbl 1 Nenhum dia 549 5 895 2 1 dia 833 50 115 3 2 dias 935 50 121 4 3 dias 943 50 124 5 4 dias 103 50 140 6 5 dias ou mais 107 50 159 ggplotestatisticasb09001 aesx B09001 y mediatempodesloc fill B09001 geombarstat identity color black alpha 07 geomtextaeslabel roundmediatempodesloc 1 vjust 05 size 3 labstitle Tempo Médio de Deslocamento por Frequência de Ausência por Insegurança x Frequência de Ausência y Tempo Médio de Deslocamento minutos thememinimal themeplottitle elementtexthjust 05 size 12 face bold axistextx elementtextangle 45 hjust 1 size 10 axistitlex elementtextsize 12 axistitley elementtextsize 12 legendposition none panelgridmajor elementblank panelgridminor elementblank 8 scalefillmanualvalues cNenhum dia red 1 dia orange 2 dias green 3 dias blue 4 dias lightblue 5 dias ou mais purple 549 833 935 943 1028 107 0 30 60 90 Nenhum dia 1 dia 2 dias 3 dias 4 dias 5 dias ou mais Frequência de Ausência Tempo Médio de Deslocamento minutos Tempo Médio de Deslocamento por Frequência de Ausência por Insegurança Há uma diferença clara no tempo médio de deslocamento até a escola considerando a frequência de ausência por motivo de insegurança Estudantes que faltaram mais dias devido à insegurança têm em média tempos de deslocamento mais longos Esta relação pode indicar que estudantes com deslocamentos mais longos enfrentam mais desafios de segurança no trajeto para a escola letra e datavalidtempodeslocREGIAO factordatavalidtempodeslocREGIAO levels 15 labels cNorte Nordeste Sudeste Sul CentroOeste ggplotdatavalidtempodesloc aesx REGIAO y TEMPODESLOC fill REGIAO geomboxplotoutliershape NA notch TRUE labstitle Tempo de Deslocamento até a Escola por Região x Região y Tempo de Deslocamento minutos thememinimal themeplottitle elementtexthjust 05 size 14 face bold axistextx elementtextsize 10 axistitlex elementtextsize 12 axistitley elementtextsize 12 legendposition none panelgridmajor elementblank panelgridminor elementblank scalefillmanualvalues cNorte red Nordeste orange Sudeste green Sul blue 9 CentroOeste purple 0 200 400 600 800 Norte Nordeste Sudeste Sul CentroOeste Região Tempo de Deslocamento minutos Tempo de Deslocamento até a Escola por Região A parte das causas de bullyng já foram mostradas graficamente na letra b Questão 02 librarydplyr libraryreadr Função para analisar um dataset analisardataset functiondataset nomedataset cat Analisando dataset nomedataset tipos sapplydataset class cat Tipos das variáveis printtipos valoresnulos sapplydataset functionx sumisnax cat Quantidade de valores nulos printvaloresnulos homicidiosatlas readcsvhomicidiosatlascsv pophomenslong readcsvpophomenslongcsv popmulhereslong readcsvpopmulhereslongcsv 10 Analisar cada dataset analisardatasethomicidiosatlas homicidiosatlascsv Analisando dataset homicidiosatlascsv Tipos das variáveis cod municipio ano homichomens homicmulheres numeric character numeric numeric numeric Quantidade de valores nulos cod municipio ano homichomens homicmulheres 0 0 0 0 0 analisardatasetpophomenslong pophomenslongcsv Analisando dataset pophomenslongcsv Tipos das variáveis cod ano pophomens numeric numeric numeric Quantidade de valores nulos cod ano pophomens 0 0 0 analisardatasetpopmulhereslong popmulhereslongcsv Analisando dataset popmulhereslongcsv Tipos das variáveis cod ano popmulheres numeric numeric numeric Quantidade de valores nulos cod ano popmulheres 0 0 0 letra a Unir os datasets de população masculina e feminina poptotallong pophomenslong innerjoinpopmulhereslong by ccod ano mutatepoptotal pophomens popmulheres selectcod ano poptotal Unir os dados de homicídios com a população total dadosunidos homicidiosatlas innerjoinpoptotallong by ccod ano Calcular as taxas de homicídios por 100 mil 11 habitantes dadosunidos dadosunidos mutatehomicidiostotais homichomens homicmulheres taxahomicidios homicidiostotaispoptotal 1e05 Visualizar os dados com as taxas de homicídios headdadosunidos A tibble 6 x 8 cod municipio ano homichomens homicmulheres poptotal homicidiostotais dbl chr dbl dbl dbl dbl dbl 1 315320 Presiden 2010 0 0 3980 0 2 350190 Amparo 2010 4 0 67483 4 3 510335 Confresa 2010 8 1 25715 9 4 310410 Arceburgo 2010 1 0 9684 1 5 521690 Pilar de 2010 0 0 2823 0 6 500750 Rochedo 2010 1 0 4642 1 i 1 more variable taxahomicidios dbl Agora temos um Dataset com todos os dados unidos e com as informações solicitadas por exemplo no município de Amparo a taxa de homicídios a cada 100 mil habitantes é 6 a cada 100 mil letra b Calcular as taxas de homicídios para a população masculina dadoshomens homicidiosatlas innerjoinpophomenslong by ccod ano mutatetaxahomicidioshomens homichomenspophomens 1e05 selectcod municipio ano homichomens pophomens taxahomicidioshomens Calcular as taxas de homicídios para a população feminina dadosmulheres homicidiosatlas innerjoinpopmulhereslong by ccod ano mutatetaxahomicidiosmulheres homicmulherespopmulheres 1e05 selectcod municipio ano homicmulheres popmulheres taxahomicidiosmulheres Visualizar os dados com as taxas de homicídios headdadoshomens A tibble 6 x 6 cod municipio ano homichomens pophomens taxahomicidioshomens dbl chr dbl dbl dbl dbl 1 315320 Presidente Juscel 2010 0 2034 0 2 350190 Amparo 2010 4 33284 120 3 510335 Confresa 2010 8 13662 586 4 310410 Arceburgo 2010 1 5008 200 5 521690 Pilar de Goiás 2010 0 1498 0 12 6 500750 Rochedo 2010 1 2411 415 headdadosmulheres A tibble 6 x 6 cod municipio ano homicmulheres popmulheres taxahomicidiosmulh1 dbl chr dbl dbl dbl dbl 1 315320 Presidente Ju 2010 0 1946 0 2 350190 Amparo 2010 0 34199 0 3 510335 Confresa 2010 1 12053 830 4 310410 Arceburgo 2010 0 4676 0 5 521690 Pilar de Goiás 2010 0 1325 0 6 500750 Rochedo 2010 0 2231 0 i abbreviated name 1 taxahomicidiosmulheres letra C librarygeobr librarystringr librarysf municipios readmunicipalityyear 2020 0 4 7 11 15 19 22 26 30 33 37 41 44 48 52 56 59 63 67 70 74 78 81 85 89 93 96 100 municipiosdf stdropgeometrymunicipios municipiosdf municipiosdf selectcodemuni nameregion mutatecodemuni substrcodemuni 1 6 renamecod codemuni regiao nameregion municipiosdfcod asnumericmunicipiosdfcod dadosunidoscomregiao dadosunidos leftjoinmunicipiosdf by cod c Calcular a taxa média de homicídios por 100 mil habitantes para cada região em cada ano taxamediaporregiao dadosunidoscomregiao groupbyano regiao summarisetaxamediahomicidios meantaxahomicidios narm TRUE ungroup summarise has grouped output by ano You can override using the groups argument Identificar a região com a maior taxa média de homicídios para cada ano regiaomaiortaxa taxamediaporregiao groupbyano filtertaxamediahomicidios maxtaxamediahomicidios ungroup 13 Visualizar a região com a maior taxa média de homicídios para cada ano headregiaomaiortaxa 15 A tibble 12 x 3 ano regiao taxamediahomicidios dbl chr dbl 1 2010 Norte 216 2 2011 Norte 215 3 2012 Norte 238 4 2013 Centro Oeste 248 5 2014 Nordeste 260 6 2015 Nordeste 266 7 2016 Nordeste 312 8 2017 Nordeste 339 9 2018 Norte 310 10 2019 Norte 273 11 2020 Centro Oeste 501 12 2021 Nordeste 287 letra d Carregar bibliotecas necessárias librarydplyr libraryggplot2 libraryggrepel Calcular a taxa média de homicídios por 100 mil habitantes para cada região em cada ano taxamediaporregiao dadosunidoscomregiao groupbyano regiao summarisetaxamediahomicidios meantaxahomicidios narm TRUE ungroup Adicionar rótulos apenas para os anos de 2010 e 2021 taxamediaporregiao taxamediaporregiao mutatelabel ifelseano 2010 ano 2021 scalespercenttaxamediahomicidios100 accuracy 01 Definir a paleta de cores coresprofissionais cCentro Oeste 1f77b4 Nordeste ff7f0e Norte 2ca02c Sudeste d62728 Sul 9467bd Criar um gráfico mostrando a variação anual das taxas de homicídios por 100 mil habitantes em cada região ggplottaxamediaporregiao aesx ano y taxamediahomicidios color regiao geomlinelinewidth 1 alpha 08 14 geomtextrepelaeslabel label size 4 showlegend FALSE nudgey 35 scalecolormanualvalues coresprofissionais labstitle Variação Anual das Taxas de Homicídios por 100 mil Habitantes nas Regiões do Brasil x Ano y Taxa Média de Homicídios por 100 mil habitantes color Região thememinimalbasesize 12 themeplottitle elementtexthjust 05 size 10 face bold axistextx elementtextangle 45 hjust 1 size 10 axistitlex elementtextsize 12 axistitley elementtextsize 12 legendposition top panelbackground elementrectfill white color white plotbackground elementrectfill white color white panelgridmajor elementlinecolor grey80 panelgridminor elementlinecolor grey90 plotmargin margin20 20 20 20 scalexcontinuousbreaks seqmintaxamediaporregiaoano maxtaxamediaporregiaoano by 1 206 196 216 119 138 243 287 286 110 134 10 20 30 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 Ano Taxa Média de Homicídios por 100 mil habitantes Região Centro Oeste Nordeste Norte Sudeste Sul Variação Anual das Taxas de Homicídios por 100 mil Habitantes nas Regiões do Brasil 15