·

Economia ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Laboratório de Econometria I 20241 Lista 2 Departamento de Economia PUCRio Prof Gilberto Boaretto Monitores André Alvarenga e Guilherme Campanha Entrega até 08052024 às 23h59 via EAD da disciplina Instruções Esta lista possui seis questões A lista pode ser feita em dupla ou individualmente A lista deve ser entregue em um documento PDF com cada questão resposta con tendo nesta ordem se for o caso 1 Código de R utilizado Formato texto isto é copiar colar o script 2 Tabelas eou figuras com os resultados obtidos Formato pode ser um printscreen recortado da tela por exemplo 3 Interpretação dos resultados Formato texto Entregar em formato diferente de PDF acarretará em penalização Sugestão não obrigatório entregar um relatório em PDF gerado no RMarkdown Alerta alunos ou duplas diferentes com respostas idênticas ou muito similares terão a pontuação da questão zerada 1 Laboratório de Econometria I 20241 Contexto Suponha que você trabalha em uma empresa de análise de dados que foi contratada por um partido político para fazer um levantamento do panorama geral das últimas eleições gerais federais do Brasil As questões desta lista correspondem às tarefas que a empresa designou para você e sua dupla neste projeto Conforme desejo do contratante o foco de vocês na parte I será nos partidos PT e PSLPL na eleições de 2018 e 2022 Já na parte II vocês considerarão todos os partidos políticos nas eleições de 2014 2018 e 2022 Alguns cálculos deverão ser feitos para uma unidade da federação UF específica designada para a dupla ou indivíduo Vocês escolherão a UF de acordo com a planilha a seguir httpsdocsgooglecomspreadsheetsd1fx2m8t19PX2ZwKrEewGivsxVXUMVfOS7j tFIOp1geditgid0 Se você ou sua dupla ainda não colocou seus nomes na planilha acima favor colocar Alguns estados ainda estão livres para vocês escolherem Parte I Nesta primeira parte da lista vamos trabalhar com dados do TSE para votação por partidos nas eleições gerais federais de 2018 e 2022 Para baixar os dados vocês deverão acessar os links httpsdadosabertostsejusbrdatasetresultados2018 httpsdadosabertostsejusbrdatasetresultados2022 e clicar na opção Votação em partido por município e zona em cada link Vocês farão o download de um arquivo zip entitulado votacaopartidomunzonazip no qual encontrarão os arquivos votacaopartidomunzona2018BRASILcsv votacaopartidomunzona2022BRASILcsv Vocês devem usar a base de dados com final BRASILcsv no nome e não as bases de dados específicas de cada UF Para detalhes sobre as bases consultar os arquivos leiamepdf Questão 1 Apresente o código empregado para abrir as bases de dados acima e agrupá las em um único dataframe Conforme descrito no arquivo LEIAME para abrir os da dos de forma adequada você terá que configurar o argumento encoding ou similar para latin1 Reporte o código bem como as dimensões do dataframe final PUCRio Gilberto Boaretto 2 Laboratório de Econometria I 20241 Questão 2 Usando o pacote ggplot2 construa um gráfico que contenha a evolução no tempo do número total de votos para presidente no primeiro turno de PT PSL em 2018 e PT PL em 2022 considerando a todo o país b apenas a região geográfica do estado analisado isto é CentroOeste Nordeste Norte Sudeste ou Sul c apenas o estado analisado Observaçõesorientações importantes Note que o número total de votos de um partido em uma eleição corresponde a soma dos números de votos nominais e na legenda Você deverá construir um gráfico para cada nível geográfico que contenha a evolução no tempo dos partidos de interesse Portanto vocês deverão construir três gráficos nesta questão Você pode escolher o tipo de gráfico da sua preferência isto é o gráfico pode ser de linhas barras colunas etc No item b você deverá deixar explícito no reporte do seu código a lista de estados da federação que compõem a região geográfica à qual o seu estado pertence Desconsidere os casos em que o campo UF é preenchido por BR VT ou ZZ Destaque isso no reporte do código Questão 3 Usando o ggplot2 e considerando todo o território nacional construa um grá fico que contenha a evolução entre 2018 e 2022 da soma da proporção de vitórias no pri meiro turno e participação no segundo turno das eleições para governador de PT e PSL em 2018 e PT e PL em 2022 Interprete os resultados Observação proporção de vitórias no primeiro turno é o número governadores eleitos pelo partido no número total de estados incluindo o distrito federal enquanto participação no segundo turno é o número de candidatos de cada partido que foram para o segundo turno também sobre o número total de estados incluindo o distrito federal Parte II Agora vamos trabalhar com as bases de dados do TSE para candidatos nas eleições gerais federais de 2014 2018 e 2022 Os nomes dos arquivos são consultacand2014BRASILcsv consultacand2018BRASILcsv consultacand2022BRASILcsv PUCRio Gilberto Boaretto 3 Laboratório de Econometria I 20241 e podem ser obtidos clicando na opção Candidatos nos links httpsdadosabertostsejusbrdatasetcandidatos2014 httpsdadosabertostsejusbrdatasetcandidatos2018 httpsdadosabertostsejusbrdatasetcandidatos2022 Tal como antes para detalhes sobre estes arquivos consultar leiamepdf Nesta parte II da lista vocês não irão mais se concentrar nos partidos analisados na parte I Agora vocês devem considerar todos os partidos ao longo das últimas três e não mais duas eleições A análise será mais geral Questão 4 Apresente o código empregado para abrir as bases de dados acima e agrupá las em um único dataframe Conforme descrito no arquivo LEIAME para abrir os da dos de forma adequada você terá que configurar o argumento encoding ou similar para latin1 Reporte o código e as dimensões do dataframe final Questão 5 Usando o pacote ggplot2 construa um gráfico que contenha a evolução tempo ral da participação total de mulheres em percentual em cada um dos três níveis geográficos a seguir todo país região geográfica do estado de interesse estado de interesse para a senador b deputado federal Orientação você deve fazer dois gráficos um para senador considerando os três níveis geo gráficos e outro para deputado federal considerando os três níveis geográficos Descreva brevemente os resultados Questão 6 Usando o pacote ggplot2 construa um gráfico que contenha a evolução da participação total de pessoas não brancas em percentual em cada um dos três níveis geo gráficos a seguir todo país região geográfica do estado de interesse estado de interesse para PUCRio Gilberto Boaretto 4 Laboratório de Econometria I 20241 a senador b deputado federal Vale a orientação da questão anterior e você deve deixar explícito como fez para definir não brancos no código Observação para os cálculos desconsidere as categorias NÃO INFORMADO e NÃO DIVULGÁVEL para a variável DSCORRACA Descreva brevemente os resultados PUCRio Gilberto Boaretto 5 Lista 2 Rafael Emerick 20240508 Parte 1 Nesta primeira parte da lista vamos trabalhar com dados do TSE para votação por partidos nas eleições gerais federais de 2018 e 2022 Questão 1 Exportando os dados por partido no Brasil dados2018 readcsvvotacaopartidomunzona2018BRASILcsv encoding latin1 sep dados2022 readcsvvotacaopartidomunzona2022BRASILcsv encoding latin1 sep Juntando os dois data frame librarytidyverse Warning package tidyverse was built under R version 433 Warning package ggplot2 was built under R version 433 Warning package readr was built under R version 433 Warning package dplyr was built under R version 433 Attaching core tidyverse packages tidyverse 200 dplyr 114 readr 215 forcats 100 stringr 150 ggplot2 350 tibble 321 lubridate 192 tidyr 130 purrr 102 Conflicts tidyverseconflicts dplyrfilter masks statsfilter dplyrlag masks statslag ℹ Use the conflicted package httpconflictedrliborg to force all conflicts to become errors dados bindrowsdados2018 dados2022 dimdados 1 1132630 36 Nesse cado temse que o dada frame formado com a união das informações das eleições de 2018 e 2022 possuí 1132630 observações e 36 variáveis Questão 2 a Para todo o país libraryggplot2 librarydplyr attachdados primeiroturno dados filterNRTURNO 1 filterSGPARTIDO PT SGPARTIDO PSL SGPARTIDO PL filterDSCARGO Presidente groupbySGPARTIDO ANOELEICAO summarisevotos sumQTVOTOSNOMINAISVALIDOS QTVOTOSLEGENDAVALIDOS ungroup summarise has grouped output by SGPARTIDO You can override using the groups argument primeiroturno A tibble 4 3 SGPARTIDO ANOELEICAO votos chr int int 1 PL 2022 51072345 2 PSL 2018 49277010 3 PT 2018 31342051 4 PT 2022 57259504 Plot o Gráfico ggplotprimeiroturno aesx factorANOELEICAO y votos fill SGPARTIDO geombarstat identity position positiondodge scalefillmanualvalues cPSL yellow PL green PT red labels cPSL PSL PL PL PT PT name Partido labsx Ano da Eleição y Número de Votos title Evolução dos Votos para PT PSL 2018 e PT PL 2022 thememinimal scaleycontinuouslabels scalescomma Em 2018 o partido PT obteve um total de 31342051 votos no primeiro turno enquanto o partido PSL teve 49277010 votos Isso significa que o PSL teve aproximadamente 57 a mais de votos que o PT considerando o território nacional Por outro lado em 2022 o PT teve 57259504 votos e o PL teve 51072340 votos Nesse ano o PT obteve cerca de 12 a mais de votos que o PL Esses números indicam mudanças significativas no cenário político entre 2018 e 2022 com uma alteração na distribuição de votos entre os partidos dos candidatos a presidencia que foram para o segundo turno Seria interessante investigar os fatores que contribuíram para essas mudanças ao longo do tempo b Região Nordente ja que o Estado escolhido foi Pernambuco nordeste cAL BA CE MA PB PE PI RN SE dadosN dados filterNRTURNO 1 filterSGPARTIDO PT SGPARTIDO PSL SGPARTIDO PL filterDSCARGO Presidente filterSGUF in nordeste groupbySGPARTIDO ANOELEICAO summarisevotos sumQTVOTOSNOMINAISVALIDOS QTVOTOSLEGENDAVALIDOS ungroup summarise has grouped output by SGPARTIDO You can override using the groups argument dadosN A tibble 4 3 SGPARTIDO ANOELEICAO votos chr int int 1 PL 2022 8787394 2 PSL 2018 7453206 3 PT 2018 14583380 4 PT 2022 21753139 Plot do gráfico ggplotdadosN aesx factorANOELEICAO y votos fill SGPARTIDO geombarstat identity position positiondodge scalefillmanualvalues cPSL yellow PL green PT red labels cPSL PSL PL PL PT PT name Partido labsx Ano da Eleição y Número de Votos title Evolução dos Votos para o Nordeste thememinimal scaleycontinuouslabels scalescomma No Nordeste observase uma tendência de apoio mais forte ao PT em comparação com o PSL em 2018 e o PL em 2022 Essa diferença sugere que a região tem uma dinâmica política distinta do restante do país c Pernambuco dadosPE dados filterNRTURNO 1 filterSGPARTIDO PT SGPARTIDO PSL SGPARTIDO PL filterDSCARGO Presidente filterSGUF PE groupbySGPARTIDO ANOELEICAO summarisevotos sumQTVOTOSNOMINAISVALIDOS QTVOTOSLEGENDAVALIDOS ungroup summarise has grouped output by SGPARTIDO You can override using the groups argument dadosPE A tibble 4 3 SGPARTIDO ANOELEICAO votos chr int int 1 PL 2022 1630938 2 PSL 2018 1444685 3 PT 2018 2309104 4 PT 2022 3558322 Gráfico ggplotdadosPE aesx factorANOELEICAO y votos fill SGPARTIDO geombarstat identity position positiondodge scalefillmanualvalues cPSL yellow PL green PT red labels cPSL PSL PL PL PT PT name Partido labsx Ano da Eleição y Número de Votos title Evolução dos Votos em Pernambuco thememinimal scaleycontinuouslabels scalescomma No estado de Pernambuco observase uma tendência semelhante à da região Nordeste onde a maioria dos votos é direcionada ao PT No entanto há uma dispersão menor em relação aos votos para outros partidos Isso sugere uma forte preferência pelo PT no estado de Pernambuco refletindo possivelmente características políticas sociais ou históricas específicas da região Questão 3 vencedores dados filterNRTURNO 1 filterDSCARGO Governador groupbySGPARTIDO ANOELEICAO SGUF summarisevotos sumQTVOTOSNOMINAISVALIDOS QTVOTOSLEGENDAVALIDOS ungroup groupbySGUF ANOELEICAO mutatetotalvotos sumvotos ungroup mutatepropvotos votostotalvotos filterpropvotos 05 countANOELEICAO SGPARTIDO filterSGPARTIDO PT SGPARTIDO PSL SGPARTIDO PL summarise has grouped output by SGPARTIDO ANOELEICAO You can override using the groups argument vencedores A tibble 3 3 ANOELEICAO SGPARTIDO n int chr int 1 2018 PT 3 2 2022 PL 1 3 2022 PT 3 novalinha dataframe ANOELEICAO 2018 SGPARTIDO PSL n 0 vencedores bindrowsnovalinha vencedores segundoturno dados filterNRTURNO 2 filterDSCARGO Governador groupbyANOELEICAO SGPARTIDO SGUF summariseany 1 ungroup countANOELEICAO SGPARTIDO filterSGPARTIDO PT SGPARTIDO PSL SGPARTIDO PL summarise has grouped output by ANOELEICAO SGPARTIDO You can override using the groups argument vencedoresn vencedoresn segundoturnon Gráfico ggplotvencedores aesx factorANOELEICAO y n fill SGPARTIDO geombarstat identity position positiondodge scalefillmanualvalues cPL green PSL yellow PT red labels cPSL PSL PL PL PT PT name Partido labsx Ano da Eleição y Vitórias em 1º turno Part em 2º title Desempenho em eleições para Governador thememinimal scaleycontinuouslabels scalescomma De acordo com o gráfico de barras podemos observar que tanto em 2018 quanto em 2022 o PT obteve o maior número de governadores eleitos em comparação com os outros partidos Isso indica uma preferência consistente dos eleitores em eleger candidatos do PT para o cargo de governador o que pode refletir a força do partido Parte 2 Agora vamos trabalhar com as bases de dados do TSE para candidatos nas eleições gerais federais de 2014 2018 e 2022 Questão 4 Dados temp readcsvconsultacand2014BRASILcsv nrows 1 colclasses repcharacter lengthtemp cand2014 readcsvconsultacand2014BRASILcsv encoding latin1 sep colClasses colclasses cand2018 readcsvconsultacand2018BRASILcsv encoding latin1 sep colClasses colclasses cand2022 readcsvconsultacand2022BRASILcsv encoding latin1 sep colClasses colclasses cand2022 cand2022 selectintersectnamescand2014 namescand2022 cand bindrowscand2014 cand2018 cand2022 dimcand 1 84872 63 Questão 5 a Senador candsenador cand filterDSCARGO SENADOR mulherespais candsenador groupbyANOELEICAO summarisepropmulheres sumDSGENERO FEMININOn mulheresnordeste candsenador filterSGUF in nordeste groupbyANOELEICAO summarisepropmulheres sumDSGENERO FEMININOn mulheresPernambuco candsenador filterSGUF PE groupbyANOELEICAO summarisepropmulheres sumDSGENERO FEMININOn mulherespaisCategoria Brasil mulheresnordesteCategoria Nordeste mulheresPernambucoCategoria Pernambuco mulheres bindrowsmulherespais mulheresnordeste mulheresPernambuco ggplotmulheres aesx ANOELEICAO y propmulheres fill Categoria geombarstat identity position positiondodge labsx Ano da Eleição y Proporção de Mulheres title Evolução da Proporção de Mulheres para Senador scalefillbrewerpalette Pastel1 thememinimal De acordo com o gráfico de barras para os anos de 2014 2018 e 2022 podemos observar que a proporção de mulheres eleitas para o cargo de senadoras é consistentemente maior no estado de Pernambuco em comparação com o Brasil como um todo e também em relação à região Nordeste Essa diferença é estatisticamente significativa e sugere um padrão distinto de representação de gênero no cenário político de Pernambuco Essa observação pode ser indicativa de um ambiente político mais receptivo à participação feminina no estado destacando a importância das dinâmicas regionais na representação de gênero na política brasileira b Deputado Ferderal candsenador cand filterDSCARGO DEPUTADO FEDERAL mulherespais candsenador groupbyANOELEICAO summarisepropmulheres sumDSGENERO FEMININOn mulheresnordeste candsenador filterSGUF in nordeste groupbyANOELEICAO summarisepropmulheres sumDSGENERO FEMININOn mulheresPernambuco candsenador filterSGUF PE groupbyANOELEICAO summarisepropmulheres sumDSGENERO FEMININOn mulherespaisCategoria Brasil mulheresnordesteCategoria Nordeste mulheresPernambucoCategoria Pernambuco mulheres bindrowsmulherespais mulheresnordeste mulheresPernambuco ggplotmulheres aesx ANOELEICAO y propmulheres fill Categoria geombarstat identity position positiondodge labsx Ano da Eleição y Proporção de Mulheres title Evolução da Proporção de Mulheres para Dep Federal scalefillbrewerpalette Pastel1 thememinimal Em relação às candidatas eleitas para o cargo de deputadas federais observamos que as proporções para o Brasil como um todo a região Nordeste e o estado de Pernambuco não apresentaram variações significativas ao longo do período analisado Isso sugere uma certa estabilidade nas tendências de eleição de mulheres para o cargo de deputadas federais tanto em nível nacional quanto regional incluindo Pernambuco Essa estabilidade pode indicar a existência de fatores estruturais ou culturais que influenciam de forma consistente a participação e a eleição de mulheres para esse cargo político específico Questão 6 a Senador candsenador cand filterDSCARGO SENADOR filterDSCORRACA NÃO INFORMADO DSCORRACA NÃO DIVULGÁVEL brancospais candsenador groupbyANOELEICAO summarisepropbrancos sumDSCORRACA BRANCAn brancosnordeste candsenador filterSGUF in nordeste groupbyANOELEICAO summarisepropbrancos sumDSCORRACA BRANCAn brancosPernambuco candsenador filterSGUF PE groupbyANOELEICAO summarisepropbrancos sumDSCORRACA BRANCAn brancospaisCategoria Brasil brancosnordesteCategoria Nordeste brancosPernambucoCategoria Pernambuco brancos bindrowsbrancospais brancosnordeste brancosPernambuco ggplotbrancos aesx ANOELEICAO y propbrancos fill Categoria geombarstat identity position positiondodge labsx Ano da Eleição y Proporção de Mulheres title Evolução da Proporção de NãoBrancos para Senador scalefillbrewerpalette Pastel1 thememinimal A análise das proporções de senadores não brancos eleitos revela variações ao longo dos anos Em 2014 a região Nordeste apresentou uma proporção maior do que o Brasil e o estado de Pernambuco No entanto em 2018 houve uma mudança significativa com Pernambuco apresentando a maior proporção em relação ao Brasil e à região Nordeste Esse crescimento exponencial na proporção de senadores não brancos eleitos em Pernambuco de 2014 para 2018 é notável e sugere mudanças significativas na representação política do estado nesse período Porém em 2018 é observável uma queda na proporção de senadores não brancos eleitos tanto para o Brasil como um todo quanto para a região Nordeste e principalmente para o estado de Pernambuco Essa queda contrasta com o crescimento anterior e indica uma possível reversão ou estagnação na representação de senadores não brancos após o aumento registrado em 2018 Essas variações destacam a importância de considerar não apenas as tendências ao longo do tempo mas também as diferenças regionais na representação política e sugerem a necessidade de investigar os fatores por trás dessas mudanças para entender melhor a dinâmica da política brasileira em relação à diversidade racial b Deputado Federal candsenador cand filterDSCARGO DEPUTADO FEDERAL filterDSCORRACA NÃO INFORMADO DSCORRACA NÃO DIVULGÁVEL brancospais candsenador groupbyANOELEICAO summarisepropbrancos sumDSCORRACA BRANCAn brancosnordeste candsenador filterSGUF in nordeste groupbyANOELEICAO summarisepropbrancos sumDSCORRACA BRANCAn brancosPernambuco candsenador filterSGUF PE groupbyANOELEICAO summarisepropbrancos sumDSCORRACA BRANCAn brancospaisCategoria Brasil brancosnordesteCategoria Nordeste brancosPernambucoCategoria Pernambuco brancos bindrowsbrancospais brancosnordeste brancosPernambuco ggplotbrancos aesx ANOELEICAO y propbrancos fill Categoria geombarstat identity position positiondodge labsx Ano da Eleição y Proporção de NãoBrancos title Evolução da Proporção de NãoBrancos para Dep Federal scalefillbrewerpalette Pastel1 thememinimal Ao considerar a proporção de Deputados Federais Não Brancos Eleitos observamos uma evolução significativa ao longo dos anos Em 2014 as proporções na região Nordeste e no estado de Pernambuco eram semelhantes e significativamente superiores à proporção nacional No entanto em 2018 e 2022 tornouse mais aparente a diferenciação dessas proporções Em ambas as eleições de 2018 e 2022 a região Nordeste mostrou ter uma proporção maior de deputados federais não brancos eleitos em comparação com o Brasil como um todo Essa diferença foi particularmente marcante em 2022 quando a proporção na região Nordeste ultrapassou 60 Isso significa que em 2022 na região Nordeste a maioria dos deputados federais eleitos era não branca