3
Linguagens de Programação
ESPM
42
Linguagens de Programação
ESPM
20
Linguagens de Programação
ESPM
5
Linguagens de Programação
ESPM
3
Linguagens de Programação
ESPM
19
Linguagens de Programação
ESPM
1
Linguagens de Programação
ESPM
14
Linguagens de Programação
ESPM
1
Linguagens de Programação
ESPM
42
Linguagens de Programação
ESPM
Texto de pré-visualização
Organização e visualização Prof Cléber da Costa Figueiredo Atividade de revisão a Crie um dataframe que contenha duas colunas uma chamada Animais e a outra chamada Alimentos A primeira coluna deve ser o vetor observe os valores repetidos intencionalmente Cachorro Gato Peixe Peixe Lagarto A segunda coluna deve ser o vetor Pão Laranja Chocolate Cenoura Leite b Salve o dataframe com a extensão csv numa pasta na sua área de trabalho configurada para receber diretamente os arquivos da disciplina sem que seja necessário indicar o caminho path O pacote tidyverse É um pacote muito utilizado para a organização de dados e principalmente para a manipulação data wrangling installpackagestidyverse librarytidyverse O conceito de tidy data Os dados são ditos organizados quando Cada variável está numa coluna Cada observação está em uma linha Cada célula possui um único valor Happy families are all alike every unhappy family is unhappy in its own way Leo Tolstoy vignettetidydata Principais problemas de dados desorganizados O cabeçalho da coluna não possui o nome da variável Mais do que uma variável aparece por coluna Variáveis estão dispostas em linhas e colunas A unidades aparecem em celulas mescladas CCES Cooperative Congressional Election Survey Vamos usar os dados de uma pesquisa coletada nos EUA que é um fragmento de uma pesquisa acadêmica muito maior conduzida por vários cientistas políticos Primeiro configure seu diretório de trabalho setwdCaulas Windows setwdDesktop Mac Segundo faça a leitura dos dados cces readcsvccessamplecsv Algumas funções úteis Eliminação de dados faltantes missings cces dropnacces Suponha que o interesse seja examinar o nível educacional das mulheres com forte inclinação aos ideais republicanos Uso de filtros women filtercces gender2 Operadores lógicos Algumas funções úteis dimcces dimwomen tableccesgender womengender republicanwomen filtercces gender2 pid74 dimrepublicanwomen tablerepublicanwomenpid7 Algumas funções úteis Para selecionar apenas algumas colunas dos dados selectrepublicanwomeneducemploy Combinar vários comandos em uma única linha de comando Usamos o conceito de piping x fy é o mesmo que fx y y fx z é o mesmo que fx y z womenrepublicanseducemploy cces filtergender2 pid74 selecteducemploy Algumas funções úteis Para reordenar segundo algum critério sortedbygenderandparty cces arrangegenderpid7 Viewsortedbygenderandparty sortedbygenderandparty cces arrangegenderdescpid7 Viewsortedbygenderandparty Algumas funções úteis Para recodificar variáveis party recodeccespid7 1Democrat 2Democrat 3Democrat 4Independent 5Republican 6Republican 7Republican ccesparty party Valores antigos Valores novos Algumas funções úteis Para renomear variáveis test renamecces trumpapprovalCC18308a testtrumpapproval cces test ccestrumpapproval A função summarise é a que mais se aproxima de uma tabela dinâmica summariseccesmeanpid7meanpid7meanfamincmeanfamincnew groupedgender cces groupbygender summarisegroupedgender meanpid7meanpid7 meanfamincmeanfamincnew Exercícios 1 Use o comando select para criar um subconjunto dos dados que inclua somente as colunas escolaridade educational level se o respondente tem algum financiamento educacional educational loan situação de trabalho employment status e aprovação ao Governo Trump approval Apresente o objeto Dica consulte o dicionário de variáveis para identificar as variáveis corretas 2 Use o comando recode para criar uma nova coluna no objeto anterior chamada trumpapprovedisapprove que recodifica a variável President Trumps job approval Um valor igual a 1 deve significar que o respondente ou strongly ou somewhat aprova o Governo e o valor 0 deve significar que o respondente ou strongly ou somewhat desaprova o Governo Trump Apresente os resultados do objeto no console 3 Use summarise para criar um sumário dos respondentes que estão empregados em tempo integral e são casados A tabela deve apresentar a média e a mediana da importância dada a religião Para semana que vem Para a próxima aula precisaremos ter o LaTex instalado no RStudio LaTex é a linguagem utilizada para compilar os relatórios do R Markdown em PDF installpackagestinytex Baixar o pacote tinytexinstalltinytex Instalálo
3
Linguagens de Programação
ESPM
42
Linguagens de Programação
ESPM
20
Linguagens de Programação
ESPM
5
Linguagens de Programação
ESPM
3
Linguagens de Programação
ESPM
19
Linguagens de Programação
ESPM
1
Linguagens de Programação
ESPM
14
Linguagens de Programação
ESPM
1
Linguagens de Programação
ESPM
42
Linguagens de Programação
ESPM
Texto de pré-visualização
Organização e visualização Prof Cléber da Costa Figueiredo Atividade de revisão a Crie um dataframe que contenha duas colunas uma chamada Animais e a outra chamada Alimentos A primeira coluna deve ser o vetor observe os valores repetidos intencionalmente Cachorro Gato Peixe Peixe Lagarto A segunda coluna deve ser o vetor Pão Laranja Chocolate Cenoura Leite b Salve o dataframe com a extensão csv numa pasta na sua área de trabalho configurada para receber diretamente os arquivos da disciplina sem que seja necessário indicar o caminho path O pacote tidyverse É um pacote muito utilizado para a organização de dados e principalmente para a manipulação data wrangling installpackagestidyverse librarytidyverse O conceito de tidy data Os dados são ditos organizados quando Cada variável está numa coluna Cada observação está em uma linha Cada célula possui um único valor Happy families are all alike every unhappy family is unhappy in its own way Leo Tolstoy vignettetidydata Principais problemas de dados desorganizados O cabeçalho da coluna não possui o nome da variável Mais do que uma variável aparece por coluna Variáveis estão dispostas em linhas e colunas A unidades aparecem em celulas mescladas CCES Cooperative Congressional Election Survey Vamos usar os dados de uma pesquisa coletada nos EUA que é um fragmento de uma pesquisa acadêmica muito maior conduzida por vários cientistas políticos Primeiro configure seu diretório de trabalho setwdCaulas Windows setwdDesktop Mac Segundo faça a leitura dos dados cces readcsvccessamplecsv Algumas funções úteis Eliminação de dados faltantes missings cces dropnacces Suponha que o interesse seja examinar o nível educacional das mulheres com forte inclinação aos ideais republicanos Uso de filtros women filtercces gender2 Operadores lógicos Algumas funções úteis dimcces dimwomen tableccesgender womengender republicanwomen filtercces gender2 pid74 dimrepublicanwomen tablerepublicanwomenpid7 Algumas funções úteis Para selecionar apenas algumas colunas dos dados selectrepublicanwomeneducemploy Combinar vários comandos em uma única linha de comando Usamos o conceito de piping x fy é o mesmo que fx y y fx z é o mesmo que fx y z womenrepublicanseducemploy cces filtergender2 pid74 selecteducemploy Algumas funções úteis Para reordenar segundo algum critério sortedbygenderandparty cces arrangegenderpid7 Viewsortedbygenderandparty sortedbygenderandparty cces arrangegenderdescpid7 Viewsortedbygenderandparty Algumas funções úteis Para recodificar variáveis party recodeccespid7 1Democrat 2Democrat 3Democrat 4Independent 5Republican 6Republican 7Republican ccesparty party Valores antigos Valores novos Algumas funções úteis Para renomear variáveis test renamecces trumpapprovalCC18308a testtrumpapproval cces test ccestrumpapproval A função summarise é a que mais se aproxima de uma tabela dinâmica summariseccesmeanpid7meanpid7meanfamincmeanfamincnew groupedgender cces groupbygender summarisegroupedgender meanpid7meanpid7 meanfamincmeanfamincnew Exercícios 1 Use o comando select para criar um subconjunto dos dados que inclua somente as colunas escolaridade educational level se o respondente tem algum financiamento educacional educational loan situação de trabalho employment status e aprovação ao Governo Trump approval Apresente o objeto Dica consulte o dicionário de variáveis para identificar as variáveis corretas 2 Use o comando recode para criar uma nova coluna no objeto anterior chamada trumpapprovedisapprove que recodifica a variável President Trumps job approval Um valor igual a 1 deve significar que o respondente ou strongly ou somewhat aprova o Governo e o valor 0 deve significar que o respondente ou strongly ou somewhat desaprova o Governo Trump Apresente os resultados do objeto no console 3 Use summarise para criar um sumário dos respondentes que estão empregados em tempo integral e são casados A tabela deve apresentar a média e a mediana da importância dada a religião Para semana que vem Para a próxima aula precisaremos ter o LaTex instalado no RStudio LaTex é a linguagem utilizada para compilar os relatórios do R Markdown em PDF installpackagestinytex Baixar o pacote tinytexinstalltinytex Instalálo