5
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
4
Bases de Dados
UNOPAR
8
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
5
Bases de Dados
UMG
6
Bases de Dados
UMG
6
Bases de Dados
UMG
Texto de pré-visualização
Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados\nProfessor: Vitor Vasconcelos de Almeida Sâs (Especialização)\nPrepare-se! Chegou a hora de testar o conhecimento adquirido nesta disciplina. A Avaliação (VIA) é composta por questões objetivas e corresponde a 100% da média final. Você terá cinco tentativas para \"enviar\" as questões, que são automaticamente corrigidas. Você pode responder às questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!\n1) A respeito de otimização de programação R, avalie a afirmativa a seguir para completar suas lacunas corretamente.\nEm se tratando de otimização da linguagem R em _____________, os programas afirmam que esta é uma questão crítica, pois, em muitas situações, os programas podem demorar um longo período de tempo para realizar ____________ de algumas tarefas (HOLBIG; MAZONETO, PAIVA, 2017). Por isso, diz-se que a otimização um amplo atenção com a intenção do produtor scripts apropriados, que possam otimizar o desempenho.\nReferência: HOLBIG, C.; MAZONETO, A.; PAIWAN, W. Computação paralela com a linguagem R: técnicas, ferramentas e aplicações. Minicurso. 17º Escola Regional de Alto Desempenho de Cálculo do Rio Grande do Sul. Análise. p. 25-42, 15 set. 2017. Disponível em: http://www.cenpes.gov.br/edard/2017/003.pdf. Acesso em: 29 nov. 2019. Assinale a alternativa correta que complete adequadamente as lacunas acima.\nAlternativas:\nProcessos; final; programas.\nComputadores; final; programas.\nComputadores; execução; correto.\nComputadores; final; execução.\n\n2) Um sistema distribuído P2P possui características próprias que o difere de um sistema centralizado. Existem três características técnicas importantes de um sistema P2P, as quais se referem a auto-organização e adaptabilidade. Qual a terceira característica de um sistema P2P?\nAssinale a alternativa CORRETA.\nAlternativas:\nEscalabilidade.\nAdaptabilidade.\nRegeneração.\nPotencialidade.\nCluster.\nResolução comentada:\nA terceira característica técnica de um sistema P2P é a escalabilidade. 3) Sobre o processamento paralelo, avalie a afirmativa a seguir para completar corretamente suas lacunas.\nEm um processamento paralelo, a maneira como os processadores e dispositivos de memória realizam comunicação entre si e o que define (o) __________ de máquinas paralelas (MEYER, 2006). Segundo o autor, os principais modelos de memória são ___________.\nReferência: MEYER, L. A. V. C. Uma visão geral dos sistemas distribuídos de cluster e grid e suas ferramentas para o processamento paralelo de dados. 2006. IBGE [s.d.]. Disponível em: https://www.censos.gov.br/... Acesso em: 17 set. 2019. Assinale a alternativa que complete adequadamente as lacunas acima.\nAlternativas:\nArquitetura; memória; compartilhado; distribuído. CORRETO\nArquitetura; memória; privada; distribuído.\nArquitetura; compartilhado; desempenho.\nProcessamento; processamento; paralelo; desempenho.\nResolução comentada:\nEm processamento paralelo, a maneira como os processadores e dispositivos de memória realizam comunicação entre si é o que define a arquitetura de máquinas paralelas (MEYER, 2006). Segundo o autor, os principais modelos de memória são compartilhados e distribuídos. 4) A análise do desempenho de sistemas paralelos é importante por uma série de justificativas que podem ser elencadas. Sobre as características da análise de desempenho, assinale duas afirmativas a seguir, sendo correta a última.\nFALSA: O custo de manutenção de dados é uma vantagem, porque há a necessidade de armazenamento de dados em disco.\nV – A falta de escalabilidade é uma das principais desvantagens.\nV – V – F – V – V.\nV – V – F – V – F. CORRETO\nResolução comentada:\nA abordagem omite não é conhecida como abordagem post-mortem, esse termo se refere a abordagem offline. A ausência de custo de manutenção de dados é uma das principais características. O custo de manutenção de dados é uma vantagem porque NÃO há a necessidade de escalonamento de dados em disco. A falta de escalabilidade é uma das principais desvantagens. Uma das características é a necessidade de gravação de informações durante a execução. PORQUE\n\nIII. Um sistema de arquivos distribuídos permite às aplicações a possibilidade de armazenamento e de acesso a arquivos diversos de forma remota como se fossem arquivos locais.\n\nAssinale a alternativa acerca das assertivas supracitadas, bem como a relação entre elas.\n\nAlternativas:\n\nAs assertivas I e II estão corretas, e a assertiva II justifica a assertiva I.\nAs assertivas I e II estão incorretas.\n\nA assertiva I está correta, a assertiva II está correta.\nA assertiva I está correta, a assertiva II está incorreta.\nA assertiva I está correta, mas a II não a justificativa da I. \n\n\nResolucao comentada:\nEssas classificações de dados ficaram populares, principalmente, a partir de 1993 com a explosão da internet, e não param de crescer desde então. Sua abordagem de grupo permite as aplicações a possibilidade de armazenamento e de acesso a arquivos diversos de forma remota como se fossem arquivos locais.\n\nCódigo da questão: 50709\n\n8) A partir da classificação dos tipos de dashboards, não existe uma homogeneidade. No entanto, de forma geral, existem três tipos: operacional, tático e estratégico. Sobre os dashboards táticos, afirma-se que permitem a seguir para completar suas lacunas corretamente. Dashboards táticos são painéis compostos por informações que conseguem permitir que os gestores direcionem recursos para que os objetivos previamente estabelecidos possam ser alcançados em ________ prazo. Seu público-alvo principal são as gerências departamentais dos negócios de uma empresa.\n\nAlternativas:\n\nGestores; médio; operações.\nGestores; médio; gerências.\nExecutivos; médio; gerências.\nExecutivos; longo; operações.\nGestores; longo; operações.\n\nResolucao comentada:\nDashboards táticos são painéis compostos por informações que conseguem permitir que os gestores direcionem recursos para que os objetivos previamente estabelecidos possam ser alcançados em médio prazo. Seu público-alvo principal são as gerências departamentais dos negócios de uma empresa.\nCódigo da questão: 50711\n\n9) Sobre o conceito de data lake, avalie as assertivas a seguir e a relação existente entre elas.\n1. É necessário, o Data Lake pode ser dividido em três camadas separadas: uma para dados brutos, outra para conjuntos de dados alimentados diariamente e outra para informações de terceiros. Esta abordagem possibilita dividir o Data Lake em três partes de acordo com sua vida útil dos dados em seis meses: dados mais antigos, mais ainda ativos, e dados renovados para outras mídias (MILOSLAVSKAYA; TOLSTOY, 2016).\n\nPORQUE\n\nA data lake observatório possivel sua divisão e Data Lake em três partes de acordo com sua vida útil dos dados em seis meses: dados mais antigos, mais ainda ativos, e dados renovados para outras mídias, que precisam ser retirados (esses dados obsoletos podem ser removidos para outras mídias).\n(MILOSLAVSKAYA; TOLSTOY, 2016). A Big data; fast data data and data lake concepts. Procedia Engineering, 88(2016), 300–305. Disponível em: https://www.sciencedirect.com/science/article/pii/S1877050916316957. Acesso em: 29 nov. 2019.\n\nAssinale a alternativa acerca das assertivas supracitadas, bem como a relação entre elas:\n\nAlternativas:\n\nA assertiva I está correta, a assertiva II está incorreta. \nAs assertivas I e II estão corretas, mas a assertiva II não justifica a I. \nA assertiva I está correta, a assertiva I está correta. \nAs assertivas I e II estão incorretas.\n\nResolucao comentada:\nÉ necessário, o Data Lake pode ser dividido em três camadas separadas: uma para dados brutos, outra para conjuntos de dados alimentados diariamente e outra para informações de terceiros. Esta abordagem possibilita dividir o Data Lake em três partes de acordo com sua vida útil dos dados em seis meses: dados mais antigos, mais ainda ativos, e dados renovados para outras mídias (MILOSLAVSKAYA; TOLSTOY, 2016).\n\nCódigo da questão: 50729\n\n10) A análise de desempenho de aplicações paralelas pode combinar duas fases de análise. Uma delas é o detalhe a parte dos registros de forma simultânea com a análise em si. Qual é o nome desta alternativa CORRETA.\n\nAlternativas:\n\nCronometragem.\nAmostragem.\nEfeito de sonda.\n\nResolucao comentada:\nA análise de desempenho de sistemas paralelos pode combinar duas fases, uma delas, a abordagem online, permite que a coleta de observação e registro ocorra simultaneamente com a análise do sistema.
5
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
4
Bases de Dados
UNOPAR
8
Bases de Dados
UNOPAR
5
Bases de Dados
UNOPAR
5
Bases de Dados
UMG
6
Bases de Dados
UMG
6
Bases de Dados
UMG
Texto de pré-visualização
Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados\nProfessor: Vitor Vasconcelos de Almeida Sâs (Especialização)\nPrepare-se! Chegou a hora de testar o conhecimento adquirido nesta disciplina. A Avaliação (VIA) é composta por questões objetivas e corresponde a 100% da média final. Você terá cinco tentativas para \"enviar\" as questões, que são automaticamente corrigidas. Você pode responder às questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!\n1) A respeito de otimização de programação R, avalie a afirmativa a seguir para completar suas lacunas corretamente.\nEm se tratando de otimização da linguagem R em _____________, os programas afirmam que esta é uma questão crítica, pois, em muitas situações, os programas podem demorar um longo período de tempo para realizar ____________ de algumas tarefas (HOLBIG; MAZONETO, PAIVA, 2017). Por isso, diz-se que a otimização um amplo atenção com a intenção do produtor scripts apropriados, que possam otimizar o desempenho.\nReferência: HOLBIG, C.; MAZONETO, A.; PAIWAN, W. Computação paralela com a linguagem R: técnicas, ferramentas e aplicações. Minicurso. 17º Escola Regional de Alto Desempenho de Cálculo do Rio Grande do Sul. Análise. p. 25-42, 15 set. 2017. Disponível em: http://www.cenpes.gov.br/edard/2017/003.pdf. Acesso em: 29 nov. 2019. Assinale a alternativa correta que complete adequadamente as lacunas acima.\nAlternativas:\nProcessos; final; programas.\nComputadores; final; programas.\nComputadores; execução; correto.\nComputadores; final; execução.\n\n2) Um sistema distribuído P2P possui características próprias que o difere de um sistema centralizado. Existem três características técnicas importantes de um sistema P2P, as quais se referem a auto-organização e adaptabilidade. Qual a terceira característica de um sistema P2P?\nAssinale a alternativa CORRETA.\nAlternativas:\nEscalabilidade.\nAdaptabilidade.\nRegeneração.\nPotencialidade.\nCluster.\nResolução comentada:\nA terceira característica técnica de um sistema P2P é a escalabilidade. 3) Sobre o processamento paralelo, avalie a afirmativa a seguir para completar corretamente suas lacunas.\nEm um processamento paralelo, a maneira como os processadores e dispositivos de memória realizam comunicação entre si e o que define (o) __________ de máquinas paralelas (MEYER, 2006). Segundo o autor, os principais modelos de memória são ___________.\nReferência: MEYER, L. A. V. C. Uma visão geral dos sistemas distribuídos de cluster e grid e suas ferramentas para o processamento paralelo de dados. 2006. IBGE [s.d.]. Disponível em: https://www.censos.gov.br/... Acesso em: 17 set. 2019. Assinale a alternativa que complete adequadamente as lacunas acima.\nAlternativas:\nArquitetura; memória; compartilhado; distribuído. CORRETO\nArquitetura; memória; privada; distribuído.\nArquitetura; compartilhado; desempenho.\nProcessamento; processamento; paralelo; desempenho.\nResolução comentada:\nEm processamento paralelo, a maneira como os processadores e dispositivos de memória realizam comunicação entre si é o que define a arquitetura de máquinas paralelas (MEYER, 2006). Segundo o autor, os principais modelos de memória são compartilhados e distribuídos. 4) A análise do desempenho de sistemas paralelos é importante por uma série de justificativas que podem ser elencadas. Sobre as características da análise de desempenho, assinale duas afirmativas a seguir, sendo correta a última.\nFALSA: O custo de manutenção de dados é uma vantagem, porque há a necessidade de armazenamento de dados em disco.\nV – A falta de escalabilidade é uma das principais desvantagens.\nV – V – F – V – V.\nV – V – F – V – F. CORRETO\nResolução comentada:\nA abordagem omite não é conhecida como abordagem post-mortem, esse termo se refere a abordagem offline. A ausência de custo de manutenção de dados é uma das principais características. O custo de manutenção de dados é uma vantagem porque NÃO há a necessidade de escalonamento de dados em disco. A falta de escalabilidade é uma das principais desvantagens. Uma das características é a necessidade de gravação de informações durante a execução. PORQUE\n\nIII. Um sistema de arquivos distribuídos permite às aplicações a possibilidade de armazenamento e de acesso a arquivos diversos de forma remota como se fossem arquivos locais.\n\nAssinale a alternativa acerca das assertivas supracitadas, bem como a relação entre elas.\n\nAlternativas:\n\nAs assertivas I e II estão corretas, e a assertiva II justifica a assertiva I.\nAs assertivas I e II estão incorretas.\n\nA assertiva I está correta, a assertiva II está correta.\nA assertiva I está correta, a assertiva II está incorreta.\nA assertiva I está correta, mas a II não a justificativa da I. \n\n\nResolucao comentada:\nEssas classificações de dados ficaram populares, principalmente, a partir de 1993 com a explosão da internet, e não param de crescer desde então. Sua abordagem de grupo permite as aplicações a possibilidade de armazenamento e de acesso a arquivos diversos de forma remota como se fossem arquivos locais.\n\nCódigo da questão: 50709\n\n8) A partir da classificação dos tipos de dashboards, não existe uma homogeneidade. No entanto, de forma geral, existem três tipos: operacional, tático e estratégico. Sobre os dashboards táticos, afirma-se que permitem a seguir para completar suas lacunas corretamente. Dashboards táticos são painéis compostos por informações que conseguem permitir que os gestores direcionem recursos para que os objetivos previamente estabelecidos possam ser alcançados em ________ prazo. Seu público-alvo principal são as gerências departamentais dos negócios de uma empresa.\n\nAlternativas:\n\nGestores; médio; operações.\nGestores; médio; gerências.\nExecutivos; médio; gerências.\nExecutivos; longo; operações.\nGestores; longo; operações.\n\nResolucao comentada:\nDashboards táticos são painéis compostos por informações que conseguem permitir que os gestores direcionem recursos para que os objetivos previamente estabelecidos possam ser alcançados em médio prazo. Seu público-alvo principal são as gerências departamentais dos negócios de uma empresa.\nCódigo da questão: 50711\n\n9) Sobre o conceito de data lake, avalie as assertivas a seguir e a relação existente entre elas.\n1. É necessário, o Data Lake pode ser dividido em três camadas separadas: uma para dados brutos, outra para conjuntos de dados alimentados diariamente e outra para informações de terceiros. Esta abordagem possibilita dividir o Data Lake em três partes de acordo com sua vida útil dos dados em seis meses: dados mais antigos, mais ainda ativos, e dados renovados para outras mídias (MILOSLAVSKAYA; TOLSTOY, 2016).\n\nPORQUE\n\nA data lake observatório possivel sua divisão e Data Lake em três partes de acordo com sua vida útil dos dados em seis meses: dados mais antigos, mais ainda ativos, e dados renovados para outras mídias, que precisam ser retirados (esses dados obsoletos podem ser removidos para outras mídias).\n(MILOSLAVSKAYA; TOLSTOY, 2016). A Big data; fast data data and data lake concepts. Procedia Engineering, 88(2016), 300–305. Disponível em: https://www.sciencedirect.com/science/article/pii/S1877050916316957. Acesso em: 29 nov. 2019.\n\nAssinale a alternativa acerca das assertivas supracitadas, bem como a relação entre elas:\n\nAlternativas:\n\nA assertiva I está correta, a assertiva II está incorreta. \nAs assertivas I e II estão corretas, mas a assertiva II não justifica a I. \nA assertiva I está correta, a assertiva I está correta. \nAs assertivas I e II estão incorretas.\n\nResolucao comentada:\nÉ necessário, o Data Lake pode ser dividido em três camadas separadas: uma para dados brutos, outra para conjuntos de dados alimentados diariamente e outra para informações de terceiros. Esta abordagem possibilita dividir o Data Lake em três partes de acordo com sua vida útil dos dados em seis meses: dados mais antigos, mais ainda ativos, e dados renovados para outras mídias (MILOSLAVSKAYA; TOLSTOY, 2016).\n\nCódigo da questão: 50729\n\n10) A análise de desempenho de aplicações paralelas pode combinar duas fases de análise. Uma delas é o detalhe a parte dos registros de forma simultânea com a análise em si. Qual é o nome desta alternativa CORRETA.\n\nAlternativas:\n\nCronometragem.\nAmostragem.\nEfeito de sonda.\n\nResolucao comentada:\nA análise de desempenho de sistemas paralelos pode combinar duas fases, uma delas, a abordagem online, permite que a coleta de observação e registro ocorra simultaneamente com a análise do sistema.