·

Sistemas de Informação ·

Estrutura de Dados

Send your question to AI and receive an answer instantly

Ask Question

Preview text

UNIVERSIDADE PRESBITERIANA MACKENZIE Decanato Acadêmico UNIDADE UNIVERSITÁRIA FACULDADE DE COMPUTAÇÃO E INFORMÁTICA FCI CURSO CIÊNCIA DA COMPUTAÇÃO DISCIPLINA CIÊNCIA DE DADOS ANOSEMESTRE 202302 PROFESSOR EDUARDO FERREIRA DOS SANTOS PROJETO 1 CIÊNCIA DE DADOS RESUMO O desenvolvimento da ciência de dados tem sua origem em ideias de Inteligência Artificial aprendizagem de máquina reconhecimento de padrões estatística e bancos de dados Desde os anos 90 até o começo dos anos 2000 várias metodologias surgiram para estruturar o trabalho a ser realizado com os dados dentre elas a metodologia CRISPDM A atividade tem como objetivo aplicar o modelo proposto pela metodologia para o desenvolvimento de um projeto real de ciência de dados OBJETIVOS Objetivo Geral Aplicar a metodologia CRISPDM para executar um projeto de ciência de dados Objetivos Específicos 1 Exercitar a construção das hipóteses de negócio 2 Realizar análise descritiva de um cenário de negócios 3 Implementar um modelo preditivo 4 Exercitar apresentação de sumário executivo ORGANIZAÇÃO DO TRABALHO Grupos O trabalho poderá ser realizado em grupos de até 3 alunos Apesar do trabalho ser em grupo a produção deve ser individual Assim deve ficar claro e explícito em todas as etapas do trabalho a contribuição individual de cada um METODOLOGIA PROJETO A Figura 1 apresenta a metodologia CRISPDM para projetos de Mineração de Dados que consiste em seis etapas 1 Entendimento do negócio 2 Entendimento dos dados UNIVERSIDADE PRESBITERIANA MACKENZIE Decanato Acadêmico METODOLOGIA 3 Préprocessamento 4 Modelagem 5 Avaliação dos resultados 6 Lançamento em produção deploy Figura 1 Modelo CRISPDM Construa um projeto de ciência de dados escolhendo uma fonte de dados e problema de sua preferência contemplando as cinco primeiras etapas Não é necessário executar a sexta lançamento em produção Requisitos Todos os fontes e artefatos produzidos para a disciplina devem ser disponibilizados no UNIVERSIDADE PRESBITERIANA MACKENZIE Decanato Acadêmico METODOLOGIA momento da entrega em um único pacote Não serão aceitas entregas realizadas em fontes externas Não deve haver nenhuma dependência proprietária para execução de qualquer etapa do projeto Se atente às dependências Não existe requisito de linguagem de programação Documentação O projeto entregue deve conter um ou mais arquivos no formato do Jupyter com evidências relativas à execução de todas as etapas do problema Não existe um formato padrão apenas a documentação das etapas é necessária Avaliação No dia da entrega será realizada uma avaliação individual dos trabalhos pelo professor com os grupos onde a execução do projeto com sucesso é um requisito para a avaliação Caso o projeto não seja capaz de cumprir o objetivo proposto o grupo deve justificar os motivos da falha e explicar mostrando o códigofonte o quão perto conseguiram chegar da solução Entrega O grupo deverá submeter os artefatos na tarefa do Moodle aberta para o tema Deverão constar Pacote contendo todos os artefatos produzidos Nome dos componentes do grupo Observações de ordem geral Os prazos para entrega não serão estendidos então fiquem atentos às datas Apesar de não haver restrição de linguagem toda escolha tecnológica deve ser justificada durante o desenvolvimento do trabalho Caso não seja possível identificar qual foi a contribuição individual de cada aluno todos terão a nota 0 zero atribuída ao trabalho RECURSOS DIDÁTICOS Comunicação entre aluno e professor Email eduardoeduardosancom Whatsapp Moodle O Moodle será utilizado para comunicar informações sobre datas das avaliações plano de ensino menção do aluno faltas do aluno e possíveis ausências ou atrasos do professor O fórum da disciplina poderá ser utilizado para comunicar informações sobre plano de ensino datas das avaliações lista de exercícios trabalhos aplicativos e materiais de ensino em geral UNIVERSIDADE PRESBITERIANA MACKENZIE Decanato Acadêmico BIBLIOGRAFIA BÁSICA FACELI K LORENA A C GAMA J CARVALHO A C P L F Inteligência Artificial Uma Abordagem de Aprendizado de Máquina 1 ed Editora LTC 2011 SILVA AS PERES SM BOSCARIOLI C Introdução a Mineração de dados Com aplicações em R 1ª ed Editora Elsevier 2016 WITTEN I H EIBE F MARK A H Data Mining Practical Machine Learning Tools and Techniques 4a ed Editora Morgan Kaufmann 2016 COMPLEMENTAR TAN PN STEINBACH M and KUMAR V Introduction to data mining 2a Edição Pearson Education India 2016 FAYYAD Usama From Data Mining to Knowledge Discovery in Databases AI Magazine 17 no 3 1996 18