6
Inteligência Artificial
UMG
23
Inteligência Artificial
UMG
4
Inteligência Artificial
UMG
5
Inteligência Artificial
UMG
4
Inteligência Artificial
UMG
6
Inteligência Artificial
UMG
9
Inteligência Artificial
UMG
4
Inteligência Artificial
UMG
6
Inteligência Artificial
UMG
1
Inteligência Artificial
UMG
Texto de pré-visualização
PROVA ON-LINE Resultados para Laura Visintainer Lerman\n\nPontuação desta tentativa: 60 de 60\nEnviado 16 abr em 19:43\nEsta tentativa levou 12 minutos.\n\nPergunta 1\n\nA classificação de imagens representa uma tarefa fundamental na área de visão computacional, sendo desafiadora tanto devido ao \"gap\" semântico existente entre os dados de entrada e o resultado desejado, quanto às dificuldades oriundas das variações de ponto de vista, iluminação e forma, entre outras. Ao contrário de métodos tradicionais baseados em regras e restrições previamente codificadas, abordagens para a classificação de imagens baseada em dados parecem ter mais sucesso.\n\nMarque a alternativa que não representa uma atividade típica e necessária relacionada a uma abordagem baseada em dados para a classificação de imagens:\n\nCorreto!\nProcessar as imagens para se extrair bordas e contornos para, em seguida, se inferir sobre os objetos representados.\n\nUma abordagem baseada em dados utiliza técnicas de aprendizado de máquina para extração de conhecimento diretamente a partir dos \"dados brutos\" sem a necessidade de seu processamento prévio.\n\nUtilizar um método de aprendizado de máquina para treinar um classificador.\n\nAvali ar o classificador treinado utilizando um conjunto de imagens para teste. Pergunta 2\n\nRecentemente, encontraram-se muitas referências na literatura e na mídia em geral ao uso de aprendizado profundo (ou \"deep learning\").\nMarque a alternativa que representa uma afirmação incorreta:\n\nCorreto!\nA aprendizagem profunda não apresenta nenhuma relação com o aprendizado de máquina, podendo ser vista como uma abordagem alternativa para tarefas em que o aprendizado de máquina não consegue obter bons resultados.\n\nNa verdade, a aprendizagem profunda é um tipo de aprendizado de máquina em que características mais abstratas e semânticas sãorelacionadas às produzidas a partir de características mais simples; sendo então utilizadas para produção de resultados.\n\nA aprendizagem profunda pode ser entendida como um tipo de aprendizagem de representação em que características mais abstratas são inferidas a partir de características mais simples.\n\nNa aprendizagem profunda, conceitos complexos (de níveis mais altos ou abstratos) são definidos em termos de sua relação com conceitos mais simples (em níveis mais baixos).\n\nUma das razões determinantes para o recente sucesso da aprendizagem profunda se encontra na maior disponibilidade de grandes conjuntos de dados para as mais diversas tarefas. Pergunta 3\n\nO aprendizado de máquina estatístico busca construir modelos que sejam eficientes e que forneçam previsões o mais próximo das previsões corretas quanto possível.\nMarque a afirmação correta relacionada ao aprendizado de máquina estatístico:\n\nApesar de ser uma abordagem estatística, apenas os valores associados aos alvos são considerados amostras de uma variável randômica; sendo as observações tratadas de forma distinta.\n\nDenomine-se de modelo a verdadeira distribuição condicional relacionada com as observações.\n\nA função de predição simplifica a tarefa de modelagem, uma vez que assume a existência de um único alvo para cada observação.\n\nUma função de predição associa cada observação a um único alvo e, dessa forma, tende a simplificar o processo de modelagem.\n\nPara se realizar uma predição do alvo y a partir de uma observação x, deve-se conhecer pelo menos a distribuição condicional P(x|y). procura-se alcançar um ponto de mínimo da função de perda utilizando a direção contrária do gradiente.\n\nMarque a alternativa que não representa uma atividade relacionada ao método do gradiente:\n\nAvaliar a função de perda em relação ao conjunto de pesos ou parâmetros atuais.\n\nAjustar o conjunto de pesos ou parâmetros do modelo a obter um novo conjunto, de preferência, mais próximo do ótimo.\n\nCalcular o gradiente da taxa de aprendizado.\n\nNo método do gradiente, deve-se calcular o gradiente da função de perda em relação aos pesos e utilizá-lo juntamente com o tamanho do passo (ou taxa de aprendizado) para se ajustar os pesos de forma a se obter preferencialmente um novo conjunto de pesos ou parâmetros. Não faz nenhum sentido e não é definir o tamanho do passo.\n\nUsar o gradiente da função de perda e o tamanho do passo para modificar os pesos ou parâmetros a cada passo do método. A sigmoide é a função de ativação que historicamente sempre foi mais popular, uma vez que foi interpretada como um modelo para a \"taxa de disparo\" de um neurônio saturado.\n\nMarque a afirmação incorreta relacionada à função sigmoide:\n\nSeu uso pode \"matar\" (ou zerar) o fluxo de gradientes. Tanto o SGD como as suas variações que utilizam outras regras para atualização de pesos possuem a taxa de aprendizado como um hiperparâmetro.\n\nConsiderando o gráfico abaixo, marque a afirmação que relaciona de forma correta a taxa de aprendizado a cada curva de perda:\n\n1=Muito Alta; 2=Boa; 3=Baixa; 4=Alta\n\n1=Baixa; 2=Muito Alta; 3=Alta; 4=Boa. Para a realização de \"dropout\", basta se multiplicar as ativações por variáveis aleatórias de Bernoulli com uma dada probabilidade.\nPergunta 8\nA normalização em lote (\"batch normalization\") faz com que cada dimensão das ativações (isto é, dos resultados de uma camada) se comportem segundo uma distribuição gaussiana com média nula e desvio padrão unitário.\nMarque a alternativa que representa uma afirmação incorreta:\nPermite taxas de aprendizado mais altas.\nReduz a forte dependência da inicialização.\nNão melhora o fluxo gradiente através da rede.\nNa verdade, um dos principais efeitos da adoção da normalização em lote é a melhoria do fluxo de gradientes viabilizando tanto o treinamento de redes com um número maior de camadas quanto um aumento da taxa de aprendizado utilizada nesse processo.\nDurante a predição (ou teste), os valores de média e variância não são calculados com base no lote atual, sendo utilizado um único par fixo de média e variância obtido durante o treinamento. Uma rede neural convolucional geralmente apresenta uma sequência de camadas convolucionais e de agrupamento intercaladas com funções de ativação.\nMarque a alternativa que representa uma afirmação incorreta:\nUma camada convolucional pode aprender múltiplos filtros com um número reduzido de parâmetros devido a suposição de estacionariedade da entrada.\nO filtro de uma camada convolucional não precisa se estender por toda a profundidade do volume de entrada.\nNa verdade, é obrigatório que o filtro se estenda por toda a profundidade do volume de entrada.\nO filtro de uma camada convolucional representa um mecanismo para compartilhar os mesmos parâmetros em diferentes locais, suposto a entrada ser estacionária.\nA camada de convolução \"desliza\" um filtro sobre todas as localizações espaciais da entrada de forma a produzir um mapa de ativação.\nPergunta 10\nAs redes AlexNet e VGG representam dois importantes marcos na evolução das redes neurais profundas aplicadas à tarefa de classificação de imagens.\nMarque a alternativa que representa uma afirmação incorreta:\nA rede VGG foi a primeira a se utilizar da função de ativação ReLU (\"Rectified Linear Unit\"). Na verdade, a rede AlexNet foi a primeira a utilizar a função de ativação ReLU.\nA rede AlexNet alcançou uma redução da taxa de erro de aproximadamente 10%.\nFoi necessário se utilizar de forma intensiva de \"data augmentation\" para treinamento da rede AlexNet.\nA rede VGG introduziu a ideia de se utilizar filtros menores em redes mais profundas, uma vez que eles conseguiram o mesmo efeito e cobertura de filtros maiores utilizando um número menor de parâmetros.\nPontuação do teste: 60 de 60\nhttps://pucminas.instructure.com/courses/86275/quizzes/161242/history?version=1\n9/9
6
Inteligência Artificial
UMG
23
Inteligência Artificial
UMG
4
Inteligência Artificial
UMG
5
Inteligência Artificial
UMG
4
Inteligência Artificial
UMG
6
Inteligência Artificial
UMG
9
Inteligência Artificial
UMG
4
Inteligência Artificial
UMG
6
Inteligência Artificial
UMG
1
Inteligência Artificial
UMG
Texto de pré-visualização
PROVA ON-LINE Resultados para Laura Visintainer Lerman\n\nPontuação desta tentativa: 60 de 60\nEnviado 16 abr em 19:43\nEsta tentativa levou 12 minutos.\n\nPergunta 1\n\nA classificação de imagens representa uma tarefa fundamental na área de visão computacional, sendo desafiadora tanto devido ao \"gap\" semântico existente entre os dados de entrada e o resultado desejado, quanto às dificuldades oriundas das variações de ponto de vista, iluminação e forma, entre outras. Ao contrário de métodos tradicionais baseados em regras e restrições previamente codificadas, abordagens para a classificação de imagens baseada em dados parecem ter mais sucesso.\n\nMarque a alternativa que não representa uma atividade típica e necessária relacionada a uma abordagem baseada em dados para a classificação de imagens:\n\nCorreto!\nProcessar as imagens para se extrair bordas e contornos para, em seguida, se inferir sobre os objetos representados.\n\nUma abordagem baseada em dados utiliza técnicas de aprendizado de máquina para extração de conhecimento diretamente a partir dos \"dados brutos\" sem a necessidade de seu processamento prévio.\n\nUtilizar um método de aprendizado de máquina para treinar um classificador.\n\nAvali ar o classificador treinado utilizando um conjunto de imagens para teste. Pergunta 2\n\nRecentemente, encontraram-se muitas referências na literatura e na mídia em geral ao uso de aprendizado profundo (ou \"deep learning\").\nMarque a alternativa que representa uma afirmação incorreta:\n\nCorreto!\nA aprendizagem profunda não apresenta nenhuma relação com o aprendizado de máquina, podendo ser vista como uma abordagem alternativa para tarefas em que o aprendizado de máquina não consegue obter bons resultados.\n\nNa verdade, a aprendizagem profunda é um tipo de aprendizado de máquina em que características mais abstratas e semânticas sãorelacionadas às produzidas a partir de características mais simples; sendo então utilizadas para produção de resultados.\n\nA aprendizagem profunda pode ser entendida como um tipo de aprendizagem de representação em que características mais abstratas são inferidas a partir de características mais simples.\n\nNa aprendizagem profunda, conceitos complexos (de níveis mais altos ou abstratos) são definidos em termos de sua relação com conceitos mais simples (em níveis mais baixos).\n\nUma das razões determinantes para o recente sucesso da aprendizagem profunda se encontra na maior disponibilidade de grandes conjuntos de dados para as mais diversas tarefas. Pergunta 3\n\nO aprendizado de máquina estatístico busca construir modelos que sejam eficientes e que forneçam previsões o mais próximo das previsões corretas quanto possível.\nMarque a afirmação correta relacionada ao aprendizado de máquina estatístico:\n\nApesar de ser uma abordagem estatística, apenas os valores associados aos alvos são considerados amostras de uma variável randômica; sendo as observações tratadas de forma distinta.\n\nDenomine-se de modelo a verdadeira distribuição condicional relacionada com as observações.\n\nA função de predição simplifica a tarefa de modelagem, uma vez que assume a existência de um único alvo para cada observação.\n\nUma função de predição associa cada observação a um único alvo e, dessa forma, tende a simplificar o processo de modelagem.\n\nPara se realizar uma predição do alvo y a partir de uma observação x, deve-se conhecer pelo menos a distribuição condicional P(x|y). procura-se alcançar um ponto de mínimo da função de perda utilizando a direção contrária do gradiente.\n\nMarque a alternativa que não representa uma atividade relacionada ao método do gradiente:\n\nAvaliar a função de perda em relação ao conjunto de pesos ou parâmetros atuais.\n\nAjustar o conjunto de pesos ou parâmetros do modelo a obter um novo conjunto, de preferência, mais próximo do ótimo.\n\nCalcular o gradiente da taxa de aprendizado.\n\nNo método do gradiente, deve-se calcular o gradiente da função de perda em relação aos pesos e utilizá-lo juntamente com o tamanho do passo (ou taxa de aprendizado) para se ajustar os pesos de forma a se obter preferencialmente um novo conjunto de pesos ou parâmetros. Não faz nenhum sentido e não é definir o tamanho do passo.\n\nUsar o gradiente da função de perda e o tamanho do passo para modificar os pesos ou parâmetros a cada passo do método. A sigmoide é a função de ativação que historicamente sempre foi mais popular, uma vez que foi interpretada como um modelo para a \"taxa de disparo\" de um neurônio saturado.\n\nMarque a afirmação incorreta relacionada à função sigmoide:\n\nSeu uso pode \"matar\" (ou zerar) o fluxo de gradientes. Tanto o SGD como as suas variações que utilizam outras regras para atualização de pesos possuem a taxa de aprendizado como um hiperparâmetro.\n\nConsiderando o gráfico abaixo, marque a afirmação que relaciona de forma correta a taxa de aprendizado a cada curva de perda:\n\n1=Muito Alta; 2=Boa; 3=Baixa; 4=Alta\n\n1=Baixa; 2=Muito Alta; 3=Alta; 4=Boa. Para a realização de \"dropout\", basta se multiplicar as ativações por variáveis aleatórias de Bernoulli com uma dada probabilidade.\nPergunta 8\nA normalização em lote (\"batch normalization\") faz com que cada dimensão das ativações (isto é, dos resultados de uma camada) se comportem segundo uma distribuição gaussiana com média nula e desvio padrão unitário.\nMarque a alternativa que representa uma afirmação incorreta:\nPermite taxas de aprendizado mais altas.\nReduz a forte dependência da inicialização.\nNão melhora o fluxo gradiente através da rede.\nNa verdade, um dos principais efeitos da adoção da normalização em lote é a melhoria do fluxo de gradientes viabilizando tanto o treinamento de redes com um número maior de camadas quanto um aumento da taxa de aprendizado utilizada nesse processo.\nDurante a predição (ou teste), os valores de média e variância não são calculados com base no lote atual, sendo utilizado um único par fixo de média e variância obtido durante o treinamento. Uma rede neural convolucional geralmente apresenta uma sequência de camadas convolucionais e de agrupamento intercaladas com funções de ativação.\nMarque a alternativa que representa uma afirmação incorreta:\nUma camada convolucional pode aprender múltiplos filtros com um número reduzido de parâmetros devido a suposição de estacionariedade da entrada.\nO filtro de uma camada convolucional não precisa se estender por toda a profundidade do volume de entrada.\nNa verdade, é obrigatório que o filtro se estenda por toda a profundidade do volume de entrada.\nO filtro de uma camada convolucional representa um mecanismo para compartilhar os mesmos parâmetros em diferentes locais, suposto a entrada ser estacionária.\nA camada de convolução \"desliza\" um filtro sobre todas as localizações espaciais da entrada de forma a produzir um mapa de ativação.\nPergunta 10\nAs redes AlexNet e VGG representam dois importantes marcos na evolução das redes neurais profundas aplicadas à tarefa de classificação de imagens.\nMarque a alternativa que representa uma afirmação incorreta:\nA rede VGG foi a primeira a se utilizar da função de ativação ReLU (\"Rectified Linear Unit\"). Na verdade, a rede AlexNet foi a primeira a utilizar a função de ativação ReLU.\nA rede AlexNet alcançou uma redução da taxa de erro de aproximadamente 10%.\nFoi necessário se utilizar de forma intensiva de \"data augmentation\" para treinamento da rede AlexNet.\nA rede VGG introduziu a ideia de se utilizar filtros menores em redes mais profundas, uma vez que eles conseguiram o mesmo efeito e cobertura de filtros maiores utilizando um número menor de parâmetros.\nPontuação do teste: 60 de 60\nhttps://pucminas.instructure.com/courses/86275/quizzes/161242/history?version=1\n9/9