·
Cursos Gerais ·
Análise de Algoritmos
Send your question to AI and receive an answer instantly
Recommended for you
1
Funções de Teste em Código
Análise de Algoritmos
PUC
7
Prova de Algoritmos - Pontifícia Universidade Católica de Minas Gerais
Análise de Algoritmos
PUC
1
Código de Testes com Badd
Análise de Algoritmos
PUC
2
Relatorio Analise Tecnica e Reflexoes sobre IA e o Futuro do Trabalho
Análise de Algoritmos
PUC
10
Código em Java ajuda com Término do Códdigo
Análise de Algoritmos
PUC
2
Trabalho Prático: Sistema de Gestão de Pedidos para Mercados - AED I
Análise de Algoritmos
PUC
2
Exercicios Resolvidos sobre 2SAT e K-Tesselação em Grafos
Análise de Algoritmos
PUC
94
Projeto e Análise de Algoritmos: Teoria dos Grafos
Análise de Algoritmos
PUC
59
Projeto e Análise de Algoritmos: Grafos Hamiltonianos e Problemas Relacionados
Análise de Algoritmos
PUC
1
Trabalho Pratico Algoritmos em Grafos Busca em Largura Profundidade Hamiltoniano Euleriano e Unicursal
Análise de Algoritmos
PUC
Preview text
Bioinformática Profa Raquel Minardi TRABALHO PRÁTICO ALINHAMENTO DE SEQUÊNCIAS Conforme vimos nas aulas do módulo sobre alinhamento de sequências este tipo de técnica é provavelmente a mais utilizada em toda a Bioinformática em todos os tempos O alinhamento de sequências tem as mais diversas aplicações que vão desde a genômica comparativa os estudos sobre a evolução e filogenia análises de variantes genéticas montagem de genomas até a sobreposição estrutural e a modelagem comparativa de estruturas tridimensionais de proteínas Vimos também que existem vários tipos de algoritmos de alinhamento com propósitos bastante diversos Por um lado há o alinhamento global que visa alinhar as sequências de proteínas em todo o seu comprimento Por outro há o alinhamento local que visa obter subsequências de alta similaridade Em relação ao número de sequências sendo alinhadas vimos que há o alinhamento parapar em que se alinha um par de sequências e o alinhamento múltiplo em que toda uma família de sequências é alinhada Vimos que alinhamentos parapar são construídos através de algoritmos polinomiais de ordem quadrática em relação ao número de nucleotídeos aminoácidos das sequências Por outro lado os alinhamentos múltiplos são obtidos por meio de heurísticas as mais diversas pois obter o alinhamento múltiplo ótimo é um problema não polinomial Trabalho Prático 1 Exemplo de um alinhamento múltiplo de sequências Comparativo entre um alinhamento global e um local Bioinformática Profa Raquel Minardi Tendo em vista a grande utilidade dos alinhamentos vamos exercitar nesse curso a implementação de um dos algoritmos mais tradicionais e simples de alinhamento de sequências O objetivo deste trabalho prático é implementar o algoritmo de NeedlemanWunsch para construir alinhamentos globais parapar de sequências de proteínas Sugerimos seguir o algoritmo proposto no livro de Jones e Pevzner 1 que utilizamos como referência no curso O capítulo necessário foi disponibilizado no Moodle Para que se obtenha uma implementação com utilidade prática sugerimos usar a matriz BLOSUM62 23 que traz em cada célula a penalidade de se substituir um aminoácido por outro ou mesmo a manutenção dele Essa matriz será usada para definição das pontuações de matches pontuação para casamento de resíduos de aminoácidos idênticos mismatches pontuação para casamento de resíduos de aminoácidos diferentes isso pode acontecer caso eles seja similares indels inserções e deleções gaps Vocês devem testar a implementação com diversas sequências Sequências pequenas fictícias foram disponibilizadas como exemplos assim como sequências reais Nos exemplos que apresentaremos abaixo usamos essa penalidade com valor 0 Sugerimos testar outros valores como 5 por exemplo Exemplos 1 Tente alinhar sequências idênticas e bem pequenas como DRQT por exemplo Trabalho Prático 2 Um alinhamento é uma forma de organizar as sequências biológicas para evidenciar regiões de similaridade que podem indicar relações funcionais estruturais ou evolutivas entre as as mesmas Matriz BLOSUM62 Bioinformática Profa Raquel Minardi 2 Faça pequenas alterações na sequência substituindo uma glutamina Q por um glutamato E 3 Alinhe sequências um pouco maiores e de comprimentos diferentes como DRQTAQAAGTTTIT e DRNTAQLLGTDTT 4 Alinhe pares de sequências reais como as fornecidas no arquivo suplementar a esse enunciado Tratase de diversas proteínas Spike do SARSCoV2 e de outros vírus Se quiser saber mais sobre essa proteína deixamos abaixo 45 os dois artigos mais importantes sobre a descoberta desta proteína e sua interação com a proteína ACE2 Enzima conversora de angiotensina 2 através da qual entra na célula humana Implementação Sugerimos que o algoritmo seja implementado em Python Você deve implementar o algoritmo e não usar nenhuma biblioteca de terceiros BioPython por exemplo Grupos O trabalho pode ser desenvolvido em grupos de até 5 pessoas Sugerimos que vocês tentem criar grupos com integrantes de formações variadas por acreditar que isso enriquecerá muito o aprendizado e as discussões Entrega Vocês devem entregar o código fonte em um arquivo zip contendo também uma página README em pdf com todas as instruções para sua execução O trabalho deve ser entregue até o dia 08052024 até 2359 exclusivamente via Moodle Gostaria de voluntários para apresentar o trabalho em sala no dia 0905 Trabalho Prático 3 Bioinformática Profa Raquel Minardi Preferencialmente grupos que implementarem algum item extra do trabalho Serão dados pontos extras pela apresentação Extras Caso vocês queiram receber pontos extras pelo trabalho temos algumas sugestões 1 Implementar uma visualização dos resultados dos alinhamentos Vocês podem utilizar a biblioteca plotly httpsdashgalleryplotlyhostdashalignmentchart httpblocksorg Jverma195339f3f23e2ca77392 ou d3js httpblocksorgJverma195339f3f23e2ca77392 Nesse caso a implementação tem que estar acoplada ao seu código ou seja ser gerada automaticamente quando o alinhamento de sequência for rodado até 3 pontos 2 Realizar análises detalhadas dos significados das conservações mutações do arquivo fornecido com as sequências dos vírus Outros conjuntos de dados de interesse também podem ser utilizados Nesse caso entregar um relatório de até 5 páginas com essas análises até 5 pontos 3 Implementar o algoritmo de SmithWaterman Nesse caso um relatório de até 5 páginas deve ser entregue mostrando exemplos comparativos entre os alinhamentos obtidos com os dois algoritmos implementados NeedlemanWunsch e SmithWaterman até 3 pontos 4 Implementar alguma heurística que permita realizar um alinhamento múltiplo a partir do algoritmo base NeedlemanWunsch Um relatório de até 5 páginas deve ser entregue explicando a estratégia desenvolvida até 5 pontos O máximo de pontos extras dados será 10 ou seja o trabalho poderá totalizar 35 pontos dependendo da complexidade do que foi realizado Referências 1 Jones Neil C Pavel A Pevzner and Pavel Pevzner An introduction to bioinformatics algorithms MIT press 2004 2 Henikoff Steven and Jorja G Henikoff Amino acid substitution matrices from protein blocks Proceedings of the National Academy of Sciences 8922 1992 1091510919 3 Eddy Sean R Where did the BLOSUM62 alignment score matrix come from Nature biotechnology 228 2004 10351036 4 Walls Alexandra C et al Structure function and antigenicity of the SARSCoV2 spike glycoprotein Cell 2020 5 Lan Jun et al Structure of the SARSCoV2 spike receptorbinding domain bound to the ACE2 receptor Nature 5817807 2020 215220 Trabalho Prático 4
Send your question to AI and receive an answer instantly
Recommended for you
1
Funções de Teste em Código
Análise de Algoritmos
PUC
7
Prova de Algoritmos - Pontifícia Universidade Católica de Minas Gerais
Análise de Algoritmos
PUC
1
Código de Testes com Badd
Análise de Algoritmos
PUC
2
Relatorio Analise Tecnica e Reflexoes sobre IA e o Futuro do Trabalho
Análise de Algoritmos
PUC
10
Código em Java ajuda com Término do Códdigo
Análise de Algoritmos
PUC
2
Trabalho Prático: Sistema de Gestão de Pedidos para Mercados - AED I
Análise de Algoritmos
PUC
2
Exercicios Resolvidos sobre 2SAT e K-Tesselação em Grafos
Análise de Algoritmos
PUC
94
Projeto e Análise de Algoritmos: Teoria dos Grafos
Análise de Algoritmos
PUC
59
Projeto e Análise de Algoritmos: Grafos Hamiltonianos e Problemas Relacionados
Análise de Algoritmos
PUC
1
Trabalho Pratico Algoritmos em Grafos Busca em Largura Profundidade Hamiltoniano Euleriano e Unicursal
Análise de Algoritmos
PUC
Preview text
Bioinformática Profa Raquel Minardi TRABALHO PRÁTICO ALINHAMENTO DE SEQUÊNCIAS Conforme vimos nas aulas do módulo sobre alinhamento de sequências este tipo de técnica é provavelmente a mais utilizada em toda a Bioinformática em todos os tempos O alinhamento de sequências tem as mais diversas aplicações que vão desde a genômica comparativa os estudos sobre a evolução e filogenia análises de variantes genéticas montagem de genomas até a sobreposição estrutural e a modelagem comparativa de estruturas tridimensionais de proteínas Vimos também que existem vários tipos de algoritmos de alinhamento com propósitos bastante diversos Por um lado há o alinhamento global que visa alinhar as sequências de proteínas em todo o seu comprimento Por outro há o alinhamento local que visa obter subsequências de alta similaridade Em relação ao número de sequências sendo alinhadas vimos que há o alinhamento parapar em que se alinha um par de sequências e o alinhamento múltiplo em que toda uma família de sequências é alinhada Vimos que alinhamentos parapar são construídos através de algoritmos polinomiais de ordem quadrática em relação ao número de nucleotídeos aminoácidos das sequências Por outro lado os alinhamentos múltiplos são obtidos por meio de heurísticas as mais diversas pois obter o alinhamento múltiplo ótimo é um problema não polinomial Trabalho Prático 1 Exemplo de um alinhamento múltiplo de sequências Comparativo entre um alinhamento global e um local Bioinformática Profa Raquel Minardi Tendo em vista a grande utilidade dos alinhamentos vamos exercitar nesse curso a implementação de um dos algoritmos mais tradicionais e simples de alinhamento de sequências O objetivo deste trabalho prático é implementar o algoritmo de NeedlemanWunsch para construir alinhamentos globais parapar de sequências de proteínas Sugerimos seguir o algoritmo proposto no livro de Jones e Pevzner 1 que utilizamos como referência no curso O capítulo necessário foi disponibilizado no Moodle Para que se obtenha uma implementação com utilidade prática sugerimos usar a matriz BLOSUM62 23 que traz em cada célula a penalidade de se substituir um aminoácido por outro ou mesmo a manutenção dele Essa matriz será usada para definição das pontuações de matches pontuação para casamento de resíduos de aminoácidos idênticos mismatches pontuação para casamento de resíduos de aminoácidos diferentes isso pode acontecer caso eles seja similares indels inserções e deleções gaps Vocês devem testar a implementação com diversas sequências Sequências pequenas fictícias foram disponibilizadas como exemplos assim como sequências reais Nos exemplos que apresentaremos abaixo usamos essa penalidade com valor 0 Sugerimos testar outros valores como 5 por exemplo Exemplos 1 Tente alinhar sequências idênticas e bem pequenas como DRQT por exemplo Trabalho Prático 2 Um alinhamento é uma forma de organizar as sequências biológicas para evidenciar regiões de similaridade que podem indicar relações funcionais estruturais ou evolutivas entre as as mesmas Matriz BLOSUM62 Bioinformática Profa Raquel Minardi 2 Faça pequenas alterações na sequência substituindo uma glutamina Q por um glutamato E 3 Alinhe sequências um pouco maiores e de comprimentos diferentes como DRQTAQAAGTTTIT e DRNTAQLLGTDTT 4 Alinhe pares de sequências reais como as fornecidas no arquivo suplementar a esse enunciado Tratase de diversas proteínas Spike do SARSCoV2 e de outros vírus Se quiser saber mais sobre essa proteína deixamos abaixo 45 os dois artigos mais importantes sobre a descoberta desta proteína e sua interação com a proteína ACE2 Enzima conversora de angiotensina 2 através da qual entra na célula humana Implementação Sugerimos que o algoritmo seja implementado em Python Você deve implementar o algoritmo e não usar nenhuma biblioteca de terceiros BioPython por exemplo Grupos O trabalho pode ser desenvolvido em grupos de até 5 pessoas Sugerimos que vocês tentem criar grupos com integrantes de formações variadas por acreditar que isso enriquecerá muito o aprendizado e as discussões Entrega Vocês devem entregar o código fonte em um arquivo zip contendo também uma página README em pdf com todas as instruções para sua execução O trabalho deve ser entregue até o dia 08052024 até 2359 exclusivamente via Moodle Gostaria de voluntários para apresentar o trabalho em sala no dia 0905 Trabalho Prático 3 Bioinformática Profa Raquel Minardi Preferencialmente grupos que implementarem algum item extra do trabalho Serão dados pontos extras pela apresentação Extras Caso vocês queiram receber pontos extras pelo trabalho temos algumas sugestões 1 Implementar uma visualização dos resultados dos alinhamentos Vocês podem utilizar a biblioteca plotly httpsdashgalleryplotlyhostdashalignmentchart httpblocksorg Jverma195339f3f23e2ca77392 ou d3js httpblocksorgJverma195339f3f23e2ca77392 Nesse caso a implementação tem que estar acoplada ao seu código ou seja ser gerada automaticamente quando o alinhamento de sequência for rodado até 3 pontos 2 Realizar análises detalhadas dos significados das conservações mutações do arquivo fornecido com as sequências dos vírus Outros conjuntos de dados de interesse também podem ser utilizados Nesse caso entregar um relatório de até 5 páginas com essas análises até 5 pontos 3 Implementar o algoritmo de SmithWaterman Nesse caso um relatório de até 5 páginas deve ser entregue mostrando exemplos comparativos entre os alinhamentos obtidos com os dois algoritmos implementados NeedlemanWunsch e SmithWaterman até 3 pontos 4 Implementar alguma heurística que permita realizar um alinhamento múltiplo a partir do algoritmo base NeedlemanWunsch Um relatório de até 5 páginas deve ser entregue explicando a estratégia desenvolvida até 5 pontos O máximo de pontos extras dados será 10 ou seja o trabalho poderá totalizar 35 pontos dependendo da complexidade do que foi realizado Referências 1 Jones Neil C Pavel A Pevzner and Pavel Pevzner An introduction to bioinformatics algorithms MIT press 2004 2 Henikoff Steven and Jorja G Henikoff Amino acid substitution matrices from protein blocks Proceedings of the National Academy of Sciences 8922 1992 1091510919 3 Eddy Sean R Where did the BLOSUM62 alignment score matrix come from Nature biotechnology 228 2004 10351036 4 Walls Alexandra C et al Structure function and antigenicity of the SARSCoV2 spike glycoprotein Cell 2020 5 Lan Jun et al Structure of the SARSCoV2 spike receptorbinding domain bound to the ACE2 receptor Nature 5817807 2020 215220 Trabalho Prático 4