Bioinformática

Da aprendis
Revisão das 12h14min de 15 de abril de 2016 por Marioleal (Discussão | contribs)

Ir para: navegação, pesquisa
Bioinformática
Sigla
Aplicações Processamento de informação biológica, Processamento de informação biomédica, Estudo de informação biológica, Estudo de informação biomédica
Conceitos relacionados Sistema de Informação em Saúde, Sinal Médico

Bioinformática pode ser definida como a conceptualização biológica em termos moleculares e a aplicação de técnicas informáticas para perceber e organizar informação associada a estas moléculas, a uma grande escala. Resumindo, a bioinformática é um sistema de informação para a biologia molecular e com diversas aplicações práticas [1]



Introdução

O termo Bioinformática surgiu por volta de 1965 com o trabalho de Margaret Dayhoff(1925-1983) “Atlas of Protein Sequence and Structure” em que a autora foi pioneira em perceber processos bioquímicos usando computador. Mais tarde no ano de 2000, o “Information Science and Technology Initiative Consortium of the National Institutes of Health” redefiniram Bioinformática. Referiram que a Bioinformática era a investigação, desenvolvimento ou aplicação de ferramentas computacionais na influência em biologia, medicina, comportamento ou saúde, incluindo as ferramentas que permitem adquirir, organizar, analisar ou visualizar essa informação[2].

A Bioinformática tem como objetivos: organizar informação permitindo que os investigadores tenham acesso a essa informação e possam adicionar mais informação enquanto elas são produzidas, por exemplo no Protein Data Bank; Desenvolver técnicas e ferramentas que auxiliem a análise dessa informação, por exemplo programas como FASTA e PSI-BLAST; Utilizar estas ferramentas e interpretar resultados de uma forma biologicamente significativa [1].

Bases de Dados

As bases de dados utilizadas em Bioinformática variam entre: sequências de DNA, sequências de proteínas, estruturas macromoleculares e sequências genómicas. Apesar da diversidade aparente nas diferentes bases de dados e na sua complexidade, existem mais bases de dados de sequências do que de estruturas pois as primeiras são de mais fácil obtenção. No caso de sequências de nucleótidos, as bases de dados mais comuns são a GenBank, EMBL e DDBJ. Para as estruturas macromoleculares a Protein Data Bank (PDB). Para as sequências primárias de proteínas a SWISS-PROT e para as sequências secundárias de proteínas a PROSITE e Pfam[3].

Ferramentas em Bioinformática

Para se perceber de que forma as diferentes bases de dados podem ser trabalhadas e compreendidas, a Bioinformática recorre a ferramentas como “sequencers” que são máquinas capazes de ler uma sequência de nucleótidos em amostras biológicas de DNA. Estas máquinas estão ligadas a computadores que demonstram a amostra que está a ser analizada. Esta demonstração é uma previsão com determinado intervalo de confiança de que cada nucleótido é de facto o nucleótido que está a ser demonstrado. Os “sequencers” atuais conseguem produzi mais de 300 mil pares de bases por dia a custos consideravelmente baixos.

A maior dificuldade em obter um genoma completo de DNA é que se este for recolhido em laboratório, as amostras são em elevado número e normalmente em sequências bastante curtas que mais tarde têm que ser reorganizadas usando programas informáticos. Este método de reorganização é denominado método shot-gun.

É comum obter-se a estrutura de proteínas com cristolografia de raios-X e por ressonância magnética. Ambos os processos são bastante caros e demorosos. Portanto, grande parte da estrutura proteíca é deduzida por microarray. A informação recolhida 3D destas proteínas é então armazenada em repositório (Protein Database PDB). No caso do National Center for Biotechnology Information (NCBI), estão armazenadas 26 mil milhões de pares de bases contendo o genoma completo humano e de outros seres vivos como bactérias, plantas e insectos[3].

Algoritmos em Bioinformática [4]

  • Comparação de sequências: Dado o elevado número de sequências disponíveis, é urgente e essencial desenvolver e utilizar algoritmos capazes de comparar sequências bastante longas. Estes algoritmos deveriam permitir deleção, inserção e substituição de símbolos que representam nucleótidos ou aminoácidos, pois estas mutações ocorrem na natureza também.
  • Construir árvores filogenéticas: Estas árvores são construidas depois de comparar sequências entre diferentes organismos. Estas árvores agrupam os diferentes organismos de acordo com a sua semelhança em termos genéticos. Servem ainda para perceber o papel da Evolução no código genético dos seres vivos.
  • Deteção de padrões em sequências: Muitos algoritmos na deteção de padrões são baseados em aprendizagem automática e redes neuronais. Estes algoritmos servem para identificar padrões em certas partes de DNA ou aminoácidos.
  • Determinar estruturas tridimensionais a partir de sequências: Este objetivo é muitas vezes dificíl de concretizar dado que por exemplo, a determinação de estrutura de RNA a partir de uma sequência requer algoritmos de complexidade cúbica.
  • Inferir regulação celular: O objetivo passa pela utilização de engenharia reversa, ou seja, inferir processos e funções de genes e proteínas a partir de informação experimental.
  • Determinar função proteíca e vias metabólicas: Este é possivelmente a área da bioinformática mais difícil pois ainda não existe nenhuma aplicação conclusiva destes algoritmos mas o objetivo é interpretar anotações humanas de funções proteicas e desenvolver associações e vias metabólicas a partir dessas anotações.
  • Combinação de fragmentos de DNA: Os fragmentos atualmente são organizados e combinados utilizando computadores, no entanto existem bastantes zonas repetitivas e vários fragmentos podem pertencer a diferentes regiões do DNA.
  • Utilização de linguagem Script: Muitas das aplicações acima mencionadas já estão disponíveis em websites. A sua utilização requer scripting que fornece informação à aplicação, recebe e analiza-a.

Referências

  1. 1,0 1,1 Luscombe, N. M., Greenbaum, D., & Gerstein, M. (2001). Review What is bioinformatics ? An, 83–100.
  2. Isea, R. (2015). The Present-Day Meaning Of The Word Bioinformatics, 2000(1), 70–73. .
  3. 3,0 3,1 Lesk, A. M. (2002). Introduction to Bioinformatics. .
  4. Cohen, J. (2004). Bioinformatics — An Introduction for Computer Scientists, 36(2), 122–158. .