Diferenças entre edições de "Bioinformática"

Da aprendis
Ir para: navegação, pesquisa
Linha 6: Linha 6:
  
 
[[Category:Conceitos]]
 
[[Category:Conceitos]]
'''Bioinformática''' pode ser definida como a conceptualização biológica em termos moleculares e a aplicação de técnicas informáticas para perceber e organizar informação associada a estas moléculas, a uma grande escala. Resumindo, a bioinformática é um sistema de informação para a biologia molecular e com diversas aplicações práticas (1)
+
'''Bioinformática''' pode ser definida como a conceptualização biológica em termos moleculares e a aplicação de técnicas informáticas para perceber e organizar informação associada a estas moléculas, a uma grande escala. Resumindo, a bioinformática é um sistema de informação para a biologia molecular e com diversas aplicações práticas <ref name="Luscombe2001"> Luscombe, N. M., Greenbaum, D., & Gerstein, M. (2001). Review What is bioinformatics ? An, 83–100.</ref>
 +
 
 +
----
  
 
== Introdução ==
 
== Introdução ==
O termo '''Bioinformática''' surgiu por volta de 1965 com o trabalho de Margaret Dayhoff(1925-1983) “Atlas of Protein Sequence and Structure” em que a autora foi pioneira em perceber processos bioquímicos usando computador. Mais tarde no ano de 2000, o “Information Science and Technology Initiative Consortium of the National Institutes of Health” redefiniram Bioinformática. Referiram que a Bioinformática era a investigação, desenvolvimento ou aplicação de ferramentas computacionais na influência em biologia, medicina, comportamento ou saúde, incluindo as ferramentas que permitem adquirir, organizar, analisar ou visualizar essa informação(2).
+
O termo '''Bioinformática''' surgiu por volta de 1965 com o trabalho de Margaret Dayhoff(1925-1983) “Atlas of Protein Sequence and Structure” em que a autora foi pioneira em perceber processos bioquímicos usando computador. Mais tarde no ano de 2000, o “Information Science and Technology Initiative Consortium of the National Institutes of Health” redefiniram Bioinformática. Referiram que a Bioinformática era a investigação, desenvolvimento ou aplicação de ferramentas computacionais na influência em biologia, medicina, comportamento ou saúde, incluindo as ferramentas que permitem adquirir, organizar, analisar ou visualizar essa informação<ref name="Isea2015"> Isea, R. (2015). The Present-Day Meaning Of The Word Bioinformatics, 2000(1), 70–73. .</ref>.
  
A Bioinformática tem como objetivos: organizar informação permitindo que os investigadores tenham acesso a essa informação e possam adicionar mais informação enquanto elas são produzidas, por exemplo no Protein Data Bank; Desenvolver técnicas e ferramentas que auxiliem a análise dessa informação, por exemplo programas como FASTA e PSI-BLAST; Utilizar estas ferramentas e interpretar resultados de uma forma biologicamente significativa(3).
+
A Bioinformática tem como objetivos: organizar informação permitindo que os investigadores tenham acesso a essa informação e possam adicionar mais informação enquanto elas são produzidas, por exemplo no Protein Data Bank; Desenvolver técnicas e ferramentas que auxiliem a análise dessa informação, por exemplo programas como FASTA e PSI-BLAST; Utilizar estas ferramentas e interpretar resultados de uma forma biologicamente significativa <ref name="Luscombe2001"/>.
 
<br>
 
<br>
  
 
== Bases de Dados ==
 
== Bases de Dados ==
As bases de dados utilizadas em Bioinformática variam entre: sequências de DNA, sequências de proteínas, estruturas macromoleculares e sequências genómicas. Apesar da diversidade aparente nas diferentes bases de dados e na sua complexidade, existem mais bases de dados de sequências do que de estruturas pois as primeiras são de mais fácil obtenção. No caso de sequências de nucleótidos, as bases de dados mais comuns são a GenBank, EMBL e DDBJ. Para as estruturas macromoleculares a Protein Data Bank (PDB). Para as sequências primárias de proteínas a SWISS-PROT e para as sequências secundárias de proteínas a PROSITE e Pfam.
+
As bases de dados utilizadas em Bioinformática variam entre: sequências de DNA, sequências de proteínas, estruturas macromoleculares e sequências genómicas. Apesar da diversidade aparente nas diferentes bases de dados e na sua complexidade, existem mais bases de dados de sequências do que de estruturas pois as primeiras são de mais fácil obtenção. No caso de sequências de nucleótidos, as bases de dados mais comuns são a GenBank, EMBL e DDBJ. Para as estruturas macromoleculares a Protein Data Bank (PDB). Para as sequências primárias de proteínas a SWISS-PROT e para as sequências secundárias de proteínas a PROSITE e Pfam<ref name="Lesk2002"> Lesk, A. M. (2002). Introduction to Bioinformatics. .</ref>.
 
<br>
 
<br>
  
Linha 24: Linha 26:
 
A maior dificuldade em obter um genoma completo de DNA é que se este for recolhido em laboratório, as amostras são em elevado número e normalmente em sequências bastante curtas que mais tarde têm que ser reorganizadas usando programas informáticos. Este método de reorganização é denominado método shot-gun.
 
A maior dificuldade em obter um genoma completo de DNA é que se este for recolhido em laboratório, as amostras são em elevado número e normalmente em sequências bastante curtas que mais tarde têm que ser reorganizadas usando programas informáticos. Este método de reorganização é denominado método shot-gun.
  
É comum obter-se a estrutura de proteínas com cristolografia de raios-X e por ressonância magnética. Ambos os processos são bastante caros e demorosos. Portanto, grande parte da estrutura proteíca é deduzida por microarray. A informação recolhida 3D destas proteínas é então armazenada em repositório (Protein Database PDB). No caso do National Center for Biotechnology Information (NCBI), estão armazenadas 26 mil milhões de pares de bases contendo o genoma completo humano e de outros seres vivos como bactérias, plantas e insectos.
+
É comum obter-se a estrutura de proteínas com cristolografia de raios-X e por ressonância magnética. Ambos os processos são bastante caros e demorosos. Portanto, grande parte da estrutura proteíca é deduzida por microarray. A informação recolhida 3D destas proteínas é então armazenada em repositório (Protein Database PDB). No caso do National Center for Biotechnology Information (NCBI), estão armazenadas 26 mil milhões de pares de bases contendo o genoma completo humano e de outros seres vivos como bactérias, plantas e insectos<ref name="Lesk2002"/>.
 
<br>
 
<br>
  
== Algoritmos em Bioinformática ==
+
== Algoritmos em Bioinformática <ref name="Cohen2004"> Cohen, J. (2004). Bioinformatics — An Introduction for Computer Scientists, 36(2), 122–158. .</ref> ==
  
 
* Comparação de sequências: Dado o elevado número de sequências disponíveis, é urgente e essencial desenvolver e utilizar algoritmos capazes de comparar sequências bastante longas. Estes algoritmos deveriam permitir deleção, inserção e substituição de símbolos que representam nucleótidos ou aminoácidos, pois estas mutações ocorrem na natureza também.
 
* Comparação de sequências: Dado o elevado número de sequências disponíveis, é urgente e essencial desenvolver e utilizar algoritmos capazes de comparar sequências bastante longas. Estes algoritmos deveriam permitir deleção, inserção e substituição de símbolos que representam nucleótidos ou aminoácidos, pois estas mutações ocorrem na natureza também.
Linha 45: Linha 47:
  
 
----
 
----
 +
== Referências ==
  
 
+
<references/>
<u> Bibliografia de Interesse </u>
+
 
+
* '''[[Bibliografia de Interesse#AMIA Board white paper: definition of biomedical informatics and specification of core competencies for graduate education in the discipline|AMIA Board white paper: definition of biomedical informatics and specification of core competencies for graduate education in the discipline]]'''
+
* '''[[Bibliografia de Interesse#What is Biomedical informatics?|What is Biomedical informatics?]]'''
+

Revisão das 12h41min de 14 de abril de 2016

Bioinformática
Sigla
Aplicações Processamento de informação biológica, Processamento de informação biomédica, Estudo de informação biológica, Estudo de informação biomédica
Conceitos relacionados Sistema de Informação em Saúde, Sinal Médico

Bioinformática pode ser definida como a conceptualização biológica em termos moleculares e a aplicação de técnicas informáticas para perceber e organizar informação associada a estas moléculas, a uma grande escala. Resumindo, a bioinformática é um sistema de informação para a biologia molecular e com diversas aplicações práticas [1]


Introdução

O termo Bioinformática surgiu por volta de 1965 com o trabalho de Margaret Dayhoff(1925-1983) “Atlas of Protein Sequence and Structure” em que a autora foi pioneira em perceber processos bioquímicos usando computador. Mais tarde no ano de 2000, o “Information Science and Technology Initiative Consortium of the National Institutes of Health” redefiniram Bioinformática. Referiram que a Bioinformática era a investigação, desenvolvimento ou aplicação de ferramentas computacionais na influência em biologia, medicina, comportamento ou saúde, incluindo as ferramentas que permitem adquirir, organizar, analisar ou visualizar essa informação[2].

A Bioinformática tem como objetivos: organizar informação permitindo que os investigadores tenham acesso a essa informação e possam adicionar mais informação enquanto elas são produzidas, por exemplo no Protein Data Bank; Desenvolver técnicas e ferramentas que auxiliem a análise dessa informação, por exemplo programas como FASTA e PSI-BLAST; Utilizar estas ferramentas e interpretar resultados de uma forma biologicamente significativa [1].

Bases de Dados

As bases de dados utilizadas em Bioinformática variam entre: sequências de DNA, sequências de proteínas, estruturas macromoleculares e sequências genómicas. Apesar da diversidade aparente nas diferentes bases de dados e na sua complexidade, existem mais bases de dados de sequências do que de estruturas pois as primeiras são de mais fácil obtenção. No caso de sequências de nucleótidos, as bases de dados mais comuns são a GenBank, EMBL e DDBJ. Para as estruturas macromoleculares a Protein Data Bank (PDB). Para as sequências primárias de proteínas a SWISS-PROT e para as sequências secundárias de proteínas a PROSITE e Pfam[3].

Ferramentas em Bioinformática

Para se perceber de que forma as diferentes bases de dados podem ser trabalhadas e compreendidas, a Bioinformática recorre a ferramentas como “sequencers” que são máquinas capazes de ler uma sequência de nucleótidos em amostras biológicas de DNA. Estas máquinas estão ligadas a computadores que demonstram a amostra que está a ser analizada. Esta demonstração é uma previsão com determinado intervalo de confiança de que cada nucleótido é de facto o nucleótido que está a ser demonstrado. Os “sequencers” atuais conseguem produzi mais de 300 mil pares de bases por dia a custos consideravelmente baixos.

A maior dificuldade em obter um genoma completo de DNA é que se este for recolhido em laboratório, as amostras são em elevado número e normalmente em sequências bastante curtas que mais tarde têm que ser reorganizadas usando programas informáticos. Este método de reorganização é denominado método shot-gun.

É comum obter-se a estrutura de proteínas com cristolografia de raios-X e por ressonância magnética. Ambos os processos são bastante caros e demorosos. Portanto, grande parte da estrutura proteíca é deduzida por microarray. A informação recolhida 3D destas proteínas é então armazenada em repositório (Protein Database PDB). No caso do National Center for Biotechnology Information (NCBI), estão armazenadas 26 mil milhões de pares de bases contendo o genoma completo humano e de outros seres vivos como bactérias, plantas e insectos[3].

Algoritmos em Bioinformática [4]

  • Comparação de sequências: Dado o elevado número de sequências disponíveis, é urgente e essencial desenvolver e utilizar algoritmos capazes de comparar sequências bastante longas. Estes algoritmos deveriam permitir deleção, inserção e substituição de símbolos que representam nucleótidos ou aminoácidos, pois estas mutações ocorrem na natureza também.
  • Construir árvores filogenéticas: Estas árvores são construidas depois de comparar sequências entre diferentes organismos. Estas árvores agrupam os diferentes organismos de acordo com a sua semelhança em termos genéticos. Servem ainda para perceber o papel da Evolução no código genético dos seres vivos.
  • Deteção de padrões em sequências: Muitos algoritmos na deteção de padrões são baseados em aprendizagem automática e redes neuronais. Estes algoritmos servem para identificar padrões em certas partes de DNA ou aminoácidos.
  • Determinar estruturas tridimensionais a partir de sequências: Este objetivo é muitas vezes dificíl de concretizar dado que por exemplo, a determinação de estrutura de RNA a partir de uma sequência requer algoritmos de complexidade cúbica.
  • Inferir regulação celular: O objetivo passa pela utilização de engenharia reversa, ou seja, inferir processos e funções de genes e proteínas a partir de informação experimental.
  • Determinar função proteíca e vias metabólicas: Este é possivelmente a área da bioinformática mais difícil pois ainda não existe nenhuma aplicação conclusiva destes algoritmos mas o objetivo é interpretar anotações humanas de funções proteicas e desenvolver associações e vias metabólicas a partir dessas anotações.
  • Combinação de fragmentos de DNA: Os fragmentos atualmente são organizados e combinados utilizando computadores, no entanto existem bastantes zonas repetitivas e vários fragmentos podem pertencer a diferentes regiões do DNA.
  • Utilização de linguagem Script: Muitas das aplicações acima mencionadas já estão disponíveis em websites. A sua utilização requer scripting que fornece informação à aplicação, recebe e analiza-a.

Referências

  1. 1,0 1,1 Luscombe, N. M., Greenbaum, D., & Gerstein, M. (2001). Review What is bioinformatics ? An, 83–100.
  2. Isea, R. (2015). The Present-Day Meaning Of The Word Bioinformatics, 2000(1), 70–73. .
  3. 3,0 3,1 Lesk, A. M. (2002). Introduction to Bioinformatics. .
  4. Cohen, J. (2004). Bioinformatics — An Introduction for Computer Scientists, 36(2), 122–158. .