B
|
ioinformatika merupakan ilmu terapan
yang lahir dari perkembangan teknologi informasi dibidang molekular. Pembahasan
dibidang bioinformatik ini tidak terlepas dari perkembangan biologi molekular
modern, salah satunya peningkatan pemahaman manusia dalam bidang genomic yang
terdapat dalam molekul DNA.
Kemampuan
untuk memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh
teknologi informasi melalui perkembangan hardware dan soffware. Baik pihak
pabrikan sofware dan harware maupun pihak ketiga dalam produksi perangkat
lunak. Salah satu contohnya dapat dilihat pada upaya Celera Genomics,
perusahaan bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom
manusia yang secara maksimal memanfaatkan teknologi informasi sehingga bisa
melakukan pekerjaannya dalam waktu yang singkat (hanya beberapa tahun).
Perkembangan
teknologi DNA rekombinan memainkan peranan penting dalam lahirnya
bioinformatika. Teknologi DNA rekombinan memunculkan suatu pengetahuan baru
dalam rekayasa genetika organisme yang dikenala bioteknologi. Perkembangan
bioteknologi dari bioteknologi tradisional ke bioteknologi modren salah satunya
ditandainya dengan kemampuan manusia dalam melakukan analisis DNA organisme,
sekuensing DNA dan manipulasi DNA.
Sekuensing DNA
satu organisme, misalnya suatu virus memiliki kurang lebih 5.000 nukleotida
atau molekul DNA atau sekitar 11 gen, yang telah berhasil dibaca secara
menyeluruh pada tahun 1977. Kemudia Sekuen seluruh DNA manusia terdiri dari 3
milyar nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu 3
tahun, walaupun semua ini belum terlalu lengkap. Saat ini terdapat milyaran
data nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan
tahun 1982.
Bioinformatika
ialah ilmu yang mempelajari
penerapan teknik komputasi
untuk mengelola dan menganalisis informasi hayati. Bidang ini mencakup
penerapan metode-metode matematika,
statistika, dan informatika untuk
memecahkan masalah-masalah biologi, terutama yang terkait dengan penggunaan
sekuens DNA dan asam amino. Contoh topik
utama bidang ini meliputi pangkalan
data untuk mengelola informasi hayati, penyejajaran sekuens (sequence
alignment), prediksi struktur untuk meramalkan struktur protein atau pun struktur
sekunder RNA, analisis filogenetik,
dan analisis ekspresi gen.
Bioinformatika
pertamakali dikemukakan pada pertengahan 1980an untuk mengacu
kepada penerapan ilmu komputer
dalam bidang biologi. Meskipun demikian, penerapan bidang-bidang dalam
bioinformatika seperti pembuatan pangkalan data dan pengembangan algoritma untuk analisis sekuens
biologi telah dilakukan sejak tahun 1960an.
Kemajuan
teknik biologi
molekuler dalam mengungkap sekuens biologi protein (sejak awal 1950an) dan asam nukleat (sejak
1960an) mengawali perkembangan pangkalan data dan teknik analisis sekuens
biologi. Pangkalan data sekuens protein mulai dikembangkan pada tahun 1960an di
Amerika Serikat, sementara
pangkalan data sekuens DNA dikembangkan pada akhir 1970an di Amerika Serikat
dan Jerman pada Laboratorium
Biologi Molekuler Eropa
(European Molecular Biology Laboratory).
Penemuan
teknik sekuensing
DNA yang lebih cepat pada pertengahan 1970an menjadi landasan terjadinya
ledakan jumlah sekuens DNA yang dapat diungkapkan pada 1980an dan 1990an. Hal ini menjadi
salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan kebutuhan
akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya
bioinformatika.
Perkembangan
jaringan internet
juga mendukung berkembangnya bioinformatika. Pangkalan data bioinformatika yang
terhubungkan melalui internet memudahkan ilmuwan dalam mengumpulkan hasil
sekuensing ke dalam pangkalan data tersebut serta memperoleh sekuens biologi
sebagai bahan analisis. Selain itu, penyebaran program-program
aplikasi bioinformatika melalui internet memudahkan ilmuwan dalam mengakses
program-program tersebut dan kemudian memudahkan pengembangannya.
Pangkalan Data sekuens
biologi dapat berupa pangkalan data primer untuk menyimpan sekuens primer asam nukleat dan protein, pangkalan data
sekunder untuk menyimpan motif sekuens protein, dan pangkalan data struktur
untuk menyimpan data struktur protein dan asam nukleat.
Pangkalan
data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika Serikat),
EMBL (the European Molecular Biology
Laboratory, Eropa), dan DDBJ
(DNA Data Bank of Japan, Jepang).
Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara harian
untuk menjaga keluasan cakupan masing-masing pangkalan data. Sumber utama data
sekuens asam nukleat adalah submisi (pengumpulan) langsung dari peneliti
individual, proyek sekuensing genom,
dan pendaftaran paten.
Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens asam
nukleat pada umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam
nukleat tersebut, dan segala sesuatu yang berkaitan dengan sekuens asam nukleat
tersebut.
Selain asam
nukleat, beberapa contoh pangkalan data penting yang menyimpan sekuens primer
protein adalah PIR
(Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga pangkalan data
tersebut telah digabungkan dalam UniProt, yang didanai
terutama oleh Amerika Serikat. Entri dalam UniProt mengandung informasi tentang
sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan
komentar yang pada umumnya berisi penjelasan mengenai fungsi protein tersebut.
Perangkat bioinformatika
yang berkaitan erat dengan penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local
Alignment Search Tool). Penelusuran BLAST (BLAST search) pada
pangkalan data sekuens memungkinkan ilmuwan untuk mencari sekuens baik asam
nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal
ini berguna misalnya untuk menemukan gen
sejenis pada beberapa organisme
atau untuk memeriksa keabsahan hasil sekuensing atau untuk
memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari
kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank, Bank Data
Protein) ialah pangkalan data tunggal yang menyimpan model struktur tiga
dimensi protein dan asam nukleat hasil
penentuan eksperimental (dengan kristalografi
sinar-X, spektroskopi
NMR, dan mikroskopi
elektron). PDB menyimpan data struktur sebagai koordinat
tiga dimensi yang menggambarkan posisi atom-atom dalam protein
atau pun asam nukleat.
Penerapan Utama Bioinformatika
Ø
Basis Data Sekuens Biologis
Sesuai dengan jenis informasi
biologis yang disimpannya, basis data sekuens biologis dapat berupa basis
data primer untuk menyimpan sekuens primer asam nukleat
maupun protein,
basis data sekunder untuk menyimpan motif sekuens protein, dan basis data
struktur untuk menyimpan data struktur protein maupun asam nukleat.
Basis data utama untuk sekuens asam
nukleat saat ini adalah GenBank
(Amerika Serikat), EMBL (Eropa),
dan DDBJ(Inggris) (DNA
Data Bank of Japan, Jepang). Ketiga basis data tersebut bekerja sama dan bertukar
data secara harian untuk menjaga keluasan cakupan masing-masing basis data.
Sumber utama data sekuens asam nukleat adalah submisi langsung dari periset
individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi
sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya
mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme
sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam
nukleat tersebut.
Sementara itu, contoh beberapa basis
data penting yang menyimpan sekuens primer protein adalah PIR (Protein
Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut
telah digabungkan dalam UniProt
(yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung
informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang
berkaitan, dan komentar yang umumnya berisi penjelasan mengenai fungsi protein
tersebut.
BLAST (Basic Local
Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan
erat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST
search) pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens
asam nukleat maupun protein yang mirip dengan sekuens tertentu yang
dimilikinya. Hal ini berguna misalnya untuk menemukan gen sejenis pada beberapa organisme
atau untuk memeriksa keabsahan hasil sekuensing
maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritma
yang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB
(Protein Data Bank, Bank Data Protein) adalah basis data tunggal yang
menyimpan model struktural tiga dimensi protein
dan asam nukleat
hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB
menyimpan data struktur sebagai koordinat tiga dimensi
yang menggambarkan posisi atom-atom dalam protein ataupun asam nukleat.
Ø
Penyejajaran Sekuens
Penyejajaran
sekuens (sequence alignment) adalah proses penyusunan/pengaturan dua
atau lebih sekuens sehingga persamaan
sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut
sebagai sequence alignment atau alignment saja. Baris sekuens
dalam suatu alignment diberi sisipan (umumnya dengan tanda
"–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang
identik atau sama di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment
DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan
"caatgggcaac" (tanda "|" menunjukkan kecocokan atau match
di antara kedua sekuens).
Sequence
alignment merupakan metode dasar dalam analisis sekuens. Metode ini digunakan untuk
mempelajari evolusi
sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan
(mismatch) dalam alignment diasosiasikan dengan proses mutasi,
sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan
proses insersi atau delesi. Sequence alignment memberikan hipotesis
atas proses evolusi
yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam
contoh alignment di atas bisa jadi berevolusi dari sekuens yang sama
"ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga
dapat menunjukkan posisi-posisi yang dipertahankan (conserved) selama
evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa
jadi penting bagi struktur atau fungsi protein tersebut.
Selain itu, sequence alignment
juga digunakan untuk mencari sekuens yang mirip atau sama dalam basis data
sekuens. BLAST adalah salah satu metode alignment yang sering digunakan
dalam penelusuran basis data sekuens. BLAST menggunakan algoritma heuristik
dalam penyusunan alignment.
Beberapa metode alignment
lain yang merupakan pendahulu BLAST adalah metode "Needleman-Wunsch"
dan "Smith-Waterman". Metode Needleman-Wunsch digunakan untuk
menyusun alignment global di antara dua atau lebih sekuens, yaitu
alignment atas keseluruhan panjang sekuens tersebut. Metode
Smith-Waterman menghasilkan alignment lokal, yaitu alignment atas
bagian-bagian dalam sekuens. Kedua metode tersebut menerapkan pemrograman dinamik (dynamic
programming) dan hanya efektif untuk alignment dua sekuens (pairwise
alignment)
Clustal adalah program
bioinformatika untuk alignment multipel (multiple alignment),
yaitu alignment beberapa sekuens sekaligus. Dua varian utama Clustal
adalah ClustalW dan ClustalX.
Metode lain yang dapat diterapkan
untuk alignment sekuens adalah metode yang berhubungan dengan Hidden
Markov Model ("Model Markov Tersembunyi", HMM). HMM
merupakan model statistika yang mulanya digunakan dalam ilmu komputer
untuk mengenali pembicaraan manusia (speech recognition). Selain
digunakan untuk alignment, HMM juga digunakan dalam metode-metode analisis
sekuens lainnya, seperti prediksi daerah pengkode protein dalam genom dan prediksi
struktur sekunder protein.
Ø
Prediksi Struktur Protein
Model protein hemaglutinin
dari virus
influensa
Secara kimia/fisika, bentuk struktur
protein
diungkap dengan kristalografi sinar-X
ataupun spektroskopi NMR, namun
kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu,
metode sekuensing
protein relatif lebih mudah mengungkapkan sekuens asam amino
protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi
protein berdasarkan sekuens asam aminonya (dengan kata lain, meramalkan
struktur tersier dan struktur sekunder berdasarkan struktur primer protein).
Secara umum, metode prediksi struktur protein yang ada saat ini dapat
dikategorikan ke dalam dua kelompok, yaitu metode pemodelan protein komparatif
dan metode pemodelan de novo.
Pemodelan
protein komparatif (comparative protein modelling) meramalkan
struktur suatu protein berdasarkan struktur protein lain yang sudah diketahui.
Salah satu penerapan metode ini adalah pemodelan homologi (homology
modelling), yaitu prediksi struktur tersier protein berdasarkan kesamaan
struktur primer protein. Pemodelan homologi didasarkan pada teori bahwa dua protein
yang homolog memiliki struktur
yang sangat mirip satu sama lain. Pada metode ini, struktur suatu protein
(disebut protein target) ditentukan berdasarkan struktur protein lain (protein
templat) yang sudah diketahui dan memiliki kemiripan sekuens dengan protein
target tersebut. Selain itu, penerapan lain pemodelan komparatif adalah protein
threading yang didasarkan pada kemiripan struktur tanpa kemiripan
sekuens primer. Latar belakang protein threading adalah bahwa struktur
protein lebih dikonservasi daripada sekuens protein selama evolusi;
daerah-daerah yang penting bagi fungsi protein dipertahankan strukturnya. Pada
pendekatan ini, struktur yang paling kompatibel untuk suatu sekuens asam amino
dipilih dari semua jenis struktur tiga dimensi protein yang ada. Metode-metode
yang tergolong dalam protein threading berusaha menentukan tingkat
kompatibilitas tersebut.
Dalam pendekatan de novo
atau ab initio, struktur protein ditentukan dari sekuens primernya tanpa
membandingkan dengan struktur protein lain. Terdapat banyak kemungkinan dalam
pendekatan ini, misalnya dengan menirukan proses pelipatan (folding)
protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan
simulasi dinamika molekular), atau
dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung
membutuhkan proses komputasi yang intens, sehingga saat ini hanya digunakan
dalam menentukan struktur protein-protein kecil. Beberapa usaha telah dilakukan
untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer
(misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed
computing, misalnya proyek Folding@home)
maupun komputasi grid.
Ø
Analisis Ekspresi Gen
Analisis klastering ekspresi gen pada kanker
payudara
Ekspresi gen
dapat ditentukan dengan mengukur kadar mRNA dengan berbagai macam
teknik (misalnya dengan microarray
ataupun Serial
Analysis of Gene Expression ["Analisis Serial Ekspresi
Gen", SAGE]). Teknik-teknik tersebut umumnya diterapkan pada analisis
ekspresi gen skala besar yang mengukur ekspresi banyak gen (bahkan genom) dan menghasilkan
data skala besar. Metode-metode penggalian data (data mining) diterapkan
pada data tersebut untuk memperoleh pola-pola informatif. Sebagai contoh,
metode-metode komparasi digunakan untuk membandingkan ekspresi di antara
gen-gen, sementara metode-metode klastering (clustering) digunakan untuk
mempartisi data tersebut berdasarkan kesamaan ekspresi gen.
Bidang-Bidang Yang Terkait Dengan Bioinformatika
Di bawah ini bidang-bidang yang
terkait dengan bioinformatika :
1. Biophysics
Merupakan
sebuah bidang interdisiplier yang mengaplikasikan teknik-teknik dari ilmu
fisika untuk memahami struktur dan ilmu biologi. Ilmu ini terkait dengan
bioinformatika karena untuk mengenal teknik-teknik dari ilmu fisika untuk
memahami struktur tersebut membutuhkan penggunaan TI.
2. Computational Biology
Bidang ini
merupakan bagian dari bioinformatika yang paling dekat dengan bidang Biologi
umum klasik. Fokus dari Computational Biology adalah gerak evolusi,
populasi, dan biologi teoritis daripada biomedis dalam molekul dan sel. Pada
penerapan bidang ini model-model statistika untuk fenomena biologi lebih di
pakai dibandingkan dengan model sebenarnya.
3. Medical Informatics
Merupakan
sebuah disiplin ilmu yang baru yang didefinisikan sebagai pembelajaran,
penemuan, dan implementasi dari struktur dan algoritma untuk meningkatkan
komunikasi, pengertian, dan manajemen informasi medis. Disiplin ilmu ini,
berkaitan dengan data-data yang didapatkan pada level biologi yang lebih
“rumit”, dimana sebagian besar bioinformatika lebih memperhatikan informasi
dari sistem dan struktur biomolekul dan seluler.
4. Proteomics
Pertama kali
digunakan utnuk menggambarkan himpunan dari protein-protein yang tersusun oleh genom.
Mengkarakterisasi banyaknya puluhan ribu protein yang dinyatakan dalam sebuah
tipe sel yang diberikan pada waktu tertentu melibatkan tempat penyimpanan dan
perbandingan dari data yang memiliki jumlah yang sangat besar, tak terhindarkan
lagi akan memerlukan bioinformatika.
5. Genomics
Adalah bidang
ilmu yang ada sebelum selesainya sekuen genom, kecuali dalam bentuk
yang paling kasar. Genomics adalah setiap usaha untuk menganalisa atau
membandingakna seluruh komplemen genetik dari satu spesies atau lebih.
Sumber :
http://nanascouting.blogspot.com/2012/03/menurut-wilkipedia-pengertian-dari.html
Tidak ada komentar:
Posting Komentar