Prediksi Profil Asam Amino Pada Family Protein Menggunakan Hidden Markov Model

Endang Wahyu Handamari, Kwardiniya A, Mila Kurniawaty, Emilia S I

Abstract


ABSTRAK

Sequence  alignment adalah metode dasar dalam analisis sekuens, yang  merupakan proses penyusunan atau penjajaran dua atau lebih sequence primer sehingga persamaan sequence - sequence tersebut tampak nyata. Salah satu kegunaan  metode ini adalah untuk  memprediksi karakteristik dari suatu protein, yaitu memprediksi struktur atau fungsi protein yang belum diketahui menggunakan protein yang telah diketahui informasi struktur atau informasi fungsinya jika protein tersebut memiliki kesamaan sequence dengan sequence yang terdapat dalam database.

Protein merupakan makromolekul yang menyusun lebih dari separuh bagian dari sel.  Protein merupakan  rantai dari gabungan 20 jenis asam amino, di mana setiap jenis protein mempunyai jumlah dan sequence asam amino yang khas. Metode yang dapat diterapkan untuk sequence  alignment di samping algoritma genetika adalah  metode yang berhubungan dengan Hidden Markov Model (HMM).

Hidden Markov Model (HMM)  merupakan bentuk pengembangan dari rantai Markov, yang dapat diterapkan dalam kasus yang tidak dapat diamati secara langsung. Sebagai observed state untuk sequence  alignment adalah sequence asam amino dalam tiga kategori yaitu : deletion(1), insertion(2) dan match(3),  sedangkan  untuk hidden state adalah residu asam amino, yang  dapat menentukan  family protein  bersesuaian dengan observasi O .               Implementasi melalui perangkat lunak HMM terhadap sequence asam amino telah dilakukan namun perlu diuji keakuratan  terhadap data sebenarnya melalui PDB (Protein Data Bank).

ABSTRACT

Sequence alignment is the basic method in sequence analysis,  which is the process of  two or more primer  sequences  so  that  the  equation sequences are apparent.  One of  the  usefulness  of  this  method to predict the characteristics of a protein, which predicts the structure or function of unknown proteins using known protein structure information  if the information  these proteins have sequence similarity to sequences contained in the data base.

Proteins are  macromolecules  which  make up more  than half of  the cell. Proteins  are  chains  of a combination of  20 kinds of amino acids,  where each type protein  has  a number of proteins and amino acid sequences are typical.   The  method  can be  applied  to sequence  alignment besides  the genetic algorithm is a method associated with the Hidden Markov Model  (HMM).

Hidden Markov Model (HMM) is a form of development of Markov chains, which can be applied in cases that can not be observed directly. As observed state for sequence alignment is the sequence of amino acids into three categories namely: deletion (1), insertion (2) and match (3), while for the hidden state is an amino acid residue, which can determine the family of proteins corresponding to the observation O. Implementation through HMM software for  the amino acid sequence has been done but needs to be tested against actual data accuracy through the PDB  (Protein Data Bank).


Refbacks

  • There are currently no refbacks.