Aturan 5 langkah untuk proses analisis pada proteom atau genom pada awalnya diusulkan oleh Kuo-Chen Chou pada 2011 - yang mana banyak ilmuwan menyebutnya sebagai "Aturan 5 langkah Chou".[1][2][3][4] Aturan ini telah banyak digunakan untuk analisis proteom dan genom, serta memprediksi modifikasi pasca-translasi (Post-Translational Modification) pada protein, RNA, dan DNA.[5]
Menurut aturan ini, untuk mengembangkan metode prediksi yang lebih berguna - atau prediktor untuk analisis genom atau proteom, ada lima pedoman yang harus diikuti:
- Membuat atau memilih dataset benchmark yang valid untuk melatih dan menguji prediktor.
- Merumuskan sampel urutan biologis dengan rumus matematika yang efektif - yang benar-benar dapat mencerminkan hubungan intrinsik individu tersebut dengan target yang akan diprediksi.
- Memperkenalkan atau mengembangkan algoritma (atau mesin) yang kuat untuk dapat mengoperasikan prediksi.
- Melakukan uji validasi silang yang benar agar dapat secara obyektif mengevaluasi tingkat akurasi prediksi.
- Membuat server web untuk prediktor yang dapat diakses oleh publik.
Sejak saat itu, aturan 5 langkah ini telah banyak digunakan oleh ilmuwan dalam mengembangkan berbagai prediktor untuk analisis proteom atau genom, terutama oleh para ilmuwan yang merumuskan urutan biologis dengan PseAAC atau PseKNC untuk mengembangkan berbagai prediktor - yang kemudian digunakan untuk analisis proteome atau genom.
Berbagai makalah yang disajikan untuk mengembangkan metode analisis urutan baru atau prediktor statistik dengan mengamati pedoman aturan 5-langkah Chou memiliki beberapa keunggulan sebagai berikut:
- Sangat jelas dalam pengembangan logika
- Sepenuhnya transparan dalam pengoperasiannya
- Hasil yang dilaporkan dapat dengan mudah diulangi oleh simpatisan lain
- Potensi tinggi dalam merangsang metode analisis urutan lainnya
- Nyaman digunakan oleh sebagian besar ilmuwan eksperimental
Selain itu, aturan 5 langkah Chou telah semakin diperluas ke bagian ilmiah lainnya, misalnya ilmu material untuk mengembangkan metode yang kuat untuk mendeteksi bahan perovskit dengan suhu Curie yang lebih tinggi juga.[6]
Referensi
- ^ Hussain W, Khan YD, Rasool N, Khan SA, Chou KC (Feb 2019). "SPrenylC-PseAAC: A sequence-based model developed via Chou's 5-steps rule and general PseAAC for identifying S-prenylation sites in proteins". J. Theor. Biol. 468: 1–11. doi:10.1016/j.jtbi.2019.02.007. PMID 30768975.
- ^ Hussain W, Khan YD, Rasool N, Khan SA, Chou KC (Mar 2019). "SPalmitoylC-PseAAC: A sequence-based model developed via Chou's 5-steps rule and general PseAAC for identifying S-palmitoylation sites in proteins". Anal. Biochem. 568: 14–23. doi:10.1016/j.ab.2018.12.019. PMID 30593778.
- ^ Le NQK, Yapp EKY, Ho QT, Nagasundaram N, Ou YY, Yeh HY (Feb 2019). "iEnhancer-5Step: Identifying enhancers using hidden information of DNA sequences via Chou's 5-step rule and word embedding". Anal. Biochem. 57: 53–61. doi:10.1016/j.ab.2019.02.017. PMID 30822398.
- ^ Ning Q, Ma Z, Zhao X (Mar 2019). "dForml(KNN)-PseAAC: Detecting Formylation sites from protein sequences using K-nearest neighbor algorithm via Chou's 5-step rule and Pseudo components". J. Theor. Biol. doi:10.1016/j.jtbi.2019.03.011. PMID 30880183.
- ^ Kabir M, Ahmad S, Iqbal M, Hayat M (Feb 2019). "iNR-2L: A two-level sequence-based predictor developed via Chou's 5-steps rule and general PseAAC for identifying nuclear receptors and their families". Genomics. doi:10.1016/j.ygeno.2019.02.006. PMID 30779939.
- ^ Zhan, X., Chen, M., Lu, W. (2018). Accelerated search for perovskite materials with higher Curie temperature based on the machine learning methods. Computational Materials Science 151, 41-48. http://dx.doi.org/10.1016/j.commatsci.2018.04.031