การวิเคราะห์แบ่งกลุ่มและการค้นหาโมดูลการทำงานของยีนจากข้อมูลการแสดงออกของยีนในรากมันสำปะหลัง
คำสำคัญ:
การวิเคราะห์แบ่งกลุ่มยีน, การแสดงออกของยีน, มันสำปะหลังบทคัดย่อ
มันสำปะหลังเป็นพืชเศรษฐกิจสำคัญทั้งในประเทศไทยและในโลก ความก้าวหน้าทางวิทยาศาสตร์ทำให้ทราบจีโนมของมันสำปะหลัง แต่การที่จะทราบหน้าที่ของยีนจากการวิเคราะห์ทางห้องปฏิบัติการทางชีววิทยาระดับโมเลกุลของพืชนั้นต้องใช้ระยะเวลาและทรัพยากรจำนวนมาก งานวิจัยนี้จึงมีวัตถุประสงค์เพื่อทำนายหน้าที่การทำงานของยีนจากพฤติกรรมการแสดงออกของยีนด้วยการวิเคราะห์แบ่งกลุ่มด้วยวิธี K-means และอนุมานหน้าที่ให้แก่ยีนที่ไม่ทราบหน้าที่ภายในกลุ่มยีนที่โดดเด่นด้วย Gene Set Enrichment Analysis (GSEA) ข้อมูลการแสดงออกของยีนที่นำมาศึกษาเป็นข้อมูลการแสดงออกของราก ซึ่งประกอบด้วยเนื้อเยื่อ 3 ชนิด ได้แก่ เนื้อเยื่อรากสะสมอาหาร เนื้อเยื่อรากฝอย และเนื้อเยื่อเจริญปลายราก รวม 8 ตัวอย่าง โดยแบ่งชุดข้อมูลออกเป็น ข้อมูลย่อย 2 ชุด ได้แก่ (1) เนื้อเยื่อรากฝอยและเนื้อเยื่อเจริญปลายราก และ (2) เนื้อเยื่อรากสะสมอาหาร เนื้อเยื่อรากฝอย และเนื้อเยื่อเจริญปลายราก พบว่า สามารถแบ่งกลุ่มรูปแบบการแสดงออกออกเป็น 21 และ 20 กลุ่มตามลำดับ ซึ่งมีเพียง 14 กลุ่มที่สามารถหาหน้าที่ที่โดดเด่นของยีนให้แต่ละกลุ่มได้ในชุดข้อมูลทั้ง 2 ชุด ทำให้สามารถทำนายหน้าที่ของยีนให้แก่ยีนที่ไม่ทราบหน้าที่ได้จำนวน 8,561 และ 8,727 ยีนในชุดข้อมูลที่ 1 และ 2 ตามลำดับ รวมแล้วสามารถทำนายหน้าที่ของยีนได้เพิ่มขึ้น 8,736 ยีน หรือ คิดเป็นร้อยละ 26.45 ของยีนทั้งหมดในจีโนมมันสำปะหลัง ผลการทำนายหน้าที่ของยีนด้วยวิธีการดังกล่าวสามารถเพิ่มความสมบูรณ์ของหน้าที่ยีน คิดเป็นร้อยละ 75.38
References
Office of Agricultural Economics, 2020, Thailand Foreign Agricultural Trade Statistics 2019 [Online], Available: http://www.oae.go.th/assets/portals/1/files/journal/2563/trade st-at62.pdf. (In Thai)
Food and Agriculture Organization of the United Nations (FAO), 2017, The Future of Food and Agriculture: Trends and Challenges [Online], Available: http://www.fao.org/3/-a-i6881e.pdf.
Bredeson, J.V., Lyons, J.B., Prochnik, S., Wu, G.A., Ha, C.M., Ha, C.M., Edsinger-Gonzales, E., Edsinger-Gonzales, E., Grimwood, J., Schmutz, J., Rabbi, I.Y., Egesi, C., Nauluvula, P., Lebot, V., Ndunguru, J., Mkamilo, G.S., Bart, R., Setter, T.L., Gleadow, R. M., Kulakow, P., Ferguson, M., Rounsley, S., Rokhsar, D.S., Rokhsar, D.S. and Rokhsar, D.S., 2016, “Sequencing Wild and Cultivated Cassava and Related Species Reveals Extensive Interspecific Hybridization and Genetic Diversity,” Nature Biotechnology, 34 (5), pp. 562-570.
Mackenzie, R., 2018, RNA-seq: Basics, Applications and Protocol [Online], Available: https://www.technologynetworks.com/genomics/articles/rna-seq-basics-applica-tions-and-protocol-299461.
Goodstein, D., Shu, S., Howson, R., Neupane, R., Hayes, R.D., Fazo, J., Mitros, T., Dirks, W., Hellsten, U., Putnam, N.H. and Rokhsar, D.S., 2012, “Phytozome: a Comparative Platform for Green Plant Genomics,” Nucleic Acids Research, 40, pp. 1178-1186. https://doi.org/10.1093/nar/gkr944
Wong, D.C., Sweetman, C. and Ford, C.M., 2014, "Annotation of Gene Function in Citrus Using Gene Expression Information and Co-expression Networks," BMC Plant Biology, 14 (1): 186. https://doi.org/10.1186/1471-2229-14-186
Villaverde, A.F. and Banga, J.R., 2014, "Reverse Engineering and Identification in Systems Biology: Strategies, Perspectives and Challenges," Journal of the Royal Society Interface, 11: 20130505. https://doi.org/10.1098/rsif.2013.0505
Wilson, M.C., Mutka, A.M., Hummel, A.W., Berry, J., Chauhan, R.D., Vijayaragha-van, A., Taylor, N.J., Voytas, D.F., Chitwood, D.H. and Bart, R.S., 2017, "Gene Expression Atlas for the Food Security Crop Cassava," New Phytologist, 213 (4), pp. 1632-1641. https://doi.org/10.1111/nph.14443
Brown, T.A., 2002, Genomes [Online], Available: https://www.ncbi.nlm.nih.gov/books/NBK21130/.
The Gene Ontology Consortium, Gene Ontology Overview [Online], Available: http://geneontology.org/docs/ontology-documentation/.
Smid, M., Coebergh van den Braak, R.R.J., van de Werken, H.J.G., van Riet, J., van Galen, A., de Weerd V., van der Vlugt-Daane, M., Bril, S.I., Lalmahomed, Z.S., Kloosterman, W.P., Wilting, S.M., Foekens, J.A., IJzermans, J.N.M., Martens, J.W.M. and Sieuwerts, A.M., 2018, “Gene Length Corrected Trimmed Mean of M-values (GeTMM) Processing of RNA-seq Data Performs Similarly in Intersample Analyses while Improving Intrasample Comparisons,” BMC Bioinformatics, 19: 236. https://doi.org/10.1186/s12859-018-2246-7
James, G., Witten, D., Hastie, T. and Tibshirani, R., 2013 An Introduction to Statistical Learning: with Applications in R, Springer, New York.
Shi, J. and Walker, M.G., 2007, "Gene Set Enrichment Analysis (GSEA) for Interpreting Gene Expression Profiles," Current Bioinformatics, 2 (2), pp. 133-137. https://doi.org/10.2174/157489307780618231
Subramanian A., Tamayo P., Mootha V.K., Mukherjee S., Ebert B.L., Gillette M.A., Paulovich A., Pomeroy S.L., Golub T.R., Lander E.S. and Mesirov, J.P., 2005, “Gene Set Enrichment Analysis: a Knowledge-based Approach for Interpreting Genome-wide Expression Profiles,” Proceedings of the National Academy of Sciences of the United States of America, 102 (43), pp. 15545-15550. https://doi.org/10.1073/pnas.0506580102
Maruschke, M., Hakenberg, O.W., Koczan, D., Zimmermann, W., Stief, C.G. and Buchner, A., 2014, "Expression Profiling of Metastatic Renal Cell Carcinoma Using Gene Set Enrichment Analysis," International Journal of Urology, 21 (1), pp. 46-51. https://doi.org/10.1111/iju.12183
Wu, B., Li, C., Xie, J., Du, Z., Luo, L., Wu, J., Zhang, P., Xu, L. and Li, E., 2014, "Bioinformatics Analyses of m-RNA Profiling Following Ezrin Knockdown in Esophageal Squamous Cell Carcinoma," Journal of Cancer Science and Therapy, 6 (9), pp. 314-321. https://doi.org/10.4172/1948-5956.1000287
Yu, Y., Blokhuis, B.R., Garssen, J. and Redegeld, F.A., 2019, "A Transcriptomic Insight into the Impact of Colon Cancer Cells on Mast Cells," International Journal of Molecular Sciences, 20 (7): 1689. https://doi.org/10.3390/ijms20071689
Klopfenstein, D.V., Zhang, L., Pedersen, B.S., Ramírez, F., Vesztrocy, A.W., Naldi, A., Mungall, C.J., Yunes, J.M., Botvinnik, O., Weigel, M., Dampier, W., Dessimoz, C., Flick, P. and Tang, H., 2018, "GOATOOLS: A Python Library for Gene Ontology Analyses," Scientific Reports, 8: 10872. https://doi.org/10.1038/s41598-018-28948-z
Huang, D.W., Sherman, B.T. and Lempicki, R.A., 2009, "Bioinformatics Enrichment Tools: Paths toward the Comprehensive Functional Analysis of Large Gene Lists," Nucleic Acids Research, 37 (1), pp. 1-13. https://doi.org/10.1093/nar/gkn923
Robinson, M.D., McCarthy, D.J. and Smyth, G.K., 2010, edgeR: a Bioconductor Package for Differential Expression Analysis of Digital Gene Expression Data, Bioinformatics, 26 (1), pp. 139-140. https://doi.org/10.1093/bioinformatics/btp616
Chen, Y., McCarthy, D., Robinson, M. and Smyth, G.K, 2008, edgeR: Differential Expression Analysis of Digital Gene Expression Data User's Guide [Online], Available: http://www.bioconductor.org/packages/release/bioc/vignettes/edgeR/inst/doc/edgeRUsersGuide.pdf.
Williams, A. and Halappanavar, S., 2017, “Application of Bi-clustering of Gene Expression Data and Gene Set Enrichment Analysis Methods to Identify Potentially Disease Causing Nanomaterials,” Data in Brief, 15, pp. 933-940. https://doi.org/10.1016/j.dib.2017.10.060
Downloads
เผยแพร่แล้ว
How to Cite
ฉบับ
บท
License
Copyright (c) 2021 มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
เนื้อหาของบทความที่ตีพิมพ์ในวารสาร Science and Engineering Connect ในทุกรูปแบบ รวมถึงข้อความ สมการ สูตร ตาราง ภาพ ตลอดจนภาพประกอบในรูปแบบอื่นใด เป็นลิขสิทธิ์ของมหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี การนำเนื้อหา ไม่ว่าจะในรูปแบบใด ของบทความไปใช้ประโยชน์ในเชิงพาณิชย์ ต้องได้รับอนุญาตจากบรรณาธิการวารสารอย่างเป็นลายลักษณ์อักษรก่อนเท่านั้น