Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  22,277,476
  • Công bố khoa học và công nghệ Việt Nam

Vi sinh vật học

Võ Trí Nam, Phạm Trung Nghĩa, Trương Hà Minh Nhật, Trần Linh Thước(1), Nguyễn Đức Hoàng

Nghiên cứu dự đoán gene biểu hiện cao cho Escherichia coli dựa trên dữ liệu mRNA microarray

Phát triển Khoa học và Công nghệ: Khoa học Tự nhiên (ĐHQG TP. Hồ Chí Minh)

2021

2

1068-1077

2588-106X

Các gene biểu hiện cao (Highly expressed genes – HEG) là những gene có sẵn trong sinh vật, mang những codon ưa thích đối với hệ thống biểu hiện. Việc xác định được các gene biểu hiện cao giúp tìm ra các codon ưa thích và sử dụng trong tối ưu hóa gene nhằm biểu hiện protein mục tiêu với mức độ mong muốn. Hiện nay, HEG-DB là cơ sở dữ liệu (CSDL) duy nhất lưu trữ dữ liệu gene biểu hiện cao của nhiều chủng vi sinh vật, tuy nhiên dữ liệu hiện không còn được cập nhật và duy trì. Vì vậy chúng tôi tiến hành dự đoán các gene biểu hiện cao ở chủng E. coli K-12 MG1655 dựa trên các bộ tham chiếu là gene mã hóa protein ribosome được sử dụng phổ biến hiện nay và những gene có độ phiên mã cao từ dữ liệu microarray do chúng tôi đề xuất. Kết quả dự đoán được phân tích bằng cách so sánh giữa các bộ tham chiếu trên cũng như so sánh với gene biểu hiện cao thu nhận từ CSDL HEG-DB. Kết quả cho thấy bộ tham chiếu gồm 69 gene mã hóa protein ribosome và 100-mRNA cho kết quả hoàn toàn trùng khớp và dự đoán được gene biểu hiện cao nhiều hơn và có độ tin cậy cao hơn so với dữ liệu từ CSDL HEG-DB thể hiện qua các gene dự đoán được có giá trị CAI cao hơn và số lượng gene tham gia vào các con đường chuyển hóa trong tế bào, đặc biệt là các con đường chuyển hóa quan trọng đều cao hơn. Nghiên cứu này đề xuất có thể sử dụng bộ tham chiếu từ dữ liệu microarray của E. coli thay cho bộ tham chiếu protein ribosome.

TTKHCNQG, CTv 149

  • [1] Huang DW; Sherman BT; Lempicki RA. (2009), Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large genee lists,Nucleic Acids Res. 2009;37[1]:1- 13;PMID: 19033363. Available f-rom: https://doi.org/10.1093/ nar/gkn923
  • [2] Huang DW; Sherman BT; Lempicki RA. (2009), Systematic and integrative analysis of large genee lists using DAVID bioinformatics resources,Nat Protoc. 2009;4(1):44–57. PMID: 19131956. Available f-rom: https://doi.org/10.1038/nprot.2008.211
  • [3] Lewis NE; Cho B-K; Knight EM; Palsson BO. (2009), Genee Expression Profiling and the Use of Geneome-Scale In Silico Models of Escherichia coli for Analysis: Providing Context for Content,Journal of Bacteriology. 2009;191(11):3437. PMID: 19363119. Available f-rom: https://doi.org/10.1128/JB.00034-09
  • [4] Puigbò P; Guzmán E; Romeu A; Garcia-Vallvé S. (2007), OPTIMIZER: a web server for optimizing the codon usage of DNA sequences,Nucleic Acids Res. 2007;35[Web Server issue]:W126- 131;PMID: 17439967. Available f-rom: https://doi.org/10.1093/ nar/gkm219
  • [5] Chi DTK; Lang TV; Hiep HX. (2016), Dự đoán gene biểu hiện cao cho thiết kế gene dùng trong tái tổ hợp,Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX -Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin [FAIR’9]. 2016
  • [6] Karlin S; Mrázek J. (2000), Predicted highly expressed genees of diverse prokaryotic geneomes,J Bacteriol. 2000;182[18]:5238- 50;PMID: 10960111. Available f-rom: https://doi.org/10.1128/ JB.182.18.5238-5250.2000
  • [7] Puigbò P; Romeu A; Garcia-Vallvé S. (2008), HEG-DB: a database of predicted highly expressed genees in prokaryotic complete geneomes under translational se-lection,Nucleic Acids Res. 2008;36[Database issue]:D524-527;PMID: 17933767. Available f-rom: https://doi.org/10.1093/nar/gkm831
  • [8] Gaspar P; Moura G; Santos MAS; Oliveira JL. (2013), mRNA secondary structure optimization using a correlated stem-loop prediction,Nucleic Acids Res. 2013;41[6]:e73;PMID: 23325845. Available f-rom: https://doi.org/10.1093/nar/gks1473
  • [9] Sharp PM; Li WH. (1987), The codon adaptation index–a measure of directional synonymous codon usage bias, and its potential applications,Nucleic Acids Res. 1987 11;15[3]:1281-95;PMID: 3547335. Available f-rom: https://doi.org/10.1093/nar/15.3. 1281
  • [10] Raab D; Graf M; Notka F; Schödl T; Wagner R. (2010), The GeneeOptimizer Algorithm: using a sliding window approach to cope with the vast sequence space in multiparameter DNA sequence optimization,Syst Synth Biol. 2010 ;4[3]:215-25;PMID: 21189842. Available f-rom: https://doi.org/10.1007/s11693- 010-9062-3
  • [11] Grote A, Hiller K; Scheer M; Münch R; Nörtemann B; Hempel DC, et al. (2005), JCat: a novel tool to adapt codon usage of a target genee to its potential expression host,Nucleic Acids Res. 2005 1;33[Web Server issue]:W526-531;PMID: 15980527. Available f-rom: https://doi.org/10.1093/nar/gki376
  • [12] Yu K; Ang KS; Lee D-Y. (2017), Synthetic genee design using codon optimization on-line [COOL],Methods Mol Biol. 2017;1472:13- 34;PMID: 27671929. Available f-rom: https://doi.org/10.1007/ 978-1-4939-6343-0_2