Thứ Hai, 1 tháng 6, 2026

OsCBL10 điều tiết ngược tính trạng chịu mặn ở gia đoạn mạc của cây lúa

 OsCBL10 điều tiết ngược tính trạng chịu mặn ở gia đoạn mạc của cây lúa

Ngun: Xuemei KuangRuofeng LiuLei JinShengping WangShufeng GaoYilan Qiu. 2026. OsCBL10 negatively regulates salt tolerance at seedling stage in ricePlant Physiol Biochem.; 2026 Feb: 231:110999. doi: 10.1016/j.plaphy.2025.110999.

    Đất mặn là nguy cơ ngày càng gia tăng cho sản xuất lúa. Cho dù, người ta biết các phức CBL-CIPK giải mã được bản chất di truyền của muối gây ra đột biết Ca2+ để tăng hoạt sự vận chuyển ion và lộ trình antioxidant, nhưng vai trò in vivo của OsCBL10 trong cây lúa vẫn chưa được biết rõ, để lại mộ khoảng trống trong cơ chế chống chịu mặn dựa trên nền ion Ca2+. Trong nghiên cứu này, tác giả minh chứng rằng OsCBL10 là một Ca2+sensor định vị tại màng không bào, nó điều tiết phiên mã kiểu “up” khi cây lúa bị mặn, hầu hết gen đích biểu hiện cao ở túi phấn và chồi thân khi cho xử lý mặn. Thực hiện đột biến có chủ đích bằng bằng knockout nhờ hệ thống CRISPR-Cas9 các dòng lúa CBL10-1/2 biểu hiện mức độ cây sống cao hơn, chồi thân dài hơn 25 và chồi lú có hàm lượng Na+/K+ thấp hơn 30% so với dòng lúa gốc (WT) trong nghiệm thức 100 mM NaCl, trong khi, dòng lúa biểu hiện mạnh mẽ (OE1/2) rất nhạy cảm với mặn. Tính trạng chịu mặn được cải tiến của dòng đột biến cbl10 mutants gắn liền với (i) tăng cường đẩy Nara ngoài và thu hồi K+, (ii) tích tụ H2O2 giảm, (iii) điều tiết phiên mã kiểu up gen OsSOS1OsNHX1  OsMIOX. Do đó, chức năng của protein OsCBL10 như một phanh “tonoplast”, làm giảm áp lực tín hiệu SOS và loại bỏ ROS khi bị stress mặn. Nghiên cứu này mở rộng vai trò hiểu biết họ protein CBL của cây lúa và nhấn mạnh OsCBL10 là gen đích phục vụ cải tiến giống lúa bằng công nghệ di truyền -  chỉnh sửa gen.

Xem https://pubmed.ncbi.nlm.nih.gov/41483744/

GHI CHÚ

Hệ thống CRISPR-Cas9 đã cách mạng hóa ngành sinh học và chọn giống cây trồng bằng cách cho phép tạo ra các đột biến có chủ đích (targeted mutagenesis) thông qua cơ chế bất hoạt gen (Knockout).

Dưới đây là cơ chế chi tiết và các ứng dụng thực tế của kỹ thuật này trong nghiên cứu và cải tiến giống thực vật.

1. Cơ chế Knockout Gen có chủ đích bằng CRISPR-Cas9

Hệ thống CRISPR-Cas9 nguyên bản gồm hai thành phần chính:

  • Enzyme Cas9: Đóng vai trò như một chiếc “kéo phân tử” cắt DNA chuỗi đôi (dsDNA).

  • sgRNA (single guide RNA): Đoạn RNA mồi được thiết kế có trình tự khoảng 20 nucleotide bổ sung chính xác với vùng gen mục tiêu cần knockout, dẫn đường cho Cas9 đến đúng vị trí.

Quy trình tạo đột biến Knockout:

  1. Định vị và Cắt: sgRNA dẫn Cas9 đến vị trí mục tiêu trên genome (ngay trước trình tự PAM - 5'-NGG-3'). Cas9 thực hiện cắt hai mạch DNA, tạo ra vết đứt gãy chuỗi đôi (DSB - Double-Strand Break).

  2. Sửa chữa sai sót (Gây đột biến): Tế bào thực vật phát hiện tổn thương và kích hoạt cơ chế tự sửa chữa tự nhiên. Trong điều kiện bình thường không có đoạn DNA sửa chữa mẫu, tế bào sẽ dùng cơ chế NHEJ (Non-Homologous End Joining - Nối đầu tận cùng không tương đồng).

  3. Lệch khung đọc (Frameshift): Cơ chế NHEJ sửa chữa rất dễ bị lỗi, thường xuyên làm mất hoặc thêm một vài nucleotide (Indels) tại vị trí cắt. Sự thay đổi này dẫn đến hiện tượng dịch khung đọc mã di truyền, xuất hiện mã kết thúc sớm (Stop codon), khiến protein không thể dịch mã hoặc tạo ra protein mất chức năng hoàn toàn  Gen bị Knockout.

2. Các ứng dụng của kỹ thuật CRISPR-Cas9 Knockout trong Thực vật

Trong công nghệ sinh học thực vật, knockout gen không chỉ phục vụ nghiên cứu cơ bản (xác định chức năng gen) mà còn là công cụ mạnh mẽ để tạo ra các tính trạng kinh tế mong muốn bằng cách loại bỏ các “gen điều hòa âm” (negative regulators) hoặc các gen mẫn cảm.

A. Nâng cao chất lượng nông sản (Quality Improvement)

Thay vì thêm gen mới, việc loại bỏ các gen chịu trách nhiệm tổng hợp các hợp chất không mong muốn giúp cải thiện giá trị dinh dưỡng:

  • Lúa gạo: Knockout gen SBEIIb (Starch branching enzyme) giúp tăng hàm lượng tinh bột kháng (resistant starch), rất tốt cho người tiểu đường. Hoặc loại bỏ gen BADH2 để kích hoạt quá trình tổng hợp mùi thơm (2-acetyl-1-pyrroline), giúp gạo thường có mùi thơm như gạo tám/gạo Jasmine.

  • Nấm mỡ / Khoai tây không bị thâm: Knockout gen mã hóa enzyme PPO (Polyphenol Oxidase) giúp ngăn chặn quá trình oxy hóa gây nâu bề mặt khi cắt hoặc dập nát, kéo dài thời gian bảo quản.

  • Đậu nành giàu Axit Oleic: Loại bỏ các gen FAD2 (Fatty Acid Desaturase 2) giúp ngăn chặn việc chuyển đổi axit oleic thành axit linoleic, tạo ra dầu đậu nành tốt cho tim mạch tương đương dầu ô liu.

B. Kháng bệnh hại (Disease Resistance)

Nhiều tác nhân gây bệnh (vi khuẩn, nấm, virus) lợi dụng các gen mẫn cảm (S-genes - Susceptibility genes) của cây để xâm nhiễm. Việc knockout các gen này giúp cây kháng bệnh mà không cần chuyển gen ngoại lai.

  • Kháng bệnh bạc lá và đạo ôn trên lúa: Knockout các gen dòng SWEET (vốn bị vi khuẩn Xanthomonas lợi dụng để hút đường từ tế bào thực vật).

  • Kháng bệnh phấn trắng (Powdery Mildew): Knockout gen MLO ở lúa mì, cà chua, và nho giúp cây kháng hoàn toàn với nấm gây bệnh phấn trắng.

C. Chống chịu stress phi sinh học (Abiotic Stress Tolerance)

  • Giúp cây thích ứng tốt hơn với biến đổi khí hậu (mặn, hạn, ngập lụt, nhiệt độ cao) bằng cách tắt các gen ức chế phản ứng chống chịu.

  • Ví dụ: Knockout gen DST (Drought and Salt Tolerance) ở lúa giúp tăng số lượng khí khổng đóng mở tối ưu, giảm mất nước, nâng cao năng suất trong điều kiện hạn và mặn.

D. Tối ưu hóa kiến trúc cây và Năng suất (Yield & Architecture Modification)

  • Điều khiển thời gian ra hoa: Tắt các gen ức chế ra hoa giúp cây ra hoa đồng loạt hoặc rút ngắn giai đoạn sinh trưởng.

  • Kiến trúc bông và hạt: Ở cây lúa, knockout một số gen như Gn1a (làm tăng số lượng hạt/bông) hay GS3 (làm tăng kích thước và chiều dài hạt), từ đó cải thiện trực tiếp cấu thành năng suất.

3. Ưu điểm vượt trội trong ứng dụng thực vật

  1. Đột biến sạch (Không chứa Transgene): Khác với sinh vật biến đổi gen (GMO) truyền thống, sau khi CRISPR-Cas9 cắt và tạo đột biến, qua quá trình lai lai phân ly ở thế hệ sau (T1,T2), các đoạn DNA mã hóa cho Cas9 và sgRNA có thể được loại bỏ hoàn toàn. Cây trồng thu được chỉ mang đột biến mất/thêm nucleotide tự nhiên, không khác gì đột biến truyền thống nhưng chính xác 100%.

  2. Chỉnh sửa đa gen đồng thời (Multiplexing): Thực vật thường có hiện tượng đa bội hoặc gen trùng lặp chức năng (paralogs). CRISPR-Cas9 cho phép thiết kế đồng thời nhiều sgRNA để cắt và knockout cùng lúc một họ gen hoặc nhiều gen khác nhau trong một lần chuyển nạp.

PHẦN MỀM SỬ DỤNG

Để thực hiện thiết kế đột biến knockout bằng hệ thống CRISPR-Cas9 trên thực vật, các nhà nghiên cứu chủ yếu sử dụng các phần mềm thiết kế sgRNA (single guide RNA)phân tích genome. Các công cụ này giúp tìm vị trí cắt tối ưu, tính toán hiệu suất cắt (On-target score) và hạn chế tối đa việc cắt nhầm vị trí khác (Off-target score).

Dưới đây là các phần mềm/công cụ trực tuyến phổ biến nhất hiện nay, hoàn toàn miễn phí kèm đường link truy cập trực tiếp:

1. Benchling (Khuyên dùng cho Nghiên cứu & Giảng dạy)

Benchling là một nền tảng sinh học phân tử đám mây cực kỳ mạnh mẽ. Nó tích hợp đầy đủ công cụ từ quản lý trình tự DNA, thiết kế mồi (primers), cho đến thiết kế sgRNA cho CRISPR-Cas9 với thư viện genome của hàng trăm loài thực vật (Lúa, ngô, Arabidopsis, cà chua...).

  • Tính năng: Tự động tìm trình tự PAM, tính toán điểm On-target và Off-target, giả lập đưa sgRNA vào plasmid vector.

  • Hình thức: Chạy trực tuyến trên trình duyệt (Cần đăng ký tài khoản Academic miễn phí).

  • Đường link truy cập: https://www.benchling.com/crispr

2. CHOPCHOP (V3)

Đây là một trong những công cụ trực tuyến trực quan và dễ sử dụng nhất hiện nay dành cho cả Knockout, Knockin hay và chỉnh sửa biểu hiện gen bằng CRISPR-Cas9/Cas12.

  • Tính năng: Chỉ cần nhập tên gen hoặc mã vùng gen, chọn loài thực vật cần nghiên cứu. Phần mềm sẽ hiển thị biểu đồ trực quan các vị trí exon có thể thiết kế sgRNA để gây đột biến dịch khung hiệu quả nhất.

  • Hình thức: Sử dụng trực tuyến miễn phí, không bắt buộc đăng ký tài khoản.

  • Đường link truy cập: https://chopchop.cbu.uib.no/

3. CRISPOR

Một công cụ chuyên biệt được cộng đồng nghiên cứu CRISPR sử dụng rất phổ biến để đánh giá các đoạn RNA dẫn đường.

  • Tính năng: Hỗ trợ thuật toán đánh giá Off-target rất chi tiết, liên kết trực tiếp với các cơ sở dữ liệu genome lớn như UCSC hay Ensembl Plants. Đặc biệt hữu ích khi cần thiết kế sgRNA cho các biến thể Cas9 khác nhau hoặc Cas12a (Cpf1).

  • Hình thức: Sử dụng trực tuyến miễn phí.

  • Đường link truy cập: http://crispor.tefor.net/

4. CRISPR-P 2.0 (Chuyên biệt cho Thực vật)

Nếu bạn tập trung hoàn toàn vào các đối tượng cây trồng, đây là công cụ được tối ưu hóa riêng cho thế giới thực vật.

  • Tính năng: Hỗ trợ cơ sở dữ liệu genome của hơn 40 loài thực vật phổ biến (gồm các giống lúa mạch, lúa nước Oryza sativa, bông, đậu tương, v.v.). Thuật toán được tinh chỉnh để phù hợp với hệ thống vector chuyển gen ở thực vật (như hệ thống vector dựa trên Agrobacterium).

  • Hình thức: Sử dụng trực tuyến miễn phí.

  • Đường link truy cập: http://crispr.hzau.edu.cn/CRISPR2/

5. CRISPRdirect

Một công cụ đơn giản, tốc độ xử lý cực nhanh đến từ Nhật Bản, tập trung vào việc kiểm tra tính đặc hiệu (Specificity) của sgRNA để tránh hiện tượng off-target.

Lưu ý nhỏ: Do kích thước dữ liệu bộ gen (Genome) của các loài thực vật thường rất lớn và cập nhật liên tục, các phần mềm này hiện nay đa số đều chuyển sang mô hình chạy trực tuyến (Web-based tools) thay vì tải phần mềm cài đặt về máy tính cá nhân. Điều này giúp máy tính của bạn không bị quá tải khi chạy các thuật toán đối chiếu trình tự DNA. 

Tìm kiếm gen chịu lạnh và những alen khả thi trong giống lúa nếp Kam ở nhiều giai đoạn tăng trưởng khác nhau

 Tìm kiếm gen chịu lạnh và những alen khả thi trong giống lúa nếp Kam ở nhiều giai đoạn tăng trưởng khác nhau

Nguồn: Kunchi YuChunhui LiuJoohyun LeeXiaoding MaBing HanZhengwu ZhaoSoon-Wook Kwon,  Longzhi Han & Di Cui. 2026. Discovery of cold tolerance genes and favorable alleles in Kam sweet rice across various growth stages. Theoretical and Applied Genetics; 11 May 2026;Volume 139, article number 152

Tích hợp phương pháp “combined association”“phân tích quét có chọn lọc” trong di truyền, người ta xác định được _OsCTD2_  and  _OsLTPL159_  là 2 gen ứng cử viên chủ chốt gắn liền với tính chống chịu lạnh ở cả 2 giai đoạn nẩy mầm và giai đoạn mạ.

Tính trạng nhiễm lạnh của cây lúa dẫn đến kết quả mất năng suất đáng kể. Xác định nguồn vật liệu giống lúa chịu lạnh và khám phá những gen đích rất cần thiết để phát triển giống lúa cao sản chịu lạnh. Kam Sweet Rice (KSR) là giống lúa biểu hiện tính chống chịu lạnh đáng chú ý, là nguồn vật liệu di truyến vô giá để tiến hành xác định các gen đích. Tác giả đánh giả kiểu hình chống chịu mặn ở nhiều giai đoạn khác nhau trong tập đoàn bao gồm 104 mẫu giống lúa KSR và 268 mẫu giống lúa bản dịa khác. Kết quả GWAS (genome-wide association studies) xác định 89 loci gắn liền có ý nghĩa với chịu lạnh: 57 loci có ỡ giai đoạn nẩy mầm, 9 có ở giai đoạn đâm chồi thân, và 28 có ở giai đoạn mạ, với 61 loci (69%) là mới tìm thấy. Kết hợp di truyền associationphân tích di truyền quét chọn lọc, người ta xác định được hai gen ứng cử viên rất đáng tin cậy, OsCTD2  OsLTPL159, gắn với tính chống chịu lạnh ở gđ nẩy mầm và gđ mạ. Kết quả phân tích haplotype cho thấy có khác biệt ý nghĩa thống kê về cấp độ chịu lạnh và mức độ cây sống sót trong nhiều haplotypes khác nhau của những gen này, với những haplotypes tối ưu đều có trong giống lúa KSR. Kết quả phân tích RNA-seq và qRT-PCR cho thấy những haplotypes tối ưu của gen OsCTD2 và OsLTPL159 biểu hiện đáng kể trong các mẫu giống lúa chịu lạnh giỏi, trong khi, không có khác biệt đáng kể nào được quan sát trong mẫu giống lúa nhiễm lạnh với những haplotypes yếu kém. Gen OsCTD2 và OsLTPL159 có trong phản ứng chịu lạnh của hệ gen cây lúa. Bên cạnh, người ta xác định được hai gen ứng cử viên triển vọng và những haplotypes ưu việt của chúng điều khiển tính trạng chịu lạnh: OsGRS7 ở giai đoạn nẩy mầm và OsBSR6 ở giai đoạn đâm chồi thân. Đây là cơ sở khoa học để dòng hóa gen chịu lạnh và là luận cứ khoa học cho chiến lược cải tiến giống lúa bằng pp phân tử.

Xem https://link.springer.com/article/10.1007/s00122-026-05246-1

GHI CHÚ

Combo tiếp cận cực kỳ mạnh mẽ và toàn diện trong di truyền học hiện đại (thường thấy trong các nghiên cứu bộ gen cây trồng, vật nuôi hoặc y sinh). Việc kết hợp giữa di truyền liên kết (GWAS/Haplotype)tiến hóa/chọn lọc (Selective Sweep) và biểu hiện gen (RNA-seq/qRT-PCR) giúp bạn đi từ một kiểu hình (phenotype) thô sơ đến việc xác định chính xác gen chức năng (causal gene) và cơ chế phân tử của nó.

Dưới đây là bức tranh toàn cảnh về cách các phương pháp này bổ trợ cho nhau theo một lộ trình nghiên cứu logic:

1. GWAS & Phân tích Quét chọn lọc (Selective Sweep)

Mục tiêu: Thu hẹp vùng gen ứng viên từ toàn bộ hệ gen.

Thông thường, nếu chỉ dùng GWAS, bạn sẽ tìm thấy rất nhiều SNP (Single Nucleotide Polymorphism) có ý nghĩa thống kê, nhưng chưa biết SNP nào thực sự là “chính chủ” hay chỉ là “ăn theo” (do liên kết di truyền). Việc kết hợp với quét chọn lọc sẽ giải quyết bài toán này.

  • GWAS (Genome-Wide Association Studies): Tìm các locus di truyền (QTL/SNP) liên kết chặt chẽ với kiểu hình quan tâm (ví dụ: năng suất, khả năng chịu hạn, kháng bệnh) dựa trên một quần thể đa dạng.

  • Phân tích quét chọn lọc (Selective Sweep Analysis): Tìm các vùng genomic bị áp lực chọn lọc (tự nhiên hoặc nhân tạo) làm thay đổi tần số alen mạnh mẽ (sử dụng các chỉ số như FSTπ, XP-CLR).

  • Điểm giao thoa: Nếu một vùng gen vừa được GWAS gọi tên (liên quan đến kiểu hình), vừa nằm trong vùng quét chọn lọc (đang được tiến hóa giữ lại), thì 90% đây là vùng chứa gen đích thực sự quan trọng.

2. Phân tích Haplotype (Haplotype Analysis)

Mục tiêu: Đào sâu vào locus ứng viên để tìm alen tối ưu.

Sau khi GWAS và Selective Sweep khoanh vùng được một vài gen ứng viên (candidate genes), bạn không thể chỉ nhìn vào từng SNP đơn lẻ. Bạn cần nhìn vào Haplotype (tổ hợp các alen cùng tồn tại trên một nhiễm sắc thể và di truyền cùng nhau).

  • Phân nhóm quần thể: Dựa vào trình tự của gen ứng viên, bạn chia quần thể nghiên cứu thành các nhóm Haplotype khác nhau (ví dụ: Hap1, Hap2, Hap3).

  • Đánh giá kiểu hình: So sánh xem nhóm mang Hap nào có kiểu hình vượt trội nhất (ví dụ: Hap1 cho hạt to hơn hẳn Hap2 và Hap3).

  • Ứng dụng: Xác định được “Alen ưu việt” (Elite allele) phục vụ cho chọn giống phân tử (Molecular Breeding) sau này.

3. RNA-seq & qRT-PCR

Mục tiêu: Chứng minh gen ứng viên hoạt động như thế nào ở mức độ phân tử.

Có biến đổi di truyền (DNA) và kiểu hình (Phenotype) là chưa đủ, bạn cần một “chiếc cầu nối” để chứng minh gen đó thực sự hoạt động. Đó là lúc sinh học phân tử biểu hiện gen lên tiếng.

  • RNA-seq (Transcriptome Sequencing): * Thường được dùng để so sánh transcriptome giữa các mẫu đối lập (ví dụ: giống chịu hạn vs giống nhiễm hạn, hoặc mẫu trước và sau khi xử lý stress).

    • Sự kết hợp: Kiểm tra xem gen ứng viên tìm thấy từ GWAS/Haplotype có sự thay đổi biểu hiện (Differentially Expressed Genes - DEG) một cách rõ rệt giữa các mẫu này hay không. Nếu có, bằng chứng gen chức năng càng thuyết phục.
  • qRT-PCR (Quantitative Real-Time PCR):

    • RNA-seq là kỹ thuật giải trình tự diện rộng (sàng lọc). Bạn cần qRT-PCR như một bước “vàng” để xác thực lại xu hướng biểu hiện của riêng gen đích đó trên một cỡ mẫu rộng hơn hoặc ở các mô/thời điểm cụ thể khác nhau.

Tóm tắt Lộ trình Kết hợp (Pipeline Nghiên cứu)

Để bạn dễ hình dung, nghiên cứu của bạn sẽ đi theo dòng chảy logic sau:

[Quần thể kiểu hình + Kiểu gen]
         │
         ├──► GWAS ──────────────┐
         │                       ▼
         └──► Quét chọn lọc ──► Giao thoa (Khoanh vùng Gen ứng viên)
                                 │
                                 ▼
                         Phân tích Haplotype (Tìm Alen ưu việt)
                                 │
                                 ▼
                         RNA-seq (Sàng lọc biểu hiện gen toàn hệ thống)
                                 │
                                 ▼
                         qRT-PCR (Xác thực biểu hiện của gen đích)
                                 │
                                 ▼
                   [Xác định chính xác Gen Chức Năng]

Sự kết hợp này đi từ Vĩ mô (GWAS/Sweep trên toàn bộ gen) ➔ Vi mô (Haplotype của một gen) ➔ Cơ chế biểu hiện (RNA-seq/qRT-PCR). Đây là một khung nghiên cứu chuẩn mực, có độ tin cậy rất cao và rất dễ thuyết phục các tạp chí khoa học lớn.

PHẦN MỀM VÀ PACKAGES CẦN DÙNG 

Tổng hợp các phần mềm, package phổ biến nhất hiện nay, được phân loại theo từng bước trong pipeline 

1. Phần mềm cho GWAS & Quét chọn lọc (Selective Sweep)

Ở bước này, dữ liệu đầu vào thường là các file genotype định dạng VCFPLINK (ped/map hoặc bed/bim/fam).

Cho GWAS

  • GAPIT (R package): Cực kỳ phổ biến trong nghiên cứu cây trồng. Hỗ trợ nhiều mô hình từ MLM, CMLM đến các mô hình đa locus tiên tiến như BLINKFarmCPU (giúp kiểm soát tốt cấu trúc quần thể và giảm báo động giả).

  • PLINK (v1.9 / v2.0): Công cụ dòng lệnh (CLI) “quốc dân” để quản lý dữ liệu genotype, QC (Quality Control), tính toán LD (Linkage Disequilibrium), và chạy GWAS theo mô hình tuyến tính đơn giản.

  • TASSEL: Có giao diện đồ họa (GUI) trực quan, rất mạnh về tính toán ma trận di truyền thân thuộc (Kinship) và cấu trúc quần thể (PCA/Q-matrix) trước khi chạy MLM.

Cho Quét chọn lọc (Selective Sweep)

  • vcftools: Tiện lợi nhất để tính nhanh giá trị FST và Nucleotide Diversity (π) theo từng cửa sổ (sliding window) trực tiếp từ file VCF.

  • XP-CLR: Phần mềm chuyên dụng để phát hiện chọn lọc định hướng giữa hai quần thể dựa trên sự mất cân bằng liên kết (LD).

  • selscan: Hỗ trợ tính toán các chỉ số dựa trên haplotype như iHS, XP-EHH.

2. Phần mềm phân tích Haplotype

Mục tiêu là gom nhóm các SNP tại locus quan tâm và vẽ đồ thị liên kết / so sánh kiểu hình.

  • Haploview: Phần mềm kinh điển có giao diện (GUI) để xem cấu trúc các khối haplotype, tính toán D’ và r2, trực quan hóa sơ đồ liên kết LD.

  • Plink / Bcftools: Dùng để trích xuất riêng vùng gen ứng viên từ file VCF lớn trước khi phân tích sâu.

  • R packages (ggpubr, ggplot2): Sau khi chia nhóm mẫu theo các Haplotype (Hap1, Hap2…), bạn dùng R để chạy các kiểm định thống kê (ANOVA, Tukey-HSD) và vẽ biểu đồ hộp (Boxplot) so sánh giá trị kiểu hình giữa các nhóm.

3. Pipeline phân tích RNA-seq (Dòng lệnh Linux/R)

Dữ liệu RNA-seq thường rất lớn (file .fastq hoặc .fastq.gz), bắt buộc phải xử lý trên môi trường Linux (Ubuntu/Server).

[Raw Reads (.fastq)] ──► Trimming (FastQC / Trimmomatic) ──► Alignment (STAR / HISAT2) ──► Quantification (FeatureCounts) ──► DEGs (DESeq2 in R)

Tiền xử lý & Căn chỉnh (Alignment)

  • FastQC & Trimmomatic / Cutadapt: Kiểm tra chất lượng raw reads và cắt lọc các trình tự adapter, trình tự chất lượng kém.

  • HISAT2 / STAR: Phần mềm căn chỉnh (aligner) các đoạn đọc RNA-seq lên bộ gen tham chiếu (Reference Genome). STAR căn chỉnh rất nhanh và chính xác nhưng ngốn nhiều RAM.

  • StringTie / featureCounts: Đếm số lượng đoạn đọc (read counts) tương ứng với từng locus gen dựa trên file annotation (.gtf hoặc .gff).

Phân tích biểu hiện gen sai biệt (Differential Expression)

  • DESeq2 / edgeR (R packages): Hai công cụ chuẩn mực nhất hiện nay để chuẩn hóa dữ liệu read counts và tìm các gen biểu hiện sai biệt (DEGs) giữa các điều kiện thí nghiệm.

4. Công cụ cho qRT-PCR

Đối với qRT-PCR, phần lớn công việc tính toán diễn ra ở giai đoạn xử lý số liệu thô.

  • Phần mềm đi kèm máy Real-time PCR: (Ví dụ: Bio-Rad CFX ManagerApplied Biosystems QuantStudio…) dùng để xuất giá trị Cq/Ct.

  • Thiết kế mồi (Primer Design): Primer3Plus hoặc NCBI Primer-BLASTLưu ý: Khi thiết kế mồi từ dữ liệu RNA-seq/GWAS, nên thiết kế mồi bắc qua ranh giới giữa các exon (exon-exon junction) để tránh khuếch đại nhầm DNA tạp nhiễm.

  • Xử lý số liệu: Thường dùng Excel hoặc R để tính toán theo phương pháp định lượng tương đối 2ΔΔCT.

💡 Lời khuyên về mặt kỹ thuật (Bioinformatics Setup)

Nếu bạn là người chủ trì hoặc trực tiếp xử lý chuỗi phân tích này, cấu hình làm việc lý tưởng sẽ là:

  1. Một máy trạm Linux (hoặc Server): Để chạy các tác vụ nặng như Alignment RNA-seq (STAR/HISAT2), xử lý file VCF lớn (vcftools/PLINK).

  2. Môi trường RStudio: Nơi bạn gom tất cả kết quả lại. Bạn có thể import kết quả P-value từ GWAS, điểm số FST, danh sách gen DEG từ DESeq2 vào R để vẽ các biểu đồ tích hợp phức tạp (như biểu đồ Manhattan kết hợp vùng quét chọn lọc, hoặc Heatmap biểu hiện gen).