Đề tài “Giải trình tự de novo virus SARS-CoV-2 gây bệnh viêm đường hô hấp cấp COVID-19 bằng hệ máy giải trình tự thế hệ mới PacBio Sequel” được Viện Hàn lâm Khoa học và công nghệ Việt Nam giao Viện Công nghệ sinh học thực hiện, nhằm đáp ứng nhu cầu hỗ trợ xử lý dịch bệnh Covid-19 tại Việt Nam.

GS.TS Trương Nam Hải - Chủ nhiệm đề tài - cho biết: Để thực hiện nhiệm vụ này, Viện Công nghệ sinh học đã phối hợp với Viện Pasteur TP. Hồ Chí Minh và Viện Vệ sinh dịch tễ trung ương Hà Nội (NIHE) xây dựng quy trình kỹ thuật giải trình tự toàn bộ hệ gen virus SARS-CoV-2 bằng công nghệ giải trình tự đoạn dài của PacBio.

Cây phân loại cho thấy sự tiến hóa của SARS-CoV-2 cũng như thời điểm các chủng lần lượt xâm nhập vào Việt Nam

Nhiệm vụ đã hoàn thành sau một năm thực hiện với việc xây dựng thành công quy trình giải trình tự hệ gen virus ARN gồm 6 bước như sau: Nuôi cấy và tách chiết ARN virus; Tổng hợp cDNA sợi đôi từ ARN virus. Hai bước này được thực hiện tại Viện Pasteur TP. Hồ Chí Minh và NIHE trong điều kiện phòng sạch an toàn sinh học cấp 3; chuẩn bị thư viện DNA để giải trình tự gen; giải trình tự toàn bộ hệ gen virus SARS-CoV-2; lắp ráp de novo hệ gen virus; chú giải và phân tích hệ gen virus.

Tại Việt Nam, để giải trình tự hệ gen virus SARS-CoV-2, các đơn vị trong nước sử dụng công nghệ giải trình tự đoạn ngắn. Sau đó lắp ráp và tham chiếu với hệ gen trước đó. Công nghệ này mất nhiều thời gian để đọc được trọn vẹn hệ gen (3-4 ngày) và vẫn có sai sót trong khi đọc. Tuy nhiên, đề tài đã giải trình tự toàn bộ hệ gen của bốn chủng virus SARS-CoV-2, với chiều dài trên 29500 nucleotide/hệ gen. Kết quả lắp ráp hệ gen cho thấy không có lỗi đọc hay đoạn trống, kết quả giải trình tự đạt độ chính xác 99,99%. Hiện nay đây là thiết bị duy nhất ở Việt Nam, nó không phải đọc đoạn ngắn, mà đọc đoạn dài. Đọc đoạn ngắn thì chỉ đọc 100-200 nucleotide/đoạn, sau đó lắp ráp thành hệ gen đầy đủ. Nhưng giải đoạn dài thì có thể đọc hàng nghìn, hàng chục nghìn nucleotide/đoạn và việc đọc đoạn dài thì khi lắp ráp để ra một hệ gen sẽ đơn giản và chính xác hơn.  Độ chính xác tương đương 99,99% tức là lỗi đọc hầu như không có, lắp ráp rất nhanh. Thời gian để giải trình tự, lắp ráp, phân tích thì mất khoảng 2 ngày là có thể xong hệ gen của một virus.

Với việc xây dựng và làm chủ kỹ thuật giải trình tự hệ gen đoạn dài của PacBio đối với virus SARS-CoV-2, theo đánh giá của các nhà khoa học đã mở ra khả năng giải trình tự hệ gen virus nhanh, chính xác mà không cần dựa vào trình tự gen tham chiếu quốc tế. Điều này cho phép các nhà khoa học Việt Nam có thể giải trình tự những đối tượng virus gây bệnh mới trong tương lai mà không cần hệ gen tham chiếu.

Dữ liệu giải trình tự hệ gen góp phần vào việc xác định nguồn gốc virus và số lượng nguồn lây (F0) trong các ổ dịch, là cơ sở khoa học, thông tin quan trọng trong xây dựng chiến lược, phương án phòng, chống hiệu quả sự lây lan của virus trong cộng đồng.

Việc nghiên cứu thành công quy trình công nghệ giải mã gen virus SARS-CoV-2 thì đã góp phần cùng với phác đồ điều trị để mà chúng ta có thể dập được dịch. Cụ thể, việc giải mã trình tự gen cùng với truy vết cho phép chúng ta xác định nguồn gốc lây lan của virus – các F0, từ đó có cơ sở khoa học để chúng ta khoanh vi, cách ly số người liên quan và chúng ta cũng có cơ sở khoa học để triển khai các phác đồ điều trị tối ưu. Với việc làm chủ quy trình công nghệ, năng lực và điều kiện hiện có, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cũng cho biết, sẵn sàng tham gia hợp tác với các đơn vị ngành y tế trong việc giải trình tự hệ gen của virus SARS-CoV-2 với quy mô lớn trong các trường hợp cấp bách, nhằm phục vụ hiệu quả công tác phòng chống dịch Covid-19 tại Việt Nam. Với việc làm chủ công nghệ này cho phép các nhà khoa học Việt Nam có thể giải trình tự hệ gen những đối tượng virus gây bệnh mới trong tương lai một cách nhanh chóng và chính xác mà không cần hệ gen tham chiếu.

Nguồn: NASATI