Tổng quan
Cổng dữ liệu VinGen Data Portal cung cấp truy cập dựa trên trang web và dòng lệnh tới các nghiên cứu về hệ gen người Việt được thực hiện tại VinBigData . Các tính năng chính của cổng dữ liệu VinGen Data Portal bao gồm:
- Truy cập mở và chi tiết thông tin các bộ dữ liệu có sẵn trên VinGen Data Portal.
- Tìm kiếm nâng cao và bộ lọc các thông tin và tệp dữ liệu về hệ gen người được hỗ trợ trực quan hóa.
- Các công cụ trực quan hóa dữ liệu giúp phân tích và tìm hiểu dữ liệu.
Tìm hiểu về hệ gen người là một nhiệm vụ cần nhiều nỗ lực của các nhà khoa học sự sống. Một khi những kiến thức toàn diện về hệ gene người được tìm ra, chúng ta có thể tiến hành những phân tích chuyên sâu giúp biến những điều trước kia không thể thành có thể, như tìm ra phương pháp chữa bệnh ung thư, hay vắc xin trị COVID-19. Nhờ Khoa học dữ liệu, đặc biệt là những thành tựu trong lĩnh vực tin sinh, chúng tôi tin tưởng rằng chúng ta sẽ vượt qua những thách thức đương đại.
Viện Nghiên cứu Dữ liệu lớn - VinBigData - một viện nghiên cứu thuộc tập đoàn VinGroup, đã triển khai dự án 1000 Gen người Việt là cơ sở dữ liệu các biến dị gene của người Việt lớn nhất từ trước đến giờ. Mục tiêu của chúng tôi là đạt được hiểu biết toàn diện về hệ gene của người Việt để từ đó rút ra các đặc điểm đặc trưng của gene người Việt, và tìm hiểu sự khác biệt của hệ gene người Việt với hệ gene của những dân tộc khác. Bằng cách tìm hiểu trang VinGen Data Portal, người sử dụng có thể tìm hiểu và truy cập dữ liệu theo các danh mục như dưới đây:
- Biến dị Nucleotide đơn (SNV): là khi một nucleotide đơn (ví dụ, A, T, C hoặc G) bị thay đổi trong trình tự DNA. Cho đến nay, SNV là kiểu thay đổi trình tự phổ biến nhất, và có nhiều nguồn nội sinh và ngoại sinh dẫn đến đột biến thay thế cặp nucleotide cơ bản đơn tạo ra SNV. (sciencedirect.com).
- Thêm bớt ngắn (Indel): là khi một trình tự nucleotide ngắn (ví dụ ATC, TCGA, hoặc GGA) bị thêm vào/ bớt đi trên giải trình tự ADN. Indels là loại thay đổi trình tự phổ biến thứ hai tính đến nay. (sciencedirect.com)
- Biến dị số lượng bản sao (CNV): là khi số lượng bản sao của một gene cụ thể thay đổi từ cá thể này sang cá thể tiếp theo. Sau khi hoàn thành Dự án hệ gene người, chúng ta có thể thấy một cách rõ ràng là hệ gene có trải qua sự gia tăng và mất đi vật chất di truyền (genome.gov).