Những câu hỏi thường gặp
1. Cổng thông tin VinGen Data Portal là gì?
Cổng thông tin VinGen cung cấp cho người dùng quyền truy cập dựa trên web và dòng lệnh vào dữ liệu của các nghiên cứu hệ gen khác nhau về dân số Việt Nam được thực hiện tại VinBigData. Vui lòng truy cập Giới thiệu về VinGen để biết thêm thông tin chi tiết.
2. Mục tiêu chính của VinGen Data Portal là gì?
Mục tiêu chính của VinGen Data Portal là phát triển một hệ thống quản lý, phân tích, chia sẻ và hài hòa các bộ dữ liệu lớn để phục vụ các dự án tin sinh học có chứa lượng lớn dữ liệu đa dạng và phức tạp được triển khai tại VinBigData.
3. Tôi có thể cộng tác với VinGen Data Portal bằng cách nào?
VinGen Data Portal hoan nghênh hợp tác với các tổ chức nghiên cứu hoặc cung cấp dịch vụ tin học hỗ trợ các nghiên cứu về gene0. Các tổ chức quan tâm đến việc cộng tác với VinGen Data Portal vui lòng liên hệ vingen@vinbigdata.org.
4. Có hạn chế nào đối với việc sử dụng dữ liệu VinGen Data Portal trong các xuất bản phẩm không?
Tất cả dữ liệu VinGen Data Portal đều có thể được sử dụng trong các xuất bản phẩm hoặc bài thuyết trình. Nếu có thêm thắc mắc về việc sử dụng dữ liệu VinGen Data Portal, hoặc để tìm hiểu về cơ hội cộng tác, vui lòng liên hệ vingen@vinbigdata.org.
5. Tôi trích dẫn VinGen Data Portal như thế nào?
Vui lòng trích dẫn hệ thống của chúng tôi trong bài báo mà bạn sử dụng dữ liệu của VinGen Data Portal, và đưa liên kết nếu bạn xây dựng nguồn trực tuyến có sử dung bộ dữ liệu. Không cần thiết phải trích dẫn chúng tôi làm tác giả trong bài báo của bạn trừ khi chúng tôi đóng góp tư vấn hoặc phân tích cụ thể cho nghiên cứu của bạn.
6. Tôi có thể truy vấn và tải dữ liệu từ VinGen Data Portal bằng thế nào?
Người dùng có thể truy vấn dữ liệu từ công thông tin VinGen Data Portal bằng cách nhấp chuột vào Công cụ hỗ trợ và chọn Truy vấn. Hiện tại, VinGen Data Portal chưa hỗ trợ tự động tải dữ liệu xuống. Nếu người dùng muốn lấy dữ liệu cụ thể nào, xin vui lòng liên hệ vingen@vinbigdata.org.
7. Tôi có thể tải dữ liệu lên VinGen Data Portal bằng cách nào?
Người dùng có thể tải dữ liệu lên VinGen Data Portal bằng cách nhấp chuột vào Công cụ hỗ trợ ở góc trên bên phải của trang và chọn Tải dữ liệu lên.
8. VinGen Data Portal hỗ trợ loại và định dạng dữ liệu nào?
Vui lòng tìm hiểu thêm Loại và Định dạng dữ liệu trong tài liệu hướng dẫn sử dụng để biết thêm danh sách các loại dữ liệu chuẩn mà VinGen Data Portal hỗ trợ.
9. VinGen Data Portal sử dụng hệ gene tham chiếu nào để phân tích?
VinGen Data Portal đang sử dụng hg38 với contig luân phiên đa quần thể.
10. Làm thế nào để có tài khoản đăng nhập vào VinGen Data Portal?
VinGen Data Portal hiện cung cấp đăng nhập thông qua tài khoản Google.
11. Tôi có thể liên hệ để báo cáo sự cố hay gửi yêu cầu đến VinGen Data Portal bằng cách nào?
Người dùng có thể báo cáo sự cố hoặc gửi yêu cầu liên quan đến VinGen Data Portal bằng cách liên hệ qua email vingen@vinbigdata.org.
12. Làm thế nào để tôi có thể tạo truy vấn tìm kiếm nâng cao?
Người dùng có thể thực hiện truy vấn tìm kiếm nâng cao bằng cách sử dụng giao diện tìm kiếm của VinGen Data Portal. Hướng dẫn chi tiết về giao diện tìm kiếm của VinGen Data Portal có trong hướng dẫn sử dụng cổng thông tin.
13. VinGen Data Portal tiến hành bảo trì khi nào?
Thời hạn bảo trì của hệ thống diễn ra hàng tháng vào thứ bảy cuối cùng của tháng từ 10:00 giờ sáng đến 4:00 giờ chiều.
14. Công cụ hoặc giao thức được đề xuất để truyền lượng lớn dữ liệu lên hoặc tải xuống từ VinGen Data Portal là gì?
Chúng tôi đang phát triển tính năng này.
15. Khi sử dụng Công cụ truyền dữ liệu của VinGen Data Portal, có thể đặt giới hạn băng thông không?
Chúng tôi đang phát triển tính năng này.
16. Công cụ truyền dữ liệu của VinGen Data Portal sử dụng đọc/ viết ngẫu nhiên hay theo trình tự? Liệu việc lựa chọn giao thức có tạo ra sự khác biệt?
Chúng tôi đang phát triển tính năng này.
17. Hoạt động xác thực được thực hiện lên dữ liệu hệ gene (tệp BAM) tải lên VinGen Data Portal như thế nào?
Các bước Kiểm tra chất lượng khác nhau được áp dụng suốt pipeline phân tích trên VinGen Data Portal. Để đánh giá chất lượng mapping, chúng tôi thu thập dữ liệu khác nhau từ file BAM sử dụng công cụ chuẩn như Picard và qualimap để xử lý thêm.
18. Tôi có thể tìm thông tin về mô hình dữ liệu VinGen Data Portal ở đâu?
Người dùng có thể tìm thấy thông tin chi tiết về mô hình dữ liệu VinGen Data Portal trong tài liệu hướng dẫn sử dụng.
19. Làm thế nào để tìm một biến dị cụ thể?
Để tìm kiếm một biến dị, bạn có thể sử dụng thanh Tìm kiếm nhanh ở phần trên cùng bên phải của Cổng thông tin VinGen Data Portal bằng cách nhập ID cụm tham chiếu dbSNP (rs #) hoặc tọa độ của sự thay đổi nhiễm sắc thể. Ví dụ: nhập 'rs121912651' hoặc 'chr17: g.7674221G> A' sẽ đưa người dùng đến trang chứa biến dị cho biến dị tìm kiếm.
20. VinGen Data Portal hỗ trợ trình duyệt web nào?
Các trình duyệt web sau được hỗ trợ sử dụng cho cổng thông tin VinGen Data Portal, cổng thông tin gửi tài liệu, lưu trữ tài liệu, trang web và trang tài liệu.
- Phiên bản ổn định được hỗ trợ mới nhất của Microsoft Edge
- Phiên bản ổn định được hỗ trợ mới nhất của Google Chrome
- Phiên bản ổn định được hỗ trợ mới nhất của Mozilla Firefox
21. Làm thế nào để tôi có thể truy cập vào dữ liệu hạn chế?
Người dùng có thể liên hệ với chúng tôi qua email vingen@vinbigdata.org để yêu cầu truy cập dữ liệu hạn chế.
22. Làm thế nào để tôi tránh bị hết thời gian chờ và gián đoạn truyền tải khi tải dữ liệu lớn từ cổng dữ liệu VinGen Data Portal?
Cổng dữ liệu VinGen Data Portal là một ứng dụng dựa trên trang web bị ảnh hưởng bởi những giới hạn của trình duyệt web và mạng. Nếu hết thời gian chờ hệ thống (system timeout) diễn ra khi đang tải tài liệu xuống hoặc lên, vui lòng sử dụng Gen3 Client tool hoặc liên hệ Genomics Help Desk để được hỗ trợ
23. Làm thế nào để tôi có thể truy cập vào dữ liệu giải trình tự VinGen Data Portal ở định dạng FASTQ?
Người dùng có thể liên hệ với chúng tôi qua email vingen@vinbigdata.org để yêu cầu dữ liệu giải trình tự.
24. Tất cả những genotype call trong Dự án VN1000G hiện tại được đưa ra dưới dạng VCF là hai allen?
Đúng vậy, tất cả các biến dị trong Dự án VN1000G được bình thường hóa và tách thành hai allen.
25. Tất cả các biến dị hiển thị trong Dự án VN1000G là do dự án tìm ra?
Không, không phải tất cả các biến dị trong trình duyệt do Dự án VN1000G phát hiện ra. Dữ liệu trong dự án dữa trên các phiên bản tùy chỉnh của trình duyệt Ensembl. Những cơ sở dữ liệu này có chứa các đặc điểm chính của Ensembl (gene và bản sao), các yếu tố quy định trong xây dựng quy định Ensembl và dữ liệu biến dị trong cơ sở dữ liệu Ensembl. Biến dị Ensembl chứa dữ liệu từ dbSNP, ClinVar, COSMIC, dbGaP, dbVAR, EGA và nhiều nguồn khác.
26. Có tệp dữ liệu FASTA nào chứa biến dị của VN1000G hoặc loại haloptype không?
Chúng tôi không cung cấp tệp FASTA giải thích cho các biến dị của VN1000G. Bạn có thể tạo 1 tệp như vậy sử dụng tập lệnh VCFtools Perl script còn được gọi là vcf-consensus.
Ví dụ dòng lệnh như sau:
Bạn có thể tìm thêm thông tin hỗ trợ bộ công cụ VCFtools bằng cách liên hệ qua email.
27. Có lệnh hoặc APIs nào sử dụng cho bộ dữ liệu VN1000G? Are there any scripts or APIs for use with the VN1000G datasets?
Dữ liệu của chúng tôi ở định dạng chuẩn như SAM và VCF có những công cụ đi kèm với chúng. Để điều khiển tệp SAM/BAM, Dữ liệu của chúng tôi ở các định dạng tiêu chuẩn như SAM và VCF, có các công cụ liên kết với chúng. Để thao tác với các tệp SAM / BAM, hãy xem thêm SAMtools để biết bộ công cụ dựa trên ngôn ngữ C và các liên kết đến các API bằng các ngôn ngữ khác. Để tương tác với các tệp VCF, hãy xem thêm VCFtools, đây là một bộ mã Perl và C ++. 30.
28. Có thống kê nào về việc Dự án VN1000G đã tạo ra bao nhiêu dữ liệu chuỗi không?
Chúng tôi đang phát triển tính năng này .
29. Tôi có thể lấy tệp hình ảnh cho bất kỳ lần chạy trình tự VN1000G nào không?
Thật tiếc là bạn không thể.
30. Tôi có thể lấy thông tin về kiểu hình, giới tính và mối quan hệ gia đình cho các mẫu VN1000G không?
Tất cả các mẫu từ VN1000G đều không liên quan, thông tin về kiểu hình và giới tính được công bố rộng rãi.
31. Tôi có thể lập bản đồ tọa độ biến dị giữa các tổ hợp bộ gen khác nhau không?
Hiện tại, cơ sở dữ liệu VN1000G chỉ hỗ trợ GRCh38 (hg38).
32. Tôi có thể sử dụng dữ liệu VN1000G để nhập không?
Chúng tôi đang phát triển tính năng này.
33. Tôi có cần xin phép sử dụng dữ liệu của VN1000G trong nghiên cứu khoa học của riêng mình không?
Có, bạn có thể liên hệ với vingen@vinbigdata.org để yêu cầu sử dụng dữ liệu của VN1000G.
34. Việc dóng hàng của trình tự được thực hiện như thế nào?
Các tệp FASTQ đầu vào thô được làm sạch thông qua quy trình tiêu chuẩn để loại bỏ các nội dung đọc xấu. Sau đó, chúng tôi thực hiện dóng hàng các tệp fastq đã được làm sạch thành hg38 bằng cách sử dụng bwa-mem tiêu chuẩn với thông tin ReadGroup để theo dõi thêm. Các tệp BAM thô sau đó được đánh dấu là trùng lặp và hiệu chỉnh lại Điểm chất lượng cơ sở theo các đường dẫn thực tiễn tốt nhất của GATK cho tệp BAM sẵn sàng phân tích.
35. Làm thế nào tôi có thể nhận được tần số alen của biến dị của tôi?
Tần số alen của một biến dị có sẵn thông qua tìm kiếm trên cổng thông tin.
36. Có bao nhiêu cá thể đã được giải trình tự?
1050 mẫu được cho là sẽ được giải trình tự khi kết thúc dự án.
37. Có bao nhiêu dữ liệu trình tự đã được tạo ra cho các cá thể đơn lẻ?
Mỗi cá nhân được giải trình tự một lần với độ sâu mục tiêu là 30x.
38. Có chú thích chức năng nào cho dữ liệu của VN1000G không?
Có, các biến dị trong dự án VN1000G được VEP chú thích về mặt chức năng. Chú thích với các công cụ khác sẽ sớm được cung cấp.
39. Có dữ liệu biểu hiện gen nào cho các mẫu VN1000G không?
Không, chúng tôi không có loại dữ liệu đó cho các mẫu VN1000G
40. Nền tảng giải trình tự nào đã được sử dụng cho dự án VN1000G?
Chúng tôi đã sử dụng nền tảng NovaSeq 6000 của Illumina.
41. Định dạng tệp trình tự của dự án là gì?
Các tệp trình tự có sẵn ở định dạng FASTQ
42. Gene panel là gì?
Gene panel là một tập hợp các gene. Thông thường, mỗi gen panel được nhắm mục tiêu đến một bệnh hoặc một lộ trình cụ thể. Chúng tôi cung cấp truy vấn gene panel giúp các nhà nghiên cứu thu hẹp số lượng các biến dị.
43. Kích thước chèn thư viện nào được sử dụng trong dự án VN1000G?
Kích thước chèn thư viện 400 bp được sử dụng trong dự án VN1000G.
44. Tỷ lệ phần trăm của bộ gen có thể khảo nghiệm được?
Tỷ lệ bao phủ của hệ gen tham chiếu là hơn 98%.
45. Dự án đã sử dụng độ dài bao phủ nào?
Độ dài bao phủ trung bình của dự án là 150bp
46. Các biến dị trong tệp VCF của bạn dựa trên sợi nào?
Các biến dị trong tệp VCF của chúng tôi nằm trên cả hai sợi.
47. Dữ liệu biến dị cấu trúc nào có sẵn cho dự án?
Dự án đang thực hiện gọi biến dị cấu trúc.
48. Nguồn DNA để giải trình tự là gì?
Nguồn DNA được lấy từ máu toàn phần đông lạnh.
49. Các tệp dóng hàng trình tự của bạn nằm ở đâu?
Các tệp dóng hàng trình tự nằm trong phần Tài liệu.
50. Các tệp biến dị của bạn nằm ở đâu?
Các tệp biến dị nằm trong phần Tài liệu.
51. Tôi có thể lấy chú thích kết quả cho các biến dị ở đâu?
Các chú thích kết quả của VEP có sẵn trong trang truy cập thông tin về các biến dị.