Luận văn Nghiên cứu đánh giá sự đa dạng di truyền các giống/dòng chè (Camellia sinensis (L.) O. Kuntze) ở Việt Nam bằng chỉ thị hình thái và chỉ thị phân tử microsatellite (SSR)
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Nghiên cứu đánh giá sự đa dạng di truyền các giống/dòng chè (Camellia sinensis (L.) O. Kuntze) ở Việt Nam bằng chỉ thị hình thái và chỉ thị phân tử microsatellite (SSR)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- nghien_cuu_danh_gia_su_da_dang_di_truyen_cac_giongdong_che_c.pdf
Nội dung text: Luận văn Nghiên cứu đánh giá sự đa dạng di truyền các giống/dòng chè (Camellia sinensis (L.) O. Kuntze) ở Việt Nam bằng chỉ thị hình thái và chỉ thị phân tử microsatellite (SSR)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Trần Đức Trung Nghiên cứu đánh giá sự đa dạng di truyền các giống/dòng chè (Camellia sinensis (L.) O. Kuntze) ở Việt Nam bằng chỉ thị hình thái và chỉ thị phân tử microsatellite (SSR) Chuyên ngành: Công nghệ sinh học Luận văn Thạc sỹ Công nghệ sinh học Người hướng dẫn khoa học: TS. Lã Tuấn Nghĩa Hà Nội- 2009
- Dành tặng những người tôi thương yêu nhất; bố mẹ vợ gia đình và bé Trần Đức Hoàng Minh .
- viii Lời cảm ơn Trước hết, tôi xin gửi lời cảm ơn chân thành và sâu sắc tới TS. Lã Tuấn Nghĩa, người đã tận tình hướng dẫn, giúp đỡ và hỗ trợ tôi trong suốt quá trình công tác cũng như trong thời gian học tập, nghiên cứu và hoàn thành luận văn này. Tôi xin bày tỏ lòng biết ơn tới các thầy cô và cán bộ công tác tại Viện Công nghệ Sinh học thực phẩm, Viện đào tạo sau đại học‐ Trường Đại học Bách khoa Hà Nội đã dạy dỗ và tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình học tập tại trường. Nhân dịp này, tôi cũng xin gửi lời cảm ơn chân thành tới các cán bộ công tác tại Viện Khoa học kỹ thuật Nông‐Lâm nghiệp miền núi phía Bắc (NOMAFSI) đã nhiệt tình giúp đỡ tôi trong thời gian thu thập số liệu và vật liệu nghiên cứu tại Viện. Tôi xin chân thành cảm ơn các cán bộ, anh chị em trong Nhóm nghiên cứu Đa dạng di truyền và Công nghệ sinh học Nông nghiệp, Viện Di truyền Nông nghiệp, đã giúp đỡ và động viên tôi trong quá trình công tác và nghiên cứu khoa học vừa qua. Cuối cùng, tôi xin chân thành cảm ơn gia đình và bạn bè đã nhiệt tình động viên, giúp đỡ tôi trong quá trình học tập, nghiên cứu khoa học cũng như trong cuộc sống. Luận văn này được thực hiện với nguồn kinh phí từ Chương trình Công nghệ sinh học Nông nghiệp. Xin chân thành cảm ơn! Hà Nội, tháng 10 năm 2009 Trần Đức Trung
- i Lời cam đoan Tôi xin cam đoan đã trực tiếp thực hiện các nghiên cứu trong luận văn này. Mọi kết quả thu được nguyên bản, không chỉnh sửa hoặc sao chép từ các nghiên cứu khác; các số liệu, sơ đồ kết quả của luận văn này chưa từng được công bố. Mọi dữ liệu, hình ảnh, biểu đồ và trích dẫn tham khảo trong luận văn đều được thu thập và sử dụng từ nguồn dữ liệu mở hoặc với sự đồng ý của tác giả. Các phần mềm phân tích TotalLab v2009, QuantityOne, NYSYS pc 2.11X, TreeCon, POPGENE32, Dendroscopes, PHYLIP v3.69 đều có bản quyền hoặc sử dụng với sự đồng ý của (nhóm) tác giả xây dựng phần mềm. Tôi xin hoàn toàn chịu trách nhiệm với những lời cam đoan trên! Trần Đức Trung
- ii Mục lục Trang Lời cam đoan i Mục lục ii Danh mục chữ viết tắt iv Danh mục bảng v Danh mục hình ảnh minh họa vi Mở đầu 1 Chương 1: Tổng quan 4 1.1. Khái quát chung về cây chè Camellia sinensis (L.) O. Kuntze 4 1.1.1. Lược sử ngành sản xuất- chế biến chè trên thế giới và Việt Nam 4 1.1.2. Nguồn gốc và phân bố của cây chè 5 1.1.3. Phân loại thực vật và đặc điểm hình thái của cây chè 8 1.1.4. Đặc điểm di truyền của cây chè Camellia sinensis (L.) O. Kuntze 14 1.1.5. Ngành sản xuất, chế biến chè trên thế giới và Việt Nam 17 1.1.6. Công tác lai tạo giống chè 19 1.1.6.1. Phương pháp truyền thống 19 1.1.6.2. Áp dụng công nghệ sinh học trong chọn tạo giống chè 21 1.2. Chỉ thị trong đánh giá đa dạng di truyền 22 1.2.1. Chỉ thị hình thái 23 1.2.2. Chỉ thị hóa sinh 24 1.2.3. Chỉ thị DNA 25 1.2.3.1. Chỉ thị dựa trên cơ sở lai DNA- chỉ thị RFLP (Restriction Fragment Length Polymorphism) 29 1.2.3.2. Chỉ thị DNA ngẫu nhiên 30 1.2.3.3. Chỉ thị DNA dựa trên đa hình các vị trí nhận biết giới hạn 31 1.2.3.4. Chỉ thị DNA dựa trên các trình tự lặp 33 1.2.3.5. Chỉ thị DNA dựa trên trình tự DNA 41 1.2.3.6. Một số loại chỉ thị DNA khác 42 1.3. Thành tựu trong nghiên cứu đa dạng di truyền chè (Camellia sinensis (L.) O. Kuntze) 43
- iii 1.3.1. Nghiên cứu đa dạng di truyền chè bằng chỉ thị hình thái 43 1.3.2. Nghiên cứu đa dạng di truyền chè bằng chỉ thị hóa sinh 44 1.3.3. Nghiên cứu đa dạng di truyền chè bằng chỉ thị DNA 45 Chương 2: Vật liệu và phương pháp nghiên cứu 50 2.1. Vật liệu nghiên cứu 50 2.2. Phương pháp nghiên cứu 55 2.1.1. Đánh giá đặc điểm hình thái chè 55 2.1.2. Thu thập mẫu lá chè 55 2.1.3. Trích ly DNA tổng số từ mẫu lá chè 57 2.1.4. Nhận dạng di truyền các giống chè bằng chỉ thị SSR 58 2.1.5. Phân tích kết quả 60 2.1.5.1. Phân tích số liệu kiểu hình 60 2.1.5.2. Phân tích số liệu kiểu gen 61 2.1.5.3. Phân loại thứ chè theo tỷ lệ nguồn gen 63 Chương 3: Kết quả và bàn luận 64 3.1. Phân tích đa dạng di truyền chè dựa trên đặc điểm hình thái 64 3.1.1. Đánh giá đặc điểm hình thái 64 3.1.2. Phân tích đa dạng di truyền dựa trên đặc điểm hình thái của các giống/dòng chè 67 3.2. Phân tích đa dạng di truyền chè bằng chỉ thị SSR 73 3.2.1. Trích ly DNA tổng số 73 3.2.2. Nhận dạng di truyền chè bằng chỉ thị SSR 75 3.2.3. Phân tích tính đa dạng di truyền của các locus SSR 81 3.2.4. Phân tích đa dạng di truyền giữa 9 quần thể chè bằng chỉ thị SSR 84 3.2.5. Phân tích đa dạng di truyền 96 giống/dòng chè bằng chỉ thị SSR 91 3.2.5.1. Phân nhóm di truyền dựa trên mức độ tương đồng Jaccard 92 3.2.5.2. Phân nhóm di truyền dựa trên khoảng cách di truyền Nei72 98 3.3. Kết hợp chỉ thị hình thái và chỉ thị SSR trong phân tích đa dạng di truyền các giống/dòng chè 106 Kết luận và kiến nghị 109 Tài liệu tham khảo 111 Phụ lục 122
- iv Bảng chữ viết tắt AFLP Amplification Fragment Length Polymorphism APS Amonium persulfate CAPs Cleaved Amplification Polymorphism Sequence cs Cộng sự CTAB Cetyl trimethylammonium bromide DNA Deoxyribonucleic acid dNTPs Deoxy nucleotide triphosphates EDTA Ethylenediaminetetraacetic acid EST Expressed sequence tag EthBr Ethidium bromide IPGRI International Plant Genetic Resource Institute ISSR Inter-simple sequence repeat MAS Molecular Assisted Selection PCA Principles Component Analysis PCR Polymerase Chain Reaction PIC Polymorphism Information Content RAPD Random Aplification Polymorhism DNA RFLP Restriction Fragment length Polymorphism SSR Simple sequence repeat STS Sequence- tagged site TAE Tris-Acetic acid- EDTA TEMED N,N,N’,N’- Tetraethyl methylendiamine
- v Danh mục bảng Trang Bảng 1.1: So sánh đánh giá đặc điểm của một số loại chỉ thị được ứng dụng trong nghiên cứu đa dạng di truyền thực vật 28 Bảng 1.2: So sánh ưu/nhược điểm của các phương pháp phân lập và phát triển chỉ thị SSR 40 Bảng 2.1: Danh sách 96 giống/dòng chè thu thập từ NOMAFSI 50 Bảng 2.2: 9 quần thể chè nghiên cứu 52 Bảng 2.3: Danh sách các cặp mồi SSR sử dụng trong nghiên cứu 53 Bảng 2.4: 12 đặc điểm hình thái được sử dụng để đánh giá các giống/dòng chè 56 Bảng 2.5: Thành phần phản ứng SSR-PCR 59 Bảng 2.6: Thành phần gel polyacrylamide 12% 60 Bảng 3.1: Giá trị đặc trưng của 90 thành phần trong phân tích PCA (khoảng cách di truyền Euclidean của 90 giống/dòng chè) 71 Bảng 3.2: Tần số alen của 21 locus SSR 82 Bảng 3.3: Thống kê các chỉ số đa dạng di truyền của 21 locus SSR 83 Bảng 3.4: Kết quả đánh giá đa dạng di truyền giữa 9 quần thể chè 85 Bảng 3.5: Khoảng cách di truyền giữa 9 quần thể chè nghiên cứu 87 Bảng 3.6: Giá trị đặc trưng của 96 thành phần trong phân tích PCA (khoảng cách di truyền Nei72 của 96 giống/dòng chè) 102
- vi Danh mục hình ảnh minh họa Trang Hình 1.1: Các nước trồng chè dựa vào sản lượng được thống kê năm 2007 7 Hình 1.2: Phân bố tự nhiên các thứ chè theo Stuart (A) và Barua (B) 10 Hình 1.3: Cây chè Trung Quốc (C.sinensis var. sinnensis) 12 Hình 1.4: Cây chè Assam (C. sinensis var. assamica) 13 Hình 1.5: Cây chè Cambod (C. sinensis var. assamica sub sp. lasiocalyx) 13 Hình 1.6: Tiêu bản nhiễm sắc thể ở kỳ giữa của cây chè (C. sinensis var. sinensis) 15 Hình 1.7: Kích thước biến thiên của lá chè 16 Hình 1.8: Biểu đồ sản lượng chè khô của một số nước năm 2005, 2006 và 2007 18 Hình 1.9: Biểu đồ khối lượng sản xuất và xuất khẩu chè khô của một số nước năm 2007 18 Hình 1.10: Nguyên lý phản ứng PCR 26 Hình 1.11: Nguyên lý kỹ thuật kỹ thuật AFLP 32 Hình 1.12: Phân loại trình tự lặp SSR 35 Hình 1.13: Đa hình DNA SSR giữa hai cá thể có motif (AT)n 37 Hình 1.14: Quy trình phát triển chỉ thị SSR từ thư viện hệ gen 39 Hình 2.1: Phân loại chè Cambod dựa trên tỷ lệ nguồn gen 63 Hình 3.1: Màu sắc lá chè non 65 Hình 3.2: Búp chè non 65 Hình 3.3: Thế lá chè 66 Hình 3.4: Cây chè dạng thân gỗ 66 Hình 3.5: Cây chè dạng thân bụi 67 Hình 3.6: Sơ đồ cây phân nhóm 90 giống/dòng chè dựa trên đặc điểm hình thái bằng phương pháp UPGMA 69 Hình 3.7: Phân tích PCA 90 giống/dòng chè thuộc 9 quần thể chè dựa trên ma trận khoảng cách di truyền Euclidean (đặc điểm hình thái) 72
- vii Hình 3.8: Kết quả trích ly DNA tổng số chè (dựa trên quy trình Porebski) 74 Hình 3.9: Ảnh điện di xác định nhiệt độ gắn mồi tối ưu cho mồi CamsinM6 (SSR-6) 75 Hình 3.10: Ảnh điện di xác định nhiệt độ gắn mồi tối ưu cho mồi MSCjaH46 (SSR-17) và MSCjaF37 (SSR-20) 76 Hình 3.11: Kết quả nhận dạng di truyền 96 giống/dòng chè bằng chỉ thị SSR CamsinM1và CamsinM4 77 Hình 3.12: Kết quả nhận dạng di truyền 96 giống/dòng chè bằng chỉ thị SSR CamsinM8 và CamsinM13 78 Hình 3.13: Kết quả phản ứng PCR của 96 giống/dòng chè với 21 cặp mồi SSR 80 Hình 3.14: Sơ đồ phân nhóm di truyền 9 quần thể chè dựa trên khoảng cách di truyền Nei72 88 Hình 3.15: Phân tích PCA biểu diễn quan hệ nhóm của 9 quần thể chè trong không gian ba chiều 88 Hình 3.16: Sơ đồ cây phân loại 96 giống/dòng chè bằng phương pháp UPGMA 94 Hình 3.17: Phân tích PCA 96 giống/dòng chè thuộc 9 quần thể chè dựa trên mức độ tương đồng di truyền Jaccard 97 Hình 3.18: Sơ đồ cây phân nhóm 96 giống/dòng chè bằng phương pháp Weighted- Neighbor Joining 99 Hình 3.19: Phân tích PCA 96 giống/dòng chè thuộc 9 quần thể chè dựa trên khoảng cách di truyền Nei72 103 Hình 3.20: Cây phân nhóm 96 giống/dòng chè dựa trên khoảng cách di truyền Nei72 (xây dựng bằng phần mềm PHYLIP 3.69 và Dendroscopes) 105
- 1 Luận văn thạc sỹ công nghệ sinh học MỞ ĐẦU Chè (trà) không chỉ là thức uống giải khát hàng ngày mà còn là một nét văn hóa đặc trưng, một thứ nghệ thuật (Trà đạo) của người dân châu Á. Cùng với cà phê và ca cao, chè là một trong ba loại đồ uống có nguồn gốc tự nhiên không chứa cồn được cả thế giới ưa chuộng. Hơn hai phần ba dân số thế giới uống chè hàng ngày không chỉ bởi hương vị đặc sắc mà còn vì những lợi ích cho sức khỏe mà chè mang lại. Từ những kinh nghiệm dân gian cho đến các nghiên cứu khoa học gần đây đã khẳng định giá trị của cây chè đối với sức khỏe. Cây chè (Camellia sinensis (L.) O. Kuntze) thuộc họ chè Theaceae là loại cây trồng lưu niên có thời gian thu lợi kinh tế kéo dài đến hơn 60 năm. Sản xuất và chế biến chè đã trở thành một trong những ngành kinh tế nông nghiệp quan trọng ở nhiều quốc gia với sản phẩm tạo ra có giá trị xuất khẩu cao. Năm 2003, diện tích trồng chè trên toàn thế giới đã lên tới 2,7 triệu ha với tổng sản lượng chè khô khoảng 3 triệu tấn [47]. Trước nhu cầu tăng nhanh cả về năng suất và chất lượng, công tác chọn tạo giống chè đã được đẩy mạnh, nhiều giống chè mới đã được tạo ra, đặc biệt ở các nước Ấn Độ, Srilanka, Trung Quốc Tuy nhiên, do đặc điểm nông- sinh học khác biệt của cây chè nên công tác chọn tạo bằng phương pháp lai tạo hữu tính giữa các cặp bố mẹ được chọn lựa dựa trên kiểu hình gặp rất nhiều khó khăn. Để có được những dòng triển vọng thì các nhà chọn giống sẽ phải tiêu tốn rất nhiều thời gian, công sức và cần có những điều kiện cơ sở vật chất khác. Trong khoảng 20 năm trở lại đây, với việc ứng dụng chỉ thị phân tử trong chọn giống đã khắc phục được những trở ngại trong phương pháp chọn tạo truyền thống. Chọn giống nhờ chỉ thị phân tử- MAS (Molecular-Assisted Selection) đang được áp dụng rộng rãi không chỉ trong chọn tạo giống cây trồng mà còn Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 2 Luận văn thạc sỹ công nghệ sinh học cả trong chăn nuôi. Nhờ các chỉ thị phân tử mà các nhà khoa học xác định được sự khác biệt về mặt di truyền của quần thể giống khởi đầu, từ đó xác định các cặp lai có khoảng cách di truyền phù hợp có thể cho ưu thế lai cao nhất. Việc tiếp cận ở mức độ phân tử cho phép đánh giá các giống bố mẹ một cách chính xác, không bị tác động bởi các điều kiện ngoại cảnh, rút ngắn thời gian và nâng cao hiệu quả công tác lai tạo. Ở Việt Nam, cây chè và các sản phẩm từ chè đã được người dân trồng và chế biến từ lâu. Nước ta có nhiều vùng trồng và chế biến chè nổi tiếng như Mộc Châu, Thái Nguyên hay B’lao- Lâm Đồng, cùng với nhiều giống chè quý như chè Shan ở Hà Giang, Suối Giàng; chè Tân Cương ở Thái Nguyên Bên cạnh đó, nhằm đáp ứng nhu cầu phát triển của ngành sản xuất chế biến chè, nhiều giống/dòng chè đã được nhập từ các nước trên thế giới như Ấn Độ, Srilanka, Trung Quốc, Nhật Bản Đây là nguồn vật liệu rất có giá trị đối với chương trình chọn tạo giống chè. Hiện nay cây chè được xác định là một trong những cây trồng chủ lực trong quy hoạch phát triển kinh tế các tỉnh trung du và miền núi phía Bắc nước ta. Tuy nhiên, để thâm canh cây chè đạt hiệu quả cao, tránh lãng phí trong đầu tư ban đầu thì việc phải có những giống chè cho năng suất cao, chất lượng tốt, phù hợp với điều kiện khí hậu- thổ nhưỡng là một yêu cầu cần được quan tâm. Trong bối cảnh đó, công tác đánh giá đa dạng di truyền cây chè ở nước ta- có vai trò rất quan trọng trong khai thác hiệu quả nguồn gen, vẫn còn nhiều hạn chế. Cho đến nay việc nghiên cứu đánh giá sự đa dạng nguồn gen cây chè trên quy mô lớn để có thể cung cấp cơ sở di truyền ban đầu và hỗ trợ cho công tác chọn tạo giống chè còn rất khiêm tốn. Vì vậy, chúng tôi tiến hành thực hiện đề tài “Nghiên cứu đánh giá sự đa dạng di truyền các giống/dòng chè (Camellia sinensis (L.) O. Kuntze) ở Việt Nam bằng chỉ thị hình thái và chỉ thị phân tử microsatellite (SSR)” với mong muốn có Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 3 Luận văn thạc sỹ công nghệ sinh học được cái nhìn tổng quan về sự đa dạng di truyền của các giống/dòng chè ở Việt Nam. Để đạt được mục tiêu của đề tài, chúng tôi đã tiến hành những nội dung nghiên cứu sau: 1. Dựa trên một số chỉ tiêu chính, đánh giá đặc điểm hình thái của các giống/dòng chè thuộc các quần thể chè được bảo tồn ở vườn quỹ gen chè- Viện Khoa học Kỹ thuật Nông-Lâm nghiệp miền núi phía Bắc (NOMAFSI). 2. Nhận dạng di truyền các giống/dòng chè bằng chỉ thị phân tử SSR. 3. Phân tính đánh giá sự đa dạng di truyền của các giống/dòng chè dựa trên kết quả đánh giá hình thái. 4. Phân tích đánh giá sự đa dạng di truyền của các quần thể chè; của các giống /dòng chè bằng chỉ thị phân tử SSR Kết quả nghiên cứu của đề tài sẽ là cơ sở dữ liệu hữu ích trong phân loại các giống/dòng chè, hỗ trợ đắc lực cho công tác chọn tạo giống chè mới năng suất cao, chất lượng tốt, góp phần thúc đẩy phát triển ngành sản xuất-chế biến chè nước ta. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 4 Luận văn thạc sỹ công nghệ sinh học Chương 1: TỔNG QUAN 1.1. KHÁI QUÁT CHUNG VỀ CÂY CHÈ Camellia sinensis (L.) O. Kuntze 1.1.1. Lược sử ngành sản xuất- chế biến chè trên thế giới và Việt Nam Chè từ lâu đã quen thuộc với đời sống của người dân các nước châu Á. Các tài liệu của Trung Quốc đều cho rằng cây chè được phát hiện một cách tình cờ bởi Thần Nông (một vị vua trong truyền thuyết) vào khoảng năm 2737 trước Công nguyên. Tuy nhiên, cũng có những giả thuyết cho rằng ngay khi người Trung Quốc biết đến các giá trị y học của cây chè thì nhu cầu về các sản phẩm từ chè đã nảy sinh và cùng với đó là sự ra đời ngành trồng và chế biến chè ở tỉnh Tứ Xuyên- Trung Quốc từ cách nay khoảng 3000 năm. Về sau, kiến thức về canh tác cây chè đã được phổ biến rộng rãi cùng với những cuộc hành hương và di cư của các tín đồ đạo Phật, từ rất lâu trước khi sự phát tán cây chè được ghi nhận. Tại Ấn Độ năm 1823, thiếu tá Robert Bruce tìm thấy cây chè dại đầu tiên ở tỉnh Assam, nhưng cho đến năm 1834, các hạt giống chè vẫn được nhập từ Trung Quốc (bởi Gordon) để phục vụ nhu cầu thành lập các vườn trồng chè thương mại. Về sau, các cây chè bản xứ đã được đưa vào trồng nhiều hơn nhờ C.A. Bruce, người quản lý trang trại chè thuộc chính phủ Anh tại thuộc địa Ấn Độ. Lợi ích thương mại từ cây chè ngày càng gia tăng và cho đến 12-02- 1839, công ty chè đầu tiên- Công ty chè Assam- đã được thành lập ở Jorhat, Assam dưới sự điều hành của Nghị viện Anh. Đây chính là mốc đánh dấu sự ra đời ngành công nghiệp chè ở Ấn Độ cũng như trên thế giới [47]. Hiện nay trên toàn thế giới đã có hơn 30 quốc gia trồng và sản xuất chè, trong đó tập Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 5 Luận văn thạc sỹ công nghệ sinh học trung chủ yếu ở các nước châu Á với năng suất chiếm hơn 85% tổng sản lượng chè thế giới (hình 1.1). Tại Việt Nam, cây chè và sản phẩm từ chè đã được người dân sản xuất, chế biến và sử dụng từ rất lâu. Cho đến trước khi thực dân Pháp đô hộ nước ta, cây chè đã được trồng chè khá phổ biến (đặc biệt ở miền Bắc) nhưng chủ yếu là tự phát nhằm đáp ứng nhu cầu tại chỗ của người dân. Đến thời kỳ đô hộ của thực dân Pháp (1982-1945), chè là nguồn tài nguyên mà thực dân rất chú ý bóc lột để chuyển về châu Âu, nơi mà chè là món hàng xa xỉ cao cấp. Từ đầu thế kỷ 20, Pháp đã lập ra các trạm nghiên cứu và đồn điền trồng chè ở Phú Hộ (Phú Thọ- 1918), Pleiku (1927) và Bảo Lộc (Lâm Đồng- 1931) nhằm tăng cường mở rộng sản xuất chè để phục vụ chính quốc, nhờ đó mà cây chè Việt Nam được khảo sát nghiên cứu khá kỹ lưỡng và ngành sản xuất chế biến chè được mở rộng. Theo Nguyễn Ngọc Kính, lịch sử của ngành sản xuất chè Việt Nam có thể chia ra ba giai đoạn chính: • Giai đoạn từ 1890 đến 1945: Những đồn điền chè đầu tiên được thiết lập, sản xuất chè bước vào quy mô tập trung. Đến năm 1938, diện tích trồng chè lên đến hơn 13 nghìn hecta với sản lượng đạt 6100 tấn chè khô. • Giai đoạn từ 1945 đến 1954: Do ảnh hưởng của chiến tranh, ngành sản xuất chè suy giảm mạnh, tổng sản lượng chè khô năm 1946 chỉ đạt 300 tấn. • Giai đoạn từ 1954 đến nay: giai đoạn phát triển không ngừng của ngành chè, không chỉ đáp ứng nhu cầu nội địa mà còn hướng tới xuất khẩu. Năm 2008 cả nước có hơn 131 nghìn hecta trồng chè với sản lượng hơn đạt hơn 160 nghìn tấn chè khô. Hiện nay, chè được trồng ở trên 30 tỉnh thành trong cả nước, tập trung chủ yếu ở các tỉnh phía Bắc (cả về diện tích và sản lượng). Với lợi thế về Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 6 Luận văn thạc sỹ công nghệ sinh học giống, đất đai và nguồn lao động, chè được xác định là ngành kinh tế chủ đạo ở các tỉnh trung du và miền núi nước ta [2, 6, 78] 1.1.2. Nguồn gốc và phân bố của cây chè Cho đến nay, nguồn gốc phát sinh chính xác của cây chè vẫn còn là đề tài tranh cãi của các nhà nghiên cứu. Tuy nhiên, tất cả đều khẳng định rằng Đông Nam Á là quê hương khởi nguồn của cây chè. Theo Wight (1959), xuất phát điểm nguyên thủy của cây chè được cho là ở khoảng 29 độ vĩ Bắc và 98 độ kinh Đông, thuộc vùng thượng nguồn sông Irrawaddy- là vùng đất giao nhau giữa Assam, bắc Myanmar, tây nam Trung Quốc và Tây Tạng. Trong khi đó, trong một nghiên cứu công bố sớm hơn, Kingdon và Ward (1950) lại cho rằng xuất phát điểm của cây chè là ở đông nam Trung Quốc, vùng tiếp giáp với hai bang Mizoram và Meghalaya ở đông bắc Ấn Độ (tỉnh Vân Nam). Bởi vậy, các khu vực địa lý trên đều được xem như là nơi khởi nguồn và phát tán của chi Camellia nói chung (Sealy, 1958) [46, 47]. Khoảng 20 năm sau, trong những nghiên cứu phân loại cây chè dựa trên thành phần catechin, Djemukhatze (1961-1976) đã kết luận rằng thành phần catechin chủ yếu của các giống chè dại Việt Nam đơn giản và gần giống nhất với các giống chè mọc hoang dại từ cổ xưa. Từ đó ông đưa ra kết luận mới: nguồn gốc của cây chè chính là ở Việt Nam [1, 2, 78]. Các kết luận trên có được từ những nghiên cứu khác nhau và mặc dù chưa có một thống nhất cuối cùng về nguồn gốc thì ngày nay cây chè đã được phổ biến rãi tới nhiều quốc gia và vùng địa lý trên thế giới, trải rộng từ 45 độ vĩ Bắc đến 34 độ vĩ Nam, thích nghi với nhiều tiểu vùng khí hậu khác nhau và khác xa với khu vực nguyên sản ban đầu (Đông Nam Á) (hình 1.1) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 7 Luận văn thạc sỹ công nghệ sinh học Hình 1.1: Các nước trồng chè dựa vào sản lượng được thống kê năm 2007. Vùng khoanh đỏ là khu vực khởi nguồn và cũng là vùng phân bố tự nhiên của cây chè. Châu Á: Ấn Độ, Bangladesh, Đài Loan, Hàn Quốc, Indonesisa, Iran, Malaysia, Myanmar, Nepal, Nhật Bản, Sri-Lanka, Trung Quốc, Việt Nam. Châu Phi: Burundi, Cameroon, Ethipoia, Kenya, Maritius, Mozambique, Nam Phi, Rwanda, Tanzania, Uganda, Zaire Nam Mỹ: Argentina, Brazil, Ecuador, Peru Châu Đại Dương: Australia, Papua-New Ghine Châu Âu: Thổ Nhĩ Kỳ, USSR Từ Trung Quốc, quốc gia biết đến chè đầu tiên, cây chè được du nhập vào Nhật Bản trong nửa đầu thế kỷ 8. Đến thế kỷ 17, ngành trồng chè mở rộng từ Nhật Bản sang Indonesia. Cây chè lần đầu tiên được trồng ở Srilanka vào năm 1839 từ những hạt giống chè mang đến từ Calcutta (Ấn Độ). Ở các nước thuộc Liên bang Xô Viết trước đây, ngành trồng chè bắt đầu khi hạt giống được nhập từ Trung Quốc vào khoảng cuối thế kỷ 19. Về sau, từ Liên bang Xô Viết, hạt giống chè được xuất khẩu sang Thổ Nhĩ Kỳ những năm 30- 40 của thế kỷ 20. Chè du nhập vào châu Âu năm 1740 thông qua công ty Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 8 Luận văn thạc sỹ công nghệ sinh học Đông Ấn của đại úy Goff, nhưng những cây được trồng lưu giữ ở Vườn bách thảo Hoàng gia (Kew- tây nam London, Anh) đã không sống được (Sealy, 1958). Không lâu sau đó, vào năm 1768 nhà tự nhiên học John Ellis và một lái buôn người Anh đã du nhập và trồng thành công cây chè ở châu Âu (Aiton, 1789; Booth, 1830); từ đây, cây chè được du nhập vào các nước châu Phi vào cuối thế kỷ 19. Ngày nay, cây chè đã được trồng ở hơn 52 quốc gia trên toàn thế [47]. 1.1.3. Phân loại thực vật và đặc điểm hình thái của cây chè Carl Linnaeus (1707-1778)- nhà động-thực vật học người Thụy Điển- là người đầu tiên xây dựng hệ thống phân loại thực vật trong đó có cây chè. Trong cuốn sách “Các loài thực vật” (The Species of Plant) xuất bản năm 1753, Carl Linnaeus đã đề xuất chi Camellia thay cho Thea như trước đây để tưởng nhớ những đóng góp của Georg Kamel (tên Latin là Camellia ) đối với ngành thực vật học (Georg Kamel (?-1708) là một thầy tu dòng Jesuit người Czech đã có nhiều khám phá về thực vật trong thời gian truyền giáo ở các nước châu Á như Philippin, Trung Quốc ). Cũng trong cuốn sách này, Carl Linnaeus đã mô tả hai loài trong chi Camellia là cây chè Camellia sinensis (sinensis trong tiếng Latin có nghĩa là Trung Quốc- lúc đó được cho quê hương của cây chè) và cây chè (hoa) Camellia japonica. Đến năm 1958, trong cuốn chuyên khảo “A Revision of the Genus Camellia”, J. Robert Sealy đã hệ thống lại và định danh cho các loại thực vật liên quan tới chi Camellia đã được nhận dạng vào lúc đó. Ông phân chia chi Camellia ra 12 nhóm và mô tả đặc điểm hình thái của 87 loài [56]. Ngày nay, các nhà khoa học thừa nhận Camellia C. L. là một chi trong hệ thống phân loại thực vật và tên khoa học chính thức của cây chè là Camellia sinensis (L.) O. Kuntze (để tưởng nhớ nhà thực vật học người Đức Otto Carl Ernst Kuntze, 1843-1907) [16]. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 9 Luận văn thạc sỹ công nghệ sinh học Trong chi chè Camellia có đến hơn 100 loài khác nhau [80, 81], bao gồm những loài tự nhiên và lai tạo. Một số loài trong đó có giá trị dược liệu được sử dụng làm thuốc hoặc mỹ phẩm (Camellia kissii), làm cây cảnh trang trí (Camellia japonica, các loài hoa Trà, hoa hải đường Camellia amplexicaulis ở Việt Nam) hoặc là nguồn tách chiết tinh dầu (Camellia assimilis). Chỉ có duy nhất loài Camellia sinensis (L.) O. Kuntze (cây chè) là được sử dụng trong sản xuất và chế biến các loại chè làm đồ uống. Do có quá trình phân tán lâu dài giữa các vùng địa lý khác nhau cùng với những tác động của con người (lai tạo, chọn lọc) nên cây chè có sự đa dạng cả về hình thái và đặc điểm di truyền. Vì vậy mà hệ thống phân loại các giống chè còn nhiều điểm chưa được thống nhất. Các giống chè ở Việt Nam được khảo sát và phân loại từ khá sớm (những năm 30 của thế kỷ 20). Theo Nguyễn Ngọc Kính (1979), Deuss và Du Pasquire (trước đó là Cohen Stuart, 1919) dựa trên đặc điểm hình thái đã phân chia các giống chè (chủ yếu khảo sát ở Việt Nam, Trung Quốc) thành bốn thứ, bao gồm: [2, 6, 78]: • Chè Trung Quốc lá to (Camellia sinensis var. macrophylla) • Chè Trung Quốc lá nhỏ (Camellia sinensis var. bohea) • Chè Shan (Camellia sinensis var. Shan) • Chè Ấn Độ (Assam) (Camellia sinensis var. assamica) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 10 Luận văn thạc sỹ công nghệ sinh học Hình 1.2: Phân bố tự nhiên các thứ chè theo Stuart (A) và Barua (B) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 11 Luận văn thạc sỹ công nghệ sinh học Hệ thống phân loại này phân chia các giống chè theo vùng địa lý rất rõ ràng (hình 1.2). Tuy nhiên về sau, khi bản chất di truyền pha trộn của cây chè được nghiên cứu kỹ hơn thì hai thứ chè Trung Quốc lá to và chè Shan được cho là dạng lai giữa hai thứ chè Trung Quốc và Assam. Đặc điểm hình thái của chè Trung Quốc lá to (giống với thứ chè Trung Quốc lá nhỏ) và chè Shan (giống với thứ chè Assam) có thể là do sự pha trộn vật chất di truyền không cân bằng tại các vùng địa lý mà chè Trung Quốc lá nhỏ chiếm ưu thế (nam Trung Quốc) hoặc chè Assam chiếm ưu thế (Đông Nam Á). Hệ thống phân loại các thứ chè theo Stuart hiện nay vẫn được áp dụng rộng rãi ở Việt Nam. Tuy nhiên, trên thế giới cách phân loại này ít được sử dụng. Một số cơ sở dữ liệu về phân loại thực vật chỉ công nhận chè Trung Quốc và Assam là hai thứ chè thuộc loài chè Camellia sinensis (L.) O. Kuntze. Các thứ chè khác tuy được liệt kê nhưng không được công nhận chính thức. Theo cơ sở dữ liệu ITIS (Integrated Taxonomic Information System), cây chè được phân loại như sau [12]: Giới thực vật – Plantae Ngành hạt kín – Magnoliophyta Lớp hai lá mầm – Magnoliopsida Bộ chè - Theales Họ chè – Theaceae Chi chè – Camellia Loài chè – Camellia sinensis (L.) O.Kuntze Thứ/giống - Camellia sinensis var. assamica Camellia sinensis var. sinensis Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 12 Luận văn thạc sỹ công nghệ sinh học Như vậy, theo cơ sở dữ liệu này, cây chè có hai thứ chính có tên khoa học đã được công nhận là thứ chè Assam- Camellia sinensis var. assamica (Masters) Kitam và thứ chè Trung Quốc- Camellia sinensis var. sinensis (L.) Kuntze [12, 80]. Hai giống chè này được phân biệt với nhau bởi đặc điểm hình thái bên ngoài rất dễ nhận biết: Giống chè Assam có nguồn gốc từ Assam- Ấn Độ có lá to, trong khi đó giống chè Trung Quốc có lá nhỏ. Barua (1963) đã tổng hợp những đặc điểm hình thái của các giống chè (đặc biệt là thân và lá) để thiết lập hệ phân loại chè mới gồm ba thứ: ngoài các thứ chè Assam và chè Trung Quốc còn có thứ chè Cambod [47]. Những đặc điểm hình thái chính của ba thứ chè được Barua mô tả như sau: Thứ chè Trung Quốc (C. sinensis var. sinensis): có thân dạng bụi (cao 1-3m), có nhiều thân nhỏ phát sinh từ một gốc. Lá chè khá nhỏ, mỏng và dai; có những khí khổng tạo thành vùng hõm trên phiến lá. Cuống lá ngắn và mập giúp cho lá có tư thế thẳng đứng và thường mọc thành cụm có từ 3 đến 7 lá (hình 1.3). Hoa chè thứ Trung Quốc thường là hoa đơn hoặc theo cặp mọc từ nách lá có cuống dài 6-10mm với 2- 3 cặp lá bắc đối xứng nhau. Hoa có 7-8 cánh hình chén, các cánh hoa dài 1,5-2 cm và có hình dạng thay đổi từ oval rộng đến hình cầu với 3-5 vòi nhụy. Quả nang có 1, 2 hoặc 3 ngăn mang 1- 3 hạt hình cầu với đường kính khoảng 10-15 mm. Camellia sinensis var. sinensis có nguồn gốc từ vùng đông nam Trung Quốc, là loại được tìm ra và Hình 1.3: Cây chè Trung Quốc (C.sinensis var. sinensis) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 13 Luận văn thạc sỹ công nghệ sinh học đưa vào canh tác sớm nhất. Các giống chè Trung Quốc là nguyên liệu chủ yếu để chế biến chè xanh. Thứ chè Assam (C. sinensis var. assamica): Cây cao từ 10 đến 15 m với hệ thân đẻ nhánh mạnh. Lá tương đối lớn và mỏng, bề mặt bóng với chóp lá biến đổi từ dạng tù đến nhọn. Lá có hệ gân mép nổi rõ và bản lá có hình elip rộng. Lá chè giống Assam thường dài 8-20 cm và rộng 3,5-7,5 cm. Hoa thường mọc đơn lẻ hoặc theo cặp có 3 lá bắc con màu xanh. Hoa có nhiều nhị, 5-6 lá đài bền Hình 1.4: Cây chè Assam (C.sinensis var. assamica) với 7-8 cánh hoa màu trắng (hình 1.4). Camellia sinensis var. assamica là thứ chè bản địa vùng Assam-Ấn Độ được tìm ra vào thế kỷ 19. Các giống chè Assam được sử dụng chế biến chè đen. Thứ chè Cambod (C. sinensis var. assamica sub sp. lasiocalyx): Thân cây đứng thẳng cao 6-10 m, ít phân nhánh, các cành thường phát triển ngang. Lá mọc thẳng đứng có màu biến thiên từ xanh nhạt đến vàng đồng hay đỏ phớt hồng, mặt lá bóng. Kích thước lá trung gian giữa thứ chè Trung Quốc Hình 1.5: Cây chè Cambod (C.sinensis var. assamica sub sp. lasiocalyx) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 14 Luận văn thạc sỹ công nghệ sinh học và thứ chè Assam (hình 1.5). Hoa khá giống với chè Assam, có 4 hoặc nhiều hơn lá bắc, có 3-4 noãn với 5 ngăn và 3-5 vòi nhụy. Các giống Cambod phổ biến ở khu vực Ấn Độ và Indonesia. Hệ thống phân loại chè của Barua được nhiều nhà khoa học ủng hộ và sử dụng rộng rãi trong các công trình nghiên cứu chè trên thế giới. Ngày nay, số lượng các loài thuộc chi chè Camellia nói chung và các giống thuộc loài chè Camellia sinensis (L.) O. Kuntze nói riêng được các nhà khoa học công bố đã tăng lên rất nhiều, khoảng 267 giống [56]. Ngoài một số loài hoang dại mới được tìm thấy ở các khu vực nguyên sản của chi Camellia [48] thì hầu hết các giống mới là các giống được lai tạo phục vụ nhu cầu làm cảnh (các giống làm hoa cây cảnh như Camellia japonica var.) và nâng cao năng suất ngành sản xuất chè. 1.1.4. Đặc điểm di truyền của cây chè Camellia sinensis (L.) O. Kuntze Mặc dù là loại cây trồng quan trọng ở nhiều nước trên thế giới nhưng cho đến nay, vẫn chưa có nhiều thông tin về bộ gen của cây chè [63]. Những nghiên cứu từ trước đến nay đã cho kết quả rất khác nhau. Năm 2001, nghiên cứu của Hanson cho thấy kích thước bộ gen 4C DNA của cây chè Camellia sinensis khoảng 15,61±1,06 pg. Do 1C DNA tương đương với 3824 Mbp và 1pg= 980Mbp nên kích thước bộ gen chè theo kết quả của Hanson vào khoảng 15.298 Mbp [47]. Tuy nhiên gần đây, nghiên cứu của Tanaka và Taniguchi (năm 2007) trên các giống chè Nhật Bản lại cho thấy kích thước bộ gen của cây chè được ước tính khoảng 4 Gbase [63]. Nghiên cứu tế bào học các giống chè của Kondo (1979) đã xác định cây chè là loài thực vật lưỡng bội (2n=30, số nhiễm sắc thể cơ sở là 15) và kiểu nhân (karotype) biến đổi Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 15 Luận văn thạc sỹ công nghệ sinh học khác nhau giữa các giống chè [36] (hình 1.6); điều này đã khẳng định lại kết quả nghiên cứu của Bezbaruah (1971) với các giống chè Ấn Độ [47]. Hình 1.6: Tiêu bản nhiễm sắc thể ở kỳ giữa của cây chè (C.sinensis var. sinensis). Kiểu nhân 1: 2n=30=18m=12sm Kiểu nhân 2: 2n=30=21m+6sm+2smsat+1st Kiểu nhân 3: 2n=30=21m+2msat+5sm+2smsat Kiểu nhân 4: 2n=30=20m+10sm Kiểu nhân 5: 2n=30=18m+2msat+6sm+1smsat+2st+1stsat Kiểu nhân 6: 2n=30=18m+8sm+4smsat (m= metacentric- tâm cân, sm= submetacentric- tâm lệch, st= subtelocentric- tâm cận mút, t= telocentric- tâm mút) [36] Nói chung, các nhiễm sắc thể của chè có kích thước nhỏ và có xu hướng kết lại với nhau thành khối. Giá trị r (tỷ lệ chiều dài giữa cánh dài và cánh ngắn của nhiễm sắc thể) của 15 cặp nhiễm sắc thể trong khoảng 1,00 đến Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 16 Luận văn thạc sỹ công nghệ sinh học 1,91. Sự đồng nhất của các nhiễm sắc thể lưỡng bội cho thấy đặc điểm cùng nguồn (monophyletic) tất cả các loài thuộc chi Camellia. Bên cạnh thể lưỡng bội, nhiều thể đa bội của cây chè (phần lớn do lai tạo) cũng đã được ghi nhận, ví dụ như thể tam bội 2n=45 (TV-29, UPASI-3, UPASI-2 ), tứ bội 2n=60, ngũ bội 2n=75 và thể bội không hoàn chỉnh (aneuploid) 2n±1 (Singh, 1980; Zhan và cs, 1987) [36, 47, 63]. Do quá trình lai chéo xảy ra phổ biến giữa các loài thuộc chi Camellia nên đã tạo ra các con lai ở trạng thái chuyển giao mang vật chất di truyền lẫn tạp; cây chè Camellia sinensis cũng không nằm ngoài xu hướng này. Các cây chè lai có những đặc điểm hình thái từ giống thứ chè Trung Quốc (lá nhỏ) đến dạng trung gian rồi giống thứ chè Assam (lá to) (hình 1.7); đến nay, rất nhiều giống chè lai được xếp vào một trong các thứ chè Trung Quốc, Assam hay Cambod dựa vào tính tương đồng về kiểu hình của chúng với các thứ chè này. Hình 1.7: Kích thước lá biến thiên từ nhỏ (thứ chè Trung Quốc- 1, 2) đến lớn (thứ chè Assam 6, 7). Thứ chè Cambod có kích thước lá trung gian (3, 4, 5). Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 17 Luận văn thạc sỹ công nghệ sinh học Cây chè có thể lai tốt với các giống hoang dại, do đó các nhà phân loại học luôn quan tâm xác định các cá thể lai này bởi qua đó có thể xác định được sự tham gia hình thành nên vốn gen (gene pool) cây chè của các giống hoang dại. Có hai loài được đặc biệt quan tâm là C. irrawadiensis và C. taliensis vốn có đặc điểm hình thái tương đồng với cây chè. Một số loài khác thuộc chi Camellia cũng được cho là góp phần hình thành nên vốn gen của cây chè thông qua quá trình lai tự nhiên như C. flava, C.petelotii và C. lutescens, trong đó C. taliensis được cho là dạng lai giữa C.sinensis và C. irrawadiensis. Cho đến nay, các nhà khoa học cho rằng ba thứ chè C.assamica; C.sinensis; C. assamica sub sp. lasiocalyx và ở chừng mực nào đó là C.irrawadiensis đều là các nhân tố chính tham gia hình thành nên vốn gen của cây chè. Có một thực tế là rất khó xác định liệu có tồn tại hay không một giống chè tự nhiên mang vật chất di truyền nguyên trạng không bị pha trộn. Bởi vậy khái niệm “cây chè” bao trùm toàn bộ các giống, dòng là con lai của các thứ chè này [47]. 1.1.5. Ngành sản xuất, chế biến chè trên thế giới và Việt Nam Hơn 300 năm sau khi chè từ châu Á du nhập vào châu Âu, nhu cầu của thị trường thế giới về các sản phẩm từ chè đã tăng vọt và kéo theo đó là sự phát triển mạnh mẽ của ngành sản xuất và chế biến chè. Từ vùng nguyên sản Đông Nam Á, đến nay trên thế giới đã có hơn 52 quốc gia sản xuất và chế biến chè [47]. Chè với vai trò là đồ uống đã được chế biến thành nhiều dạng sản phẩm như chè đen, chè xanh, chè trắng, chè Ô Long; cách thức pha chế và thưởng thức chè cũng rất đa dạng, từ pha hãm truyền thống đến các loại chè túi lọc tiện lợi và nhanh chóng. Bên cạnh đó, lá chè với nhiều thành phần có lợi cho sức khỏe cũng được sử dụng làm thuốc, mỹ phẩm Năm 2007, tổng sản lượng chè trên toàn thế giới đạt trên 3,5 triệu tấn, trong đó Trung Quốc và Ấn Độ là hai trong số những quốc gia có sản lượng Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 18 Luận văn thạc sỹ công nghệ sinh học chè lớn nhất thế giới [67]. Với giá niêm yết trên các sàn giao dịch chè khoảng 2 USD cho một kg, thì giá trị tổng sản lượng chè (dưới dạng chè khô) trên toàn thế giới ước đạt 7 tỉ USD. Việt Nam được xếp vào nhóm 10 quốc gia sản xuất, chế biến và xuất khẩu chè lớn nhất thế giới (hình 1.8). n) ấ ng (nghìn t ượ n l ả S Hình 1.8: Biểu đồ sản lượng chè khô của một số nước năm 2005, 2006 và 2007 (số liệu theo thống kê của ITC London-2008 [67]) n) ấ ng (nghìn t ượ n l ả S Hình 1.9: Biểu đồ khối lượng sản xuất và xuất khẩu chè khô của một số nước năm 2007 (số liệu theo thống kê của ITC London-2008 [67]) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 19 Luận văn thạc sỹ công nghệ sinh học Một điều khá thú vị là nếu xét theo tỷ lệ xuất khẩu/tổng sản lượng thì Trung Quốc, Ấn Độ là các quốc gia có sản lượng chè cao và cũng là những nước xuất khẩu chè ít hơn cả. Bởi vì chè không chỉ là thức uống quen thuộc hàng ngày mà còn là một nét văn hóa đặc trưng của các quốc gia này (hình 1.9). Mặc dù là loại cây trồng có giá trị thương mại cao nhưng do hạn chế về diện tích đất canh tác và điều kiện khí hậu nên diện tích trồng chè không được mở rộng đáng kể. Chính vì lẽ đó, để nâng cao sản lượng cũng như chất lượng chè thì biện pháp tối ưu nhất chính là tạo ra các giống chè mới đáp ứng được các yêu cầu về cả lượng và chất. Từ các giống chè hiện có, công tác lai tạo chè từ lâu đã rất được chú ý đầu tư. Ở một số quốc gia như Ấn Độ, Srilanka, Trung Quốc, Nhật Bản, Việt Nam có các trung tâm nghiên cứu về chè là nơi tiến hành các nghiên cứu lai tạo ra các giống chè mới và cũng đã đưa nhiều giống có năng suất, chất lượng tốt ra trồng sản xuất đại trà. 1.1.6. Công tác lai tạo giống chè Hiện nay, công tác lai tạo nhân giống chè được tiến hành rất phổ biến ở các quốc gia trồng chè với mục tiêu không chỉ tạo ra giống chè mới năng suất cao, chất lượng tốt mà còn với số lượng lớn phục vụ sản xuất. Ngoài các phương pháp truyền thống như lai hoa lấy hạt, giâm ghép , với sự phát triển khoa học kỹ thuật- nhất là công nghệ sinh học, thì nhiều công nghệ mới đã được áp dụng cho hiệu quả vượt trội so với các phương pháp truyền thống. 1.1.6.1. Phương pháp truyền thống Chương trình lai tạo giống chè giữa các quốc gia, khu vực rất khác nhau, dựa trên yêu cầu thực tế của từng nơi nhưng đều hướng tới mục tiêu nâng cao năng suất và cải thiện chất lượng. Ở các vùng sản xuất chè đen như Kenya, Srilanka, Ấn Độ chương trình lai tạo giống chè chú trọng đến tạo giống cho Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 20 Luận văn thạc sỹ công nghệ sinh học năng suất và chất lượng búp cao, trong khi các vùng sản xuất chè khác (Nhật Bản, Hàn Quốc, Trung Quốc) lại tập trung nâng cao tính chống chịu lạnh, sương muối và các điều kiện bất lợi khác Các phương pháp lai tạo giống chè truyền thống như lai hữu tính, lai đa bội, lai khác loài được áp dụng khá phổ biến; nhìn chung có thể quy về hai hướng chính là chọn lọc từ quần thể chè triển vọng và lai tạo giữa các giống chè tiềm năng. Chọn lọc cá thể là phương thức đã được áp dụng từ rất lâu, nhất là đối với các giống chè nhập nội nhằm thu được các dòng chè mới không chỉ mang những ưu điểm về năng suất- chất lượng của giống gốc mà còn thích ứng tốt với điều kiện vùng sinh thái mới. Dựa vào đặc điểm hình thái (tương ứng với những chỉ tiêu năng suất, chất lượng) các dòng chè triển vọng trong quần thể vật liệu ban đầu được chọn lựa, cho tự thụ để thu hạt và gieo trồng thế hệ sau. Cứ qua mỗi thế hệ, các cá thể tốt nhất, đồng đều không mang biến dị sẽ được lựa chọn làm đầu dòng cho các bước tiếp theo. Quá trình chọn lọc cứ như vậy kéo dài qua nhiều thế hệ (2, 3 hoặc hơn) có thể thu được các dòng chè triển vọng áp dụng cho sản xuất đại trà. Đã có khá nhiều giống/dòng chè tốt được tạo ra theo hướng này như giống Đại Bạch Trà- Trung Quốc (chọn lọc từ quần thể chè Kỳ Môn), giống TRI 777- Srilanka (chọn lọc từ giống chè Shan Chồ Lồng- Mộc Châu, Việt Nam). Ở Việt Nam, nhiều giống/dòng chè tiềm năng cũng đã được chọn lọc như TB11, TB14 (chọn lọc từ chè Shan Pousang- Lào); các giống PH1, 1A, F23 được chọn lọc từ các giống chè Ấn Độ [6]. Cùng với chọn lọc cá thể, lai hữu tính cũng là hướng tiếp cận phổ biến trong công tác chọn tạo giống chè. Dựa trên các đánh giá đặc điểm hình thái và đặc tính nông học (nguồn gốc sinh thái, đặc tính số lượng, đặc tính chất lượng, tính kháng bệnh, tính chống chịu điều kiện bất lợi ) các nhà tạo giống thường lựa chọn cặp lai mà cây bố mang những ưu điểm mà cây mẹ không có (và ngược lại). Về mặt lý thuyết thì cây con tạo ra sẽ mang những đặc tính tốt Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 21 Luận văn thạc sỹ công nghệ sinh học của cả cây bố lẫn cây mẹ (nếu bố mẹ mang kiểu gen thuần chủng quy định những tính trạng quan tâm). Nếu bố mẹ không thuần chủng thì các con lai có những biến dị với kiểu hình rất khác nhau. Lúc này bằng các phương pháp chọn lọc cá thể có thể thu được giống mới đáp ứng yêu cầu ban đầu [6, 46]. Ở Việt Nam có một số giống chè đã được tạo ra theo hướng này như LDP1, LDP2 (chọn lọc từ cặp lai Đại Bạch Trà (Trung Quốc) và PH1); Phúc Vân Tiên (chọn lọc từ cặp lai Đại Bạch Trà và Vân Nam lá to) [6]. Do đặc điểm di truyền và nông-sinh học riêng biệt của cây chè mà phương pháp lai tạo truyền thống thường tốn nhiều thời gian và công sức (thời gian sinh trưởng đạt tới lúc ổn định khoảng 2-3 năm). Bên cạnh đó chè còn là loài có đặc điểm hình thái biến đổi theo tiểu vùng khí hậu nên các đánh giá kiểu hình thường có sai lệch, không đảm bảo chính xác để làm cơ sở chọn cặp lai và sàng lọc con lai. 1.1.6.2. Áp dụng công nghệ sinh học trong chọn tạo giống chè Trong khoảng vài năm trở lại đây, công nghệ sinh học đã dần được áp dụng trong chọn tạo giống chè. Nhằm khắc phục những điểm yếu của phương pháp truyền thống, công nghệ sinh học đã hỗ trợ hoặc thay thế một số công đoạn trong chiến lược chọn tạo giống, phổ biến nhất là hai mảng công nghệ chỉ thị phân tử và nuôi cấy mô phôi tế bào [46, 47]: • Áp dụng chỉ thị phân tử trong đánh giá đa dạng di truyền các giống chè, hỗ trợ chọn lựa cặp lai phù hợp; nhận dạng di truyền các giống chè và đặc biệt đóng vai trò quan trọng trong chọn giống phân tử MAS. • Áp dụng công nghệ cứu phôi nhằm nâng cao tỷ lệ sống sót của các phôi lai và công nghệ nhân giống vô tính in vitro nhân nhanh hàng loạt cây con. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 22 Luận văn thạc sỹ công nghệ sinh học Với những ưu điểm vượt trội, công nghệ sinh học đang ngày càng được áp dụng phổ biến trong nghiên cứu và chọn tạo giống chè. Tuy nhiên, ở Việt Nam lĩnh vực này còn chưa nhận được sự quan tâm thích đáng. 1.2. CHỈ THỊ TRONG ĐÁNH GIÁ ĐA DẠNG DI TRUYỀN Đa dạng sinh học là vấn đề rất được quan tâm hiện nay. Gìn giữ và bảo tồn đa dạng sinh học là mục tiêu sống còn trong việc duy trì cân bằng sinh thái, đảm bảo môi sinh của các sinh vật trên Trái đất, trong đó có con người. Khái niệm đa dạng sinh học được hiểu theo nhiều cấp, đó có thể là sự đa dạng của các quần xã sinh vật trong hệ sinh thái, là sự đa dạng giữa các loài trong quần xã hay sự đa dạng ở cấp độ di truyền giữa các cá thể trong cùng một loài. Mặc dù là cấp độ thấp nhất, nhưng đa dạng di truyền lại có vai trò vô cùng quan trọng trong tiến hóa và thích nghi của các sinh vật; mọi biến động ở cấp độ đa dạng di truyền đều có những tác động đến những cấp độ cao hơn và cuối cùng là ảnh hưởng đến đa dạng sinh học [61]. Đa dạng di truyền là kết quả của quá trình biến đổi trong vật chất di truyền sinh vật (trình tự DNA, số lượng cấu trúc nhiễm sắc thể) theo các con đường tự nhiên (lai, phân ly-tái tổ hợp, đột biến tự nhiên ) hay bởi bàn tay con người (lai-chọn tạo giống, gây đột biến, chuyển gen ). Tất cả những quá trình này gây nên những biến đổi trong gen và tần số alen, dẫn đến những thay đổi trong kiểu hình của sinh vật. Đa dạng di truyền có vai trò và ý nghĩa hết sức quan trọng trong công nghệ sinh học nông nghiệp. Từ những kết quả đánh giá đa dạng di truyền, các nhà khoa học có thể quy hoạch và bảo tồn các nguồn gen quý nhằm duy trì đa dạng sinh học hoặc hỗ trợ quá trình lai-chọn tạo giống thông qua chọn lựa các cặp bố mẹ trong các phép lai nhằm thu được ưu thế lai cao nhất. Trên nhiều đối tượng thực vật, nghiên cứu đa dạng di truyền đã được thực hiện từ khá lâu Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 23 Luận văn thạc sỹ công nghệ sinh học với nhiều phương pháp tiếp cận khác nhau, thông qua các dữ liệu kiểu hình (chỉ thị hình thái), thành phần protein và hoạt chất (chỉ thị hóa sinh) hay sự khác biệt (đa hình) trong DNA (chỉ thị DNA). Mỗi loại chỉ thị đều có những ưu- nhược điểm cũng như khả năng đánh giá mức độ đa dạng di truyền khác nhau. Trong đó, chỉ thị hình thái được sử dụng sớm nhất và là cơ sở ban đầu trong đánh giá phân loại sinh vật, còn chỉ thị hóa sinh và đặc biệt chỉ thị DNA hiện nay được sử dụng rộng rãi nhất không chỉ trong đánh giá đa dạng di truyền mà còn là công cụ hữu hiệu hỗ trợ công tác chọn tạo giống. 1.2.1. Chỉ thị hình thái Trước đây, sự đa dạng giữa các cá thể trong quần thể và giữa các quần thể được xác định thông qua đánh giá các đặc điểm hình thái nổi trội (hình dạng, kích thước, đặc điểm các bộ phận ). Với ưu điểm như dễ dàng tiếp cận và nghiên cứu, không đòi hỏi thiết bị đặc biệt cũng như quy trình thực hiện phức tạp, chỉ thị hình thái được sử dụng khá rộng rãi trong nghiên cứu đa dạng di truyền thực vật. Trong đánh giá và chọn tạo giống truyền thống, chỉ thị hình thái được áp dụng phổ biến và khá hiệu quả ở một số loại cây trồng như lúa, ngô, đậu tương [9]. Tuy nhiên, còn có những nhược điểm ảnh hưởng đến tính chính xác cũng như hiệu quả của chỉ thị hình thái. Thứ nhất, số lượng chỉ thị rất hạn chế (so với các loại chỉ thị khác) trong khi các đặc điểm hình thái lại chịu tác động rất lớn của môi trường cũng như phụ thuộc vào giai đoạn sinh trưởng phát triển của đối tượng nghiên cứu. Mức độ tin cậy của công tác đánh giá đa dạng di truyền phụ thuộc vào số lượng các chỉ thị được xét tới, do số lượng chỉ thị hình thái không đủ nhiều nên kết quả thu được cũng không chính xác. Bên cạnh đó, do tính biến thiên của các đặc điểm hình thái theo điều kiện môi trường và giai đoạn sinh trưởng nên kết quả thường có sự sai lệch giữa các lần Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 24 Luận văn thạc sỹ công nghệ sinh học đánh giá hoặc trong điều kiện đánh giá khác nhau. Thứ hai, việc đánh giá kiểu hình mang tính chất thống kê nên cần thực hiện trên số lượng lớn đối tượng để đảm bảo độ chính xác. Chính vì vậy sẽ cần diện tích đất đai lớn cũng như nhiều nhân lực và thời gian để gieo trồng và đánh giá đối tượng. Cuối cùng, do đặc điểm dựa trên kiểu hình để đánh giá kiểu gen nên chỉ thị hình thái không thể là thước đo chính xác để đánh giá tính đa dạng di truyền giữa các cá thể, nhất là khi không phải toàn bộ các gen đều thể hiện ra kiểu hình có thể đo đếm được. Hiện nay, tuy có nhiều nhược điểm và trong bối cảnh chỉ thị DNA được sử dụng phổ biến hơn, nhưng chỉ thị hình thái vẫn được áp dụng khá hiệu quả trong đánh giá đa dạng di truyền (đặc biệt đối với các đối tượng mà chỉ thị phân tử chưa có nhiều) hoặc trong nghiên cứu lập bản đồ liên kết phục vụ chọn tạo giống cây trồng như ở lúa (Lã Tuấn Nghĩa và cs, 2000; Zeng và cs, 2003) [4, 79], ngô (Hugo và cs, 2005) [28] 1.2.2. Chỉ thị hóa sinh Protein và các hoạt chất trao đổi khác là sản phẩm của quá trình biểu hiện gen ở sinh vật. Nghiên cứu sự khác biệt trong thành phần của các sản phẩm này có thể giúp xác định những khác biệt về mặt di truyền giữa các cá thể và loài khác nhau. Bush và cs (1978) khẳng định điện di protein trên gel là phương pháp hữa hiệu có thể giúp phân biệt, nhận diện giữa các loài và phân loại sinh vật. Các protein, sản phẩm trao đổi chất được sử dụng như những chỉ tiêu đánh giá, phân biệt các sinh vật được gọi là chỉ thị hóa sinh. Chỉ thị hóa sinh được sử dụng phổ biến nhất là các isozyme (các enzyme có trình tự amio acid khác nhau nhưng cùng xúc tác cho một phản ứng hóa học). Isozyme được trích ly, tinh sạch và điện di trên gel. Các thành phần trong gel biến tính (thường là SDS) phá vỡ các cấu trúc bậc cao của chuỗi amino acid Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 25 Luận văn thạc sỹ công nghệ sinh học và khi đó dưới tác động của điện trường, các isozyme biến tính sẽ phân tách trên gel dựa trên khối lượng và độ tích điện. Từ sự đa hình giữa các băng điện di thu được sẽ giúp nhận diện từng các thể và đánh giá được sự đa dạng trong quần thể nghiên cứu. So với chỉ thị hình thái thì chỉ thị hóa sinh đáng tin cậy hơn bởi mỗi protein là sản phẩm của một gen, do đó sự đa hình các protein cũng phản ánh gián tiếp sự đa hình trong kiểu gen của sinh vật. Tuy nhiên, đối với các cá thể có quan hệ di truyền gần gũi (đặc biệt là giữa các giống cây trồng) thì các sản phẩm biểu hiện gen (protein, enzyme ) không cho sự đa hình rõ ràng. Đây là một nhược điểm của chỉ thị hóa sinh cùng với tính không độc lập với điều kiện môi trường (do quá trình biểu hiện gen thay đổi ở các điều kiện sinh trưởng khác nhau) và số lượng chỉ thị đa hình không phong phú. Bởi vậy trong hầu hết những nghiên cứu đa dạng di truyền ngày nay, chỉ thị DNA được sử dụng phổ biến hơn cả. 1.2.3. Chỉ thị DNA Đầu những năm 80 của thế kỷ 20, kỹ thuật RFLP ra đời và được biết đến là loại chỉ thị mới-chỉ thị DNA thế hệ đầu tiên- với những ưu điểm vượt trội so với những chỉ thị hình thái và chỉ thị hóa sinh đang được sử dụng trong đánh giá đa dạng di truyền lúc đó (Botstein, 1980). Tuy nhiên mốc đánh dấu quan trọng nhất của công nghệ chỉ thị phân tử nói riêng và sinh học phân tử nói chung chính là phát minh phản ứng chuỗi polymerase (Polymerase Chains Reaction- PCR) của Karl Mullis (1983). Với khả năng tạo ra vô số bản sao của một đoạn DNA chỉ từ một vài phân tử DNA ban đầu, đây là phát minh mang tính bước ngoặt, làm thay đổi hoàn toàn cách thức tiếp cận- nghiên cứu sinh học phân tử và là cơ sở nền tảng ra đời cho thế hệ chỉ thị phân tử tiếp theo. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 26 Luận văn thạc sỹ công nghệ sinh học PCR là phản ứng nhân gen in-vitro, dựa trên hoạt tính của loại enzyme DNA polymerase chịu nhiệt. Phản ứng PCR chuẩn có ba giai đoạn nhiệt độ được kiểm soát bởi máy gia nhiệt. Thành phần phản ứng bao gồm : 1. Đệm phản ứng, thường chứa Tris-HCl, KCl và MgCl2 2. Enzyme DNA polymerase chịu nhiệt có khả năng gắn nucleotide vào đầu 3’ của đoạn mồi gắn với DNA khuôn sợi đơn 3. Bốn loại deoxyribocnucleotide triphosphate (dNTP) là dATP, dCTP, dGTP và dTTP 4. Hai đoạn mồi oligonucleotide được thiết kế bổ sung đặc hiệu với đoạn DNA cần nhân lên 5. DNA khuôn Nguyên lý của phản ứng PCR được thể hiện ở hình 1.10. Dựa trên nguyên lý của phản ứng PCR, sử dụng các loại mồi oligonucleotide khác nhau (mồi ngẫu nhiên, mồi đặc hiệu) nhằm nhân lên các vùng trình tự DNA, nhiều chỉ thị DNA đã được phát triển và ứng dụng trong nghiên cứu đa dạng di truyền như RAPD (Williams và cs, 1990; Caetanos-Anolles và cs, 1991), SSR (Litt và Luty, 1989), AFLP (Zabeau và cs, 1993), SNP (Lai và cs, Hình 1.10: Nguyên lý phản ứng PCR Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 27 Luận văn thạc sỹ công nghệ sinh học 1998) [26]. Các chỉ thị này đã được ứng dụng và mang lại những kết quả đáng tin cậy, có giá trị không chỉ với nghiên cứu đa dạng di truyền mà còn với nhiều lĩnh vực công nghệ sinh học nông nghiệp khác. Nghiên cứu tổng hợp của Joshi (1999) và Weising (2005) đã đề ra những đặc điểm và cũng là tiêu chuẩn cho các loại chỉ thị DNA như sau: 1. Có mức độ đa hình cao 2. Di truyền đồng trội (cho phép phân biệt cá thể đồng hợp tử- dị hợp tử) 3. Phân định rõ ràng giữa các alen 4. Tần suất xuất hiện trong hệ gen cao 5. Phân bố đều trên hệ gen 6. Có trạng thái trung tính (không chịu tác động đa gen) 7. Dễ dàng tiếp cận đánh giá 8. Có thể phân tích nhanh và đơn giản 9. Khả năng tái lặp cao 10. Kết quả có thể trao đổi dễ dàng giữa các cơ sở nghiên cứu 11. Có chi phí phát triển và thực hiện thấp Cho đến nay có thể khẳng định rằng không một chỉ thị DNA nào có thể đáp ứng được đầy đủ các tiêu chuẩn trên (bảng 1.1). Tuy nhiên hoàn toàn có thể chọn lựa trong số những chỉ thị này một hay một vài chỉ thị mang những đặc điểm đáp ứng được yêu cầu nghiên cứu với từng đối tượng cụ thể. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 28 Luận văn thạc sỹ công nghệ sinh học Bảng 1.1: So sánh đánh giá đặc điểm của một số loại chỉ thị được ứng dụng trong nghiên cứu đa dạng di truyền thực vật [19, 33] Dựa Mức Tính Chi Hàm Yêu Phát trên độ đa di phí lượng- cầu hiện phản hình truyền phát chất trình bằng ứng triển, lượng tự phóng PCR ứng DNA DNA xạ dụng I. Chỉ thị hình thái x L D-R-C x x x II. Chỉ thị hóa sinh x L C H/M x x x III. Chỉ thị DNA RFLP x L-M C M/H H/H x √/x RAPD √ M-H D L/L L/L x x SSR √ H C H/M L/M √ x ISSR √ H D L/L L/M √/x x AFLP √ H D M-H/L L/H x √/x IRAP/REMAP √ H C H/M L/M √ STS/EST √ H C/D H/M L/H √ √/x SNP √ Ex-H C H/M-L L/H √ x SCARS/CAPS √ H C H/M L/H √ √x Microarray √ H M/L L/H √ x Chú thích: L- thấp; M-trung bình; H- cao; ex-H-rất cao D- trội; R-lặn; C- đồng trội Các chỉ thị DNA có thể được phân chia theo nhiều tiêu chí khác nhau, dựa trên cơ sở kỹ thuật hay tính chất di truyền của chỉ thị (trội hay đồng trội) Dựa trên cơ sở kỹ thuật, có thể phân chia các chỉ thị DNA thành các nhóm sau: 1. Chỉ thị dựa trên cơ sở lai DNA 2. Chỉ thị dựa trên phản ứng PCR 3. Chỉ thị dựa trên trình tự DNA Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 29 Luận văn thạc sỹ công nghệ sinh học 4. Chỉ thị dựa trên hình dạng DNA 5. Chỉ thị microarray Mặc dù hiện nay số lượng chỉ thị DNA rất phong phú với nhiều biến thể khác nhau nhưng nhìn chung chỉ có một số loại được sử dụng phổ biến trong nghiên cứu đa dạng di truyền. 1.2.3.1. Chỉ thị dựa trên cơ sở lai DNA- chỉ thị RFLP (Restriction Fragment Length Polymorphism) Trong số các chỉ thị DNA, RFLP (đa hình độ dài các đoạn cắt giới hạn) là chỉ thị thế hệ đầu tiên, được phát triển sớm nhất và ban đầu được sử dụng trong nghiên cứu di truyền ở người (Botstein, 1980). Trong hệ gen sinh vật thường xảy ra các quá trình làm thay đổi trình tự DNA như các đột biến điểm, đột biến thêm-bớt đoạn DNA (với số lượng từ vài chục đến vài trăm cặp nucleotide) hay sự sắp xếp lại các đoạn nhiễm sắc thể trong quá trình phân ly- tái tổ hợp. Những biến đổi này có làm tăng, giảm hoặc dịch chuyển các vị trí giới hạn (vị trí nhận biết của các enzyme giới hạn). Khi sử dụng enzym giới hạn để phân cắt DNA hệ gen, những thay đổi của vị trí nhận biết sẽ tạo ra các mảnh DNA có kích thước khác nhau [26]. Về nguyên lý, chỉ thị RFLP dựa trên sự phân cắt DNA hệ gen bằng các enzym giới hạn và sản phẩm cắt giới hạn có thể được phát hiện bởi quá trình lai Southern với các mẫu dò đánh dấu phóng xạ (đoạn trình tự DNA đặc hiệu được thiết kế để có thể bắt cặp bổ sung và qua đó phát hiện được trình tự DNA mục tiêu) sau khi điện di trên gel agarose (Southern, 1979) [61]. RFLP là chỉ thị đồng trội do có thể phát hiện được các alen khác nhau của một locus trong hệ gen nhân, hệ gen ti thể hay hệ gen lục lạp bằng một mẫu dò dặc hiệu [75]. RFLP là công cụ chủ yếu trong nghiên cứu đa dạng di truyền trong và giữa các loài động thực vật trong những năm 80 thế kỷ 20 [26, 61]. Rất nhiều Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 30 Luận văn thạc sỹ công nghệ sinh học nghiên cứu đa dạng di truyền trên thực vật đã được thực hiện bằng chỉ thị RFLP. Tuy nhiên, do các thao tác thực hiện phức tạp, đòi hỏi kỹ thuật viên có tay nghề cao, thí nghiệm tốn nhiều thời gian và độc hại nên khi các chỉ thị phân tử khác được tìm ra thì RFLP đã không còn được sử dụng phổ biến. 1.2.3.2. Chỉ thị DNA ngẫu nhiên Tính đặc hiệu trong phản ứng nhân bản DNA phụ thuộc vào nhiều yếu tố (thành phần, điều kiện phản ứng ), trong đó tính đặc hiệu của đoạn mồi đóng vai trò quyết định. Nếu đoạn mồi có độ dài lớn (trên 20 nucleotide) thì khả năng bắt cặp với DNA khuôn càng đặc hiệu và ngược lại, nếu đoạn mồi ngắn (dưới 10 nucleotide) thì khả năng bắt cặp ngẫu nhiên với DNA khuôn càng tăng. Do đó với đoạn mồi ngắn, số lượng sản phẩm DNA có kích thước khác nhau của phản ứng PCR sẽ rất nhiều. Đây là cơ sở của chỉ thị DNA dựa trên kỹ thuật PCR sử dụng các đoạn mồi ngẫu nhiên. Năm 1990, William và Welsh trong những nghiên cứu độc lập đã phát triển chỉ thị ngẫu nhiên RAPD (Random Amplified Polymorphism DNA)- chỉ thị phân tử thế hệ thứ hai, dựa trên kỹ thuật PCR. Trong kỹ thuật RAPD-PCR, đoạn mồi có trình tự ngẫu nhiên (dài 10 nucleotide, tỷ lệ GC tối thiểu 50%) bắt cặp với DNA khuôn tại các vị trí bổ sung và tổng hợp các đoạn DNA sản phẩm có kích thước khác nhau [75]. Kỹ thuật RAPD-PCR dễ thực hiện, chi phí rẻ hơn rất nhiều so với RFLP và chỉ yêu cầu một lượng nhỏ DNA khuôn cho phản ứng PCR. Tuy nhiên, do đặc điểm ngẫu nhiên của mồi RAPD nên kết quả phân tích không ổn định, thường có sự sai khác giữa những lần nghiên cứu cho dù chỉ thay đổi một thông số thí nghiệm. Bên cạnh đó, RAPD là chỉ thị trội nên không thể phát hiện được các cá thể dị hợp tử, do đó khó ứng dụng trong lập bản đồ di truyền [5, 61]. Để khắc phục những nhược điểm trên, nhiều biến thể của chỉ thị RAPD đã được nghiên cứu và phát triển như chỉ thị DAF (DNA Aplification Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 31 Luận văn thạc sỹ công nghệ sinh học Fingerprinting) (Caetano-Anolles,1991), chỉ thị AP-PCR (Arbitrary Primed Polymerase Chain Reaction) (Welsh, McClelland, 1991) [33]. Các chỉ thị này có chiều dài đoạn mồi ngẫu nhiên thay đổi (ngắn đến 5 nucleotide- DAF hoặc dài 10-50 nucleotide- AP-PCR) và được sử dụng trong điều kiện phản ứng khác nhau nhằm ổn định kết quả phản ứng nhân gen (chỉ thị AP-PCR) hoặc tạo ra nhiều đoạn DNA sản phẩm đa hình hơn khi phân tích các cá thể có quan hệ di truyền gần gũi (chỉ thị DAF). Tuy nhiên, do đòi hỏi các điều kiện thí nghiệm khắt khe nên các biến thể của chỉ thị RAPD ít được áp dụng, trong khi chỉ thị RAPD vẫn được sử dụng khá phổ biến, đặc biệt trong nghiên cứu các đối tượng chưa có thông tin trình tự DNA. 1.2.3.3. Chỉ thị DNA dựa trên đa hình các vị trị nhận biết giới hạn RFLP là chỉ thị DNA thế hệ đầu tiên có thể phát hiện tính đa hình DNA giữa các cá thể nhờ các vị trí nhận biết của enzyme giới hạn. Do những hạn chế về mặt kỹ thuật (tốn thời gian, độc hại ) nên ngày nay chỉ thị RFLP ít được sử dụng. Tuy nhiên, phân tích đa hình dựa trên các vị trí giới hạn cho kết quả rất đáng tin cậy và có thể ứng dụng trong xác định đột biến nên cùng với sự ra đời của kỹ thuật PCR, RFLP đã được cải tiến nhằm khắc phục những nhược điểm trên. Năm 1991, William và cs đã cải tiến kỹ thuật RFLP khi sử dụng enzyme giới hạn phân cắt sản phẩm PCR được nhân lên từ DNA hệ gen lúa bởi cặp mồi đặc hiệu và đã ghi nhận được kết quả đa hình DNA giữa các mẫu nghiên cứu [33, 75]. Đến nay, kỹ thuật này được gọi là PCR- RFLP hay còn gọi là CAPS (Cleaved Amplified Polymorphic Sequences). Phân tích đa hình sử dụng chỉ thị CAPS đơn giản, nhanh chóng, chi phí thấp và có thể phân biệt được cá thể dị hợp tử. Tuy nhiên, mức độ đa hình phát hiện được bởi chỉ thị này phụ thuộc vào các vị trí giới hạn cũng như các enzyme giới hạn sử dụng để phân cắt sẳn phẩm PCR. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 32 Luận văn thạc sỹ công nghệ sinh học Một cải tiến khác của chỉ thị RFLP cũng dựa trên kỹ thuật PCR là AFLP (Aplified Polymorphic Length Polymorphism) được Zabeau và cs phát triển năm 1993 [33]. Các bước chính của kỹ thuật AFLP (hình 1.11) bao gồm (i) phân cắt DNA đồng thời bằng hai enzyme giới hạn tạo đầu cắt so le, sau đó gắn với các adapter oligonucleotide có trình tự được thiết kế dựa trên trình tự nhận biết của enzym giới hạn, (ii) Cặp mồi được thiết kế bổ sung với trình tự adapter gắn vào sẽ được sử dụng để nhân đoạn DNA giữa hai vị trí nhận biết giới hạn, (iii) điện di phân tách sản phẩm PCR (hình 1.12) [5, 33]. Ưu điểm của chỉ thị AFLP là sự kết hợp giữa khả năng cho kết quả đa hình cao và ổn định- ưu điểm của kỹ thuật RFLP với độ chính xác và Hình 1.11: Nguyên lý kỹ thuật AFLP nhanh chóng của kỹ thuật PCR. Nhờ đó, chỉ thị AFLP không chỉ được áp dụng trong phân tích đa dạng di truyền mà còn được sử dụng trong xác định nguồn gốc cá thể (xác định bố- mẹ) trong chọn tạo giống (Krauss, 1999) và lập bản đồ gen (Castiglioni, 1998) [33, 61] Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 33 Luận văn thạc sỹ công nghệ sinh học 1.2.3.4. Chỉ thị DNA dựa trên các trình tự lặp Trong hệ gen sinh vật bậc cao, ngoài các đoạn trình tự (gen) mã hóa protein còn có các yếu tố DNA lặp lại, phân bố trên mọi nhiễm sắc thể và có kích thước khác nhau. Tùy thuộc vào sự phân bố trên hệ gen, các yếu tố DNA lặp lại được chia thành hai nhóm: trình tự DNA lặp lại rải rác (ví dụ như các DNA transposon) và trình tự DNA lặp lại nối tiếp có kích thước khác nhau nhau (VNTR-Variable Number of Tandem Repeat) [27, 75]. VNTR bao gồm hàng loạt các đơn vị trình tự (motif) lặp lại nối tiếp nhau và có mặt trên các nhiễm sắc thể (kể cả nhiễm sắc thể giới tính). Các VNTR được phân chia thành các nhóm khác nhau dựa trên chiều dài motif, số lần lặp lại của các motif cũng như vị trí của chúng trên các nhiễm sắc thể [66, 75], bao gồm: (i) DNA vệ tinh (Satellite DNA): năm 1974, khi thí nghiệm ly tâm gradient tỷ trọng nổi DNA tổng số, các nhà khoa học phát hiện các phân đoạn DNA tách riêng biệt và gọi là DNA vệ tinh (Skinner và cs, 1974) [75]. DNA vệ tinh bao gồm số lượng rất lớn các đoạn lặp của một motif (từ 1000 đến hơn 100.000 đoặn lặp), mỗi motif có chiều dài từ hai đến hàng trăm bp, nhưng phổ biến từ 100 đến 300bp. DNA vệ tinh thường tập trung thành nhóm lớn (lên đến 100 triệu bp) ở các vùng dị nhiễm sắc trên nhiễm sắc thể, gồm tâm động và đầu mút (telomer). (ii) Minisatellite: là hệ lặp nối tiếp với mức độ trung bình của các motif có kích thước vừa phải (khoảng 10 đến 60 bp) và thường phân bố ở vùng nhiễm sắc trên nhiễm sắc thể (Jeffrey, 1985) [33]. (iii) Vi vệ tinh- Microsatellite: là các đoạn lặp nối tiếp của các motif có kích thước rất ngắn (từ 1 đến 6 bp) (Litt và Lutty, 1989) [33]. Vi vệ tinh có nhiều motif khác nhau, thường có mức độ lặp lại thấp và biến đổi ở một locus nhất định, chính vì vậy số lượng alen ở mỗi Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 34 Luận văn thạc sỹ công nghệ sinh học locus SSR là rất nhiều. Các vi vệ tinh có thể được tìm thấy khắp nơi, ở vùng mang mã (exon) và không mang mã (intron) trên hệ gen trong nhân và cả hệ gen ngoài nhân (ti thể, lục lạp) (Trojanowska, 2004) [68]. Có nhiều danh pháp khác nhau được dùng để chỉ vi vệ tinh: trình tự lặp đơn giản- SRS (Simple Repetitive Sequences), đoạn lặp trình tự đơn giản- SSR (Simple Sequence Repeats) hay đoạn lặp nối tiếp đơn giản- STR (Simple Tandem Repeat) [5, 61]. Trong ba loại trình tự lặp nêu trên, vi vệ tinh- SSR có số lượng motif rất phong phú, phân tán đều khắp hệ gen và có mức độ đa hình rất cao. Theo Jurka và Pethiyagoda (1995) [75], với bốn loại base A-T-G-C, số lượng các motif SSR trên cấu trúc sợi đôi DNA có thể lên đến 501 loại khác nhau, bao gồm 2 motif một nucleotide (monomeric), 4 motif hai nucleotide (dimeric). 10 motif ba nucleotide (trimeric), 33 motif bốn nucleotide (tetrameric), 102 motif năm nucleotide (pentameric) và 350 motif sáu nucleotide (hexameric). Motif phổ biến nhất ở hệ gen động vật có vú là (A)n và (CA)n trong khi (A)n, (AT)n, (GA)n và (GAA)n là những motif lặp lại phổ biến ở thực vật. Bên cạnh đa dạng về số lượng, sự sắp xếp các motif trong đoạn trình tự lặp cũng góp phần làm phong phú SSR trong hệ gen. Dựa trên mức độ hoàn chỉnh của các motif lặp lại, Weber (1990) đã phân chia các SSR thành ba nhóm khác nhau, bao gồm (1) SSR lặp lại hoàn chỉnh (Perfect repeats), bao gồm một motif lặp lại liên tục không bị ngắt quãng; (2) SSR lặp lại không hoàn chỉnh (Imperfect repeat), chuỗi motif lặp lại bị gián đoạn bởi một hay một vài base không thuộc cấu trúc motif; và (3) SSR lặp lại phức hợp (Compound repeat), là sự kết hợp xen kẽ có/không có quy luật của hơn hai motif khác nhau (hình 1.12) [75]. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 35 Luận văn thạc sỹ công nghệ sinh học Hình 1.12: (A) Ví dụ các SSR lặp hoàn chỉnh cấu thành từ các motif có 1, 2, 3, 4, 5, 6 base. (B) Ví dụ các SSR có cấu trúc lặp lại hoàn chỉnh, lặp lại không hoàn chỉnh và lặp lại phức hợp (SSR của cây đậu xanh (Cicer arietinum)- Huttel và cs, 1999 [30]) Trước đây, DNA lặp được coi là “DNA tạp” bởi chức năng của chúng chưa được tìm ra [68]. Ngày nay, mặc dù vai trò của DNA lặp đối với hệ gen vẫn chưa được làm sáng tỏ nhưng chúng đã trở thành công cụ quan trọng trong nghiên cứu di truyền, đặc biệt là các DNA vi vệ tinh- SSR. Các đặc điểm như phân bố khắp mọi nơi trên hệ gen với tần suất xuất hiện cao (mỗi Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 36 Luận văn thạc sỹ công nghệ sinh học 21,2 kb ở thực vật hai lá mầm và mỗi 64,6 kb ở thực vật 1 lá mầm (Wang và cs, 1994) [57]), có mức độ đa dạng alen ở mỗi locus cao, di truyền đồng trội đã đưa SSR trở thành loại chỉ thị DNA có hiệu quả nhất trong nghiên cứu đa dạng di truyền, lập bản đồ gen Hiện nay, có nhiều loại chỉ thị DNA khác nhau được phát triển dựa trên các trình tự lặp, phổ biến hơn cả là chỉ thị SSR và chỉ thị ISSR. a) Chỉ thị SSR: Chỉ thị SSR là chỉ thị DNA quan trọng và được sử dụng phổ biến trong nghiên cứu đa dạng di truyền, lập bản đồ gen, nhận dạng di truyền, chọn giống phân tử ở lúa (Lưu Thị Ngọc Huyền, 2001; Phạm Thị Thúy, 2006), ngô (Ngô Thị Minh Tâm, 2007), đỗ tương (Lương Thị thu Hương, 2006) [5, 26]. Chỉ thị SSR có hai ưu điểm lớn so với các chỉ thị DNA khác: - Tính đặc hiệu cao: các đoạn mồi SSR được thiết kế dựa trên vùng trình tự sườn có tính bảo thủ cao của các đoạn lặp SSR, do đó sản phẩm nhân gen của phản ứng SSR-PCR đặc hiệu và ổn định hơn các chỉ thị DNA ngẫu nhiên. Bên cạnh đó, nhờ tính chất bảo thủ của vùng trình tự sườn mà các mồi SSR có thể được sử dụng chéo giữa các loài có quan hệ di truyền gần gũi (Roder và cs, 1995; Lã Tuấn Nghĩa, 2004) [5, 54]. - Di truyền đồng trội và mức độ đa hình cao: Trải qua tiến hóa và các biến đổi di truyền, số lần lặp lại các motif SSR thay đổi rất nhiều và làm cho các đoạn SSR có chiều dài khác nhau. Bởi vậy phản ứng SSR- PCR có thể phát hiện các alen khác nhau trong một locus SSR, qua đó phát hiện được các cá thể đồng hợp tử/ dị hợp tử ở locus đó (chỉ thị đồng trội). Ngoài hai ưu điểm chính trên, với tần suất xuất hiện trên hệ gen cao của các trình tự lặp thì số lượng chỉ thị SSR là rất phong phú với mức độ đa hình cao. Dựa trên kỹ thuật PCR và kết hợp với các phương pháp phát hiện khác Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 37 Luận văn thạc sỹ công nghệ sinh học nhau, các phân tích sử dụng chỉ thị SSR rất đơn giản, nhanh chóng, tin cậy và đặc biệt có khả năng tự động hóa cao [5, 26, 40, 57, 68], điều này rất phù hợp với các nghiên cứu di truyền quần thể như đánh giá đa dạng di truyền, lập bản đồ gen, chọn giống phân tử Một số nghiên cứu so sánh, đánh giá ưu nhược điểm của chỉ thị SSR với các loại chỉ thị khác như RFLP, AFLP, RAPD đã khẳng định những ưu điểm của SSR so với các chỉ thị trên (Powell và cs, 1996; Garcia và cs, 2004) [21, 27, 52]. Hình 1.13: Đa hình DNA SSR giữa hai cá thể có motif (AT)n Khác với các chỉ thị ngẫu nhiên (RAPD) hay chỉ thị dựa trên các vị trí giới hạn (RFLP, AFLP), chỉ thị SSR được phát triển dựa trên trình tự DNA đã biết trước của đối tượng nghiên cứu. Quy trình phát triển chỉ thị SSR gồm hai giai đoạn chính là xác định các trình tự lặp trên hệ gen và thiết kế mồi đặc hiệu cho đoạn trình tự đó; đây là quy trình phức tạp, đòi hỏi áp dụng nhiều kỹ thuật-phương pháp khác nhau và đặc biệt có chi phí rất tốn kém [5, 40, 57, 68]. Vì vậy, chỉ thị SSR chỉ thực sự phát huy hiệu quả khi trình tự DNA hệ gen của đối tượng cần nghiên cứu đã được khám phá khá đầy đủ. Theo Brown và cs (1996), có ba hướng chính trong phát triển và thiết kế mồi SSR, bao gồm (i) tìm kiếm trình tự lặp và thiết kế mồi SSR trên cơ sở dữ liệu trình tự Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 38 Luận văn thạc sỹ công nghệ sinh học (ngân hàng cDNA, EST, GeneBank); (ii) áp dụng tính chất bảo thủ của vùng trình tự sườn để áp dụng chéo mồi SSR giữa các đối tượng có quan hệ di truyền gần gũi và (iii) sàng lọc thư viện hệ gen (thư viện BAC, YAC) để phát hiện và thiết kế mồi SSR [40] (hình 1.14). Mỗi hướng nghiên cứu phát triển chỉ thị SSR đã được cải tiến thành nhiều phương pháp khác nhau và được ứng dụng ở một số đối tượng như lúa (Panaud và cs, 1995), khoai tây (Milbourne và cs, 1998) Năm 2001, Scott đã tổng hợp và phân chia các phương pháp này theo nguồn vật liệu ban đầu và đánh giá ưu- nhược điểm của từng phương pháp (bảng 1.2) [57]. Hiện nay, với sự ra đời và phát triển nhanh chóng của các cơ sở dữ liệu di truyền (NCBI, EMB ) đặc biệt là ngân hàng EST thì việc phân lập và phát triển chỉ thị SSR dựa trên cơ sở trình tự sẵn có đã trở thành hướng đi nhanh chóng, đơn giản, ít tốn kém và ngày càng phổ biến [18, 25, 65]. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 39 Luận văn thạc sỹ công nghệ sinh học Hình 1.14: Quy trình phát triển chỉ thị SSR từ thư viện hệ gen: (a) phân cắt DNA hệ gen, (b) gắn vào các vector plasmid, (c) chuyển vào vi khuẩn E. coli và phân chia các khuẩn lạc vào từng vị trí xác định riêng biệt, (d) lai với các mẫu dò có trình tự lặp được thiết kế trước nhằm phát hiện các vector mang trình tự lặp, (e) giải trình tự các vector mang trình tự lặp, (f) thiết kế mồi SSR dựa trên kết quả giải trình tự, (g) thử nghiệm sàng lọc các mồi SSR cho đa hình (Powell, 1996) [40]. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 40 Luận văn thạc sỹ công nghệ sinh học Bảng 1.2: So sánh ưu/nhược điểm của các phương pháp phân lập và phát triển chỉ thị SSR Khả năng Dựa trên Thời Mức độ đa Khả năng phát hiện Độ lệch của độ tin cậy Nguồn phân lập SSR gian/chi phí hình chuyển giao số lượng các motif của các phát triển lớn SSR nghiên cứu trước đó Thư viện hệ gen H H M M L Thư viện hệ gen làm giàu M H M E H (enriched genomic library) Thư viện BAC/ YAC H H M M L M Thư viện cDNA H* M M/H M M M Cơ sở dữ liệu công khai L M/H M/H M M H (GeneBank) Cơ sở dữ liệu EST L M M/H M M H Các loài gần gũi về mặt di Tùy thuộc Tùy thuộc L M D H truyền đối tượng đối tượng Chú thích: E- dễ dàng; L- thấp; M- trung bình; H- cao; D- khó * nếu phải giải trình tự phụ thuộc mức độ sẵn có của trình tự phụ thuộc dữ liệu trình tự trong cơ sở dữ liệu Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 41 Luận văn thạc sỹ công nghệ sinh học b) Chỉ thị ISSR (Inter-Simple Sequence Repeat): ISSR là kỹ thuật dựa trên PCR, nhân bản các đoạn DNA nằm giữa hai vùng lặp SSR hướng ngược chiều nhau sử dụng một loại mồi duy nhất (dài khoảng 15-25 nucleotide) có trình tự lặp giống như SSR. Các mồi ISSR có thể được bổ sung thêm từ một đến bốn nucleotide “neo” ở đầu 3’ (Yang và cs, 1996) hoặc đầu 5’ (Zietkiewicz và cs, 1994) nhằm tăng độ đặc hiệu của phản ứng nhân gen. Hầu hết chỉ thị ISSR là chỉ thị trội và có tính ổn định cao hơn chỉ thị RAPD. Dựa trên các motif lặp và số nucleotide làm “neo” để thiết kế mồi ISSR thì số lượng chỉ thị ISSR gần như là không giới hạn [33, 31]. Chỉ thị ISSR có tính đa hình cao và rất hiệu quả trong nghiên cứu đa dạng di truyền. Bên cạnh SSR và ISSR còn có nhiều chỉ thị khác được phát triển dựa trên các trình tự lặp nhưng không được sử dụng rộng rãi như STMS (Sequence-tagged microsatellite site marker) và DAMD-PCR (Direct Amplification of Minisatellite DNA markers) [33]. 1.2.3.5. Chỉ thị DNA dựa trên trình tự DNA Trong số nhiều dạng đột biến xảy ra tự nhiên trong hệ gen, sự thay đổi một nucleotide (các đột biến điểm hay hiện tượng đa hình nucleotide đơn- SNP Single Nuleotide Polymorphism) là một hiện tượng phổ biến, có số lượng rất lớn và phân bố khắp hệ gen. Về bản chất, khái niệm SNP mô tả những vị trí cặp base trong hệ gen của hai (hay nhiều hơn) cá thể mà tại đó có sự thay đổi trong trình tự, ví dụ SNP có thể thay đổi trình tự DNA từ AAGGCTAA sang ATGGCTAA. SNP có thể xảy ra ở vùng không mang mã hoặc vùng mang mã trên hệ gen, trong đó nhiều SNP không gây ảnh hưởng tới tế bào nhưng cũng có những SNP gây ra những biến đổi không có lợi cho cơ thể [31]. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 42 Luận văn thạc sỹ công nghệ sinh học SNP là chỉ thị rất phù hợp cho nghiên cứu nhận dạng di truyền và đa dạng quần thể bởi có số lượng lớn (mỗi 1000bp hệ gen có một SNP) và có thể áp dụng các phương pháp tự động trong phát hiện và phân tích [49]. SNP được áp dụng rất phổ biến trong nghiên cứu di truyền học ở người (trong chẩn đoán bệnh và nghiên cứu đáp ứng thuốc). Đến nay, SNP đang ngày được sử dụng rộng rãi trong nghiên cứu di truyền thực vật [17, 49]. Bên cạnh SNP, có nhiều loại chỉ thị khác dựa trên trình tự DNA cũng đã được nghiên cứu và ứng dụng trong nghiên cứu đa dạng di truyền và phân loại như chỉ thị đặc hiệu các vùng bảo thủ rDNA, STS [61]. 1.2.3.6. Một số loại chỉ thị DNA khác Phân tử DNA không chỉ khác nhau về trình tự mà còn khác nhau về hình dạng không gian khi DNA ở trạng thái sợi xoắn kép. Hai trình tự DNA chỉ cần có một vị trí nucleotide khác nhau cũng có thể mang hình dạng khác nhau. Bằng phương pháp điện di có thể phát hiện được sự đa hình (về hình dạng) giữa các đoạn DNA này (chỉ thị CSGE- Conformation Sensitive Gel Electrophoresis) [33,75]. Cùng với những thành tựu của công nghệ sinh học, nhiều loại chỉ thị mới đã được phát triển và ứng dụng, làm phong phú hơn những công cụ sử dụng trong nghiên cứu đa dạng di truyền. Với mục tiêu làm sáng tỏ hơn bản chất phân tử trong các nghiên cứu, các chỉ thị mới đi sâu vào phân tích trình tự DNA của các gen cụ thể (chỉ thị STS, EST và DNA microarray ) giúp nghiên cứu đa dạng di truyền chính xác và chi tiết hơn. Tuy nhiên, những chỉ thị này yêu cầu kỹ thuật và chi phí cao hơn so với các loại chỉ thị DNA “thế hệ cũ” (RAPD, SSR, ). Đây chính là điểm cơ bản hạn chế sự phổ biến của những chỉ thị này trong nghiên cứu đa dạng di truyền. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 43 Luận văn thạc sỹ công nghệ sinh học 1.3. THÀNH TỰU TRONG NGHIÊN CỨU ĐA DẠNG DI TRUYỀN CHÈ (Camellia sinensis (L.) O. Kuntze) Chè là loại cây trồng phổ biến và có giá trị xuất khẩu cao, đóng góp đáng kể vào sự phát triển kinh tế ở nhiều quốc gia, đặc biệt là ở châu Á và châu Phi. Trải qua thời gian lâu dài từ khi được con người trồng tới nay, lai tạo giống chè đã trở thành công việc thường xuyên nhằm đáp ứng nhu cầu giống chè tốt cho việc mở rộng canh tác và nâng cao sản lượng. Vì vậy, đến nay đã có nhiều giống chè lai được tạo ra, với số lượng áp đảo hoàn toàn so với các giống hoang dại trước đây. Tuy nhiên, vì mục tiêu hướng tới năng suất, chất lượng nên số lượng các tính trạng được nhắm đến trong quá trình lai tạo bị thu hẹp, bởi vậy giữa các giống chè lai có sự tương đồng di truyền cao hơn hẳn so với các giống hoang dại. Các hoạt động canh tác như thay thế giống truyền thống bằng các giống lai làm mất dần đi nguồn gen hoang dại (có thể mang những tính trạng quý chưa biết đến) là nguồn vật liệu quý cho công tác chọn tạo giống [23]; cao hơn nữa làm mất đi sự đa dạng di truyền của cây chè và có thể ảnh hưởng đến đa dạng sinh học. Chính vì vậy, nghiên cứu đánh giá đa dạng di truyền nhằm bảo tồn các giống chè quý và hỗ trợ công tác chọn tạo giống là yêu cầu rất cấp thiết 1.3.1. Nghiên cứu đa dạng di truyền chè bằng chỉ thị hình thái Chỉ thị hình thái là công cụ đầu tiên được sử dụng để phân loại các giống chè [47, 80]. Các đặc điểm như kích thước cây, lá; màu sắc của lá non, lá trưởng thành; hình dáng hoa, quả đã được sử dụng để phân loại các giống chè (Barua, 1963; Bezbaruah, 1971) [47]. Kết quả cho thấy chè được chia thành ba giống chính là giống chè Assam (lá to), chè Trung Quốc (lá nhỏ) và chè Cambod (lá nhỡ). Bên cạnh đó, các chỉ tiêu về kích thước, sắc tố, thế lá của lá chè cũng được coi là những tiêu chuẩn trong đánh giá năng suất và chất Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 44 Luận văn thạc sỹ công nghệ sinh học lượng chè (Wight và Barua, 1954; Banerjee, 1992) [46, 47]. Chính vì vậy, mặc dù chỉ thị hình thái không phản ánh đầy đủ bản chất di truyền và chịu tác động của điều kiện ngoại cảnh nhưng hiện nay vẫn được sử dụng khá phổ biến trong phân loại và nhất là đánh giá chọn lựa các tổ hợp lai trong công tác chọn tạo giống chè. Năm 1997, Viện tài nguyên di truyền thực vật quốc tế (IPGRI) đã công bố tiêu chuẩn đánh giá đặc điểm hình thái chè [32]. Dựa theo tiêu chuẩn này, một số nghiên cứu đánh giá đa dạng di truyền các giống chè bằng chỉ thị hình thái đã được thực hiện. Chen và cs (2005) đã sử dụng 33 chỉ tiêu hình thái để đánh giá sự đa dạng di truyền của 87 giống chè ở tỉnh Vân Nam- Trung Quốc. Kết quả cho thấy sự đa dạng rất cao giữa các giống chè, đặc biệt các đặc điểm của lá và hoa cho thấy sự đa dạng cao hơn so với các chỉ tiêu khác [13]. Trong các nghiên cứu khác nhau đối với các giống chè ở Srilanka, Gunasekare (2006) và Piyasundara (2006) đã ghi nhận được sự tương đồng lớn của các giống chè lai trong phân tích phân nhóm di truyền [22, 50]. Ở Việt Nam, đặc điểm hình thái được sử dụng phổ biến trong đánh giá các giống chè và đóng vai trò quan trọng trong công tác chọn lọc và lai tạo giống chè. Tuy nhiên, các đánh giá này chỉ mang tính chất thống kê và được thực hiện ở quy mô nhỏ với số lượng giống chè không nhiều [72]. 1.3.2. Nghiên cứu da đạng di truyền chè bằng chỉ thị hóa sinh Lá chè, cũng giống như các loài thực vật khác, chứa toàn bộ các thành phần sinh hóa là sản phẩm của hoạt động trao đổi chất như các carbonhydrate, protein, lipid Tuy nhiên, không giống với phần lớn các loài thực vật khác, trong lá chè có chứa hàm lượng đáng kể các methylxathine và polyphenol, là hai thành phần mang lại hương vị đặc trưng cho chè [11]. Từ lâu, các thành phần sinh hóa đã được sử dụng như là chỉ thị trong phân loại và đánh giá đa Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 45 Luận văn thạc sỹ công nghệ sinh học dạng di truyền chè. Chen và cs (2005) đã sử dụng thành phần caffein, polyphenol và các amino acid tự do làm chỉ thị để phân loại các giống chè Vân Nam- Trung Quốc [13]. Trước đó, Takeo (1983) đã đề xuất phương pháp phân loại các giống chè sử dụng thành phần terpene làm tiêu chí để phân biệt [73]. Djemukhatze (1961-1976) đã nghiên cứu sự đa dạng các giống chè ở miền Bắc Việt Nam thông qua thành phần catechin có trong lá chè, qua đó đưa ra nhận xét miền Bắc Việt Nam là nơi khởi nguồn của cây chè [1, 6]. Cho đến nay, các nghiên cứu đa dạng di truyền thông qua chỉ thị hóa sinh của chè ở Việt Nam còn khá ít và với quy mô nhỏ [8]. Bên cạnh các sản phẩm trao đổi chất, các isozyme và allozyme cũng là chỉ thị được sử dụng khá phổ biến trong nghiên cứu đa dạng di truyền chè. Các isozyme chủ yếu được sử dụng làm chỉ thị là polyphenol oxidase, 5- dehydroshikimate reductase, phenylalanine ammonia lyase và peroxidase (Sen và cs, 2000; Chen và cs, 2005) [11, 73]. Kết quả các nghiên cứu cho thấy phân nhóm di truyền dựa trên isozyme phân biệt khá rõ ràng các giống chè lai và giống tự nhiên. Tuy nhiên, do số lượng các chỉ thị isozyme có giới hạn và phần lớn chịu tác động của điều kiện ngoại cảnh nên có thể không phản ánh đúng sự khác biệt di truyền và ảnh hưởng đến tính chính xác của các nghiên cứu [74]. Chính vì vậy, với những thành tựu của sinh học phân tử, nghiên cứu đa dạng di truyền chè đã dần hướng tới sử dụng chỉ thị DNA như là sự lựa chọn tối ưu. 1.3.3. Nghiên cứu đa dạng di truyền chè bằng chỉ thị DNA Trong những năm gần đây, sự phát triển của sinh học phân tử đã đạt được nhiều thành tựu mà sự phong phú của các chỉ thị DNA chỉ là một trong số đó. Chỉ thị DNA đã được ứng dụng rất hiệu quả trong nghiên cứu di truyền thực vật mà phân tích đa dạng di truyền và chọn giống phân tử (MAS- Marker Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 46 Luận văn thạc sỹ công nghệ sinh học Assisted Selection) là hai lĩnh vực thành công nhất. Đối với cây chè, lai tạo truyền thống- tốn thời gian, hiệu quả không cao- hiện nay vẫn là phương thức phổ biến. Để nâng cao hiệu quả của công tác này thì việc ứng dụng công nghệ chỉ thị DNA là con đường duy nhất [23]. Các nghiên cứu đa dạng di truyền chè sử dụng chỉ thị DNA đã được tiến hành từ giữa những năm 1990, với các chỉ thị DNA từ thế hệ đầu như RFLP, đến các chỉ thị AFLP, ISSR , nhưng được sử dụng phổ biến nhất vẫn là chỉ thị RAPD [23, 46, 47]. Chỉ thị RFLP đã được sử dụng trong phân tích quan hệ di truyền giữa các giống cây trồng và họ hàng hoang dại của chúng từ năm 1989 (Tanksley và cs) [73]. Ở cây chè, ít có những báo cáo về sử dụng chỉ thị RFLP trong nghiên cứu đa dạng di truyền. Phần lớn các nghiên cứu sử dụng RFLP đến nay đều được thực hiện ở Nhật Bản (Matsumoto và cs, 2002, 2004) [45, 47]. Bằng các mẫu dò cDNA của gen mã hóa phenylalanine ammonia lyase (PAL)- loại enzym tham gia tổng hợp catechin và tanin tạo hương vị cho chè, tác giả đã phân nhóm các giống chè thuộc giống chè Trung Quốc (C. sinensis var. sinensis), bên cạnh đó mẫu dò PAL còn được sử dụng trong kỹ thuật PAL/RFLP nhằm xác định các giống chè cao cấp và cấp thấp trước khi đưa vào trồng sản xuất ở Nhật Bản [45]. Với ưu điểm đơn giản, nhanh chóng, chi phí thấp và nhất là không yêu cầu biết trước trình tự DNA, RAPD là chỉ thị DNA được sử dụng phổ biến nhất trong nghiên cứu đa dạng di truyền chè (Wachira, 1995, 1997; Hackett, 2000; Lai, 2001; Kaundun, 2002; Mishra, 2004; Nguyễn Hữu La, 2004; Chen, 2005; Wen, 2008 ). Kết quả của các nghiên cứu cho thấy tính đa dạng rất cao giữa các giống chè tự nhiên (hệ số tương đồng dao động trong khoảng 0.3 đến 0,7), và khẳng định việc sử dụng chỉ thị RAPD có thể nhận dạng di truyền và phân loại các giống chè vào ba thứ chè chính là Assam, Trung Quốc và Cambod- tương ứng với kết quả có được khi sử dụng chỉ thị hình thái, Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 47 Luận văn thạc sỹ công nghệ sinh học nhưng chi tiết hơn. Do có nhược điểm kém ổn định nên một số nghiên cứu đã kết hợp chỉ thị RAPD với một số chỉ thị khác như AFLP (Hackett, 2000; Mishra, 2004), ISSR (Lai, 2001) nhằm nâng cao độ tin cậy của kết quả [24, 38, 42]. Trong một nghiên cứu sâu hơn, Ota và Tanaka (2000) đã sử dụng chỉ thị RAPD để xây dựng bản đồ liên kết di truyền sơ bộ của hai giống chè Sayamakaori và Kana-Chk17 [64]. Cũng trong thời gian này, Hackett và cs (2000) đã sử dụng chỉ thị RAPD kết hợp với chỉ thị AFLP xây dựng bản đồ liên kết di truyền quần thể F1 của hai giống Assam và Trung Quốc [24]. Đây là những bản đồ liên kết di truyền đầu tiên ở cây chè, đánh dấu mốc mới trong nghiên cứu di truyền chè. AFLP là chỉ thị DNA ổn định và mức độ đa hình cao hơn so với chỉ thị RAPD. Do vậy chỉ thị AFLP thường được sử dụng trong nghiên cứu di truyền các đối tượng có quan hệ di truyền gần gũi [26]. Chỉ thị AFLP lần đầu tiên được áp dụng với cây chè bởi Paul và cs (1997). Kết quả nghiên cứu với 32 dòng chè Kenya cho thấy sự phân nhóm của ba thứ chè Assam, Trung Quốc và Cambod, trong đó quần thể chè Trung Quốc có mức độ đa dạng di truyền cao hơn cả. Các nghiên cứu sau này của Lee (2003) và Mishra (2004, 2009) [39, 41, 42] cũng cho kết quả tương tự ISSR là chỉ thị DNA ngẫu nhiên dựa trên trình tự lặp có độ ổn định và tính đa hình cao [31, 33]. Năm 2001, Lai và cs đã sử dụng 20 chỉ thị ISSR nghiên cứu sự đa dạng di truyền giữa các giống chè bản địa Đài Loan với các giống chè Assam và Trung Quốc khác. Kết quả phân nhóm di truyền cho thấy các giống chè bản địa có đặc điểm di truyền gần gũi với giống chè Assam hơn là các giống chè Trung Quốc, bên cạnh đó các giống chè tự nhiên cũng có mức độ đa dạng di truyền cao hơn các giống chè lai [38]. Nghiên cứu sau đó Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 48 Luận văn thạc sỹ công nghệ sinh học của Devarumath (2002) với các giống chè Assam, chè Trung Quốc và chè Cambod thể tam bội cũng cho kết quả tương tự [19]. Gần đây nhất, Yao và cs (2008) đã sử dụng chỉ thị ISSR nghiên cứu đa dạng di truyền 48 giống chè có nguồn gốc từ Trung Quốc, Nhật Bản, Kenya và ứng dụng trong phân tích quan hệ di truyền các cây chè lai (xác định bố mẹ), hỗ trợ công tác lai tạo giống chè [77]. Dựa trên trình tự lặp, Kaundun và cs (2002) đã sử dụng cặp mồi đặc hiệu cho DNA lục lạp và đã phát hiện sự đa hình giữa các trình tự lặp trên DNA lục lạp của các giống chè Assam và chè Trung Quốc. Mặc dù mức độ đa hình của trình tự lặp trên DNA lục lạp thấp hơn so với DNA nhân nhưng lại rất có ý nghĩa trong phân tích di truyền các tính trạng mã hóa bởi gen ngoài nhân [34]. Trước đó, năm 2001 Sigh và cs đã phát hiện hai trình tự lặp có kích thước 300 và 325 bp với 2 motif lặp trên các gen 5S rDNA- là các gen có mức độ bảo toàn cao và được sử dụng trong phân tích xác định nguồn gốc sinh vật [59]. Đến năm 2006, tiếp tục nghiên cứu của mình, Sigh đã sử dụng các trình tự lặp trên 5S rDNA để nhận dạng và phân tích đa dạng di truyền các giống chè ở Ấn Độ. Kết quả khẳng định trình tự lặp trên các gen 5S rDNA là chỉ thị phân tử giúp phân biệt các giống chè Trung Quốc với các giống chè Assam và Cambod với kết quả phân nhóm di truyền rất rõ ràng [60]. Cũng dựa trên các trình tự lặp, SSR là chỉ thị DNA phổ biến trong nghiên cứu đa dạng di truyền. Tuy nhiên cho tới nay, chỉ có một vài nghiên cứu sử dụng chỉ thị SSR với cây chè được công bố (Kaundun, 2002; Vo Thai Dan, 2006; Ujihara, 2009) [34, 70, 73]. Thư viện EST, cDNA của chè còn chưa phong phú, trong khi các phương pháp phát triển mồi SSR thông qua sàng lọc thư viện BAC, YAC được làm giàu trình tự lặp lại tốn kém công sức, thời gian và tiền bạc là những nguyên nhân chính giải thích cho việc còn có quá ít mồi SSR được phát triển cho cây chè. Khi chưa có các chỉ thị SSR đặc Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 49 Luận văn thạc sỹ công nghệ sinh học hiệu cho chè, giải pháp được tính đến là sử dụng các cặp mồi SSR từ các loài cùng chi Camellia. Kaundun và cs (2002) đã áp dụng phương pháp này khi sử dụng các mồi SSR của cây chè hoa Camellia japonica để nghiên cứu đa dạng di truyền 24 giống chè Assam và Trung Quốc [34]. Ujihara và cs (2009) cũng sử dụng một số cặp mồi SSR thiết kế cho cây chè hoa để nhận dạng di truyền các giống chè bản địa, phục vụ yêu cầu dán nhãn các sản phẩm chè lưu hành trên thị trường Nhật Bản [70]. Đến năm 2004, những mồi SSR đặc hiệu cho chè đầu tiên đã được phát triển bằng phương pháp sàng lọc thư viện cDNA đã làm giàu trình tự lặp (Freeman và cs, 2004) [20]. Gần đây nhất, Sharma và cs (2009) bằng phương pháp sàng lọc in silico thư viện EST chè đã xây dựng bộ 96 cặp mồi SSR, trong đó qua kiểm tra trên 34 giống chè đã xác định 61 cặp mồi SSR cho đa hình và có thể sử dụng trong nghiên cứu đa dạng di truyền [58]. Ở Việt Nam, chỉ thị DNA đã được ứng dụng rộng rãi trong phân tích đa dạng di truyền động-thực vật và vi sinh vật, tuy nhiên với cây chè các nghiên cứu còn rất hạn chế. Đến nay chỉ có một số nghiên cứu đa dạng di truyền chè bằng chỉ thị RAPD nhưng mới chỉ trên quy mô nhỏ, mang tính chất thăm dò. Nguyễn Hữu La và cs (2004) đã sử dụng 10 mồi RAPD trong nghiên cứu đánh giá đa dạng di truyền một số giống chè Shan ở Phú Hộ, Phú Thọ [3]. Sau đó, 38 giống/dòng chè triển vọng trong tập đoàn giống chè miền Bắc Việt Nam được phân tích phân nhóm di truyền bằng 12 chỉ thị RAPD (Trần Đức Trung, 2009) [7]. Mặc dù quy mô các nghiên cứu trên còn hạn chế nhưng kết quả thu được phù hợp với các công bố trước đó và là cơ sở di truyền ban đầu cho công tác chọn tạo giống chè ở Việt Nam. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 50 Luận văn thạc sỹ công nghệ sinh học Chương 2: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1. VẬT LIỆU NGHIÊN CỨU Qua đánh giá sơ bộ nguồn gốc và tiềm năng sử dụng trong chọn tạo giống chè, 96 trong số hơn 150 giống/ dòng chè đang được trồng tại vườn bảo tồn quỹ gen chè- Viện Khoa học Kỹ thuật Nông-Lâm nghiệp miền núi phía Bắc (NOMAFSI) được lựa chọn cho nghiên cứu này (bảng 2.1) Bảng 2.1: Danh sách 96 giống/dòng chè thu thập từ NOMAFSI ST ST Tên giống Nguồn gốc Tên giống Nguồn gốc T T 1 ACT 49 Ấn Độ 49 Yamanoyburi Nhật Bản 2 ACT 63 Ấn Độ 50 Okumiori Nhật Bản 3 Assam Ấn Độ 51 1A Phú Thọ 4 Dajelling 1 Ấn Độ 52 5A Phú Thọ 5 Manipur dangri Ấn Độ 53 F16 Phú Thọ 6 Manipur messai Ấn Độ 54 F35 Phú Thọ 7 Swinglaybari Ấn Độ 55 LCT Phú Thọ 8 Dòng 27 Đài Loan 56 LDP2 Phú Thọ 9 Dòng 29 Đài Loan 57 PH1 Phú Thọ 10 Kim Huyền Đài Loan 58 PHT Phú Thọ 11 Ngọc Thúy Đài Loan 59 S28 Phú Thọ 12 Ô long Thanh Tâm Đài Loan 60 Trung du Thanh Đức Phú Thọ 13 Gruizia 16 Gruizia 61 Trung du tím Phú Thọ 14 Gruizia 1962 Gruizia 62 Trung du vàng Phú Thọ 15 Gruizia 2 Gruizia 63 Trung du xanh Phú Thọ 16 Gruizia 4 Gruizia 64 Trung du xanh hỗn hợp Phú Thọ 17 Gruizia 5 Gruizia 65 Bản Xen 2 Quảng Ninh 18 Gruizia 8 Gruizia 66 Mộc Châu Sơn La 19 Kon khit da Gruizia 67 CIN 143 Srilanka 20 Nhật Bản lá nhỏ Gruizia 68 TRI2023 Srilanka 21 Tham Vè Hà Giang 69 TRI2025 Srilanka 22 Chất Tiền Hà Giang 70 TRI2043 Srilanka 23 Cù Dề Phùng Hà Giang 71 TRI777 Srilanka 24 Gia Vài Hà Giang 72 Đại Bạch Trà Trung Quốc Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 51 Luận văn thạc sỹ công nghệ sinh học ST ST Tên giống Nguồn gốc Tên giống Nguồn gốc T T 25 Lũng Phìn Hà Giang 73 Hồ Nam 2 Trung Quốc 26 Nâm Ngặt Hà Giang 74 Hùng Đỉnh Bạch Trung Quốc 27 Nậm Ty Hà Giang 75 Keo Am Tích Trung Quốc 28 Hàn Quốc 3 Hàn Quốc 76 Kỳ Môn Trung Quốc 29 Hàn Quốc 1 Hàn Quốc 77 Phúc An 1 Trung Quốc 30 Hàn Quốc 2 Hàn Quốc 78 Phúc Đỉnh 1 Trung Quốc 31 B’Lao cũ Lâm Đồng 79 Phúc Đỉnh 2 Trung Quốc 32 Minh Rông 1 Lâm Đồng 80 Phúc Đỉnh 3 Trung Quốc 33 Minh Rông 3 Lâm Đồng 81 Phúc Vân 10 Trung Quốc 34 TB14 Lâm Đồng 82 Phúc Vân Tiên Trung Quốc 35 Shan Tân Chi Lạng Sơn 83 PT 95 Trung Quốc 36 Tô Hiệu Lạng Sơn 84 Quảng Tây Trung Quốc 37 Macomen Lào 85 Thiết Bảo Trà Trung Quốc 38 Pousang Lào 86 Triết Giang 1 Trung Quốc 39 Jetinga Miến Điện 87 Triết Giang 2 Trung Quốc 40 Hoc Môn Nam Bộ 88 Triết Giang 3 Trung Quốc 41 Kanayamidory Nhật Bản 89 Triết Giang 4 Trung Quốc 42 Meriyoku Nhật Bản 90 Triết Giang 5 Trung Quốc 43 Midori Nhật Bản 91 Trung Quốc lá nhỏ Trung Quốc 44 Okuhikari Nhật Bản 92 Hương Tích Sơn (số 1) Trung Quốc 45 Okumidi Nhật Bản 93 Quế Lục Trung Quốc 46 Okuyutaka Nhật Bản 94 Vân Nam 1 Trung Quốc 47 Saemidory Nhật Bản 95 Suối Giàng Yên Bái 48 Sayamakaori Nhật Bản 96 Shan Tuyết Mộc Châu Mộc Châu Dựa trên nguồn gốc xuất xứ, 96 giống/dòng được chia thành 9 quần thể để đánh giá sự đa dạng di truyền giữa các quần thể chè (bảng 2.2) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 52 Luận văn thạc sỹ công nghệ sinh học Bảng 2.2 : 9 quần thể chè nghiên cứu Số STT Quần thể chè lượng Phân loại thực vật theo vùng địa lý cá thể 1 Ấn Độ (IND) 7 Thứ chè Assam điển hình Vùng địa lý giao thoa của hai thứ chè 2 Đài Loan (TAW) 5 Assam và Trung Quốc 3 Gruizia (GRU) 8 Chè không phải cây bản địa 4 Hàn Quốc (KOR) 3 Du nhập từ Trung Quốc Lào- Myanmar Vùng địa lý giao thoa của hai thứ chè 5 3 (LAO) Assam và Trung Quốc 6 Nhật Bản (JPN) 10 Du nhập từ Trung Quốc Chè không phải cây bản địa, chủ yếu 7 Srilanka (SRI) 5 du nhập được từ Ấn Độ 8 Trung Quốc (CHN) 23 Có cả chè Trung Quốc và chè Assam Vùng địa lý giao thoa của hai thứ chè 9 Việt Nam (VIE) 32 Assam và Trung Quốc Để nhận dạng và phân tích đa dạng di truyền các giống chè, 21 cặp mồi SSR đã được sử dụng. Các mồi SSR được lựa chọn bao gồm 13 cặp mồi SSR thiết kế đặc hiệu cho cây chè Camellia sinensis được thiết kế bởi Freeman và cs (2004) [20] và 8 cặp mồi thiết kế cho cây chè hoa Camellia japonica (Ueno và cs, 1999) [69] (bảng 2.3). Thiết bị và hóa chất sử dụng trong nghiên cứu được liệt kê ở phụ lục 1. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 53 Luận văn thạc sỹ công nghệ sinh học Bảng 2.3: Danh sách các cặp mồi SSR sử dụng trong nghiên cứu Kích T Số STT Locus Trình tự (5’-3’) Motif lặp Mã truy nhập* thước a (°C) alen (bp) (f) GAATCAGGACATTATAGGAATTAA SSR1 CamsinM1 (GT) AJ621786 280-300 50 9 (r) GGCCGAATGTTGTCTTTTGT 16 (f) CCTCTGGTGGTCCTACACCT SSR2 CamsinM2 (GT) AJ621787 240-260 55 10 (r) AAAGCCTTGATGCCTTTCG 17 (f) GGTGTGGTGTTTTGAAGAAA SSR3 CamsinM3 (CA) AJ621788 190-210 65 8 (r) TGTTAAGCCGCTTCAATGC 18 (f) ACATTCAAGCANTCCACATATGTGAAA SSR4 CamsinM4 (GA) AJ621789 358-370 60 5 (r) CCTGNTGCAGGACTGTCTATAGATGA 19 (f) AAACTTCAACAACCAGCTCTGGTA SSR5 CamsinM5 (GT) (GA) AJ621790 170-205 60 10 (r) ATTATAGGATGCAAACAGGCATGA 15 8 (f) TGTTTTCTTAGGGTTGGATAAAGG SSR6 CamsinM6 (TG) (T) AJ621791 280-300 55 11 (r) TTTTGTTGTAATGACGAAAATTC 12 15 (f) TGGTAAGGGTCCTAAGAGGTACAC SSR7 CamsinM7 (GT) AJ621792 210-235 55 10 (r) TTCCAATCTTTTTCTATAACATCTGC 16 (f) CCATCATTGGCCATTACTACAA SSR8 CamsinM8 (CA) (TA) AJ621793 154-170 65 10 (r) CCATATGTGTGTGAATGATAAAACC 17 5 (f) CTCATGGAGTCCAAGGAAGC SSR9 CamsinM9 (CT) (CA) AJ621794 170-205 55 7 (r) AAAGCAGTCTGGAACCTTGC 15 12 (f) TTACATCTCTTTTGCAGCTGTCGG SSR10 CamsinM10 (GT) AJ621795 170-195 65 8 (r) CTTCGGGAACTTCTGCTTCATC 16 (f) GCATCATTCCACCACTCACC SSR11 CamsinM11 (CA) AJ621796 82-160 65 9 (r) GTCATCAAACCAGTGGCTCA 12 (f) CATTATCGTCACTTGCAAAGAGGT SSR12 CamsinM12 (GT) (GA) AJ621797 135-190 65 12 (r) CGAGAAGAAGAGCTCTATTGGTT 12 18 (f) CACATTGTGGCGTGTTATTAATTT SSR13 CamsinM13 (TG) AJ621798 160-246 60 13 (r) ACATTGGCTATCTCTCATCATGG 13 Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 54 Luận văn thạc sỹ công nghệ sinh học Bảng 2.3: Danh sách các cặp mồi SSR sử dụng trong nghiên cứu (tiếp theo) Các cặp mồi SSR đặc hiệu cho Camellia japonica Kích T Số STT Locus Trình tự (5’-3’) Motif lặp Mã truy nhập* a thước (°C) alen (f) GGGAAGGTGCATAAAATACT SSR14 MScjaF25 (CA) (AAAAAT) AB016189 221-254 46 12 (r) TGCGACCTAAGATTACTAAA 8 4 (f) GCTGAGCTTGGAGATTTTGTT SSR15 MSCjaH38 (GA) AB016190 348-378 55 12 (r) CCTATTGCCTACGACCATTTC 14 (f) CGAGCCTTCCTTTTCCCATTC SSR16 MSCjaF37 (AG) (GAA) AB016191 335-367 60 9 (r) CGCTCGACGTAATGCCACACT 13 7 (f) CATCGTCCTAATCCACTTCAC SSR17 MSCjaH46 (GA) AB016192 444-464 60 11 (r) AGGGAGCATTATGAGTCGTCT 16 (f) TTAAGCAAAGAAGTCGCG (CA) (AAA) (AAA SSR18 MSCjaF25 4 1 na 155 50 na (r) CTAAAATCTCCACTCAGCT T)3(AAAAAT)3 (f) TATTGCCTACGACCATTTCCA SSR19 MSCjaH38 (GA) na 207 60 na (r) TTTGAGTTCGTTGCCTTCTCT 14 (f) ACTCAACTCAACTGTGCGATC (AG) (GGA) (GA SSR20 MSCjaF37 12 1 na 134 60 na (r) ACAGTGAAGAAAGTAGGGTCG A)7(GAC)1(GAA)1 (f) AAGAAGAGCAGAGCAACAAGTG SSR21 MSCjaH46 (r) CCACACACTTTCCACACTTTTG (GA)13 na 198 60 na Ghi chú: (f) mồi xuôi; (r) mồi ngược; na: không có thông tin * Mã số truy nhập trình tự trên GeneBank Thông số theo công bố của tác giả Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 55 Luận văn thạc sỹ công nghệ sinh học 2.2. PHƯƠNG PHÁP NGHIÊN CỨU 2.1.1. Đánh giá đặc điểm hình thái chè Dựa trên tài liệu hướng dẫn đánh giá đặc điểm hình thái chè của IPGRI năm 1997 [32], 12 tiêu chí liên quan đến khả năng đánh giá năng suất- chất lượng chè đã được lựa chọn để đánh giá đặc điểm hình thái của 96 giống dòng chè tại vườn bảo tồn nguồn gen chè, NOMAFSI (bảng 2.4). Các phép đo và đánh giá được thực hiện năm lần rồi lấy giá trị trung bình, dữ liệu kiểu hình được số hóa và xử lý bởi phần mềm Excel 2007. 2.1.2. Thu thập mẫu lá chè Các mẫu lá chè non sạch, không bị sâu bệnh được thu hái ngay tại vườn theo nguyên tắc chọn phần búp non có 1-2 lá bánh tẻ (một tôm hai lá). Mẫu lá được vệ sinh sạch, lau khô và ngâm trực tiếp trong nitơ lỏng đến khi đưa về bảo quản ở điều kiện -24C°C tại phòng thí nghiệm. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 56 Luận văn thạc sỹ công nghệ sinh học Bảng 2.4: 12 đặc điểm hình thái được sử dụng để đánh giá các giống/dòng chè. Chỉ tiêu Điểm đánh giá STT đánh giá 1 2 3 4 5 7 99 Đặc điểm thân 1 Dạng thân thân gỗ thân bán gỗ thân bụi 2 Loại thân đơn thân đa thân Đặc điểm lá 3 Màu lá non vàng xanh đậm khác Màu lá trưởng 4 xanh nhạt xanh xanh xám vàng xám xanh vàng khác thành 5 Hình dạng lá hình trứng hình thuôn hình elip hình lưỡi mác khác 6 Bề mặt lá nhẵn, trơn gồ ghề khác răng cưa 7 Mép lá trơn gợn sóng răng cưa nhỏ răng cưa lớn không đều 8 Dài lá (cm) 9 Rộng lá (cm) Kích thước lá trung bình 10 nhỏ ( 10/7) khác (dài/ rộng) (5-10/3-7) 11 Lông tơ trên lá thưa trung bình dày xiên (35°- ngang 12 Tư thế lá (°) thẳng (>35°) rủ (>90°) 75°) (76°-90°) Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 57 Luận văn thạc sỹ công nghệ sinh học 2.1.3. Trích ly DNA tổng số từ mẫu lá chè Trích ly DNA thực vật bằng dung dịch đệm chứa CTAB là phương pháp được sử dụng phổ biến trong nghiên cứu di truyền thực vật. Dựa trên quy trình chuẩn của Saghai và Maroof (1994), nhiều quy trình trích ly DNA khác nhau đã được xây dựng nhằm thu được kết quả tối ưu cho từng đối tượng thực vật. Trong nghiên cứu này, quy trình trích ly DNA từ thực vật chứa nhiều polysaccharide và polyphenol của Porebski (1997) đã được sử dụng làm cơ sở xây dựng quy trình trích ly DNA tổng số phù hợp cho cây chè [51]: (i) Nghiền khoảng 3 g lá chè trong nito lỏng thành dạng bột mịn, sau đó chuyển sang ống Falcon 50 ml. Thêm 10 ml đệm trích ly (đã được ủ sẵn ở nhiệt độ 60°C), trộn đều và ủ khoảng 30- 45 phút ở 60°C trong bể lắc nhiệt. (ii) Sau khi ủ, để dung dịch nguội tự nhiên ở nhiệt độ phòng (khoảng 10 phút), thêm 10 ml dung dịch Chloroform: Isoamylalcohol (24:1), trộn đều bằng cách đảo ống nhẹ nhàng đến khi dung dịch trong ống chuyển sang dạng sữa. (iii) Ly tâm 5000 vòng/ phút trong 15 phút ở nhiệt độ thường. (iv) Hút chuyển dung dịch ở pha trên sang ống Falcon mới (tránh hút lớp cặn hoặc dung dịch pha dưới, lặp lại bước (ii)- (iii) nếu dung dịch vẫn bị lẫn tạp). Thêm một thể tích tương ứng Propanol lạnh (-20°C), lắc nhẹ và giữ ở -20°C trong 30 phút. (v) Ly tâm 10.000 vòng/ phút trong 10 phút. (vi) Loại bỏ dung dịch trong ống, rửa kết tủa bằng Ethanol 70%. Để khô kết tủa ở nhiệt độ phòng (khoảng 1 giờ). Hòa tan kết tủa trong 500 µl TE (ở 4°C, qua đêm) sau đó chuyển sang ống Eppendorf 2 ml. Thêm 2 µl Rnase A (10 mg/ml) và ủ ở 37°C trong khoảng 1giờ. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 58 Luận văn thạc sỹ công nghệ sinh học (vii) Thêm 1ml dung Chloroform: Isoamylalcohol (24:1), lắc nhẹ cho dung dịch trộn đều và ly tâm ở 12.000 vòng/ phút trong 15 phút. (viii) Cẩn thận hút phần dung dịch pha trên sang ống Eppendorf 2 ml mới (lặp lại bước (vii)- (viii) nếu dung dịch bị hút lẫn). Thêm 2 lần thể tích Ethanol lạnh (-20°C) và 1/10 thể tích Natri acetat 3M, lắc nhẹ nhàng và giữ ở -20°C trong ít nhất 6 giờ. (ix) Ly tâm ở 12.000 vòng/phút trong 10 phút, loại bỏ dung dịch trong ống và rửa kết tủa bằng Ethanol 70% (2 lần). Để khô kết tủa ở nhiệt độ phòng trong khoảng 1 giờ. (x) Hòa tan kết tủa trong 100 đến 200 µl TE, sau đó bảo quản dung dịch DNA tổng số ở 4°C (sử dụng ngay) hoặc -20°C (bảo quản lâu dài). Các mẫu DNA tổng số chè cùng với DNA nồng độ chuẩn (λDNA 25 ng/µl) được điện di kiểm tra trên gel agarose 1% sau đó nhuộm trong dung dịch EthBr 0,5ng/ml và scan trên máy Molecular Imager FX (BioRad Laboratories). Độ tinh sạch, nguyên vẹn của DNA được đánh giá qua hình ảnh điện di, nồng độ các mẫu DNA được xác định thông qua phương pháp so sánh cường độ quang bằng phần mềm QuantityOne (BioRad Laboratories) giữa các băng điện di mẫu DNA chè và λDNA. 2.1.4. Nhận dạng di truyền các giống chè bằng chỉ thị SSR 96 giống/ dòng chè được nhận dạng di truyền bằng 21 chỉ thị SSR. Các thành phần phản ứng SSR-PCR được chuẩn bị và chia vào các ống Eppendorf 0,2 ml. Tổng thể tích mỗi phản ứng PCR là 20 µl, với nồng độ các thành phần được thể hiện ở bảng 2.5. Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội
- 59 Luận văn thạc sỹ công nghệ sinh học Bảng 2.5: Thành phẩn phản ứng SSR-PCR Thể tích cho 1 Thành phần Nồng độ phản ứng (µl) Đệm PCR 10X 1X 2 Hỗn hợp dNTPs (2,5 mM mỗi loại) 0,2 mM 1,6 MgCl2 (25 mM) 2,0 mM 1,6 Mồi xuôi (20 pmol/µl) 1 pmol/µl 1 Mồi ngược (20 pmol/µl) 1 pmol/µl 1 Taq DNA polymerase (5 U/µl) 1 U/20µl 0,15 BSA (10 mg/ml) 5 µg/µl 1 DNA khuôn (25 ng/µl) 1 dH2O 10,65 Tổng thể tích 20 Phản ứng SSR-PCR được tiến hành trên máy PCR AB Vertity theo chu trình nhiệt sau: 95°C 3 phút 94°C 1phút Ta 1 phút 30 chu kỳ 72°C 1 phút 30 giây 72°C 15 phút 4°C ∞ Nhiệt độ gắn mồi Ta cho từng cặp mồi SSR được thống kê ở bảng 3.3. Để nhận dạng di truyền các giống/dòng chè, sản phẩm SSR-PCR sẽ được điện di trên gel polyacrylamide 12% ở điều kiện 80V/120 phút. Sau khi điện di, bản gel polyacrilamide được nhuộm 20 phút trong dung dịch EthBr 0,5 ng/ml, sau đó soi chụp bằng máy MultiDoc-It của hãng UVP. Thành phần gel Trần Đức Trung – Cao học CNSH khóa 2007-2009, ĐH Bách khoa Hà Nội