Giáo trình Di truyền tế bào
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Di truyền tế bào", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- giao_trinh_di_truyen_te_bao.pdf
Nội dung text: Giáo trình Di truyền tế bào
- 1 Di truyền tế bào Nguyễn Như Hiền NXB Đại học quốc gia Hà Nội 2005. Từ khoá: Di truyền tế bào, AND, Cấu trúc phân tử, Mã di truyền, Cấu trúc của gen, Hardy- Weinberg, Tiến hóa vi mô, Thể nhiểm sắc của tế bào, T. Morgan, C. B. Bridges, Kiểu nhân, Băng nhiễm sắc, Biến dị, Thường biến, Đột biến gen, Đột biến nhiễm sắc thể, Biến dị di truyền, Quy luật Mendel, Quy luật phân ly, Lai phân tích, Cơ sở tế bào, Hoán vị gen, Chu kỳ sống, Sự phân giao, Phân bào nguyên nhiễm, Sinh sản vô tính, Sinh sản hữu tính, Phân bào giảm nhiễm, Tế bào Soma, Ung thư, Lai tế bào, Tế bào lành, tế bào ung thư. Tài liệu trong Thư viện điện tử ĐH Khoa học Tự nhiên có thể được sử dụng cho mục đích học tập và nghiên cứu cá nhân. Nghiêm cấm mọi hình thức sao chép, in ấn phục vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất bản và tác giả. Mục lục Lời nói đầu 5 Chương 1 Cơ sở phân tử của di truyền tế bào 7 1.1 ADN – vật chất mang thông tin di truyền 7 1.1.1 Nhân tố chuyển dạng của Griffith 7 1.1.2 Thí nghiệm của A. Hershey và M. Chase 8 1.1.3 Mô hình cấu trúc phân tử của ADN 8 1.1.4 Sự tái bản của ADN 9 1.2 Từ ADN đến ARN và đến Protein - Sự biểu hiện thông tin di truyền 12 1.2.1 Mã di truyền 12
- 2 1.2.2 Sự phiên mã (transcription) 14 1.2.3 Sự dịch mã (translation) 16 1.3 Khái niệm về gen và hệ gen 18 1.3.1 Cấu trúc của gen 18 1.3.2 Hệ gen (genome). Tổ chức của hệ gen 23 1.4 Sự điều hòa hoạt động của gen 28 1.4.1 Điều hòa hoạt động của gen ở sinh vật nhân sơ 28 1.4.2 Điều hòa hoạt động của gen ở sinh vật nhân chuẩn 30 1.5 Tiến hóa của hệ gen 35 1.5.1 Hàm lượng ADN 35 1.5.2 Vốn gen (gene pool). Biến dị di truyền trong quần thể 36 1.5.3 Phân tích vốn gen. Công thức Hardy- Weinberg 37 1.5.4 Tiến hóa vi mô (Microevolution) 38 Chương 2 Thể nhiễm sắc của tế bào - tổ chức chứa ADN 41 2.1 Hình thái thể nhiễm sắc 41 2.1.1 Kích thước thể nhiễm sắc 41 2.1.2 Số lượng thể nhiễm sắc 42 2.2 Cấu trúc hiển vi của thể nhiễm sắc 44 2.2.1 Thể nhiễm sắc thường và thể nhiễm sắc giới tính 44 2.2.2 Trung tiết (Centromere) 48 2.2.3 Thể mút (telomere) 49 2.2.4 Các băng nhiễm sắc (chromosome bands) 50 2.3 Cấu trúc siêu vi của thể nhiễm sắc 51 2.4 Học thuyết thể nhiễm sắc của Di truyền 52 2.4.1 Thí nghiệm của T. Morgan 52 2.4.2 Thí nghiệm của C. B. Bridges 54 2.4.3 Cơ sở thể nhiễm sắc của các quy luật Mendel 55 2.5 Kiểu nhân - Tiến hóa của kiểu nhân 56 2.5.1 Kiểu nhân (caryotype) 56 2.5.2 Tiến hóa kiểu nhân ở tế bào nhân chuẩn (Eukaryota) 61 2.5.3 Nghiên cứu kiểu nhân ở côn trùng truyền bệnh 66 2.5.4 Phương pháp nhận biết loài 68 Chương 3 Cơ sở tế bào của biến dị di truyền 70 3.1 Đặc tính biến dị của cơ thể 70 3.1.1 Thường biến 70 3.1.2 Biến dị di truyền 71 3.2 Đột biến gen 71 3.2.1 Đột biến gen có thể là đột biến soma hay là đột biến mầm 71 3.2.2 Đột biến gen là ngẫu nhiên hoặc cảm ứng 72 3.2.3 Đột biến là qúa trình ngẫu nhiên không có tính thích nghi 73 3.2.4 Đột biến là qúa trình thuận nghịch 73 3.2.5 Hậu quả kiểu hình của đột biến gen 74 3.2.6 Đa số các đột biến đều có hại và lặn 74 3.2.7 Đột biến gây chết có điều kiện 75 3.2.8 Cơ sở phân tử của đột biến gen 76 3.2.9 Hệ thống sửa chữa và bảo vệ ADN 76
- 3 3.3 Đột biến thể nhiễm sắc (chromosome aberration) 81 3.3.1 Đột biến về số lượng thể nhiễm sắc 81 3.3.2 Đột biến cấu trúc thể nhiễm sắc 88 3.4 Phương pháp phát hiện đột biến 92 3.4.1 Sử dụng các kỹ thuật di truyền, nuôi cấy tế bào và phân tích phả hệ trong phát hiện các đột biến 92 3.4.2 Tần số đột biến ngẫu nhiên 96 3.5 Nguyên nhân gây đột biến 98 3.5.1 Tia tử ngoại và Thymin dimer 98 3.5.2 Nhân tố bức xạ 98 3.5.3 Đột biến tạo các dẫn xuất của bazơ (chất tương tự bazơ) 99 Chương 4 Cơ sở tế bào của các quy luật và phương thức di truyền 101 4.1. Các quy luật Mendel 101 4.1.1 Gregor Mendel và cây đậu vườn 101 4.1.2 Quy luật phân ly (Principle of Segregation) và cơ sở tế bào 102 4.1.3 Quy luật phân ly độc lập (Principle of Independent Assortment) và cơ sở tế bào105 4.1.4 Lai phân tích 107 4.1.5 Qui luật xác suất 108 4.2. Các phương thức di truyền bổ sung cho qui luật Mendel, cơ sở tế bào và phân tử của chúng 109 4.2.1 Tính trội không hoàn toàn 109 4.2.2 Hiện tượng đa alen và tính đồng trội 109 4.2.3 Hiện tượng liên kết gen (Gene linkage) 110 4.2.4 Hiện tượng hoán vị gen và tái tổ hợp di truyền 111 4.2.5 Di truyền liên kết giới tính 113 4.2.6 Sự tương tác giữa các gen 113 4.2.7 Di truyền tế bào chất 115 Chương 5 Chu kỳ sống của tế bào và sự phân bào 116 5.1 Các thời kỳ của chu kỳ tế bào 116 5.1.1 Gian kỳ 117 5.1.2 Pha G1 117 5.1.3 Pha S 117 5.1.4 Pha G2 118 5.1.5 Phân bào 118 5.2 Phân bào nguyên nhiễm 119 5.3.1 Đặc điểm của phân bào nguyên nhiễm 119 5.3.2 Các kỳ của phân bào 119 5.3.3 Thời gian của các kỳ và sự điều chỉnh phân bào 122 5.3 Phân bào giảm nhiễm 123 5.3.1 Sinh sản vô tính và sinh sản hữu tính 123 5.3.2 Sơ đồ chung của phân bào giảm nhiễm 124 5.3.3 So sánh phân bào giảm nhiễm và phân bào nguyên nhiễm 127 5.3.4 Thể nhiễm sắc chổi bóng đèn (Lampbrush chromosome) 128 5.3.5 Ý nghĩa của phân bào giảm nhiễm 129 Chương 6 Điều chỉnh chu kỳ tế bào 133 6.1 Điều chỉnh chu kỳ tế bào ở cơ thể đa bào 133
- 4 6.1.1 Một hệ thống trung tâm phát động các qúa trình cần thiết của chu kỳ 133 6.1.2 Hệ thống điều chỉnh chu kỳ - phức hệ các protein-kinaza 134 6.1.3 Chu kỳ của tế bào phôi sớm và vai trò của MPF 135 6.1.4 Điều chỉnh chu kỳ tế bào ở nấm men - Các gen mã hóa cyclin và Cdk 138 6.1.5 Điều chỉnh chu kỳ tế bào động vật có vú 143 Chương 7 Di truyền tế bào Lai Soma 153 7.1 Sự biệt hóa các tế bào soma 153 7.6.2 Sự biệt hóa về hình thái và chức năng 153 7.6.2 Sự biệt hóa về sinh hóa 153 7.6.2 Sự biệt hóa- hoạt động biệt hóa của hệ gen 154 7.2 Lai tế bào soma 154 7.6.2 Lai ghép ở thực vật 154 7.6.2 Cấy ghép mô ở động vật 155 7.3 Lai tế bào soma động vật invitro 155 7.6.2 Sự tạo thành ngẫu nhiên tế bào lai soma invitro 155 7.6.2 Lai tế bào khi sử dụng virut kích thích 157 7.6.2 Các tế bào lai heterocaryon 157 7.6.2 Sự hoạt hóa của gen ở tế bào lai 162 7.6.2 Các bào quan trong tế bào lai 164 7.4 Lập bản đồ gen 165 7.5 Lai tế bào soma và công nghệ tế bào thực vật 166 7.6.2 Phương pháp tạo tế bào trần (protoplast) 166 7.6.2 Sự liên kết và dung hợp tế bào trần 167 7.6.2 Sự phát triển của tế bào lai 167 7.6.2 Chọn lọc và xác định các dòng tế bào lai và mô sẹo 167 7.6.2 Ưu thế của lai soma ở thực vật 168 7.6 Công nghệ tế bào lai và thực tiễn sản xuất 169 7.6.2 Tạo và chọn lọc giống cây trồng 169 7.6.2 Sản xuất kháng thể đơn dòng (monoclonal antibody) 169 Chương 8 Di truyền tế bào Soma và ung thư 172 8.1 Bệnh ung thư (cancer) 172 8.2 Sự chuyển hóa ung thư 173 8.2.1 Tế bào lành và tế bào ung thư invitro 173 8.2.2 Sự chuyển hóa ung thư khi lai tế bào 173 8.2.3 Sự chuyển hóa ung thư in vivo 174 8.3 Cơ sở di truyền tế bào của ung thư 175 8.3.1 Đột biến thể nhiễm sắc và ung thư 175 8.3.2 Các gen gây ung thư (oncogenes) và phát sinh ung thư 175 8.3.3 Ung thư vú (breast cancer) 179 8.3.4 U xơ thần kinh (neurofibromatose) 179 8.3.5 Ung thư võng mạc (retinoblastome) 180 8.3.6 Ung thư thận 181 8.3.7 Ung thư kết - trực tràng (colorectal cancer) 181 8.4 Ung thư thất điều dãn mạch (ataxie telangiectasie) 182 8.5 Chẩn đoán và chữa trị ung thư 183 8.6 Điều trị bệnh di truyền bằng liệu pháp gen (Genetic therapy) 184
- 5 8.5.1 Nguyên lý của liệu pháp gen 184 8.5.2 Liệu pháp gen ex vivo 185 8.5.3 Liệu pháp gen in vivo 187 8.5.4 Liệu pháp gen sử dụng các oligonucleotit 187 Tài liệu tham khảo 188 Lời nói đầu Giáo trình Di truyền tế bào là tài liệu học tập của học viên Cao học tại Khoa Sinh học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội theo khung chương trình đào tạo sau Đại học của Bộ Giáo dục và Đào tạo. Giáo trình được biên soạn nhằm giới thiệu những kiến thức chuyên ngành về Di truyền tế bào, bao gồm: những kiến thức cơ bản và chuyên sâu cập nhật thuộc lĩnh vực khoa học trung gian giữa Di truyền học, Tế bào học và Sinh học phân tử. Phần cơ bản chủ yếu ôn lại một cách có hệ thống các kiến thức Di truyền học và Sinh học tế bào là những kiến thức cơ sở để có thể nghiên cứu chuyên sâu một số vấn đề về Di truyền tế bào như: tổ chức và hoạt động
- 6 của hệ gen, thể nhiễm sắc, di truyền tế bào soma, chu trình tế bào và cơ chế phân tử của điều chỉnh chu trình. Giáo trình cũng đề cập một số ứng dụng thực tiễn của Di truyền tế bào như: công nghệ tế bào, di truyền tế bào và bệnh ung thư v.v Trong phần đầu của mỗi chương đều có nêu mục tiêu cần đạt được về nội dung và cuối chương đều có các chủ đề để các học viên chuẩn bị và thảo luận trong các buổi xêmine, cùng các bài thực tập theo từng chủ mà học viên cần phải làm. Giáo trình có thể được dùng làm tài liệu tham khảo cho các cán bộ nghiên cứu tại các Trường Đại học hay các Viện nghiên cứu có liên quan đến chuyên ngành Di truyền tế bào. Tuy nhiên, Di truyền tế bào là chuyên ngành rộng lớn, có liên quan đến Di truyền học, Sinh học tế bào và Sinh học phân tử, cho nên giáo trình không thể đề cập chuyên sâu đến nhiều lĩnh vực mà chỉ có thể đề cập một số vấn đề cốt lõi nhất. Giáo trình chắc chắn còn nhiều thiếu sót, tác giả chân thành mong muốn nhận được nhiều đóng góp ý kiến của độc giả để hoàn thiện hơn. Tác giả
- 7 Chương 1 Cơ sở phân tử của di truyền tế bào Mục tiêu: Sau khi học xong chương này, học viên sẽ có khả năng: - Trình bày được các khái niệm về gen, hệ gen và mã di truyền. - Trình bày được mô hình và cơ chế tái bản ADN. - Trình bày được mô hình và cơ chế phiên mã, ADN → ARN. - Trình bày được mô hình và cơ chế dịch mã, ADN → mARN → Protein. - Trình bày được cơ chế điều hòa hoạt động của gen. - Giải thích được cơ sở phân tử của tiến hóa. 3.1 ADN – vật chất mang thông tin di truyền ADN (axit deoxyribonucleic) là hợp chất đại phân tử cấu tạo nên các gen và thể nhiễm sắc – là vật chất quy định đặc tính di truyền và biến dị của cơ thể sống. Chúng ta sẽ xem xét lịch sử mà qua đó các nhà sinh vật học đã khám phá ra ADN là vật chất di truyền. 8.1.1 Nhân tố chuyển dạng của Griffith Năm 1928 Federick Griffith, nhà sinh vật học người Anh, đã công bố các kết quả thí nghiệm về sự chuyển nạp (transformation) ở vi khuẩn gây bệnh viêm phổi (Streptococcus pneumoniae). Ông đã sử dụng hai chủng vi khuẩn là một chủng gây bệnh viêm phổi và một chủng không gây bệnh – chủng lành. Chủng gây bệnh có đặc tính gây bệnh và có vỏ bảo vệ, còn chủng lành không gây bệnh và không có vỏ. Ông giết chết vi khuẩn bằng nhiệt độ cao và đem trộn lẫn các vi khuẩn gây bệnh đã giết chết với các vi khuẩn lành còn sống và đem tiêm vào chuột. Chuột bị bệnh viêm phổi và trong máu chuột tìm thấy các vi khuẩn gây bệnh sống. Ông kết luận rằng các chủng lành đã chuyển dạng thành các chủng gây bệnh do một nhân tố nào đó (nhân tố quy định bệnh và di truyền) đã chuyển từ chủng bệnh sang chủng lành và biến chủng lành thành chủng gây bệnh. Các chủng gây bệnh do bị chuyển dạng sinh sản ra con cháu đều mang tính gây bệnh. Nhưng Griffith chưa phát hiện được bản chất hóa học của nhân tố chuyển dạng. Phải đợi đến năm 1944, các nhà sinh vật học với rất nhiều nghiên cứu khoa học khác nhau mới chứng minh được nhân tố chuyển dạng của Griffith là ADN. Tại Viện Nghiên cứu Rockefeller (Mỹ) T. Avery và các cộng tác viên đã tiến hành nhiều thí nghiệm tỉ mỷ và chính xác trên các đối tượng vi khuẩn mà Griffith đã nghiên cứu và chứng minh được rằng nhân tố do Griffith giả định có bản chất là ADN, nghĩa là ADN của vi khuẩn gây bệnh đã chuyển sang cho vi khuẩn lành, biến vi khuẩn lành thành vi khuẩn gây bệnh có vỏ bảo vệ.
- 8 8.1.2 Thí nghiệm của A. Hershey và M. Chase Năm 1952, hai nhà sinh vật học người Mỹ là Affred Hershey và Martha Chase đã tiến hành nhiều thí nghiệm trên đối tượng thực khuẩn thể (Bacteriophage) T2 là virut ký sinh trong vi khuẩn E. coli. Bằng phương pháp tách phần ADN và protein của virut riêng biệt nhau và đánh dấu phóng xạ ADN bằng photpho phóng xạ và đánh dấu protein bằng sunphua phóng xạ, đồng thời gây nhiễm cho E. coli bằng virut có mang ADN và protein đánh dấu, các ông đã chứng minh rằng chỉ có ADN của virut xâm nhập vào tế bào vi khuẩn và gây bệnh cho vi khuẩn vì virut tạo được vỏ protein của mình (không có dấu phóng xạ) và sinh sản ra nhiều virut T2 phá huỷ tế bào vi khuẩn. Khi đem tiêm trực tiếp ADN của T2 vào E. coli thì E. coli bị lây nhiễm, còn tiêm protein của T2 vào E. coli thì E. coli không bị lây nhiễm. Như vậy, các nhà nghiên cứu đã khẳng định được vật chất di truyền của virut là ADN. Nhiều virut có vật chất di truyền là ARN, ví dụ virut gây bệnh khảm thuốc lá, virut HIV v.v Trong những năm 50, nhiều thí nghiệm phân tách ARN và protein cũng đã chứng minh rằng ARN là vật chất mang thông tin di truyền. Cũng trong năm 1952, các nhà khoa học đã quan sát thấy hiện tượng được gọi là tải nạp (transduction) – là hiện tượng chuyển tải ADN từ vi khuẩn này sang vi khuẩn khác một cách gián tiếp thông qua virut và khẳng định vai trò của ADN trong đặc tính di truyền của cơ thể. Từ khi phát hiện ra ADN là vật chất di truyền thì cần phải tìm hiểu bản chất và cấu trúc của phân tử ADN. 8.1.3 Mô hình cấu trúc phân tử của ADN Như phần trên ta đã biết ADN và ARN đều là axit nucleic. Chúng được cấu tạo gồm nhiều đơn vị (monomere) được gọi là nucleotit. Các nucleotit liên kết với nhau theo tuyến tính tạo nên mạch trùng hợp (polymere) được gọi là mạch polynucleotit. Năm 1953, nhà sinh học người Mỹ là Jame D. Watson và nhà vật lý người Anh Francis Crick, căn cứ vào cấu tạo hóa học của ADN và ảnh chụp tinh thể ADN bằng phương pháp nhiễu xạ Rơngen (do Maurice Wilkins và Franklin Rosalind nghiên cứu) đã công bố mô hình cấu trúc phân tử ADN được giới khoa học công nhận và năm 1962, hai ông (cùng với Wilkins) đã được nhận giải thưởng Nobel về công trình đó. Theo mô hình cấu tạo phân tử ADN của Watson và Crick thì phân tử ADN là sợi xoắn kép gồm 2 mạch đơn deoxyribonucleotit xoắn với nhau quanh một trục trung tâm tưởng tượng, trong đó hai tay thang dọc ở phía ngoài là các liên kết đường – phôtphat, còn nằm phía trong là các bậc thang - là các liên kết hydro giữa các bazơ nitơ của hai mạch theo nguyên tắc bổ sung: A - T và C - G (hình 1.1). Sợi xoắn kép ADN theo nguyên tắc bổ sung của Watson và Crick không chỉ chứng minh cho công thức của Ewin Chargaff tìm ra trước đây là (A+T)/(C+G) =1. Điều này có nghĩa là trong phân tử ADN tổng số các nucleotit A và T luôn luôn bằng C và G, đồng thời cũng là cơ sở cấu trúc cho các đặc tính quan trọng của phân tử ADN như là phân tử tích thông tin di truyền, là phân tử có đặc tính tự tái bản (ADN > ADN) để truyền thông tin di truyền qua các thế hệ. ADN còn là phân tử có đặc tính phiên mã để cho ra ARN từ đây dịch mã để tổng hợp protein là cơ sở của các tính trạng trong mỗi thế hệ cơ thể.
- 9 Hình 1.1 Mô hình sợi ADN xoắn kép 8.1.4 Sự tái bản của ADN Một trong những đặc tính của cơ thể sống là đặc tính tự sinh sản ra những cơ thể mang các tính trạng hình thái và sinh lý giống bố mẹ. Đặc tính đó dựa trên đặc tính tự tái bản (replication) của phân tử ADN qua đó một phân tử ADN mẹ đã sinh sản ra hai phân tử ADN con giống hệt ADN mẹ và thông qua cơ chế phân bào hai phân tử ADN con được phân ly về hai tế bào con, do đó mà hai tế bào con mang đặc tính di truyền như tế bào mẹ. 1.1.4.1 Đặc tính của sự tái bản ADN Sự tái bản của ADN bảo đảm tính chính xác của sự sao chép mã di truyền từ phân tử ADN mẹ sang các phân tử ADN con nhờ các cơ chế đặc biệt. Sự tái bản của ADN dựa trên nguyên tắc khuôn và bổ sung, nghĩa là mỗi mạch đơn ADN được dùng làm khuôn theo đó các deoxyribonucleotit (A, C, T, G) được lắp ráp theo nguyên tắc bổ sung (A lắp với T, C lắp với G và ngược lại) vì vậy, trong sợi xoắn kép ADN con có trình tự sắp xếp các nucleotit giống như sợi ADN mẹ. Sự tái bản ADN mang tính nửa bảo tồn nghĩa là sợi ADN con mang một mạch đơn ADN cũ (mạch khuôn) và một mạch đơn ADN mới (mạch mới được tổng hợp). Sự tái bản ADN mang tính định hướng và diễn ra theo hai hướng ngược nhau, vừa liên tục vừa gián đoạn, nghĩa là sự tổng hợp mạch mới chỉ diễn ra theo hướng 3' - 5' (tức là từ đầu 3 đến đầu 5 của mạch khuôn) do trong sợi kép ADN, hai mạch đơn ADN xoắn theo hai chiều ngược nhau nên sự tổng hợp diễn ra theo cả hai hướng ngược nhau (một mạch theo hướng 3'- 5', mạch kia theo hướng 5'-3'). Trong hai mạch khuôn, thì một mạch được dùng để tổng hợp mạch mới một cách liên tục (gọi là mạch dẫn đầu hay mạch liền - leading strand), còn mạch kia tổng hợp gián đoạn (gọi là mạch chậm hay mạch gián đoạn - lagging strand) nghĩa là tổng
- 10 hợp từng đoạn ADN ngắn và sau đó mới được khâu lại tạo thành mạch ADN hoàn chỉnh (hình 1.2). 1.1.4.2 Cơ chế và mô hình của sự tái bản ADN Có nhiều loại protein và enzym tham gia vào qúa trình tái bản ADN: - Phức hệ replixom (replisome) là một phức hệ đa enzym gồm có: Enzym helicaza có tác động (phối hợp với một protein gây bất ổn định được gọi là SSB) mở xoắn và tách đôi sợi ADN kép; Primoxom (primosome) gồm enzym và một số protein có trách nhiệm tổng hợp các đoạn ARN mồi (ARN primer). Các enzym ADN polimeraza I và III có vai trò trùng hợp các deoxyribonucleotit thành mạch ADN. Enzym ATPaza có vai trò thuỷ phân ATP. - Enzym ADN- polimeraza II. - Enzym topoisomeraza có tác dụng như enzym ligaza dùng để khâu các đoạn ADN lại với nhau. Các enzym ADN polimeraza ngoài tác dụng trùng hợp - xúc tác tổng hợp mạch ADN mới, còn có hoạt tính enzym exonucleaza cắt mạch ADN từ đầu tự do (trong lúc các endonucleaza lại cắt ADN từ các điểm nằm bên trong sợi) và chúng có tác dụng sửa sai – phát hiện và cắt bỏ những bazơ kết cặp sai do đó giúp cho qúa trình tái bản được chính xác. Phân tử ADN của vi khuẩn là sợi xoắn kép có dạng vòng. Bước vào qúa trình tái bản, phân tử ADN đính vào mesoxom (phần lõm vào của màng sinh chất) ở điểm khởi đầu cho sự tái bản, ở vùng này có gen khởi đầu (initiator gene). Sự tái bản bắt đầu từ điểm khởi đầu. Do sự mở xoắn và tách hai mạch nên ở điểm khởi đầu xuất hiện “con mắt tái bản” ở dạng vòng tròn gồm hai mạch đơn nối liền với sợi xoắn ở hai điểm gọi là điểm tăng trưởng hay điểm chẻ đôi, từ đây sợi kép sẽ tiếp tục mở xoắn và tách ra ở cả hai đầu. Ở điểm tách ra của hai mạch tạo nên chẽ ba (gồm hai mạch đơn nối với sợi kép) được gọi là chẽ ba tái bản (replication fork, hình 1.2). Sự lắp ráp các deoxyribonucleotit diễn ra trong chẽ ba và sử dụng các mạch đơn ADN mẹ làm khuôn. Sự mở xoắn và tách hai mạch đơn là do enzym helicaza tác động, đồng thời các protein gây bất ổn định SSB (Single Strand Binding) là protein bám mạch đơn ngăn không cho chúng xoắn lại với nhau, để chúng có thể làm khuôn tổng hợp mạch mới. Sự xoắn và tách đôi hai mạch đòi hỏi cung cấp năng lượng từ ATP. ATP được thuỷ phân cho ra ADP, P và năng lượng nhờ enzym ATPaza của replixom. Mỗi lần ADN mở xoắn thì lại làm tăng thêm xoắn ở sợi kép tiếp theo ngay trước enzym helicaza. Sự tăng xoắn có thể dẫn tới làm đứt gãy ADN. Enzym topoisomeraza tác động như một nhân tố làm dãn xoắn bằng cách cắt các đoạn ADN qúa xoắn để chúng dãn xoắn và khâu nối lại suốt trong tiến trình hoạt động của helicaza. Các ADN polimeraza không có khả năng khởi đầu cho việc tổng hợp mạch ADN mới. Để khởi đầu cho việc tổng hợp ADN, đòi hỏi phải có một đoạn ARN mồi gồm 10 ribonucleotit (ARN primer). Về sau đoạn mồi bị tiêu huỷ và sẽ bị ADN thế chỗ. Đoạn ARN mồi được tổng hợp nhờ enzym primaza (ARN polimeraza phụ thuộc ADN) ngay từ khi khởi đầu tái bản - khi xuất hiện “con mắt tái bản”. Do hai mạch ADN xếp song song ngược chiều cho nên tiến trình lắp ráp các mạch ADN từ hai mạch khuôn là không giống nhau. Mạch khuôn có hướng 3'- 5'
- 11 sẽ được tổng hợp trước và liên tục và mạch ADN mới được hình thành có hướng 5'- 3', mạch này được gọi là mạch liền. Đối với mạch ADN khuôn thứ hai có hướng 5'- 3' diễn ra chậm hơn và diễn ra gián đoạn, nghĩa là tổng hợp từng đoạn ADN và sau đó được khâu nối lại. Mạch ADN mới này có hướng 3'- 5' được gọi là mạch gián đoạn (hình 1.2). Quá trình tổng hợp ADN mạch liên tục diễn ra ngay sau khi đoạn ARN mồi được tổng hợp (cùng trên khuôn của mạch ADN 3'- 5') có hướng 5'- 3', do đó ADN polimeraza III nhận biết đầu 3'-OH của đoạn mồi, bắt đầu xúc tác lắp ráp các deoxyribonucleotit và tạo nên mạch ADN mới có hướng 5'- 3' bổ sung với mạch khuôn. Đoạn mồi bị cắt bỏ và bị tiêu huỷ bởi exonucleaza. Hình 1.2 Mô hình tái bản ADN theo mạch liền và mạch gián đoạn. Tiến trình tổng hợp ADN mạch gián đoạn diễn ra trên mạch ADN khuôn thứ hai. Do mạch ADN khuôn thứ hai có hướng 5'- 3' nên sự tổng hợp diễn ra gián đoạn phức tạp hơn và chậm hơn so với mạch dẫn đầu. Nhờ xúc tác của enzym ARN-polimeraza phụ thuộc ADN (1 loại primaza) đoạn ARN mồi thứ nhất được tổng hợp, enzym ADN polimeraza III nhận biết dấu 3'-OH của ARN – mồi bắt đầu tổng hợp một đoạn ADN (có khoảng 2.000 nucleotit) được gọi là đoạn Okazaki (hình 1.2). Đoạn ARN mồi thứ nhất bị thuỷ phân bởi ADN - polimeraza (tác động như exonucleaza). Tiếp theo trên khuôn của ADN, đoạn ARN mồi thứ hai được tổng hợp và tiếp theo đó ADN – polimeraza tổng hợp đoạn Okazaki thứ 2, đoạn mồi thứ hai bị cắt bỏ. Đoạn Okazaki thứ nhất được khâu nối với đoạn Okazaki thứ 2. Tiến trình cứ tiếp diễn như thế cho đến khi kết thúc sự tái bản - các đoạn Okazaki được khâu nối với nhau nhờ enzym ligaza thành mạch ADN liên tục. Về cơ bản thì sự tái bản ADN ở Eucaryota cũng giống với Prokaryota. Tuy nhiên, ở Eucaryota ADN liên kết với histon để tạo thành nucleoxom và tạo thành các sợi nhiễm sắc nhiều cấp phức tạp cho nên qúa trình tái bản ADN diễn ra phức tạp hơn và có vài điểm khác biệt. 1.1.4.3 Các đơn vị tái bản (replicon) Đối với Prokaryota chỉ tồn tại một điểm khởi đầu tái bản và qúa trình tái bản diễn ra theo hai chiều ngược nhau xuất phát từ điểm đó. Như vậy, ở Prokaryota chỉ là một đơn vị tái bản. Đối với tế bào Eucaryota phân tử ADN vô cùng dài nếu như chỉ có một đơn vị tái bản thì thời
- 12 gian tái bản phải kéo dài tới 76 ngày, trên thực tế thời gian tái bản chỉ kéo dài 6 - 8 giờ (tốc độ tái bản ADN xảy ra ở mức độ 2μm/phút). Điều đó nói lên rằng ở ADN của Eucaryota tồn tại nhiều đơn vị tái bản (replicon). Mỗi replicon có chiều dài từ 40 - 400μm. Mỗi replicon có điểm khởi đầu tái bản riêng của mình. Tiến trình tái bản trong từng replicon cũng diễn ra giống như ở Prokaryota nghĩa là theo nguyên tắc khuôn bổ sung, có định hướng, theo hai chiều ngược nhau, liên tục và gián đoạn. Khi tất cả các replicon đã được tái bản, chúng liên thông với nhau và khi đó hai sợi ADN được hình thành. Nucleoxom và tiến trình tái bản. Sự tồn tại cấu trúc nucleoxom ở Eucaryota làm cho tiến trình tái bản xảy ra chậm hơn và các đoạn okasaki ngắn hơn. Trong tiến trình tái bản phân tử ADN dãn cuộn khỏi lõi histon, trong lúc đó histon octomer biến dạng thành hai tetramer. Các histon mới được tổng hợp từ tế bào chất được chuyên chở vào nhân, tạo thành các octomer mới để cùng sợi kép ADN được tổng hợp tạo thành các nucleoxom và từ đó tạo thành các sợi nhiễm sắc và thể nhiễm sắc con. Qua pha S, hàm lượng ADN và số lượng thể nhiễm sắc được tăng gấp đôi, qua qúa trình phân bào sẽ chia đôi đồng đều cho hai tế bào con. 8.2 T ADN n ARN và n Protein - S biu hin thông tin di truyn Như ta đã biết, phân tử ADN là vật chất mang thông tin di truyền và thông tin di truyền được di truyền từ thế hệ bố mẹ sang thế hệ con cái thông qua sự tái bản ADN và phân ly ADN về các tế bào con qua phân bào. Ở mỗi cơ thể nhất định, thông tin di truyền được thể hiện ở các tính trạng hình thái và sinh lý - được gọi là kiểu hình (phenotype). Các tính trạng hình thái như: độ lớn cơ thể, màu sắc, hình dạng, cũng như các tính trạng sinh lý và tập tính như: trao đổi chất, trao đổi năng lượng, tính chịu nhiệt, ưa sáng v.v. đều do protein quy định. Như vậy, phải có mối liên hệ giữa ADN và protein. Sinh học phân tử đã cho chúng ta biết dòng thông tin từ ADN đến protein phải thông qua ARN hay còn gọi là giáo lý trung tâm của Crick: ADN → ARN → Protein Cấu tạo đặc thù của protein được quy định bởi cấu tạo đặc thù của ADN hay nói một cách khác mã của protein được quy định bởi mã của ADN và được gọi là mã di truyền (genetic code). Qúa trình từ ADN → ARN được gọi là sự phiên mã (transcription) và qúa trình từ ARN → Protein là sự dịch mã (translation). 8.2.1 Mã di truyền Mã di truyền (genetic code) là mã của ngôn ngữ protein được mã hóa bởi ngôn ngữ axit nucleic, hay nói một cách cụ thể hơn là trình tự các axit amin trong mạch polypeptit của protein được quy định bởi trình tự của các nucleotit trong mạch polynucleotit của ADN. Để xây dựng nên polypeptit cần đến 20 loại axit amin, trong lúc đó mạch polynucleotit được cấu tạo bởi 4 dạng nucleotit là A, T (U), G và C. Các nhà di truyền học phân tử đã giả thiết rằng mã di truyền là mã bộ ba (tripled code) nghĩa là trình tự của một bộ ba (một codon) nucleotit quy định cho trình tự một axit amin. Như vậy, sẽ có 43 = 64 codon tương ứng với 20 axit amin. Nhưng bộ ba (codon) nào quy định axit amin nào thì phải đến năm 1961 nhà sinh vật học người Anh là M. Nirenberg lần đầu tiên
- 13 đã chứng minh bằng thực nghiệm rằng mã di truyền là mã bộ ba và đã tìm ra codon đầu tiên mã hóa cho axit amin phenilalanin là bộ ba UUU. Những năm sau đó, các codon mã hóa cho 20 axit amin đều được xác định (xem bảng 1.1). Người ta đã phát hiện ra rằng mã di truyền là mã thoái hóa nghĩa là một axit amin có thể tương ứng với nhiều mã ví dụ: tương ứng với phenilalanin có hai mã, với valin có bốn mã và với leucin có đến sáu mã (xem bảng1.1). Theo quy định trong bảng mà người ta ký hiệu codon bằng ba ribonucleotit, ví dụ UUU hoặc UUC mã cho phenilalanin, vì khi tổng hợp protein ADN được phiên mã thành khuôn mARN theo nguyên tắc bổ sung tức là U - A và C - G. Ngoài ra, trong 64 mã còn có mã khởi đầu (mã AUG vừa là mã của methionin, vừa là mã khởi đầu) và mã kết thúc (3 mã UAA, UAG và UGA) là mã báo hiệu sự khởi đầu và kết thúc mạch polynucleotit được tổng hợp trên khuôn mARN. Bảng 1.1 Từ điển mã di truyền (ghi theo mã ARN)
- 14 Mã thoái hóa nói lên tính dự trữ và sự thích nghi của cơ thể để hạn chế bớt tác hại của đột biến xảy ra làm sai lệch mã dẫn đến hư hỏng protein. Mã di truyền có tính vạn năng, nghĩa là tất cả các cơ thể sống từ vi khuẩn cho đến thực vật, động vật và cả con người đều sử dụng một bộ mã chung. Bằng thực nghiệm người ta đã chuyển gen từ cơ thể này sang cơ thể khác và gen đó vẫn được phiên mã và dịch mã tổng hợp nên protein do gen đã được mã hóa. Tính vạn năng của mã chứng tỏ rằng mã xuất hiện rất sớm trong qúa trình tiến hóa và tất cả các cơ thể sống có chung cơ sở phân tử và nguồn gốc phát sinh. Tuy nhiên, có một số ngoại lệ, ví dụ ở một số động vật đơn bào và các bào quan (ty thể) bộ mã có ít nhiều sai khác với bộ mã chung. Ví dụ đối với ADN của ti thể ở người, động vật có vú, nấm men v.v. mã AUG là mã của triptophan, mã AUG là mã của metionin, mã AGA và AGG là mã kết thúc. Điều đó chứng tỏ mã di truyền khi mới xuất hiện có tính đa dạng và qua qúa trình tiến hóa chọn lọc mới hình thành bộ mã chung như hiện nay. 8.2.2 Sự phiên mã (transcription) Sự phiên mã của ADN có thể diễn ra trong tất cả các pha của gian kỳ. Sự phiên mã là sự tổng hợp các phân tử mARN cũng như rARN và tARN từ ADN theo nguyên tắc bổ sung (A - U và C - G) diễn ra trong nhân. 1.2.2.1 Các ARN polimeraza ARN - polimeraza là enzym có vai trò phiên mã, nghĩa là xúc tác sự tổng hợp các ARN (mARN, tARN và rARN) trên khuôn của một mạch ADN. Sự tổng hợp ARN diễn ra theo chiều 3’- 5’ và được xác định bởi promoter. Ở Bacteria người ta chỉ tìm thấy một dạng ARN -
- 15 polimeraza với trọng lượng phân tử 500.000D chứa nhiều mạch polypeptit (ví dụ ở E.coli có đến 5 mạch). Ở Eucaryota có đến 3 dạng ARN - polimeraza, mỗi dạng có vai trò riêng, đó là các dạng ARN - polimeraza I, II và III. ARN - polimeraza I có vai trò tổng hợp các rARN (trừ rARN 5S). ARN - polimeraza II có vai trò phiên mã các mARN. ARN - polimeraza III có vai trò tổng hợp các tARN và rARN 5S. Trong tế bào động vật có vú, người ta đã tính được khoảng 40.000 phân tử ARN - polimeraza I, 40.000 phân tử ARN - polimeraza II và khoảng 20.000 phân tử ARN - polimeraza III. 1.2.2.2 Cơ chế phiên mã Sự tổng hợp ARN mang tính chọn lọc cao. Trong tế bào Eucaryota có khoảng 1% các trình tự nucleotit trong ADN được phiên mã thành ARN phục vụ cho hoạt động của tế bào. Tham gia qúa trình phiên mã ngoài các ARN - polimeraza còn có các nhân tố khác đóng vai trò điều chỉnh. Các nhân tố đó thường là các protein axit. Bắt đầu phiên mã là sự acetyl hóa các histon đưa đến biến đổi trong cấu trúc của nucleoxom. Do sự acetyl hóa dạng histon bát hợp (octamere) đã biến thành histon tứ hợp (tetramere) hoặc nửa nucleoxom. Sợi ADN dãn vòng và được nới lỏng. Promoter được nhận biết bởi các ARN - polimeraza nhờ một hoặc nhiều protein liên kết với ADN ở đoạn promoter. Promoter trở thành hoạt động khi đã liên kết với protein (được gọi là nhân tố phiên mã), thì ARN - polimeraza gắn vào promoter và bắt đầu phiên mã từ điểm khởi đầu và di chuyển dọc theo sợi ADN đã được tháo xoắn và bằng cách dùng một mạch ADN làm khuôn theo nguyên tắc bổ sung, các ribonucleotit được lắp ráp thành mạch ARN kéo dài theo hướng 5’- 3’ cho đến điểm kết thúc; phân tử ARN được tổng hợp tức thì được tách khỏi ADN. ARN- polimeraza cũng tách khỏi ADN (xem hình 1.3) sự kéo dài và kết thúc mạch ARN đòi hỏi có sự tham gia của các nhân tố điều chỉnh. Sự điều chỉnh hoạt động của gen (phiên mã) có thể do yếu tố cấu trúc gen như các enhancer, promoter, v.v. là những đoạn ADN có khả năng liên kết với các nhân tố điều chỉnh - là các protein điều chỉnh tác động như những nhân tố đóng mở gen (ức chế hoặc hoạt hóa gen). Các nhân tố điều chỉnh hoạt động của gen không chỉ là hệ thống các protein rất đa dạng của nhân và thể nhiễm sắc mà còn có thể là các nhân tố ngoại bào như các sản phẩm trao đổi chất và các hormon v.v
- 16 Hình 1.3 Mô hình quá trình phiên mã Mạch ARN mới được tổng hợp bao gồm cả ARN được phiên từ các exon và intron, vì vậy được gọi là bản phiên khởi thuỷ. Bản phiên khởi thuỷ này phải được xử lý, chế biến (ARN processing) thành các ARN có hoạt tính chức năng trước khi được tế bào sử dụng (các mARN, tARN và rARN). Trong nhân tế bào dưới tác dụng của enzym exonucleaza các đoạn intron của mARN khởi thuỷ bị cắt bỏ và sau đó các đoạn exon được khâu nối lại với nhau nhờ enzym ligaza và tạo thành mARN chín có hoạt tính chức năng nghĩa là dùng để dịch mã khi được chuyển đến riboxom. 8.2.3 Sự dịch mã (translation) Sự dịch mã là sự tổng hợp protein cũng có thể xảy ra ở các pha khác nhau của gian kỳ. Protein là chất trùng hợp mang tính đặc trưng loài, đặc trưng cho cá thể và đặc trưng cho tế bào. Sự đặc trưng này được thể hiện trong cấu trúc cấp 1 của protein, tức là trình tự sắp xếp của các đơn hợp - các axit amin cấu tạo nên protein đó. Trình tự sắp xếp các axit amin trong mạch polypeptit (protein) được mã hóa bằng trình tự sắp xếp của các nucleotit trong mạch polynucleotit (ADN) - Mã như vậy được gọi là mã di truyền - tức là một bộ ba (hay là codon) nucleotit trong ADN qui định cho một axit amin trong polypeptit và như vậy trình tự các codon trong mạch polynucleotit qui định nên trình tự các axit amin trong mạch polypeptit. Có 64 codon ứng với 20 loại axit amin. Như vậy, 1 axit amin có thể có nhiều codon tương ứng. Kiểu mã như thế gọi là mã thoái hóa. Mã di truyền là vạn năng - nghĩa là áp dụng cho tất cả các cơ thể sống. Do ADN chứa trong thể nhiễm sắc định khu trong nhân tế bào, cho nên mã chứa trong ADN sẽ được phiên mã thành mã chứa trong mARN - qua xử lý và chế biến, mARN được chuyên chở đến riboxom trong tế bào chất, ở đây mARN được dùng làm khuôn để lắp ráp các axit amin thành protein nhờ các tARN và các nhân tố khác nữa. 1.2.3.1 Cơ chế tổng hợp protein + Vai trò của tARN. Mỗi axit amin tương ứng với một số tARN; phân tử tARN liên kết với axit amin đặc trưng nhờ enzym amino - axil - tARN synthetaza. Có 20 amino - axil -
- 17 tARN synthetaza đặc trưng cho 20 axit amin. Đầu tiên là amino - axil - tARN synthetaza liên kết với axit amin đặc trưng cho riêng mình thành một phức hợp - phức hợp này liên kết với tARN đặc trưng qua đầu 3' với axit amin của phức hợp, tARN nhận biết được axit amin đặc trưng cho mình là nhờ enzym amino - axil - tARN - synthetaza, còn liên kết giữa tARN với axit amin đòi hỏi tiêu phí năng lượng từ ATP. Khi tARN đã liên kết với axit amin (amino- axil-tARN) thì enzym được giải phóng và amino - axil - tARN chuyển đến bến A của riboxom, trong đó anticodon của tARN phù hợp - bổ sung với codon của mARN, nghĩa là đúng codon của axit amin được mã hóa (hình 1.4). Đầu tiên, một tARN mang axit amin mở đầu (met - tARN) đến bám vào vị trí mã mở đầu. Đối mã của nó khớp bổ sung với mã mở đầu trên mARN; aa1 - tARN tới vị trí bên cạnh và đối mã của nó khớp bổ sung với mã của axit amin. + Vai trò của riboxom. Sự lắp ráp các axit amin để tạo thành mạch polypeptit được thực hiện trên riboxom, gồm 3 giai đoạn: - Giai đoạn khởi đầu, bao gồm sự hình thành phức hệ khởi đầu do sự liên kết của mARN + với đơn vị nhỏ 40S của riboxom (nhờ nhân tố F3 và ion Mg ) trong đó codon khởi đầu (codon AUG mã hóa cho methionin) được liên kết bổ sung với anticodon của methionin tARN. Đối với tế bào Eucaryota thì codon khởi đầu là methionin còn đối với tế bào Prokaryota là N - formyl - methionin . Methionin tARN kết hợp anticodon UAC với codon AUG nhờ nhân tố F19, F2 và GTP và liên kết vào bến P của đơn vị nhỏ 60S của riboxom. - Giai đoạn kéo dài, trong tiến trình kéo dài sự lắp ghép các axit amin thành mạch polypeptit, bao gồm sự hình thành liên kết peptit giữa các axit amin và sự chuyển dịch. Các amino - axil - tARN lần lượt chuyên chở các axit amin vào bến A, trong đó anticodon của tARN phù hợp với codon tiếp theo của mARN - ví dụ codon tiếp theo AUG là GCA (codon của alanin) chẳng hạn thì alanin - tARN sẽ đến đậu ở bến A và anticodon CGU sẽ khớp với codon GCA. Sự liên kết này đòi hỏi phải có mặt các nhân tố của sự kéo dài là EF1 và GTP. Với sự xúc tác của enzym peptidyl - transferaza và sự có mặt của ion K+, liên kết peptit giữa methionin - alanin được hình thành. Sau đó, nhờ nhân tố EF2 và GTP tARN mang methionin được giải phóng, đồng thời riboxom chuyển dịch theo sợi mARN với khoảng cách một codon và alanin- tARN được chuyển sang bến P, và amino- axil- tARN tiếp theo vào đậu ở bến A ứng với codon của nó (hình 1.4). Sự hình thành liên kết peptit và chuyển dịch của riboxom xảy ra liên tục, các tARN được giải phóng và lại quay vòng chuyên chở các axit amin tương ứng vào bến A và kết quả là kết thúc sự tạo thành mạch polypeptit. - Giai đoạn kết thúc, diễn ra khi riboxom dịch chuyển đến codon kết thúc dịch mã là UAA hoặc UGA hoặc UAG (đây là 3 codon kết thúc dịch mã chung cho tất cả mARN). Mạch polypeptit được giải phóng nhờ nhân tố giải phóng RF, GTP và riboxom phân giải thành hai đơn vị nhỏ và phân tử mARN cũng được giải phóng nhưng có thể được dùng lại để tổng hợp những phân tử protein khác. Các protein mới được tổng hợp sẽ được kiến tạo thành các cấu trúc cấp 2, cấp 3 v.v. là cấu trúc không gian đặc thù để thực hiện các chức năng của chúng trong tế bào.
- 18 Hình 1.4 Mô hình qúa trình dịch mã 8.3 Khái nim v gen và h gen Từ năm 1865, G. Mendel khi công bố các quy luật di truyền đã giả định rằng đặc tính di truyền được quy định bởi các “nhân tố” có ở bố mẹ và được di truyền lại cho thế hệ con cái. Các “nhân tố” đó quy định các tính trạng kiểu hình như: độ lớn của cây, màu sắc hoa, dạng quả, hạt v.v Sau năm 1900, tức là sau khi tái phát hiện các quy luật Mendel, các nhà di truyền gọi các “nhân tố” Mendel là gen (gene, Johannson, 1909) và được xác định như là đơn vị chức năng quy định tính di truyền của cơ thể sống và học thuyết thể nhiễm sắc của di truyền xác định rằng “gen được chứa trong các thể nhiễm sắc”. 8.3.1 Cấu trúc của gen Theo quan điểm hiện đại thì gen được xác định là một đoạn ADN chứa mã quy định cho một polipeptit. Nhưng khái niệm gen được mở rộng hơn ở chỗ người ta phân biệt: gen cấu trúc - đoạn ADN có chứa mã để tổng hợp polipeptit; gen điều chỉnh, gen vận hành v.v. là các đoạn ADN đóng vai trò điều chỉnh hoạt động của gen cấu trúc. Ngoài ra còn có các gen rARN và tARN là các đoạn ADN chứa mã cho các rARN và tARN. Người ta thường đánh giá độ lớn của gen bằng độ dài của đoạn ADN thể hiện bằng số cặp nucleotit có trong gen. Độ lớn của gen tùy thuộc vào loại gen, ví dụ gen cấu trúc, gen rARN hay gen tARN v.v Bình thường gen cấu trúc có độ lớn từ 1.000 - 2.000 cặp nucleotit, nhưng nếu là gen khảm số nucleotit của gen có thể đạt tới vài trăm nghìn đến hàng triệu cặp nucleotit. Như vậy, cấu trúc của gen và tổ chức của hệ gen (genom) - tập hợp tất cả gen và ADN của một cơ thể là vô cùng phức tạp. Hệ gen của Eucaryota có tổ chức rất đa dạng và phức tạp gồm các thành phần sau:
- 19 1.3.1.1 Gen cấu trúc (structure genes) Gen cấu trúc là các gen chứa các cặp nucleotit mã hóa cho polipeptit, khi phiên mã sẽ cho ra mARN và khi dịch mã cho ra protein. Có loại gen cấu trúc trong trình tự nucleotit chỉ chứa các cặp nucleotit khi phiên mã cho ra mARN được dùng làm khuôn để dịch mã ngay. Loại gen cấu trúc này thường gặp ở vi khuẩn. Ở vi khuẩn nhiều gen cấu trúc thường tập hợp thành cụm được gọi là operon, ví dụ operon lac ở E. coli gồm 3 gen cấu trúc (mã cho 3 enzym khác nhau) xếp kế tiếp nhau và khi phiên mã chúng được phiên mã đồng thời. Có loại gen cấu trúc trong trình tự nucleotit có chứa các đoạn exon xen kẽ với đoạn intron. Những gen như thế được gọi là gen khảm. Gen khảm thường quan sát thấy ở tế bào vi khuẩn cổ (Archaea) và ở tế bào nhân chuẩn (Eucaryota). Đoạn exon là đoạn nucleotit được phiên mã và sẽ được dịch mã cho ra polipeptit. Đoạn intron là đoạn nucleotit được phiên mã nhưng không được dịch mã và sẽ bị cắt bỏ trong qúa trình xử lý ARN. Gen khảm thường có độ dài rất lớn có thể chứa từ hàng chục nghìn đến hàng triệu cặp nucleotit, ví dụ ở người, gen mã hóa cho protein distrophin có độ dài 2,4 triệu cặp nucleotit và chứa 79 exon. Các gen khảm khi phiên mã sẽ cho ra các tiền mARN. Các tiền mARN sẽ bị xử lý, chế biến để cắt bỏ các đoạn intron và nối các đoạn exon tạo nên mARN chín - chỉ chứa các codon qui định axit amin. Cấu trúc gen khảm có ý nghĩa nhất định trong qúa trình tiến hóa và là cơ sở để tạo nên các tổ hợp gen ở mức độ các mARN (xem phần sau). Phụ thuộc vào gen cấu trúc còn có các đoạn promotor, enhancer hoặc silencer là các đoạn ADN chứa nucleotit có vai trò điều hòa sự phiên mã, nhưng bản thân chúng không được phiên mã. Ngoài ra trong gen còn chứa các đoạn nucleotit báo hiệu sự khởi đầu (mã khởi đầu - AUG) và đoạn nucleotit báo hiệu kết thúc phiên mã (mã kết thúc - UAA, UAG, UGA) . Promotor (còn được gọi là gen vận hành) là đoạn nucleotit nằm ngay phía trước gen, có vai trò là nơi liên kết của enzym phiên mã ARNpolimeraza và tác động phiên mã chỉ xảy ra theo một chiều. Trong lúc đó enhancer (còn được gọi là gen tăng cường) và silencer (còn được gọi là gen im lặng hay gen bất hoạt) là đoạn nucleotit dài hơn có thể định vị ở phía trước, phía sau hoặc phía trong gen, chúng tác động theo cả hai chiều và có thể tác động phối hợp với promotor điều chỉnh hoạt động của gen khi ở cách xa gen. Cơ chế tác động điều chỉnh của promotor cũng như của enhancer thể hiện ở chỗ chúng chứa vùng nucleotit đặc thù là nơi bám của các protein điều chỉnh (xem phần sau). 1.3.1.2 Gen điều chỉnh (regulator genes) Gen điều chỉnh là các gen chứa các cặp nucleotit mã hóa cho các protein có vai trò điều chỉnh sự phiên mã của các gen cấu trúc và điều chỉnh sự phát triển cá thể (thông qua sự phiên mã và dịch mã). Hoạt động của operon lac của E. coli được điều chỉnh bởi gen điều chỉnh R, gen này hoạt động sẽ sản sinh ra protein ức chế R có tác động ức chế hoạt động của operon lac. Nhiều đoạn ADN đặc trưng không chứa mã, đóng vai trò điều chỉnh hoạt động của gen cấu trúc (được gọi là ADN điều chỉnh) bằng cách liên kết với các protein điều chỉnh. 1.3.1.3 Các gen rARN và gen tARN Gen rARN là những gen chứa các cặp nucleotit khi phiên mã sẽ cho ra các rARN, gen tARN là những gen chứa các cặp nucleotit khi phiên mã sẽ cho ra các tARN tương ứng. Các gen rARN và tARN thường là các gen đa bản.
- 20 1.3.1.4 Các gen đơn bản và gen đa bản Nhiều gen có trong hệ gen là gen đơn bản nghĩa là chỉ có một trình tự nucleotit độc nhất, nhưng có nhiều gen là gen đa bản nghĩa là có nhiều bản về trình tự của gen đó - gen lặp, ví dụ gen mã hóa histon có tần số lặp từ 20 - 1000 bản, các gen tARN và rARN cũng đều là những gen đa bản. Trong những trường hợp cần thiết tất cả các bản của gen đa bản đều có thể phiên mã cho ra mARN (tARN hoặc rARN) và dịch mã cho ra nhiều protein nhằm đáp ứng kịp thời hoạt động sống của tế bào và cơ thể. Ví dụ, trong giai đoạn chín của noãn bào của động vật các gen đa bản rARN được phiên mã hàng loạt để tạo nên rất nhiều rARN xây dựng nên hàng tỷ riboxom đáp ứng kịp thời cho sự tổng hợp các chất dinh dưỡng của noãn hoàng trứng. 1.3.1.5 Các gen nhảy (transposons) Gen nhảy hay còn được gọi là yếu tố ADN di động (transposable element) là đoạn nucleotit có khả năng di chuyển vị trí ngay trong nội bộ một thể nhiễm sắc hoặc từ thể nhiễm sắc này sang thể nhiễm sắc khác. Gen nhảy có vai trò trong sự tái tổ hợp lại hệ gen. Gen nhảy lần đầu tiên được Barbara McKlintock phát hiện và nghiên cứu ở cây ngô từ những năm 40 của thế kỉ XX (Bà nhận được giải thưởng Nobel vào năm 1983), nhưng phải chờ đến những năm 70 - 80 với sự tiến bộ của kĩ thuật phân tích di truyền người ta mới hiểu rõ được cấu trúc và cơ chế hoạt động của transposon. Transposon được tìm thấy ở vi khuẩn, nấm, thực vật, động vật và con người. + Gen nhảy ở Prokaryota Loại transposon đơn giản nhất được tìm thấy ở vi khuẩn gọi là đoạn trình tự xen hay đoạn xen (Insertion Sequences - IS), đó là những đoạn ngắn, nucleotit xếp xen kẽ vào trong gen hoặc trong plasmid. Trường hợp điển hình IS gồm 2500 cặp nucleotit và chỉ chứa các gen mã hóa cho các protein, có vai trò phát động hoặc điều chỉnh sự chuyển dịch vị trí. Nhiều loại IS ở vi khuẩn đã được nghiên cứu. Loại IS bé nhất gồm 768 cặp nucleotit được gọi là IS1. Các loại IS đều có đoạn trình tự ngắn tương đối giống nhau ở hai đầu cuối được gọi là đoạn lặp cuối ngược chiều (inverted terminal repeats) chứa khoảng 9 - 40 cặp nucleotit. Ví dụ: ACCGTCGGC CGGCTGCCA TGGCAGCCG GCCGACGGT Đoạn lặp cuối này có vai trò quan trọng trong sự chuyển dịch của transposon. Những đột biến xảy ra trong đoạn này đều làm mất khả năng chuyển dịch của transposon. Sự chuyển dịch của transposon là nhờ có enzym transposaza, enzym này có vai trò bám vào ADN và cắt đoạn dịch chuyển và tách chúng khỏi ADN và ghép chúng vào vị trí mới của phân tử ADN đó hoặc phân tử ADN khác. Enzym transposaza thường được mã hóa trong trình tự nucleotit của IS. Khi một IS được ghép xen vào phân tử ADN nhận (hoặc plasmid nhận) sẽ gây nên sự nhân đoạn (duplication) ở vùng đó của ADN. Trong phân tử ADN nhận, nơi mà IS được ghép vào là nơi có đoạn lặp cùng chiều (direct repeat) gồm khoảng 2 - 13 cặp nucleotit. Ví dụ: ATGCA ATGCA TACGT TACGT Như vậy, sau khi được lắp ghép, IS sẽ nằm xen vào giữa hai đoạn lặp cùng chiều của phân tử nhận và phân tử ADN nhận sẽ có trình tự nucleotit như sau: ATGCA.ACCGTCGGC CGGCTGCCA.ATGCA
- 21 TACGT.TGGCAGCCG GCCGACGGT.TACGT Trong hệ gen của vi khuẩn, ví dụ E. coli mỗi loại IS có thể có vài bản sao. Ví dụ, IS1 có từ 6 - 10 bản sao. IS có thể tồn tại trong hệ gen hoặc trong plasmid. Ví dụ trong plasmid F (là plasmid qui định tính tiếp hợp của E. coli) có hai IS khác nhau, đó là IS2 và IS3. Khi hai IS này được dịch chuyển sang hệ gen của cá thể E. coli nào đó thì cá thể có hệ gen tổ hợp này trở nên có khả năng tiếp hợp, nghĩa là trao đổi vật chất di truyền giữa hai cá thể để tạo nên ADN tái tổ hợp, tức là tạo nên đa dạng di truyền trong quần thể vi khuẩn v.v Ngoài những IS, ở vi khuẩn còn có các đoạn xen có khả năng di chuyển có kích thước lớn hơn nằm xen vào giữa hai IS, được gọi là transposon (Tn). Ví dụ, Tn9 với hai IS1 ở hai bên, chứa gen camR (gồm 2.500 cặp nucleotit) qui định tính chống chịu cloramphenicol của vi khuẩn. Tn5 gồm hai IS50 chứa ba gen kanR, bleR, và strR (gồm 5.700 cặp nucleotit) qui định tính chống chịu kanamixin, bleomixin, và treptomixin. Tn10 gồm hai IS10 chứa gen tetR (gồm 9.300 cặp nucleotit) qui định tính chống chịu tetraxiclin của vi khuẩn. Đặc biệt là các IS của các Tn có thể mã hóa cho các enzym và protein có vai trò trong sự chuyển dịch của Tn. Ví dụ, đoạn IS50 có chứa gen mã hóa cho enzym transposaza cần cho sự cắt và dịch chuyển của Tn. Nghiên cứu gen nhảy ở vi khuẩn có tầm quan trọng đối với Y - Dược học. Sự ra đời và sử dụng thuốc kháng sinh đã là cuộc cách mạng trong việc chữa trị các bệnh nhiễm trùng. Nhưng càng ngày vi khuẩn gây bệnh càng trở nên nhờn thuốc. Nhân loại đã từng vui sướng khi cho rằng bệnh lao đã được loại trừ ra khỏi đời sống, nhưng càng ngày tần số người bị nhiễm lao và chết vì lao càng gia tăng. Tại sao vậy? Bởi vì vi khuẩn lao đã chống chịu được (nhờn thuốc) với tác động của kháng sinh kể cả thuốc đa kháng sinh và với liều cao. Các hãng dược phẩm đang có cuộc chạy đua với tính kháng thuốc của vi khuẩn. Tại sao vi khuẩn xuất hiện tính kháng thuốc? Các nhà khoa học đã phát hiện là tính kháng thuốc của vi khuẩn có liên quan đến tính biến dị di truyền của vi khuẩn và đặc biệt liên quan đến các gen nhảy. Đa số Tn của vi khuẩn đều chứa gen chống chịu thuốc kháng sinh. Chúng có thể di chuyển từ phân tử ADN này sang phân tử ADN khác, từ hệ gen này sang hệ gen khác, từ cá thể này sang cá thể khác và kết quả là gen kháng thuốc được phổ biến rộng trong quần thể vi khuẩn và hậu quả là các thuốc kháng sinh sẽ sớm mất tác dụng chống bệnh. Qúa trình này đã được quan sát thấy trong nhiều chủng gây bệnh ở người, ví dụ các chủng Staphylococcus, Enterococcus, Neisseria, Shigella và Samonella. Hiện nay, nhiều bệnh nhiễm trùng do vi khuẩn như bệnh lỵ, lao, lậu v.v. rất khó chữa khỏi, nhiều trường hợp bị tử vong vì vi khuẩn gây bệnh nhờn với nhiều loại kháng sinh khác nhau. Đặc biệt tính kháng thuốc được lan truyền nhanh trong quần thể vi khuẩn là do các plasmid R tiếp hợp (conjugative R plasmids) có chứa gen đề kháng. Những plasmid này có hai cấu thành: một, được gọi là nhân tố chuyển kháng (RTF) chứa các gen cần thiết cho sự chuyển gen bằng cách tiếp hợp giữa các tế bào; cấu thành thứ hai được gọi là thể quyết định R chứa gen đề kháng. Các gen đề kháng này thường nằm trong transposon xếp xen kẽ trong plasmid. Các plasmid R tiếp hợp có thể được chuyển giao giữa các vi khuẩn trong quần thể, thậm chí giữa các loài khác nhau, ví dụ giữa Coccus và Bacillus. Như vậy, tính kháng thuốc một khi đã có ở một bộ phận nhỏ sẽ được lan truyền nhanh chóng cho các bộ phận khác của quần thể vi khuẩn. + Gen nhảy ở Eucaryota Người ta đã phát hiện nhiều loại gen nhảy ở nhiều nhóm sinh vật nhân chuẩn. Chúng rất đa dạng về độ lớn và cơ chế hoạt động, nhưng đều có điểm chung là được xếp xen kẽ vào hệ
- 22 gen và sử dụng enzym transposaza để di chuyển từ vị trí này sang vị trí khác của phân tử ADN. Ở cây ngô các gen nhảy Ac và Ds đã được Barbara McClintock phát hiện và nghiên cứu. Chúng qui định tính biến dị thiếu áo và hạt đốm ở bắp ngô. Bà đã giả thiết là có hai nhân tố Ac và Ds qui định tính đột biến này và chúng là những yếu tố có thể di chuyển từ thể nhiễm sắc này sang thể nhiễm sắc khác. Về sau các nhà di truyền học phân tử đã xác định Ac và Ds thuộc họ gen nhảy (transposons). Trong hệ gen của ngô chứa rất nhiều bản Ac và Ds. Chúng có thể di chuyển và ghép xen vào trong gen gây nên đột biến gen. Kĩ thuật giải trình tự nucleotit cho thấy đoạn Ac gồm 4.563 cặp nucleotit được bao bởi đoạn lặp ngược chiều gồm 11 cặp nucleotit. Đoạn lặp này cần thiết cho sự di chuyển của Ac. Khi đã được di chuyển sang ADN nhận, chúng được bao bởi đoạn lặp cùng chiều gồm 8 cặp nucleotit. Ds cũng thuộc họ gen nhảy với Ac và sự hoạt động chuyển dịch vị trí đều phụ thuộc vào sự hoạt động tương tác của Ac và Ds. Ở ruồi quả Drosophila melanogaster, gen nhảy được nghiên cứu nhiều nhất là yếu tố P. Yếu tố P gây nên tính đột biến bất thường ở ruồi. Yếu tố P có trong thể nhiễm sắc của dòng bố (paternel) (nên được gọi là yếu tố P) là gen nhảy. Chúng gồm có 2.907 cặp nucleotit với đoạn lặp ngược chiều gồm 31 cặp nucleotit. Yếu tố P có chứa gen mã hóa cho enzym transposaza. Nhờ transposaza yếu tố P có thể chuyển dịch sang vị trí mới của hệ gen. Trong hệ gen của ruồi quả có thể có từ vài bản đến 50 bản yếu tố P. Điều đáng ngạc nhiên là trước năm 1950 người ta không phát hiện được yếu tố P trong các quần thể ruồi. Vì vậy, các nhà di truyền học đã giả thiết rằng yếu tố P được di nhập vào hệ gen của ruồi từ các virut kí sinh trong tế bào ruồi. Cũng tương tự như vậy, các yếu tố IS trong hệ gen vi khuẩn E. coli là có nguồn gốc từ thể thực khuẩn thông qua hiện tượng tải nạp di truyền (genetic transduction). Ngoài ra ở ruồi quả còn phát hiện thấy gen nhảy mariner gồm 1286 cặp nucleotit với đoạn lặp ngược chiều gồm 28 cặp nucleotit. Điều đặc biệt là gen nhảy mariner còn được phát hiện ở nhiều loài côn trùng, ở giun tròn, ở nấm và cả ở người. Đáng ngạc nhiên là gen nhảy mariner ở ruồi quả cũng tương tự như ở ong mật (đứng về mặt tiến hóa chúng cách xa nhau hàng trăm triệu năm), vì vậy các nhà di truyền học cho rằng gen nhảy mariner đã được chuyển giao giữa các loài côn trùng với nhau hoặc thông qua virut kí sinh khi chúng lây nhiễm từ vật chủ này sang vật chủ khác và mang theo gen nhảy ghép vào trong hệ gen của vật chủ. Trong hệ gen của nhiều động vật không xương sống và động vật có xương sống, người ta cũng đã phát hiện gen nhảy Tc1 tương tự như mariner nhưng lớn hơn, chứa khoảng 1.700 cặp nucleotit. + Các Retrotransposon Trong genom của Eucaryota ngoài các gen nhảy có bản chất ADN, còn có các yếu tố di động có nguồn gốc từ ARN được gọi là retrotransposon. Có hai loại retrotransposon: một loại giống như retrovirut (virutARN) nghĩa là giống với ARN của virut và thông qua sự phiên mã ngược thành ADN để nhân bản phổ biến và một loại có liên quan đến ARN của tế bào được gọi là retroposon. Loại yếu tố giống retrovirut, ví dụ Ty1 transposon tìm thấy ở Nấm men Saccharomyces cerevisiae là đoạn ADN chứa khoảng 5900 cặp nucleotit. Có chủng có tới 35 bản Ty1. Ty1 chỉ chứa hai gen là gen TyA và gen TyB giống với gen gag và gen pol của retrovirut và sản phẩm protein của chúng trong tế bào Nấm men cũng giống của virut. ADN của Ty1 là có nguồn gốc từ sự phiên mã ngược từ ARN. Trong qúa trình dịch chuyển của Ty1 thì ARN được phiên mã từ ADN của Ty1, sau đó ARN sẽ được phiên mã ngược thành ADN Ty1 (nhờ enzym revertaza do gen Ty1B mã hóa). ADN Ty1 mới được ghép nối vào ADN nhận để hình thành nên Ty1
- 23 mới. Các yếu tố di động giống retrovirut cũng được tìm thấy ở ruồi quả, ví dụ yếu tố copia, yếu tố gypsy đều chứa những gen giống với gen của retrovirut. Retroposon là loại retrotransposon rất phổ biến trong giới động vật: đó là các yếu tố F, G và I tìm thấy ở ruồi quả; các yếu tố LINE tìm thấy ở động vật có vú và ở người. Chúng có đặc tính là những đoạn ADN không chứa các đoạn lặp ở cuối và khi dịch chuyển vị trí phải thông qua ARN và sự phiên mã ngược thành ADN nhờ enzim revertaza do chúng mã hóa. Một đặc tính điển hình nhất của các retroposon là đều có nguồn gốc từ sự phiên mã ngược từ các ARN có phần tận cùng chứa nhiều nucleotit lặp poliA. Đối với con người retroposon LINE1 (còn gọi là L1) được phát hiện từ năm 1988 và được nghiên cứu nhiều nhất. Bình thường L1 có trong thể nhiễm sắc số 22 và khi chúng dịch chuyển vào gen liên kết với thể nhiễm sắc X (gen này mã hóa cho protein là nhân tố VIII của sự đông máu), gây nên đột biến và kết quả là gây bệnh hay chảy máu (hemophilia) ở người. Điều đáng ngạc nhiên là ở khỉ đột Gorilla cũng tìm thấy yếu tố L1 trong thể nhiễm sắc số 22 của chúng, có nghĩa là L1 đã xuất hiện trước khi Người và Vượn người phân hóa thành hai nhánh cách đây trên 6 triệu năm. Trong hệ gen của Người có thể có từ 50000 - 100000 bản sao L1 và chiếm tới 5% ADN của hệ gen. + Ý nghĩa tiến hóa của gen nhảy Gen nhảy là cấu thành rất phổ biến và lâu đời của hệ gen. Đối với một số loài, gen nhảy chiếm số lượng khá nhiều, ví dụ ở ruồi quả, chúng chiếm tới 12 - 15% ADN của hệ gen. Như vậy, rõ ràng là gen nhảy là cấu thành quan trọng của hệ gen. Chúng có vai trò gia tăng tần số đột biến, ví dụ ở ruồi quả Drosophila một nửa đột biến ngẫu nhiên là do gen nhảy tạo nên. Như vậy, gen nhảy có vai trò gì trong qúa trình tiến hóa? Gen nhảy từ đâu đến? Chúng là thành phần cấu trúc của hệ gen hay chỉ là phân tử kí sinh? Nhiều nghiên cứu ở nhiều đối tượng khác nhau đã chứng minh rằng gen nhảy là cấu thành quan trọng của hệ gen và đóng vai trò quan trọng trong sự tiến hóa của cấu trúc thể nhiễm sắc. Người ta đã xác định được ở ruồi quả có khoảng 40 họ gen nhảy khác nhau. Mỗi họ có thể có từ 20 – 80 thành viên. Với khả năng di động di chuyển vị trí, các gen nhảy tạo nên sự tổ hợp lại hệ gen làm cho hệ gen càng đa dạng. Hơn nữa gen nhảy còn gia tăng tần số đột biến. Các gen nhảy có thể được xếp xen kẽ vào các đoạn exon, các đoạn intron hoặc vào vùng ADN điều chỉnh của gen và tạo nên các đột biến gen rất đa dạng. Tuy nhiên, những đột biến mới do sự di chuyển vị trí của gen nhảy xảy ra hiếm hơn cơ chế kiểm soát chặt chẽ sự di chuyển của đa số gen nhảy. Về nguồn gốc của gen nhảy có tác giả cho rằng gen nhảy là do sự phân hóa ngay trong hệ gen của tế bào. Về nguồn gốc các retrotransposon là có thể có nguồn gốc từ các retrovirut bị biến đổi và bắt nhốt vào hệ gen vật chủ hoặc do các retrovirut mang theo khi lây nhiễm từ vật chủ này sang vật chủ khác. Ngày nay các kĩ thuật tách chiết, nhân bản, giải trình tự và chuyển ghép gen nhảy là một công cụ quan trọng của công nghệ gen và công nghệ tế bào. 8.3.2 Hệ gen (genome). Tổ chức của hệ gen Có thể xem hệ gen là một tập hợp tất cả ADN của một cơ thể trong đó bao gồm cả ADN tạo nên các gen cấu trúc, gen điều chỉnh, các gen rARN và tARN, các ADN điều chỉnh cùng tất cả các loại ADN khác. Cơ thể đơn bội (n) có chứa một genom, cơ thể lưỡng bội (2n) chứa hai genom bao gồm genom của bố và genom của mẹ. Trong tế bào và cơ thể đơn bội, gen không có alen, còn trong tế bào và cơ thể lưỡng bội gen có alen tương ứng: một gen có nguồn gốc từ bố và một
- 24 gen có nguồn gốc từ mẹ. Gen và alen của nó định khu trong cùng locut của cặp thể nhiễm sắc tương đồng. Hàm lượng ADN trong genom ở các cơ thể khác nhau là rất khác nhau và tổ chức của genom phản ánh mức độ tiến hóa của loài. 1.3.2.1 Độ lớn của hệ gen Độ lớn của hệ gen được đánh giá bằng hàm lượng ADN chứa trong tế bào thể hiện ở số lượng cặp nucleotit và chúng rất khác nhau ở các nhóm phân loại khác nhau. Qua qúa trình tiến hóa, hệ gen của các sinh vật ở mức độ tiến hóa cao hơn có hàm lượng ADN nhiều hơn. Tất nhiên, mức độ tiến hóa không chỉ thể hiện ở hàm lượng ADN trong hệ gen mà thể hiện chủ yếu ở tổ chức của hệ gen. + Đối với tế bào Prokaryota Hệ gen của Prokaryota là phân tử ADN xoắn kép, trần, dạng vòng và được định vị trực tiếp trong tế bào chất. Hàm lượng ADN trong hệ gen của Prokaryota khoảng 0,7 x 106 đến 107 cặp nucleotit, chứa khoảng vài trăm đến hàng nghìn gen. Hệ gen của vi khuẩn, ví dụ của E. coli là phân tử ADN xoắn kép có dạng vòng chứa khoảng 4,64 x 106 cặp nucleotit, chứa 4397 gen (mã hóa cho hàng nghìn protein qui định nên các đặc tính hình thái và sinh lý của vi khuẩn) nếu ta cắt và kéo dài ra thì phân tử ADN có chiều dài khoảng 1,6mm và rộng khoảng 2,4nm, như vậy nó dài hơn tế bào E. coli hàng nghìn lần, vì vậy trong tế bào vi khuẩn (có độ lớn vài μm) phân tử ADN phải cuộn gấp tạo thành thể chắc được gọi là nucleoid (thể tương tự nhân). Đối với một số ít vi khuẩn, ADN có dạng xoắn kép thẳng, ví dụ vi khuẩn Borrelia burgdorferi có ADN mạch thẳng với độ dài 910.000 cặp nucleotit chứa 853 gen. Hệ gen của vi khuẩn không chứa các đoạn intron (trừ vi khuẩn cổ). Một đặc tính tổ chức của hệ gen vi khuẩn là các gen cấu trúc cùng với các phần điều chỉnh thường tập hợp thành đơn vị operon. Ví dụ operon lac ở E. coli gồm có ba gen cấu trúc với operator và promotor riêng. Ngoài ra trong tế bào vi khuẩn còn có một số phân tử ADN bé hơn (chứa từ 1.000 - 100.000 cặp nucleotit) có cấu tạo dạng thẳng hoặc dạng vòng được gọi là plasmid. Plasmid có thể tồn tại độc lập với genom hoặc có thể nhập vào genom tạo nên ADN tái tổ hợp. Plasmid có thể được di chuyển từ vi khuẩn sang vi khuẩn khác. Trong Plasmid chứa một số gen qui định một số đặc tính của vi khuẩn như tính chống chịu được môi trường khắc nghiệt, ví dụ gen chống chịu kim loại độc; gen chuyển hóa các hóa chất đặc biệt như: toluen, naphtalen, các sản phẩm dầu mỏ v.v. gen chống chịu thuốc kháng sinh. Một số chất độc của vi khuẩn gây bệnh cho động vật và thực vật cũng do plasmid qui định. Một đặc tính quan trọng của plasmid là nó qui định tính tiếp hợp giữa hai tế bào vi khuẩn qua đó chúng trao đổi gen cho nhau. Cũng vì vậy mà công nghệ gen đã sử dụng plasmid như là vectơ chuyển gen, đồng thời dùng plasmid để tạo các chủng vi khuẩn tái tổ hợp có đặc tính mong muốn sử dụng trong y học và công nghệ môi trường. Với kỹ thuật giải trình tự hệ gen các nhà công nghệ gen đã tiến hành giải trình tự hệ gen của nhiều loài vi khuẩn, đặc biệt là các vi khuẩn gây bệnh hoặc vi khuẩn có tầm quan trọng đối với công nghệ vi sinh vật. Điều này cho phép các nhà công nghệ gen biết được cấu trúc và hoạt động của hệ gen (tạo ra hệ protein) từ đó sử dụng chúng cho mục đích y dược học (tạo vacxin phòng chống bệnh, tạo kháng sinh đặc hiệu chống nhờn thuốc v.v.), mục đích công nghệ sản xuất các chế phẩm công nghiệp lên men (tạo chủng có năng xuất cao nhất), công nghiệp thực phẩm (bia, rượu, nước giải khát, chất dinh dưỡng: sữa, bơ, phò mát, axit amin
- 25 không thay thế v.v.), công nghiệp hóa chất (chất phụ gia, mỹ phẩm, hóa chất tẩy rửa, nhuộm màu, xăng etanol, xăng hidro v.v.), công nghệ xử lý rác thải làm sạch môi trường v.v + Đối với tế bào Eucaryota Trong tế bào Eucaryota, ADN liên kết với protein histon tạo nên cấu trúc thể nhiễm sắc chứa trong nhân tế bào. Hệ gen đơn bội của chúng chứa tới 108 (ở nấm, tảo, động vật đơn bào) cho tới 1011 cặp nucleotit (thực vật và động vật đa bào) tức là vào khoảng 6.000 gen (ví dụ nấm men) cho tới vài chục nghìn gen. Ví dụ hệ gen đơn bội của người chứa từ 3 x109 đến 3,2 x109 cặp nucleotit và chứa khoảng từ 25.000 đến 35.000 gen. Số lượng gen này được chứa trong ADN của 23 thể nhiễm sắc (22 thể nhiễm sắc thường và một thể nhiễm sắc giới tính X hoặc Y). Ngoài ra trong tế bào người (cũng như ở các tế bào nhân chuẩn khác) còn có hệ gen ty thể chứa các phân tử ADN ty thể có cấu tạo xoắn kép dạng vòng, trần (giống ADN vi khuẩn). Mỗi ty thể của tế bào người chứa 10 phân tử ADN và mỗi phân tử ADN có 16.569 cặp nucleotit, chứa 13 gen (không có đoạn intron) mã hóa cho protein riêng của ty thể. Ở các cơ thể nhân chuẩn quang hợp thì trong lục lạp cũng có hệ gen lục lạp chứa các ADN lục lạp có cấu tạo xoắn kép dạng vòng (giống ADN vi khuẩn lam). Ví dụ trong lục lạp của cây lúa, ADN lục lạp có 136.000 cặp nucleotit và chứa hàng trăm gen. ADN ty thể và ADN lục lạp được gọi là ADN ngoài nhân chứa các gen tế bào chất (plasmogen) và là cơ sở của di truyền tế bào chất. Bảng 2.1 Hàm lượng ADN trong tế bào của các cơ thể sinh vật Độ lớn của hệ gen Cơ thể (106 cặp Nu) + Prokaryota + + - Mycoplasma genitalium + 0,58 + - Escherichia coli + 4,64 + - Bacillus megaterium + 30 + Eucaryota + + Nấm + + - Saccharomyces cerevisiae (Nấm men) + 12,1 + - Aspergillus nidulans + 25,4 + Động vật đơn bào + + - Tetrahymena pyriformis + 190 + Động vật không xương sống + + - Caenorhabditis elegans (giun tròn) + 100 + - Drosophila melanogaster (ruồi quả) + 140 + - Bombyx mori (tằm dâu) + 490 + - Strongylocentrotus purpuratus (cầu gai) + 845 + - Locusta migratoria (châu chấu) + 5.000 + Động vật có xương sống + + - Fugu rubripes (cá Fugu) + 400 + - Rana esculenta (ếch) + 15.000 + - Salamandra sp. (sa giông) + 90.000
- 26 + - Mus musculus (chuột nhắt) + 3.300 + - Homo sapiens (người) + 3.200 + Thực vật + + - Arabidopsis thaliana (rau talia) + 100 + - Oryza sativa (lúa) + 565 + - Pisum sativum (đậu Hà lan) + 4.800 + - Zea mays (ngô) + 5.000 + - Triticum aestivum (lúa mì) + 17.000 + - Fritillaria assyriaca + 120.000 Khi phân tích hàm lượng ADN ở các cơ thể khác nhau người ta thấy là hàm lượng ADN tăng dần theo cấp độ tiến hóa nhưng không thấy có sự tương ứng hoàn toàn giữa hàm lượng ADN với độ phức tạp của cơ thể ở các bậc tiến hóa. Ví dụ như các loài thuộc lớp chân khớp ở mức độ tiến hóa cao có tổ chức cơ thể phức tạp có hàm lượng ADN dao động trong khoảng từ 108 - 1010 cặp nucleotit tương tự với nhóm động vật đơn bào là bọn ở mức tiến hóa thấp. Trong lớp lưỡng cư, hàm lượng ADN dao động rất lớn từ 109 - 1011 cặp nucleotit. Đối với con người ở đỉnh cao của tiến hóa nhưng hàm lượng ADN ít hơn so với nhiều các loài lưỡng cư. Đối với Eucaryota, tiến hóa của hệ gen không thể hiện ở hàm lượng ADN chứa trong hệ gen (xem bảng 2.1). Bảng 2.2 Hàm lượng ADN và số lượng gen chứa trong bộ thể nhiễm sắc đơn bội của người + Hàm + Số + Số + Nhóm lượng ADN + Số lượng gen/ NST NST + (triệu lượng gen + 1 cặp Nu) triệu cặp Nu + 1 + A + 279 + 3013 + 13 + 2 + A + 251 + 2230 + 10 + 3 + A + 221 + 1979 + 10 + 4 + B + 197 + 1406 + 8 + 5 + B + 198 + 1678 + 9 + 6 + C + 176 + 1802 + 11 + 7 + C + 163 + 1479 + 10 + 8 + C + 148 + 1154 + 9 + 9 + C + 140 + 1250 + 11 + 10 + C + 143 + 1261 + 10 + 11 + C + 148 + 1948 + 15 + 12 + C + 142 + 1648 + 12 + 13 + D + 118 + 715 + 8
- 27 + 14 + D + 107 + 1072 + 12 + 15 + D + 100 + 987 + 13 + 16 + E + 104 + 1222 + 15 + 17 + E + 88 + 1486 + 19 + 18 + E + 86 + 580 + 8 + 19 + F + 72 + 1730 + 27 + 20 + F + 66 + 856 + 14 + 21 + G + 45 + 351 + 10 + 22 + G + 48 + 787 + 23 + X + C + 163 + 1218 + 8 + Y + G + 51 + 128 + 6 Hơn nữa người ta cũng không quan sát thấy sự tương ứng giữa hàm lượng ADN và số lượng gen trong hệ gen. Ví dụ, nếu ta so sánh Nấm men Saccharomyces có hàm lượng ADN là 12,1x106 cặp nucleotit chứa tới 6.000 gen (đã được giải trình tự năm 1996) với người có hàm lượng ADN là 3.200x106 cặp nucleotit (gấp 250 lần so với Nấm men) thì hệ gen người phải chứa tới 1,5 triệu gen. Nhưng thực tế hệ gen người chỉ có khoảng 25.000 – 35.000 gen (đã được giải trình tự năm 2003). Như vậy, sự sai khác về tiến hóa trong hệ gen không chỉ thể hiện ở hàm lượng ADN mà còn thể hiện ở tính tổ chức của hệ gen. Nếu tính trung bình một gen có độ lớn khoảng 1.500 – 1.800 cặp nucleotit thì tế bào con người chứa khoảng hàng triệu gen mã hóa cho hàng triệu protein khác nhau. Nhưng hệ gen người chỉ có khoảng 25.000 gen, hơn nữa cấu trúc của gen phức tạp hơn nhiều, có thể chứa tới hàng chục nghìn, hàng trăm nghìn thậm chí hàng triệu cặp nucleotit (xem bảng 2.2). Như vậy, tại sao lại có một hàm lượng ADN khổng lồ trong hệ gen người? Để sáng tỏ được vấn đề này cần tìm hiểu mức độ tổ chức đa dạng và phức tạp của hệ gen. 1.3.2.2 Đặc tính tổ chức của hệ gen Tính đa dạng và phức tạp của hệ gen (genome) ở Eucaryota không chỉ thể hiện ở thành phần cấu trúc mà còn thể hiện ở sự sắp xếp của các gen trong hệ gen thể hiện ở chỗ: + Họ đa gen Nhiều gen thân thuộc sắp xếp liên kết thành họ đa gen. Các họ đa gen này cũng rất đa dạng nhưng đều thể hiện vai trò tổ hợp trong hoạt động của hệ gen đáp ứng nhu cầu của cơ thể trong qúa trình sinh trưởng và phát triển. Có họ đa gen mã hóa cho các họ protein có vai trò cấu trúc và chức năng như: actin, tubulin, collagen, keratin, protein màng nuôi, một số protein huyết tương, hemoglobin, một số protein màng, histon, protein noãn hoàng và protein kháng thể. Các gen trong họ đa gen là kết quả của sự nhân đoạn và đột biến hoặc tổ hợp từ gen gốc. Ví dụ ở người, trong tế bào nón và tế bào que (có vai trò thu nhận ánh sáng) tồn tại 4 gen mã hóa cho 4 loại protein khu trú trong màng sinh chất có chức năng thu nhận bức xạ ánh sáng khác nhau, 4 loại protein này đều thuộc họ rodopxin. Bốn gen này định vị thành một cụm trong thể nhiễm sắc X. Các bệnh sai
- 28 lệch về thị giác, đặc biệt là bệnh mù màu là có nguyên nhân đột biến trong họ gen rodopxin dẫn tới làm sai lệch cấu trúc phân tử của protein thuộc họ Rodopxin. Có họ đa gen không mã hóa cho protein mà là các gen chỉ phiên mã - đó là các gen rARN và tARN. + Sự định khu và sắp xếp của các gen Trong phân tử ADN các gen được sắp xếp tuyến tính nối tiếp nhau theo từng cụm cùng với các phần bổ trợ tạo nên các operon như ở vi khuẩn hoặc sắp xếp theo các họ đa gen như ở Eucaryota. Các gen cùng họ có thể giống nhau và xếp liên tiếp cạnh nhau như các gen rARN hoặc có thể là các gen khác nhau xếp liên tiếp cạnh nhau như các gen mã hóa cho globin của hemoglobin; hoặc có thể là các gen khác nhau định khu ở trong các thể nhiễm sắc khác nhau ví dụ họ gen – actin, họ gen – tubulin. - Giữa các gen trong họ gen, có các đoạn nucleotit đệm xen kẽ vào. Các đoạn đệm có thể phiên mã hoặc không, nhưng không được dịch mã. - Các gen định khu trong thể nhiễm sắc theo trình tự của các nucleotit xếp nối tiếp thẳng hàng liên tục, nhưng có rất nhiều gen sắp xếp theo kiểu nối ghép (split) tức có xen kẽ các đoạn intron (là đoạn nucleotit được phiên mã nhưng không được dịch mã) với đoạn exon (đoạn nucleotit được phiên mã và dịch mã). Ví dụ gen mã hóa cho vitellogenin A có đến 33 đoạn intron. Các gen có chứa các đoạn intron xen kẽ được gọi là gen phân tán hoặc gen khảm. Kiểu tổ chức theo kiểu gen khảm có vai trò quan trọng trong việc thực hiện cơ chế điều hòa hoạt động của gen, cũng như có vai trò trong tiến hóa. + Các đoạn ADN lặp Trong hệ gen của Eucaryota có rất nhiều trình tự nucleotit lặp với tần số lặp từ 3 đến 100.000 lần. Đoạn nucleotit lặp có thể chỉ chứa vài cặp nucleotit đến 300 cặp nucleotit hay nhiều hơn và có khi chiếm trên 40 - 50% ADN của hệ gen. Các đoạn lặp ngắn thường phân bố xen kẽ vào các gen cấu trúc. Có ý kiến cho rằng các cụm nucleotit lặp xen kẽ đóng vai trò điều hòa và tổ hợp hoạt động của các gen cấu trúc. Trong tổ chức của hệ gen, các nhân tố điều chỉnh hoạt động của gen được tăng cường theo con đường đa dạng hóa không chỉ tăng cường các yếu tố điều hòa tại chỗ – các đoạn ADN sắp xếp trước gen, xen kẽ trong gen mà còn bằng sự sắp xếp các gen theo định khu không gian (không tuyến tính) trong tổ chức thể nhiễm sắc tạo điều kiện cho sự phối hợp sự điều hòa hoạt động của gen cũng như tổ hợp lại các gen có sẵn tạo nên các gen mới. Tính đa dạng và phức tạp về tổ chức của hệ gen không chỉ thể hiện trong cấu tạo mà còn thể hiện ở cơ chế hoạt động và điều hòa hoạt động của gen. 8.4 S iu hòa hot ng ca gen 8.4.1 Điều hòa hoạt động của gen ở sinh vật nhân sơ Hệ gen của tế bào sinh vật nhân sơ có hàng trăm đến nghìn gen. Ở mỗi thời điểm chỉ có một số ít các gen hoạt động, đại bộ phận các gen khác ở trạng thái ức chế. Cơ chế điều hòa hoạt động của gen đã được F. Jacob và J. Monod là hai nhà khoa học người Pháp phát hiện ở vi khuẩn E.coli vào năm 1961.
- 29 Cơ chế điều hòa của gen phụ thuộc vào cấu trúc của hệ gen trong ADN, phụ thuộc vào các nhân tố trong tế bào và các nhân tố của môi trường. 1.4.1.1 Mô hình điều hòa cảm ứng Trong ADN, các gen có liên quan về chức năng thường được phân bố thành một cụm, có chung một cơ chế điều hòa được gọi là operon. Ví dụ: operon lac ở E.coli điều hòa tổng hợp các enzym (β-galactozidaza, transaxetilaza, permeaza v.v.) giúp chúng sử dụng đường lactozơ có trong môi trường. Operon lac gồm các thành phần: + Nhóm gen cấu trúc (structure gene - S) liên quan với nhau về chức năng nằm kề nhau (ví dụ các gen A, B, C) mã hóa cho các enzym (β-galactozidaza, transaxetilaza, permeaza). + Gen chỉ huy (operator gene - O): nằm trước các gen cấu trúc và là vị trí tương tác với protein ức chế. + Vùng khởi động (còn gọi là gen vận hành) (promotor - P): nằm trước gen chỉ huy đó là vị trí tương tác với enzym ARN polimeraza để khởi đầu phiên mã. Hình 1.5 Sơ đồ cơ chế điều hòa hoạt động của operon lac ở E. coli Sự hoạt động của operon chịu sự điều khiển của một gen điều hòa (regulator gene- R) nằm ở trước operon. Bình thường gen R tổng hợp ra một loại protein có tác dụng ức chế (được gọi là protein ức chế - repressor) gắn vào gen chỉ huy do đó enzym ARNpolimeraza không phiên mã được, gen cấu trúc ở trạng thái ức chế không hoạt động. Đó là trường hợp trong môi trường không có lactozơ. Trong trường hợp môi trường có lactozơ thì operon chuyển sang trạng thái hoạt động. Lactozơ đóng vai trò như nhân tố cảm ứng bằng cách liên
- 30 kết với protein ức chế, do đó protein ức chế không gắn vào O, nhờ vậy enzym phiên mã ARNpolimeraza tương tác được với P để phiên mã. Sơ đồ cơ chế điều hòa hoạt động của operon lac ở trạng thái ức chế (I) và trạng thái hoạt động (II) được mô tả trên hình 1.5. 1.4.1.2 Mô hình điều hòa ức chế Mô hình điều hòa ức chế thể hiện cơ chế điều hòa theo kiểu cảm ứng (hoạt hóa gen) xảy ra đối với các operon khi có chất cảm ứng là các cơ chất được vi khuẩn phân giải. Ngoài ra còn có cơ chế điều hòa theo kiểu ức chế (bất hoạt gen) đặc trưng cho các operon khi có chất ức chế là các sản phẩm được tổng hợp bởi vi khuẩn. Ví dụ, đối với operon trp là operon chứa các gen mã hóa cho enzym (triptophan xinthetaza) có vai trò tổng hợp axit amin triptophan cần cho vi khuẩn. Trường hợp vi khuẩn thiếu triptophan, operon trp hoạt động và sản sinh ra enzym, do đó triptophan được tổng hợp, nhưng khi lượng triptophan đã đủ thì chính triptophan lại trở thành chất ức chế hoạt động của operon trp. Triptophan được gọi là chất đồng ức chế, bởi vì trong trường hợp bình thường khi không có triptophan thì chất ức chế do gen R sản sinh ra không có hoạt tính nghĩa là không gắn vào O do đó operon trp hoạt động sản sinh ra enzym, còn khi có qúa nhiều triptophan thì triptophan sẽ liên kết với chất ức chế và phức hợp này sẽ gắn vào O và do đó ức chế hoạt động của operon. Nhân tố của môi trường tham gia vào cơ chế điều chỉnh hoạt động của gen có thể là các nhân tố nội bào (các sản phẩm của trao đổi chất) hoặc nhân tố đến từ môi trường. Chúng có thể đóng vai trò cảm ứng (hoạt hóa gen ví dụ lactozơ hoạt hóa operon lac) hoặc đóng vai trò ức chế (bất hoạt gen ví dụ triptophan ức chế operon trp). 8.4.2 Điều hòa hoạt động của gen ở sinh vật nhân chuẩn Cơ chế điều hòa hoạt động của gen ở sinh vật nhân chuẩn phức tạp hơn, do cấu trúc phức tạp của ADN trong thể nhiễm sắc. ADN trong các tế bào của sinh vật nhân chuẩn có khối lượng rất lớn tới hàng chục triệu, hàng tỉ cặp nucleotit. Chỉ có một phần nhỏ ADN mã hóa các thông tin di truyền (tạo nên các gen cấu trúc) còn đại bộ phận đóng vai trò điều hòa hoặc không hoạt động. Tế bào tổng hợp protein nhiều hay ít là do nhu cầu của từng tế bào hoặc tuỳ từng giai đoạn phát triển của cơ thể. ADN nằm trong thể nhiễm sắc có cấu trúc bện xoắn phức tạp cho nên trước phiên mã, thể nhiễm sắc phải tháo xoắn. Sự điều hòa hoạt động của gen ở sinh vật nhân chuẩn qua nhiều mức điều hòa, qua nhiều giai đoạn như: thể nhiễm sắc tháo xoắn, phiên mã, biến đổi sau phiên mã, dịch mã và biến đổi sau dịch mã. Trong cùng một loại tế bào, các loại mARN có tuổi thọ khác nhau. Các protein đã được tổng hợp xong vẫn tiếp tục chịu một cơ chế kiểm soát của các enzym. Enzym phân giải những protein bị sai lệch hoặc không còn cần thiết đồng thời tổng hợp các protein khác thay thế. Ở các sinh vật nhân chuẩn bên cạnh vùng khởi động (promotor) phiên mã người ta còn thấy có các yếu tố điều hòa khác như các gen tăng cường (enhancer), gen bất hoạt (gen im lặng- silencer). Các gen tăng cường tác động lên gen điều hòa gây nên sự biến đổi cấu trúc của nucleoxom; còn gen bất hoạt làm ngừng qúa trình phiên mã. Về tín hiệu, thì ngoài những tín hiệu đóng mở gen có trong tế bào chất hoặc đến từ môi trường thì còn có rất nhiều tín hiệu đến từ tế bào bên cạnh, từ các mô và cơ quan khác nhau,
- 31 ví dụ các chất sinh trưởng (growth factors), các hormon steroid là tín hiệu hoạt hóa gen. Về cơ chế thì phức tạp hơn thể hiện sự điều chỉnh theo nhiều cấp độ, lệ thuộc vào nhau và phối hợp với nhau. Trong tế bào soma của động vật có xương sống bậc cao có khoảng 20 - 20.000 gen hoạt động, thuộc 2 loại: - Những gen phổ biến còn được gọi là các “gen giữ nhà” (house keeping genes) là những gen chiếm đa số, hoạt động trong tất cả các dạng tế bào. Ví dụ, các gen mã hóa cho các enzym của qúa trình đường phân. - Những gen đặc thù chỉ hoạt động trong một số dạng tế bào. Các gen này chịu trách nhiệm trong sự biệt hóa tế bào về cấu tạo và chức năng. Các gen này hoạt động (mở) ở một số tế bào và không hoạt động (đóng) ở một số tế bào khác, ví dụ các gen mã hóa cho hemoglobin hoạt động trong dòng tế bào tuỷ xương biệt hóa thành hồng cầu, còn đối với các tế bào biểu bì da thì các gen mã hóa cho keratin ở trạng thái hoạt động, còn gen mã hóa cho hemoglobin bị đóng. 1.4.2.1 Cấp độ điều hòa Sự điều hòa hoạt động của gen thực hiện ở 9 cấp độ khác nhau: a/ Tổ chức của ADN trong thể nhiễm sắc bao gồm tổ chức phân tử, siêu hiển vi và hiển vi. b/ Sự phiên mã ADN thành ARN, bao gồm các nhân tố tham gia phiên mã như: các ARN polymeraza, các phức hợp nhân tố phiên mã, các nhân tố liên kết với vùng điều chỉnh của gen (nhân tố liên kết được gọi là TRANS, còn vùng ADN bị liên kết được gọi là CIS). c/ Qúa trình xử lý, chế biến ARN sau phiên mã, gồm qúa trình chín ARN. d/ Sự chuyên chở mARN từ dịch nhân qua lỗ màng nhân ra tế bào chất, nơi cần để dịch mã. e/ Sự dịch mã trên riboxom để tạo thành protein: protein cấu trúc, protein enzym hoặc protein điều chỉnh. f/ Sự tồn tại và phân giải của mARN - tuổi thọ của mARN. g/ Các biến đổi của protein sau dịch mã bao gồm sự gluxit hóa (glycosylation), sự photphorin hóa, sự tạo thành cấu trúc 3D. h/ Sự cung cấp protein đúng địa chỉ, nơi tế bào và cơ thể cần sử dụng. i/ Sử dụng và phân giải protein được tổng hợp. 1.4.2.2 Điều hòa hoạt động của gen trong phiên mã - Protein điều chỉnh (regulator proteins) + Các nhân tố điều hòa phiên mã là các protein (yếu tố TRANS) gắn vào ADN ở vùng điều chỉnh (yếu tố CIS) của gen. Các protein điều chỉnh có cấu trúc cấp 4 ở dạng nhị hợp (dimer) hoặc đa hợp (polymer) có chứa tối thiểu 3 vùng hoạt tính: vùng hoạt tính cần cho sự
- 32 nhị hợp hóa, vùng hoạt tính cần cho sự gắn kết với ADN và vùng hoạt tính cần cho sự điều hòa phiên mã (tương tác với ARN - polymeraza). + Protein điều chỉnh nhận biết trình tự nucleotit của vùng điều chỉnh của gen (gồm khoảng 6 nucleotit) có cả ở 2 mạch ADN. Mỗi mạch polipeptit của protein điều chỉnh gắn với một mạch ADN ở vùng điều chỉnh. + Khi protein điều chỉnh gắn vào ADN điều chỉnh sẽ tạo nên chỗ gấp cong của ADN. Góc gấp cong ADN thay đổi tuỳ theo loại protein điều chỉnh và có ảnh hưởng đến tốc độ hoạt động của gen. Đồng thời, protein điều chỉnh qua vùng hoạt tính thứ 3 sẽ liên kết với ARN - polymeraza II ở vùng promotor của gen để tạo nên chỗ gấp cong thứ hai và dẫn tới tạo nên những vòng bên ADN. Sự hình thành vòng bên tạo điều kiện cho sự điều hòa phiên mã bởi các vùng ADN ở cách xa nhau của mạch ADN ở dạng tuyến tính. + Cùng một gen có thể có nhiều vùng điều chỉnh gắn với các protein điều chỉnh khác nhau. Các vùng điều chỉnh này có tên gọi chung là “yếu tố trả lời” (reponse element-RE). Ví dụ, RE cho các tín hiệu hormon steroit. Hormon khuếch tán qua màng sẽ liên kết với protein - thụ thể nội bào tạo thành dimer và dimer sẽ gắn với ADN điều chỉnh. Ví dụ, RE cho AMP vòng (CRE). AMP vòng xuất hiện khi có tác động của hormon protein gắn với thụ thể màng và khi nồng độ AMP vòng tăng cao sẽ làm photphorin hóa protein-dimer được gọi là CREB (CRE binding protein), dimer này sẽ gắn vào ADN điều chỉnh tức là CRE. Cần nhớ rằng các protein điều chỉnh cũng được mã hóa bởi các gen điều chỉnh và bản thân các gen này cũng có vùng điều chỉnh riêng của mình. + Sự liên kết của protein điều chỉnh với vùng ADN điều chỉnh gây nên hiệu ứng hoạt hóa hoặc ức chế sự phiên mã (mở hoặc đóng gen) và kết quả là làm tăng cao hoặc giảm thiểu lượng mARN được tổng hợp tuỳ nhu cầu. Sự ức chế phiên mã là do sự gắn của protein đặc thù vào vùng ADN được gọi là vùng bất hoạt (silencer). Những protein đặc thù đó kiểm soát sự phiên mã của các gen mã hóa cho các protein của nơron (các protein tạo nên các tơ thần kinh (neurofilament), các protein tạo nên kênh natri v.v.). Sự kích thích phiên mã là do các protein điều chỉnh gắn vào vùng ADN được gọi là vùng tăng cường (enhancer). + Một số protein có tác động điều hòa sự phiên mã là cần thiết cho sự biệt hóa tế bào và mô. Ví dụ, protein MyoDI tác động trong sự biệt hóa các hợp bào cơ vân, hàm lượng của chúng thay đổi tuỳ theo các giai đoạn phát triển của hợp bào cơ vân. MyoDI là protein điều chỉnh phiên mã của các gen mã hóa cho các protein tạo nên các tơ cơ co rút và các protein tạo kênh ion trong màng sinh chất hợp bào cơ. Ở giai đoạn cơ bào (myoblast) hàm lượng MyoDI rất ít và được tăng cao ở giai đoạn hợp bào cơ chứa nhiều tơ cơ. Trong hợp bào cơ hàm lượng của chúng giảm khi cơ đã có phân bố thần kinh (hình thành xinap cơ-thần kinh) và sẽ tăng cao khi hợp bào cơ bị cắt mất dây thần kinh. Như vậy, MyoDI có tác động hoạt hóa các gen mã hóa cho các protein co rút hoặc protein kênh ion ở dạng “trưởng thành” của hợp bào cơ khi hợp bào cơ chưa có tiếp xúc thần kinh và khi đã hình thành tiếp xúc thần kinh các gen này sẽ bị ức chế. Protein MyoDI kết hợp cùng các protein khác cùng họ với MyoDI tác động nối tiếp nhau kiểm tra các giai đoạn biệt hóa của hợp bào cơ.
- 33 + Nhiều protein điều chỉnh có chứa vùng hoạt tính đặc biệt được gọi là vùng homeo (homeodomain), chúng chịu trách nhiệm trong sự biệt hóa của phôi giai đoạn sớm tức là kiểm soát sự phân cắt và phân cực của phôi. Đột biến của các gen mã hóa cho các protein này sẽ dẫn đến sai lệch và quái thai ở các phần khác nhau của cơ thể ở ruồi quả cũng như ở người. Những gen này vẫn có thể hoạt hóa ở cơ thể trưởng thành và protein do chúng qui định vẫn đóng vai trò điều chỉnh phiên mã cho các gen khác. - Tương tác giữa enzym ARN- polimeraza III với promotor + Mối tương tác giữa enzym ARN-polymeraza III với promotor cũng là nhân tố điều hòa hoạt động của gen. Promotor là đoạn ADN gồm một số trình tự nucleotit đặc thù có ái lực liên kết với ARN-polymeraza III để bắt đầu phiên mã. Số lượng promotor cũng như vị trí định khu của chúng trong gen cũng là nhân tố kiểm soát sự hoạt động của gen. Ví dụ, gen mã hóa cho enzym α -amilaza. Amilaza là enzym xúc tác thuỷ phân tinh bột thành maltozơ. Chúng được tổng hợp trong gan (để thuỷ phân glicogen) và trong tuyến nước bọt (để thuỷ phân tinh bột). Gen này có hai promotor và là gen khảm có chứa các đoạn intron và các đoạn exon S, L, 2, 3, v.v Trong tế bào gan, promotor nằm cạnh exon L được hoạt hóa và kết quả tạo nên amilaza trong gan. Trong tế bào tuyến nước bọt, promotor nằm cạnh exon S được hoạt hóa và tạo nên amilaza trong nước bọt. + Mạch ADN của Eucaryota nằm gấp khúc và nén trong cấu trúc thể nhiễm sắc tạo nên sự định vị không gian của các gen cũng như của các promotor, tạo điều kiện cho sự liên kết của ARN-polymeraza với promotor để điều hòa hoạt động của gen đáp ứng nhu cầu của tế bào. 1.4.2.3 Điều hòa hoạt động của gen sau phiên mã Điều hòa hoạt động của gen sau phiên mã thể hiện chủ yếu ở qúa trình chín và số phận tương lai của mARN. - Các mARN vừa được tổng hợp chưa thể dùng làm khuôn để dịch mã được gọi là tiền mARN (hay mARN sơ cấp), chúng cần được xử lý ghép nối (alternative splicing) tức là qúa trình cắt bỏ các đoạn intron và ghép nối các đoạn exon tạo thành nhiều mARN chín khác nhau có thể làm khuôn để dịch mã sản sinh nhiều protein khác nhau. Sự chế biến ghép nối có thể tạo nên mARN để dịch mã cho các iso của cùng protein trong cùng một tế bào hoặc trong các tế bào khác nhau, ví dụ một gen có thể sản sinh ra các dạng iso của protein dính kết NCAM 140 và 180kDa trong nơron và cơ vân và dạng 120kDa trong các tế bào thần kinh đệm (astrocyte). Sự chế biến ghép nối có thể tạo nên các mARN để dịch mã cho 2 loại protein khác nhau, trong 2 loại tế bào khác nhau, ví dụ cùng một gen nhưng trong tế bào cạnh nang của tuyến giáp sẽ sản sinh ra hormon calcitonin, còn trong nơron vận động lại sản sinh ra CGRP (Calcitonin Gene Related Peptide) là chất trung gian thần kinh. - Các qúa trình khác trong sự chín của mARN và sự xuất xưởng của mARN cũng tham gia vào sự điều hòa hoạt động của gen, ví dụ độ lớn và thành phần nucleotit của vùng 3' không mã hóa của mARN có ảnh hưởng đến sự ổn định và tuổi thọ của mARN. Phân tử mARN thường gồm 3 đoạn: đoạn 5' không mã hóa (không dùng để dịch mã sang protein) có độ lớn khoảng 100 nucleotit tạo thành mũ được gắn với protein, cần thiết cho sự vận chuyển
- 34 mARN qua lỗ màng nhân và dịch mã trên riboxom và đoạn cuối 3' không mã hóa có độ lớn khoảng 1.000 nucleotit và tận cùng bởi đuôi poly-A. Chính đoạn 3' không mã hóa này có chứa tín hiệu địa chỉ nơi tế bào chất mà ở đó mARN cần chuyên chở đến, cũng như chứa tín hiệu liên kết với protein đặc thù trong tế bào chất qui định tuổi thọ của mARN. Độ dài của đuôi poly-A qui định tuổi thọ của mARN, đuôi poly-A càng ngắn thì mARN bị phân giải càng nhanh. Trong tế bào chất đoạn 3' không mã hóa có thể liên kết với các cấu trúc vi sợi và vi ống. Một số dạng mARN có tuổi thọ ngắn khoảng 15 phút, có dạng mARN có tuổi thọ dài tới vài ngày. 1.4.2.4 Cấu trúc của thể nhiễm sắc Ở Eucaryota, cấu trúc phức tạp của thể nhiễm sắc cũng đóng góp vào cơ chế điều hòa hoạt động của gen trong các tế bào soma, ví dụ như trạng thái xoắn và đông đặc của sợi nhiễm sắc, sự khác biệt giữa vùng nhiễm sắc thực (eurochromatine) và vùng dị nhiễm sắc (heterochromatine), như hiện tượng bất hoạt của một thể nhiễm sắc X ở cá thể cái động vật có vú (hiện tượng bù liều), như hiện tượng hình thành các thể nhiễm sắc đặc biệt qua các giai đoạn phát triển cá thể (thể nhiễm sắc khổng lồ ở giai đoạn ấu trùng ruồi quả, thể nhiễm sắc chổi bóng đèn ở giai đoạn tiền kỳ giảm phân I ở một số động vật) v.v Ta xem xét một số trạng thái cấu trúc của thể nhiễm sắc gây ảnh hưởng lên hoạt động của gen. - Vùng nhiễm sắc thực và vùng dị nhiễm sắc Trong nhân tế bào ở giai đoạn gian kỳ, chất nhiễm sắc tồn tại ở hai trạng thái thấy rõ dưới kính hiển vi: vùng chất nhiễm sắc thẫm hơn, đậm đặc hơn được gọi là vùng dị nhiễm sắc và vùng ở đó chất nhiễm sắc thưa hơn, nhạt hơn được gọi là vùng nhiễm sắc thực. Nhiều nghiên cứu di truyền tế bào kết hợp với nghiên cứu sinh hóa đã chứng minh rằng vùng nhiễm sắc thực chứa các sợi nhiễm sắc đang ở trạng thái dãn xoắn (gen hoạt động), còn vùng dị nhiễm sắc là nơi chứa các sợi nhiễm sắc ở trạng thái xoắn và cô đặc (gen không hoạt động). Bằng kỹ thuật di truyền, nếu đem chuyển gen ở vùng nhiễm sắc thực đến vùng dị nhiễm sắc thì chúng sẽ không sản ra sản phẩm hoặc sinh ra sản phẩm sai lệch. Trong cơ thể, ví dụ ở ruồi quả nhiều đột biến đảo đoạn hoặc chuyển đoạn xảy ra là do sự chuyển vị trí của gen ở vùng nhiễm sắc thực sang vùng dị nhiễm sắc. Các đột biến này thường được gọi là đột biến do hậu quả vị trí (position- effect variegation). Rõ ràng rằng trạng thái xoắn và cô đặc của vùng dị nhiễm sắc đã ngăn cản gen hoạt động, bởi vì muốn gen phiên mã (tổng hợp ARN) từ đó dịch mã (tổng hợp protein thì sợi nhiễm sắc phải tháo xoắn để có thể sử dụng mạch đơn ADN làm khuôn tổng hợp ARN. Có khoảng 30% ADN của ruồi quả là ở trạng thái dị nhiễm sắc. Đa số dị nhiễm sắc định vị xung quanh trung tiết, một số nằm xen kẽ vào vùng nhiễm sắc thực, một số khác định vị ở cuối tiết mút của thể nhiễm sắc. Các vùng dị nhiễm sắc thường chứa nhiều trình tự ADN lặp với tần số cao và trung bình trong đó có các gen nhảy, đặc biệt là các retransposon không hoạt động. Tuy nhiên, trong vùng dị nhiễm sắc có chứa các gen không hoạt động tạm thời và trong điều kiện cần thiết có thể chuyển sang hoạt động, ví dụ các gen mã hóa cho rARN, hay các gen mã hóa cho một số protein. Trong qúa trình tự tái bản các ADN của vùng dị nhiễm sắc thường tái bản chậm hơn so với ADN vùng nhiễm sắc thực. Đối với tế bào soma ở nữ giới, một thể nhiễm sắc X ở trạng thái bất hoạt là dị nhiễm sắc. Nhiều nghiên cứu sinh hóa đã chứng minh là vùng thể nhiễm sắc ở trạng thái dị nhiễm sắc là do ADN của vùng đó bị methyl hóa ở gốc cytozin và bị liên kết với các protein đặc thù do đó phong bế bộ máy phiên mã. Như vậy, sự phân hóa của chất nhiễm sắc thành vùng dị nhiễm sắc và vùng nhiễm sắc thực cũng một phương thức điều chỉnh hoạt động của gen. - Hoạt động của gen trong thể nhiễm sắc đa sợi
- 35 Thể nhiễm sắc đa sợi (polyten chromosome) quan sát thấy ở ruồi quả và ở sâu bọ Hai cánh (Diptera) thể hiện sự hoạt động của gen tùy thuộc vào trạng thái cấu trúc của thể nhiễm sắc. Thể nhiễm sắc đa sợi có đặc điểm không chỉ ở chỗ bao gồm rất nhiều sợi nhiễm sắc xếp thành bó mà còn ở chỗ có rất nhiều cấu trúc đĩa ngang (đĩa Balbiani), đó là các gen được nhân đoạn ở trạng thái không hoạt động. Trong qúa trình phát triển ở giai đoạn ấu trùng (con dòi) biến thành nhộng, các đĩa ngang đậm đặc biến đổi thành các “búp” thưa hơn, sáng hơn. Các nghiên cứu về di truyền tế bào và sinh hóa đánh dấu phóng xạ đã chứng minh rằng ở vùng các “búp” là các sợi nhiễm sắc được tháo xoắn, các gen đang tích cực phiên mã sản sinh nhiều ARN. Theo tiến trình thời gian các đĩa được lần lượt được “búp” hóa (gen hoạt động) dưới tác động kích hoạt của hormon ecdicxơn do bản thân ấu trùng tiết ra. Thực nghiệm đã chứng minh rằng nhiều nhân tố kích hoạt gen, ví dụ sốc nhiệt (nuôi ấu trùng ở nhiệt độ trên 33oC), gây nên sự “búp” hóa ở các locut của gen sốc nhiệt (heat – shock genes). - Hoạt động của gen trong thể nhiễm sắc chổi bóng đèn Thể nhiễm sắc chổi bóng đèn (lampbrush chromosome) được quan sát thấy ở giai đoạn diplonem của tiền kỳ giảm phân I ở noãn bào các loài ếch nhái và một số loài động vật có xương sống khác cũng thể hiện sự hoạt động của gen có liên quan đến trạng thái dãn xoắn của sợi nhiễm sắc. Thể nhiễm sắc chổi bóng đèn có kích thước rất lớn đạt tới 400- 800μm chiều dài, gồm một trục sợi nhiễm sắc xoắn mang nhiều búi bên hình số 8. Các nghiên cứu hóa tế bào phóng xạ đã chứng minh rằng, các búi bên gồm các sợi nhiễm sắc dãn xoắn trong đó các gen đang tích cực phiên mã tổng hợp nhiều ARN. Đa số các gen này là gen mã hóa cho rARN, chúng phiên mã cung cấp rARN tạo nên hàng triệu riboxom, đáp ứng sự tổng hợp protein cần thiết cho noãn bào tích lũy chất dinh dưỡng trong noãn hoàng của trứng. - Cấu trúc nucleoxom và phiên mã của gen Một vấn đề đặt ra cho các nhà di truyền tế bào phân tử giải quyết là làm sáng tỏ cấu trúc nucleoxom đối với sự phiên mã ở tế bào nhân chuẩn. Khi sử dụng tổng hợp các kỹ thuật nghiên cứu về hóa tế bào, sinh hóa đánh dấu phóng xạ, hiển vi điện tử v.v. trên nhiều đối tượng đặc biệt trên hồng cầu gà đối với gen mã hóa β-globulin và gen mã hóa cho albumin, người ta đã giả thiết rằng khi phiên mã ADN xoắn quanh lõi histon (ở nucleoxom) đã được “mở” ra để phiên mã. Sự “mở” để nới lỏng ADN có liên quan đến 2 dạng protein phi histon là HMG14 và HMG17 (HMG - High Mobility Group tên gọi nhóm protein phi histon có tính di chuyển nhanh khi điện di trên gel). Người ta cũng giả thiết rằng các protein này đã tác động đến đoạn ADN nằm trước gen phiên mã hoặc nằm trong vùng ADN của promotor hoặc enhancer của gen phiên mã làm cho ADN nới lỏng khỏi lõi histon và tạo điều kiện cho hoạt động của bộ máy phiên mã. 8.5 Tin hóa ca h gen 8.5.1 Hàm lượng ADN Như ta đã biết, gen có bản chất là ADN (hoặc ARN như đối với một số virut), là đơn vị tích thông tin di truyền được tập hợp thành tổ chức hệ gen (genome). Gen cũng như hệ gen được xuất hiện và tiến hóa trong qúa trình tiến hóa của sự sống. Như phần trên đã nói có thể là phân tử ARN xuất hiện trước về sau mới chuyển nhiệm vụ tích thông tin di truyền cho ADN còn ARN chỉ đóng vai truyền đạt thông tin di truyền. Hiện nay còn tồn tại nhiều virut sử dụng ARN để tích thông tin di truyền ví dụ virut khảm thuốc lá, virut HIV v.v Trong qúa trình ký sinh dung hợp trong tế bào vật chủ, virut HIV có thể phiên mã ngược từ ARN thành ADN để tích thông tin di truyền của chúng. Đối với virut và Prokaryota chúng có
- 36 ADN là phân tử mạch đơn hoặc mạch kép ở dạng trần không liên kết với histon, có cấu tạo vòng và búi với hàm lượng tương ứng với số lượng gen chứa trong đó. Ví dụ thực khuẩn thể MS2 có ARN mạch đơn chứa 3.569 nucleotit tạo nên 4 gen, thực khuẩn thể X174 có mạch đơn ADN chứa 5.386 nucleotit tạo nên 11 gen. Virut có nhiều gen nhất là thực khuẩn thể T2, ADN của chúng chứa tới 150 gen. Đối với Prokaryota thì hàm lượng ADN và số lượng gen nhiều hơn, ví dụ vi khuẩn E. coli có mạch kép ADN chứa 4,64 triệu cặp nucleotit tạo nên khoảng 4.000 gen. Đối với Eucaryota thì cấu trúc của gen và tổ chức của hệ gen phức tạp hơn nhiều. Trong lúc Prokaryota có ADN trần và hệ gen đơn bội (gen không có alen tương ứng) thì Eucaryota có ADN ở dạng mạch kép thẳng luôn liên kết với histon tạo thành thể nhiễm sắc và tồn tại ở dạng lưỡng bội (gen có alen tương ứng). Gen cũng như hệ gen ở Eucaryota có cấu trúc rất phức tạp. Hàm lượng ADN rất lớn và không tương ứng với số lượng gen chứa trong đó. Số lượng gen nhiều khi chỉ chiếm từ 10 - 20% hàm lượng ADN. Gen có cấu tạo ngoài những nucleotit mã hóa cho axit amin còn chứa các nucleotit đóng vai trò bổ trợ và điều chỉnh hoạt động của gen, ở cơ thể tiến hóa càng cao thì yếu tố này càng nhiều, cũng vì vậy mà có một nghịch lý là ở Eucaryota hàm lượng ADN không tương ứng với số lượng gen mà cơ thể có và tuy rằng số lượng gen là tăng theo mức độ tiến hóa và độ phức tạp của cơ thể nhưng hàm lượng ADN thì không thể hiện qui luật đó. Ta hãy xem một vài ví dụ: Nấm men Saccharomyces chứa hàm lượng đơn bội ADN là 12,1 triệu cặp nucleotit có khoảng 6.000 gen, ruồi quả Drosophila chứa hàm lượng đơn bội ADN là 140 triệu cặp nucleotit nhưng số gen chỉ có khoảng 13.000 gen và con người đỉnh cao nhất của tiến hóa chứa hàm lượng đơn bội 3 tỷ cặp nucleotit nhưng số gen chỉ có khoảng 25.000 - 35.000 gen, nghĩa là chỉ gấp từ 2 đến 2,5 lần so với ruồi quả. Trong lúc đó một số loài ếch nhái lại chứa hàm lượng ADN rất cao, cao hơn nhiều so với động vật có vú. Ví dụ, ếch Rana esculenta có ADN đơn bội đạt tới 15 tỷ cặp nucleotit nhiều gấp 5 lần so với con người và đặc biệt là loài sa giông Salamandra (một loài ếch nhái có đuôi) có hàm lượng ADN đơn bội đạt tới 90 tỷ cặp nucleotit nghĩa là gấp 6 lần so với ếch (thuộc cùng một lớp) và 30 lần so với con người. Như vậy, rõ ràng rằng không thể dùng hàm lượng ADN để đánh giá mức độ tiến hóa của các loài mà phải căn cứ vào cấu trúc của gen và tổ chức của hệ gen của chúng. Hy vọng rằng khi hệ gen của các cơ thể được giải mã hoàn toàn các nhà tiến hóa luận sẽ lý giải được nghịch lý đã nêu. Hệ gen của Eucaryota là lưỡng bội, thể nhiễm sắc tồn tại thành cặp tương đồng và gen có alen tương ứng. Cấu trúc của thể nhiễm sắc cũng rất phức tạp, được phân hóa thành thể nhiễm sắc thường (autosome) và thể nhiễm sắc giới tính (gonosome- sexchromosome), vùng tâm động (centromere), vùng cùng tiết (telomere), vùng NOR (vùng chứa các gen rARN) v.v Tổ chức như thế thể hiện phương thức đa dạng hóa cơ cấu di truyền (genotip) của cơ thể. 8.5.2 Vốn gen (gene pool). Biến dị di truyền trong quần thể Quần thể (population) là đơn vị sinh học bé nhất chịu tác động của tiến hóa. Nghiên cứu qúa trình và phương thức di truyền ở mức độ quần thể là đối tượng của di truyền học quần thể (population genetics). Khái niệm chủ yếu của di truyền quần thể là vốn gen (gene pool) là tập hợp tất cả các gen-alen (kiểu gen) của tất cả các cá thể trong quần thể. Vốn gen của quần thể là nguồn dự trữ cho sự tái lập kiểu gen của các thế hệ cá thể tương lai của quần thể. Nguồn gốc biến dị di truyền trong vốn gen của quần thể là đột biến và biến dị tổ hợp. Đột biến ở mức độ ADN và thể nhiễm sắc đều có thể dẫn đến tạo nên những alen mới trong vốn gen và chúng có thể được chọn lọc bởi môi trường và phổ biến trong quần thể. Đối với các cơ thể có vòng đời ngắn như vi khuẩn thì đột biến tuy là nguồn biến dị di truyền duy nhất nhưng chúng nhanh chóng được phổ biến trong quần thể.
- 37 Đối với các cơ thể sinh sản hữu tính như thực vật và động vật thì biến dị tổ hợp được tạo qua qúa trình phân bào giảm nhiễm và thụ tinh, dẫn đến sự hình thành nhiều tổ hợp di truyền đa dạng và phong phú trong quần thể. Đột biến và biến dị tổ hợp là những qúa trình xảy ra ngẫu nhiên và xác suất không mang tính chọn lọc và thích nghi, nhưng nhân tố môi trường đã chọn lọc chúng và phổ biến chúng trong quần thể. 8.5.3 Phân tích vốn gen. Công thức Hardy- Weinberg Năm 1908, nhà toán học người Anh là Hardy và bác sĩ người Đức là Weinberg khi phân tích vốn gen của quần thể qua các thế hệ và đã đề ra qui luật cho rằng trong điều kiện xác định, đối với một quần thể đủ lớn có giao phối ngẫu nhiên tần số gen-alen (tần số kiểu gen) không đổi qua các thế hệ. Qui luật đó được biểu diễn bởi công thức: p2 + 2pq + q2 = 1 Trong đó p là tần số của gen và q là tần số của alen tương ứng. Ví dụ, trong quần thể có gen A (trội) và alen a (lặn) thì kiểu gen của quần thể sẽ là AA, aA, Aa và aa. Tần số của gen A là p và tần số kiểu gen AA là p x p = p2. Tần số của alen a là q và tần số kiểu gen aa là q x q = q2. Tần số kiểu gen Aa + aA = 2pq. Trong quần thể mỗi cá thể chỉ mang một cặp alen, vì vậy p + q = 1 và tần số kiểu gen ( p+ q)2 = p2 + 2pq + q2 =1. Ví dụ, trong một quần thể cây hoa, alen A qui định màu hoa đỏ (trội) và alen a (lặn) qui định màu hoa trắng. Tần số alen A là p = 80% hay là 0,8, như vậy tần số alen a là q= 0,2. Tần số kiểu gen AA là p2 = 0,8 x 0,8 = 0,64, tần số kiểu gen aa là q2 = 0,2 x 0,2 = 0,04 và tần số kiểu gen Aa sẽ là 2pq = 2 x 0,8 x 0,04 = 0,32. Như vậy, vốn gen của quần thể có tần số là 0,64+0,32+0,04=1. Công thức Hardy-Weinberg thể hiện trạng thái cân bằng của quần thể. Trạng thái cân bằng của quần thể chỉ đạt được trong điều kiện xác định như sau: - Không có tác động của đột biến, phiêu bạt gen và dòng gen. - Không có tác động của chọn lọc tự nhiên. - Có sự giao phối ngẫu nhiên nghĩa là các kiểu gen có cùng độ thụ tinh và sức sống như nhau. Đối với quần thể người có thể áp dụng công thức Hardy-Weinberg để tính số phần trăm người mang gen qui định bệnh di truyền. Ví dụ, bệnh Phenylxeton niệu (Phenylketonuria) là bệnh di truyền thể hiện ở chỗ cơ thể không phân giải được phenylalanin do đó làm cho bệnh nhân bị kém phát triển về trí tuệ. Theo thống kê ở Mỹ có 1/10000 ca em bé sinh ra mắc bệnh Phenylxeton. Bệnh do alen lặn qui định và như vậy tần số các cá thể mang bệnh là q2 = 0,0001 và tần số của alen lặn sẽ là q =căn bậc hai của 0,0001= 0,01, và tần số của alen trội là p = 1 − q = 1 – 0,01 = 0,99. Ta hãy tính tần số các cá thể dị hợp mang alen bệnh. Tần số kiểu gen dị hợp là 2pq = 2 x 0,99 x 0,01 = 0,0198. Như vậy, có khoảng 2% dân Mỹ có mang alen gây bệnh Phenylxeton niệu. Những người dị hợp mang alen bệnh không thể hiện bệnh nhưng có thể di truyền gen bệnh cho con cháu. Thống kê và đánh giá được tần số
- 38 các alen gây bệnh di truyền nguy hiểm trong quần thể cho phép đề ra các dự án dự phòng và bảo vệ sức khỏe cộng đồng một cách hữu hiệu. 8.5.4 Tiến hóa vi mô (Microevolution) Học thuyết tiến hóa hiện đại phân biệt hai qúa trình tiến hóa là tiến hóa vi mô và tiến hóa vĩ mô. Tiến hóa vi mô (còn gọi là tiến hóa nhỏ) là qúa trình tiến hóa diễn ra trong đơn vị sinh học bé nhất là quần thể và như vậy có thể xác định tiến hóa vi mô là sự biến đổi tần số kiểu gen trong quần thể. Một quần thể không tiến hóa là quần thể trong đó vẫn giữ cân bằng Hardy-Weinberg nghĩa là vốn gen luôn giữ ổn định qua các thế hệ. Như vậy, muốn có tiến hóa phải có sự biến đổi trong vốn gen của quần thể. Trong tự nhiên ít khi quần thể giữ được cân bằng di truyền bởi vì quần thể luôn bị tác động của nhiều nhân tố gây nên sự biến đổi vốn gen trong quần thể dẫn đến qúa trình tiến hóa nhỏ. Thường có 4 nguyên nhân gây nên tiến hóa nhỏ: 1.5.4.1 Biến dị di truyền Biến dị di truyền dẫn đến làm thay đổi vốn gen của quần thể, làm tăng hoặc làm giảm tần số alen nào đấy hoặc làm xuất hiện những alen mới. Những biến dị này có được di truyền và phổ biến qua các thế hệ hay không là còn tùy thuộc vào nhân tố chọn lọc tự nhiên và thông qua sinh sản. 1.5.4.2 Hiện tượng phiêu bạt gen (genetic drift) Hiện tượng phiêu bạt gen thường xảy ra trong quần thể nhỏ với số lượng cá thể ít và dẫn tới mất cân bằng Hardy-Weinberg, cũng vì vậy mà để có cân bằng thì quần thể phải đủ lớn. Các cá thể trong thế hệ sau được truyền thụ kiểu gen từ thế hệ trước với tần số gen-alen một cách ngẫu nhiên và theo qui luật xác suất, nghĩa là để có được tần số của thế hệ sau càng giống thế hệ trước thì quần thể phải càng lớn. Quần thể càng bé thì độ sai lệch về tần số càng lớn và dẫn đến mất cân bằng trong vốn gen. Ví dụ, trong một quần thể cây hoa đỏ, hoa trắng chỉ có tất cả 10 cây với vốn gen có tần số alen A (đỏ) là p = 0,7 và tần số alen a (trắng) là q = 0,3 trong đó chỉ có 5 cây là sinh sản và cho ra thế hệ sau 10 cây với tần số p =0,5 và q = 0,5, đến thế hệ thứ 3 thì chỉ có 2 cây là sinh sản và cho ra 10 cây với tần số p = 1 và q = 0. Như vậy, alen a đã bị loại ra khỏi quần thể. Cơ chế tiến hóa do sự biến đổi vốn gen trong quần thể bé tuân theo qui luật xác suất (may mắn) được gọi là phiêu bạt gen. Phiêu bạt gen có thể làm giảm độ biến dị của quần thể dẫn đến sự bảo tồn các dạng thích nghi hẹp. Phiêu bạt gen cũng có thể tác động sáng tạo dẫn đến tạo nên tiến hóa phân ly hình thành các quần thể mới, ví dụ ở các đảo, các hồ cô lập v.v 1.5.4.3 Dòng gen (gene flow) Để duy trì được cân bằng Hardy-Weinberg đòi hỏi quần thể phải có vốn gen cô lập với các quần thể khác. Trong tự nhiên các quần thể không hoàn toàn cô lập mà luôn luôn có sự trao đổi gen giữa các quần thể (dòng gen) thông qua sự di cư hoặc nhập cư của các cá thể
- 39 hoặc giao tử hữu thụ từ một quần thể này sang một quần thể khác. Sự di cư hoặc nhập cư dẫn tới làm thay đổi vốn gen của quần thể. Ví dụ với quần thể hoa đỏ, hoa trắng đã dẫn, nếu có trận gió mạnh thổi mang theo toàn phấn hoa trắng vào vườn cây hoa bên cạnh sẽ dẫn tới làm tăng tần số gen a trong quần thể cây hoa của vườn. Đối với quần thể người trong thời hiện đại sự di cư, nhập cư diễn ra trên tất cả quốc gia và dòng gen là nhân tố quan trọng trong sự tiến hóa vi mô của các quần thể người trước đây sống biệt lập. 1.5.4.4 Chọn lọc tự nhiên Phiêu bạt gen, dòng gen và đột biến đều là nguyên nhân của tiến hóa vi mô nhưng tác động của chúng không nhất thiết dẫn đến thích nghi với môi trường nếu như những biến đổi đó không được chọn lọc và di truyền cho các thế hệ sau. Chỉ có chọn lọc tự nhiên mới tạo nên tiến hóa thích nghi. Như vậy, đặc tính thích nghi của sinh vật không mang tính mục đích luận mà tiến hóa thích nghi là sự phối hợp giữa cái ngẫu nhiên là biến dị trong vốn gen với cái tất yếu là chọn lọc tự nhiên tức là sự sống còn của các cá thể sinh sản hiệu quả nhất (cho nhiều con cháu hữu thụ ở các thế hệ sau). Quan niệm “đấu tranh sinh tồn” và “tồn tại của cá thể thích nghi nhất” của Darwin về chọn lọc tự nhiên phải hiểu là sự đóng góp của một cá thể này vào vốn gen của thế hệ tương lai nhiều hơn so với các cá thể khác. Nếu chỉ có thích nghi với môi trường mà không để lại con cháu hữu thụ cho thế hệ tương lai thì cũng không thể có tiến hóa. Như vậy, sinh sản ra nhiều con cháu hữu thụ là vấn đề cốt lỗi của chọn lọc tự nhiên. Chọn lọc tự nhiên thường thể hiện tác động theo ba phương thức: chọn lọc định hướng, chọn lọc phân ly và chọn lọc ổn định. Để thấy rõ được vai trò của chọn lọc tự nhiên ta hãy xem xét ba trường hợp sau đây trong di truyền quần thể người: + Di truyền bệnh thiếu máu hồng cầu hình liềm. Trong quần thể người Mỹ gốc da đen châu Phi có đến 1/500 người bị bệnh. Bệnh do alen lặn gây nên, như vậy chỉ có những người đồng hợp về alen lặn mới thể hiện bệnh. Có một trường hợp trong 11 người Mỹ da đen mang alen bệnh ở trạng thái dị hợp tuy họ không thể hiện bệnh nhưng họ có thể truyền alen bệnh cho con cháu. Một vấn đề đặt ra là tại sao alen bệnh lại rất phổ biến trong quần thể người Mỹ gốc châu Phi so với quần thể người Mỹ nói chung? Các nhà di truyền học tiến hóa giải thích rằng ở châu Phi nhiệt đới alen bệnh là alen đột biến (do sự đột biến trong codon số 6 – GAG- của axit glutamic biến thành codon – GUG- của valin trong gen mã hóa cho mạch bêta của hemoglobin) vừa có hại và vừa có lợi. Nếu ở trạng thái đồng hợp chúng sẽ gây nên bệnh, nhưng những người mang alen ở trạng thái dị hợp có khả năng chống chịu bệnh sốt rét là bệnh rất phổ biến ở các vùng nhiệt đới. Nghiên cứu sự phân bố của alen bệnh thiếu máu hồng cầu hình liềm trên thế giới cho thấy tần số của chúng tăng cao trùng hợp với vùng phân bố tăng cao của bệnh sốt rét. Trong các quần thể Người ở vùng nhiệt đới alen lặn đơn thường gặp với tần số từ 0,2 - 20%, như vậy tần số alen đồng hợp lặn sẽ là q2 = 0,2 x 0,2 = 0,04 tức là có 4% dân số bị bệnh hồng cầu hình liềm và tử vong và tần số người dị hợp 2pq = 0,8 x 0,2 = 0,32, có nghĩa là trong dân số có đến 32% mang gen dị hợp không thể hiện bệnh nhưng có khả năng chống chịu bệnh sốt rét. Những người không mang gen bệnh tuy không bị bệnh thiếu máu nhưng dễ dàng bị muỗi sốt rét tấn công và bị bệnh sốt rét. Như vậy, alen lặn tuy có hại nhưng đã được chọn lọc và phổ biến trong quần thể. + Bệnh tim mạch. Bệnh tim mạch là bệnh rất nguy hiểm và rất phổ biến hiện nay. Những nghiên cứu về di truyền tiến hóa cho thấy rằng bệnh do chế độ dinh dưỡng kết hợp với cơ cấu di truyền do con người thừa hưởng từ tổ tiên xa xưa của mình. Bệnh thể hiện nhiều nhất ở