Giáo trình Sinh học phân tử - Hoàng Trọng Phán (Phần 1)

72 trang hapham 4350

Download

Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Sinh học phân tử - Hoàng Trọng Phán (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_sinh_hoc_phan_tu_hoang_trong_phan_phan_1.pdf

Nội dung text: Giáo trình Sinh học phân tử - Hoàng Trọng Phán (Phần 1)

ĐẠI H ỌC HU Ế TRUNG TÂM ĐÀO T ẠO T Ừ XA HOÀNG TR ỌNG PHÁN SINH HỌC PHÂN TỬ (KHÁI NI ỆM, NGUYÊN LÝ & QUÁ TRÌNH) Hu ế - 2012 1
Li nói đ u Để góp ph ần đổ i m ới n ội dung giáo trình Sinh h ọc phân t ử của Trung tâm Đào t ạo T ừ xa – Đại học Hu ế theo h ướng c ập nh ật ki ến th ức c ũng nh ư ph ươ ng pháp d ạy - học phù h ợp v ới đố i t ượng đặc thù, chúng tôi đã tham c ứu nhi ều tài li ệu và c ố g ắng biên so ạn giáo trình trên tinh th ần ấy. Nội dung giáo trình gồm tám ch ươ ng bao quát các ki ến th ức c ơ b ản của Sinh h ọc phân t ử mà học viên và sinh viên c ủa Trung tâm và các tr ường Đạ i h ọc c ần n ắm v ững để có th ể v ận d ụng t ốt vào trong công tác nghiên c ứu và gi ảng d ạy c ủa mình. Ch ươ ng 1: C ấu trúc và ch ức n ăng c ủa các đạ i phân t ử sinh h ọc Ch ươ ng 2: T ổ ch ức b ộ gen các sinh v ật Ch ươ ng 3: C ấu trúc và ch ức n ăng c ủa gen Ch ươ ng 4: Tái b ản c ủa các b ộ gen Ch ươ ng 5: Phiên mã và d ịch mã Ch ươ ng 6: Điều hòa s ự bi ểu hi ện c ủa gen Ch ươ ng 7: Các bi ến đổ i c ủa b ộ gen Ch ươ ng 8: Các ph ươ ng pháp sinh h ọc phân t ử và công ngh ệ ADN tái t ổ h ợp Mở đầ u m ỗi ch ươ ng có ph ần gi ới thi ệu và m ục tiêu giúp ng ười h ọc xác đị nh các ch ủ đề chính cần tìm hi ểu. Sau m ỗi ch ươ ng có ph ần Tóm t ắt nh ằm giúp ng ười h ọc n ắm n ội dung khái quát c ủa ch ươ ng. Cu ối cùng là ph ần Câu h ỏi và Bài t ập, v ới 15-25 câu m ỗi ch ươ ng, yêu cầu ng ười h ọc t ập vận d ụng hi ểu bi ết c ủa mình vào gi ải quy ết chúng tr ước khi sang ch ươ ng m ới. Đặ c bi ệt, trong khi biên so ạn chúng tôi có đưa thêm ph ần Hướng d ẫn Tr ả l ời Câu h ỏi và Bài t ập cu ối m ỗi ch ươ ng cùng với m ột s ố v ấn đề liên quan thi ết y ếu khác vào ph ần Ph ụ l ục (đặt ở cu ối sách) nh ằm giúp ng ười h ọc tra c ứu, tham kh ảo cách h ọc và gi ải quy ết v ấn đề khi c ần. Hy v ọng r ằng giáo trình này s ẽ đáp ứng được nhu c ầu h ọc t ập c ủa h ọc viên và sinh viên v ề môn học v ốn d ĩ r ất m ới và r ất khó này. Tuy nhiên, vì khuôn kh ổ có h ạn nên m ột s ố ch ủ để không th ể đề cập sâu h ơn trong sách này. H ơn n ữa, v ới kh ả n ăng có h ạn, ch ắc ch ắn sách không th ể tránh kh ỏi các sai sót trong khi biên so ạn. Chúng tôi r ất mong nh ận được s ự phê bình và ch ỉ b ảo c ủa quý đồ ng nghi ệp và b ạn đọ c để giáo trình được hoàn ch ỉnh h ơn trong l ần in sau. Hu ế, ngày 20 tháng 2 năm 2012 Tác gi ả HOÀNG TR ỌNG PHÁN 2
Chươ ng 1 CẤU TRÚC VÀ CHỨC NĂNG CỦA CÁC ĐẠI PHÂN T Ử SINH H ỌC Đối v ới các nghiên c ứu sinh h ọc c ơ s ở, b ốn đạ i phân t ử quan tr ọng ph ải k ể đế n là các các axit nucleic, protein, polysaccharide và lipid. Tuy nhiên, trên quan điểm c ủa sinh h ọc phân t ử, protein và các axit nucleic là hai lo ại h ợp ch ất quan tr ọng nh ất mà ch ủ y ếu là ADN và các thành ph ần c ủa chúng. Vi ệc nghiên c ứu c ấu trúc và ch ức n ăng của các axit nucleic th ực s ự bắt đầ u từ gi ữa th ế k ỷ XX. Vào n ăm 1944, O.T. Avery, MacLeod và McCarty l ần đầ u tiên ch ứng minh ADN là v ật ch ất mang thông tin di truy ền. Kế đó, s ự khám phá ra c ấu trúc phân t ử ADN bởi James Watson và Francis Crick n ăm 1953 cùng với nh ững h ệ qu ả c ủa nó đã là m ột trong nh ững s ự ki ện khoa h ọc nổi bật nh ất c ủa th ế k ỷ XX, đặt n ền t ảng cho s ự ra đời và phát ti ển c ủa di truy ền h ọc và sinh h ọc phân tử. Trong ch ươ ng này, chúng ta l ần l ượt tìm hi ểu các v ấn đề sau: (i) Cấu trúc và ch ức n ăng c ủa các axit nucleic; (ii) Cấu trúc và ch ức n ăng c ủa protein; (iii) Cấu trúc và ch ức n ăng c ủa các polysaccharide và lipid; và (iv) Các liên k ết hóa h ọc c ơ b ản trong các h ệ th ống sống. 1. C ấu trúc và ch ức n ăng c ủa các Axit Nucleic 1.1. Đại c ươ ng v ề các axit nucleic Ngày nay chúng ta đều bi ết r ằng v ật ch ất di truy ền hay b ộ gen c ủa các sinh v ật trên trái đất là các axit nucleic mà h ầu h ết là acid deoxyribonucleic (ADN) và ở m ột s ố ít virus là acid ribonucleic (ARN). Điều này đã được ch ứng minh qua các thí nghi ệm kinh điển n ổi ti ếng, đó là: (i) Thí nghi ệm bi ến n ạp ở vi khu ẩn được th ực hi ện đầ u tiên bởi Griffith (1928) và sau đó là nhóm nghiên c ứu của Avery và c ộng s ự (1944); (ii) Thí nghi ệm c ủa Hershey và Chase ở th ể th ực khu ẩn T2; và (iii) Thí nghi ệm c ủa Conrat và Singer ở virus đố m thu ốc lá (1956). Các axit nucleic là nh ững đạ i phân t ử sinh h ọc có tr ọng l ượng phân t ử l ớn v ới thành ph ần g ồm các nguyên t ố C, H, O, N và P. Chúng được c ấu thành t ừ các đơ n phân (monomer) - các nucleotide ; các đơ n phân này n ối v ới nhau b ằng các liên k ết phosphodiester t ạo thành c ấu trúc đa phân (polymer) g ọi là các chu ỗi, m ạch hay s ợi polynucleotide - cấu trúc s ơ c ấp c ủa các phân t ử ADN và ARN. Vật ch ất di truy ền có các đặc tính thi ết y ếu sau: (1) Đặc tính thông tin sinh h ọc: Nó ch ứa đự ng toàn b ộ thông tin di truy ền cần thi ết cho vi ệc xác định c ấu trúc c ủa các protein đặ c thù c ủa mỗi loài (các gen cấu trúc) và điều khi ển các ho ạt động sinh tr ưởng, phân chia và bi ệt hoá t ế bào. (2) Đặc tính tái b ản: Đó là kh ả n ăng t ự sao chép chính xác, đả m b ảo thông tin di truy ền c ủa th ế h ệ sau gi ống v ới th ế h ệ tr ước. (3) Đặc tính ho ạt độ ng c ủa các gen : Các gen trong b ộ gen có kh ả n ăng t ổng h ợp ra các s ản ph ẩm là nh ững phân t ử tham gia vào m ọi độ ng s ống c ăn b ản c ủa t ế bào. Đó là các quá trình phiên mã, dịch mã và điều hòa ho ạt độ ng c ủa các gen. (4) Đặc tính bi ến đổ i: Đó là kh ả n ăng b ị bi ến đổ i của các b ộ gen từ các quá trình khác nhau 3
nh ư đột bi ến, tái t ổ h ợp, các y ếu t ố di truy ền v ận độ ng. Chính s ự bi ến đổ i này t ạo ra các ngu ồn bi ến dị di truy ền đa d ạng và phong phú cho quá trình ch ọn l ọc và ti ến hoá c ủa sinh gi ới k ể t ừ khi s ự s ống bắt đầ u hình thành trên trái đất cách đây ch ừng 3 t ỷ r ưỡi n ăm. 1.2. Cấu trúc của các nucleotide Đơ n v ị c ấu trúc c ơ s ở c ủa các axit nucleic là các nucleotide. Mỗi nucleotide g ồm có: 1 baz ơ nit ơ, 1 đường pentose, và 1 axit phosphoric. Baz ơ nit ơ - thành ph ần đặ c tr ưng c ủa các nucleotide - là các h ợp ch ất purine và pyrimidine dị vòng ch ứa nit ơ có tính ki ềm. ADN ch ứa b ốn lo ại baz ơ chính là adenine (A), guanine (G), thymine (T) và cytosine (C); trong ARN c ũng ch ứa 4 lo ại nh ư th ế, ch ỉ khác là uracil thay cho thymine (Hình 1.1). Ngoài ra, trong ADN còn có m ặt các baz ơ b ị bi ến đổ i ch ủ y ếu do s ự methyl hoá ở các v ị trí khác nhau, ví d ụ: 5-methylcytosine, 5-hydroxymethylcytosine, 7-methylguanine v.v. (Hình 1.2). Đường pentose của ARN là D-ribose và c ủa ADN là 2'-deoxy-D-ribose (ký hi ệu D ch ỉ d ạng đường quay ph ải tr ước ánh sáng phân c ực để phân bi ệt v ới d ạng L quay trái không có trong thành ph ần c ủa các axit nucleic t ự nhiên). Các phân t ử đường này đều có c ấu trúc vòng. Vì các nguyên t ử carbon ở đây x ếp liên t ục nên được đánh s ố th ứ t ự có d ấu ph ẩy trên đầu, ví d ụ C1', C2' cho đế n C5' (Hình 1.3). Hình 1.1. Cấu trúc 5 lo ại baz ơ có m ặt trong ADN và ARN. 4
Hình 1.2. Một s ố dạng baz ơ b ị bi ến đổ i ch ủ y ếu do s ự methyl hoá. Hình 1.3. (a) Cấu trúc c ủa các phân t ử đường ribose và deoxyribose. (b) C ấu trúc c ủa ribonucleotide Adenine trong ARN. Hai phân t ử đường này khác nhau ở C2'; trong ribose đó là nhóm hydroxyl và trong deoxyribose là m ột nguyên t ử hydro. T ừ các g ốc đường khác nhau này t ạo ra hai lo ại nucleotide - ribonucleotide và deoxyribonucleotide - cấu t ạo nên hai lo ại axit nucleic khác nhau là ARN và ADN. C ần để ý r ằng, trong các phân t ử đường này có ba v ị trí quan tr ọng có ch ứa nhóm hydroxyl (–OH) t ự do, đó là: (i) nhóm –OH ở v ị trí C 1' có kh ả n ăng hình thành liên k ết N-glycosid v ới g ốc - NH c ủa các baz ơ để t ạo thành các nucleoside; (ii) nhóm -OH ở v ị trí C 5' có kh ả n ăng hình thành liên kết ester v ới nhóm phosphate để t ạo ra các nucleotide; và (iii) nhóm –OH ở v ị trí C 3' có kh ả n ăng hình thành liên k ết phosphodiester v ới nhóm phosphate c ủa m ột nucleotide khác để t ạo chu ỗi polynucleotide. Nh ư v ậy, tính phân c ực trong g ốc đường mà t ừ đó quy ết đị nh tính phân c ực c ủa các chu ỗi polynucleotide được th ể hi ện ở hai v ị trí C 3' và C 5'. Trong các nucleotide c ủa ADN và ARN, nhóm phosphate liên k ết v ới các nucleoside t ại C 5' . Mỗi nucleoside được t ạo thành do m ột baz ơ nối v ới đường t ại C 1' bằng m ột liên k ết N-glycoside. C ụ th ể, C 1' nối v ới N 1 của pyrimidine ho ặc v ới N 9 của purine. Tên g ọi chính th ức hay danh pháp c ủa các nucleoside b ắt ngu ồn t ừ các baz ơ tươ ng ứng, trong đó các nucleoside là d ẫn xu ất c ủa purine có đuôi là -osine và các d ẫn xu ất c ủa pyrimidine có đuôi là -idine (Bảng 1.1). Tóm l ại, m ỗi nucleotide gồm 3 thành ph ần k ết dính v ới nhau nh ư sau: g ốc đường n ối v ới baz ơ tại C 1' bằng m ột liên k ết β-glycosid và n ối v ới nhóm phosphate tại C 5' bằng m ột liên k ết phosphomonoester (Hình 1.4). Bảng 1.1. Tên g ọi c ủa các nucleoside và nucleotide của ARN và ADN Baz ơ Nucleoside Nucleotide ARN Adenine (A) Adenosine Adenosine 5'-monophosphate (AMP) Guanine (G) Guanosine Guanosine 5'-monophosphate (GMP) Cytosine (C) Cytidine Cytidine 5'-monophosphate (CMP) 5
Uracil (U) Uridine Uridine 5'-monophosphate (UMP) ADN Adenine (A) Deoxyadenosine Deoxyadenosine 5'-phosphate (dAMP) Guanine (G) Deoxyguanosine Deoxyguanosine 5'-phosphate (dGMP) Cytosine (C) Deoxycytidine Deoxycytidine 5'-phosphate (dCMP) Thymine (T) Deoxythymidine Deoxythymidine 5'-phosphate (dTMP) 1.3. C ấu trúc c ủa các chu ỗi polynucleotide Các nucleotide trong ADN ho ặc ARN n ối v ới nhau b ằng các m ối liên k ết đồ ng hoá tr ị (covalent) có tên là liên k ết 3',5'-phosphodiester (gi ữa g ốc đường c ủa nucleotide này v ới nhóm phosphate c ủa nucleotide k ế ti ếp), t ạo thành chu ỗi polynucleotide . Vì v ậy các chu ỗi này bao gi ờ cũng được kéo dài theo chi ều 5' →3' ( đầ u 5' mang nhóm phosphate và đầu 3' ch ứa nhóm -OH t ự do). Chúng có b ộ khung v ững ch ắc g ồm các g ốc đường và phosphate x ếp luân phiên nhau, còn các baz ơ nằm v ề m ột bên. Trình t ự các baz ơ vì v ậy được đọ c theo m ột chi ều xác đị nh 5' →3'. Đây là c ấu trúc sơ c ấp c ủa ADN và ARN (Hình 1.5). Hình 1.4. Cấu trúc c ủa một deoxyribonucleotide (dAMP) Thông th ường ng ười ta bi ểu di ễn trình t ự baz ơ 5' →3' theo chi ều t ừ trái sang ph ải. Hình 1.5 cho th ấy các chu ỗi ADN và ARN ch ỉ khác nhau bởi baz ơ U ho ặc T và g ốc đường trong các nucleotide c ủa chúng. N ếu b ỏ qua s ự khác bi ệt v ề g ốc đường, ta có th ể hình dung trình t ự các baz ơ của hai chu ỗi polynucleotide c ủa ADN và ARN đều sinh tr ưởng theo chi ều t ừ 5' đế n 3' (5' →3'), nh ư sau: Chu ỗi ADN: (5') pApApTpTpCpTpTpApApApTpTpC -OH (3') Chu ỗi ARN: (5') pApApUpUpCpUpUpApApApUpUpC -OH (3') Cần l ưu ý r ằng: (1) Các h ợp ch ất dùng để polymer hoá là các nucleoside triphosphate, nh ưng 6
các monomer c ủa axit nucleic l ại là monophosphate. Ph ản ứng trùng h ợp này được xúc tác b ởi các enzyme ADN polymerase và ARN polymerase . (2) Các oligonucleotide là nh ững đoạn có độ dài th ường là ~10-100 nucleotide. Các oligoribonucleotide t ồn t ại trong t ự nhiên và được s ử d ụng nh ư là nh ững đoạn m ồi (primer) trong tái b ản ADN và cho các m ục đích khác nhau trong t ế bào. Các oligonucleotide t ổng h ợp có th ể t ạo ra b ằng s ự t ổng h ợp hoá h ọc và là nguyên li ệu thi ết y ếu cho các kỹ thu ật sinh h ọc phân t ử, nh ư: gi ải mã di truy ền trong ống nghi ệm; xác đị nh trình t ự ADN, ph ản ứng trùng h ợp chu ỗi b ằng polymerase (polymerase chain reaction = PCR), lai t ại ch ỗ ( in situ hybridization), m ẩu dò axit nucleic, lai axit nucleic v.v. Chu ỗi polynucleotide c ủa ẢN sai khác ở: Ribose (-OH) và baz ơ Uracil Hình 1.5. Cấu trúc chu ỗi polynucleotide c ủa ADN (trên) và c ủa ARN. 1.4. Cấu trúc của phân t ử ADN 1.4.1. Thành ph ần hóa h ọc c ủa ADN Bảng 1.2. Thành ph ần baz ơ của ADN ở m ột s ố loài A + G A + T Sinh v ật A% T% G% C% T + C G + C Phage lambda 21,3 22,9 28,6 27,2 1,00 0,79 Phage T7 26,0 26,0 24,0 24,0 1,00 1,08 Mycobacterium tuberculosis 15,1 14,6 34,9 35,4 1,00 0,42 Escherichia coli 24,7 23,6 26,0 25,7 1,03 0,93 Aspergillus niger (n ấm m ốc) 25,0 24,9 25,1 25,0 1,00 1,00 Saccharomyces cerevisiae 31,3 32,9 18,7 17,1 1,00 1,79 Triticum (lúa m ỳ) 27,3 27,1 22,7 22,8 1,00 1,19 Zea mays (ngô) 26,8 27,2 22,8 23,2 0,98 1,17 Salmo salar (cá h ồi) 29,7 29,1 20,8 20,4 1,02 1,43 7
Gallus domestica (gà nhà) 29,5 27,7 22,4 20,4 1,08 1,34 Homo sapiens (ng ười) 30,9 29,4 19,9 19,8 1,01 1,52 Hình 1.6. (a) R. Franklin; (b) Nhi ễu x ạ tia X c ủa ADN, và (c) Ảnh ch ụp. Erwin Chargaff (1949) l ần đầ u tiên áp d ụng ph ươ ng pháp s ắc ký gi ấy vào vi ệc phân tích thành ph ần hóa h ọc c ủa ADN các loài khác nhau đã khám phá ra r ằng (Bảng 1.2): (i) S ố l ượng b ốn lo ại baz ơ trong ADN là không b ằng nhau; (ii) T ỷ l ệ t ươ ng đối c ủa các baz ơ là không ng ẫu nhiên; trong t ất c ả các m ẫu ADN nghiên c ứu có t ươ ng quan v ề hàm l ượng (%) gi ữa các baz ơ: A ≈ T và G ≈ C, ngh ĩa là t ỷ s ố (A+G)/(T+C) ≈ 1; và (iii) M ỗi loài có m ột t ỷ l ệ (A+T)/(G+C) đặ c thù. 1.4.2. C ấu trúc c ủa chu ỗi xo ắn kép ADN Vào n ăm 1951-1952, vi ệc nghiên c ứu c ấu trúc ba chi ều c ủa ADN b ằng phân tích nhi ễu x ạ tia X được b ắt đầ u b ởi Maurice Wilkins và Rosalind Franklin (Hình 1.6). Các b ức ảnh ch ụp được g ợi ý rằng ADN có c ấu trúc xo ắn g ồm hai ho ặc ba chu ỗi. Tuy nhiên, gi ải pháp đúng đắ n nh ất là chu ỗi xo ắn kép bổ sung do Watson và Crick đư a ra n ăm 1953 (Hình 1.7 và 1.8). Mô hình này hoàn hoàn toàn phù h ợp v ới các s ố li ệu c ủa Wilkins và Franklin c ũng nh ư c ủa Chargaff. S ự ki ện này m ở ra một b ước ngo ặt m ới cho cho s ự ra đờ i và phát tri ển nhanh chóng c ủa sinh h ọc phân t ử. Với phát minh v ề mô hình c ấu trúc phân t ử ADN, Watson và Crick cùng chia s ẻ v ới Wilkins gi ải th ưởng Nobel n ăm 1962. 8
Hình 1.7. J.Watson (trái) và F.Crick cùng v ới M. Wilkins bên cạnh mô hình c ấu trúc phân t ử ADN làm nên tên tu ổi c ủa h ọ. Mô hình Watson-Crick (hay ADN d ạng B) có các đặ c điểm sau: (1) ADN g ồm hai chu ỗi đối song song (antiparallel) cùng u ốn quanh m ột tr ục trung tâm theo chi ều xo ắn ph ải, v ới đường kính 20A o (1Angstrom = 10 -10 m), g ồm nhi ều vòng xo ắn l ặp l ại m ột cách đều đặ n và chi ều cao m ỗi vòng xo ắn là 34 A o, ứng v ới 10 cặp baz ơ (base pair = bp). (2) Các b ộ khung đường-phosphate phân b ố ở m ặt ngoài chu ỗi xo ắn và các baz ơ n ằm ở bên trong; chúng x ếp trên nh ững m ặt ph ẳng song song v ới nhau và th ẳng góc v ới tr ục phân t ử, v ới kho ảng cách ~3,4 A o. (3) Hai m ạch đơn c ủa ADN g ắn v ới nhau b ằng các liên k ết hydro gi ữa các c ặp baz ơ đối di ện (n ằm cách nhau kho ảng 3A o) theo nguyên t ắc b ổ sung , đó là: A-T (2 liên k ết hydro) và G-C (3 liên kết) - Hình 1.8 và 1.9a. (4) Tính ch ất b ổ sung theo c ặp baz ơ d ẫn đế n s ự b ổ sung v ề trình t ự các baz ơ gi ữa hai mạch đơ n c ủa m ỗi chu ỗi xo ắn kép. Vì v ậy, trong b ất k ỳ m ột phân t ử ADN m ạch kép nào ho ặc m ột đoạn A+ G của nó bao gi ờ c ũng có: A = T và G = C; ngh ĩa là: [A + G] = [T + C] hay =1, còn t ỷ l ệ T+ C A+ T là đặc thù cho t ừng loài. Nh ư vậy, mô hình c ấu trúc chu ỗi xo ắn kép c ủa Watson-Crick G+ C (1953) hoàn toàn tho ả mãn các k ết qu ả nghiên c ứu c ủa Chargaff (1949); và các bi ểu th ức A = T và G = C còn g ọi là các quy lu ật Chargaff (Chargaff's rules). Vì v ậy, khi bi ết trình t ự baz ơ ở m ột m ạch đơn của ADN, ta có th ể xác đị nh được trình t ự baz ơ ở m ạch b ổ sung c ủa nó. Ví d ụ: Mạch 1 (cho tr ước): 5'- AATTCTTAAATTC -3' Mạch 2 (b ổ sung): 3'- TTAAGAATTTAAG -5' Tóm l ại, hai đặ c điểm quan tr ọng nh ất trong c ấu trúc ADN là s ự phân c ực ng ược chi ều của hai mạch đơn (5' →3' và 3' →5') và nguyên t ắc b ổ sung của các c ặp baz ơ (A-T và G-C). Đây là hai 9
nguyên lý c ăn b ản chi ph ối các c ơ ch ế di truy ền ở c ấp độ phân t ử (tái b ản, phiên mã và d ịch mã), mà ta có th ể hình dung t ổng quát ở s ơ đồ g ọi là Giáo lý trung tâm của Sinh h ọc phân t ử. Hình 1.8. Các mô hình c ấu trúc chu ỗi xo ắn kép ADN. (a) (b) Hình 1.9. (a) Hai ki ểu k ết c ặp baz ơ bổ sung A-T và G-C. (b) S ơ đồ minh h ọa các kh ả n ăng k ết c ặp “1 pyrimidine - 1 pyrimidine”, “1 purine - 1 purine”, và “1 purine - 1 pyrimidine” (xem gi ải thích trong bài). Cần l ưu ý r ằng, theo nguyên t ắc k ết c ặp các baz ơ đối di ện trên 2 m ạch đơn c ủa ADN có th ể có các tr ường h ợp sau: "1 pyrimidine - 1 pyrimidine", "1 purine - 1 purine", "1 purine - 1 pyrimidine" nh ư ở Hình 1.9b Tuy nhiên, nh ư ta th ấy, hai tr ường h ợp đầ u cho th ấy chúng ho ặc là quá m ỏng ho ặc quá dày so v ới đường kính phân t ử. Ch ỉ có tr ường h ợp "1 purine - 1 pyrimidine" là phù h ợp. Nh ư v ậy có th ể có 4 ki ểu k ết c ặp là A-T, G-C, A-C và G-T; trong đó ch ỉ có hai ki ểu A-T 10
và G-C là b ền v ững, còn các ki ểu A-C và G-T vì ch ỉ có m ột liên k ết hydro, kém b ền nên chúng ch ỉ xu ất hi ện nh ư là ngo ại l ệ khi có s ự h ỗ bi ến c ủa các baz ơ và h ậu qu ả là d ẫn t ới s ự phát sinh các độ t bi ến thay th ế baz ơ d ạng đồ ng hoán trong quá trình tái b ản ADN (ch ươ ng 7). 1.4.3. Các d ạng bi ến đổ i c ủa ADN Mô hình Watson-Crick hay ADN dạng B là c ấu trúc ph ổ bi ến. Tuy nhiên, sau này ng ười ta còn phát hi ện ra nhi ều d ạng xo ắn ph ải khác (A, C, D ); chúng có một s ố bi ến đổ i so v ới ADN-B (Bảng 1.3). Bên c ạnh các d ạng ADN xo ắn ph ải (A, B, C ), Alexander Rich và đồng s ự (1979) còn phát hi ện thêm m ột d ạng ADN xo ắn trái duy nh ất cho đế n nay. D ạng ADN này có b ộ khung zigzag uốn g ập khúc theo chi ều xo ắn trái, m ỗi vòng xo ắn dài 45,6A o ch ứa 12 c ặp baz ơ. Nhìn chung, so v ới ADN d ạng B, ADN-Z dài và thon g ầy h ơn, các rãnh l ớn b ị d ẹt ra ph ần b ề m ặt c ủa chu ỗi xo ắn; còn ADN d ạng A ng ắn và m ập h ơn (Hình 1.10; B ảng 1.3). Bảng 1.3. Một s ố đặ c điểm chính c ủa các ADN d ạng A, B và Z. Dạng Chi ều xo ắn Số bp/vòng xo ắn Đường kính chu ỗi xo ắn A Ph ải 11,0 23A o B Ph ải 10,0 19A o Z Trái 12,0 18A o Nh ững vùng nào c ủa ADN có ch ứa các purine và pyrimidine s ắp x ếp xen k ẽ nhau trên m ột mạch thì có th ể ti ếp nh ận c ấu hình ADN-Z, ví d ụ: 5' CGCGCG 3' 3' GCGCGC 5' Sự chuy ển đổ i này di ễn ra thu ận l ợi b ởi s ự có m ặt c ủa 5-methylcytosine và b ởi tr ạng thái siêu xo ắn âm (negative supercoiling). ADN là m ột phân t ử độ ng h ọc, vì v ậy nó có th ể chuy ển t ừ m ột c ấu hình này sang m ột c ấu hình khác d ựa trên các l ực bên ngoài trong t ế bào. S ự chuy ển đổ i t ừ d ạng B sang d ạng Z có th ể có liên quan đến s ự điều hoà bi ểu hi ện gen. C ấu trúc này c ũng có m ặt trong các tế bào s ống v ới m ột t ỷ l ệ r ất nh ỏ song ch ức n ăng c ủa nó còn ch ưa th ật s ự hi ểu rõ. Hình 1.10. Các mô hình ADN dạng A, B và Z. 1.4.4. Đặc tính hóa lý c ủa ADN Một trong nh ững đặ c điểm quan tr ọng nh ất c ủa ADN là hai m ạch đơn b ổ sung c ủa nó g ắn v ới 11
nhau b ằng các liên k ết hydro, v ốn là l ực hóa h ọc y ếu nên chúng có th ể b ị phân h ủy d ưới tác d ụng của các enzyme, n ăng l ượng làm cho hai m ạch đơn c ủa chu ỗi xo ắn kép tách r ời nhau, g ọi là bi ến tính (denaturation). Nh ờ đó ADN mới có th ể tái b ản và các gen có th ể phiên mã và bi ểu hi ện ra s ản ph ẩm c ủa chúng. M ặt khác, ADN có th ể ph ục h ồi tr ạng thái ban đầ u gọi là hồi tính (renaturation). Bằng th ực nghi ệm, ng ười ta đã ch ứng minh điều đó b ằng cách s ử d ụng các tác nhân v ật lý và hóa h ọc khác nhau. Ch ẳng h ạn, khi đun nóng t ừ t ừ khi đun nóng t ừ t ừ dung d ịch ch ứa ADN thì ở nhi ệt độ v ừa ph ải, thì các phân t ử ADN b ị bi ến tính t ừng ph ần, và khi t ăng lên t ới nhi ệt độ g ần 100 oC (th ường là 90-95 oC) thì các liên k ết hydro c ủa chúng b ị phá h ủy hoàn toàn và hai m ạch b ổ sung tách ra (bi ến tính hoàn toàn). Điều đó có th ể gi ải thích nh ư sau: Vì m ỗi c ặp A-T ch ỉ có hai liên kết hydro, kém b ền h ơn so v ới m ỗi c ặp G-C có t ới ba liên k ết, cho nên các vùng giàu c ặp A-T s ẽ tách t ừng ph ần tr ước, trong khi các vùng giàu c ặp G-C v ẫn gi ữ nguyên đặc tính xo ắn kép và ch ỉ tách ở nhi ệt độ cao. Ng ược l ại, khi làm ngu ội t ừ t ừ dung d ịch ADN nóng ch ảy hoàn toàn này thì các mạch đơ n th ường c ặp lại với mạch bổ sung c ủa chúng và làm ph ục h ồi cấu trúc chu ỗi xo ắn kép nh ư lúc đầu. Đây là hai quá trình thu ận-ngh ịch. – Bi ến tính hay sự tách hai mạch của chu ỗi xo ắn kép ADN Trong khi các t ỷ s ố G v ới C và A v ới T trong ADN của m ột sinh v ật là c ố đị nh, thì hàm l ượng GC (t ỷ l ệ ph ần tr ăm c ủa G + C) có th ể sai khác nhau m ột cách đáng k ể gi ữa các ADN thu ộc các loài khác nhau. Bảng 1.4 cho th ấy hàm l ượng GC c ủa ADN nhi ều loài sinh v ật. Các tr ị s ố này bi ến thiên từ 22% đến 73%, và điều đó được ph ản ảnh trong s ự sai khác v ề các đặ c tính c ủa ADN. Nhi ệt độ mà t ại đó các m ạch ADN tách nhau m ột n ửa được g ọi là nhi ệt độ nóng ch ảy (melting temperature), ký hi ệu là Tm. T m là điểm gi ữa c ủa pha chuy ển ti ếp và nó tùy thu ộc vào hàm lượng GC c ủa ADN, ngh ĩa là đặc tr ưng cho ADN m ỗi loài. Trên th ực t ế, hàm l ượng GC c ủa ADN càng cao thì T m của nó càng cao (Hình 1.12). Ví d ụ, ADN c ủa E. coli với 50-51% GC thì có T m là 69- 70 oC. T ươ ng t ự, k ết qu ả x ử lý nhi ệt đố i v ới ADN ph ế c ầu khu ẩn Streptococcus pneumoniae và nhi ệt độ nóng ch ảy c ủa nó được đo b ằng s ự gia t ăng độ h ấp th ụ ở 260-nm cho phép thu được đường o cong nóng ch ảy c ủa vi khu ẩn này. T m cho ADN này d ưới nh ững điều ki ện nh ư th ế là kho ảng 85 C (Hình 1.11). Bảng 1.4. Hàm l ượng t ươ ng đối (G + C) c ủa các ADN khác nhau Ngu ồn ADN (G+C)% Ngu ồn ADN (G+C)% Dictyostelium (m ốc nh ầy) 22 Lách chu ột 44 Streptococcus pyogens 34 Tinh trùng cá h ồi 44 Bacillus cereus 37 B. subtilis 44 Hemophilus influenzae 39 Escherichia coli 51 Saccharomyces cerevisiae 39 Phage T7 51 Tuy ến ức bê 40 Phage T3 53 Gan chu ột (Rattus) 40 Neurospora crassa 54 Streptococcus pneumoniae 42 Herpes simplex virus 72 Mầm lúa m ỳ 43 Mycobacterium phlei 73 12
Hình 1.11. Đường cong nóng ch ảy c ủa ADN Streptococcus pneumoniae . ADN s ợi kép b ị bi ến tính bởi vi ệc đun nóng và nhi ệt độ nóng ch ảy c ủa nó được đo b ằng s ự t ăng độ h ấp th ụ ở b ước sóng 260 nm. Điểm mà t ại đó 50% c ặp baz ơ b ị bi ến tính hay m ột n ửa ADN có d ạng s ợi đơn g ọi là o nhi ệt độ nóng ch ảy (T m). Ở ví d ụ này là kho ảng 85 C. (Ph ỏng theo P. Doty, The Harvey Lectures 55:121, 1961). – Sự ph ục h ồi tr ạng thái nguyên th ể c ủa ADN hay h ồi tính Một khi hai m ạch c ủa ADN tách ra, d ưới nh ững điều ki ện thích h ợp chúng có th ể k ết h ợp tr ở lại và ph ục h ồi tr ạng thái ban đầ u. Góp ph ần vào hi ệu qu ả "h ồi tính" này c ủa ADN có nhi ều nhân tố. D ưới đây nêu lên ba nhân t ố quan tr ọng nh ất: (i) Nhi ệt độ tối ưu cho s ự h ồi tính c ủa m ột ADN là kho ảng 25 oC d ưới nhi ệt độ nóng ch ảy c ủa nó; (ii) Nồng độ ADN trong dung d ịch c ũng quan tr ọng. Trong gi ới h ạn h ợp lý, n ồng d ộ ADN càng cao thì hai m ạch b ổ sung s ẽ càng d ễ dàng b ắt g ặp nhau trong m ột th ời gian nào đó. Nói cách khác, n ồng độ càng cao thì s ự hàn g ắn tr ở l ại càng nhanh. (iii) Th ời gian cho phép hai m ạch hàn g ắn tr ở l ại càng dài thì s ự h ồi tính x ảy ra càng d ễ dàng. Hình 1.12. Mối quan h ệ gi ữa nhi ệt độ nóng ch ảy c ủa ADN và hàm l ượng GC. ADN ch ỉ có AT (AT-DNA) là các ADN t ổng h ợp bao g ồm ch ủ y ếu là A và T (hàm l ượng GC = 0). (Ph ỏng theo P. Doty, The Harvey Lectures 55:121, 1961). 13
1.4.5. Ch ức n ăng c ủa ADN Ngày nay, chúng ta đều bi ết r ằng ADN hay b ộ gen c ủa t ất c ả các sinh v ật nói chung có ch ức năng chính là mang đầy đủ toàn b ộ thông tin di truy ền đặc tr ưng của loài. Thông tin này được ghi l ại dưới d ạng m ật mã, g ọi là mã di truy ền, ch ứa đự ng trong các gen c ấu trúc cũng nh ư các yếu t ố điều hòa để điều khi ển m ọi ho ạt độ ng sinh tr ưởng, phân chia và bi ệt hoá c ủa t ế bào. Các ch ức n ăng và c ơ ch ế truy ền đạ t thông tin di truy ền chính y ếu c ủa ADN được mô t ả tóm t ắt nh ư d ưới đây. Hơn n ữa, ADN hay v ật ch ất di truy ền nói chung đều có kh ả n ăng t ự sao chép m ột cách chính xác b ản thân nó trong quá trình tái b ản (replication). Đấy là cơ s ở c ủa s ự t ự nhân đôi nhi ễm s ắc th ể và phân chia t ế bào, qua đó truy ền đạ t v ật ch ất di truy ền cho th ế h ệ sau. Đó còn là các quá trình ho ạt động và điều hoà s ự bi ểu hi ện c ủa các gen trong b ộ gen, th ường được k ể đế n nh ư là các quá tình phiên mã (transcription) và dịch mã (translation) để tổng h ợp các phân t ử ARN và cu ối cùng là các protein tham gia vào các c ấu trúc và ho ạt độ ng cơ s ở của t ế bào. Nh ờ đó mà con cái sinh ra th ường gi ống v ới cha m ẹ, m ỗi loài duy trì s ự ổn đị nh t ươ ng đối b ộ gen c ủa mình và nói r ộng ra là, nh ờ đó mà sự s ống được duy trì m ột cách liên t ục k ể t ừ khi s ự s ống b ắt đầ u hình thành trên trái đất cách đây ch ừng ba t ỷ r ưỡi n ăm. Mặt khác, ADN còn có kh ả n ăng phát sinh các bi ến đổ i trong quá trình phát tri ển cá th ể và sinh sản. Đó là các đột bi ến gen (gene mutations) gây ra b ởi tác độ ng c ủa các tác nhân v ật lý và hoá h ọc khác nhau, ho ặc do chính các sai sót trong quá trình tái b ản, ho ặc do s ự d ịch chuy ển v ị trí c ủa b ản thân các gen trong b ộ gen - các yếu t ố di truy ền v ận độ ng (transposable genetic elements) hay còn g ọi là các gen nh ảy (jumping genes) – gây nên sự bi ến độ ng c ủa b ộ gen và bi ến đổ i ở ki ểu hình. Ngoài ra, đó còn là các quá trình tái t ổ h ợp di truy ền (genetic recombination) t ạo nên các bi ến d ị t ổ h ợp phong phú và đa d ạng trong quá trình sinh s ản c ủa sinh v ật. Chính các quá trình bi ến đổ i đa d ạng này đã không ng ừng t ạo nên các ngu ồn bi ến d ị di truy ền s ơ c ấp và th ứ c ấp cho s ự ch ọn l ọc và ti ến hoá c ủa sinh gi ới. 2. C ấu trúc và ch ức n ăng c ủa protein 2.1. C ấu trúc c ủa protein Các protein là nh ững polymer sinh h ọc được t ạo ra b ởi s ự k ết n ối c ủa các axit amin (amino acid) v ới nhau b ằng các liên k ết peptide . Có 20 lo ại L-α-axit amin được phát hi ện trong các protein của các t ế bào. Về c ấu trúc, nói chung, m ỗi axit amin g ồm có m ột nguyên t ử carbon alpha (C α) ở v ị trí trung tâm, đính xung quanh nó là m ột nhóm ạmin (-NH 2), m ột nhóm carboxyl (-COOH), m ột nguyên t ử hydro (-H) và m ột g ốc R hay chu ỗi bên đặc tr ưng cho t ừng lo ại axit amin (Hình 1.14). Khi ở tr ạng + thái dung d ịch, các nhóm amin và carboxyl th ường phân ly thành tr ạng thái ion, t ươ ng ứng là H3N- và -COO − (Hình 1.13). 14
(a) (b) Hình 1.13. (a) Cấu trúc chung của các axit amin. (b) Một dipeptide. Hai axit amin n ối v ới nhau b ằng m ột liên k ết peptide (−CO −NH−) gi ữa nhóm carboxyl c ủa axit amin này v ới nhóm amin c ủa axit amin k ế ti ếp và lo ại tr ừ m ột phân t ử n ước; c ứ nh ư th ế các axit amin k ết n ối v ới nhau t ạo thành m ột chu ỗi g ồm nhi ều axit amin, g ọi là polypeptide (Hình 1.15). + − Mỗi chu ỗi polypeptide luôn luôn có chi ều xác đị nh H3N → COO (do tác d ụng c ủa peptydyl- transferase ) và được đặ c tr ưng v ề s ố l ượng, thành ph ần và ch ủ y ếu là trình t ự s ắp x ếp c ủa các axit amin. Có b ốn m ức độ c ấu trúc c ủa các protein (xem Hình 1.16). Cấu trúc protein b ậc I là trình t ự s ắp x ếp c ủa các axit amin trong m ột chu ỗi polypeptide. Đây là b ậc c ấu trúc c ơ s ở quan tr ọng nh ất c ủa t ất c ả các protein do gen quy đị nh. 15
Hình 1.14. Cấu t ạo c ủa 20 lo ại axit amin thu ộc các nhóm khác nhau. Hình 1.15. Sự hình thành liên k ết peptide gi ữa các axit amin. Hình 1.16. Bốn b ậc c ấu trúc c ủa protein. 16
Cấu trúc protein b ậc II xảy ra khi trình t ự các axit amin trong m ột chu ỗi polypeptide n ối v ới nhau b ằng các liên k ết hydro. C ấu trúc này có hai ki ểu c ơ b ản, đó là: chu ỗi xo ắn alpha (xo ắn trái) và tấm beta (g ấp n ếp). Cấu trúc protein b ậc III xảy ra khi các l ực h ấp d ẫn nào đó có m ặt gi ữa các vùng xo ắn alpha và các t ấm beta g ấp n ếp trong một chu ỗi polypeptide, hình thành nên m ột c ấu trúc cu ộn g ập có d ạng kh ối c ầu. M ột s ố protein ch ức n ăng có c ấu trúc ki ểu này, ví d ụ myoglobin Cấu trúc protein b ậc IV là m ột protein g ồm hai ho ặc nhi ều chu ỗi polypeptide cùng lo ại ho ặc khác lo ại k ết h ợp v ới nhau. Có khá nhi ều protein ch ức n ăng có ki ểu c ấu trúc này; m ột s ố nh ư hemoglobin còn có thêm ion kim lo ại nh ư Fe ++ trong túi hem c ủa nó. 2.2. Ch ức n ăng c ủa protein Nói chung, protein là các h ợp ch ất h ữu c ơ v ốn là c ơ s ở c ủa s ự s ống, v ới các ch ức n ăng thi ết yếu sau đây (Hình 1.17): Hình 1.17. Tổng quát v ề c ấu trúc và ch ức n ăng c ủa protein. (i) Các protein là thành ph ần c ấu t ạo cơ s ở c ủa các t ế bào, bao g ồm các màng t ế bào, các bào quan, b ộ máy di truy ền c ủa chúng. Đó c ũng là các protein d ạng m ạch làm thành các c ơ quan, b ộ ph ận trên c ơ th ể các độ ng v ật, nh ư: collagen làm nên x ươ ng, s ụn, gân và da; keratin c ấu t ạo nên các lớp ngoài cùng c ủa da và tóc, móng, s ừng và lông; (ii) Các enzyme đóng vai trò xúc tác cho t ất c ả các ph ản ứng hóa h ọc trong t ế bào và c ơ th ể đều là nh ững protein hình c ầu. Quan tr ọng nh ất là các enzyme tham gia vào các con đường chuy ển hóa và các enzyme tham gia vào các quá trình truy ền thông tin di truy ền trong t ế bào (Hình 1.18). 17
Hình 1.18. Lysozyme lòng tr ắng tr ứng gà. (a) Lysozyme t ự do. (b) Lysozyme có c ơ ch ất bám vào. (Ph ỏng theo Horton et al, 2006). (iii) Các kháng th ể (antibodies) trong h ệ th ống mi ễn d ịch, còn g ọi là các immunoglobulin, làm ra hàng ngàn protein khác nhau v ốn được sinh ra trong huy ết thanh máu ph ản ứng l ại v ới các kháng nguyên (antigens). Chúng đóng vai trò b ảo v ệ c ơ th ể ch ống l ại s ự xâm nh ập c ủa các v ật l ạ. (iv) Các hormone protein b ắt ngu ồn t ừ các tuy ến n ội ti ết thì không ho ạt độ ng nh ư các enzyme. Thay vì kích thích các c ơ quan đích, chúng ki ểm soát các ho ạt độ ng quan tr ọng, nh ư t ốc độ chuy ển hóa và s ản xu ất các enzyme tiêu hóa và s ữa ch ẳng h ạn. Insulin (t ừ tuy ến t ụy) điều hòa s ự chuy ển hóa carbohydrate b ằng cách ki ểm soát các m ức glucose trong máu. Thyroglobulin (t ừ tuy ến giáp) điều hòa các quá trình chuy ển hóa nói chung; calcitonin c ũng t ừ tuy ến giáp làm h ạ th ấp m ức calci máu. (v) Ngoài ra, các protein còn là ngu ồn dinh d ưỡng chính cung c ấp n ăng l ượng cho t ế bào và cơ th ể duy trì các ho ạt động trao đổ i ch ất và l ớn lên. Ví d ụ hemoglobin mang các sinh ch ất theo máu đi kh ắp c ơ th ể; các fibrinogen và fibrin được bi ến đổ i t ừ nó v ốn có trong máu c ần thi ết cho quá trình đông máu. Các protein c ơ mà ch ủ y ếu là myosin ph ối h ợp v ới actin t ạo thành actomyosin, ch ịu trách nhi ệm cho ho ạt độ ng co c ơ 3. Cấu trúc và ch ức n ăng c ủa các Polysaccharide 3.1. C ấu trúc c ủa các Polysaccharide Các polysaccharide và h ợp ch ất carbohydrate nói chung có hành ph ần hóa h ọc g ồm các nguyên t ố C, H và O, theo t ỷ l ệ thông th ường là 1:2:1 hay (CH 2O) n. Đơ n phân cấu t ạo nên chúng là các monosaccharide, ch ủ y ếu là glucose. Các monosaccharide n ối v ới nhau b ằng các liên k ết glycosid tạo thành các chu ỗi polysaccharide . (Hình 1.19 và 1.20) Hình 1.19. (a) Glucose và (b) cellulose. Cellulose là m ột polymer mạch th ẳng do các g ốc glucose nối v ới nhau b ằng các liên k ết glycosid. 18
Hình 1.20. Sự hình thành các disaccharide Lactose (a) và Sucrose (b) b ằng các liên k ết β1,4- và α1,2-glycosid. 3.2. Ch ức n ăng c ủa các Polysaccharide Các polysaccharide có hai ch ức n ăng quan tr ọng nh ất trong t ế bào, đó là tham gia vào c ấu t ạo và d ự tr ữ n ăng l ượng. V ề c ấu t ạo, cellulose tạo nên vách t ế bào th ực v ật và nó là h ợp ch ất h ữu c ơ có mặt ph ổ bi ến trong sinh quy ển. V ề n ăng l ượng, ngu ồn d ự tr ữ n ăng l ượng ở t ế bào động v ật là glycogen , trong khi đó ở các t ế bào th ực v ật là tinh b ột. 4. Cấu trúc và ch ức n ăng c ủa Lipid 4.1. C ấu trúc c ủa Lipid Đon v ị c ấu trúc c ơ s ở c ủa lipid là các axit béo. Mỗi axit béo bao g ồm m ột chu ỗi hydrocarbon đính vào nhóm carboxyl (–CÔOH); chúng khác nhau về chi ều dài của mạch, s ố carbon c ũng nh ư s ố lượng và vị trí của các liên k ết đôi carbon-carbon (C=C). Các axit béo ph ổ bi ến trong các t ế bào có số nguyên t ử carbon th ường là 14, 16, 18 ho ặc 20 (xem Bảng 1.5). Các axit béo th ường được vi ết tắt Cx:y, trong đó x là s ố l ượng carbon trong chu ỗi và y là s ố liên kết đôi. Chu ỗi hay m ạch hydrocarbon dài c ủa m ột axit béo có th ể không ch ứa liên k ết đôi thì g ọi là axit béo no hay bão hòa (saturated) ho ặc có m ột hay nhi ều liên k ết đôi thì g ọi là axit béo không no hay không bão hòa (unsaturated). Bảng 1.5. Một s ố axit béo chi ếm ưu th ế trong các phospholipid (Lược t ừ Lodish et al, 2008) Tên ph ổ bi ến c ủa các axit (D ạng ion hóa trong ngo ặc đơn) Vi ết t ắt Công th ức hóa h ọc Các axit béo bão hòa: Palmitic (palmitate) C16:0 CH 3(CH 2)14 COOH Stearic (stearate) C18:0 CH 3(CH 2)16COOH Các axit béo không bão hòa: Oleic (oleate) C18:1 CH 3(CH 2)7CH=CH(CH 2)7COOH Linoleic (linoleate) C18:2 CH 3(CH 2)4CH=CHCH 2CH=CH(CH 2)7COOH 19
Tất c ả các phosphoglyceride đề u là nh ững phân t ử l ưỡng c ực (amphipathic), có m ột cái đuôi kỵ n ước (th ường là hai chu ỗi axit béo) và m ột cái đầu ưa n ước (hydrophilic head; Hình 1.21a,b). Trong dung d ịch n ước, hi ệu qu ả ưa n ước và các ki ểu t ươ ng tác van der Waals đư a l ại s ự t ổ ch ức và ổn đị nh các phospholipid vào m ột trong ba c ấu trúc sau: micelle, liposome ho ặc là màng hai l ớp (Hình 1.21c). 4.2. Ch ức n ăng c ủa Lipid Lipid là thành ph ần c ấu t ạo quan tr ọng c ủa các màng sinh h ọc (biomembrane; Hình 1.21), ng ăn cách gi ữa các t ế bào v ới môi tr ường chung quanh, gi ữa các khoang trong tế bào sinh v ật nhân chu ẩn, đồ ng th ời nó là n ơi bám của một s ố protein. Cũng nh ư glucose, các axit béo là ngu ồn n ăng l ượng cho nhi ều t ế bào và được b ảo qu ản d ưới dạng triacylglycerol (xem Hình dưới) trong mô m ỡ. Ngoài ra, các axit béo còn là nh ững ch ất ti ền thân cho phospholipid và nhi ều lipid khác v ới m ột lo ạt ch ức n ăng khác nhau. Hình 1.21. Cấu trúc của phospholipid . (a) C ấu trúc c ủa phosphat-idylcholine, m ột phosphoglyceride điển hình, và (b) Mô hình c ấu t ạo c ủa glycerophospholipid. (c) T ổ ch ức c ủa các phospholipid trong c ấu trúc của một micelle, liposome và màng hai l ớp trong dung d ịch nước. 20
5. Các liên k ết hóa h ọc c ơ b ản và vai trò c ủa chúng 5.1. Các liên k ết đồ ng hóa tr ị trong các đạ i phân t ử sinh h ọc Liên k ết hóa h ọc là l ực hút gi ữa các nguyên t ử hay các phân t ử v ới nhau. Có hai lo ại liên k ết cơ b ản v ới vai trò khác nhau, đó là: Các liên k ết c ộng hóa tr ị và các liên k ết hóa h ọc y ếu (Hình 1.22). 5.1.1. Các liên k ết c ộng hóa tr ị hay đồ ng hóa tr ị (covalent) Đó là các lực hóa h ọc m ạnh gi ữ ch ặt sự n ối k ết gi ữa các nguyên t ử trong m ột phân t ử ho ặc tạo ra các đại phân t ử có c ấu trúc b ền v ững. Ví d ụ, c ầu disulfur (–S–S–), liên k ết ester (xem Bảng 1.6). Ở đây, xin nh ắc l ại các liên k ết đồ ng hóa tr ị quan tr ọng trong vi ệc k ết nối các đơn phân để t ạo thành các c ấu trúc đa phân chính y ếu sau: + Các liên k ết N-glycosid và liên k ết ester nối k ết gi ữa C1' và C5'c ủa g ốc đường v ới baz ơ và nhóm phosphate tr ọ ra c ấu trúc các nucleotide. Các nucleotide n ối v ới nhau b ằng các liên k ết phosphodiester tạo thành các chu ỗi polynucleotide – cấu trúc b ậc I c ủa các phân t ử axit nucleic. + Các axit amin n ối v ới nhau b ằng các liên k ết peptid tạo thành các chu ỗi polypeptide – cấu trúc b ậc I c ủa các phân t ử protein. + Các monosaccharide k ết h ợp v ới nhau b ằng các liên k ết glycosid tạo thành các polysaccharide; ví d ụ các glucose n ối v ới nhau b ằng các liên k ết β1,4-glycosid để t ạo ra s ợi cellulose. Bảng 1.6. Một s ố nhóm ch ức n ăng và liên k ết đồ ng hóa tr ị c ơ b ản 5.1.2. Các liên k ết hóa h ọc y ếu Đó là các t ươ ng tác không ph ải đồ ng hóa tr ị (noncovalent interactions), có m ức n ăng l ượng th ấp th ường d ễ b ị phá v ỡ và ch ỉ t ồn t ại trong m ột th ời gan ng ắn. Các liên k ết này đóng vai trò r ất quan tr ọng trong các h ệ th ống s ống; chúng được hình thành do s ự t ươ ng tác gi ữa các thành ph ần của m ột phân t ử hay gi ữa các phân t ử v ới nhau. Có b ốn lo ại liên k ết hóa h ọc y ếu c ơ b ản (Hình 1.22 và 1.23), đó là: (i) Liên k ết hydro là l ực hóa h ọc y ếu được hình thành do s ự t ươ ng tác gi ữa nguyên t ử hydro (H) v ới nguyên t ử oxy (O) ho ặc nguyên t ử nit ơ (N) c ủa các phân t ử khác nhau. Trong các h ệ th ống sống, chính sự có m ặt c ủa các nhóm amin (–NH 2) và hydroxyl (–OH) trong thành ph ần c ủa các axit 21
nucleic, protein và carbonhydrate cho phép hình thành các liên k ết hydro nội trong các đại phân t ử này c ũng nh ư sự tươ ng tác gi ữa chúng trong môi tr ường c ơ b ản của s ự s ống là n ước. Nh ư đã bi ết, các liên k ết hydro trong các c ặp G-C và A-T ho ặc A-U không ch ỉ giúp ổn đị nh cấu trúc các phân t ử ADN và ARN mà còn cho phép chúng th ực hi ện các ch ức n ăng di truy ền đặ c thù nh ư tái b ản, phiên mã và d ịch mã. Trong protein, các liên k ết hydro có vai trò đặc bi ệt trong vi ệc hình thành c ấu trúc b ậc II nh ư xo ắn α hay phi ến β, c ấu trúc b ậc III và t ừ đó quy đị nh c ấu hình đặc tr ưng c ủa t ừng protein (Hình 1.16). Hình 1.22. Năng l ượng tươ ng đối c ủa các liên k ết đồ ng hóa tr ị và các t ươ ng tác không ph ải đồng hóa tr ị. Các n ăng l ượng liên k ết được xác đị nh là n ăng l ượng c ần thi ết để phân h ủy m ột ki ểu liên k ết c ụ th ể. So v ới các t ươ ng tác không ph ải đồ ng hóa tr ị thì các liên k ết đồ ng hóa tr ị có l ực m ạnh g ấp 100 đến 1.000 lần. Năng l ượng của các t ươ ng tác không ph ải đồ ng hóa tr ị lớn hơn nhi ệt n ăng c ủa nhi ệt độ phòng (25 oC) một chút. Nhi ểu quá trình sinh h ọc kèm theo s ự gi ải phóng n ăng l ượng khi th ủy phân m ột liên k ết phosphoanhydride trong ATP (Theo Lodish et al, 2006). (ii) Liên k ết ion là l ực t ươ ng tác t ĩnh điện gi ữa hai nguyên t ử hay hai nhóm có điện tích khác dấu (nhóm tích điện âm g ọi là cation và nhóm tích điện d ươ ng g ọi là anion ). Bởi vì điện t ử liên k ết không phân chia đồng đề u cho hai phía nên liên k ết này không được x ếp vào nhóm các liên k ết đồng hóa tr ị. Trong h ệ th ống s ống, đáng k ể nh ất đó là m ối liên k ết ion gi ữa các histone v ới ADN trong nhân hay các protein và enzyme th ực hi ện các quá trình tái b ản, phiên mã, điều hòa ho ạt độ ng của các gen c ũng nh ư c ủa c ả b ộ gen, V ề th ực ch ất, đó là s ự t ươ ng tác gi ữa c ấu hình không gian đặc tr ưng c ủa các protein v ới các đoạn trình t ự đặ c thù trên ADN. Hình 1.23. Tính ch ất b ổ sung phân t ử và vi ệc bám dính c ủa các protein nh ờ các t ươ ng tác không 22
ph ải đồ ng hóa tr ị. (Lodish et al, 2006). (iii) T ươ ng tác van der Walls là l ực t ươ ng tác không đặc hi ệu xu ất hi ện gi ữa hai nguyên t ử khi chúng ti ến l ại g ần nhau và gây ra s ự phân c ực nh ất th ời trên phân t ử. Đó là k ết qu ả c ủa các l ực hút và đẩy c ủa các đám mây điện t ử trong m ột kho ảng cách xác đị nh. Ví d ụ, đó là sự t ươ ng tác gi ữa enzyme và c ơ ch ất (Hình 1.18), gi ữa kháng nguyên và kháng th ể (iv) T ươ ng tác k ỵ n ước (hydrophobic) là l ực thúc đẩ y các phân t ử ho ặc các vùng không phân cực (non-polar) c ủa chúng liên k ết v ới nhau thay vì liên k ết v ới các phân t ử n ước; vì th ế g ọi là tươ ng tác k ỵ nước hay “ghét n ước”, “sợ n ước”. Các t ươ ng tác d ạng này đóng vai trò quan tr ọng trong vi ệc ổn đị nh tr ạng thái c ủa các phân t ử protein, các ph ức h ợp c ủa protein v ới các phân t ử khác (Hình 1.23) Tóm l ại, các ki ểu liên k ết hóa h ọc y ếu đóng vai trò vô cùng quan tr ọng đố i v ới các h ệ th ống sống. Nh ờ có s ố l ượng l ớn các liên k ết này mà các đại phân t ử axit nucleic, các protein và các h ệ th ống s ống nói chung v ừa có tính ổn đị nh v ừa có tính linh độ ng, v ừa đả m b ảo s ự liên l ạc gi ữa các bộ ph ận và s ự hài hòa c ủa c ả h ệ th ống. TÓM T ẮT (1) Các axit nucleic (ADN và ARN) và protein là các đại phân t ử sinh h ọc quan tr ọng nh ất của s ự s ống. Bộ gen của tuy ệt đạ i đa s ố sinh v ật là ADN; protein là s ản ph ẩm c ủa các gen ch ứa đựng trong ADN. Mỗi loài có m ột b ộ gen (genome) và một bộ protein (proteome) đặ c thù và ổn định. Các polysaccharide tham gia vào c ấu t ạo và d ự tr ữ n ăng l ượng. Phospholipid là thành ph ần cấu t ạo quan tr ọng c ủa các màng sinh h ọc, còn các axit béo là ngu ồn n ăng l ượng cho nhiều t ế bào. (2) Đơ n phân c ủa ADN và ARN là các nucleotide. M ỗi nucleotide có công th ức cấu t ạo t ổng quát là: Baz ơ – Đường – Phosphate, v ới baz ơ là thành ph ần đặ c tr ưng. Trong ADN có 4 lo ại là A, G, T và C, còn trong ARN có U thay cho T. Các nucleotide n ối với nhau b ằng các liên k ết phosphodiester t ạo thành các polynucleotide theo chi ều 5’ →3’. (3) Hầu h ết ADN có c ấu trúc đúng nh ư mô hình c ủa Watson – Crick, v ới hai đặc điểm quan tr ọng nh ất là: S ự ng ược chi ều c ủa hai m ạch đơn và tính ch ất b ổ sung c ủa các c ặp baz ơ. H ệ qu ả c ủa nguyên t ắc b ổ sung là trong ADN luôn có A = T và G = C (còn g ọi là quy lu ật Chargaff ). (4) Do tính ch ất đặ c thù c ủa các liên k ết hydro mà ADN có th ể bi ến tính và hồi tính . Nh ờ đó ADN có th ể th ực hi ện các quá trình truy ền thông tin di truy ền trong t ế bào nh ư tái b ản, phiên mã và dịch mã. (5) Đơ n v ị c ấu trúc c ơ s ở c ủa protein là 20 lo ại α-axit amin; chúng nối v ới nhau b ằng các liên kết peptide để tạo thành các chu ỗi polypeptide. Protein có 4 b ậc c ấu trúc I, II, III và IV. Các protein đảm nh ận các ch ức n ăng khác nhau trong t ế bào, nh ư: c ấu trúc, xúc tác, điều hòa, b ảo v ệ (6) Các t ươ ng tác hóa h ọc y ếu nh ư liên k ết hydro, liên k ết ion đóng vai trò rất quan tr ọng đối v ới các h ệ th ống s ống. Nh ờ đó các phân t ử axit nucleic và protein v ừa có tính ổn đị nh về c ấu trúc vừa có tính linh độ ng trong các quá trình di truy ền, sinh hóa-sinh lý c ủa t ế bào. CÂU H ỎI VÀ BÀI T ẬP 1. Các axit amin n ối v ới nhau b ằng các liên k ết ___(a)___ và t ạo nên c ấu trúc b ậc I g ọi là ___(b)___. 2. Các nucleotide n ối v ới nhau b ằng các liên k ết ___(a)___ và t ạo nên c ấu trúc b ậc I g ọi là 23
___(b)___. 3. Trong các nucleotide c ủa ADN và ARN, baz ơ nit ơ và phosphate l ần l ượt đính vào hai nguyên t ử cacbon __(a)__ c ủa g ốc đường b ằng các liên k ết đồ ng hóa tr ị t ươ ng ứng là __(b)__. 4. Cellulose được t ạo thành t ừ các đơn phân là ___(a)___ nối v ới nhau b ằng các liên k ết ___(b)___. 5. Công th ức c ấu t ạo c ủa m ột nucleotide trong ADN và ARN là: Phosphate - Baz ơ - Đường. (a) Đúng. (b) Sai. 6. Nếu m ột m ạch đơn c ủa ADN ch ứa 1500 nucleotide và nucleotide lo ại A chi ếm t ỷ l ệ 20%, thì kết qu ả m ỗi tr ường h ợp sau đây đố i v ới ADN m ạch kép c ủa nó s ẽ nh ư th ế nào? (a) S ố nguyên t ử phosphor? (b) S ố l ượng nucleotide t ừng lo ại; (c) T ổng s ố liên k ết ester trong các nucleotide? (d) T ổng s ố liên k ết phosphodiester? (e) T ổng s ố liên k ết hydro? 7. Hai đặc điểm quan tr ọng nh ất trong c ấu trúc c ủa ADN là __(a)__ và __(b)__. 8. Cấu trúc b ậc I c ủa protein g ọi là ___(a)___ , đặc tr ưng b ởi ___(b)___ có chi ều N →C và lo ại liên k ết hóa h ọc y ếu là ___(c)___. 9. Hemoglobin có m ức độ c ấu trúc cao nh ất là ___(a)___ v ới b ốn chu ỗi polypeptide khác nhau, đó là ___(b)___ và ___(c)___. 10. Lipid là thành ph ần c ấu t ạo quan tr ọng c ủa ___(a)___; chúng có đơn v ị c ấu trúc c ơ s ở là ___(b)___. Tất c ả các phosphoglyceride đề u là nh ững phân t ử ___(c)___, có m ột đuôi ___(d)___ và m ột đầ u __(e)__. 11. Phân tích và so sánh c ấu trúc các nucleotide c ủa ADN và ARN. 12. Trình bày s ự hình thành các chu ỗi polynucleotide c ủa ADN và ARN và ch ỉ ra nh ững điểm gi ống nhau và khác nhau gi ữa chúng. 13. So sánh đơ n phân và c ấu trúc b ậc I c ủa protein và axit nucleic. 14. Tại sao ch ỉ t ừ 20 lo ại axit amin nh ưng trong s ự s ống có th ể có vô s ố lo ại protein khác nhau? (a) Một peptide g ồm 5 axit amin khác nhau có th ể có bao nhiêu cách s ắp x ếp khác nhau? (b) Câu hỏi t ươ ng t ự cho m ột polypeptide có 30 axit amin, v ới 6 lo ại sau: 10 Phe, 6 Ser, 5 Leu, 4 Lys, 3 His và 2 Arg. 15. Tại sao nói mô hình Watson-Crick th ỏa mãn thành ph ần hóa h ọc c ủa ADN h ầu h ết các sinh vật, nh ưng không tho ả mãn b ộ gen của một s ố virus? Cho ví d ụ. 16. Tính ch ất b ổ sung và ng ược chi ều được th ể hiện nh ư th ế nào trong c ấu trúc và c ơ ch ế tái b ản của ADN? 17. Liên k ết hydro là gì và có vai trò nh ư th ế nào trong c ấu trúc và ch ức n ăng của ADN và protein? 18. Tại sao trong ADN ch ỉ t ồn t ại hai ki ểu k ết c ặp baz ơ A-T và G-C mà không là A-C và G-T? Nếu x ảy ra các kiểu k ết c ặp A-C và G-T, trong điều ki ện nào và h ậu qu ả là gì? Cho các s ơ đồ minh h ọa. 19. Th ế nào là bi ến tính và h ồi tính c ủa ADN? Gi ải thích và cho bi ết ý ngh ĩa sinh h ọc c ũng nh ư ứng d ụng c ủa các hi ện t ượng này. 20. Hãy ước tính s ố l ượng t ừng lo ại nucleotide và tổng s ố liên k ết hydro trong ADN c ủa m ột loài vi khu ẩn, bi ết r ằng b ộ gen c ủa vi khu ẩn này ch ứa 4,6 tri ệu c ặp nucleotide và có t ỷ l ệ 24
(A+T)/(G+C) b ằng 1. 21. Hãy xác định t ỷ l ệ % c ủa các nucleotide trong ADN c ủa bò, bi ết r ằng t ỷ s ố (A+T)/(G+C) c ủa ADN này là 1,35. 22. Bộ gen m ột loài động v ật có t ỷ l ệ (A+T)/(G+C) là 1,5 và ch ứa kho ảng 3 t ỷ c ặp nucleotide. Hãy tính s ố l ượng t ừng lo ại nucleotide và s ố l ượng liên k ết hydro có th ể có trong b ộ gen nói trên. 23. Nếu t ỷ l ệ (A+T)/(G+C) ở m ột m ạch đơn c ủa ADN là 0,2 thì t ỷ l ệ này ở m ạch b ổ sung và c ủa c ả phân t ử s ẽ nh ư th ế nào? T ại sao? 24. Cho bi ết t ỷ l ệ (A+G)/(T+C) trên m ột m ạch c ủa m ột phân t ử ADN là 0,3. T ỷ l ệ này ở m ạch b ổ sung là nh ư th ế nào? và trong toàn b ộ phân t ử ADN xo ắn kép là bao nhiêu? 25. Hàm l ượng c ặp baz ơ G-C c ủa ADN thể th ực khu ẩn T3 (m ột lo ại virus ký sinh ở E. coli ) là 53%. Theo lý thuy ết, hàm l ượng hay t ỷ l ệ %(G+C) c ủa mARN th ể th ực khu ẩn T3 là bao nhiêu? 25
Chươ ng 2 TỔ CH ỨC B Ộ GEN CÁC SINH V ẬT Để có th ể đi sâu nghiên c ứu đặ c điểm và c ơ ch ế c ủa quá trình tái b ản các b ộ gen ở các sinh v ật (ch ươ ng 3 ) cũng nh ư các n ội dung liên quan ở các ch ươ ng v ề sau, tr ước tiên chúng ta s ẽ tìm hi ểu một cách đạ i c ươ ng v ề thành ph ần và t ổ ch ức b ộ gen c ủa các nhóm sinh v ật. Chươ ng này sẽ lần l ượt trình bày và phân tích các v ấn đề sau: (i) Đại c ươ ng v ề các nhóm sinh v ật trong sinh gi ới. (ii) Virus là gì? B ộ gen của các virus được t ổ ch ức nh ư th ế nào? (iii) Th ế nào là sinh v ật nhân s ơ (prokaryote)? B ộ gen c ủa các sinh v ật nhân s ơ mà đại di ện là vi khu ẩn E. coli được t ổ ch ức nh ư th ế nào? (iv) Sinh v ật nhân chu ẩn (eukaryote) bao g ồm nh ững nhóm nào? B ộ gen c ủa chúng mà đại di ện là con ng ười có các thành ph ần chính y ếu nào và được t ổ ch ức ra sao? (v) Mối quan h ệ gi ữa kích th ước b ộ gen và trình độ ti ến hoá của các sinh v ật được hi ểu nh ư th ế nào? 1. Đại c ươ ng v ề các nhóm sinh v ật Từ nh ững th ập niên đầu c ủa th ế k ỷ XX các nhà khoa h ọc phân chia s ự s ống thành hai gi ới là động v ật và th ực v ật, các vi khu ẩn được x ếp vào gi ới th ực v ật. Mãi đến 1969, Whitaker chia toàn b ộ sự s ống ra làm 5 gi ới: Monera (hay prokaryote), Protista (t ức Protozoa hay độ ng c ật nguyên sinh), Plantae (th ực v ật), Fungi (n ấm) và Animalia (động v ật). Tuy nhiên, vào cu ối th ập niên 1970, Carl Woese dựa vào k ết qu ả các nghiên c ứu của mình về trình t ự các gen ARN ribosome (rARN) c ủa nhi ều sinh v ật khác nhau đã đi đến k ết lu ận r ất m ới, đó là: M ột l ớp các sinh v ật mà lâu nay được xếp vào nhóm vi khu ẩn (bacteria) l ại có các gen rARN gi ống v ới các eukaryote hơn là các vi khu ẩn nh ư E. coli . Carl Woese đặt tên cho chúng là archaebacteria (vi khu ẩn c ổ), để phân bi ệt v ới các vi khu ẩn th ật hay eubacteria . Ngày càng có nhi ều b ằng ch ứng sinh h ọc phân t ử tích l ũy được thì v ấn đề này càng tr ở nên rõ ràng, ở ch ỗ: Archaebacteria cần ph ải được tách thành m ột nhóm riêng. Vì v ậy Woese đã đổi tên chúng thành archaea . Ngày nay chúng ta đều bi ết r ằng, t ất c ả s ự s ống được g ộp vào 3 siêu gi ới hay v ực (domain), đó là: bacteria, eukaryota và archaea (Hình 2.1 ). Mặc dù về m ặt v ật lý, archaea gi ống nh ư các vi khu ẩn, nh ưng m ột s ố khía c ạnh sinh h ọc phân t ử thì chúng t ỏ ra gi ống v ới các eukaryota hơn. 26
Hình 2.1. Sơ đồ ba siêu gi ới hay là cây phát sinh s ự s ống. Điều đáng nói ở đây là các archaea sinh sống ở nh ững vùng kh ắc nghi ệt nh ất trên trái đất. Một số trong chúng là các thermophile , ngh ĩa là các sinh v ật “ưa nhi ệt” (“heat-lovers”); chúng có th ể sinh s ống được t ại các khu v ực nóng b ức v ới nhi ệt độ trên 100 0C gần các các rãnh n ứt đị a nhi ệt sâu dưới lòng đại d ươ ng hay các su ối n ước nóng ở Công viên Qu ốc gia Yellowstone (Yellowstone National Park, M ỹ). Một s ố khác là các halophile (các sinh v ật “ưa thích halogen”; halogen-lovers); chúng có th ể ch ống ch ịu được nồng độ mu ối r ất cao mà th ường thì các sinh vật khác không th ể s ống được. Và m ột nhóm khác n ữa là các methanogen, ngh ĩa là sinh v ật s ản xu ất methan (“methane- producers”) mà môi tr ường s ống c ủa chúng là d ạ dày c ủa bò; điều đó gi ải thích t ại sao các con bò lại là ngu ồn sinh khí methane tốt đế n v ậy. Do tính ch ất đặ c thù của b ộ môn, trong giáo trình này chúng ta đề c ập ch ủ y ếu v ẫn là hai nhóm đầu, đó là: các sinh v ật nhân s ơ và sinh v ật nhân chu ẩn, th ường g ọi là prokaryote và eukaryote, bởi vì chúng được nghiên c ứu k ỹ nh ất. Dù v ậy ở ch ươ ng cu ối c ũng có nói đến loài archaea mà t ừ đó Kary Mullis đã chi ết xu ất và s ử d ụng enzyme Taq-polymerase DNA để t ạo dòng ADN in vitro , g ọi là ph ươ ng pháp PCR. Và c ũng bi ết r ằng Methanococcus jannaschii (thu ộc nhóm archaea) là m ột trong nh ững sinh v ật đầ u tiên có b ộ gen được xác đị nh trình t ự đầ y đủ . 2. Tổ ch ức b ộ gen c ủa các virus Virus là nhóm “sinh v ật” bé nh ất ch ưa có c ấu t ạo t ế bào, không t ồn t ại đơn độc mà ký sinh b ắt bu ộc ở các t ế bào sinh v ật nhân s ơ (prokaryote) ho ặc sinh v ật nhân chu ẩn (eukaryote); ch ỉ trong điều ki ện đó chúng m ới có kh ả n ăng tái b ản và t ổng h ợp ARN và protein. Các virus ký sinh ho ặc gây nhi ễm vi khu ẩn thì gọi là th ể th ực khu ẩn (bacteriophage) hay phage . Các virus có c ấu trúc t ươ ng đối đơn gi ản, với hai ph ần chính là lõi axit nucleic và v ỏ protein. Một s ố virus ở th ực v ật ho ặc các virus gây ung th ư, AIDS, SARS ở ng ười và động v ật có b ộ gen là ARN. S ố còn l ại bao g ồm nhi ều virus ký sinh ở vi khu ẩn và động v ật có b ộ gen là ADN mạch kép ho ặc mạch đơ n, m ạch th ẳng ho ặc mạch vòng (Bảng 1.3). 27
Hình 2.2. (A) S ơ đồ c ấu t ạo c ủa phage T2 ở E. coli. (B) Ảnh hi ển vi điện t ử c ủa T4, m ột phage có quan h ệ g ần g ũi v ới phage T2. (C) Sơ đồ c ấu trúc c ủa HIV - một retrovirus. Hình 2.3. Bản đồ ADN mạch đơ n dạng vòng c ủa phage φX174 (A), với m ột s ố gen gối nhau (B). 3. Tổ ch ức b ộ gen c ủa các sinh v ật nhân s ơ (prokaryote) Nhóm prokaryote bao g ồm các vi khu ẩn (bacteria) và vi khu ẩn lam (cyanobacteria), là các sinh v ật có c ấu t ạo t ế bào đơ n gi ản nh ất. Vi khu ẩn Escherichia coli (Hình 2.4) là đối t ượng được s ử 28
dụng r ộng rãi trong các nghiên c ứu sinh h ọc phân t ử. B ộ gen chính c ủa nó (Hình 2.5) là m ột phân t ử ADN mạch kép vòng có kích th ước l ớn, t ức nhi ễm s ắc th ể chính (4.639.221 c ặp baz ơ, v ới 4289 gen mã hóa protein và 115 gen mã hóa các ARN khác). Nó th ường t ập trung ở m ột " vùng nhân " (nucleoid), không có màng nhân bao b ọc và ở tr ạng thái siêu xo ắn (supercoiled DNA) d ưới s ự ki ểm soát c ủa các topoisomerase . Ngoài ra, còn có nhi ều ADN mạch kép tr ần dạng vòng khác có kính th ước bé h ơn rất nhi ều, g ọi là các plasmid. Từ đầ u th ập niên 1990 đến nay, ng ười ta còn phát hi ện ra rằng b ộ gen của một s ố vi khu ẩn không ch ỉ gồm một phân t ử ADN mạch kép dạng vòng (nh ư ở Bacillus , E. coli, Pseudomonas v.v.) mà còn có th ể có các tr ường h ợp ngo ại l ệ sau đây: 1 ADN mạch th ẳng ( Borella = 0,91 Mbp); 2 ADN mạch vòng ( V. cholera = 2,9 + 1,1 Mbp); ho ặc 3 ADN vòng ( Paracoccus denitrificans = 2,0 + 1,1 + 0,64 Mbp); ho ặc th ậm chí g ồm m ột ADN mạch th ẳng (2,1 Mbp) và m ột ADN mạch vòng (3,0 Mbp) nh ư ở Agrobacterium tumefaciens v.v. Về ph ần các plasmid c ũng v ậy, ví d ụ ở chi Borella có r ất nhi ều plasmid vòng và th ẳng v ới kích th ước bi ến thiên t ừ 5 đế n 200 Kbp. (Chú thích: 1 Mbp = 10 3 Kbp = 10 6 bp). (a) (b) Hình 2.4. (a) Các t ế bào E. coli . (b) ADN mạch kép vòng ở tr ạng thái siêu xoắn (trái) và giãn xo ắn. Hình 2.5. Tổ ch ức phân t ử c ủa bộ gen vi khu ẩn E. coli. 29
4. T ổ ch ức b ộ gen c ủa các sinh v ật nhân chu ẩn (eukaryote) 4.1. C ấu trúc ch ất nhi ễm s ắc Các eukaryote là nhóm l ớn nh ất và ti ến hóa đa d ạng nh ất v ề trình độ t ổ ch ức c ơ th ể, bao gồm tất c ả các sinh v ật có c ấu t ạo t ế bào (tr ừ vi khu ẩn và vi khu ẩn lam), có th ể là đơ n bào ho ặc đa bào. Trong t ế bào ch ứa hai h ệ th ống di truy ền, b ộ gen nhân và b ộ gen tế bào ch ất. B ộ gen tế bào ch ất bao g ồm các ADN mạch kép vòng, đó là: các ADN ty th ể (mitochondrial DNA = mtDNA) có m ặt trong t ất c ả các t ế bào eukaryote, và ADN lạp th ể (chloroplast DNA = cpDNA) ch ỉ có trong các t ế bào th ực v ật. Hình 2.6. Cấu trúc c ủa nucleosome Trong nhân t ế bào eukaryote ch ứa nhi ều nhi ễm s ắc th ể; m ỗi nhi ễm s ắc th ể là một ph ức h ợp nucleoprotein gọi là ch ất nhi ễm s ắc (chromatin), g ồm m ột phân t ử ADN mạch kép th ẳng kích th ước lớn kết h ợp v ới các phân t ử protein ki ềm tính (giàu lysine và arginine) gọi là các histone. Đơ n v ị tổ ch ức của c ơ s ở c ủa nhi ễm s ắc th ể eukaryote là các nucleosome (Hình 2.6) có đường kính kho ảng 10-11 nm, g ồm m ột kh ối c ầu tám phân t ử histone (H2A+ H2B +H3+H4) 2, gọi là lõi octamer và đoạn ADN có kích th ước 146 bp qu ấn xung quanh nó 1¾ vòng (nói chung là ~160 bp qu ấn hai vòng quanh octamer, tùy t ừng loài). M ột phân t ử H1 bám vào các vùng ADN nối (linker DNA) bên ngoài nucleosome, gi ữ v ững s ự t ươ ng tác c ủa ADN với các histone lõi. Các m ức độ t ổ ch ức hay s ự hoá xo ắn c ủa nhi ễm s ắc th ể eukaryote được mô t ả ở Hình 2.7. 30
Hình 2.7. Tổ ch ức ADN trong nhi ễm s ắc th ể eukaryote. Mức độ cấu trúc đầ u tiên c ủa chromatin được hình dung d ưới d ạng m ột chu ỗi các nucleosome, hay sợi nucleosome (nucleosome fiber) có độ dày 10 nm (1 nanomet = 10 A o). Mức th ứ hai c ủa cu ộn g ập chromatin có liên quan t ới s ự xo ắn l ại c ủa sợi nucleosome tạo thành sợi dày 30 nm g ọi là solenoid . Các histone H1 tham gia vào s ự xo ắn l ại này b ằng cách t ươ ng tác v ới các phân tử H1 khác. Mức th ứ ba c ủa s ự hóa xo ắn có l ẽ là cu ộn vòng c ủa sợi 30 nm tạo thành m ột c ấu trúc tươ ng t ự nh ư bàn ch ải v ới các vòng đeo dính vào m ột cái giá ở trung tâm (dày ~300 nm). Đây chính là vùng giãn xo ắn c ủa nhi ễm s ắc th ể, t ươ ng ứng v ới ch ất đồ ng nhi ễm s ắc (euchromatin). Sau đó các dãy vòng được s ắp x ếp trong các không gian ba chi ều này cu ộn ch ặt t ạo thành các vùng g ọi là ch ất dị nhi ễm s ắc (heterochromatin) trên m ột chromatid với độ dày kho ảng 700 nm. T ại k ỳ gi ữa c ủa nguyên phân, m ỗi nhi ễm s ắc th ể có c ấu trúc điển hình g ồm hai chromatid ch ị em dính chung nhau ở tâm động (centromere) v ới độ dày toàn b ộ ch ừng 1400 nm. Nh ư v ậy, ch ất nhi ễm s ắc trong các t ế bào eukaryote t ồn t ại ở hai d ạng: Ch ất d ị nhi ễm s ắc là các ph ần cu ộn xo ắn ch ặt và không có ho ạt tính phiên mã; và chất đồ ng nhi ễm s ắc là các vùng giãn xo ắn và chí ít c ũng có ti ềm n ăng ho ạt tính. Bảng 2.1. Tỷ l ệ đóng gói các m ức độ hóa xo ắn c ủa c ấu trúc ADN. Dạng ch ất nhi ễm s ắc Tỷ l ệ đóng gói ADN xo ắn kép tr ần 1,0 Sợi nucleosome 10 nm 7 – 10 Sợi chromatin 30 nm do các nucleosome siêu xo ắn 40 – 60 31
Nhi ễm s ắc th ể k ỳ gi ữa co xo ắn c ực đạ i 8.000 4.2. Cấu trúc phân t ử c ủa centromere Kết qu ả nghiên c ứu g ần đây cho th ấy vùng lõi c ủa centromere ở n ấm men ( S. cerevisiae ) có kích th ước kho ảng 220 c ặp nucleotide (t ươ ng đươ ng 15-20 nm). V ề c ấu trúc, centromere có 3 đoạn trình t ự CDE đặ c thù n ằm k ế ti ếp nhau theo chi ều 5' →3' t ừ trái sang ph ải, ký hi ệu là I, II và III; (Hình 2.8) trong đó: – đoạn CDE-I có 8 c ặp baz ơ đặc thù là: RTCACRTG ; – đoạn CDE-II có ~78 đến 86 c ặp baz ơ đặc thù, v ới 91-95% c ặp AT ; – đoạn CDE-III có 26 c ặp baz ơ đặc thù, đó là: TGTTTRTG–TTTCCGAAA – – – –AAAAA (Lưu ý: R ở đây bi ểu th ị cho m ột baz ơ purine, A ho ặc G) Với c ấu trúc lõi ấy mà chúng có th ể t ươ ng tác v ới các ph ức h ợp protein đặ c thù giúp cho s ợi thoi có th ể bám vào tâm động. (a) (b) Hình 2.8. (a) Ảnh ch ụp b ộ NST cho th ấy các vùng tâm động bắt màu đặc thù. (b) Sơ đồ một đoạn sợi nucleosome băng qua vùng lõi tâm động, v ị trí ti ếp xúc v ới s ợi thoi. (c) Trình t ự đặ c thù của lõi centromere (CDE I, II và III) được bào t ồn cao độ trong ti ến hóa. 4.3. C ấu trúc phân t ử c ủa telomere Mỗi nhi ễm s ắc th ể eukaryote có hai đầu mút với c ấu trúc đặc tr ưng g ọi là telomere . Các k ết qu ả nghiên c ứu đầ u tiên c ủa Elizabeth Blackburn và cs (1989) cho hay các telomere không ch ứa gen; thay vì th ế chúng có c ấu trúc đơn gi ản g ồm nh ững trình t ự ng ắn (6-8 bp) l ặp l ại n ối ti ếp c ả ngàn l ần và đặc thù cho t ừng loài (Hình 2.9 ). Ch ẳng h ạn, ở Tetrahymena , m ột nhóm độ ng v ật nguyên sinh có lông t ơ, trình t ự này là 32
(TTGGGG) n; ở Caenorhabditis = (CCCTCCC) n; ở b ọn Oxytrichia thu ộc Euplotes = (CCCCAAA) n v.v. Ở ng ười và các động v ật có vú, trình t ự telomere là 5'-TTAGGG-3' lặp l ại ~1.000 - 2.000 l ần, kho ảng bi ến thiên phát hi ện được trong các t ế bào ở các giai đoạn khác nhau là 150 - 2.000 l ần (Yakoob và cs, 1999). Các nghiên c ứu g ần đây cho th ấy: enzyme telomerase (ch ịu trách nhi ệm t ổng h ợp các telomere) ch ỉ có m ặt trong các tế bào m ầm, các t ế bào g ốc phôi, các t ế bào ung th ư và các eukaryote đơ n bào nh ư Tetrahymena thermophila . Trong khi đó, các t ế bào soma bình th ường c ủa độ ng v ật có vú không th ấy có telomerase. Điều đó cho phép lý gi ải t ại sao các t ế bào m ầm c ũng nh ư các t ế bào ung th ư có kh ả n ăng phân chia g ần nh ư là vô h ạn. Ng ược l ại, các t ế bào soma ch ỉ có th ể ti ến hành kho ảng 30-50 l ần nguyên phân, và sau đó chúng mất h ẳn kh ả n ăng phân chia, bước vào giai đoạn lão hóa và ch ết t ự nhiên. Hình 2.9. Ảnh ch ụp cho th ấy các telomere v ới màu vàng đặc tr ưng (trái). Trình t ự telomere c ủa Tetrahymena (A) và mô hình vòng-T ở đầ u mút nhi ễm s ắc th ể (B). 4.4. Thành ph ần ADN trong b ộ gen ng ười Nói chung, trong m ỗi b ộ gen eukaryote bao g ồm các ki ểu ADN chính sau đây, để cho ti ện ta lấy b ộ gen ng ười làm thí d ụ : - ADN bản sao đơn (single-copy/unique), ngh ĩa là các gen có m ặt ch ỉ m ột l ần trong b ộ gen; lo ại này chi ếm ~75% và bao g ồm h ầu h ết các gen. - ADN lặp l ại (repetitive) bao g ồm m ột s ố gen được l ặp l ại vài l ần cho đế n hàng ngàn l ần trong b ộ gen. Nhóm này được chia làm hai lo ại: + ADN lặp l ại ki ểu phân tán (interspersed): lo ại này chi ếm kho ảng 15% và phân b ố r ải rác kh ắp b ộ gen gi ữa các gen cũng nh ư bên trong các gen; bao g ồm các trình t ự Alu (là các đoạn ADN dài kho ảng 300 bp và được l ặp l ại kho ảng 300.000 l ần trong b ộ gen; chúng có th ể có m ặt ở ch ỗ ti ếp giáp ho ặc bên trong các gen trong các intron ho ặc các vùng không được d ịch mã) và c ả các đoạn lặp n ối ti ếp có s ố l ượng bi ến thên (VNTRs = variable numbers of tandem repeats), v ốn là các đoạn lặp ng ắn ch ỉ vài c ặp baz ơ nh ưng có chi ều dài sai khác, còn g ọi là các ti ểu v ệ tinh (minisatellite or microsatellite). Ví d ụ: các đoạn l ặp phân tán trong các đoạn trình t ự Alu (Alu sequences): 33
5'– GCTGCGG GCTGAGG GCTGAGG –3' + ADN vệ tinh (satellite) hay ADN lặp l ại nối ti ếp (tandem): lo ại này chi ếm kho ảng 10% và được l ặp l ại r ất nhi ều l ần, bao g ồm các trình t ự đơn gi ản th ường khu trú ở các tâm động (centromere) và các đầu mút (telomere) c ủa các nhi ễm s ắc th ể. Ví d ụ: các đoạn l ặp n ối ti ếp thu ộc các microsatellite hay telomere: 5'– TTAGGG TTAGGGTTAGGG TTAGGG –3' Nhìn chung, b ộ gen ng ười có các đặ c điểm sau: • Bộ gen nhân (xem s ơ đồ): - Bộ gen đơ n b ội có kho ảng 3,2 t ỷ cặp baz ơ; hầu nh ư t ất c ả m ức độ ph ức t ạp c ủa nó đề u n ằm trong l ớp ADN bản sao đơn (~75%); - Chứa kho ảng 25.000 gen mã hóa protein , trong đó đa ph ần là các gen phân đoạn với c ấu trúc ph ức t ạp; - Các gen ch ứa t ừ 1 cho đế n trên 75 exon ; - Các gen sai khác nhau v ề chiều dài, bi ến thiên t ừ d ưới 100 cho đế n kho ảng 2.400.000 cặp baz ơ là chi ều dài l ớn nh ất c ủa gen được bi ết cho đế n nay. Đó chính là gen gây r ối lo ạn d ưỡng c ơ DMD thu ộc NST X; - Trình t ự Alu có m ặt kh ắp b ộ gen v.v. • Bộ gen ty th ể (Hình 2.10): Một s ố đặ c điểm chính v ề c ấu trúc và ch ức n ăng c ủa ADN ty th ể ng ười nh ư sau: (Ngu ồn: Harding AE, Trends Neurol Sci 1991;14:132.) 34
Hình 2.10. ADN ty th ể c ủa ng ười. - Mỗi mtADN mạch kép d ạng vòng có m ột sợi n ặng (H) và m ột s ợi nh ẹ (L); nó chứa 16.569 bp, v ới 37 gen mã hóa cho các enzyme và các tARN, rARN, trong đó có 22 gen tARN, 2 gen rARN (16S và 12S), và 13 vùng mã hóa protein c ủa chu ỗi hô h ấp, bao g ồm: + 7 ti ểu đơn v ị của NADH dehydrogenase (ph ức h ợp I); + Cytochrome b của ph ức h ợp III; + 3 ti ểu đơn v ị của cytochrome oxidase (ph ức h ợp IV); + 2 ti ểu đơn v ị của ATP synthase. - Mã di truy ền có sai khác chút ít so v ới mã ph ổ bi ến, ở ch ỗ: + UGA (codon kết thúc c ủa mã chu ẩn) được đọ c là Trp; + AGA và AGG (codon mã chu ẩn cho Arg) được đọ c là codon k ết thúc. - Ch ứa r ất ít trình t ự không được d ịch mã. - Tỷ l ệ độ t bi ến cao (gấp 5 đến 10 lần so v ới ADN nhân). - Các so sánh v ề trình t ự c ủa các mtADN cung c ấp b ằng ch ứng v ề ngu ồn g ốc ti ến hóa c ủa b ộ linh tr ưởng (Primates) và các loài khác. 5. Kích th ước b ộ gen và tính ph ức t ạp về m ặt ti ến hoá Dựa trên các k ết qu ả phân tích b ộ gen của các virus và vi khu ẩn c ũng nh ư c ủa b ộ gen đơ n b ội ở eukaryote, cho phép khái quát nh ư sau: Kích th ước c ủa b ộ gen tăng lên t ươ ng đối cùng v ới m ức độ ph ức t ạp v ề mặt ti ến hóa . Th ật v ậy, t ừ bảng 2.2 cho th ấy kích th ước b ộ gen của các virus nói chung là r ất nh ỏ so v ới nhóm prokaryote, và kích th ước b ộ gen của các prokaryote l ại t ỏ ra quá đơn gi ản so v ới ngay c ả m ột eukaryote đơn bào nh ư n ấm men. Trong khi ADN của m ột vi khu ẩn điển hình nh ư E. coli ch ỉ có ~4,6 tri ệu c ặp baz ơ và ch ứa ~4.290 gen mã hóa protein, thì phage MS2 là một trong các virus bé nh ất, b ộ gen ARN của nó c ũngch ỉ có 3.569 baz ơ với t ất c ả 4 gen; ho ặc có kích th ước l ớn nh ư virus Epstein-Barr (ADN mạch kép vòng) c ũng ch ỉ có 172.282 bp với t ất cả 80 gen. 35
Nếu xét trên c ả hai nhóm prokaryote và eukaryote, ta th ấy r ằng kích th ước các b ộ gen bi ến thiên r ất lớn: b ộ gen một vi khu ẩn sống t ự do được bi ết là bé nh ất ch ứa kho ảng 600.000 c ặp baz ơ, trong khi các b ộ gen của ng ười và chu ột ch ỉ kho ảng 3 t ỷ bp. N ếu xét riêng ở nhóm eukaryote, ta đã bi ết m ỗi loài có m ột s ố l ượng nhi ễm s ắc th ể đặ c tr ưng và nó không ph ản ánh trình độ ti ến hóa c ủa các loài. Tuy nhiên, v ề m ặt nào đó rõ ràng là có s ự t ươ ng quan thu ận gi ữa hàm l ượng ADN của các bộ gen đơ n b ội và n ấc thang ti ến hóa c ủa các độ ng-th ực v ật. Dù v ậy v ẫn có m ột s ố ngo ại l ệ so v ới quy t ắc này! Hàm l ượng ADN và ngh ịch lý giá tr ị C Mặc dù Psilotum nudum , đôi khi g ọi là "d ươ ng x ỉ lông", là m ột lo ại th ực v ật đơn gi ản h ơn nhi ều so v ới loài Arabidopsis thaliana vốn là m ột th ực v ật có hoa thu ộc h ọ c ải, nh ưng nó l ại có kích th ước b ộ gen lớn h ơn t ới 3.000 l ần. Đó là do trên 80% b ộ gen của nó là ADN lặp l ại không ch ứa thông tin di truy ền nào c ả! Hay m ột s ố th ực v ật (ngô, loa kèn) hay m ột s ố độ ng v ật (nh ư l ưỡng thê, cá) lại có kích th ước b ộ gen lớn g ấp nhi ều l ần so v ới l ớp thú (bảng 2.2). M ột s ố l ưỡng thê ch ứa ADN nhi ều hơn bộ gen chúng ta đến 30 l ần, nh ưng ch ắc ch ắn không ph ải là chúng ph ức t ạp g ấp chúng ta 30 l ần! Bảng 2.2. Kích th ước b ộ gen của m ột s ố sinh v ật th ường gặp Bộ gen sinh v ật Số bp Số gen Số l ượng NST Virus Th ể th ực khu ẩn MS2 3.569 4 1 (ARN m.đơ n) Virus đốm thuôc lá (TMV) 6.400 4 1 (ARN m.đơ n) Virus cúm (Influenza) 13.500 12 8 (ARN m.đơ n) Th ể th ực khu ẩn ØX174 5.386 10 1 (ADN m.đơ n) Th ể th ực khu ẩn lambda 48.502 60 1 (ADN m.kép) Th ể th ực khu ẩn T4 200.000 165 1 (ADN m.kép) Poxvirus 187.000 300 1 (ADN m.kép) Prokaryote (và các ADN của ty th ể, l ạp th ể) Ty th ể ng ười 16.569 37 1 Ty th ể ( Arabidopsis ) 366.923 57 1 Lạp th ể ( Arabidopsis ) 154.478 128 1 Mycoplasma genitalium 580.000 480 1 Methanococcus 1,7 Mbp 1.500 1 Escherichia coli 4,6 Mbp 4.300 1 Agrobacterium tumefaciens 4,7 Mbp 5.400 1 Myxococcus 9,5 Mbp 9.100 1 Eukaryote (b ộ gen đơ n b ội) Saccharomyces cerevisiae 12,5 Mbp 5.700 16 Drosophila melanogaster 140 Mbp 13.000 4 36
Caenorhabditis elegans 100 Mbp 19.000 6 Ng ười ( Homo sapiens ) 3.300 Mbp 22.000 23 Arabidopsis thaliana 115 Mbp 25.000 5 Chu ột ( Mus musculus ) 220 Mbp 25.000 19 Lúa ( Oryza sativa ) 430 Mbp 45.000 12 Ng ười ta g ọi t ổng hàm l ượng ADN trong b ộ gen đơ n b ội là giá tr ị C (C-value). V ới phân tích ở trên cho th ấy không h ề t ồn t ại m ột m ối quan h ệ ổn đị nh nh ất quán gi ữa giá tr ị C và tính ph ức t ạp của m ột sinh v ật (nh ư l ưỡng thê v ới thú); cái đó g ọi là ngh ịch lý giá tr ị C (C-value paradox). Kích th ước ADN của một s ố bào quan Từ bảng 2.3 cho th ấy ADN của m ột s ố bào quan có v ẻ đơn gi ản và không có d ấu hi ệu ti ến hóa rõ r ệt. Nói chung, kích th ước m ỗi phân t ử ADN ty th ể c ủa ng ười và các động v ật có vú th ường n ằm trong kho ảng 15.000-17.000 cặp baz ơ; trong khi đó, kích th ước m ột ADN lạp th ể ở ph ần l ớn t ế bào các th ực v ật th ường bi ến thiên trong kho ảng 130.000 - 150.000 bp. Còn các plasmid c ủa m ột số t ế bào th ực v ật th ường có kích th ước r ất bé kho ảng 1-2 ngàn c ặp baz ơ. Bảng 2.3. Kích th ước ADN bào quan ở m ột s ố sinh v ật nhân chu ẩn ADN ty th ể Cặp baz ơ Plasmid Cặp baz ơ Ng ười ( Homo sapiens ) 16.569 O. sativa (indica) 1.485 D. melanogaster 19.517 O. sativa (jap.) 2.135 S. cerevisiae 85.779 Ngô ( Zea mays ) 1.913 ADN lạp th ể Brassica 11.640 Lúa O. sativa (indica) 134.494 N. crassa (3 lo ại) 3.581 O. sativa (japonica) 134.525 – 3.675 Ngô ( Zea mays ) 140.384 – 7.050 Triticum aestivum 134.545 Chúng ta c ũng c ần bi ết qua các sinh v ật mô hình (Hình 2.11), t ức các sinh v ật đã được di truy ền h ọc và sinh h ọc phân t ử nghiên c ứu r ất k ỹ và đã gi ải trình t ự đầ y đủ b ộ gen c ủa chúng. Tên tu ổi chúng, ch ẳng h ạn ru ồi gi ấm Drosophila hay E. coli n ổi ti ếng đế n độ b ạn ch ỉ c ần gõ tên và các bộ máy tìm ki ếm nh ư Google s ẽ cho b ạn hàng tri ệu hình ảnh và các thông tin chi ti ết đế n không ng ờ. Ở đây, chúng tôi l ược nêu s ố l ượng cặp baz ơ trong b ộ gen ( đơn b ội) và s ố l ượng các gen khác nhau có m ặt trong m ỗi b ộ gen c ủa các sinh v ật mô hình được ước tính g ần đây (Bảng 2.4). Qua đó bạn s ẽ th ấy được tuy có s ự t ươ ng đồng gi ữa chúng v ề s ố gen ho ặc th ậm chí kích th ước b ộ gen nh ưng hoàn toàn không có chút t ươ ng đồng nào v ề trình độ ti ến hóa c ủa chúng! 37
Bảng 2.4. Kích th ước b ộ gen ( đơn b ội) và s ố gen khác nhau trong b ộ gen c ủa các sinh v ật mô hình (Ngu ồn: Eberhard Passarge, 2007) Loài sinh v ật Tên th ường g ọi Số Mb Số gen Homo sapiens Con ng ười 3.000 ~22.000 Chimpanzee Hắc tinh tinh 3.000 1,2% sai khác Canis domesticus Chó nhà 24.100 19.300 Zebrafish Cá ng ựa v ằn 1.600 ~22.000 Mus musculus Chu ột 2.500 ~25.000 Anopheles gambiae Mu ỗi anôphen 278 ~14.000 D. melanogaster Ru ồi gi ấm 180 13.600 C. elegans Giun tròn 97 19.000 S. cerevisiae Nấm men bia 12,1 6.300 E. coli Vi khu ẩn E. coli 4.700 4.300 Arabidopsis thaliana Th ực v ật có hoa 125 ~25.000 Hình 2.11. Các sinh v ật mô hình tiêu bi ểu. TÓM T ẮT (1) Tất c ả s ự s ống được g ộp vào 3 siêu giới (domain): bacteria, eukaryota và archaea. Tuy nhiên, trong sinh h ọc phân t ử, các nghiên c ứu k ỹ nh ất là các prokaryote và eukaryote, các virus virus ký sinh trên chúng. 38
(2) Bộ gen c ủa virus r ất đa d ạng và đơ n gi ản, ch ỉ là 1 phân t ử axit nucleic - ADN ho ặc ARN, mạch kép ho ặc m ạch đơn, d ạng th ẳng ho ặc vòng; kích th ước ng ắn và ch ứa ít gen. (3) B ộ gen c ủa t ế bào prokaryote g ồm có NST chính và các plasmid. Thông th ường ch ỉ có 1 NST ch ứa 1 phân t ử ADN m ạch kép vòng, vài tri ệu c ặp baz ơ và ch ứa vài ngàn gen; m ột s ố plasmid có mang gen kháng thu ốc được s ử d ụng r ộng rãi trong k ỹ thu ật ADN tái t ổ h ợp. (4) Các t ế bào eukaryote có hai b ộ gen: B ộ gen nhân và b ộ gen t ế bào ch ất. M ỗi NST trong nhân ch ứa 1 ADN m ạch kép th ẳng, kích th ước l ớn liên k ết v ới các histone d ưới dạng các nucleosome. N ếu nh ư b ộ gen nhân ch ứa h ầu h ết các gen và các thành ph ần quan tr ọng c ủa t ế bào thì bộ gen t ế bào ch ất là các ADN m ạch kép vòng, ng ắn có trong ty th ể (mtADN) và trong l ạp th ể ở tế bào th ực v ật (cpADN); chúng ch ỉ ch ứa vài ch ục gen liên quan ch ủ y ếu đế n h ệ th ống t ổng h ợp ATP và protein c ủa bào quan. (5) Trình độ ti ến hóa c ủa các sinh v ật không hoàn toàn t ỷ l ệ v ới kích th ước b ộ gen c ũng nh ư số l ượng các gen mà ch ủ y ếu ph ụ thu ộc vào m ức độ t ổ ch ức tinh vi và ph ức t ạp c ủa chúng. CÂU H ỎI VÀ BÀI T ẬP 26. Bộ gen của virus HIV là hai phân t ử ARN m ạch đơn, m ỗi phân t ử có g ắn m ột phân t ử enzyme phiên mã ng ược. (a) Đúng. (b)Sai. 27. Bộ gen chính c ủa t ất c ả các vi khu ẩn là m ột phân t ử ADN tr ần, m ạch kép d ạng vòng. (a) Đúng. (b) Sai. 28. Gi ữa kích th ước bộ gen, s ố l ượng gen và trình độ ti ến hóa c ủa các sinh v ật có s ự t ươ ng quan thu ận. (a) Đúng. (b) Sai. 29. Bộ gen c ủa E. coli là 1 phân t ử ADN m ạch kép vòng có kích th ước ch ừng __(a)__ c ặp baz ơ, ch ứa kho ảng __ (b)__ gen c ấu trúc nhau. 30. Đơ n v ị t ổ ch ức c ơ s ở c ủa các nhi ễm s ắc th ể sinh v ật nhân chu ẩn là __(a)__, có đường kính kho ảng __(b)__ Angstrong, gồm m ột lõi octamer ch ứa __ (c)__ phân t ử histone được qu ấn bên ngoài b ới m ột đoạn __(d)__ dài ch ừng 140-160 bp. 31. Các m ức độ hóa xo ắn c ủa ADN trong t ổ ch ức phân t ử của nhi ễm s ắc sinh v ật nhân chu ẩn có đường kính 2, 11 và 30 nm được g ọi t ươ ng ứng là: __(a)__, __(b)__, và __(c)__. 32. Sự hóa xo ắn c ủa ADN tong nhi ễm s ắc th ể có hai ý ngh ĩa chính là __(a)__ và __(b)__. . 33. Các histone H1 bám gi ữ các v ị trí __(a)__ và __(b)__ trên m ỗi nucleosome; chúng đóng vai trò quan tr ọng trong __(c)__. 34. Hai đầu mút c ủa m ỗi nhi ễm s ắc th ể sinh v ật nhân chu ẩn có c ấu trúc đặ c tr ưng g ọi là các __(a)__. Đó là các đoạn trình t ự __(b)__, ví d ụ ở ng ười là __(c)__; v ới các vai trò chính y ếu là __(d)___. 35. Hãy làm sáng t ỏ nh ận đị nh sau: Nhóm virus có trình độ t ổ ch ức "c ơ th ể" s ơ khai nh ất v ới các bộ gen rất đơ n gi ản và đa d ạng. 39
36. Hi ện nay sinh gi ới được phân thành nh ững siêu gi ới (domain) nào và d ựa trên c ơ s ở nào? Hãy dựa vào s ơ đồ "cây s ự s ống" để ch ọn vài ví d ụ thích h ợp cho m ỗi siêu gi ới và ch ỉ ra m ối quan h ệ ti ến hóa t ổng quát gi ữa chúng. 37. Trình bày các hi ểu bi ết v ề các thành ph ần chính trong t ổ ch ức c ủa b ộ gen vi khu ẩn E. coli . 38. Phân tích và trình bày tổ ch ức phân t ử c ủa nhi ễm s ắc th ể sinh v ật nhân chu ẩn, các m ức độ đóng xo ắn và ý ngh ĩa c ủa hi ện t ượng đó. 39. Trình bày hi ểu bi ết hi ện nay v ề các thành ph ần chính trong t ổ ch ức phân t ử c ủa b ộ gen ng ười. 40. Phân tích c ấu trúc c ủa telomere và centromere ở các nhi ễm s ắc th ể eukaryote và cho bi ết vai trò của các c ấu trúc này. 40
Chươ ng 3 CẤU TRÚC VÀ CH ỨC N ĂNG C ỦA GEN Gen (gene) là khái ni ệm trung tâm c ủa di truy ền h ọc và sinh h ọc phân t ử. N ội hàm c ủa khía ni ệm gen không ng ừng được phát tri ển và hoàn thi ện cùng v ới s ự phát tri ển c ủa di truy ền h ọc và sinh học phân t ử đặ c bi ệt trong hơn n ửa th ế k ỷ qua. Tuy nhiên, căn c ứ vào nh ững khám phá g ần đây, để đư a ra được m ột đị nh ngh ĩa chính xác v ề gen càng tr ở nên khó kh ăn h ơn bao gi ờ h ết. Gen là thành ph ần thi ết y ếu c ủa b ộ gen, ch ứa đự ng thông tin d ưới d ạng mật mã di truy ền (genetic code). Sự truy ền đạt thông tin t ừ gen đế n protein được th ực hi ện b ởi hai quá trình c ơ b ản là phiên mã (transcription) và dịch mã (translation) nh ư ở Hình 3.1. Trong ch ươ ng này, chúng ta l ần l ượt tìm hi ểu các n ội dung chính sau: (i) Gen là gì và có quá trình l ịch s ử phát tri ển nh ư th ế nào? (ii) Trong b ộ gen của các sinh v ật có nh ững lo ại gen nào và chúng khác v ới các thành ph ần còn l ại c ủa b ộ gen ra sao? Cấu trúc và t ổ ch ức c ủa gen ở các sinh v ật nhân s ơ và nhân chu ẩn có gì gi ống và khác nhau? (iii) B ản ch ất c ủa mã di truy ền là gì và đã được khám phá b ằng cách nào? Mã di truy ền có nh ững đặ c tính nào và ứng d ụng ra sao? Hình 3.1. Sự truy ền thông tin t ừ trong gen đế n protein và ảnh h ưởng lên ki ểu hình của c ơ th ể sinh vật. 1. Sự phát tri ển c ủa khái ni ệm gen 1.1. Các quan ni ệm c ủa Mendel v ề gen Mendel là ng ười đầ u tiên nêu lên định ngh ĩa v ề gen năm 1865 (thu ật ng ữ gene được Johannsen đư a ra n ăm 1909). Theo đó, gen là đơ n v ị di truy ền t ồn t ại ở d ạng h ạt riêng bi ệt, xác định m ột tính tr ạng c ụ th ể trong c ặp tính tr ạng tươ ng ph ản. Đây m ới ch ỉ là s ự suy lu ận thu ần túy, là sự tiên đoán tài tình c ủa Mendel về s ự t ồn t ại t ất y ếu c ủa gen. Quan ni ệm chính xác h ơn v ề c ơ s ở vật ch ất và ch ức n ăng c ủa gen nảy sinh t ừ nhi ều ngu ồn nghiên c ứu độ c l ập trong su ốt 50 n ăm đầ u của th ế k ỷ XX. 41
1.2. Các quan ni ệm c ủa tr ường phái Morgan v ề gen Tr ường phái Morgan (1926) cho r ằng gen là đơ n v ị di truy ền n ằm trên NST không th ể chia nh ỏ h ơn, và nó đóng ba vai trò: (i) Đơ n v ị ch ức n ăng : mỗi gen t ồn t ại nh ư m ột th ể th ống nh ất toàn vẹn, xác đị nh s ự phát tri ển c ủa m ột tính tr ạng c ụ th ể; (ii) Đơ n v ị tái t ổ h ợp: trao đổi chéo ch ỉ x ảy ra gi ữa các gen mà không x ảy ra bên trong ph ạm vi m ột gen; và vì gen không b ị chia nh ỏ b ởi trao đổi chéo nên nó được xem là đơ n v ị c ấu trúc c ơ s ở; và (iii) Đơ n v ị độ t bi ến: gen b ị bi ến đổ i nh ư m ột đơ n v ị hoàn ch ỉnh và cho ra m ột ki ểu hình đột bi ến (–) so v ới ki ểu d ại (+). Tuy nhiên, bản ch ất hóa h ọc c ủa gen là gì và nó xác định tính tr ạng nh ư th ế nào v ẫn còn là điều bí ẩn! Ph ải ch ăng trao đổ i chéo không x ảy ra trong gen? Phải ch ăng m ỗi gen ch ỉ cho m ột ki ểu đột bi ến? 1.3. Gi ả thuy ết “một gen - một enzyme ” của Beadle và Tatum Một h ướng nghiên c ứu khác là tập trung vào ph ươ ng di ện ch ức n ăng sinh hóa c ủa gen. N ăm 1902, Archibald Garrod g ợi ý r ằng r ối l ạn chuy ển hóa alkapton ni ệu (alcaptonuria) b ắt ngu ồn t ừ một sai h ỏng c ủa m ột enzyme đặ c thù và được di truy ền theo ki ểu l ặn nhi ễm s ắc th ể th ường, mà ông g ọi là sai sót chuy ển hóa b ẩm sinh. Đế n n ăm 1941, Beadle và Tatum m ới làm sáng t ỏ ý t ưởng trên b ằng các thí nghi ệm gây độ t bi ến b ằng tia X ở Neurosporora . Để gi ải thích các t ổn th ươ ng sinh hóa đặc thù do đột bi ến, h ọ lập lu ận r ằng: (i) Trong t ế bào, các quá trình chuy ển hóa x ảy ra d ưới dạng các chu ỗi ph ản ứng sinh hóa; (ii) M ỗi ph ản ứng do m ột enzyme xúc tác; (iii) Mỗi enzyme do một gen xác định (nếu nh ư m ột gen b ị độ t bi ến thì enzyme của nó sai h ỏng và kéo theo c ả chu ỗi ph ản ứng không th ể th ực hi ện được, k ết qu ả là t ạo ra ki ểu hình đột bi ến). Từ đó G. Beadle và E. Tatum đề xu ất “gi ả thuy ết m ột gen - một enzyme ” nổi ti ếng; m ở đường cho s ự ra đờ i c ủa di truy ền học-sinh hóa. Sau đó, quan ni ệm này được m ở r ộng thành “một gen - một protein ” và chính xác hóa bằng mệnh đề “một gen - một polypeptide ” nh ờ các nghiên c ứu về hemoglobin c ủa L. Pauling (1949) và V. Ingram (1957). Kể từ khi Avery và đồng s ự (1944) ch ứng minh “ADN là v ật ch ất mang thông tin di truy ền”, và đặc bi ệt là sau khi Watson và Crick khám phá ra c ấu trúc ADN năm 1953, quan ni ệm v ề gen không ng ừng được phát tri ển và chính xác hóa. Tr ước tiên, ta hãy tìm hi ểu công trình nghiên cứu của Benzer v ề c ấu trúc tinh vi c ủa gen. 1.4. Quan ni ệm c ủa Benzer v ề các đơn v ị di truy ền học Các công trình nghiên c ứu c ủa Seymour Benzer (t ừ 1957 đế n 1961) đã ch ứng minh r ằng, gen không ph ải là đơ n v ị tái t ổ h ợp hay đột bi ến. Qua phân tích t ỷ m ỉ hàng tr ăm th ể độ t bi ến ở vùng rII của phage T4 (ký sinh ở E. coli ), Benzer đã thi ết l ập được bản đồ chi ti ết vùng này và kh ẳng đị nh ph ần l ớn các trao đổ i chéo xảy ra trong ph ạm vi m ột gen. Đồng th ời ông ch ỉ rõ vùng rII ch ứa hai đơ n v ị ch ức n ăng riêng bi ệt (rIIA và rIIB), g ọi là các cistron . M ỗi cistron g ồm nhi ều đơn v ị tái t ổ hợp và đơ n v ị độ t bi ến, gọi là các recon và muton . T ừ đây Benzer đã định ngh ĩa l ại các thu ật ng ữ di truy ền h ọc do ông đề ngh ị nh ư sau: (i) Đơ n v ị ch ức n ăng (hay cistron) là m ột đoạn xác đị nh c ủa ADN (~1.200 c ặp baz ơ) mang thông tin c ấu trúc c ủa m ột polypeptide c ụ th ể mà gi ới h ạn c ủa nó được xác đị nh b ằng tr ắc nghi ệm cis-trans. (ii) Đơ n v ị tái t ổ h ợp (recon): đơ n v ị c ấu trúc bé nh ất c ủa cistron (~2-3 c ặp nucleotide) và tái t ổ h ợp ch ỉ có th ể xảy ra gi ữa các recon. (iii) Đơ n v ị độ t bi ến (muton): đơ n v ị bé nh ất c ủa cistron (~4-5 c ặp nucleotide) có kh ả n ăng bi ến đổ i do độ t bi ến. 42
Lưu ý r ằng hi ện nay thu ật ng ữ cistron được s ử d ụng r ộng rãi và nó đồng ngh ĩa v ới gen cấu trúc ; còn muton và recon vì tương đươ ng v ới m ột c ặp nucleotide - không ph ải là đơ n v ị di truy ền học, cho nên t ự chúng mất ý ngh ĩa và không còn giá tr ị s ử d ụng n ữa, ngo ại tr ừ giá tr ị l ịch s ử. Thu ật ng ữ cistron của Benzer có ngh ĩa là đơ n v ị ch ức n ăng di truy ền không chia nh ỏ mà có th ể được xác định b ằng ph ươ ng pháp phân tích b ổ sung (complementation analysis); trong đó gen mà c ụ th ể là s ản ph ẩm c ủa nó được tr ắc nghi ệm v ề kh ả n ăng bù đắp cho m ột độ t bi ến t ại m ột gen tươ ng ứng trong cùng t ế bào. S ự b ổ sung liên ti ếp các s ản ph ẩm dẫn t ới ph ục h ồi ki ểu hình d ại. Cơ s ở c ủa phân tích b ổ sung là tr ắc nghi ệm cis-trans (cis-trans test ), mà t ừ đây n ảy sinh thu ật ng ữ cistron ở ch ỗ các c ặp độ t bi ến có ngu ồn gốc độc l ập được xét qua các cấu hình cis (đều) và trans (l ệch). Tr ắc nghi ệm cis được dùng làm đối ch ứng (Hình 3.2a), vì n ếu nh ư c ả hai độ t bi ến đề u có m ặt trong m ột b ộ gen thì b ộ gen kia ph ải là ki ểu d ại ở c ả hai locus và sinh ra các s ản ph ẩm bình th ường, vì v ậy cho ki ểu hình d ại (Hình 3.2b). Tr ắc nghi ệm trans là phép th ử b ổ sung và xác định gới h ạn c ủa đơn v ị ch ức n ăng. N ếu nh ư các đột bi ến n ằm trong các gen khác nhau, ngh ĩa là thu ộc cấu hình trans , thì mỗi m ột b ộ gen có th ể b ổ sung s ản ph ẩm mà gen kia không t ạo ra được. Khi có đủ t ất c ả các s ản ph ẩm gen c ần thi ết thì t ế bào bi ểu hi ện ki ểu d ại (Hình 3.2c), ngh ĩa là có s ự bổ sung dươ ng tính. Nếu nh ư c ả hai độ t bi ến thu ộc cùng m ột gen và có m ặt ở c ấu hình trans , thì m ỗi m ột b ộ gen có th ể mang m ột b ản sao độ t bi ến c ủa gen đó và không có s ản ph ẩm ho ạt độ ng ch ức n ăng được tạo ra trong t ế bào, ngh ĩa là không có s ự b ổ sung nên s ẽ cho ki ểu d ại (Hình 3.2d). Hình 3.2. Sơ đồ tr ắc nghi ệm cis-trans . (a) con đường chuy ển hóa bình th ường; (b) tr ắc nghi ệm cis; (c) và (d) tr ắc nghi ệm trans. [S là cơ ch ất; I là sản ph ẩm trung gian; P là sản ph ẩm cu ối cùng mà ở đây là s ắc t ố đặ c tr ưng cho ki ểu hình d ại; các m ũi tên ch ỉ các enzyme sinh ra t ừ các cistron 1 và cistron 2]. Sự phân tích b ổ sung ở vi khu ẩn và n ấm men bia về sau cũng ch ỉ ra r ằng gen là m ột cistron. Ph ươ ng pháp này t ỏ ra h ữu ích cho vi ệc xác định ch ức n ăng c ủa gen, s ố l ượng c ũng nh ư tr ật t ự ho ạt động c ủa các gen trong m ột con đường chuy ển hóa cụ th ể của t ế bào. 2. C ấu trúc và ch ức n ăng c ủa gen 2.1. Gen và b ộ gen Tr ước tiên, ta hãy định ngh ĩa tổng quát v ề gen nh ư sau: Gen là m ột đọ an xác đị nh c ủa b ộ gen 43
mã hóa thông tin cho một polypeptide ho ặc m ột phân t ử ARN ch ức n ăng (tARN, rARN ) . Mặc dù vậy, đị nh ngh ĩa này vẫn không th ể bao g ồm đầ y đủ ch ức n ăng và c ấu trúc c ủa gen trong toàn b ộ sinh gi ới, b ởi vì các chi ến l ược cho s ự bi ểu hi ện của gen và t ổ ch ức b ộ gen ở prokaryote và eukaryote là r ất khác nhau. Bây gi ờ ta hãy nêu s ơ l ược v ề các y ếu t ố hay thành ph ần di truy ền c ủa b ộ gen. Trong m ột b ộ gen, các thành ph ần được bi ểu hi ện ra s ản ph ẩm, ngh ĩa là được phiên mã thì g ọi là các gen c ấu trúc; còn các thành ph ần không được bi ểu hi ện thì không g ọi là gen. – Xét theo ngh ĩa r ộng, các gen c ấu trúc bao g ồm: (i) Các gen mã hóa các mARN mà t ừ đó xác định c ấu trúc c ủa protein thì g ọi là gen mã hóa protein (protein-coding gene) - đây là nhóm gen quan tr ọng nh ất c ủa các t ế bào và là ch ủ đề chính xuyên su ốt n ội dung cu ốn sách này; (ii) Các gen mã hóa các tARN; (iii) Các gen mã hóa các rARN; và (iv) Các gen mã hóa nhi ều lo ại ARN khác ở các t ế bào eukaryote (xem Bảng 3.1). – Các thành ph ần không ph ải gen r ất đa d ạng, chúng đóng vai trò nh ư là nh ững tín hi ệu điều hòa ho ạt độ ng c ủa các gen (ví d ụ các vùng kh ởi độ ng = promoter) hay ki ểm soát s ự tái b ản c ủa bộ gen (các kh ởi điểm tái b ản), các vùng đệm phân cách gi ữa các gen Đối v ới các prokaryote, đó còn là các vùng v ận hành (operator). Đối v ới các eukaryote, có vô s ố y ếu t ố nh ư v ậy: các đoạn t ăng c ường (enhancer), các trình t ự gây b ất ho ạt gen (silencer), các trình t ự ADN l ặp l ại c ủa telomere v.v. Nhìn chung, vi ệc đị nh ngh ĩa và phân lo ại gen có tính ch ất t ươ ng đối và th ường xuyên được sửa đổ i, ch ẳng h ạn các khám phá v ề các gen phân đoạn (split gene) và các ph ươ ng th ức c ắt n ối ch ọn l ọc đố i v ới các b ản sao s ơ c ấp c ủa chúng ở các eukaryote mà chúng ta s ẽ nghiên c ứu sau này. Tuy nhiên, nếu nhìn toàn c ục thì m ột khái ni ệm th ống nh ất n ổi b ật về đặ c t ưng c ủa s ự s ống, đó là: tất c ả các sinh v ật t ừ virus, vi khu ẩn cho đế n con ng ười đề u có chung hệ th ống m ật mã di truy ền ch ứa đự ng trong các gen c ủa b ộ gen và được s ử d ụng để tổng h ợp các protein c ủa t ế bào c ũng nh ư tái bản c ủa các b ộ gen qua đó truy ền l ại cho th ế h ệ sau. 2.2. Các thành ph ần c ấu trúc c ủa gen Tổ ch ức c ủa m ột gen có th ể bao g ồm các vùng riêng bi ệt v ới ch ức n ăng đặ c thù sau đây (xem Bảng 3.1). Hình 3.3. Cấu trúc t ổng quát của m ột gen. Tại locus bất k ỳ, m ột vùng ADN được phiên mã có th ể g ọi là m ột đơ n v ị phiên mã (transcription unit = TU). Nh ư đã đề c ập, ở prokaryote, m ột đơn v ị phiên mã có th ể g ồm nhi ều gen; trong khi đó ở eukaryote, các đơn v ị phiên mã h ầu nh ư bao gi ờ c ũng t ươ ng đươ ng v ới m ột gen. Đối với các gen mã hóa protein, rõ ràng là có m ột s ự phân cách gi ữa vùng được d ịch mã thành chu ỗi 44
polypeptide và vùng không được d ịch mã. Ở vi khu ẩn, vùng được d ịch mã là khung đọc m ở (ORF), trong đó các gen ng ăn cách nhau bằng các đoạn đệ m (spacer) g ọi là các vùng không mã hóa bên trong (internal noncoding region). Các gen n ằm ở hai đầ u c ủa m ột operon c ũng được kèm b ởi m ột vùng không mã hóa có tên là vùng 5' không được dịch mã (5' untranslated region = 5'-UTR) hay đoạn d ẫn đầ u (leader sequence) và vùng 3' không được d ịch mã (3'-UTR) hay đoạn theo sau (trailer sequence). V ề b ản ch ất, chúng là các đoạn điều hòa; ch ẳng h ạn, vùng 5'-UTR có ch ứa trình t ự Shine-Dalgarno giàu baz ơ purine ki ểm soát s ự bám vào c ủa ribosome trong b ước m ở đầ u d ịch mã, còn vùng 3'-UTR th ường đóng vai trò quan trọng trong ổn đị nh mARN. Ở eukaryote, vùng mã hóa của các gen cũng được kèm b ởi các vùng UTR điều hòa, và c ả hai vùng 5'-UTR và 3'-UTR cũng nh ư khung đọc m ở có th ể b ị gián đoạn b ởi các đoạn không mã hóa (các intron) mà sau đó chúng s ẽ được c ắt b ỏ tr ước khi mARN tr ưởng thành đi ra tế bào ch ất. Nh ư th ế, b ất k ỳ đoạn nào mà r ốt cu ộc b ị lo ại b ỏ kh ỏi bản sao pre-ARN thì được g ọi là các đoạn đệ m được phiên mã (transcribed spacer). Bảng 3.1. Các thu ật ng ữ được dùng để ch ỉ các thành ph ần ch ức n ăng khác nhau c ủa các gen (theo Twyman 1998, có s ửa đổ i) Thu ật ng ữ Định ngh ĩa Alen (allele) Một bi ến th ể v ề trình t ự c ủa m ột gen. Một đơn v ị ch ức n ăng di truy ền, m ột vùng c ủa ADN Cistron mã hóa m ột s ản ph ẩm đặ c thù. Vùng mã hóa, Một vùng c ủa ADN được d ịch mã thành protein. Ở vi khung đọc m ở khu ẩn, đó là m ột gen. Ở eukaryote, vùng mã hóa có (ORF) th ể b ị gián đọ an b ởi các intron. Gen phân đoạn Gen mã hóa protein g ồm các đoạn không mã hóa (split gene) (intron) n ằm xen gi ữa các đoạn mã hóa (exon). Ở vi khu ẩn, m ột cistron mã hóa m ột polypeptide ho ặc phân t ử ARN. Ở eukaryote, m ột đơn v ị phiên mã có Gen (gene) th ể mã hóa m ột ho ặc nhi ều s ản ph ẩm ho ặc đóng góp vào m ột s ản ph ẩm. Vị trí c ủa m ột gen trên m ột nhi ễm s ắc th ể, k ể c ả các yếu t ố điều hòa li ền k ề. Thu ật ng ữ locus được dùng Locus gen theo cách riêng để ch ỉ v ị trí c ủa gene-marker, y ếu t ố điều hòa, kh ởi điểm tái b ản, v.v Một locus c ủa vi khu ẩn có ch ứa nhi ều gen (mà được Operon phiên mã nh ư là m ột b ản sao polycistron đơn) và các yếu t ố điều hòa chung c ủa chúng. Pseudogen Một trình t ự không ho ạt độ ng ch ức n ăng v ốn có c ấu (gen gi ả) trúc t ươ ng t ự m ột gen ho ạt độ ng ch ức n ăng. Bất k ỳ ph ần nào c ủa đơn v ị phiên mã c ủa 1 gen ARN Đoạn đệ m được hay operon gen ARN s ẽ b ị lo ại b ỏ trong khi t ạo ra các phiên mã phân t ử ARN tr ưởng thành. Một vùng c ủa ADN được phiên mã thành ARN. Ở Đơ n v ị phiên mã, các eukaryote, đó là m ột gen. Ở vi khu ẩn, nó th ường vùng được phiên mã bao g ồm nhi ều gen. 45
Các vùng c ủa đơn v ị phiên mã không được d ịch mã Vùng không được thành protein. Các UTR k ề bên m ột vùng mã hóa hay dịch mã (UTR) operon được g ọi là 5'-UTR và 3'-UTR. 2.3. Các gen ở prokaryote Ở các prokaryote và eukaryote b ậc th ấp, th ường có m ột m ối quan h ệ đơn gi ản gi ữa gen và s ản ph ẩm c ủa nó. Trong h ầu h ết tr ường h ợp, có m ột s ự t ươ ng ứng “một gen - một s ản ph ẩm”; sự đồ ng tuy ến tính gi ữa gen và chu ỗi polypeptide của nó đã được Yanofsky xác nh ận n ăm 1961. Vì v ậy ở các sinh v ật này, gen và cistron là t ươ ng đươ ng: gen là đơ n v ị ch ức n ăng, mang thông tin di truy ền được bi ểu hi ện tr ọn v ẹn. Cần l ưu ý r ằng: (1) Ở vi khu ẩn, các gen đồ ng ngh ĩa v ới vùng mã hóa hay khung đọc m ở (ORF), trong khi đó ở các eukaryote nó đồ ng ngh ĩa v ới đơ n v ị phiên mã . Đó là vì các gen vi khu ẩn th ường được s ắp x ếp trong m ột operon (xem Chươ ng 6), và được phiên mã chung trong một phân tử mARN g ọi là mARN đa cistron (polycistronic mRNA). Trái l ại, ở các eukaryote, h ầu h ết các gen được phiên mã riêng r ẽ dưới d ạng các mARN đơ n cistron (monocistronic mRNA). (2) Trong các gen mã hóa protein c ủa vi khu ẩn không có các intron nh ư ở eukaryote mà chúng ta s ẽ tìm hi ểu ngay sau đây (xem Hình 3.4). Hình 3.4. (a) Ở vi khu ẩn, các gen không có intron. (b) Ở eukaryote, các gen mã hóa protein ch ủ y ếu là gen phân đoạn. 2.4. Các gen ở eukaryote Ở các b ộ gen eukaryote b ậc cao, thông th ường có một m ối quan h ệ ph ức t ạp gi ữa gen và s ản ph ẩm c ủa nó. H ầu h ết các gen c ủa eukaryote b ậc cao đề u có ch ứa các intron (intervening sequence), t ức các đoạn không mã hóa protein, n ằm xen gi ữa các exon (expressed sequence) - các đoạn mã hóa protein. Các gen nh ư vậy được g ọi là gen phân đoạn (split gene), gen kh ảm (mosaic gene) hay gen đứt quãng (interrupted gene). Lo ại gen này được Phillip Sharp phát hi ện l ần đầ u tiên năm 1977 mà lúc đó ông g ọi là “Gene in pieces”. Một dụ kinh điển v ề gen phân đoạn là gen ovalbumin ở gà đã được E. Chambon xác định đầ y đủ trình t ự nucleotide năm 1981 ( Hình 3.5 ). 46
Hình 3.5. Gen phân đoạn. (a-b) Vi ảnh điện t ử và s ơ đồ minh họa sự lai hoá gi ữa mARN tr ưởng thành được đánh d ấu v ới mạch khuôn c ủa gen thu ộc ADN bị bi ến tính. Các vùng ký hi ệu A →G là các intron c ủa mạch khuôn gen, do không có vùng b ổ sung t ươ ng ứng trên mARN để k ết c ặp nên chúng xu ất hi ện d ưới d ạng các vòng. (c) C ấu trúc c ủa gen ovalbumin, g ồm đoạn mã hoá “leader” (L) v ới các exon 1-7 (hàng trên) và s ố c ặp baz ơ tươ ng ứng (hàng d ưới); xen k ẽ gi ữa chúng là các intron. 2.5. Các gen mã hóa protein ở ng ười Cho đến nay được bi ết các gen trong b ộ gen c ủa sinh v ật nhân chu ẩn ph ần l ớn là các gen phân đoạn. Hình 3.6 và Bảng 3.2 và B ảng 3.3 cho th ấy các đặc điểm c ủa một s ố gen mã hoá protein trong bộ gen ng ười. Bảng 3.2. Sự t ươ ng ph ản v ề kích th ước gen, kích th ước mARN và s ố lượng intron c ủa m ột s ố gen ở ng ười (1 kb = 1.000 bp). Kích th ước Kích th ước Số l ượng Gen gen (kb) mARN (kb) intron Insulin 1,7 0,4 2 Collagen [pro-α-2(1) ] 38,0 5,0 50 Albumin 25,0 2,1 14 Phenylalanine hydroxylase 90,0 2,4 12 Dystrophin (DMD) 2000,0 17,0 50 Bảng 3.3. Số lượng và kích th ước c ủa các exon và intron trong các gen α-, β-, và γ-globin c ủa hemoglobin ng ười, k ể cả 5'-UTR và 3'-UTR của đơ n v ị phiên mã (TU). TU c ủa Globin Đầu 5' E1 I1 E2 I2 E3 Đầu 3' alpha 37 93 113 204 141 129 112 beta 50 93 130 222 850 126 132 47
gamma 53 93 122 222 886 126 87 histone toàn bộ = 400 bp; exon = 400 bp βββ-globin toàn bộ = 1.660 bp; các exon = 990 bp HGPRT (HPRT) toàn bộ = 42.830 bp; các exon = 1263 bp nhân tố VIII toàn bộ = ~186.000 bp; các exon = ~9,000 bp Hình 3.6. Một s ố gen mã hoá protein trong b ộ gen ng ười. Một s ố gen nh ư các gen của histone là không có intron, còn đa s ố các gen đề u có ch ứa ít nh ất m ột intron, ví d ụ: gen β-globin có 3 exon và hai intron; gen mã hoá hypoxanthine-guanine phosphoribosyl transferase (HGPRT) có 9 exon và dài g ấp gen histone kho ảng 100 l ần, tuy nhiên mARN c ủa nó ch ỉ dài g ấp ch ừng ba l ần mARN histone; gen c ủa nhân t ố VIII gây đông máu có quá nhi ều intron (bi ểu th ị b ằng các đường k ẻ đứ ng m ảnh). Các khám phá sau này còn cho th ấy các sự ki ện r ắc r ối n ẩy sinh đối v ới nhi ều gen phân đoạn, ở ch ỗ: thông tin trong một gen được s ử d ụng m ột cách ch ọn l ọc để sinh ra nhi ều s ản ph ẩm khác nhau, gọi là cắt-nối ch ọn l ọc (alternative splicing). Các s ản ph ẩm có quan h ệ v ề c ấu trúc này th ường có các ch ức n ăng khác nhau. Hình 3.7 cho th ấy hai ki ểu lo ại bỏ các intron t ừ các gen phân đoạn ở eukaryote. Hình 3.7. Hai ki ểu lo ại b ỏ intron t ừ các gen phân đoạn ở eukaryote. 48
Ngoài ra, có vài tr ường h ợp trong đó c ần t ới hai gen để sinh ra m ột s ản ph ẩm mARN đơ n thông qua ki ểu cắt-nối chéo (trans-splicing) ho ặc biên t ập ARN (RNA editing). Ch ẳng h ạn, khám phá m ới nh ất cho th ấy glucose 6-phosphate dehydrogenase là m ột enzyme có m ặt trong các t ế bào hồng c ầu ng ười; nó bao g ồm hai d ạng th ứ y ếu và chính y ếu; d ạng đầ u có trình t ự các axit amin thu ộc gen trên nhi ễm s ắc th ể X; và d ạng sau g ồm hai peptide được mã hóa t ừ thông tin c ủa hai nhi ễm s ắc th ể, các axit amin trong đoạn 1-53 được mã hóa trên nhi ễm s ắc th ể s ố 6 và các axit amin ở đoạn ti ếp theo 54-479 được mã hóa trên nhi ễm s ắc th ể X. Một l ần n ữa, t ất c ả các tr ường h ợp này nói lên m ột điều r ằng, để đưa ra m ột đị nh ngh ĩa chính xác v ề gen là không hề đơ n gi ản! 3. Mã di truy ền Gen hay ADN được c ấu t ạo t ừ b ốn lo ại nucleotide, trong khi đó protein được c ấu t ạo b ởi 20 lo ại axit amin. V ấn đề đặ t ra là, các gen mã hóa cho các sản ph ẩm protein c ủa chúng b ằng cách nào? Bằng suy lu ận, ta có th ể suy đoán r ằng m ỗi axit amin không th ể được xác đị nh b ởi đơn v ị mã gồm m ột, hai ho ặc b ốn nucleotide b ởi m ột đằ ng còn ch ưa đủ và m ột đằ ng khác l ại quá d ư th ừa. Có lẽ nó ph ải là m ột nhóm g ồm ba nucleotide (4 3 = 64). V ới 64 ki ểu b ộ ba hoá ra là đủ th ừa để mã hoá cho 20 lo ại axit amin. Nh ư th ế, m ột axit amin được xác đị nh b ởi trung bình ba b ộ ba khác nhau. Phải ch ăng mã di try ền là mã b ộ ba? Năm 1961, S.Brenner, F.Crick và L.Barnett đã phân tích chi ti ết nhi ều th ể độ t bi ến c ủa phage T4 nh ận được b ằng cách x ử lý acridin, tác nhân gây các độ t bi ến m ất ho ặc thêm m ột c ặp baz ơ, đã kh ẳng đị nh mã di truy ền là mã b ộ ba (triplet code) đúng nh ư d ự đoán. Nh ư v ậy, đơ n v ị mã (coding unit) g ồm ba nucleotide xác định m ột axit amin gọi là codon . 3.1. Gi ải mã di truy ền Vi ệc ti ếp theo là xác định xem m ỗi axit amin cụ th ể được mã hoá b ởi m ột ho ặc m ột s ố b ộ ba nào. C ũng trong n ăm 1961, M.Nirenberg và H. Matthaei l ần đầ u tiên s ử d ụng mARN nhân t ạo có thành ph ần baz ơ bi ết tr ước được t ổng h ợp b ằng enzyme polynucleotide phosphorylase (do Ochoa tìm ra n ăm 1959) và h ệ th ống t ổng h ợp là d ịch chi ết t ế bào E. coli bao g ồm đầ y đủ các y ếu t ố (ribosome, tARN, axit amin, enzyme, ATP ) c ần thi ết cho ti ến hành gi ải mã di truy ền in vitro . V ới mARN ch ỉ ch ứa toàn U, poly(U), chu ỗi polypeptide sinh ra ch ỉ ch ứa toàn phenylalanine (Phe). Điều đó ch ứng t ỏ UUU là b ộ ba mã hoá c ủa Phe. Sau đó, Gobind Khorana đã ti ến hành các thí nghi ệm s ử d ụng các mARN t ổng h ợp có ch ứa hai, ba ho ặc b ốn nucleotide được k ết n ối theo ki ểu l ặp l ại để ti ến hành gi ải mã. Ví d ụ: (i) V ới mARN nhân t ạo ch ứa hai baz ơ là poly(UC) hay UCUCUC , s ẽ ch ứa hai codon xen k ẽ UCU và CUC (chú ý r ằng s ự d ịch mã in vitro kh ởi đầ u t ại v ị trí ng ẫu nhiên). K ết qu ả là thu được m ột polypeptide g ồm hai axit amin xen k ẻ nhau là serin và leucin, poly(Ser-Leu); (ii) V ới mARN t ổng hợp g ồm các b ộ ba l ặp l ại s ẽ được d ịch thành các homopolypeptide. Ví d ụ, poly(UUC) có th ể được đọc là (UUC-UUC), ho ặc (UCU-UCU), ho ặc (CUU-CUU) tùy thu ộc vào v ị trí b ắt đầ u d ịch mã. Và kết qu ả là có ba lo ại polypeptide được t ổng h ợp, poly(Phe) ho ặc poly(Ser) ho ặc poly(Leu) v.v. Từ các k ết qu ả thu được b ằng cách đó Khorana đã xác định được 'ngh ĩa' c ủa ph ần l ớn các codon có thành ph ần baz ơ không đồng nh ất, và vi ệc gi ải toàn b ộ h ệ th ống mã di truy ền (genetic code) được hoàn t ất vào tháng 6 n ăm 1966. V ới công lao to l ớn đó Khorana và Nirenberg được trao gi ải th ưởng Nobel n ăm 1968. T ừ đây cho phép xây d ựng nên b ảng mã di truy ền (B ảng 3.4) với các 49
đặc tính được trình bày d ưới đây. Bảng 3.4. Mã di truy ền (trên mARN, chi ều codon N 1N2N3 là 5' →3') Bảng mã tra thu ận Bảng mã tra ng ược N3 A.amin Codon (5' →3') N1 N2 U C A G Ala GC N U Phe Leu Arg CG N + AGA, AGG C Ser Asn AAU, AAC U A Tyr ■ ■ Asp GAU, GAC G Cys ■ Trp Cys UGU, UGC Gln CAA, CAG U Leu Glu GAA, GAG C Pro Gly GG N C A His Gln His CAU, CAC G Arg Ile AUU, AUC, AUA Leu CU N + UUA, UUG U Ile Met ► Lys AAA, AAG C Thr Met (►) AUG A A Asn Lys Phe UUU, UUC G Ser Arg Pro CC N Ser UC N + AGU, AGC U Val Thr AC N C Ala Trp UGG G A Asp Glu Tyr UAU, UAC G Gly Val GU N KT ( ■) UAA, UAG, UGA Chú thích : (1) N = U, C, A ho ặc G ► : Codon m ở đầ u (M Đ) ■ : Codon k ết thúc (KT) (2) Vi ết t ắt b ằng ba ch ữ cái thông d ụng của các axit amin. Tên đầy đủ Vi ết t ắt Tên đầy đủ Vi ết t ắt Alanine Ala Leucine Leu Arginine Arg Lysine Lys Aspartic acid Asp Methionine Met Asparagine Asn Phenylalanine Phe Cysteine Cys Proline Pro Glutamic acid Glu Serine Ser Glutamine Gln Threonine Thr Glycine Gly Tryptophan Trp 50
Histidine His Tyrosine Tyr Isoleucine Ile Valine Val Mở đầ u MĐ ( ►) Kết thúc KT ( ■) 3.2. Các đặc tính c ủa mã di truy ền - Mã di truy ền là mã b ộ ba (triplet code). Các b ộ ba cu ả mARN g ọi là codon (mã) và b ộ ba đặc tr ưng của tARN có th ể kh ớp v ới codon c ủa mARN theo nguyên t ắc b ổ sung g ọi là anticodon (đối mã) (Hình 3.8). Hình 3.8. Các phân t ử tARN mang axit amin Ser (trái) và Tyr (ph ải) đọ c mã trên mARN bằng cách kh ớp anticodon c ủa chúng v ới codon c ủa mARN. - Mã di truy ền không g ối lên nhau (non-overlapping). M ỗi codon là m ột đơn v ị độ c l ập, và thông tin c ủa mARN được đọ c l ần l ượt qua các codon theo chi ều 5' →3' b ắt đầ u t ừ codon kh ởi đầ u. - Mã di truy ền có tính liên t ục, không b ị ng ắt quãng (unpunctuated). - Mã di truy ền có các codon kh ởi đầ u (initiation) và kết thúc (termination) n ằm ở hai đầ u 5' và 3' c ủa mARN đóng vai trò là tín hi ệu kh ởi đầ u và k ết thúc t ổng h ợp chu ỗi polypeptide. - Mã di truy ền có tính đơ n tr ị, rõ ràng (unambigous). M ỗi codon xác đị nh ch ỉ một axit amin ho ặc là tín hi ệu k ết thúc d ịch mã. - Mã di truy ền có tính thoái hóa (degenrate). V ới t ất c ả 61 codon có ngh ĩa (sense codon) trong khi ch ỉ có 20 lo ại axit amin, vì v ậy m ỗi axit amin có th ể được xác đị nh b ởi nhi ều h ơn m ột codon. Các codon cùng xác định một axit amin nh ư th ế g ọi là các codon đồng ngh ĩa, chúng th ường khác nhau ở baz ơ cu ối (baz ơ 3') – baz ơ thoái hóa . Ví d ụ, các axit amin Arg, Ser và Leu đều có sáu codon đồng ngh ĩa (Bảng 3.4). - Mã di truy ền có tính ph ổ bi ến (universal). Đến đây ta có th ể hình dung m ối quan h ệ gi ữa ADN-gen v ới s ản ph ẩm mARN và protein c ủa nó nh ư ở Hình 3.9 51
Hình 3.9. Mối quan h ệ gi ữa ADN-gen v ới s ản ph ẩm mARN và protein c ủa nó 3.3. Nh ững ngo ại l ệ so v ới mã di truy ền “ph ổ bi ến” Bên c ạnh tính ph ổ bi ến (universal) c ủa h ệ th ống mã di truy ền nói trên, các nghiên c ứu g ần đây cho th ấy m ột vài ch ệch h ướng mà h ầu h ết là x ảy ra trong các b ộ gen ty th ể (Bảng 3.5). Tuy nhiên, ở các bào quan th ực v ật, s ự biên t ập ARN (ARN editing) là ph ổ bi ến và không rõ ràng, ở ch ỗ: Li ệu ph ải ch ăng t ất cả các tr ường h ợp sai l ệch so v ới mã ph ổ bi ến ở th ực v ật là các bi ến đổ i th ật hay là h ậu qu ả c ủa s ự biên t ập ARN tr ước khi d ịch mã. M ột vài thay đổi th ỉnh tho ảng c ũng x ảy ra ở các bộ gen vi khu ẩn và b ộ gen nhân c ủa các eukaryote, nh ưng th ường thì liên quan v ới các codon k ết thúc. S ự phân b ố phát sinh ch ủng lo ại c ủa các thay đổ i này ch ỉ ra r ằng mã di truy ền v ẫn còn ti ến hóa. Bảng 3.5. Các ngo ại l ệ so v ới mã “ph ổ bi ến” Ngu ồn Codon Ngh ĩa ph ổ bi ến Ngh ĩa m ới Ty th ể ru ồi gi ấm UGA Kết thúc Tryptophan AGA & AGG Arginine Serine AUA Isoleucine Methionine Ty th ể độ ng v ật có vú AGA & AGG Arginine Kết thúc AUA Isoleucine Methionine UGA Kết thúc Tryptophan Ty th ể n ấm men CUN (1) Leucine Threonine AUA Isoleucine Methionine UGA Kết thúc Tryptophan Ty th ể T.vật b ậc cao UGA Kết thúc Tryptophan CGG Arginine Tryptophan Nhân c ủa Protozoa (2) UAA & UAG Kết thúc Glutamine Mycoplasma UGA Kết thúc Tryptophan (1) N = U, C, A ho ặc G; (2) Protozoa: Động v ật nguyên sinh. 52
3.4. S ự linh ho ạt trong k ết c ặp baz ơ gi ữa anticodon và codon Mặc dù có 61 codon có ngh ĩa nh ưng trên th ực t ế trong m ỗi t ế bào prokaryote và eukaryote ch ỉ có kho ảng 40 phân t ử tARN khác nhau. Tuy nhiên, trong t ế bào ch ỉ có 20 lo ại axit amin được xác định b ởi mã di truy ền, nên m ột s ố lo ại tARN ph ải mang cùng m ột lo ại axit amin. Các b ản sao tARN nh ư th ế có th ể có trình t ự anticodon gi ống nhau, trong tr ường h ợp đó chúng có th ể thay th ế ch ức năng cho nhau. Các tARN khác thì mang các trình t ự anticodon khác nhau và do v ậy nh ận bi ết các codon khác nhau; chúng được g ọi là isoaccepting tARN , và độ giàu t ươ ng đối c ủa chúng có th ể ảnh hưởng t ới cách th ức s ử d ụng codon. Năm 1966, F.Crick đư a ra m ột cách để gi ải thích v ề s ự k ết c ặp “lỏng l ẻo” có th ể x ảy ra ở v ị trí th ứ ba c ủa các codon đồ ng ngh ĩa. Theo Crick, hai baz ơ đầu tiên c ủa m ột codon ph ải có s ự k ết cặp chính xác v ới anticdon (theo nguyên t ắc b ổ sung), còn baz ơ cu ối c ủa codon thì có th ể “linh ho ạt” (wobble), ít đặc thù h ơn so v ới v ị trí bình th ường c ủa nó để hình thành nên s ự k ết c ặp baz ơ bất th ường v ới anticodon. Đề ngh ị này được g ọi là gi ả thuy ết linh ho ạt (wobble hypothesis). Hình 3.10. Hai ki ểu kết c ặp baz ơ v ới G ở v ị trí linh ho ạt và ba ki ểu k ết c ặp baz ơ v ới I (inosine) ở v ị trí linh ho ạt. Hình d ưới (bên ph ải) cho th ấy s ự k ết c ặp linh ho ạt x ảy ra ở baz ơ 5' c ủa tARN với baz ơ 3' c ủa codon mã hóa Leucine. Crick g ợi ý r ằng m ột baz ơ G trong anticodon có th ể c ặp không ch ỉ v ới C ở v ị trí th ứ ba c ủa 53