Bài giảng Hệ điều hành phân tán (Phần 1) - Hà Quang Thụy

pdf 182 trang hapham 1260
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Hệ điều hành phân tán (Phần 1) - Hà Quang Thụy", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_he_dieu_hanh_phan_tan_phan_1_ha_quang_thuy.pdf

Nội dung text: Bài giảng Hệ điều hành phân tán (Phần 1) - Hà Quang Thụy

  1. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) ch−ơng I. Các nguyên lý cơ bản của hệ điều hành 1.1 Sự tiến hoá của hệ điều hành hiện đại a. Khái niệm hệ điều hành Hệ điều hành (Operating System - OS, d−ới đây viết tắt tiếng Việt là HĐH) là một hệ thống các ch−ơng trình (và dữ liệu - tham số hệ thống) đ−ợc cài đặt sẵn (d−ới dạng các file trên đĩa từ - băng từ) thực hiện hai chức năng cơ bản: - Chức năng của một hệ thống quản trị tài nguyên: Quản trị, phân phối công việc cho hệ thống thiết bị để hệ thống thiết bị hoạt động hiệu quả nhất, - Chức năng của một máy tính mở rộng (máy tính ảo): Phục vụ nhu cầu đa dạng của ng−ời dùng một cách tốt nhất. Theo cách nói cụ thể hơn, HĐH là một bộ các môđun phần mềm hệ thống đóng vai trò giao diện giữa ch−ơng trình ứng dụng với phần cứng hệ thống, với mục tiêu đạt tới một hệ thống máy tính hiệu quả, tin cậy và dễ sử dụng. Một cách đại thể, tồn tại các chức năng riêng biệt của HĐH nh− lập lịch làm việc của bộ xử lý (hoặc các bộ xử lý), phối hợp thực hiện các quá trình (QT: process) t−ơng tác nhau, quản lý các tài nguyên hệ thống (chẳng hạn nh− các thiết bị vào/ra, bộ nhớ trong, File ) nhằm nâng cao năng lực điều khiển và bảo vệ, duy trì tính toàn vẹn hệ thống, thi hành khôi phục lỗi và cung cấp một giao diện ng−ời dùng. HĐH th−ờng cấu trúc hai yêu cầu này thành hai lớp: dịch vụ hệ thống và nhân của HĐH. Dịch vụ hệ thống là những chức năng mức cao đ−ợc ch−ơng trình ứng dụng nhận biết còn nhân (th−ờng trực trong bộ nhớ trong) chỉ đảm bảo những chức năng mang tính cơ bản nhất và phụ thuộc vào kiến trúc hạ tầng. Hình 1.1. mô tả khung nhìn đơn giản về hệ thống máy tính theo cấu trúc lớp. Vị trí của dịch vụ hệ thống trong hình cho thấy vai trò quan trọng của lớp này. Ng−ời dùng Ch−ơng trình ứng dụng Dịch vụ hệ thống Nhân Phần cứng máy tính Hình 1.1. Cấu trúc lớp của hệ thống máy tính • Với ý nghĩa đóng vai trò nh− một máy tính ảo, theo cách nhìn của ng−ời dùng (từ lớp ch−ơng trình ứng dụng), HĐH là sự trừu t−ợng hóa của hệ thống máy tính đ−ợc trình diễn bằng các dịch vụ hệ thống: HĐH đ−ợc chỉ dẫn nh− là một máy mở rộng (máy tính ảo). Mục đích của lớp dịch vụ hệ thống là nhằm che đậy đi những chi tiết của hệ thống (phần cứng và phần mềm) đối với ng−ời dùng. • Theo cách nhìn của ng−ời quản trị hệ thống, dịch vụ hệ thống và nhân đ−ợc coi là ng−ời quản lý tài nguyên. Quản lý hệ thống tài nguyên (CPU, bộ nhớ, hệ thống vào ra, file) không chỉ kiểm soát đ−ợc tình trạng của các tài nguyên mà còn nhằm khai thác - 1-
  2. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) hiệu quả nhất. Một số bài toán điển hình nh− điều khiển bộ nhớ, lập lịch QT, điều khiển liên QT, điều khiển file, điều khiển vào ra Máy tính mở rộng và quản lý tài nguyên là hai thuật ngữ chung nhất đ−ợc dùng để xác định một HĐH. Máy tính mở rộng (trừu t−ợng máy) là mục tiêu thiết kế nguyên thủy đối với HĐH và quản lý tài nguyên giải nghĩa cho việc thực hiện mục tiêu đó. Thiết kế HĐH truyền thống th−ờng bắt đầu từ yếu tố quan trọng hơn là quản lý tài nguyên, trong khi đó thiết kế HĐH hiện đại lại tập trung nhiều hơn vào yếu tố trừu t−ợng máy. Và một lẽ tất nhiên là yếu tố nào là quan trọng hơn lại phụ thuộc vào sự quan tâm từ phía ng−ời dùng. b. Sơ bộ về sự tién hóa của hệ điều hành Trong máy tính thuộc các thế hệ đầu tiên không có HĐH. Các thao tác chọn công việc, phân công công việc đều do thao tác viên (và thậm chí ngay chính ng−ời lập trình) thực hiện. Theo thời gian, năng lực của máy tính đ−ợc nâng cao: về tốc độ xử lý của CPU, về dung l−ợng bộ nhớ, về hệ thống thiết bị ngoại vi, về phần mềm hệ thống cũng nh− số l−ợng và năng lực ng−ời sử dụng tăng tr−ởng và vì vậy cần có một hệ thống ch−ơng trình điều khiển tự động hệ thống máy tính. Những yếu tố thực tế nh− vậy làm nảy sinh những điều kiện cần thiết cho việc xuất hiện các HĐH đơn giản. Lịch sử tiến hóa của HĐH trình diễn một quá trình chuyển hóa từng b−ớc trong việc thiết kế, từ nhấn mạnh chức năng quản trị tài nguyên sang nhấn mạnh chức năng máy tính mở rộng. Theo mô hình trong hình 1.1. thì điều đó đ−ợc thể hiện việc chuyển hóa từ nhấn mạnh nhân sang nhấn mạnh các dịch vụ hệ thống. Theo lịch sử tiến hóa, HĐH hiện đại đ−ợc phân ra thành 4 thế hệ: HĐH truyền thống (tập trung), hệ điều mạng, HĐH phân tán và hệ tự trị cộng tác. Thế hệ gần đây nhất (hệ tự trị cộng tác) chú trọng thiết kế các ứng dụng phân tán trong môi tr−ờng hệ thống mở (bao gồm các thành phần hệ thống hỗn tạp đ−ợc tích hợp mềm dẻo và có tính khả chuyển nhằm hỗ trợ việc cộng tác thực hiện theo quy mô lớn ở mức ứng dụng). D−ới đây mô tả sơ bộ về cách thức phân biệt các HĐH này theo (1) độ kết dính phần cứng-phần mềm và (2) tổ hợp mục tiêu-đặc tr−ng. Chiều giảm độ kết dính phần cứng- phần mềm Thế hệ 1 Thế hệ 3Thế hệ 4 Thế hệ 2 Hệ điều Hệ điều Hệ điều Hệ điều hành tập hành phân hành tự trị hành mạng trung tán cộng tác Hình 1.2. Phân bố của các thế hệ hệ điều hành theo độ kết dính • Độ kết dính phần cứng-phần mềm cho biết hệ thống là "tập trung đến mức độ nào", đ−ợc đo bằng tổ hợp kết dính phần cứng và kết dính phần mềm. Theo đó, phân bố các thế hệ HĐH đ−ợc sắp xếp nh− hình 1.2. Tỷ số giữa tổng phí truyền thông liên bộ xử lý so với thời gian truyền thông nột tại bộ xử lý càng thấp thì kết dính phần cứng càng chặt. Kết dính phần mềm chặt nếu phần mềm điều khiển tập trung và sử dụng thông tin toàn cục. - HĐH tập trung kết dính phần cứng - phần mềm chặt. - 2-
  3. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) - HĐH phân tán (DOS): phần mềm kết dính chặt trên nền phần cứng kết dính lỏng, - HĐH mạng (NOS): cả phần mềm lẫn phần cứng đều kết dính lỏng, - Hệ tự trị cộng tác (CAS) làm giảm kết dính chặt phần mềm (cách nhìn lôgic tập trung của DOS). CAS nằm giữa NOS và DOS. • Phân biệt HĐH theo tổ hợp mục tiêu-đặc tr−ng Bảng 1.1 trình bày sự phân biệt các thế hệ HĐH theo tổ hợp mục tiêu-đặc tr−ng. Bảng 1.1. Phân biệt hệ điều hành theo mục tiêu-đặc tr−ng Thế hệ Hệ thống Đặc tr−ng Mục tiêu Quản trị quá trình Quản trị bộ nhớ Quản trị tài nguyên 1 HĐH tập trung Quản trị vào-ra Máy tính mở rộng (ảo) Quản trị file Truy nhập từ xa Chia xẻ tài nguyên 2 HĐH mạng Trao đổi thông tin (liên thao tác) Duyệt mạng Khung cảnh toàn cục của: Hệ thống file, Cách nhìn của một máy tính duy nhất của một hệ 3 HĐH phân tán Không gian tên, thống phức hợp các máy Thời gian, an toàn, tính (tính trong suốt) Năng lực tính toán Các ứng dụng phân tán Làm việc cộng tác (tự 4 Hệ tự trị cộng tác là mở và cộng tác trị) Mục tiêu nguyên thủy của HĐH là máy tính ảo (virtual computer). Ba mục tiêu bổ sung là liên thao tác, trong suốt và tự trị hiện vẫn đang là những nội dung nghiên cứu, phát triển. - Mục tiêu liên thao tác h−ớng tới năng lực tạo ra điều kiện thuận tiện cho việc trao đổi thông tin giữa các thành phần hỗn tạp trong hệ thống. Đây là mục tiêu gợi mở nguyên thuỷ dẫn tới việc thiết kế HĐH mạng trong một môi tr−ờng hỗn tạp. - Khái niệm trong suốt (transparency) và khái niệm ảo t−ơng tự nhau ở chỗ cung cấp tính trừu t−ợng cao cho hệ thống. Điều khác biệt giữa hai khái niệm này là theo tính ảo, ng−ời dùng có thể nhìn thấy cái họ muốn, trong khi đó tính trong suốt đảm bảo rằng ng−ời dùng không nhìn thấy những cái họ không muốn. ảo là mục tiêu quan trọng của HĐH tập trung còn trong suốt là mục tiêu quan trọng của DOS. Khái niệm trong suốt cho phép mô tả DOS nh− một hệ thống cung cấp một khung cảnh lôgic của hệ thống cho ng−ời dùng, độc lập với hạ tầng vật lý. Ng−ời dùng có đ−ợc cách nhìn của máy tính đơn cho một hệ thống máy tính phức hợp: sự tồn tại của hạ tầng mạng và hoạt động của hệ thống là trong suốt với ng−ời dùng. Từ "trong suốt" ở đây đ−ợc hiểu theo nghĩa 'thuần khiết" của một môi tr−ờng thuần nhất. - Trong suốt là một mục tiêu quá cao. Hơn nữa, không bắt buộc phải luôn cố đạt tới tính trong suốt vì nó bao gói một độ tập trung nào đó. Điều chắc chắn phù hợp với ng−ời dùng là họ thích có đ−ợc cái nhìn riêng về hệ thống. Ng−ời dùng cần một môi tr−ờng mở không đòi hỏi nhất thiết về tính trong suốt mà chỉ cần hệ thống cung cấp - 3-
  4. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) tính mở để ng−ời dùng biến đổi, chuyển, di trú, mở rộng phần mềm ứng dụng của họ một cách độc lập đối với sự hỗn tạp của hệ thống. Lý do là, nh− lẽ rất tự nhiên, ng−ời dùng biết đ−ợc sự tồn tại của tài nguyên phức và sự hiện diện của các ng−ời dùng khác, và ng−ời dùng trở thành cộng tác hoàn toàn với hệ thống. Từ đó, hệ thống phần mềm đ−ợc xây dựng nhờ việc tích hợp các dịch vụ cộng tác, đ−ợc cung cấp từ các đơn vị tự trị. Kiểu hoạt động nh− vậy của hệ tự trị cộng tác rất giống xã hội loài ng−ời. Hiện tại một số hệ thống phần mềm lớp giữa (middleware) đ−ợc xây dựng nh− những phiên bản (version) ban đầu của hệ tự trị cộng tác. Liên thao tác, trong suốt, và tự trị là những tính chất rất đáng mong muốn. Ng−ời dùng không phải (th−ờng là không cần thiết) biết HĐH hiện tại có phải là mạng, DOS, CAS hay không. Hầu hết các HĐH hiện đại là một hệ thống tích hợp. Nó là việc tiến hóa từ HĐH tập trung tới HĐH mạng, HĐH phân tán và sau đó là hệ tự trị cộng tác, trong đó ng−ời dùng tiếp xúc với việc xây dựng các ứng dụng cộng tác lớn dựa trên các khối đã đ−ợc cấu trúc hoàn hảo. 1.2. Tổng quan về hệ điều hành truyền thống Nh− đã biết, HĐH truyền thống (còn đ−ợc gọi là HĐH tập trung với đơn/đa bộ xử lý) chạy trên một máy tính là thế hệ HĐH đầu tiên, với độ kết dính chặt chẽ phần mềm - phần cứng trong đó mọi tài nguyên đ−ợc chia xẻ một cách nội tại và truyền thông liên xử lý/liên QT đ−ợc thực hiện qua hoặc chia xẻ bộ nhớ hoặc ngắt QT trực tiếp. Trong HĐH tập trung, hệ thống máy tính là tập trung: CPU (một hoặc nhiều) và bộ nhớ trong thỏa mãn một số tính chất nguyên thủy của chúng (ví dụ, tốc độ truy nhập của một CPU bất kỳ tới một địa chỉ bộ nhớ trong bất kỳ là đồng nhất ). Coi rằng chỉ có duy nhất "một bộ CPU" cùng duy nhất "một bộ nhớ trong" và không hề quan tâm đến sự khác biệt thời gian truyền thông giữa các CPU hay giữa các bộ phận của bộ nhớ trong. Trong các HĐH truyền thống, chức năng hệ quản trị tài nguyên đ−ợc nhấn mạnh hơn cho nên việc thiết kế chúng định h−ớng vào khai thác hiệu quả các tài nguyên phần cứng của hệ thống. Các bài toán điều khiển CPU (lập lịch), điều khiển bộ nhớ trong, điều khiển dữ liệu đ−ợc đặc biệt chú ý. HĐH truyền thống đ−ợc tiến hóa từ một ch−ơng trình đơn giản (cung cấp một giao diện ng−ời dùng và điều khiển vào - ra) tới một hệ đa ng−ời dùng/đa bài toán hoàn hảo với các yêu cầu về quản trị rất phức tạp đối với QT, bộ nhớ, file và thiết bị. Sự tiến hóa này đ−ợc thể hiện trong bảng 1.2 mà các chức năng quản lý đ−ợc đặt ra nhằm đáp ứng mỗi yêu cầu bổ sung. Bảng 1.2. Chức năng chính của hệ điều hành tập trung Yêu cầu hệ thống Chức năng quản lý Ng−ời dùng cá nhân Giao diện ng−ời dùng, Điều khiển vào - ra, ngắt, điều khiển thiết bị Vào - ra hiệu quả Thiết bị vào - ra ảo, spooling Ch−ơng trình lớn Bộ nhớ ảo, phân trang hay phân segment Đa ng−ời dùng Đa ch−ơng trình và phân chia thời gian Lập lịch quá trình Điều khiển truy nhập và bảo vệ Chia xẻ file và điều khiển đồng thời Đa bài toán (đa nhiệm) Xử lý đồng thời Đồng bộ hóa quá trình, bế tắc Truyền thông liên quá trình - 4-
  5. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) Có một l−u ý nhỏ về chính khái niệm hệ điều hành trong thời kỳ đánh dấu sự phát triển mạnh của HĐH truyền thống (vào khoảng những năm 1980). Trong nhiều tài liệu, đặc biệt là tài liệu về thiết kế HĐH, "hệ điều hành" đ−ợc hiểu theo những nội dung đã đ−ợc trình bày trên đây. Nh−ng trong không ít các tài liệu khác, "hệ điều hành" đ−ợc hiểu nh− bộ các ch−ơng trình hệ thống (xem hình 1.3) đ−ợc cung cấp cho ng−ời sử dụng và ngoài những thành tố đã nói - t−ơng ứng với thành phần điều kiển, HĐH còn có thành phần ứng dụng và thành phần tiện ích. Lý do chính của việc mở rộng nội dung khái niệm về HĐH nh− vậy liên quan đến sản phẩm kết quả cung cấp cho ng−ời sử dụng là một "bộ phần mềm hệ điều hành". Tuy nhiên, khi trình bày bản chất của HĐH, cách quan niệm này cũng nhất quán với cách quan niệm đã nói và nội dung trong giáo trình này nhất quán theo cách quan niệm nh− vậy. Ng−ời dùng Các ch−ơng trình ứng dụng Trình biên dịch Trình soạn thảo Trình thông dịch ch−ơng trình Hệ điều hành (Lời gọi hệ thống, nhân) hệ thống Ngôn ngữ máy Vi ch−ơng trình tại ROM phần cứng Thiết bị vật lý Hình 1.3. Một cách nhìn khác về kiến trúc mức hệ thống máy tính Tiếp theo trong mục d−ới đây, chúng ta mô tả sơ l−ợc quá trình tiến hóa của HĐH truyền thống. 1.2.0. Tiến hóa hệ điều hành truyền thống a. Hệ điều hành đơn ch−ơng trình HĐH đơn ch−ơng trình (HĐH dãy: serial OS) xuất hiện đầu tiên: ch−ơng trình của ng−ời dùng đ−ợc xếp hàng để lần l−ợt đ−ợc đ−a vào bộ nhớ trong và chạy (thực hiện). Một ch−ơng trình sau khi đ−ợc nạp từ dòng xếp hàng vào bộ nhớ trong đ−ợc hệ thống (cùng toàn bộ tài nguyên) phục vụ từ khi ch−ơng trình bắt đầu chạy cho đến lúc ch−ơng trình kết thúc. Một ch−ơng trình đ−ợc nạp vào bộ nhớ nh− vậy có thể đ−ợc thực hiện với nhiều bộ dữ liệu. Chỉ khi ch−ơng trình này kết thúc thì mới nạp tiếp ch−ơng trình khác trong dòng đợi vào bộ nhớ trong. Trong hệ thống đơn ch−ơng trình thực chất không cần giải quyết bài toán điều khiển CPU (lập lich) vì CPU đã đ−ợc dành riêng cho ch−ơng trình hiện tại. Tuy nhiên, việc nạp ch−ơng trình và dữ liệu vào bộ nhớ trong làm việc lại liên quan đến thiết bị vào-ra đa dạng mà trong giai đoạn ban đầu phổ biến là vào bìa đục lỗ (thiết bị vào chuẩn) và ra máy in (thiết bị ra chuẩn). Và tới một thời điểm, ra đời CPU tốc độ cao, tốc độ nạp bìa cũng nh− tốc độ in ra không theo kịp với tốc độ của CPU, vì thế làm tăng thời gian nghỉ vô ích của CPU mà gây ra lãng phí. Đòi hỏi cần cải tiến nhằm tăng hiệu quả hoạt động. Một trong những cải tiến đối với HĐH đơn ch−ơng trình là hoạt động theo chế độ SPOOLING (Simultaneous Peripheral Operation OnLine), mà theo đó tất cả việc vào - ra đối với HĐH là làm việc với đĩa cứng còn vào - ra từ đĩa - 5-
  6. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) cứng với các vật mang tin khác đ−ợc đảm bảo bằng những cơ chế riêng. Tốc độ của toàn bộ hệ thống đ−ợc tăng lên đáng kể. Chế độ SPOOLING còn đ−ợc sử dụng trong những HĐH đa ch−ơng trình xuất hiện sau này. b. Hệ điều hành đa ch−ơng trình Sự tiến bộ nhanh chóng của công nghệ máy tính dẫn tới dung l−ợng bộ nhớ tăng lên đáng kể (v−ợt xa dung l−ợng trung bình của các ch−ơng trình ng−ời dùng) và tốc độ CPU cũng tăng nhanh, chế độ hoạt động đa ch−ơng trình xuất hiện. Chế độ đa ch−ơng trình (multiprogramming) đ−ợc phân loại theo h−ớng độc lập ng−ời dùng (chế độ mẻ) và h−ớng thân thiện ng−ời dùng (chế độ đa ng−ời dùng). Đối với HĐH đa ch−ơng trình, tại mỗi thời điểm có thể có nhiều ch−ơng trình đồng thời có mặt ở bộ nhớ trong. Các ch−ơng trình này đều có nhu cầu đ−ợc phân phối bộ nhớ và CPU để thực hiện. Nh− vậy, bộ nhớ, CPU, các thiết bị ngoại vi v.v. là các tài nguyên của hệ thống đ−ợc chia xẻ cho các ch−ơng trình. Đặc điểm quan trọng cần l−u ý là các ch−ơng trình này phải đ−ợc “bình đẳng” khi giải quyết các yêu cầu tài nguyên. Khái niệm ch−ơng trình nói trong chế độ đa ch−ơng trình đ−ợc dùng để chỉ cả ch−ơng trình ng−ời dùng lẫn ch−ơng trình HĐH. Khi so sánh với HĐH đơn ch−ơng trình, có thể nhận thấy ngay một điều là đối với một ch−ơng trình cụ thể thì trong chế độ đơn ch−ơng trình, ch−ơng trình đó sẽ kết thúc nhanh hơn (thời gian chạy ngắn hơn) so với khi nó chạy trong chế độ đa ch−ơng trình; nh−ng bù lại, trong một khoảng thời gian xác định thì chế độ đa ch−ơng trình sẽ hoàn thiện đ−ợc nhiều ch−ơng trình (giải đ−ợc nhiều bài toán) hơn, do đó hiệu quả sử dụng máy tính cao hơn. Một trong những tài nguyên quan trọng nhất của hệ thống máy tính là CPU. Việc chia xẻ CPU là một trong những dạng điển hình của việc chia xẻ tài nguyên. Tính chất chia xẻ CPU lại phân lớp các HĐH đa ch−ơng trình thành các lớp con: HĐH hoạt động theo chế độ mẻ (batch) và HĐH hoạt động theo chế độ phân chia thời gian (time shared). • Hệ điều hành hoạt động theo chế độ mẻ Đây là loại HĐH định h−ớng tới mục tiêu làm cực đại số l−ợng các bài toán đ−ợc giải quyết trong một khoảng đơn vị thời gian (có nghĩa là trong một khoảng đơn vị thời gian thì h−ớng mục tiêu vào việc hoàn thiện đ−ợc càng nhiều ch−ơng trình càng tốt). ở n−ớc ta những năm tr−ớc đây, các máy tính EC-1022, EC-1035 (HĐH OS), IBM 360/40-50 (HĐH DOS) phổ biến hoạt động theo chế độ mẻ. Trong HĐH chế độ mẻ, cách thức điều khiển CPU điển hình là một ch−ơng trình ở trạng thái sẵn sàng sẽ đ−ợc chọn thực hiện (đ−ợc phân phối CPU) khi ch−ơng trình đang chạy phải ngừng vì nó cần đến một tài nguyên khác CPU. Các HĐH theo chế độ mẻ lại có thể phân biệt thành hai loại điển hình là MFT và MVT: sự phân biệt chúng theo cách điều khiển bộ nhớ trong. MFT: Multiprogramming with Fixed number of Tasks Khi hệ thống làm việc, đã quy định sẵn một số l−ợng cố định các bài toán đồng thời ở bộ nhớ trong: Bộ nhớ trong đ−ợc chia thành một số vùng nhớ cố định, các vùng này có biên cố định mà mỗi vùng đ−ợc dùng để chứa một ch−ơng trình tại một thời điểm. Mỗi ch−ơng trình ng−ời dùng chỉ đ−ợc đ−a vào một vùng nhớ xác định t−ơng ứng với ch−ơng trình đó. Một ch−ơng trình chỉ có thể làm việc trong giới hạn của vùng bộ nhớ trong đang chứa nó: ch−ơng trình đó tồn tại trong vùng bộ nhớ t−ơng ứng trong suốt thời gian nó đ−ợc thực hiện trong máy tính, kể từ lúc bắt đầu cho tới lúc kết thúc. - 6-
  7. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) MVT: Multiprogramming with Variable number of Tasks Khác với chế độ MFT, trong chế độ MVT, bộ nhớ trong không bị chia sẵn thành các vùng, việc nạp ch−ơng trình mới vào bộ nhớ trong còn đ−ợc tiếp diễn khi mà bộ nhớ trong còn đủ để chứa thêm ch−ơng trình. Có thể quan niệm rằng trong chế độ MFT bộ nhớ trong đ−ợc phân thành các vùng có vách ngăn cố định, còn trong chế độ MVT, không có vách ngăn sẵn, mỗi khi ch−ơng trình đ−ợc nạp vào mới hình thành một vách ngăn tạm thời. Nếu chỉ gặp các ch−ơng trình đòi hỏi ít bộ nhớ thì theo chế độ MVT, số l−ợng ch−ơng trình đồng thời có mặt trong bộ nhớ nhiều lên. • Chế độ phân chia thời gian (Time Shared System: TSS) Chế độ phân chia thời gian là chế độ hoạt động điển hình của các HĐH đa ng−ời dùng (multi-users). HĐH hoạt động theo chế độ này định h−ớng phục vụ trực tiếp ng−ời dùng khi ch−ơng trình của ng−ời dùng đó đang thực hiện, làm cho giao tiếp của ng−ời dùng với máy tính là hết sức thân thiện. Liên quan đến HĐH hoạt động theo chế độ này là các khái niệm l−ợng tử thời gian, bộ nhớ ảo v.v. Trong hệ TSS, tại cùng thời điểm có nhiều ng−ời dùng đồng thời làm việc với máy tính: Mỗi ng−ời làm việc với máy tính thông qua một trạm cuối (terminal) và vì vậy, hệ thống đã cho phép máy tính thân thiện với ng−ời dùng. Khác với cách thức điều khiển CPU trong chế độ mẻ, HĐH phân phối CPU lần l−ợt cho từng ch−ơng trình ng−ời dùng, mỗi ch−ơng trình đ−ợc chiếm giữ CPU trong một khoảng thời gian nh− nhau (khoảng thời gian đó đ−ợc gọi là l−ợng tử thời gian: time quantum): có thể thấy phổ biến về l−ợng tử thời gian điển hình là khoảng 0,05s. Máy tính làm việc với tốc độ cao, chu kỳ quay lại phục vụ cho từng ch−ơng trình ng−ời dùng là rất nhanh so với giác quan của ng−ời dùng, và vì vậy, mỗi ng−ời dùng đều có cảm giác rằng mình đang chiếm hữu toàn bộ tài nguyên hệ thống. Điều khiển bộ nhớ trong của chế độ đa ng−ời dùng có nhiều khác biệt bản chất so với chế độ mẻ. Bộ nhớ trong luôn chứa ch−ơng trình của mọi ng−ời dùng, vì vậy xảy ra tình huống toàn bộ bộ nhớ trong không đủ để chứa tất cả ch−ơng trình ng−ời dùng hiện đang thực hiện; vì vậy, đối với HĐH TSS nảy sinh giải pháp sử dụng bộ nhớ ảo: sử dụng đĩa từ nh− vùng mở rộng không gian nhớ của bộ nhớ trong. HĐH UNIX (và Linux) là HĐH đa ng−ời dùng điển hình. Có thể nhận xét rằng, tính quản trị tài nguyên đ−ợc nhấn mạnh trong HĐH mẻ và tính chất máy tính ảo đã đ−ợc quan tâm hơn trong HĐH đa ng−ời dùng. c. Hệ điều hành thời gian thực Nhiều bài toán trong lĩnh vực điều khiển cần đ−ợc giải quyết không muộn hơn một thời điểm nhất định, và vì vậy, đối với các máy tính trong lĩnh vực đó cần HĐH thời gian thực (RT: Real Time). Trong hệ thời gian thực, mỗi bài toán đ−ợc gắn với một thời điểm tới hạn (tiếng Anh là deadtime) và bài toán phải đ−ợc giải quyết không muộn hơn thời điểm đã cho đó: Nếu bài toán hoàn thiện muộn hơn thời điểm đó thì việc giải quyết nó trở nên không còn ý nghĩa nữa. Hệ thời gian thực có thể đ−ợc coi nh− một tr−ờng hợp của hệ đa ch−ơng trình hoạt động theo chế độ mẻ có gắn thêm thời điểm kết thúc cho mỗi bài toán. d. Hệ điều hành kết hợp Các nhà thiết kế HĐH hiện đại cũng chọn lựa việc thiết kế HĐH có khả năng khởi tạo hoạt động đ−ợc theo một trong một số chế độ hoạt động của HĐH đã nói trên đây. Chẳng hạn, HĐH OS cho hệ thống máy EC hoặc IBM có thể hoạt động hoặc theo chế - 7-
  8. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) độ mẻ (MFT, MVT) hoặc theo chế độ phân chia thời gian (SYS); hoặc HĐH LINUX hoạt động theo chế độ đơn ng−ời dùng (với superuser) hoặc chế độ đa ng−ời dùng (với các ng−ời dùng khác). Kiểu hệ điều hành nh− vậy đ−ợc quan niệm là kết hợp nội dung của nhiều loại hệ điều hành (Combination Operating System). e. Hệ thống đa xử lý Hệ thống nhiều CPU Hiện nay, từ tốc độ phát triển nhanh của công nghệ, máy tính ngày càng đ−ợc phổ dụng trong xã hội. Mức độ thâm nhập của máy tính vào cuộc sống càng cao thì yêu cầu nâng cao năng lực của máy tính lại ngày càng trở nên cấp thiết. Bộ nhớ chính ngày càng rộng lớn; đĩa từ có dung l−ợng càng rộng, tốc độ truy nhập ngày càng cao; hệ thống thiết bị ngoại vi càng phong phú, hình thức giao tiếp ng−ời-máy ngày càng đa dạng. Nh− đã nói, CPU là một tài nguyên thể hiện chủ yếu nhất năng lực của hệ thống máy tính, vì vậy một trong những vấn đề trọng tâm nhất để tăng c−ờng năng lực của hệ thống là tăng c−ờng năng lực của CPU. Đối với vấn đề này, nảy sinh các giải pháp theo hai h−ớng: Giải pháp tăng c−ờng năng lực của một CPU riêng cho từng máy tính: công nghệ vi mạch ngày càng phát triển vì vậy năng lực của từng CPU cũng ngày nâng cao, các dự án vi mạch VLSI với hàng triệu, hàng chục tiệu transitor đ−ợc triển khai. Tuy nhiên giải pháp này cũng nảy sinh những hạn chế về kỹ thuật: tốc độ truyền thông tin không v−ợt qua tốc độ ánh sáng; khoảng cách gần nhất giữa hai thành phần không thể giảm thiểu quá nhỏ v.v. Song song với giải pháp tăng c−ờng năng lực từng CPU là giải pháp liên kết nhiều CPU để tạo ra một hệ thống chung có năng lực đáng kể: việc xử lý song song tạo ra nhiều lợi điểm. Thứ nhất, chia các phần nhỏ công việc cho mỗi CPU đảm nhận, năng suất tăng không chỉ theo tỷ lệ thuận với một hệ số nhân mà còn cao hơn do không mất thời gian phải thực hiện những công việc trung gian. Thứ hai, giải pháp này còn có lợi điểm tích hợp các hệ thống máy đã có để tạo ra một hệ thống mới với sức mạnh tăng gấp bội. Chúng ta khảo sát một số nội dung chọn giải pháp đa xử lý theo nghĩa một hệ thống tính toán đ−ợc tổ hợp không chỉ một CPU mà nhiều CPU trong một máy tính (hệ đa xử lý tập trung) hoặc nhiều máy tính trong một hệ thống thống nhất. Gọi chung các hệ có nhiều CPU nh− vậy là hệ đa xử lý. Phân loại các hệ đa xử lý Có một số cách phân loại các hệ đa xử lý: • Phân loại theo vị trí đặt các CPU: tập trung hoặc phân tán. Các siêu máy tính (supercomputer) là các ví dụ về hệ đa xử lý tập trung. Đặc tr−ng của hệ thống này là các CPU đ−ợc liên kết với nhau trong một máy tính duy nhất đảm bảo độ kết dính phần cứng chặt. Ví dụ về hệ đa xử lý phân tán là các hệ thống tính toán phân tán dựa trên mạng máy tính với độ kết dính phần cứng lỏng. • Phân loại theo đặc tính của các CPU thành phần: hệ đa xử lý thuần nhất hoặc hệ đa xử lý không thuần nhất v.v. Một ví dụ quen thuộc về hệ không thuần nhất là thiết bị xử lý trong máy vi tính gồm CPU xử lý chung và CPU xử lý dấu phảy động. Siêu máy tính ILLIAC-IV gồm nhiều CPU có đặc tr−ng giống nhau là một ví dụ về hệ thuần nhất. • Cách phân loại điển hình là dựa theo kiểu các CPU thành phần tiếp nhận và xử lý dữ liệu trong một nhịp làm việc. Cách phân loại này bao gồm cả máy tính đơn xử lý thông th−ờng: - 8-
  9. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) - Đơn chỉ thị, đơn dữ liệu (SISD: Single Data Single Instruction) đ−ợc thể hiện trong máy tính thông th−ờng; Mỗi lần làm việc, CPU chỉ xử lý “một dữ liệu” và chỉ có một chỉ thị (instruction, câu lệnh) đ−ợc thực hiện. Đây là máy tính đơn xử lý. - Đơn chỉ thị, đa dữ liệu (SIMD: Single Instruction Multiple Data): Các bộ xử lý trong cùng một nhịp làm việc thực hiện chỉ cùng một chỉ thị. Ví dụ nh− phép cộng hai vector cho tr−ớc: Các CPU thành phần đều thực hiện các phép cộng theo đối số t−ơng ứng tại mỗi CPU; sau đó, chọn tiếp chỉ thị mới để tiếp tục công việc. Thông th−ờng, hệ thống có bộ phận điều khiển riêng cho việc chọn chỉ thị và mọi CPU thành phần cùng thực hiện chỉ thị đó (bộ xử lý ma trận). - Đa chỉ thị, đơn dữ liệu (MISD: Multiple Instruction Single Data): Trong các máy tính thuộc loại này, hệ thống gồm nhiều CPU, các CPU liên kết nhau tuần tự: output của CPU này là input của CPU tiếp theo (Bộ xử lý vector). Các CPU kết nối theo kiểu này đ−ợc gọi là kết nối “dây chuyền”. - Đa chỉ thị, đa câu lệnh (MIMD): Mỗi CPU có bộ phân tích ch−ơng trình riêng; chỉ thị và dữ liệu gắn với mỗi CPU: nhịp hoạt động của các CPU này hoàn toàn “độc lập nhau”. 1.2.1. Cấu trúc hệ điều hành truyền thống Các ứng dụng Kế toán Văn phòng Sản xuất Các hệ thống Môi tr−ờng lập trình Hệ thống cơ sở dữ liệu con Các tiện ích Bộ biên dịch Thông dịch lệnh Th− viện Các dịch vụ hệ Hệ thống File Quản lý bộ nhớ Bộ lập lịch thống CPU đa thành phần, kiểm soát ngắt, điều khiển thiết bị, đồng bộ Nhân nguyên thủy, truyền thông liên quá trình Hình 1.4 Phân mức các thành phần hệ điều hành theo chiều dọc và chiều ngang HĐH là bộ phần mềm lớn có kích th−ớc từ hàng nghìn tới hàng triệu dòng mã lệnh, cho nên khi thi hành cần thiết phải kiến trúc phần mềm HĐH từ các môđun dễ dàng quản lý (phù hợp với ph−ơng pháp chung phát triển phần mềm). Kỳ vọng một kết quả thiết kế là cung cấp các giao diện đ−ợc xác định t−ờng minh giữa các môđun và cách đặt các ràng buộc cho t−ơng tác môđun. Hai cách tiếp cận truyền thống thông dụng phân hoạch các môđun là phân hoạch ngang và phân hoạch dọc. Phân hoạch dọc dựa trên khái niệm mức, theo đó phân chia các môđun thành nhóm theo các mức khác nhau với ràng buộc là chỉ cho phép t−ơng tác giữa các môđun thuộc hai mức liền kề. Đây là giao diện một vào - một ra giữa các mức. Các môđun trong từng mức (phân hoạch ngang) lại đ−ợc tổ chức thành các thành phần lớn rời rạc nhau, mỗi thành phần nh− thế lại có thể đ−ợc tinh chế tiếp theo tổ hợp phân hoạch ngang hoặc dọc (hình 1.4). Kiểu điển hình của môđun là tập dòng lệnh thi hành một dịch vụ hệ thống riêng biệt. Trong một hệ thống h−ớng đối t−ợng, các môđun cần đ−ợc thi hành nh− một đối t−ợng với các thao tác (hoàn toàn xác định) trên mỗi đối t−ợng dịch vụ thành phần. Môđun hóa dựa trên đối t−ợng là tốt hơn so với mã hóa. Mọi tài nguyên, bao gồm cả file và QT, cần đ−ợc tiếp cận nh− đối t−ợng dữ liệu mà thể hiện vật lý của chúng phải đ−ợc che giấu bằng các cấu trúc dữ liệu trừu t−ợng. Hoạt động (thực hiện) của môđun đ−ợc giới - 9-
  10. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) hạn bằng một tập các thao tác và luật hình thức gán cho đối t−ợng. Môđun h−ớng đối t−ợng cung cấp hàng loạt lợi thế, trong đó có tính đồng nhất truy nhập và bảo vệ. Vì đồng nhất, chúng dễ dàng biến đổi và do đó làm tăng tính khả chuyển của hệ thống. Tính khả chuyển của HĐH còn tăng lên khi tách các mã phụ thuộc-máy từ hệ thống. Đa phần các phần mềm HĐH (các dịch vụ hệ thống) là độc lập phần cứng. Từ đó, hệ thống cần đ−ợc cấu trúc theo cách mà phần phụ thuộc-máy đ−ợc giữ ở mức tối thiểu nhất và tách rời khỏi các dịch vụ hệ thống. Cách tiếp cận nhân tối thiểu này làm giảm bớt độ phức tạp về tính khả chuyển hệ thống từ kiểu kiến trúc máy tính này sang kiểu kiến trúc máy tính khác vì chỉ có nhân mới phải viết lại. Các chức năng điển hình đ−ợc thi hành trong nhân tối thiểu bao gồm: tính đa thành phần của các bộ xử lý với hỗ trợ đa ch−ơng trình, kiểm soát ngắt, điều khiển thiết bị, (dịch vụ) nguyên thuỷ đồng bộ QT (ĐBQT), các ph−ơng tiện truyền thông liên QT (TTLQT, tiếng Anh Interprocess Communication, IPC). Cấu trúc nhân th−ờng nguyên khối theo nghĩa không còn phân hoạch ngang hoặc dọc đ−ợc nữa mà chỉ là môđun hóa theo mã. Cấu trúc này đạt đ−ợc do nhân đã đ−ợc tối thiểu nhất. Triết lý thiết kế này là hiệu quả cho phép chú ý tới cách liên kết nhân hơn là cấu trúc nhân. Hình 1.4 thể hiện các khái niệm môđun hóa và cấu trúc hóa với một số thành phần trong mỗi mức của phần mềm hệ thống. Cấu trúc HĐH đ−ợc nâng cao theo mô hình Client/Server. Mô hình Client/Server là một mô hình lập trình khuôn mẫu. Theo mô hình này, lời gọi hệ thống từ các ch−ơng trình ứng dụng yêu cầu các dịch vụ HĐH giống nh− yêu cầu QT khách trực tiếp tới QT phục vụ. Chúng đ−ợc thi hành gián tiếp thông qua nhân HĐH. Lời gọi hệ thống chia xẻ một lối vào nhất quán tới hệ thống. Cơ chế này làm đơn giản hóa t−ơng tác tới HĐH và cho phép ng−ời thiết kế hệ thống chuyển thêm nhiều dịch vụ hệ thống tới mức cao hơn (trong nhiều tr−ờng hợp tới không gian QT ng−ời dùng) và kết quả đ−ợc nhân nhỏ hơn và dễ quản lý hơn. Mô hình Client/Server là cách tự nhiên mô tả các t−ơng tác giữa các QT trong hệ phân tán trong khi chuyển thông điệp (một khái niệm quan trọng) chỉ có nghĩa chuyển vận dữ liệu trong các thực thể truyền thông. Sự phân biệt giữa ch−ơng trình ứng dụng với ch−ơng trình hệ thống th−ờng mơ hồ. Ch−ơng trình trong nhân và dịch vụ hệ thống là phần mềm hệ thống (xem hình 1.4). Tuy nhiên, theo một quan niệm khác (nh− đã đ−ợc trình bày trong hình 1.3), ch−ơng trình hệ thống còn bao gồm cả trình biên dịch, trình soạn thảo hệ thống, trình thông dịch [3]. Chính bởi lý do đó mà ng−ời viết trình biên dịch cũng tự coi họ là những ng−ời lập trình hệ thống. Tuy nhiên, trình biên dịch theo quan điểm của HĐH đ−ợc xem là một ứng dụng. Mặt khác, phần mềm cơ sở dữ liệu là một ứng dụng đối với trình biên dịch hoặc một ngôn ngữ, đến l−ợt mình nó lại là ch−ơng trình hệ thống đối với ứng dụng 1 ứng dụng 1 ứngdụng Các ứng dụng API Tính mở rộng Các dịch vụ hệ thống SPI (hoặc HAL) Tính dễ chuyển Mã máy 1 Mã máy 2 Mã máy Nền Hình 1.5. Các mức API và SPI - 10-
  11. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) ng−ời dùng. Kiến trúc này có thể phát triển thêm một vài mức. Ng−ời dùng nhìn hệ thống qua một hệ thống con đ−ợc đặc tr−ng bằng các dịch vụ cung cấp cho họ. Mối quan hệ giữa ch−ơng trình hệ thống và ch−ơng trình ứng dụng là gần gũi. 1.2.2. Hệ thống con và vi nhân Nhân tối thiểu vạn năng mà dựa trên nó, các dịch vụ HĐH chuẩn đ−ợc thi hành nhằm hỗ trợ các hệ thống con h−ớng ứng dụng đ−ợc gọi là vi nhân. Kiến trúc vi nhân bao gồm một nhân tối thiểu phụ thuộc nền phần cứng và một tập các thi hành độc lập phần cứng (dịch vụ hệ thống) bằng Bộ giao diện trình ứng dụng (API: Application Program Interface) hoàn toàn xác định. Điều ý nghĩa của khái niệm vi nhân ở chỗ nó cung cấp một môi tr−ờng chứa các điều kiện cần và đủ để cấu trúc HĐH hoặc hệ thống con đáp ứng nhu cầu bất kỳ với ít công sức nhất. Nhân, mặc dù phụ thuộc phần cứng, nh−ng đ−ợc cấu trúc với độ trừu t−ợng phần cứng để dễ dàng đ−ợc ghi lại mã máy khi đ−ợc mang chuyển tới một nền khác. Cấu trúc bổ sung này đ−ợc gọi là Mức trừu t−ợng phần cứng (HAL: Hardware Abstraction Layer) hoặc Giao diện cung cấp dịch vụ (SPI: Service Provider Interface) khi đ−ợc sử dụng trong mô đun phần mềm mức trên. Nh− trình bày tại hình 1.5 thì API cung cấp tính mở rộng cho các ứng dụng mức cao còn SPI (hoặc HAL) đề cao tính khả chuyển cho nền tảng mức thấp. Khách OS/2 Khách Win Khách POSIX Mode Hệ thống con Hệ thống con Hệ thống con ng−ời OS/2 Win 32 POSIX dùng Mode nhân API dịch vụ hệ thống Quản lý Giám sát Quản lý Lời gọi Quản lý Quản lý Các đối t−ợng an toàn quá trình thủ tục bộ nhớ ảo vào ra chấp hành cục bộ Nhân với sự trừu t−ợng phần cứng Nền phần cứng Hình 1.6. Kiến trúc hệ thống Windows NT Các dịch vụ hệ thống là đồng hạng môđun và đầy đủ vì vậy chúng đ−ợc dùng nh− một cơ chế để hỗ trợ lớp rộng lớn các ứng dụng. Ng−ời thiết kế phần mềm chỉ cần biết các giao diện chuẩn tới các môđun dịch vụ thi hành và có thể chọn một tập con của chúng theo đòi hỏi. Kiến trúc nh− vậy rất thuyết phục vì tính môđun hóa, dễ mang chuyển và khả năng tiếp thị (môđun thi hành có thể thuộc bản quyền của nhà cung cấp hệ thống khác). Ngành công nghiệp đã có một vài cố gắng h−ớng tới một kiến trúc vi nhân chung, đáng kể nhất là Microkernel của IBM và Windows NT của Microsoft. Windows NT đ−ợc trình bày trong hình 1.6 nh− một ví dụ của kiến trúc vi nhân, trong kiến trúc này mỗi khách thấy máy tính theo một môi tr−ờng tính toán khác nhau (OS/2, Win32, POSIX) đ−ợc biểu diễn bởi API trong hệ thống con. Mỗi hệ thống con có không gian địa chỉ lôgic riêng của mình, có thể đ−ợc cô lập và bảo vệ đối với các hệ thống con khác. Lời gọi hệ thống con dựa trên API dịch vụ hệ thống và nh− vậy đ−ợc thi hành một cách độc lập với việc thực hiện tại mức nhân và mức phần cứng. Nh− một - 11-
  12. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) chọn lựa, hệ thống con có thể t−ơng tác gián tiếp với dịch vụ hệ thống qua hệ thống con Win32, hệ này hỗ trợ ph−ơng tiện lập trình window. Kiến trúc tại hình vẽ đạt đ−ợc mọi khái niệm kiến trúc hệ thống nh− đã thảo luận: môđun hóa, phân mức, mô hình Client/Server, mô hình đối t−ợng, và nhân tối thiểu. Hầu hết các HĐH hện đại theo đuổi triết lý thiết kế nh− vậy với một vài khác biệt nhỏ khi thi hành. 1.2.3. Các chức năng quản trị HĐH có chức năng quản trị tài nguyên. Mỗi tài nguyên trong hệ thống máy tính nói chung thuộc vào một trong bốn lớp: Bộ xử lý/quá trình, bộ nhớ, I/O và dữ liệu/file. Mô tả một cách tóm tắt các vấn đề cơ sở của HĐH truyền thống. Tóm tắt này nh− là những thông tin nền tảng cho thảo luận HĐH mạng, HĐH phân tán và hệ tự trị cộng tác. • Quản trị Bộ xử lý/Quá trình ở mức hệ thống thấp nhất là cung cấp ánh xạ (lập lịch: scheduling) các bộ xử lý tới các QT, hoặc ng−ợc lại. Để thuận tiện cho việc mở rộng đa ng−ời dùng và đa bài toán (đa nhiệm), cần tới tính đa thành phần-không gian bộ nhớ (nơi đặt QT) và tính đa thành phần-thời gian các bộ xử lý (nơi QT thực hiện). Thi hành tính đa thành phần nh− vậy thông qua tính đa ch−ơng trình và phân chia thời gian đ−ợc cơ chế kiểm soát ngắt đầy đủ hỗ trợ. Tại mức cao, việc thi hành là trong suốt tới các QT thực hiện đồng thời. Ng−ời dùng chỉ quan tâm tới việc phối hợp t−ơng tác các QT đồng thời. Các t−ơng tác đòi hỏi ĐBQT và TTLQT. Trong hơn hai chục năm trở lại đây, hàng loạt ph−ơng pháp ĐBQT đ−ợc đề xuất nhằm giải quyết bài toán đồng bộ nhờ loại trừ ràng buộc và kết hợp trạng thái. Hầu hết các tiếp cận cơ sở dùng lời gọi hệ thống đặc biệt thao tác trên các biến kiểu dữ liệu semaphore. Do đ−ợc hệ thống hỗ trợ khả năng kết khối QT, các thao tác nguyên tử trên semaphore (yêu cầu tài nguyên P(s) / giải phóng tài nguyên V(s)) cho phép phối hợp các QT t−ơng tác. Các tiếp cận khác (không dùng semaphore) gắn năng lực đồng bộ vào ngôn ngữ lập trình nhờ hoặc là biến dạng cấu trúc điều khiển (chẳng hạn, khoảng tới hạn có điều kiện - Condition Critical Region, ghi tắt CCR. Khái niệm cơ sở là khoảng tới hạn - Critical Region, ghi tắt là CR) hoặc là bổ sung kiểu dữ liệu trừu t−ợng mới (chẳng hạn, bộ giám sát - monitor). Ngoài ra, một cách thức ĐBQT khác dựa theo cách lệnh vào-ra, chẳng hạn Bộ các quá trình tuần tự truyền thông (Communicating Sequential Processes: CSP). Đây là cách tiếp cận tổng quát hơn theo kiểu lời gọi thủ tục và dẫn dắt điểm hẹn (rendezvous) trong ngôn ngữ lập trình Ada. Tiến thêm một b−ớc mới, cho phép đặc tả dãy các điều khiển thực hiện đồng thời trong một ch−ơng trình mà không cần dùng các nguyên thủy đồng bộ một cách t−ờng minh, nh− đ−ợc thi hành trong biểu thức đ−ờng đi (Path Expression: PE). Ng−ời ta chỉ ra rằng, mọi tiếp cận đ−ợc đề xuất cho bài toán đồng bộ có thể đ−ợc thi hành với sự thỏa hiệp giữa hiệu quả và năng lực diễn tả lời giải bài toán. Các ph−ơng pháp đồng bộ truyền thống sẽ đ−ợc mô tả sơ l−ợc tại ch−ơng 3). Các ph−ơng tiện TTLQT đ−ợc phát triển song hành với ĐBQT. Trong HĐH tập trung, TTLQT xuyên qua chia xẻ bộ nhớ d−ờng nh− là giải pháp dễ dàng. Tuy nhiên, chia xẻ bộ nhớ vi phạm giả thiết cơ bản là các QT không đồng bộ và nhìn chung là không chia xẻ không gian địa chỉ chung. Lựa chọn còn lại là truyền thông thông qua chuyển thông điệp (ghi tắt CTĐ, message passing). −u điểm của CTĐ do nó là một phần bản chất của hệ phân tán và nh− vậy có thể đ−a việc phát triển HĐH tập trung thích hợp với việc phát triển hệ phân tán. Điều rất có giá trị chính là mối quan hệ thân thiết giữa ĐBQT và truyền thông QT (TTQT). TTQT đòi hỏi một số giả thiết nền tảng từ ĐBQT, chẳng hạn nh− đồng bộ gửi và nhận dữ liệu. Với các dịch vụ nguyên thủy của truyền thông QT, cấu trúc đồng bộ mức cao có thể đ−ợc thi hành chỉ dựa trên các TTQT nguyên thủy. Khởi đầu từ nguyên - 12-
  13. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) thủy đồng bộ và truyền thông cũng dẫn đến việc phát triển ngôn ngữ đồng thời: các ngôn ngữ cho phép đặc tả đ−ợc QT đồng thời, đồng bộ và TTLQT. Ngôn ngữ đồng thời và đồng bộ/truyền thông trong hệ phân tán đ−ợc bàn luận t−ơng ứng trong ch−ơng 3 và ch−ơng 4. Cùng với ĐBQT và TTQT, quản trị QT còn có chức năng lập lịch. Quá trình đang sẵn sàng (ready) hoặc ở dòng xếp hàng (waiting sequence) cần đ−ợc lập lịch lại để thực hiện khi tài nguyên đã sẵn sàng hoặc điều kiện nào đó đ−ợc thỏa mãn. Rất nhiều chiến l−ợc đ−ợc dùng nhằm đạt đ−ợc hàm mục tiêu, chẳng hạn tối thiểu thời gian chuyển lịch hoặc tối đa thông l−ợng hệ thống (system throughput). Lập lịch bài toán (task, hoặc quá trình - process) cho máy đơn-đa xử lý là một vấn đề nghiên cứu thao tác cổ điển. ứng dụng lập lịch bài toán vào hệ phân tán là phức tạp do tồn tại đa máy tính và tổng phí (overhead) truyền thông buộc phải tính đến trong lập lịch. Tồn tại hai kiểu lập lịch: Lập lịch QT tĩnh dựa trên mô hình quan hệ đi tr−ớc và chia xẻ tải động quá trình dựa trên mô hình quan hệ phụ thuộc quá trình. Quan hệ đi tr−ớc biểu diễn các QT buộc phải đồng bộ nh− thế nào, trong khi đó quan hệ phụ thuộc chỉ cho biết dấu hiệu t−ơng tác giữa các QT. Hai kiểu lập lịch này biểu diễn độ hiểu biết khác nhau về mối t−ơng tác giữa các QT trong đồng bộ và truyền thông. Lập lịch tĩnh, chia xẻ động và cân bằng tải đ−ợc trình bày trong ch−ơng 5. • Quản trị thiết bị vào - ra là trách nhiệm chặt chẽ của hệ thống các thiết bị gắn kết vật lý. Nhằm giảm bớt độ phức tạp khi thiết kế hệ thống theo tính phụ thuộc máy, kiến trúc hệ thống của bộ xử lý th−ờng đ−ợc tách hoàn toàn khỏi tính chi tiết thiết bị vào-ra. Bộ xử lý cung cấp một giao diện chung tới tất cả thiết bị và căn cứ theo giao diện chung đó, nhà chế tạo thiết bị vào-ra phát triển thiết bi điều khiển thiết bị vào-ra và trình điều khiển phần mềm để tích hợp vào hệ thống. Theo h−ớng trừu t−ợng, các thiết bị vào-ra chỉ là bộ ghi nhớ: Một số cho phép đọc và ghi (chẳng hạn, đĩa từ), một số khác chỉ cho phép đọc (chẳng hạn, bàn phím) và một số khác nữa chỉ cho phép ghi (chẳng hạn, máy in). Theo quan điểm của HĐH, thích hợp nhất coi tất cả thiết bị vào- ra là file lôgic. File lôgic biểu diễn thiết bị vật lý đ−ợc gọi là thiết bị ảo. Các QT chỉ thao tác trên các file và hệ thống chịu trách nhiệm diễn giải file này tới thiết bị vật lý. Ng−ời ta sử dụng một số kỹ thuật nhằm tăng tốc thao tác vào-ra, đáng kể nhất là hai khái niệm spooling và buffering. Spooling (nh− đã đ−ợc giới thiệu tại trang 10) làm thuận tiện chia xẻ các thiết bị vào - ra, còn buffer (bộ đệm) căn bản đ−ợc dùng để dàn xếp sự khác nhau về tốc độ làm việc giữa thiết bị vào-ra chậm và bộ xử lý nhanh. Buffer có thể đ−ợc thi hành ở nhiều mức phần mềm khác nhau, chẳng hạn nh− hệ thống file, trình điều khiển thiết bị, và trong một số tr−ờng hợp ở ngay trong thiết bị điều khiển vào-ra. Hai thiết bị vào - ra quan trọng nhất là ổ đĩa và trạm cuối. Đĩa tốc độ cao và dung l−ợng rộng (vài trăm gigabytes) là rất thông dụng. Đĩa dung l−ợng cao đóng vai trò đáng kể trong việc thiết kế phần mềm lớn. Trạm cuối bản đồ - bộ nhớ tạo nên sự thi hành việc hỗ trợ các cửa sổ (windows) tại trạm cuối. Cửa sổ đ−ợc khởi hành nh− một bàn giao tiếp ảo (virtual console) đơn giản. Với các chức năng bổ sung nh− một giao diện ng−ời dùng đồ họa và các cửa sổ đa t−ơng tác, windows đ−ợc tiến hóa thành giao diện đang phát triển một cách thăng hoa đối với hệ thống con và sẽ trở thành một máy tính ảo nh− tr−ờng hợp HĐH Windows 95. Một vấn đề đáng quan tâm liên quan tới quản trị vào-ra là bế tắc (deadlock). Bế tắc nảy sinh trong hệ thống do định vị sai tài nguyên khi có một tập QT không −u tiên (nonpreemptable) mà mỗi từ chúng giữ tài nguyên lại đòi hỏi tài nguyên từ QT trong tập đó, tạo ra một chu trình xâu QT không thể tháo rời. "Tài nguyên" có thể là thiết bị vật lý và (chung hơn) là các buffer và các điều kiện. Việc phòng ngừa, thoát ra, và phát - 13-
  14. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) hiện bế tắc đã đ−ợc nghiên cứu rộng rãi. Tuy nhiên, phát hiện và giải quyết bế tắc phân tán hiện vẫn đang là vấn đề mở. • Quản lý bộ nhớ bao gồm việc phân phối - phân phối lại bộ nhớ và ánh xạ không gian ch−ơng trình lôgic vào bộ nhớ vật lý. Mục tiêu căn bản là bảo đảm tận dụng cao bộ nhớ và cung cấp bộ nhớ ảo hỗ trợ ch−ơng trình lớn, đặc biệt là các ch−ơng trình có kích th−ớc v−ợt kích th−ớc bộ nhớ vật lý. Hầu hết hệ thống máy tính hiện nay đều sử dụng các kỹ thuật điều khiển trang (paging)/ điều khiển segment (segmentation) khi thi hành bộ nhớ ảo. Thi hành bộ nhớ ảo đòi hỏi phần cứng bổ sung, th−ờng đ−ợc gọi là đơn vị quản lý bộ nhớ (memory managment unit). Cả trang và segment đều là các cơ chế phân phối bộ nhớ rời rạc. Sự khác nhau chính giữa hai cơ chế này phân ch−ơng trình theo trang vật lý và theo segment logic. HĐH hiện đại thi hành bộ nhớ ảo theo cơ chế tổ hợp hai cơ chế này. Do không phải tất cả các trang và segment đồng thời nằm trong bộ nhớ trong, nên cần điều tiết những chỉ dẫn tới dữ liệu và chỉ thị (lệnh) mới khi thực hiện một ch−ơng trình. Nhiều thuật toán thay trang đ−ợc đề xuất nhằm rút gọn tần số lỗi trang. Hiệu suất của chiến l−ợc thay trang phụ thuộc mạnh vào cách thực hiện ch−ơng trình tại khoảng thời gian đã cho bất kỳ. Định h−ớng không gian và thời gian đ−ợc mô tả tổng quát trong ch−ơng trình có ảnh h−ởng đáng kể khi chọn thuật toán thay trang. Bộ nhớ ảo là giải pháp nhằm giải quyết sự khác nhau về kích th−ớc và tốc độ giữa bộ nhớ đĩa chậm t−ơng đối và bộ nhớ vật lý nhanh hơn. Tồn tại vấn đề t−ơng tự khi bộ nhớ tốc độ cao (cache) đ−ợc dùng nh− bộ đệm giữa bộ xử lý và bộ nhớ chính. Quá trình buffer này chỉ đòi hỏi phải ánh xạ địa chỉ vật lý (đ−ợc gọi là caching) mà thông th−ờng đ−ợc quan tâm theo h−ớng kiến trúc hơn là vấn đề của HĐH. Chọn lựa thuật toán thay trang, ảnh h−ởng của cỡ trang và segment, ảnh h−ởng của phân phối bộ nhớ, caching và liên kết cache là một số vấn đề của quản trị bộ nhớ. Trong HĐH tập trung, bộ nhớ chia xẻ cho giá trị là tính đơn giản đối với truyền thông và t−ơng tác QT. Nhiều thuật toán đ−ợc phát triển cho bộ nhớ chia xẻ. Trong môi tr−ờng phân tán, hy vọng mô phỏng đ−ợc hệ thống bộ nhớ chia xẻ trong khi không có bộ nhớ vật lý chia xẻ. Khái niệm bộ nhớ phân tán này đ−a ra một số câu hỏi về tính nhất quán và hiệu năng của chia xẻ dữ liệu là t−ơng tự nh− chia xẻ file trong hệ thống file phân tán. Ch−ơng 6 trình bày về hệ thống file phân tán. • Cuối cùng, song không kém quan trọng, là quản trị file trong HĐH. File là một thực thể dữ liệu lôgic đ−ợc thi hành trên các thiết bị nhớ, bao gồm đĩa, bộ nhớ, và thậm chí cả thiết bị vào-ra. Theo nghĩa trừu t−ợng nhất, mọi tính toán đ−ợc xem nh− các quá trình thao tác với file. Nếu bỏ đi hai thuật ngữ cơ bản là quá trình và file, thì không còn có gì nghiên cứu về HĐH. Do chúng ta chỉ giải quyết với quá trình và file, mọi chủ đề tiếp theo đều liên quan đến chúng. Chúng ta không bàn luận nhiều về quản trị vào - ra và quản trị bộ nhớ vì điều đó chỉ thích hợp trong HĐH tập trung. File cần đ−ợc cấu trúc và thi hành tr−ớc khi đ−ợc thao tác. Mỗi khi một cấu trúc file chung và thi hành của chúng đ−ợc quyết định thì các chức năng cơ sở để quản trị file là truy nhập file (file acces) và chia xẻ file. Thêm nữa vì mục tiêu hiệu quả, truy nhập file đòi hỏi cơ chế điều khiển bảo vệ (protection) và an toàn, và chia xẻ file đồng bộ hoặc điều khiển đồng thời. Khác với quản trị bộ nhớ và quản trị vào-ra, file đ−ợc phân tán và nhân bản trên mạng hoặc môi tr−ờng phân tán. An toàn và điều khiển đồng thời file để thao tác file trở thành những vấn đề thiết thực hơn trong thiết kế HĐH phân tán so với HĐH tập trung. ứng dụng caching trong truy nhập file cũng phức tạp hơn, do thực tế file đ−ợc cache trên nhiều máy. Một số ch−ơng, đoạn tiếp thảo luận về thi hành và điều khiển hệ thống file phân tán. - 14-
  15. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) 1.3. Sơ l−ợc về hệ điều hành mạng Hiện nay, máy tính không đ−ợc dùng một cách riêng lẻ và nhiều máy tính đ−ợc kết nối thành một hệ thống tính toán chung; mỗi máy tính đảm nhận một chức năng bộ phận và toàn bộ hệ thống tính toán chung đó có năng lực hơn hẳn việc sử dụng riêng lẻ. Theo tiến trình đó các loại HĐH mạng, HĐH phân tán và HĐH tự trị cộng tác xuất hiện (hình 1.3). So với HĐH tập trung, kết nối phần cứng và phần mềm trong hệ thống máy tính trở nên mềm dẻo hơn, trong một số tr−ờng hợp (nh− HĐH mạng) kết nối đó là lỏng lẻo. HĐH mạng cho phép liên kết nhiều máy tính theo cách không thực sự chặt chẽ: không có sự điều khiển phần cứng hoặc phần mềm trực tiếp từ một trạm làm việc (workstation) tới những trạm làm việc khác tồn tại trong hệ thống, và tổng phí truyền thông giữa các trạm cuối (đo theo thời gian) là lớn hơn rất nhiều so với chuyển giao thông tin nội tại trong mỗi trạm cuối. Mục tiêu căn bản của HĐH mạng là chia xẻ tài nguyên (bao gồm ch−ơng trình và dữ liệu) trong mạng. T−ơng tác duy nhất trong hệ thống là trao đổi thông tin giữa các trạm thông qua một vài dạng kênh truyền thông ngoài. Đặc tr−ng duy nhất, liên thao tác (interoperability) là tính chất mong muốn trong hệ thống máy tính mạng. Liên thao tác cung cấp tính linh hoạt trong trao đổi thông tin dọc theo các trạm trong mạng máy tính hỗn tạp, đây đ−ợc gọi là tính liên tác động. Liên thao tác đ−ợc biểu thị bởi các giao thức truyền thông chuẩn và giao diện chung nhằm chia xẻ CSDL và hệ thống File. Ví dụ về cơ chế hỗ trợ liên thao tác là giao thức truyền thông chuẩn và giao diện chung tới các CSDL (data base) hoặc hệ thống file. Chức năng trao đổi thông tin đ−ợc phân chia và thi hành theo cấu trúc mức. Tại mức phần cứng, mạng con truyền thông chịu trách nhiệm thi hành trao đổi thông tin. Cao hơn, HĐH cung cấp dịch vụ giao vận (transport service) dữ liệu và ng−ời dùng sử dụng các giao thức truyền thông quá trình điểm - điểm (peer to peer) h−ớng ứng dụng. Các mức có thể mịn hơn nh− kiến trúc bảy mức OSI của ISO. HĐH mạng có thể đ−ợc coi là mở rộng trực tiếp HĐH truyền thống, đ−ợc thiết kế nhằm làm thuận tiện chia xẻ tài nguyên và trao đổi thông tin. Do đó, thuận tiện mô tả HĐH mạng thông qua minh họa các ứng dụng mạng chung của nó và các dịch vụ giao vận cần có để hỗ trợ các ứng dụng này. Dịch vụ giao vận phục vụ nh− một giao diện đứng giữa QT ứng dụng mạng và mạng truyền thông vật lý, và nó thi hành giao thức truyền thông giữa hai hệ điều hành điểm. Hình 1.6 cho thấy sự tích hợp các dịch vụ giao vận trong HĐH đối với QT ứng dụng truy nhập hệ thống file từ xa. Ví dụ này đ−ợc mô hình hóa theo Hệ thống file mạng (Network File System: NFS) của Sun. Truy nhập file từ xa dựa trên hệ thống file mạng truyền thông và đ−ợc chuyển dịch bởi hệ thống mạng thành các giao vận dữ liệu giữa các dịch vụ điểm. Hầu hết các HĐH mạng dùng API mức cao chẳng hạn nh− socket và lời gọi thủ tục từ xa (Remote Procedure Call: RPC) đối với dịch vụ giao vận nhằm hỗ trợ truyền thông giữa các HĐH trong các miền mạng khác nhau. HĐH mạng đ−ợc đặc tr−ng bởi tập gồm một mức giao vận và hỗ trợ ứng dụng mạng chạy trên dịch vụ giao vận. Các lớp ứng dụng mạng đáng chú ý là đăng nhập từ xa (remote login), chuyển file (file transfer), thông điệp, duyệt mạng (network browsing) và thực hiện từ xa (remote execution). D−ới đây trình bày sơ l−ợc về chúng. - 15-
  16. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) Quá trình (ứng dụng) Quá trình (ứng dụng) Các giao Dịch vụ file thức truyền Dịch vụ file Hệ thống file Hệ thống file thông điểm Hệ thống file Hệ thống file địa ph−ơng mạng mạng địa ph−ơng Quản trị Dịch vụ Dịch vụ Quản trị thiết bị giao vận giao vận thiết bị Điều khiển Dịch vụ Dịch vụ Điều khiển thiết bị NHÂN mạng mạng NHÂN thiết bị Phần cứng địa ph−ơng Mạng truyền thông Phần cứng địa ph−ơng Hình 1.6. Tích hợp dịch vụ giao vận • Đăng nhập từ xa: là khả năng cho phép trạm riêng của ng−ời dùng thành một trạm cuối đăng nhập vào một trạm làm việc từ xa trong mạng, cho phép chia xẻ trực tiếp CPU và tài nguyên t−ơng ứng của nó. Để đăng nhập từ xa input từ bàn phím đ−ợc chuyển đổi thành các bó dữ liệu của các giao thức truyền thông mạng. Tại điểm đối ngẫu áp dụng tới hiển thị output. Đôi lúc hy vọng mô phỏng rất nhiều kiểu trạm cuối (đ−ợc gọi là mô phỏng trạm cuối). Nh− vậy, việc dàn xếp giữa các tham số trạm cuối là cần thiết tr−ớc khi kết nối đ−ợc thiết lập. Dịch vụ với mở rộng kết hợp này đ−ợc gọi là hỗ trợ trạm cuối ảo. Một ứng dụng mạng đ−ợc sử dụng rộng rãi với mở rộng nh− vậy là telnet, một dịch vụ đăng nhập từ xa đ−ợc thiết kế cho các trạm cuối không đồng bộ (asynchronous: dị bộ). Trong UNIX, rlogin là dịch vụ t−ơng tự ngoại trừ nó không hỗ trợ mô phỏng trạm cuối. Thêm vào, rlogin giả thiết rằng host từ xa trong cùng một miền đồng nhất, và việc xác minh mật khẩu không phải là một lựa chọn ngầm định. • Truyền file: là năng lực truyền file hoặc mang chuyển file dọc theo các trạm làm việc khác nhau trong một hệ thống mạng. Truyền file không đơn thuần một trao đổi dữ liệu. File chứa dữ liẹu, cấu trúc file và cả các thuộc tính file. Nh− vậy, một giao thức truyền file (chẳng hạn, fpt trong UNIX) bắt buộc cung cấp một giao diện tới các hệ thống file địa ph−ơng và hỗ trợ các lệnh t−ơng tác của ng−ời dùng. Thông tin về thuộc tính file, khuôn dạng dữ liệu, dòng dữ liệu, và điều khiển truy nhập bắt buộc phải đ−ợc trao đổi và có giá trị nh− một phần của thao tác truyền file. Nhân bản file từ xa (rcp) trong UNIX là một dịch vụ truyền file có hạn chế bằng việc sao các fioe giữa các trạm làm việc, khi giả thiết rằng cấu trúc file UNIX là nh− nhau trong miền mạng (tức là HĐH tại các nút là đồng nhất). • Hệ thống thông điệp cho phép ng−ời sử dụng mạng gửi và nhận tài liệu hoặc thông điệp mà không cần tạo ra một kết nối thời gian thực. Hai ứng dụng thông điệp chính là Chuyển đổi dữ liệu điện tử (Electronic Data Interchange: EDI) đói với các giao dịch (transaction) kinh doanh và th− điện tử (e-mail). EDI là ứng dụng chuẩn mà nguyên tắc chủ đạo là truyền thông tin kinh doanh. E-mail là thông điệp cho phép trao đổi thông điệp giữa các ng−ời dùng mạng. Khác với truyền File, hệ thống mail là không thông dịch ngoại trừ những thông điệp chung đ−ợc gắn vào trong mail (hiện nay, điều này không hoàn toàn do một số hệ thống mail có chức năng thực hiện từ xa). Thuộc tính cấu trúc và điều khiển truy nhập của dữ liệu mail không đ−ợc chú ý. Điều căn bản là nắm giữ và truyền thông điệp và giao diện ng−ời dùng thao tác trên thông điệp mail. Rất nhiều chuẩn, chẳng hạn X.400 do CCITT (nay là, ITU-T) và Giao thức truyền mail - 16-
  17. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) đơn giản (Simple Mail Transfer Protocol: SMTP) của Bộ quốc phòng Mỹ, đã đ−ợc đề xuát nhằm thi hành hệ thống mail mạng. Nhiều hệ thống e-mail tinh vi đã đ−ợc xây dựng, để phục vụ nh− bộ chuyển đổi có năng lực truyền thông giữa các hệ thống mail khác nhau. • Duyệt mạng là dịch vụ thông tin để tìm kiếm và trình bày các tài liệu giữa các site mạng thành viên. Trình duyệt th−ờng đ−ợc thi hành nh− là một hệ thống Client/Server trong đó trình duyệt là khách truy nhập đối t−ợng tại phục vụ file từ xa. Hệ thống đ−ợc sử dụng rộng rãi nhất hiện nay là WWW (World Wide Web). WWW là mô hình dữ liệu để liên kết các tài liẹu siêu ph−ơng tiện dùng các chỉ dẫn đ−ợc gọi là Bộ định vị tài nguyên thống nhất (Universal Resource Locator: URL). Tài liệu đ−ợc hiển thị bởi trình duyệt th−ờng là siêu văn bản (hypertext) và có thể chứa nhiều con trỏ tới siêu văn bản khác hoặc siêu ph−ơng tiện khác. Trình duyệt, chăng hạn Mosaic, truyền thông với phục vụ WWW dùng giao thức truyền siêu văn bản (HyperText Transport Protocol: HTTP). Các giao thức khác, chẳng hạn ftp và telnet cũng đ−ợc sử dụng. Tài liệu đa ph−ơng tiện điển hình đ−ợc cấu trúc khi sử dụng Ngôn ngữ đánh dấu văn bản (HyperText Markup Language: HTML) và đ−ợc phân tán nhờ dịch vụ Web. Hiện có nhiều hệ thóng duyệt khác với (cơ sở dữ liệu) tài nguyên phân tán lớn. Vào thời điểm 1997, Netscape hầu nh− là hệ thống duyệt phổ dụng nhất với hiẹu quả bổ sung của nó và sự mở rộng về an toàn. • Thực hiện từ xa là khả năng gửi thông điệp đòi hỏi sự thực hiện một ch−ơng trình tại site từ xa. Do các ch−ơng trình thực hiện đ−ợc là phụ thuộc máy và không thể chạy trên máy tùy ý, sự thực hiện từ xa th−ờng đ−ợc làm theo cách thông dịch (không là biên dịch) một file script hoặc mã liên ph−ơng tiên độc lập máy đ−ợc thông điệp đ−a ra. Thực hiện từ xa là một công cụ mạng rất mạnh song nguy hiểm. Vì thế nó th−ờng đ−ợc giới hạn tới một số ứng dụng mà sự hạn chế có thể kéo theo việc ngăn ngừa đe doạ và bảo vệ khỏi vi phạm. ứng dụng tốt của thực hiện từ xa là chuyển vận dữ liệu đa ph−ơng tiện. File video và ảnh đòi hỏi khối l−ợng lớn băng thông nếu chúng đ−ợc truyền d−ới dạng dòng điểm. Chúng cũng phải gặp bài toán về tính không t−ơng thích trong hiển thị output. Một số ngôn ngữ liên ph−ơng tiện phổ dụng có thể đ−ợc dùng để đặc tả dạng thống nhất và cô đọng hơn. Tại điểm nhận, thông dịch t−ơng ứng đ−ợc gọi nhằm dịch dữ liệu hoặc thực hiện các chỉ thị trong ngôn ngữ đa ph−ơng tiện. Vấn đề chuyển đổi dữ liệu đ−ợc giải quyết và việc tải trên mạng là rất lớn. Nhiều ứng dụng mạng sử dụng khái niệm thực hiện từ xa. Ví dụ, MIME (Multupurpose Internet Mail Extension) là hệ thống mail tích cực mà hỗ trợ trao đổi mail đa ph−ơng tiện giữa các máy tính khác nhau, chẳng hạn, thông điệp có thể mang một kiểu đặc biệt cho một hiển thị riêng. Phụ thuộc vào kiểu, quá trình t−ơng ứng đ−ợc gọi nhằm thực hiện bài toán. Thông điệp ytong mail MIME đ−ợc thông dịch và có cùng hiệu quả nh− ch−ơng trình thực hiện ở xa. Cách tiếp cận tổng quát hơn tới thực hiện từ xa trong ngôn ngữ và môi tr−ờng lập trình Java. Java là ngôn ngữ lập trình h−ớng đối t−ợng mục đích - tổng quát, xuất pát từ C++. Biên dịch Java cho dãy các chỉ thị mã-byte hiệu năng cao và độc lập máy cô đọng có thể đ−ợc gửi và thông dịch tại host bất kỳ miễn có sẵn thông dịch Java. Ch−ơng trình mã-byte đ−ợc gọi là tiểu dụng (applet). Nhằm hỗ trợ dịch vụ mạng và phân tán, môi tr−ờng lập trình Java cung cấp th− viện gồm các thủ tục con kết hợp chặt chẽ các giao thức Internet, chẳng hạn http và fpt. Một tiểu dụng Java là một đối t−ợng mà có thể đ−ợc chỉ dẫn tại một URRL nhằm mở các đối t−ợng khác. Một ứng dụng trực tiếp của tiểu dụng trong WWW là sử dụng thế mạnh động của tiểu dụng để kéo - 17-
  18. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) ảnh đ−ợc tạo ra dễ dàng hơn trong hệ thống duyệt. Phiên bản mới của Netscape đ−ợc thi hành nhờ sử dụng Java vì vậy hỗ trợ tiểu dụng Java. Do việc sử dụng những ứng dụng chia sẻ tài nguyên mạng nh− trên đang phát triển, chúng đ−ợc thi hành nh− những phục vụ hệ thống chuẩn (quá trình chạy ngầm: daemon) thực hiện giao thức điểm trên một hạ tầng dịch vụ giao vận và trở thành bộ phận của HĐH mạng. • Ngoài ra, hiện có nhiều h−ớng cải tiến truyền thông trên mạng liên quan đến tính chất lin hoạt, th−ờng đ−ợc gọi là "tích cực" trong mạng, liên quan đến giao thức (thông điệp tích cực: active massage), liên quan đến môi tr−ờng (mạng tích cực: active network) Mặt khác, an ninh mạng đã và đang là một trong những vấn đề cốt lõi nhất hiện nay. 1.4. Sơ l−ợc về hệ điều hành phân tán HĐH phân tán mới thực sự là một HĐH quản lý tài nguyên máy tính trên phạm vi lãnh thổ lớn. Các máy tính đ−ợc kết nối lôgic (theo phần mềm) trong HĐH phân tán một cách t−ơng đối chặt chẽ, hệ thống tài nguyên của mỗi máy tính đóng góp thực sự vào hệ thống tài nguyên chung thống nhất và tham gia vào việc giải quyết mỗi bài toán điều phối quá trình, điều phối bộ nhớ, điều phối vào-ra v.v. HĐH phân tán, về lôgic là một hệ thống thống nhất song về vật lý lại đ−ợc “phân bố” chạy trên nhiều máy tính ở các vị trí khác nhau. Sự phát triển các trạm làm việc mạnh và những tiến bộ của công nghệ truyền thông tạo ra sự cần thiết và hợp lý để mở rộng việc chia xẻ tài nguyên thêm một b−ớc nữa: để bao gồm dạng tổng quát hơn nữa các hoạt động cộng tác giữa một tập hợp gồm các máy tính tự trị, đ−ợc kết nối bởi một mạng truyền thông. Chia xẻ tài nguyên và cộng tác các hoạt động phân tán kiểu này của môi tr−ờng tính toán là những mục tiêu chính trong thiết kế HĐH phân tán và là tiêu điểm chính của tập bài giảng này. Cần xác định những thành phần trong một hệ phân tán kết nối lỏng là cần phân tán hay không tập trung. Tài nguyên vật lý là phân tán vì đ−ợc thừa h−ởng tự nhiên từ hệ kết nối lỏng. Thông tin và nhu cầu thông tin trở nên phân tán do tính tự nhiên của nó hoặc do nhu cầu tổ chức, chẳng hạn về tính hiệu quả và tính an toàn. Hơn nữa, hiệu năng hệ thống cần đ−ợc nâng cao nhờ tính toán phân tán. Làm thế nào để các tài nguyên và hoạt động phân tán đ−ợc quản lý và điều khiển là những trách nhiệm căn bản của HĐH phân tán. Nên chăng HĐH phân tán tự nó cũng phân tán ? Lời giải đáp là về đại thể là nên theo cách thức đó chính do tính tự nhien của nó và nhu cầu tổ chức. Điều đó đặt ra vấn đề thi hành phân tán đối với các chức năng quản trị và điều khiển của HĐH phân tán, chính là thiết kế các thuật toán phân tán. Nhu cầu về các thuật toán phân tán trong các HĐH phân tán thúc đẩy việc tích hợp hai chủ thể có quan hệ mật thiết này trong một số tài liệu. Khi cho một HĐH phân tán trên một hệ phân tán, hy vọng có đ−ợc sự che khuất các chi tiết thi hành của hệ thống đó đối với ng−ời dùng. Điều phân biệt mấu chốt giữa HĐH mạng và HĐH phân tán ở chính khái niệm trong suốt. Trong suốt là một khái niệm mới. Trong HĐH tập trung, ng−ời sử dụng chia xẻ thời gian có sự trong suốt đồng thời (concurrency transparency) nếu họ không nhận biết thực tế có nhiều ng−ời dung fkhác cũng đang chia xẻ cùng một hệ thống. Một ch−ơng trình đ−ợc gọi trong suốt định vị (location transparrency) nếu nh− bản đồ của ch−ơng trình vào trong bộ nhớ vật lý và/hoặc bộ xử lý là bị che khuất. Trong HĐH phân tán khái niệm này còn đ−ợc mở rộng tới định vị file và đồng thời truy nhập nếu file có thể nằm bất kỳ trên hệ thống l−u trữ và truy nhập nó thông qua đ−ờng dẫn lôgic hơn là vật lý. Đối với quá - 18-
  19. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) trình phân tán, có thể đạt đ−ợc phân tán song song và phân tán hiệu năng nếu quá trình có thể đ−ợc thực hiện trên một bộ xử lý bất kỳ mà không kể sự nhận biết của ng−ời dùng và không kể sự khác nhau đáng kể về hiệu năng. Còn nhiều ví dụ nữa và có giới hạn hay không ? Một hệ thống trong suốt hoàn toàn là hợp lý hoặc thậm chí chỉ hy vọng là một câu hỏi còn đ−ợc bàn luận. Nói chung, tính trong suốt là một cái tốt đẹp cần có và chúng ta vẫn sử dụng nó nh− mở rộng mấu chốt của HĐH phân tán. Trong các mục tr−ớc đây, hệ thống tính toán đ−ợc mô tả nh− một hệ thống trừu t−ợng bao gồm các quá trình và các file. Cần bổ sung các thuật toán (chính xác hơn là các thuật toán điều khiển phân tán) mà quản lý sự thực hiện các quá trình trên các file trong hệ phân tán. Nh− vậy, HĐH phân tán bao gồm ba thành phần chính: điều phối các quá trình phân tán, quản trị các tài nguyên phân tán và thi hành các thuật toán phân tán. Tại mỗi nút trong hệ phân tán, giả thiết rằng tồn tại những môđun thực hiện việc quản trị tài nguyên địa ph−ơng. Một số HĐH phân tán điển hình nh− AMAEBA, MACH, CHORUS, DCE đ−ợc giới thiệu trong [8]. 1.5. Sơ l−ợc về hệ tự trị cộng tác HĐH tự trị cộng tác cho một cách thức linh hoạt hơn so với HĐH phân tán. Các máy tính thành viên vừa đ−ợc phép tham gia kết nối vào toàn bộ hệ thống lại vừa đ−ợc phép chạy một cách độc lập. Khi tham gia vào hệ thống, tài nguyên của máy tính thành viên đ−ợc toàn bộ hệ thống sử dụng (gần nh− theo cách thức của HĐH phân tán) còn khi máy thành viên chạy độc lập thì nó độc quyền sử dụng tài nguyên riêng. Về thực chất, trong hệ tự trị cộng tác, tính "tự trị" của máy thành viên đ−ợc chú trọng hơn so với tính thống nhất lôgic của toàn bộ hệ thống. Nh− vậy, nếu chỉ cần duy trì tính trong suốt ở một mức độ nào đó và hủy bỏ về cái nhìn của một hệ thống nhất lôgic của hệ đa máy tính, nhận đ−ợc cách nhìn khác nhau hoàn toàn của một hệ (phần cứng và phần mềm) lỏng lẻo thuần túy. Mỗi ng−ời dùng hoặc quá trình thao tác tự trị bằng cách cung cấp các dịch vụ của mình và yêu cầu các dịch vụ từ nơi khác. Nhóm các hành động có thể đ−ợc điều phối bằng việc trao đổi dịch vụ và yêu cầu. Dịch vụ mức cao có thể đ−ợc cung cấp bằng cách giải quyết chúng từ những dịch vụ ở mức thấp hơn. Mọi hệ thống phần mềm có thể đ−ợc định danh một cách thoải mái bằng cách tích hợp nhiều dịch vụ với sự thoả thuận nào đó theo cấu trúc. Đây là cách tiệm cận đã bắt ch−ớc cách ứng xử trong xã hội loài ng−ời: ứng xử trong hệ thống máy tính làm theo cách ứng xử trong xã hội loài ng−ời phức tạp. Đây là cách nhìn của hệ tự trị cộng tác. Hình 1.8 minh họa một số khác biệt cơ bản giữa HĐH phân tán với hệ tự trị công tác. Hệ phân tán đ−ợc đặc tr−ng bằng phân tích dịch vụ trong khi hệ tự trị cộng tác lại nhấn mạnh việc tích hợp dịch vụ. Hệ tự trị cộng tác là hệ thống phần mềm định h−ớng dịch vụ mức cao đòi hỏi hỗ trợ cơ chế truyền thông trên đó các giao thức truyền thông mức cai đã đ−ợc xây dựng. Lấy ví dụ hình ảnh cách thức giao dịch bất động sản có thể đ−ợc thực hiện trong một hệ tự trị cộng tác. Ng−ời mua nhà, là một quá trình khách, có thể tạo ra một yêu cầu tới hoặc trực tiếp tới chủ ngôi nhà hoặc gián tiếp tới đại lý bất động sản (cả hai đều là quá trình phục vụ). Chủ ngôi nhà là quá trình khách tới ng−ời môi giới. Ng−ời môi giới có thể từ một đại lý bất động sản, một phục vụ lớn hơn có thể chỉ dẫn cho ng−ời mua nhà một môi giới giành riêng. Ng−ời bán là khách tới đại lý bất động sản giống nh− một khách tới ng−ời môi giới. Ng−ời mua có thể định vị đ−ợc đại lý bất động sản nhờ xem thông tin trên Trang vàng, đã đ−ợc biết đến nh− một quá trình phục vụ trực tiếp. Nếu ngôi nhà đ−ợc chủ của nó bán trực tiếp thì ng−ời chủ có thể quảng cáo tại đâu đó nhờ quá trình phục vụ với địa chỉ đã biết. Hình 1.9 trình bày một loạt các quan hệ Client/Server - 19-
  20. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) của một ứng dụng hệ tự trị cộng tác. Phục vụ kiểu Trang vàng và đại lý bất động sản cung cấp dịch vụ môi giới hoặc th−ơng mại nh− những dịch vụ định vị. Khái niệm mấu chốt của hệ tự trị cộng tác là tích hợp các dịch vụ thành dạng hoạt động cộng tác. Cả phần cứng và phàn mềm là tách rời và không tập trung hoàn toàn. T− t−ởng của hệ tự trị không tập trung hình nh− g−ợng gạo. Tuy nhiên, một mở rộng đơn giản có khái niệm Làm việc cộng tác đ−ợc hỗ trợ bằng máy tính (Computer Supported Cooperative Work: CSCW). CSCW là một khung nhằm hỗ trợ phần mềm nhóm (groupware), một ứng dụng phần mềm lớn mà bao gồm các ng−ời dùng cộng tác và tài nguyên phân tán dọc theo một mạng hỗn tạp. Một ví dụ là hội thảo phân tán, trong đó cuộc mit tinh điện tử trong một mạng vật lý phân tán có thể đ−ợc tổ chức. Trái ng−ợc với triết lý máy tính đơn đ−ợc chỉ cho ng−ời dùng và tài nguyên có thể thiết kế Dịch vụ Phân tích trong hệ phân Tích hợp trong hệ tự trị tán cộng tác Hình 1.8. Phân tích và tích hợp dịch vụ và quản trị, là sự nhận biết rõ ràng sự tồn tại đa máy tính. Ng−ời dùng, từ mạng logic của họ với mụctiêu riêng và đ−ợc sẵn sàng cho điều khiển truy nhập và bảo vệ của nhóm. Hệ cộng tác không tập trung là hệ thống cungg cấp những dịch vụ chuẩn cho phép tích hợp các dịch vụ cộng tác mức cao trong một hệ thống mạng lớn. Với số l−ợng rất lớn đã lên ph−ơng án về mạng và con ng−ời, đây là sự tiến hóa tự nhiên của HĐH mạng và HĐH phân tán. Nhu cầu trộn các ứng dụng hệ tự trị cộng tác có thể bùng phát một số cố gắng chuẩn hóa cho việc phát triển t−ơng lai của phần mềm phân tán, đáng chú ý là Quá trình phân tán mở (Open Distributed Processing: ODP) và Kiến trúc môi giới yêu cầu đối t−ợng chung (Common Object Request Broker Architeturre: CORBA). ODP là khung hệ thống công cộng hõ trợ phân tán, liên thao tác và khả chuyển đối với các xử lý phân tán hõn tạp cả bên trong và dọc theo tổ chức tự trị. CORBA ccung cho cùng triết lý và sử dụng mô hình h−ớng đối t−ợng để thi hành yêu cầu dịch vụ trong suốt dọc theo một hệ thống phân tán đa đối t−ợng hỗn tạp liên kết nối. Cả ODP và CORBA dùng dịch vụ thông minh trader hoặc broker làm thuận tiện liên t−ơng tác trong hệ tự trị cọng tác. Trang vàng và đại lý bất động sản nh− những th−ơng nhân. Chúng có thể đ−ợc nhìn - 20-
  21. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) nh− tuyến phần mềm liên kết quá trình khách và phục vụ và chúng phục vụ nh− một phần mềm lớp giữa (middleware) hỗ trợ các ứng dụng cộng tác phân tán. Trang vàng Các kênh truyền thông PHụC Đại lý bất động sản Ng−ời môi giới Ng−ời môi giới Vụ Khách Phục vụ đại chúng Khách Ng−ời mua Báo chí Ng−ời bán Hình 1.9. Một hệ tự trị thông qua tích hợp dịch vụ • Đồng thời với tiến trình phát triển trên đây của các HĐH, việc nghiên cứu về các hệ thống xử lý song song cũng đ−ợc phát triển. T−ơng ứng với các mô hình song song trên các hệ thống tập trung SIMD, MISD, MIMD là các mô hình SPMD (Single Program Multiple Data), MPSD, MPSD trong đó đối t−ợng thực hiện song song là ch−ơng trình thay cho chỉ thị (instruction). Một h−ớng nghiên cứu thời sự hiện nay là mô hình tính toán cụm (Cluster Computing) trong đó việc song song hóa một cách hiệu quả là mục tiêu của các mô hình nh− vậy. Trong các mô hình tính toán song song thì cách thức SPMD là điển hình nhất. Tính toán song song trên mạng các máy tính cá nhân, khai thác công suất d− thừa của các máy tính cá nhân trong mạng cũng là h−ớng đang đ−ợc đặc biệt chú ý, theo đó tìm cách "tổ hợp sức mạnh" các máy tính cá nhân trong mạng thành "siêu máy tính ảo" (có ng−ời còn gọi là "siêu máy tính con nhà nghèo). Cách thức nói trên liên quan đến việc tạo dựng "cụm máy tính cá nhân" (PC-cluster) bằng một hệ thống phần mềm (thuộc dạng middleware) với tên gọi là phần mềm PC-cluster. Hiện tại có hai lớp phần mềm PC-cluster miễn phí điển hình là PVM (Parallel Vitural Machine) và MPI (Message Passing Interface). Tính đến thời điểm năm 2002, một số hệ thống PC-cluster đã đ−ợc cài đặt thử nghiệm tại một số cơ quan trong n−ớc (trong đó có khoa Công nghệ, ĐHQGHN) song hiệu quả thực sự của chúng hiện vẫn còn ở mức rất khiêm tốn. Vấn đề thiết kế và nghiên cứu đối với HĐH tập trung (truyền thống), hoạt động trong một hệ thống có một hoặc nhiều bộ xử lý, đã đ−ợc nghiên cứu t−ơng đối dầy đủ. Tuy nhiên, với việc phát triển nhanh chóng các trạm làm việc cá nhân và mạng cục bộ dẫn đến sự phát triển nhanh chóng các khái niệm HĐH mới, là HĐH mạng và HĐH phân tán (một số tác giả, đặc biệt là các tác giả Việt kiều, dùng thuật ngữ "phân bố" thay cho thuật ngữ "phân tán" đ−ợc dùng trong tài liệu này). Vấn đề quan hệ đến mạng và HĐH phân tán là mục tiêu nghiên cứu của giáo trình này. Một vấn đề khác nổi lên là phát triển các hệ thống tự động cộng tác, trong đó nhấn mạnh việc thiết kế các thuật toán phân tán trong một môi tr−ờng hệ thống mở. Một hệ thống mở liên quan đến tính mềm dẻo một cách toàn vẹn và che khuất đi sự hỗn tạp các thành phần nhằm hỗ trợ việc cộng tác nhiều cấp tại mức ứng dụng. Khái niệm này là rộng lớn hơn so với HĐH theo nghĩa truyền thống. 1.6. Thuật toán phân tán - 21-
  22. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) Việc thiết kế các thuật toán phân tán, đ−ợc đòi hỏi nhằm hỗ trợ việc thi hành dịch vụ HĐH phân tán để điều phối sự thực hiện của các quá trình đồng thời có vai trò quan trọng trong nghiên cứu về HĐH phân tán. Các thuật toán th−ờng đ−ợc chỉ dẫn nh− các giao thức do chức năng của chúng là chủ yếu thiết lập lệnh hoặc quy tắc đối với sự hạn chế của hệ phân tán là thiếu những thông tin trạng thái hệ thống toàn cục. Mỗi quá trình có nhận thức khác nhau của hệ thống do sự thiếu vắng bộ nhớ chia xẻ và độ trễ truyền thông đáng kế giữa các quá trình. Cái nhien của họ về hệ thống th−ờng là không đầy đủ và không mạch lạc. Phần tử bản chất nhất của thông tin toàn cục là thông tin thời gian toàn cục cỡ hệ thống, th−ờng đ−ợc chỉ dẫn nh− một đồng hồ toàn cục. Về mặt lý thuyết, không thể đạt đ−ợc nhằm đạt đ−ợc một đồng hồ toàn cục thậm chí trong hệ phân tán có một đồng hồ trung tâm chung. Bỏ qua thông tin thời gian toàn cục, sự thúc ép sự sắp xếp sự xuất hiện các sự kiện trở thành một bài toán không tầm th−ờng. Việc xấp xỉ đồng hồ toàn cục với sự thứ lỗi thời gian nào đó và cơ chế thực hiện thứ tự sự kiện đúng đắn không cần sử dụng thông tin đồng hồ toàn cục bắt buộc phải đ−ợc phát triển. Nhiều thi hành của các chức năng điều khiển mức cao chẳng hạn ĐBQT và TTQT dựa vào sự thứ lỗi (fault tolerance) thời gian và cơ chế sắp xếp sự kiện này. Độ trễ truyền thông tạo ra khó khăn lớn để đạt đ−ợc thỏa thuận về trạng thái hệ thống, bản chất của các hoạt động phân tán cộng tác. Bổ sung tới tính phức tạp do độ trễ truyền thông, thiết kế thuật toán phân tán là phức tạp hơn bởi vì nguồn lỗi và không tin cậy là phổ biến hơn trong hệ phân tán so với hệ tập trung. Thứ lỗi trong hệ phân tán là vấn đề khó tính hơn đối với các thuật toán phân tán. Bản chất là hệ thống bao gói nhiều kiểu của lỗi. Thậm chí nhiều thuật toán tập trung để ĐBQT, lập lịch, và điều khiển đồng thời buộc phải đ−ợc xem xét kỹ l−ỡng để dùng trong hệ phân tán. Thuật toán có thể đ−ợc phân thành hai lớp: thuật toán không tập trung đầy đủ và thuật toán phân tán với một điều phối tập trung thứ lỗi. Loại thứ hai đơn giản hơn theo khái niệm cung cấp những cơ chế hiệu quả tồn tại nhằm kiểm soát lỗi của điều khiển tập trung và chọn những chỉ đạo mới. Kiến trúc phần cứng của hệ phân tán cũng có vai trò quan trọng trong thi hành các thuật toán phân tán. Các ph−ơng pháp truyền thông phụ thuộc vào việc tôpô mạng là kết nối đầy đủ hay không, thông th−ờng hay không thông th−ờng, và truyền dữ liệulà điểm-điểm hay đa điểm. Kiến trúc thậm chí cho phép cả việc thay đổi tôpô, lỗi kết nối và các nút là tồn tại. Về phía phần mềm dữ liệu th−ờng đ−ợc nhân bản nhằm cho phép truy nhập đồng thời và đạt đ−ợc độ tin cậy cao hơn. Nhân bản dữ liêu lại đ−a đến vấn đề tính chặt chẽ của dữ liệu. Quản lý nhân bản dữ liệu trở thành một vấn đề cũng khó tính trong thiết kế hệ phân tán. D−ới đây là một danh sách tổng quát các thuật toán phân tán khi l−u tâm tới những vấn đề đáng kể của hệ phân tán đ−ợc tóm tắt từ những điều mô tả trên. • Chuyển thông điệp Hệ quả của việc không có bộ nhớ chia xẻ ngụ ý rằng điều phối giữa các quá trình đồng thời bắt buộc phải thực hiện bằng CTĐ. Nh− vậy, thuật toán đồng bộ và nắm giữ bế tắc cần đ−ợc thiết kế lại trong môi tr−ờng phân tán. Thuật toán phân tán có thể không tập trung hoàn toàn hoặc tập trung. Trong thuật toán tập trung, thuật toán bầu cử phân tán th−ờng đ−ợc đòi hỏi để thiết lập và duy trì điều khiển tập trung. • Sự thiếu thông tin toàn cục. Hiệu lực của thuật toán phân tán phụ thuộc vào tri thức của nó về trạng thái của hệ thống. Do không hợp lý nếu đ−a ra thông tin trạng thái toàn cục do độ trễ mạng và các thành phần trong hệ thống không tin cậy, t−ơng tác giữa các quá trình bắt buộc phải dựa trên sự nhất trí nhận đ−ợc từ một vài giao thức thỏa thuận nào đó. Giao thức thoả thuận tự nó là thuật toán phân tán. - 22-
  23. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) • Nhân bản dữ liệu. Quản lý nhân bản dữ liệu là chức năng cơ sở của hệ thống file và cơ sở dữ liệu phân tán. Mục tiêu căn bản của giao thức là duy trì tính nhất quán (consistency). Vấn đề t−ơng đ−ơng lôgic cần đến tán phát tin cậy (reliable broadcast). Tập các dữ liệu đ−ợc nhân bản là t−ơng tự nh− một nhóm thành viên đ−ợc tán phát. Vấn đề này kéo theo trong HĐH hoặc CSDL cũng đ−ợc nhìn nhận. • Lỗi và khôi phục. Độ tin cậy của hệ thống có thể đ−ợc nâng cao theo nghĩa thứ lỗi hoặc khôi phục tiếp sau lỗi. Tiếp cận thứ lỗi sử dụng giải pháp d− thừa hoặc đa phục vụ. Khôi phục là cách tiếp cận sẵn có trong đó trạng thái của hệ thống là đ−ợc duy trì và đ−ợc dùng để thực hiện lại từ điểm kiểm tra ngay tr−ớc. Thuật toán khôi phục giải quyết với việc đăng nhập vào trạng thái hệ thống, các điểm kiểm tra và nắm giữ các quá trình và thông điệp cô lập. Câu hỏi và bài tập 1. Trình bày khái niệm và hai chức năng cơ bản của hệ điều hành. 2. Trình bày sơ l−ợc về quá trình tiến hóa của hệ điều hành, những nét đặc tr−ng nhất của mỗi lớp hệ điều hành. Nhận xét về quá trình tiến hóa đó. 3. Trình bày những bài toán điều khiển chủ yếu nhất của hệ điều hành truyền thống và sơ bộ về một số giải pháp giải quyết mỗi bài toán đó. 4. Khái niệm vi nhân và sơ bộ về giải pháp vi nhân. 5. Tính mở và tính khả chuyển của hệ điều hành. Sơ bộ về giải pháp thi hành tính mở và tính khả chuyển. - 23-
  24. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) ch−ơng II. Khái niệm và kiến trúc hệ phân tán II.0. Giới thiệu Nh− đã đ−ợc trình bày trong ch−ơng tr−ớc, HĐH hiện đại th−ờng tập trung vào chức năng máy tính ảo, nhấn mạnh mức dịch vụ hệ thống và vì vậy thuận tiện hơn quan niệm HĐH phân tán nh− một bộ tích hợp các dịch vụ hệ thống cho phép trình diễn cái nhìn trong suốt tới hệ thống máy tính với tài nguyên và điều khiển phân tán (đặt tại nhiều vị trí địa lý khác nhau). Có thể nói HĐH phân tán là HĐH kết nối chặt về phần mềm trên nền tảng kết nối lỏng về phần cứng. Theo một cách nói khác, HĐH phân tán cung cấp cho ng−ời sử dụng cách thức làm việc nh− với một HĐH tập trung trong điều kiện phân tán cả phần cứng lẫn phần mềm. Một vấn đề đặt ra cho chính khái niệm HĐH phân tán. Tồn tại nhiều cách hiểu về HĐH phân tán, song có rất hiếm tài liệu cho một định nghĩa chính thức về HĐH phân tán. Trong nhiều ngữ cảnh, ng−ời ta còn sử dụng khái niệm "hệ phân tán" thay thế cho khái niệm "HĐH phân tán". Chúng ta chấp nhận định nghĩa đ−ợc đ−a ra trong [8]: Hệ phân tán là tổ hợp bao gồm các máy tính độc lập với trình diễn hệ thống nh− một máy tính đơn tr−ớc ng−ời dùng. HĐH phân tán đ−ợc phát triển trên cơ sở một số tiền đề sau đây: • Thứ nhất, do nhu cầu tăng không ngừng việc chia xẻ tài nguyên và thông tin mà các HĐH đã có từ tr−ớc không đáp ứng đ−ợc. Trong quá trình triển khai ứng dụng Tin học vào đời sống, các mạng máy tính đ−ợc phát triển không ngừng, các tài nguyên của các máy tính trong mạng (phần cứng, phần mềm) ngày càng đ−ợc mở rộng và nâng cấp, giá trị các tài nguyên này càng tăng nhanh dẫn đến sự tăng tr−ởng v−ợt bậc nhu cầu chia xẻ tài nguyên và thông tin trong một hệ thống thống nhất. HĐH tập trung và HĐH mạng thuần túy không đáp ứng đ−ợc nhu cầu đối với sự tăng tr−ởng đó. • Tiền đề thứ hai liên quan đến việc giá các trạm làm việc giảm nhanh chóng. Việc giảm giá các trạm làm việc làm cho chúng đ−ợc sử dụng phổ dụng hơn, số l−ợng và chất l−ợng các trạm làm việc cũng tăng không ngừng mà từ đó làm tăng yêu cầu xử lý phân tán. Điều này tạo ra nhiều vị trí có khả năng xử lý và l−u trữ thông tin hơn mà từ đó cần thiết phải phối hợp để chia xẻ tốt hơn tiềm năng l−u trữ và xử lý của các vị trí đó. • Việc sử dụng rộng rãi các mạng Trên cơ sở việc kết nối mạng để triển khai HĐH mạng tạo nên một cơ sở kỹ thuật hạ tầng (phần cứng, kết nối mạng, phần mềm) làm nền tảng phát triển HĐH phân tán. • Tính thuần thục về kỹ nghệ phần mềm của các chuyên gia phát triển HĐH. Kinh nghiệm xây dựng HĐH tr−ớc đây (HĐH tập trung, HĐH mạng) cho phép nâng cao trình độ để đủ năng lực xây dựng HĐH phân tán. II.1. Các mục tiêu thiết kế hệ điều hành phân tán I.1.1. Đặc điểm của hệ phân tán Hệ phân tán có các đặc điểm cơ bản là Tính chia xẻ tài nguyên, Tính mở, Khả năng song song, Tính mở rộng, Khả năng thứ lỗi, Tính trong suốt. - 24-
  25. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) a. Tính chia xẻ tài nguyên Thuật ngữ tài nguyên đ−ợc dùng để chỉ tất cả mọi thứ có thể đ−ợc chia xẻ trong hệ phân tán, bao gồm từ các thiết bị phần cứng (Đĩa, máy in ) tới các đối t−ợng (file, các cửa sổ, CSDL và các đối t−ợng dữ liệu khác). Trong hệ phân tán, chia xẻ tài nguyên đ−ợc hiểu là tài nguyên của hệ thống đ−ợc các QT chia xẻ (sử dụng chung) mà không bị hạn chế bởi tình trạng phân tán tài nguyên theo vị trí địa lý. Việc chia xẻ tài nguyên trên hệ phân tán - trong đó tài nguyên bị lệ thuộc về mặt vật lý với một máy tính nào đó - đ−ợc thực hiện thông qua truyền thông. Để chia xẻ tài nguyên một cách hiệu quả thì mỗi tài nguyên cần phải đ−ợc quản lý bởi một ch−ơng trình có giao diện truyền thông, các tài nguyên có thể truy nhập, cập nhật đ−ợc một cách tin cậy và nhất quán. Quản lý tài nguyên ở đây bao gồm lập kế hoạch và dự phòng, đặt tên các lớp tài nguyên, cho phép tài nguyên đ−ợc truy cập từ nơi khác, ánh xạ tên tài nguyên vào địa chỉ truyền thông b. Tính mở Tính mở của một hệ thống máy tính là tính dễ dàng mở rộng phần cứng (thiết bị ngoại vi, bộ nhớ, các giao diện truyền thông ) và phần mềm (các mô hình HĐH, các giao thức truyền thông, các dịch vụ chia xẻ tài nguyên ) của nó. Nói một cách khác, tính mở của hệ thống phân tán mang ý nghĩa bao hàm tính dễ dàng cấu hình cả phần cứng lẫn phần mềm của nó. Tính mở của hệ phân tán đ−ợc thể hiện là hệ thống có thể đ−ợc tạo nên từ nhiều loại phần cứng và phần mềm của nhiều nhà cung cấp khác nhau với điều kiện các thành phần này phải theo một tiêu chuẩn chung (liên quan đến HĐH là tính đa dạng tài nguyên; liên quan đến nhà cung cấp tài nguyên là tính chuẩn). Vai trò của ASP và SPI trong HĐH đã đ−ợc trình bày trong ch−ơng 1. Tính mở của Hệ phân tán đ−ợc xem xét theo mức độ bổ sung thêm các dịch vụ chia xẻ tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại. Tính mở đ−ợc hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của hệ phân tán và làm cho nó t−ơng thích với các nhà phát triển phần mềm (tức là các giao diện chính của HĐH phân tán cần phổ dụng). Tính mở của HĐH phân tán đ−ợc thi hành dựa trên việc cung cấp cơ chế truyền thông giữa các QT và công khai các giao diện đ−ợc dùng để truy cập tài nguyên chung. c. Khả năng song song Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy tính có thể có một hoặc nhiều CPU. Trong cùng một thời điểm nếu có từ hai QT trở lên cùng tồn tại, ta nói rằng chúng đ−ợc thực hiện đồng thời. Việc thực hiện các QT đồng thời theo cơ chế phân chia thời gian (một CPU) hay song song (nhiều CPU). Khả năng làm việc song song trong hệ phân tán đ−ợc thi hành do hai tình huống: - Nhiều ng−ời sử dụng đồng thời đ−a ra các lệnh hay t−ơng tác với ch−ơng trình ứng dụng (đồng thời xuất hiện nhiều QT khách). - Nhiều QT phục vụ chạy đồng thời, mỗi QT đáp ứng yêu cầu của một trong số các QT Khách. Từ điều kiện đa xử lý, khả năng song song của hệ thống phân tán trở thành một thuộc tính của nó. - 25-
  26. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) d. Khả năng mở rộng Hệ phân tán có khả năng hoạt động tốt và hiệu quả ở nhiều mức khác nhau. Một hệ phân tán nhỏ nhất có thể hoạt động chỉ cần hai trạm làm việc và một phục vụ file. Các hệ lớn có thể bao gồm hàng nghìn máy tính, nhiều phục vụ File và phục vụ máy in Khả năng mở rộng của một hệ phân tán đ−ợc đặc tr−ng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ thống đ−ợc mở rộng. Điều này chỉ đạt ở mức độ nào đó đối với hệ phân tán hiện tại (không thể hoàn toàn nh− định nghĩa trên). Yêu cầu mở rộng không chỉ là mở rộng về phần cứng hay về mạng trên đó hệ thống bao trùm mà còn cần phải đ−ợc phân tích, đánh giá trên tất cả các khía cạnh khi thiết kế hệ phân tán. Một ví dụ đơn giản là tình huống tần suất sử dụng một file quá cao xuất hiện nh− kết quả của việc tăng số ng−ời sử dụng trên mạng. Để tránh tình trạng tắc nghẽn xảy ra nếu nh− chỉ có một phục vụ đáp ứng các yêu cầu truy cập file đó, cần nhân bản file đó trên một vài phục vụ và hệ thống đ−ợc thiết kế sao cho dễ dàng bổ sung phục vụ. Có thể tính đến các giải pháp khác là sử dụng Cache và bản sao dữ liệu. e. Khả năng thứ lỗi Khả năng thứ lỗi thể hiện việc hệ thống không bị sụp đổ bởi các sự cố do các lỗi thành phần (cả phần cứng lẫn phần mềm) trong một bộ phận nào đó. Việc thiết kế khả năng chịu lỗi của các hệ thống máy tính dựa trên hai giải pháp sau đây: - Dùng khả năng thay thế để đảm bảo việc hoạt động liên tục và hiệu quả. - Dùng các ch−ơng trình đảm bảo cơ chế phục hồi dữ liệu khi xảy ra sự cố. Để xây dựng một hệ thống có thể khắc phục sự cố theo cách thứ nhất thì có thể chọn giải pháp nối hai máy tính với nhau để thực hiện cùng một ch−ơng trình mà một trong hai máy đó chạy ở chế độ Standby (không tải hay chờ). Giải pháp này khá tốn kém vì phải nhân đôi phần cứng của hệ thống. Giải pháp khác nhằm giảm bớt phí tổn là dùng nhiều phục vụ khác nhau cung cấp các ứng dụng quan trọng để các phục vụ này có thể thay thế nhau khi sự cố xuất hiện. Khi không có sự cố thì các phục vụ chạy bình th−ờng (nghĩa là vẫn phục vụ các yêu cầu của khách). Khi xuất hiện sự cố trên một phục vụ nào đó, các ứng dụng khách tự chuyển h−ớng sang các phục vụ còn lại. Với cách thứ hai thì phần mềm phục hồi đ−ợc thiết kế sao cho trạng thái dữ liệu hiện thời (trạng thái tr−ớc khi xảy ra sự cố) có thể đ−ợc khôi phục khi lỗi đ−ợc phát hiện. Chú ý rằng với cách thức này, một mặt thì cùng một dịch vụ có thể đ−ợc sẵn sàng trên nhiều máy và mặt khác, trên một máy lại có sẵn một số dịch vụ khác nhau. Hệ phân tán cung cấp khả năng sẵn sàng cao để đối phó với các sai hỏng phần cứng. Khả năng sẵn sàng của hệ thống đ−ợc đo bằng tỷ lệ thời gian mà hệ thống sẵn sàng làm việc so với thời gian có sự cố. Khi một máy trên mạng sai hỏng thì chỉ có công việc liên quan đến các thành phần sai hỏng bị ảnh h−ởng. Ng−ời sử dụng có thể chuyển đến một trạm khác nếu máy họ đang sử dụng bị hỏng, một QT phục vụ có thể đ−ợc khởi động lại trên một máy khác. f. Tính trong suốt - 26-
  27. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) Nh− đã đ−ợc trình bày trong ch−ơng 1, tính trong suốt là tính chất căn bản của hệ phân tán. Tính trong suốt của hệ phân tán đ−ợc hiểu nh− là sự che khuất đi các thành phần riêng biệt của hệ thống máy tính (phần cứng và phần mềm) đối với ng−ời sử dụng và những ng−ời lập trình ứng dụng. Ng−ời sử dụng có quyền truy cập đến dữ liệu đặt tại một điểm dữ liệu ở xa một cách tự động nhờ hệ thống mà không cần biết đến sự phân tán của tất cả dữ liệu trên mạng. Hệ thống tạo cho ng−ời dùng cảm giác là dữ liệu đ−ợc coi nh− đặt tại máy tính cục bộ của mình. Các thể hiện điển hình về tính trong suốt của HĐH phân tán đ−ợc trình bày trong phần sau. II.1.2. Mục tiêu thiết kế hệ điều hành phân tán Các đặc điểm của hệ phân tán cần đ−ợc tính đến khi thiết kế HĐH phân tán. Mục tiêu thiết kế HĐH phân tán t−ơng đồng với mục tiêu thiết kế HĐH nói chung và cần đ−ợc xem xét theo hai góc độ: góc độ của ng−ời sử dụng và góc độ của nhà cung cấp HĐH. Trong thiết kế HĐH phân tán, những mục tiêu chung nhất theo cả hai góc độ này là cung cấp một mô hình đơn giản h−ớng tới một hệ thống hiệu quả (efficient), mềm dẻo (linh hoạt - flexible), nhất quán (consistency), mạnh mẽ (robust). Nội dung của bốn mục tiêu thiết kế này cũng bao gói đ−ợc phần lớn các tính chất của hệ phân tán mà đã đ−ợc giới thiệu trong mục tr−ớc. Do tính chất "phân tán" vật lý (tài nguyên phân tán, truyền thông mức cao, đa dạng hơn các lỗi thành phần) cho nên HĐH phân tán hoạt động phức tạp hơn, cũng có nghĩa là việc thi hành các mục tiêu trên đây là phức tạp và khó khăn hơn. • Tính hiệu quả Tính hiệu quả trở nên phức tạp hơn so với HĐH tập trung do phải tính đến chi phí phải trả cho bài toán truyền thông mà tr−ớc đây trong HĐH tập trung đã bỏ qua yếu tố này. Truyền thông CTĐ trong môi tr−ờng phân tán địa lý dẫn đến độ trễ tới hàng micro giây, mili giây thậm chí là hàng giây và tạo ra một yếu tố phức tạp trong việc đánh giá mức độ hiệu quả của hệ thống. Nguồn gốc của "độ trễ" là do bổ sung nhiều yếu tố mới vào HĐH phân tán so với HĐH tập trung, đó là độ trễ do nhân bản dữ liệu, độ trễ do tính toán đến tổng phí theo các giao thức truyền thông ở các mức độ khác nhau và sự phân tán tải của hệ thống. Độ trễ do nhân bản dữ liệu là khá rõ ràng và hiển nhiên. Nhân bản dữ liệu là việc tạo thêm các bản sao dữ liệu từ nơi khác tới vị trí xử lý nhằm mục đích tăng tốc độ truy nhập dữ liệu. Tuy nhiên nhân bản dữ liệu cũng đòi hỏi chi phí phải trả gồm thời gian sao dữ liệu và thời gian đảm bảo yếu tố nhất quán của dữ liệu đ−ợc nhân bản. Không thể đặt ra giải pháp nhằm hạn chế nhân bản dữ liệu. Tuy nhiên, việc truyền thông mức ngôn ngữ hay HĐH nên làm thật hiệu quả và giao thức truyền thông mức mạng nên làm cho thật tốt. Khi l−u ý đến phân bố tải hệ thống thì những vấn đề nh− hiện t−ợng thắt cổ chai hoặc tắc nghẽn hoặc trong mạng vật lý hoặc trong thành phần phần mềm bắt buộc phải đ−ợc địa chỉ hóa. Các ứng dụng (hệ thống hoặc ng−ời dùng) có thể tiến thêm một b−ớc là QT phân tán cần đ−ợc cấu trúc tốt chẳng hạn nh− tính toán và truyền thông có thể đ−ợc cân bằng tải và gối lên nhau một cách hợp lý. Một thuật toán lập lịch tối −u trong HĐH tập trung có thể không trở thành thuật toán tốt khi áp dụng trong HĐH phân tán. Việc phân tán các QT sao cho hệ thống đ−ợc cân bằng: các CPU dùng cho xử lý, các đ−ờng truyền thông đ−ợc phát huy cao nhất có thể có. Hai thông số quan trọng đánh giá hiệu quả hệ phân tán là độ tăng tốc và thông l−ợng hệ thống. Độ tăng tốc (speedup) đ−ợc hiểu là thời gian hoàn thiện QT là nhanh hay chậm. Thông l−ợng (throughput) đ−ợc hiểu là số QT đồng thời đ−ợc xử lý tại một thời điểm. Việc nâng cao hai thông số này thông qua việc lập lịch các QT phân tán, chia xẻ tải và hệ thống truyền thông cần đ−ợc thiết kế tốt. - 27-
  28. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) • Tính mềm dẻo Theo cách nhìn của ng−ời sử dụng, tính mềm dẻo đ−ợc thể hiện thông qua tính thân thiện của hệ thống, tính tự do của ng−ời dùng khi sử dụng hệ thống. Tính thân thiện đ−ợc hiểu rất rộng nh− dễ dàng sử dụng giao diện hệ thống, khả năng ánh xạ quá trình tính toán trong không gian bài toán tới hệ thống. Tiếp cận h−ớng đối t−ợng là chiến l−ợc phổ biến để hoàn thành mục tiêu này. Tính thân thiện cũng liên kết với các tính chất nhất quán và tính tin cậy. Các hệ thống nhất quán và đáng tin cậy không có những hạn chế vô lý. Nó cần cung cấp môi tr−ờng hoạt động thích hợp trong đó các tool và dịch vụ mới dễ dàng đ−ợc xây dựng. Theo cách nhìn của hệ thống, tính mềm dẻo là năng lực của hệ thống để tiến hóa và di trú. Các tính chất mấu chốt là môđun, co giãn, khả chuyển và liên thao tác. Trong những tr−ờng hợp khác, các tính chất này có độ quan trọng riêng trong hệ phân tán do hầu hết các hệ thống sử dụng các thành phần phần cứng và phần mềm hỗn tạp. Một mặt, chúng ta mong muốn có một quyền tự trị địa ph−ơng, nh−ng mặt khác, chúng ta lại muốn cùng cộng tác thành một hệ liên kết chặt chẽ, và chính điều này đã dẫn đến hạn chế nào đó tới chúng ta. Chính từ hai mong muốn có vẻ đối lập nhau này đ−a đến giải pháp dung hòa trong việc giải quyết tính mềm dẻo của hệ phân tán. • Tính nhất quán Tính nhất quán trở nên khó khăn hơn khi thi hành trong hệ phân tán: thiếu vắng thông tin toàn cục, tiềm tàng nhân bản và phân hoạch dữ liệu mạnh, khả năng xẩy ra lỗi thành phần, mối liên quan phức tạp các môđun thành phần; tất cả các điều đó đều tham gia vào sự thiếu nhất quán của hệ thống. Theo ph−ơng diện ng−ời dùng, một hệ thống là nhất quán nếu nh− có đ−ợc tính đồng nhất khi sử dụng và ứng xử hệ thống có thể khẳng định tr−ớc. Hơn nữa, hệ thống phải đủ năng lực duy trì tình trạng toàn vẹn nhờ cơ chế điều khiển đồng thời chính xác và các thủ tục kiểm soát lỗi và khôi phục. Điều khiển nhất quán trong dữ liệu và file (hoặc CSDL trong hệ thống định h−ớng giao dịch) là những vấn đề còn đ−ợc bàn luận trong hệ thống file phân tán. • Tính mạnh mẽ Bài toán tính mạnh mẽ càng trở nên quan trọng hơn trong hệ thống phân tán: lỗi kết nối truyền thông, lỗi tại nút xử lý và lỗi trong các QT Client/Server là th−ờng xuyên hơn so với hệ thống máy tính tập trung. Quy tắc nào cần đ−ợc hệ HĐH tuân thủ trong những tr−ờng hợp, chẳng hạn nh− một thông điệp hỏi/đáp bị mất hoặc nút xử lý hoặc phục vụ bị đổ vỡ ? Tính mạnh mẽ về khía cạnh thứ lỗi đ−ợc hiểu rằng hệ thống đủ năng lực tự khởi động lại tới trạng thái mà tại đó tính toàn vẹn của hệ thống đã đ−ợc bảo quản mà chỉ với một độ giảm sút hiệu năng một cách hợp lý. Để có tính mạnh mẽ, hệ thống nên đ−ợc trang bị cơ chế kiểm soát đ−ợc tình huống khác th−ờng (thậm chí ch−a phải là lỗi rõ ràng) và lỗi, chẳng hạn nh− thay đổi tôpô hệ thống, độ trễ thông điệp lớn, hoặc sự bất lực khi định vị phục vụ. Tính mạnh mẽ cũng nên đ−ợc mở rộng để phủ đ−ợc khía cạnh an toàn đối với ng−ời dùng và hệ thống. Tính tin cậy, bảo vệ và điều khiển truy nhập là trách nhiệm của HĐH phân tán. II.2. Tính trong suốt trong hệ phân tán Tính chất mấu chốt nhất phân biệt hệ phân tán với các hệ thống khác là tính trong suốt, thuật ngữ th−ờng xuyên đ−ợc nhắc trong các hệ thống phân tán. Nó là mục tiêu thúc đẩy việc che khuất đi những chi tiết phụ thuộc hệ thống mà không thích hợp đối với ng−ời dùng trong mọi hoàn cảnh và tạo ra một môi tr−ờng thuần nhất cho ng−ời dùng. Nguyên lý này đã đ−ợc thực tế hóa khi thiết kế hệ thống máy tính qua một thời gian - 28-
  29. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) dài. Tính trong suốt trở nên quan trọng hơn trong hệ thống phân tán và thực hiện khó khăn hơn chính từ tính hỗn tạp của hệ thống. Sự che khuất thông tin phụ thuộc hệ thống khỏi ng−ời dùng dựa trên việc cân bằng giữa tính đơn giản và tính hiệu quả. Một cách đáng tiếc, hai tính chất này là xung đột nhau. Bởi vậy, mong muốn một mục tiêu trong suốt hoàn toàn là không thích hợp. Hệ phân tán tốt là cố gắng đạt đ−ợc tính trong suốt cao nhất có thể đ−ợc. T−ơng tự nh− khái niệm "ảo" trong HĐH và "trừu t−ợng" trong ngôn ngữ lập trình, mục tiêu của tính trong suốt là cung cấp một cái nhìn lôgic thống nhất của một hệ thống vật lý hỗn tạp nhờ việc rút gọn hiệu quả việc nhận biết hệ thống vật lý tới cực tiểu (nói riêng, theo khía cạnh chia cắt vật lý của các đối t−ợng và điều khiển trong hệ thống). • Tính trong suốt thể hiện trong nhiều khía cạnh, d−ới đây là một số khía cạnh điển hình nhất: - Trong suốt truy nhập: Truy nhập đối t−ợng địa ph−ơng/toàn cục theo cùng một cách thức. Sự tách rời vật lý của các đối t−ợng hệ thống đ−ợc che khuất tới ng−ời dùng. - Trong suốt định vị (còn đ−ợc gọi là trong suốt tên): Ng−ời dùng không nhận biết đ−ợc vị trí của đối t−ợng. Đối t−ợng đ−ợc định vị và chỉ dẫn theo tên lôgic trong một hệ thống thống nhất. - Trong suốt di trú (còn đ−ợc gọi là độc lập định vị): là tính chất bổ sung vào trong suốt định vị theo nghĩa không những đối t−ợng đ−ợc chỉ dẫn bằng tên lôgic mà đối t−ợng còn đ−ợc di chuyển tới định vị vật lý khác mà không cần đổi tên. - Trong suốt đồng thời: cho phép chia xẻ đối t−ợng dùng chung không gặp tranh chấp. Nó t−ơng tự nh− khái niệm phân chia thời gian theo nghĩa khái quát. - Trong suốt nhân bản: đ−a ra tính nhất quán của đa thể hiện (hoặc vùng) của file và dữ liệu. Tính chất này quan hệ mật thiết với trong suốt đồng thời song đ−ợc cụ thể hơn vì file và dữ liệu là loại đối t−ợng đặc biệt, - Trong suốt song song: cho phép các hoạt động song song mà ng−ời dùng không cần biết hoạt động song song đó xẩy ra nh− thế nào, ở đâu và khi nào. Tính song song có thể không đ−ợc ng−ời dùng đặc tả. - Trong suốt lỗi: cung cấp khả năng thứ lỗi của hệ thống đ−ợc hiểu là lỗi trong hệ thống có thể đ−ợc biến đổi thành sự giảm hiệu năng hệ thống một cách mềm dẻo hơn chứ không phải chỉ là làm cực tiểu sự đổ vỡ và nguy hiểm đối với ng−ời dùng, - Trong suốt hiệu năng: cố gắng giành đ−ợc tính nhất quán và khẳng định (không cần thiết ngang bằng) mức độ hiệu năng thậm chí khi thay đổi cấu trúc hệ thống hoặc phân bố tải. Hơn nữa, ng−ời dùng không phải chịu sự chậm trễ hoặc thay đổi quá mức khi thao tác từ xa. Trong suốt hiệu năng còn đ−ợc thể hiện là hiệu năng hệ thống không bị giảm theo thời gian. - Trong suốt kích th−ớc: liên quan đến tính mềm dẻo và tiềm tàng. Nó cho phép sự tăng tr−ởng của hệ thống đ−ợc che khuất đối với ng−ời sử dụng. Kích th−ớc hệ thống không tạo ra tác động đối với nhận thức của ng−ời dùng. - Trong suốt duyệt lại chỉ dẫn rằng sự tăng tr−ởng hệ thống theo chiều dọc là tỷ lệ nghịch với sự tăng tr−ởng hệ thống theo chiều ngang. Sự duyệt lại phần mềm bị che khuất đối với ng−ời dùng. Trong suốt duyệt lại cũng đ−ợc hiểu nh− trong suốt phân đoạn. • Sau đây là một ví dụ giải thích. Tr−ớc đây khi điện thoại còn ch−a phổ biến (điện thoại liên tỉnh hiếm hoặc rất đắt), dùng điện thoại nếu khoảng cách ngắn còn dùng th− nếu ở xa để liên lạc với ng−ời quen. Tr−ờng hợp này vi phạm tính trong suốt truy nhập - 29-
  30. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) do ph−ơng pháp liên lạc là không đồng nhất. Khi điện thoại liên tỉnh phát triển, giá cả giảm, nếu dùng điện thoại cố định thì liên lạc số điện thoại nội tỉnh khác với liên lạc với số điện thoại tỉnh ngoài (chẳng hạn, bổ sung thêm mã tỉnh). Tr−ờng hợp này vi phạm trong suốt định vị. Nếu một ng−ời chuyển chỗ ở phải thay số điện thoại mới (không thể dùng số điện thoại cũ) là vi phạm tính trong suốt di trú. Một ph−ơng pháp liên lạc lý t−ởng là trên phạm vi toàn hệ thống, có thể "gặp" đối t−ợng bất kỳ chỉ bởi tên toàn cục (ký hiệu hoặc số) chẳng hạn nh− số chứng minh nhân dân. Tiếp tục các ví dụ trên đây, nếu mọi ng−ời chỉ sử dụng điện thoại di động để liên lạc với nhau thì hệ thống nh− vậy đ−ợc coi là thỏa mãn các tính chất trong suốt truy nhập, định vị và di trú. Từ phân tích trên đây, nhận thấy rằng trong suốt truy nhập, định vị, và di trú có quan hệ gần gũi nhau. Trong suốt song song, đồng thời, và hiệu năng đ−ợc thiết kế nhằm che chắn sự quản lý các hoạt động đồng thời đối với các ng−ời dùng, dựa trên các quan hệ nội tại ng−ời dùng (intrauser), liên ng−ời dùng (interuser) và liên nút (internode). Cho phép thực hiện đồng thời ở các mức thực hiện khác nhau: nội tại một ng−ời dùng, giữa các ng−ời dùng, và giữa các nút phân tán. Trong suốt nhân bản và trong suốt lỗi có quan hệ với việc duy trì tính toàn vẹn hệ thống. Trong suốt kích th−ớc và trong suốt duyệt lại cung cấp sự biến đổi uyển chuyển của hệ thống theo sự tăng tr−ởng về phần cứng và phần mềm. Danh sách trong suốt đ−ợc mô tả trên đây không phải là toàn diện. Tuy nhiên, danh sách này thích hợp với hệ phân tán. Chúng cũng đ−ợc phân lớp khi xem xét mối quan hệ với các mục tiêu thiết kế hệ điều hành. Trong suốt đồng thời và hiệu quả cung cấp tính hiệu quả. Trong suốt truy nhập, định vị, di trú và kích th−ớc liên quan đến tính mềm dẻo. Tính nhất quán liên quan tới trong suốt truy nhập, nhân bản và trong suốt hiệu năng. Cuối cùng, các trong suốt lỗi, nhân bản, và kích th−ớc liên quan tới tính mạnh mẽ của hệ thống. Bảng 2.1 cho mối liên hệ giữa mục tiêu của hệ thống với tính trong suốt. Bảng 2.1 . Phân lớp các tính trong suốt theo mục tiêu hệ thống Mục tiêu của hệ thống Tính trong suốt Hiệu quả đồng thời / song song / hiệu năng Mềm dẻo truy nhập / định vị / di trú / kích th−ớc / duyệt lại Bền vững truy nhập / nhân bản / hiệu năng Mạnh mẽ thứ lỗi / nhân bản / kích th−ớc / duyệt lại Thi hành HĐH phân tán và các thuật toán điều khiển phân tán t−ơng ứng liên quan chạt chẽ tới việc thực hiện các tính trong suốt này. Nói tóm lại, hệ phân tán cung cấp sự tách rời vật lý của các đối t−ợng, tính trong suốt đ−ợc dùng để che khuất đi tác động của sự chia tách vật lý này. Kết quả cuối cùng là ng−ời dùng nhìn hệ đa máy tính nh− một hệ máy tính đơn lôgic. Bàn luận trên đây về tính trong suốt dựa trên các tính chất của hệ thống đáng mong muốn theo quan điểm của cả ng−ời dùng lẫn hệ thống. Các bài toán chính trong HĐH phân tán cũng đ−ợc phân lớp theo tính trong suốt và đ−ợc trình bày trong bảng 2.2. Nói tóm lại, mục tiêu của HĐH phân tán là cung cấp môi tr−ờng tính toán hiệu năng cao và mạnh mẽ với việc nhận biết ít nhất về quản lý và điều khiển của các tài nguyên hệ thống phân tán. - 30-
  31. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) Bảng 2.2. Vấn đề của hệ phân tán và tính trong suốt Vấn đề chính của hệ thống Tính trong suốt Truyền thông Trong suốt liên thao tác và Đồng bộ điều khiển Thuật toán phân tán Lập lịch quá trình Trong suốt hiệu năng Nắm giữ bế tắc Cân bằng tải Lập lịch tài nguyên Trong suốt tài nguyên Chia xẻ file Điều khiển đồng thời Kiểm soát lỗi Trong suốt lỗi Cấu hình Thu gọn II.3. Các dịch vụ HĐH đ−ợc coi là "nhà" cung cấp dịch vụ và để thiết kế hiệu quả các dịch vụ này thì chúng nên đ−ợc tổ chức và xây dựng theo phân cấp. Nh− vậy, dịch vụ đ−ợc tạo nên từ các dịch vụ đã có và chúng ta nhận đ−ợc một cấu trúc nhiều mức dịch vụ: dịch vụ nguyên thủy, dịch vụ từ phục vụ hệ thống và dịch vụ gia tăng giá trị. 2.3.1 Dịch vụ nguyên thủy Dịch vụ nguyên thủy là mức thấp nhất trong hệ thống các mức dịch vụ, chúng là những dịch vụ cơ bản nhất, chúng tồn tại trong nhân của HĐH mỗi nút trong hệ thống. Dịch vụ nguyên thủy, bắt buộc phải đ−ợc đ−a vào nhân của HĐH: điều này t−ơng ứng với cách tiệm cận "nhân tối thiểu" (vi nhân) của HĐH tập trung. Ba dịch vụ (chức năng) cơ bản mà nhân buộc phải cung cấp đ−ợc định danh nh− sau: - Dịch vụ truyền thông: Trong hệ phân tán, truyền thông giữa các QT đ−ợc thực hiện nhờ CTĐ, một tập các dịch vụ nguyên thủy gửi và nhận buộc phải đ−ợc xác định và thi hành. Các dịch vụ nguyên thủy này truyền tin theo kênh lôgic. - Gửi và nhận có thể đồng bộ hoặc dị bộ. Truyền thông đồng bộ thêm vào phục vụ mục đích truyền thông, đ−ợc phát triển từ đồng bộ truyền thông liên QT (tại một nút) nhằm giúp ích cho truyền thông liên nút. Nếu CTĐ chỉ theo nghĩa t−ơng tác QT, đồng bộ QT phải dựa vào truyền thông hoặc chính ngữ nghĩa đồng bộ của truyền thông hoặc bởi các phục vụ đồng bộ nào đó dựa trên CTĐ. Tr−ớc hết cần có các dịch vụ nguyên thủy đồng bộ (syschronous primitive), còn đ−ợc gọi là dịch vụ kết khối (blocking primitive). Đối ngẫu với chúng là nguyên thủy dị bộ (asyschronous primitive) hay dịch vụ không kết khối (nonblocking primitive). Ngoài ra còn có các cặp dịch vụ nguyên thủy buffer (buffered primitive/ unbuffered primitive) và cặp các dịch vụ nguyên thủy tin cậy (reliable primitive/ unreliable primitive). - Vì yêu cầu che đậy sự phụ thuộc vật lý trong hệ phân tán, mô tả bộ xử lý đa thành phần nh− là một phục vụ QT là phù hợp hơn. Dịch vụ QT quản lý việc phát sinh, loại bỏ và điều chỉnh các QT bằng cách định vị các tài nguyên cần thiết, chẳng hạn nh− bộ nhớ và thời gian xử lý. Việc giải đáp vấn đề bộ xử lý là cục bộ hay từ xa, yêu cầu bao nhiêu bộ xử lý rỗi tới các QT là trong suốt. Phục vụ QT t−ơng tác với các phục vụ QT khác thông qua truyền thông từ xa và đồng bộ. - 31-
  32. Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1) 2.3.2. Dịch vụ từ phục vụ hệ thống Có rất nhiều dịch vụ tuy rất cần thiết song không bắt buộc phải đ−a vào nhân, các dịch vụ này đ−ợc các phục vụ hệ thống cung cấp. D−ới đây là một số dịch vụ điển hình nhất đ−ợc liệt kê theo mức độ quan hệ với hệ thống phân tán. Chức năng che giấu đối t−ợng vật lý bằng tên lôgic đòi hỏi tồn tại cơ chế ánh xạ tên lôgic thành đối t−ợng vật lý. Địa chỉ của một QT hay định vị một file có thể thu đ−ợc theo cách ad-hoc (không dự tính tr−ớc), nh−ng nói chung là qua xem xét của phục vụ tên hoặc phục vụ th− mục. Phục vụ tên th−ờng đ−ợc dùng để định vị (định danh) ng−ời dùng, QT, hoặc máy còn phục vụ th− mục th−ờng đ−ợc dùng để liên kết với file hoặc cổng truyền thông. Nếu không thể định vị đ−ợc phục vụ thì phục vụ là vô dụng vì vậy mọi phục vụ cần đ−ợc định vị bởi dịch vụ tên. Nh− vậy phục vụ tên là phục vụ thiết yếu nhất trong hệ phân tán. Việc thu đ−ợc địa chỉ và định vị từ phục vụ tên phụ thuộc hệ thống và buộc phải đ−ợc giải thích thành đ−ờng truyền thông tr−ớc khi đối t−ợng đ−ợc truy nhập. Các dịch vụ giải thích này, gồm chọn đ−ờng đi và chọn lộ trình thực sự của thông tin, là các dịch vụ đ−ợc cung cấp bởi phục vụ mạng. Phục vụ mạng đ−ợc trong suốt theo mức độ HĐH. Việc truyền phát TĐ trong mạng mà ch−a dùng đến khả năng hỗ trợ hiệu quả của phần cứng cần tới một phục vụ truyền phát hay phục vụ khuyếch tán trong HĐH. Phục vụ quan trọng tiếp theo là phục vụ thời gian. Đồng hồ (tổng quát hơn là bộ thời gian) đ−ợc dùng để đồng bộ và lập lịch các hoạt động phần cứng và phần mềm trong mọi hệ thống máy tính. Về mặt lý thuyết thì không thể đ−a vào hay chấp nhận một thông tin đồng hồ tổng thể tuyệt đối. Thậm chí có tồn tại một đồng hồ trung tâm (kiểu thời gian Greenwich) thì độ lệch thời gian vẫn xuất hiện do độ trễ khi tiếp nhận và ghi thông tin thời gian. Trong hệ phân tán, độ lệch này càng lớn do độ lệch truyền thông giữa các QT dài hơn. Tại nức HĐH, có hai kiểu sử dụng thông tin thời gian điển hình để đồng bộ các QT: (1) đòi hỏi một xấp xỉ gần gũi thời gian (chẳng hạn thời đoạn CPU phục vụ một QT) với đồng hồ thời gian thực và (2) sử dụng đồng hồ thời gian nhân tạo nhằm duy trì quan hệ nhân quả thứ tự sự kiện (sự kiện nào xuất hiện tr−ớc trong hai sự kiện). T−ơng ứng, chúng đ−ợc gọi là đồng hồ vật lý và đồng hồ lôgic. Mục đích dùng đồng hồ vật lý là đảm bảo tính đồng bộ thao tác hoặc đòi hỏi rằng thao tác thực sự đ−ợc giải quyết tại một thời điểm thời gian thực. Thời gian buộc phải phù hợp nhờ một độ đo thực sự nào đó song việc có gần gũi với thời gian thế giới thực hay không là không quan trọng. Đồng bộ các QT sử dụng đồng hồ lôgic do cần duy trì một thứ tự tổng thể việc xuất hiện các sự kiện nhằm tin chắc chắn vào tính đúng đắn về sự phụ thuộc lẫn nhau của các thao tác. Phục vụ thời gian cho đồng hồ vật lý dựa trên việc xấp xỉ tốt nhất đồng hồ thời gian "thực". Giải pháp thực hiện đồng bộ đồng hồ logic là hợp lý và đ−ợc thực hiện bằng đồng hồ lôgic Lamport xuất hiện tr−ớc. Phục vụ tên và phục vụ thời gian là các phục vụ thông tin. Thông th−ờng, còn đòi hỏi thêm các phục vụ hệ thống khác nhằm quản lý tài nguyên hệ thống đ−ợc chia xẻ. Ví dụ quen thuộc đó là phục vụ file và phục vụ in. Phục vụ file có thể đ−ợc nhân bản hay tách nếu file không biến đổi. Các phục vụ có thể đ−ợc cấu trúc thứ bậc, chẳng hạn, phục vụ file có thể chứa các phục vụ con th− mục hoặc an toàn để điều khiển truy nhập và xác nhận quyền; phục vụ QT có thể bổ sung thành một phục vụ di trú với sự cộng tác của phục vụ QT để thuận tiện chuyển QT từ nút này sang nút khác. Trong một hệ thống phân tán rộng lớn mà các QT truyền thông có thể nghi ngại nhau, cần đến một phục vụ xác định tin cậy để xác định định danh quá trình. Phục vụ hệ thống cung cấp những dịch vụ cơ sở để quản lý quá trình, file, truyền thông quá trình. - 32-