Đề cương bài giảng Lý thuyết cơ sở dữ liệu

pdf 155 trang hapham 90
Bạn đang xem 20 trang mẫu của tài liệu "Đề cương bài giảng Lý thuyết cơ sở dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfde_cuong_bai_giang_ly_thuyet_co_so_du_lieu.pdf

Nội dung text: Đề cương bài giảng Lý thuyết cơ sở dữ liệu

  1. Đề cương bài giảng : Lý thuyết cơ sở dữ liệu Bởi: Khoa CNTT ĐHSP KT Hưng Yên
  2. Đề cương bài giảng : Lý thuyết cơ sở dữ liệu Bởi: Khoa CNTT ĐHSP KT Hưng Yên Phiên bản trực tuyến: Hoc lieu Mo Vietnam - Vietnam Open Educational Resources
  3. Tài liệu này và sự biên tập nội dung có bản quyền thuộc về Khoa CNTT ĐHSP KT Hưng Yên. Tài liệu này tuân thủ giấy phép Creative Commons Attribution 3.0 ( Tài liệu được hiệu đính bởi: August 19, 2010 Ngày tạo PDF: August 20, 2010 Để biết thông tin về đóng góp cho các module có trong tài liệu này, xem tr. 146.
  4. Nội dung 1 Bài 1: Các khái niệm về hệ cơ sở dữ liệu 1.1 Các khái niệm cơ bản về hệ cơ sở dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 Bài 2: Mô hình thực thể - Liên kết 2.1 Mô hình thực thể - Liên kết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 Bài 3: Tổng kết mô hình thực thể liên kết - Câu hỏi ôn tập 3.1 Tổng kết mô hình thực thể - liên kết và câu hỏi ôn tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4 Bài 4: Mô hình quan hệ, các rằng buộc quan hệ 4.1 Mô hình quan hê, các rằng buộc quan hệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5 Bài 5: Chuyển đổi mô hình ER thành mô hình quan hệ 5.1 Chuyển đổi mô hình ER thành mô hình quan hệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 6 Bài 6: Các phép toán đại số quan hệ 6.1 Các phép toán đại số quan hệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 7 Bài 7: Các nguyên tắc thiết kế lược đồ quan hệ và phụ thuộc hàm 7.1 Các nguyên tắc thiết kế lược đồ quan hệ và phụ thuộc hàm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 8 Bài 8: Chuẩn hóa lược đồ quan hệ 8.1 Chuẩn hóa lược đồ quan hệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 9 Bài 9: Tổng kết và kểm tra giữa kỳ 9.1 Tổng kết và kiểm tra giữa kỳ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 10 Bài 10: Giới thiệu ngôn ngữ truy vấn cấu trúc (SQL) 10.1 Giới thiệu ngôn ngữ truy vấn cấu trúc (SQL) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 11 Bài 11: Thực hành câu lệnh create database, create table, alter table, drop table 11.1 Thực hành câu lệnh create database, create table, alter table, drop table . . . . . . . . . . . . . . . . . . 95 12 Bài 12: Truy vấn dữ liệu 12.1 Truy vấn dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 13 Bài 13: Thực hành truy vấn cơ bản 13.1 Thực hành truy vấn cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 14 Bài 14: Phép hợp, toán tử UNION, EXISTS, IN và Truy vấn lồng 14.1 Phép hợp, toán tử UNION, EXISTS, IN và Truy vấn lồng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 15 Bài 15: Thực hành các phép toán tập hợp và truy vấn lồng 15.1 Thực hành các phép toán tập hợp và truy vấn lồng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 16 Bài 16: Hàm kết hợp và gom nhóm 16.1 Hàm kết hợp và gom nhóm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 17 Bài 17: Thực hành hàm kết hợp và gom nhóm 17.1 Thực hành hàm kết hợp và gom nhóm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 18 Bài 18: Một số dạng truy vấn khác và câu lệnh cập nhật dữ liệu 18.1 Một số dạng truy vấn khác và câu lệnh cập nhật dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
  5. iv 19 Bài 19: Thực hành một số dạng truy vấn khác và câu lệnh cập nhật dữ liệu 19.1 Thực hành một số dạng truy vấn khác và câu lệnh cập nhật dữ liệu . . . . . . . . . . . . . . . . . . . . . . 141 20 Tài liệu tham khảo 145 Attributions 146
  6. Chương 1 Bài 1: Các khái niệm về hệ cơ sở dữ liệu 1.1 Các khái niệm cơ bản về hệ cơ sở dữ liệu1 Các cơ sở dữ liệu và các hệ cơ sở dữ liệu đã trở thành một thành phần chủ yếu trong cuộc sống hàng ngày của xã hội hiện đại. Trong vòng một ngày con người có thể có nhiều hoạt động cần có sự giao tiếp với cơ sở dữ liệu như: đến ngân hàng để rút tiền và gửi tiền, đăng ký chỗ trên máy bay hoặc khách sạn, truy cập vào thư viện đã tin học hoá để tìm sách báo, đặt mua tạp chí ở một nhà xuất bản Tại các ngân hàng, các cửa hàng, người ta cũng cập nhật tự động việc quản lý tiền bạc, hàng hoá. Tất cả các giao tiếp như trên được gọi là các ứng dụng của cơ sở dữ liệu truyền thống. Trong các cơ sở dữ liệu truyền thống, hầu hết các thông tin được lưu giữ và truy cập là văn bản hoặc số. Những năm gần đây, những tiến bộ về kỹ thuật đã đưa đến những ứng dụng mới của cơ sở dữ liệu. Các cơ sở dữ liệu đa phương tiện bây giờ có thể lưu trữ hình ảnh, phim và tiếng nói. Các hệ thống thông tin địa lý có thể lưu trữ và phân tích các bản đồ, các dữ liệu về thời tiết và các ảnh vệ tinh. Kho dữ liệu và các hệ thống phân tích trực tuyến được sử dụng trong nhiều công ty để lấy ra và phân tích những thông tin có lợi từ các cơ sở dữ liệu rất lớn nhằm đưa ra các quyết định. Các kỹ thuật cơ sở dữ liệu động và thời gian thực được sử dụng trong việc kiểm tra các tiến trình công nghiệp và sản xuất. Các kỹ thuật tìm kiếm cơ sở dữ liệu đang được áp dụng cho World Wide Web để cung cấp việc tìm kiếm các thông tin cần thiết cho người sử dụng bằng cách duyệt qua Internet. Để hiểu được các cơ sở kỹ thuật của cơ sở dữ liệu chúng ta phải bắt đầu từ các cơ sở kỹ thuật của cơ sở dữ liệu truyền thống. Mục đích của giáo trình này là nghiên cứu các cơ sở kỹ thuật đó. Trong bài này chúng ta sẽ định nghĩa cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, mô hình cơ sở dữ liệu và các thuật ngữ cơ bản khác. 1.1.1 Cơ sở dữ liệu 1.1.1.1 Định nghĩa cơ sở dữ liệu Cơ sở dữ liệu và kỹ thuật cơ sở dữ liệu đã có ảnh hưởng rất lớn đến việc sử dụng máy tính. Có thể nói rằng cơ sở dữ liệu đóng vai trò quan trọng trong mọi lĩnh vực có sử dụng máy tính như giáo dục, thương mại, kỹ nghệ, khoa học, thư viện, Thuật ngữ cơ sở dữ liệu trở thành một thuật ngữ phổ dụng. Một cơ sở dữ liệu là một tập hợp các dữ liệu có liên quan với nhau, được lưu trữ trên máy tính, có nhiều người sử dụng và được tổ chức theo một mô hình. Dữ liệu là những sự kiện có thể ghi lại được và có ý nghĩa. Ví dụ, để quản lý việc học tập trong một môi trường đại học, các dữ liệu là các thông tin về sinh viên, về các môn học, điểm thi Chúng ta tổ chức các dữ liệu đó thành các bảng và lưu giữ chúng vào sổ sách 1This content is available online at . 1
  7. 2 CHƯƠNG 1. BÀI 1: CÁC KHÁI NIỆM VỀ HỆ CƠ SỞ DỮ LIỆU hoặc sử dụng một phần mềm máy tính để lưu giữ chúng trên máy tính. Ta có một tập các dữ liệu có liên quan đến nhau và mang nhiều ý nghĩa, đó là một cơ sở dữ liệu. 1.1.1.2 Các tính chất của một cơ sở dữ liệu Một cơ sở dữ liệu có các tính chất sau: 1. Một cơ sở dữ liệu biểu thị một khía cạnh nào đó của thế giới thực như hoạt động của một công ty, một nhà trường, một ngân hàng Những thay đổi của thế giới thực phải được phản ánh một cách trung thực vào trong cơ sở dữ liệu. Những thông tin được đưa vào trong cơ sở dữ liệu tạo thành một không gian cơ sở dữ liệu hoặc là một “thế giới nhỏ” (miniworld) . 2. Một cơ sở dữ liệu là một tập hợp dữ liệu liên kết với nhau một cách logic và mang một ý nghĩa cố hữu nào đó. Một cơ sở dữ liệu không phải là một tập hợp tuỳ tiện. 3. Một cơ sở dữ liệu được thiết kế và được phổ biến cho một mục đích riêng. Nó có một nhóm người sử dụng có chủ định và có một số ứng dụng được xác định phù hợp với mối quan tâm của người sử dụng. Nói cách khác, một cơ sở dữ liệu có một nguồn cung cấp dữ liệu, một mức độ tương tác với các sự kiện trong thế giới thực và một nhóm người quan tâm tích cực đến các nội dung của nó. Một cơ sở dữ liệu có thể có cỡ tuỳ ý và có độ phức tạp thay đổi. Có những cơ sở dữ liệu chỉ gồm vài trăm bản ghi (như cơ sở dữ liệu phục vụ việc quản lý lương ở một cơ quan nhỏ), và có những cơ sở dữ liệu có dung lượng rất lớn (như các cơ sở dữ liệu phục vụ cho việc tính cước điện thoại, quản lý nhân sự trên một phạm vi lớn). Các cơ sở dữ liệu phải được tổ chức quản lý sao cho những người sử dụng có thể tìm kiếm dữ liệu, cập nhật dữ liệu và lấy dữ liệu ra khi cần thiết. Một cơ sở dữ liệu có thể được tạo ra và duy trì một cách thủ công và cũng có thể được tin học hoá. Một cơ sở dữ liệu tin học hoá được tạo ra và duy trì bằng bằng một nhóm chương trình ứng dụng hoặc bằng một hệ quản trị cơ sở dữ liệu. 1.1.2 Hệ quản trị cơ sở dữ liệu 1.1.2.1 Định nghĩa hệ quản trị cơ sở dữ liệu Một hệ quản trị cơ sở dữ liệu là một tập hợp chương trình giúp cho người sử dụng tạo ra, duy trì và khai thác một cơ sở dữ liệu. Nó là một hệ thống phần mềm phổ dụng, làm cho quá trình định nghĩa, xây dựng và thao tác cơ sở dữ liệu trở nên dễ dàng cho các ứng dụng khác nhau. Định nghĩa một cơ sở dữ liệu bao gồm việc đặc tả các kiểu dữ liệu, các cấu trúc và các ràng buộc cho các dữ liệu sẽ được lưu trữ trong cơ sở dữ liệu. Xây dựng một cơ sở dữ liệu là quá trình lưu trữ các dữ liệu trên các phương tiện lưu trữ được hệ quản trị cơ sở dữ liệu kiểm soát. Thao tác một cơ sở dữ liệu bao gồm các chức năng như truy vấn cơ sở dữ liệu để lấy ra các dữ liệu cụ thể, cập nhật cơ sở dữ liệu để phản ánh các thay đổi trong thế giới nhỏ và tạo ra các báo cáo từ các dữ liệu. Các hệ quản trị cơ sở dữ liệu dùng để thể hiện một cơ sở dữ liệu tin học hoá có thể là phổ dụng (là một phần mềm đóng gói) hoặc có thể là chuyên dụng (là một tập các phần mềm được tạo ra với một mục đích riêng). Người ta gọi cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu bằng một thuật ngữ chung là hệ cơ sở dữ liệu. Môi trường của một hệ cơ sở dữ liệu được mô tả bằng hình . Người sử dụng / Người lập trình
  8. 3 Figure 1.1: Môi trường của một hệ cơ sở dữ liệu 1.1.2.2 Các chức năng của một hệ quản trị cơ sở dữ liệu Một hệ quản trị cơ sở dữ liệu hiện nay có các chức năng sau: 1. Lưu trữ các định nghĩa, các mối liên kết dữ liệu (gọi là siêu dữ liệu) vào một từ điển dữ liệu. Các chương trình truy cập đến cơ sở dữ liệu làm việc thông qua hệ quản trị cơ sở dữ liệu. Hệ quản trị cơ sở dữ liệu sử dụng dữ liệu trong từ điển dữ liệu để tìm kiếm các cấu trúc thành phần dữ liệu và các mối liên kết được yêu cầu. Mọi sự thay đổi trong các tệp cơ sở dữ liệu sẽ được tự động ghi lại vào từ điển dữ liệu. Như
  9. 4 CHƯƠNG 1. BÀI 1: CÁC KHÁI NIỆM VỀ HỆ CƠ SỞ DỮ LIỆU vậy, hệ quản trị cơ sở dữ liệu giải phóng người sử dụng khỏi việc lập trình cho các mối liên kết phức tạp trong mỗi chương trình, việc sửa đổi các chương trình truy cập đến tệp cơ sở dữ liệu đã bị sửa đổi. Nói cách khác, hệ quản trị cơ sở dữ liệu loại bỏ sự phụ thuộc giữa dữ liệu và cấu trúc ra khỏi hệ thống. 2. Tạo ra các cấu trúc phức tạp theo yêu cầu để lưu trữ dữ liệu. Nó giúp người sử dụng làm nhiệm vụ khó khăn là định nghĩa và lập trình cho các đặc trưng vật lý của dữ liệu. 3. Biến đổi các dữ liệu được nhập vào để phù hợp với các cấu trúc dữ liệu ở điểm 2. Như vậy, hệ quản trị cơ sở dữ liệu giúp người sử dụng phân biệt dạng logic và dạng vật lý của dữ liệu. Bằng việc duy trì sự độc lập dữ liệu, hệ quản trị cơ sở dữ liệu chuyển các yêu cầu logic thành các lệnh định vị một cách vật lý và lấy ra các dữ liệu yêu cầu. Điều đó cũng có nghĩa là hệ quản trị cơ sở dữ liệu tạo khuôn dạng cho các dữ liệu được lấy ra để làm cho nó phù hợp với mong muốn logic của người sử dụng. 4. Tạo ra một hệ thống bảo mật và áp đặt tính bảo mật và riêng tư trong cơ sở dữ liệu. 5. Tạo ra các cấu trúc phức tạp cho phép nhiều người sử dụng truy cập đến dữ liệu 1. Cung cấp các thủ tục sao lưu và phục hồi dữ liệu để đảm bảo sự an toàn và toàn vẹn dữ liệu. 7. Xúc tiến và áp đặt các quy tắc an toàn để loại bỏ vấn đề toàn vẹn dữ liệu. Điều đó cho phép ta làm tối thiểu sự dư thừa dữ liệu và làm tối đa tính nhất quán dữ liệu. 8. Cung cấp việc truy cập dữ liệu thông qua một ngôn ngữ truy vấn. Một ngôn ngữ truy vấn là một ngôn ngữ phi thủ tục cho phép người sử dụng chỉ ra cái gì cần phải làm mà không cần phải chỉ ra nó được làm như thế nào. Các hệ quản trị cơ sở dữ liệu cũng cung cấp việc truy cập dữ liệu cho những người lập trình thông qua các ngôn ngữ thủ tục. 1.1.2.3 Các đặc trưng của giải pháp cơ sở dữ liệu Trước khi khái niệm cơ sở dữ liệu ra đời, hệ thống tệp (file) là một phương pháp được áp dụng trong việc quản lý. Một tệp có thể được xem là một cặp hồ sơ lưu trữ các thông tin liên quan đến từng công việc riêng biệt. Ví dụ, trong một cơ quan, bộ phận tài vụ sẽ có một cặp hồ sơ liên quan đến lương của các nhân viên, bộ phận tổ chức có cặp hồ sơ liên quan đến vấn đề nhân sự Việc xử lý để lấy ra các thông tin như là các thống kê về lương, về quá trình công tác lúc đầu được thực hiện một cách thủ công. Dần dần, khối lượng thông tin ngày càng lớn, việc xử lý thông tin ngày càng phức tạp, người ta sử dụng máy tính vào việc quản lý. Các cặp hồ sơ được chuyển thành các tệp trên máy tính và việc xử lý thông tin được thực hiện bằng cách lập trình (trong một ngôn ngữ lập trình thế hệ 3). Việc quản lý theo giải pháp hệ thống tệp có rất nhiều nhược điểm. Thứ nhất, đó là sự dư thừa thông tin: cùng một thông tin được lưu trữ nhiều lần (chẳng hạn, danh sách nhân viên có mặt trong tệp lương và cũng có mặt cả trong tệp nhân sự). Điều đó gây ra việc lãng phí bộ nhớ và dễ gây sai sót trong khi cập nhật dữ liệu, dễ sinh ra các dữ liệu không đúng đắn. Thứ hai, đó là việc phụ thuộc giữa chương trình ứng dụng và dữ liệu. Mỗi khi có sự thay đổi cấu trúc tệp và các dữ liệu trong tệp, chương trình ứng dụng khai thác thông tin trên tệp đó cũng thay đổi theo. Điều đó gây ra khó khăn lớn cho việc bảo trì. Giải pháp cơ sở dữ liệu ra đời đã giải quyết được những nhược điểm đó. Cụ thể, giải pháp cơ sở dữ liệu có những đặc trưng sau: 1. Bản chất tự mô tả của hệ cơ sở dữ liệu. Một đặc trưng cơ bản của giải pháp cơ sở dữ liệu là hệ thống cơ sở dữ liệu không chỉ gồm có bản thân cơ sở dữ liệu mà còn có cả định nghĩa hoặc mô tả đầy đủ về cấu trúc cơ sở dữ liệu và các ràng buộc. Định nghĩa này được lưu trữ trong từ điển hệ thống, nó chứa các thông tin như là cấu trúc của mỗi tệp, kiểu và dạng lưu trữ của từng mục dữ liệu. Các thông tin được lưu giữ trong từ điển gọi là siêu dữ liệu (meta-data) và chúng mô tả cấu trúc của dữ liệu nguyên thuỷ (hình 1-1). Phần mềm hệ quản trị cơ sở dữ liệu và những người sử dụng cơ sở dữ liệu sử dụng từ điển để lấy thông tin về cấu trúc của cơ sở dữ liệu. 2. Sự độc lập giữa chương trình và dữ liệu. Trong hệ thống tệp, cấu trúc của các tệp cơ sở dữ liệu được nhúng vào trong các chương trình truy cập, vì vậy bất kỳ một thay đổi nào về cấu trúc của một tệp cũng đòi hỏi phải thay đổi tất cả các chương trình truy cập đến tệp đó. Ngược lại, các chương trình truy cập của hệ quản trị cơ sở dữ liệu không đòi hỏi việc
  10. 5 thay đổi như thế. Cấu trúc của các tệp dữ liệu được lưu trữ trong từ điển tách rời với các chương trình truy cập. Tính chất này gọi là sự độc lập dữ liệu – chương trình. 3. Hỗ trợ các khung nhìn dữ liệu nhiều thành phần. Một cơ sở dữ liệu có nhiều người sử dụng, mỗi một người có thể đòi hỏi một phối cảnh hoặc một khung nhìn (view) khác nhau. Một khung nhìn có thể là một tập con của cơ sở dữ liệu hoặc nó có thể chứa các dữ liệu ảo, đó là các dữ liệu được trích ra từ các tệp cơ sở dữ liệu khác nhau nhưng không được lưu trữ một cách rõ ràng. Một hệ quản trị cơ sở dữ liệu nhiều người sử dụng phải cung cấp nhiều công cụ để định nghĩa các khung nhìn nhiều thành phần. 4. Chia sẻ dữ liệu và nhiều người sử dụng. Một hệ quản trị cơ sở dữ liệu nhiều người sử dụng phải cho phép nhiều người sử dụng truy cập đồng thời đến cơ sở dữ liệu. Hệ quản trị cơ sở dữ liệu phải có phần mềm kiểm tra cạnh tranh để đảm bảo rằng các người sử dụng cập nhật đến cùng một cơ sở dữ liệu phải được thực hiện theo cách được kiểm tra để cho kết quả của các cập nhật là đúng đắn. 1.1.2.4 Ví dụ về một cơ sở dữ liệu Chúng ta hãy xem xét một cơ sở dữ liệu mà nhiều người đã quen biết: cơ sở dữ liệu TRƯỜNG. Cơ sở dữ liệu này lưu giữ các thông tin liên quan đến sinh viên, các môn học, điểm trong một môi trường đại học. Cơ sở dữ liệu được tổ chức thành 5 bảng, mỗi bảng lưu trữ các bản ghi dữ liệu cùng một kiểu. Bảng SINHVIÊN lưu giữ dữ liệu về các sinh viên, bảng MÔNHỌC lưu giữ các dữ liệu về các môn học, bảng HỌCPHẦN lưu giữ các dữ liệu về các học phần của các môn học, bảng ĐIỂM lưu giữ điểm của từng học phần của các sinh viên và bảng BIẾTTRƯỚC lưu giữ thông tin về các môn học cần biết trước của các môn học. Cấu trúc của cơ sở dữ liệu và một vài mẫu dữ liệu ví dụ được trình bày ở hình.
  11. 6 CHƯƠNG 1. BÀI 1: CÁC KHÁI NIỆM VỀ HỆ CƠ SỞ DỮ LIỆU Figure 1.2: Cơ sở dữ liệu TRƯỜNG
  12. 7 Figure 1.3: Cơ sở dữ liệu TRƯỜNG Để định nghĩa cơ sở dữ liệu này, chúng ta phải chỉ ra cấu trúc của các bản ghi của mỗi tệp (bảng) bằng cách đặc tả các kiểu khác nhau của các phần tử dữ liệu sẽ được lưu trữ trong mỗi bản ghi. Theo hình 1-2 , mỗi bản ghi SINHVIÊN bao gồm các dữ liệu để biểu diễn Mã số sinh viên, Họ tên sinh viên, Lớp, Chuyên ngành. Mỗi bản ghi MÔNHỌC bao gồm các dữ liệu để biểu diễn Tên môn học, Mã số môn học, Số đơn vị học trình, Khoa, Chúng ta phải chỉ ra một kiểu dữ liệu cho mỗi phần tử dữ liệu bên trong các bản ghi. Ví dụ, ta có thể đặc tả Họ tên sinh viên là một dãy ký tự có độ dài nhỏ hơn hoặc bằng 30, Mã số sinh viên là một số nguyên, Để xây dựng cơ sở dữ liệu TRƯỜNG, chúng ta lưu giữ các dữ liệu để biểu diễn mỗi sinh viên, mỗi môn học, vào các tệp thích hợp. Để ý rằng các bản ghi trong các tệp khác nhau có thể có mối quan hệ với nhau. Ví dụ, bản ghi đối với Nguyễn Nam trong tệp SINHVIÊN có liên quan đến hai bản ghi trong tệp ĐIỂM. Các bản ghi này chỉ ra điểm của Nguyễn Nam trong hai học phần. Tương tự như vậy, các bản ghi trong tệp có mối quan hệ với các bản ghi trong tệp MÔNHỌC Thông thường một cơ sở dữ liệu chứa nhiều kiểu bản ghi và chứa nhiều mối quan hệ giữa các tệp. Thao táccơ sở dữ liệu bao gồm việc truy vấn và cập nhật cơ sở dữ liệu. Truy vấn cơ sở dữ liệu là đưa ra các yêu cầu đối với cơ sở dữ liệu để lấy ra các thông tin cần thiết. Ví dụ, chúng ta có thể có các truy vấn như: “Liệt kê các môn học và điểm thi của sinh viên Nguyễn Nam”, “ Đưa ra danh sách các sinh viên thi trượt môn cơ sở dữ liệu”. Cập nhật cơ sở dữ liệu bao gồm việc thêm vào cơ sở dữ liệu bản ghi, xoá bỏ các bản ghi hoặc sửa đổi các giá trị trong các bản ghi. Các truy vấn và các cập nhật phải được đặc tả trong ngôn ngữ hệ cơ sở dữ liệu một cách chính xác trước khi chúng được xử lý.
  13. 8 CHƯƠNG 1. BÀI 1: CÁC KHÁI NIỆM VỀ HỆ CƠ SỞ DỮ LIỆU 1.1.3 Mô hình cơ sở dữ liệu Các loại cấu trúc cơ sở dữ liệu và mối liên hệ giữa chúng đóng vai trò rất lớn trong việc xác định tính hiệu quả của hệ quản trị cơ sở dữ liệu. Vì vậy, thiết kế cơ sở dữ liệu trở thành hoạt động chính trong môi trường cơ sở dữ liệu. Việc thiết kế cơ sở dữ liệu được thực hiện đơn giản hơn nhiều khi ta sử dụng các mô hình. Các mô hình là sự trừu tượng đơn giản của các sự kiện trong thế giới thực. Các trừu tượng như vậy cho phép ta khảo sát các đặc điểm của các thực thể và các mối liên hệ được tạo ra giữa các thực thể đó. Việc thiết kế các mô hình tốt sẽ đưa ra các cơ sở dữ liệu tốt và trên cơ sở đó sẽ có các ứng dụng tốt. Ngược lại, mô hình không tốt sẽ đưa đến thiết kế cơ sở dữ liệu tồi và dẫn đến các ứng dụng không đúng. Một mô hình cơ sở dữ liệu là một tập hợp các khái niệm dùng để biểu diễn các cấu trúc của cơ sở dữ liệu. Cấu trúc của một cơ sở dữ liệu là các kiểu dữ liệu, các mối liên kết và các ràng buộc phải tuân theo trên các dữ liệu. Nhiều mô hình còn có thêm một tập hợp các phép toán cơ bản để đặc tả các thao tác trên cơ sở dữ liệu. 1.1.3.1 Các loại mô hình cơ sở dữ liệu Có rất nhiều mô hình dữ liệu đã được đề nghị. Chúng ta có thể phân loại các mô hình dữ liệu dựa trên các khái niệm mà chúng sử dụng để mô tả các cấu trúc cơ sở dữ liệu. Các mô hình dữ liệu bậc cao hoặc mô hình dữ liệu mức quan niệm cung cấp các khái niệm gắn liền với cách cảm nhận dữ liệu của nhiều người sử dụng. Các mô hình này tập trung vào bản chất logic của biểu diễn dữ liệu, nó quan tâm đến cái(đối tượng) được biểu diễn trong cơ sở dữ liệu chứ không phải cách biểu diễn dữ liệu. Các mô hình dữ liệu bậc thấp hoặc các mô hình dữ liệu vật lý cung cấp các khái niệm mô tả chi tiết về việc các dữ liệu được lưu trữ trong máy tính như thế nào. Các khái niệm do mô hình dữ liệu vật lý cung cấp nói chung có ý nghĩa đối với các chuyên gia máy tính chứ không có ý nghĩa mấy đối với người sử dụng thông thường. Ở giữa hai loại mô hình này là một lớp các mô hình dữ liệu thể hiện, chúng cung cấp những khái niệm mà người sử dụng có thể hiểu được và không xa với cách tổ chức dữ liệu bên trong máy tính. Người ta còn gọi loại mô hình dữ liệu này là loại mô hình dữ liệu mức logic. Các mô hình dữ liệu thể hiện che giấu một số chi tiết về việc lưu trữ dữ liệu nhưng có thể được cài đặt trực tiếp trên hệ thống máy tính. Trong những bài sau chúng ta sẽ nghiên cứu một mô hình dữ liệu mức quan niệm, mô hình thực thể - liên kết, gọi tắt là mô hình ER (Entity – Relationship Model). Mô hình này sử dụng các khái niệm thực thể, thuộc tính, mối liên kết, để diễn đạt các đối tượng của thế giới thực. Một thực thể diễn đạt một đối tượng hoặc một khái niệm của thế giới thực. Ví dụ, một thực thể là một nhân viên hoặc một dự án được mô tả trong cơ sở dữ liệu. Một thuộc tính diễn đạt một đặc trưng nào đó của thực thể. Chẳng hạn, họ tên, lương là các thuộc tính của thực thể nhân viên. Một mối liên kết giữa hai hay nhiều thực thể diễn đạt một mối quan hệ qua lại giữa các thực thể. Ví dụ, giữa thực thể nhân viên và thực thể dự án có mối liên kết một nhân viên làm việc trên một dự án. Mô hình dữ liệu hướng đối tượng cũng là một mô hình dữ liệu bậc cao. Nó sử dụng các khái niệm như lớp, phương thức, thông điệp Các mô hình dữ liệu thể hiện là các mô hình được sử dụng thường xuyên nhất trong các hệ cơ sở dữ liệu thương mại. Ba mô hình nổi tiếng thuộc loại này là mô hình quan hệ, mô hình mạng và mô hình phân cấp. Các mô hình mạng và phân cấp ra đời trước và được sử dụng rộng rãi trong quá khứ (trước 1970). Vào đầu những năm 70, mô hình quan hệ ra đời. Do tính ưu việt của nó, mô hình quan hệ dần dần thay thế các mô hình mạng và phân cấp. Chúng ta sẽ nghiên cứu về mô hình quan hệ trong những bài sau. Các mô hình dữ liệu vật lý mô tả cách lưu trữ dữ liệu trong máy tính giới thiệu các thông tin như khuôn dạng bản ghi, sắp xếp bản ghi, đường truy cập. 1.1.3.2 Lược đồ và trạng thái cơ sở dữ liệu Trong một mô hình dữ liệu cần phải phân biệt rõ giữa mô tả của cơ sở dữ liệu và bản thân cơ sở dữ liệu. Mô tả của một cơ sở dữ liệu được gọi là lược đồ cơ sở dữ liệu, nó được xác định rõ trong quá trình thiết kế cơ sở dữ liệu và không bị thay đổi thường xuyên. Đa số các mô hình dữ liệu có các quy ước hiển thị các lược
  14. 9 đồ. Hiển thị của một lược đồ được gọi là biểu đồ của lược đồ đó. Một biểu đồ lược đồ chỉ thể hiện một vài khía cạnh của lược đồ như là các kiểu bản ghi, các mục dữ liệu và một số kiểu ràng buộc. Các khía cạnh khác không được thể hiện trong biểu đồ lược đồ. Các dữ liệu trong một cơ sở dữ liệu có thể thay đổi một cách thường xuyên. Các dữ liệu trong một cơ sở dữ liệu tại một thời điểm cụ thể được gọi là một trạng thái cơ sở dữ liệu hoặc là ảnh (snapshot) của cơ sở dữ liệu. Nhiều trạng thái quan hệ có thể được xây dựng để làm tương ứng với một lược đồ cơ sở dữ liệu cụ thể. Mỗi khi chúng ta chèn vào hoặc loại bỏ một bản ghi, sửa đổi giá trị của một mục dữ liệu trong một bản ghi, chúng ta đã làm thay đổi trạng thái của cơ sở dữ liệu sang một trạng thái khác. Việc phân biệt giữa lược đồ cơ sở dữ liệu và trạng thái cơ sở dữ liệu là rất quan trọng. Khi chúng ta định nghĩa một cơ sở dữ liệu mới, ta chỉ đặc tả lược đồ cơ sở dữ liệu cho hệ quản trị cơ sở dữ liệu. Tại thời điểm này, trạng thái của cơ sở dữ liệu là một trạng thái rỗng, không có dữ liệu. Chúng ta nhận được trạng thái ban đầu của cơ sở dữ liệu khi ta nhập dữ liệu lần đầu tiên. Từ đó trở đi, mỗi khi một phép toán cập nhật được thực hiện đối với cơ sở dữ liệu, chúng ta nhận được một trạng thái cơ sở dữ liệu khác. Tại mọi thời điểm, cơ sở dữ liệu có một trạng thái hiện tại. Hệ quản trị cơ sở dữ liệu có trách nhiệm đảm bảo rằng mỗi trạng thái cơ sở dữ liệu là một trạng thái vững chắc, nghĩa là một trạng thái thoả mãn cấu trúc và các ràng buộc được đặc tả trong lược đồ. Vì vậy, việc đặc tả một lược đồ đúng đắn cho hệ quản trị cơ sở dữ liệu là một việc làm cực kỳ quan trọng và lược đồ phải được thiết kế một cách cẩn thận. Hệ quản trị cơ sở dữ liệu lưu trữ các mô tả của các cấu trúc lược đồ và các ràng buộc – còn gọi là siêu dữ liệu – vào trong từ điển (catalog) của hệ quản trị sao cho phần mềm hệ quản trị cơ sở dữ liệu có thể tham khảo đến lược đồ khi nó cần. Đôi khi người ta còn gọi lược đồ là mục tiêu (intension) và trạng thái cơ sở dữ liệu là mở rộng (extension) của lược đồ. 1.1.4 Con người trong hệ cơ sở dữ liệu Với một cơ sở dữ liệu lớn, rất nhiều người tham gia vào việc thiết kế, sử dụng và duy trì cơ sở dữ liệu. Những người liên quan đến hệ cơ sở dữ liệu được chia thành hai nhóm chính. Nhóm thứ nhất gồm những người mà công việc của họ liên quan hàng ngày đến cơ sở dữ liệu, đó là những người quản trị cơ sở dữ liệu, thiết kế cơ sở dữ liệu, sử dụng cơ sở dữ liệu, phân tích hệ thống và lập trình ứng dụng. Nhóm thứ hai gồm những người làm việc để duy trì môi trường hệ cơ sở dữ liệu nhưng không quan tâm đến bản thân cơ sở dữ liệu, đó là những người thiết kế và cài đặt hệ quản trị cơ sở dữ liệu, phát triển công cụ, thao tác viên và bảo trì. Người quản trị hệ cơ sở dữ liệu (Database Administrator – DBA) Trong một tổ chức có nhiều người cùng sử dụng các tài nguyên, cần phải có một người giám sát và quản lý. Trong môi trường hệ cơ sở dữ liệu, các tài nguyên là cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu và các phần mềm liên quan. Người quản trị hệ cơ sở dữ liệu là người chịu trách nhiệm quản lý các tài nguyên đó. Người này chịu trách nhiệm về việc cho phép truy cập cơ sở dữ liệu, tổ chức và hướng dẫn việc sử dụng cơ sở dữ liệu, cấp các phần mềm và phần cứng theo yêu cầu. 1.1.4.1 Người thiết kế cơ sở dữ liệu (Database Designer) Người này chịu trách nhiệm xác định các dữ liệu sẽ được lưu giữ trong cơ sở, chọn các cấu trúc thích hợp để biểu diễn và lưu giữ các dữ liệu đó. Những nhiệm vụ này được thực hiện trước khi cơ sở dữ liệu được cài đặt và phổ biến. Người thiết kế có trách nhiệm giao thiệp với những người sử dụng tương lai để hiểu được các đòi hỏi của họ và đưa ra một thiết kế thoả mãn các yêu cầu đó. Anh ta cũng có nhiệm vụ giao thiệp với các nhóm người sử dụng và có khả năng hỗ trợ các yêu cầu của các nhóm. 1.1.4.2 Những người sử dụng (End User) Những người sử dụng là những người mà công việc của họ đòi hỏi truy cập đến cơ sở dữ liệu để truy vấn, cập nhật và sinh ra các thông tin. Có thể chia những người sử dụng thành hai nhóm chính: những người sử dụng thụ động (tức là những người sử dụng không có nhiều kiến thức về hệ cơ sở dữ liệu) và những người sử dụng chủ động (là những người có hiểu biết tốt về hệ cơ sở dữ liệu).
  15. 10 CHƯƠNG 1. BÀI 1: CÁC KHÁI NIỆM VỀ HỆ CƠ SỞ DỮ LIỆU Chức năng công việc của những người sử dụng thụ động (chiếm phần lớn những người sử dụng) gắn liền với việc truy vấn và cập nhật thường xuyên cơ sở dữ liệu bằng cách sử dụng các câu hỏi và các cập nhật chuẩn (gọi là các giao tác định sẵn) đã được lập trình và kiểm tra cẩn thận. Những người này chỉ cần học một ít về các phương tiện do hệ quản trị cơ sở dữ liệu cung cấp và hiểu các kiểu giao tác chuẩn đã được thiết kế và cài đặt là đủ. Những người sử dụng chủ động có hiểu biết tốt về hệ cơ sở dữ liệu, họ có thể tự cài đặt các ứng dụng riêng của mình để làm thoả mãn các yêu cầu phức tạp của họ. Người phân tích hệ thống và lập trình ứng dụng Người phân tích hệ thống xác định các yêu cầu của những người sử dụng (chủ yếu là những người sử dụng thụ động) để đặc tả các chương trình phù hợp với yêu cầu của họ. Người viết chương trình ứng dụng thể hiện các đặc tả của những người phân tích thành chương trình, sau đó kiểm thử, sửa lỗi làm tài liệu và bảo trì các giao tác định sẵn. Người thiết kế và cài đặt hệ quản trị dữ liệu Đó là những người thiết kế, cài đặt các mô đun, giao diện của hệ quản trị cơ sở dữ liệu thành các phần mềm đóng gói. Một hệ quản trị cơ sở dữ liệu là một hệ thống phần mềm phức tạp bao gồm nhiều thành phần (mô đun). Đó là các mô đun cài đặt từ điển dữ liệu, ngôn ngữ truy vấn, bộ xử lý giao diện, truy cập dữ liệu, kiểm tra cạnh tranh, phục hồi và an toàn. Hệ quản trị cơ sở dữ liệu phải giao tiếp với các hệ thống phần mềm khác như hệ điều hành và các chương trình dịch cho nhiều ngôn ngữ khác nhau. Những người phát triển công cụ Là những người thiết kế và cài đặt các công cụ (tool), đó là các phần mềm đóng gói làm dễ việc thiết kế và sử dụng cơ sở dữ liệu. Các thao tác viên và những người bảo trì Là những người chịu trách nhiệm về việc chạy và bảo trì phần cứng và phần mềm của hệ thống. Ngôn ngữ cơ sở dữ liệu và giao diện Các ngôn ngữ hệ quản trị cơ sở dữ liệu Một khi việc thiết kế cơ sở dữ liệu đã hoàn thành, cần phải chọn một hệ quản trị cơ sở dữ liệu để cài đặt cơ sở dữ liệu. Trong các hệ quản trị cơ sở dữ liệu hiện nay thường có các ngôn ngữ: ngôn ngữ định nghĩa dữ liệu (data definition language – DDL) và ngôn ngữ thao tác dữ liệu (data manipulation language – DML). Ngôn ngữ định nghĩa dữ liệu được sử dụng để định nghĩa các lược đồ. Hệ quản trị cơ sở dữ liệu có một chương trình dịch ngôn ngữ DDL, nhiệm vụ của nó là xử lý các câu lệnh DDL để xác định mô tả của cấu trúc lược đồ và lưu trữ mô tả lược đồ vào từ điển của hệ quản trị cơ sở dữ liệu. Ngôn ngữ thao tác cơ sở dữ liệu được sử dụng để thao tác cơ sở dữ liệu. Các thao tác chính gồm có lấy ra, chèn vào, loại bỏ và sửa đổi các dữ liệu. Có hai kiểu ngôn ngữ thao tác dữ liệu chính: ngôn ngữ thao tác dữ liệu mức cao hoặc ngôn ngữ phi thủ tục hoặc ngôn ngữ thao tác dữ liệu mức thấp. Ngôn ngữ thao tác dữ liệu mức cao có thể được sử dụng để diễn đạt các phép toán cơ sở dữ liệu một cách ngắn gọn. Phần lớn các hệ quản trị cơ sở dữ liệu cho phép nhập các lệnh của ngôn ngữ thao tác dữ liệu mức cao theo cách lặp (nghĩa là sau khi nhập một lệnh, hệ thống sẽ thực hiện lệnh đó rồi mới nhập lệnh tiếp theo) hoặc được nhúng vào một ngôn ngữ lập trình vạn năng. Trong trường hợp nhúng vào ngôn ngữ khác, các lệnh của ngôn ngữ thao tác dữ liệu phải được xác định bên trong chương trình sao cho một chương trình tiền dịch có thể nhận ra chúng và được hệ quản trị cơ sở dữ liệu xử lý. Ngôn ngữ thao tác cơ sở dữ liệu mức thấp hoặc ngôn ngữ thủ tục phải được nhúng vào trong một ngôn ngữ lập trình vạn năng. Ngôn ngữ thao tác cơ sở dữ liệu kiểu này thường rút ra các bản ghi hoặc các đối tượng riêng rẽ và xử lý chúng một cách riêng rẽ. Vì vậy, chúng cần phải sử dụng các cấu trúc ngôn ngữ lập trình như vòng lặp, điều kiện, để rút ra từng bản ghi một từ một tập các bản ghi. Ngôn ngữ thao tác dữ liệu mức thấp được gọi là ngôn ngữ “một lần một bản ghi”. Các ngôn ngữ thao tác dữ liệu mức cao có thể dùng một lệnh để rút ra một lúc nhiều bản ghi nên chúng được gọi là ngôn ngữ “một lần một tập hợp”. Các loại giao diện hệ quản trị cơ sở dữ liệu Các hệ quản trị cơ sở dữ liệu cung cấp rất nhiều loại giao diện người dùng thân thiện. Các loại giao diện chính gồm có: Giao diện dựa trên bảng chọn:Các giao diện này cung cấp cho người sử dụng danh sách các lựa chọn, gọi là bảng chọn (menu) và hướng dẫn người sử dụng diễn đạt một yêu cầu từ đầu đến cuối. Các bảng chọn làm
  16. 11 cho người sử dụng không cần nhớ các lệnh và cú pháp của ngôn ngữ truy vấn. Các bảng chọn thả xuống đã trở thành kỹ thuật phổ biến trong các giao diện dựa trên cửa sổ. Chúng thường được sử dụng trong các giao diện quét, cho phép người sử dụng nhìn thấy nội dung của một cơ sở dữ liệu theo cách không có cấu trúc. Giao diện dựa trên mẫu biểu: Các giao diện này hiển thị một mẫu biểu cho người sử dụng. Những người sử dụng có thể điền vào tất cả các ô của mẫu biểu để nhập các dữ liệu mới hoặc họ chỉ điền vào một số ô còn hệ quản trị cơ sở dữ liệu sẽ đưa ra các dữ liệu phù hợp cho các ô khác. Các mẫu biểu thường được thiết kế và được lập trình cho các người dùng đơn giản. Một số hệ thống có các tiện ích giúp người sử dụng từng bước xây dựng một mẫu biểu trên màn hình. Giao diện đồ hoạ: Một giao diện đồ hoạ (GUI) thường hiển thị một lược đồ cho người sử dụng dưới dạng biểu đồ. Người dùng có thể thực hiện một truy vấn bằng cách thao tác trên biểu đồ. Trong nhiều trường hợp, GUI sử dụng cả các bảng chọn và các mẫu biểu. Đa số các GUI sử dụng các công cụ trỏ như chuột, phím để kích các phần của sơ đồ. Giao diện cho người quản trị hệ thống: Đa số các hệ quản trị cơ sở dữ liệu có các lệnh ưu tiên, chỉ có những người quản trị hệ thống mới sử dụng các lệnh đó. Đó là các lệnh tạo ra các tài khoản (account), đặt các tham số cho hệ thống, cấp các tài khoản, thay đổi lược đồ hoặc tổ chức lại các cấu trúc lưu trữ của cơ sở dữ liệu. 1.1.5 Câu hỏi ôn tập 1. Định nghĩa các thuật ngữ: cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, hệ cơ sở dữ liệu, từ điển cơ sở dữ liệu, mô hình cơ sở dữ liệu. 2. Nêu các tính chất của một cơ sở dữ liệu 3. Nêu các chức năng của một hệ quản trị cơ sở dữ liệu 4. Giải thích các đặc trưng của giải pháp cơ sở dữ liệu 5. Định nghĩa mô hình cơ sở dữ liệu và phân loại 6. Liệt kê các người có liên quan đến hệ cơ sở dữ liệu.
  17. 12 CHƯƠNG 1. BÀI 1: CÁC KHÁI NIỆM VỀ HỆ CƠ SỞ DỮ LIỆU
  18. Chương 2 Bài 2: Mô hình thực thể - Liên kết 2.1 Mô hình thực thể - Liên kết1 Trong bài này chúng ta sẽ làm quen với mô hình thực thể - liên kết, gọi tắt là mô hình ER ( Entity- Relationship Model). Đó là một mô hình dữ liệu mức quan niệm phổ biến, tập trung vào các cấu trúc dữ liệu và các ràng buộc. Mô hình này thường được sử dụng để thiết kế các ứng dụng cơ sở dữ liệu và nhiều công cụ thiết kế cơ sở dữ liệu sử dụng các khái niệm của nó. 2.1.1 Sử dụng mô hình quan niệm bậc cao cho việc thiết kế cơ sở dữ liệu Quá trình thiết kế một cơ sở dữ liệu sử dụng mô hình quan niệm bậc cao được minh họa bằng hình dưới đây. Bước đầu tiên là tập hợp các yêu cầu và phân tích. Trong bước này, người thiết kế cơ sở dữ liệu phỏng vấn những người sử dụng cơ sở dữ liệu để hiểu và làm tài liệu về các yêu cầu về dữ liệu của họ. Kết quả của bước này là một tập hợp ghi chép súc tích về các yêu cầu của những người sử dụng. Những yêu cầu sẽ được đặc tả càng đầy đủ và chi tiết càng tốt. Song song với việc đặc tả các yêu cầu dữ liệu, cần phải đặc tả các yêu cầu về chức năng của ứng dụng: đó là các thao tác do người sử dụng định nghĩa sẽ được áp dụng đối với cơ sở dữ liệu. Mỗi khi tất cả các yêu cầu đã được thu thập và phân tích, bước tiếp theo là tạo ra lược đồ quan niệm cho cơ sở dữ liệu bằng cách sử dụng mô hình dữ liệu quan niệm mức cao. Bước này gọi là thiết kế quan niệm. Lược đồ quan niệm là một mô tả súc tích về các yêu cầu dữ liệu của những người sử dụng. Nó bao gồm các mô tả chi tiết của các kiểu thực thể, kiểu liên kết và các ràng buộc, chúng được biểu diễn bằng các khái niệm do các mô hình dữ liệu bậc cao cung cấp. Vì những khái niệm này không chứa các chi tiết cài đặt, chúng thường dễ hiểu và có thể sử dụng chúng để giao lưu với những người sử dụng. Lược đồ quan niệm mức cao cũng có thể được sử dụng như một dẫn chứng để đảm bảo rằng tất cả các đòi hỏi của người sử dụng đều thỏa mãn và các đòi hỏi này không chứa các mâu thuẫn. Giải pháp này cho phép những người thiết kế cơ sở dữ liệu tập trung vào việc đặc tả các tính chất của dữ liệu mà không cần quan tâm đến các chi tiết lưu trữ. Một thiết kế cơ sở dữ liệu quan niệm tốt sẽ làm dễ cho công việc của những người thiết kế cơ sở dữ liệu. Trong quá trình (hoặc sau khi) thiết kế lược đồ quan niệm, chúng ta có thể sử dụng các phép toán cơ bản của mô hình dữ liệu để đặc tả các thao tác của người sử dụng được xác định trong khi phân tích chức năng. Điều đó cũng giúp khẳng định rằng lược đồ quan niệm thỏa mãn mọi yêu cầu chức năng được xác định. Nếu có một số yêu cầu chức năng không thể nêu ra được trong lược đồ ban đầu thì ở bước này có thể có sự sửa đổi lược đồ quan niệm cho phù hợp. Bước tiếp theo trong việc thiết kế cơ sở dữ liệu là việc cài đặt một cơ sở dữ liệu bằng cách sử dụng một hệ quản trị cơ sở dữ liệu có sẵn. Hầu hết các hệ quản trị cơ sở dữ liệu sử dụng một mô hình dữ liệu cài đặt 1This content is available online at . 13
  19. 14 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT (thể hiện), chẳng hạn như mô hình quan hệ hoặc đối tượng, vì vậy lược đồ quan niệm được chuyển từ mô hình dữ liệu bậc cao thành mô hình dữ liệu cài đặt. Bước này gọi là thiết kế logic hoặc là ánh xạ mô hình dữ liệu. Kết quả của bước này là một lược đồ cơ sở dữ liệu dưới dạng một mô hình dữ liệu cài đặt của hệ quản trị cơ sở dữ liệu. Bước cuối cùng trong thiết kế cơ sở dữ liệu là thiết kế vật lý. Trong bước này ta phải chỉ ra các cấu trúc bên trong, các đường dẫn truy cập, tổ chức tệp cho các tệp cơ sở dữ liệu. Song song với các hoạt động đó, các chương trình ứng dụng cũng được thiết kế và cài đặt như là các giao tác (transaction) cơ sở dữ liệu tương ứng với các đặc tả giao tác mức cao.
  20. 15 Figure 2.1: Sơ đồ mô tả các bước chính của việc thiết kế
  21. 16 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT 2.1.2 Các thành phần cơ bản của mô hình ER 2.1.2.1 Thực thể và thuộc tính Đối tượng được trình bày trong mô hình ER là thực thể. Thực thể là một “vật” trong thế giới thực, có sự tồn tại độc lập. Một thực thể có thể là cụ thể, tức là chúng ta có thể cảm nhận được bằng các giác quan, hoặc có thể là trừu tượng, tức là cái mà chúng ta không cảm nhận được bằng các giác quan nhưng có thể nhận biết được bằng nhận thức. Một cái ô tô, một nhân viên, là những thực thể cụ thể. Một đơn vị công tác, một trường học là những thực thể trừu tượng. Mỗi một thực thể có các thuộc tính, đó là các đặc trưng cụ thể mô tả thực thể đó. Ví dụ, một thực thể Nhânviên được mô tả bằng Họtên, Tuổi, Địachỉ, Lương của nhân viên đó. Một thực thể cụ thể sẽ có một giá trị cho mỗi thuộc tính của nó. Ví dụ, nhân viên nv1 có các giá trị cho các thuộc tính Họtên, Tuổi, Địachỉ, Lương của nó là “ Lê Vân”, 32, “Hà nội”, 500000. Các giá trị thuộc tính mô tả mỗi thực thể sẽ trở thành một phần chính của các dữ liệu sẽ được lưu giữ trong cơ sở dữ liệu. Trong mô hình ER có mặt nhiều kiểu thuộc tính: thuộc tính đơn, thuộc tính phức hợp, thuộc tính đơn trị, thuộc tính đa trị, thuộc tính được lưu trữ, thuộc tính suy diễn được, thuộc tính có giá trị không xác định, thuộc tính phức tạp. Thuộc tính đơn là thuộc tính không thể phân chia ra được thành các thành phần nhỏ hơn. Ví dụ, thuộc tính Tuổi của một nhân viên là một thuộc tính đơn. Thuộc tính phức hợp là thuộc tính có thể phân chia được thành các thành phần nhỏ hơn, biểu diễn các thuộc tính cơ bản hơn với các ý nghĩa độc lập. Ví dụ, thuộc tính Họtên của thực thể nhân viên có thể phân chia thành các tính Họđệm và Tên. Giá trị của một thuộc tính là sự kết hợp kết hợp các giá trị của các thuộc tính thành phần tạo nên nó. Việc phân chia một thuộc tính phức hợp thành các thuộc tính đơn tùy thuộc vào hoàn cảnh cụ thể. Những thuộc tính có giá trị duy nhất cho một thực thể cụ thể gọi là các thuộc tính đơn trị. Ví dụ, Họtên là một thuộc tính đơn trị của thực thể nhân viên, mỗi nhân viên có một họ tên duy nhất. Trong một số trường hợp, một thuộc tính có thể có một tập giá trị cho cùng một thực thể. Những thuộc tính như vậy gọi là thuộc tính đa trị. Ví dụ, thuộc tính Bằngcấp của một người. Một người có thể không có bằng cấp nào, người khác có thể có một bằng, người khác nữa có thể có nhiều bằng. Như vậy, các người khác nhau có thể có một số giá trị khác nhau cho thuộc tính Bằngcấp. Thuộc tính Bằngcấp là một thuộc tính đa trị. Thuộc tính được lưu trữ là các thuộc tính mà giá trị của nó được nhập vào khi cài đặt cơ sở dữ liệu. Trong một số trường hợp, hai hay nhiều thuộc tính có giá trị liên quan đến nhau. Ví dụ, thuộc tính Tuổi và thuộc tính Ngàysinh của một người. Với một người cụ thể, ta có thể tính tuổi của anh ta bằng cách lấy năm hiện tại trừ đi năm của Ngàysinh. Thuộc tính mà giá trị của nó có thể tính được thông qua giá trị của các thuộc tính khác gọi là thuộc tính suy diễn được. Các giá trị không xác định (null values): Trong một số trường hợp, một thực thể cụ thể có thể không có các giá trị áp dụng được cho một thuộc tính. Ví dụ, thuộc tính Sốđiệnthoại của thực thể nhân viên sẽ không có giá trị đối với các nhân viên không có số điện thoại. Trong trường hợp như vậy, ta phải tạo ra một giá trị đặc biệt gọi là giá trị không xác định (null). Giá trị không xác định được tạo ra khi một thuộc tính có giá trị không áp dụng được hoặc khi không biết. Các thuộc tính phức tạp: Là sự kết hợp của các thuộc tính phức hợp và đa trị. 2.1.2.2 Kiểu thực thể, tập thực thể, khóa và tập giá trị Các kiểu thực thể và các tập thực thể : Một cơ sở dữ liệu thường chứa những nhóm thực thể như nhau. Ví dụ, một công ty thuê hàng trăm nhân viên và lưu giữ những thông tin tương tự liên quan đến mỗi nhân viên. Các thực thể nhân viên này chia sẻ các thuộc tính giống nhau nhưng mỗi thực thể có các giá trị riêng cho các thuộc tính đó. Một kiểu thực thể là một tập hợp các thực thể có các thuộc tính như nhau. Một kiểu thực thể trong cơ sở dữ liệu được mô tả bằng tên và các thuộc tính. Vídụ: NHAˆNVIÊN (Họtên, Tuổi, Lương), CÔNGTY (Tên, Địađiểm, Giámđốc). Một tập hợp các thực thể của một kiểu thực thể cụ thể trong cơ sở dữ liệu tại một thời điểm được gọi là một tập thực thể, nó thường được tham chiếu đến bằng cách sử dụng tên của kiểu thực thể. Ví dụ, NHAˆNVIÊN vừa dùng để chỉ một kiểu thực thể, vừa để chỉ tập hợp hiện tại của tất cả các thực thể nhân viên trong cơ sở dữ liệu. Hình 2-2 minh họa các kiểu thực thể NHAˆNVIÊN, CÔNGTY và các tập thực thể tương ứng.
  22. 17 Một kiểu thực thể được biểu diễn trong lược đồ ER như là một hộp hình chữ nhật có chứa tên kiểu thực thể. Các thuộc tính được đặt trong các hình ô van và được nối với các kiểu thực thể bằng các đường thẳng. Các thuộc tính phức hợp cũng được nối với các thuộc tính thành phần của nó bằng đường thẳng. Các thuộc tính đa trị được hiển thị trong các hình ô van đúp (hình 2-3). Một kiểu thực thể mô tả một lược đồ (hoặc một mục đích) cho một tập các thực thể chia sẻ cùng một cấu trúc. Tập hợp các thực thể của một kiểu thực thể cụ thể được nhóm vào một tập thực thể và được gọi là một thể hiện của một kiểu thực thể. Figure 2.2: Kiểu thực thể và tập thực thể Thuộc tính khóa của một kiểu thực thể: Một ràng buộc quan trọng trên các thực thể của một kiểu thực thể là khóa. Một kiểu thực thể thường có một thuộc tính mà các giá trị của nó là khác nhau đối với mỗi thực
  23. 18 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT thể tiêng biệt trong một tập thực thể. Thuộc tính như vậy gọi là thuộc tính khóa và các giá trị của nó có thể dung để xác định từng thực thể một cách duy nhất. Ví dụ, thuộc tính Tên của kiểu thực thể CÔNGTY là khóa của kiểu thực thể đó vì mỗi thực thể công ty có một tên duy nhất. Đôi khi, nhiều thuộc tính kết hợp với nhau tạo thành một khóa, nghĩa là tổ hợp các giá trị của các thuộc tính này phải khác nhau đối với mỗi thực thể. Trong trường hợp như vậy ta có một thuộc tính khóa phức hợp. Chú ý rằng khóa phức hợp phải tối thiểu, nghĩa là tất cả các thuộc tính thành phần phải có mặt trong thuộc tính phức hợp để thỏa mãn tính chất duy nhất. Trong biểu đồ đồ họa của mô hình ER, thuộc tính khóa được biểu diễn bằng cách gạch ngang dưới tên của nó (hình 2-3). Khi chỉ ra rằng một thuộc tính là khóa của một kiểu thực thể nghĩa là tính chất duy nhất nêu trên phải được thỏa mãn đối với đối với mỗi mở rộng của kiểu thực thể. Như vậy, ràng buộc khóa cấm hai thực thể bất kỳ có giá trị cho thuộc tính khóa như nhau tại cùng một thời điểm. Đó là một ràng buộc trên tất cả các thể hiện của thực thể. Ràng buộc khóa cũng như các ràng buộc sẽ được giới thiệu về sau được lấy ra từ các ràng buộc của “thế giới nhỏ” của cơ sở dữ liệu. Một kiểu thực thể có thể có nhiều hơn một thuộc tính khóa. Ví dụ, nếu một công ty có một mã số duy nhất và một tên duy nhất thì các thuộc tính Mãsốcông ty và Têncôngty đều là các thuộc tính khóa. Một kiểu thực thể cũng có thể không có khóa. Một thực thể không có khóa được gọi là kiểu thực thể yếu. Figure 2.3: Biểu diễn kiểu thực thể và các thuộc tính Miền giá trị của các thuộc tính: Mỗi thuộc tính đơn của một kiểu thực thể được kết hợp với một miền giá trị. Đó là một tập các giá trị có thể gán cho thuộc tính này đối với mỗi thực thể riêng biệt. Các miền giá trị không hiển thị trong các sơ đồ ER. Một cách toán học, một thuộc tính A của kiểu thực thể E có tập giá trị V có thể được định nghĩa như là một hàm từ E vào tập hợp lực lượng P(V) của V: A: E → P(V). Ta ký hiệu giá trị của thuộc tính A đối với thực thể e là A(e). Định nghĩa ở trên đúng cho các thuộc tính đơn trị, đa trị và thuộc tính không xác định. Một giá trị không xác định được biểu diễn bằng một tập rỗng. Với các thuộc tính đơn trị, A(e) là một giá trị đơn cho thực thể e. Các thuộc tính đa trị không có các hạn
  24. 19 chế trên A(e). Với một thuộc tính phức hợp A, tập giá trị V là tích Đề các của P(V1)x P(V2)x xP(Vn), trong đó V1,V2, ,Vn là tập các giá trị cho các thành phần đơn của A. 2.1.2.3 Kiểu liên kết, tập liên kết và các thể hiện Một kiểu liên kết R giữa n kiểu thực thể E1,E2, ,En xác định một tập liên kết giữa các thực thể của các kiểu đó. Cũng như các kiểu thực thể và tập thực thể, một kiểu liên kết và tập liên kết tương ứng với nó cũng có tên chung là R. Một cách toán học, tập liên kết R là một tập hợp các thể hiện liên kết ri , i = 1,2, trong đó mỗi ri liên kết n thực thể riêng biệt e1, e2, , en và mỗi một thực thể ej trong ri là một thành phần của kiểu thực thể Ej , 1≤ j ≤ n. Như vậy, một kiểu liên kết R là một quan hệ toán học trên E1, E2, ,En hoặc có thể định nghĩa như là một tập con của tích Đề các E1 x E2 x x En. Mỗi kiểu thực thể E1,E2, ,En được gọi là tham gia vào kiểu liên kết R, và tương tự, mỗi thực thể riêng biệt e1, e2, , en được gọi là tham gia vào thể hiện liên kết ri = ( e1,e2, ,en). Một cách không hình thức, mỗi thể hiện liên kết ri trong R là một sự kết hợp của các thực thể, mỗi thực thể thuộc về một kiểu thực thể tham gia vào liên kết. Mỗi liên kết ri như vậy diễn đạt một sự kiện rằng các thực thể tham gia trong ri có mối quan hệ với nhau theo một cách nào đó ở trong thế giới thực. Ví dụ, trong thực tế, các nhân viên làm việc cho các đơn vị, như vậy, có một kiểu liên kết liên kết làm việc cho, liên kết giữa kiểu thực thể NHAˆNVIÊN và kiểu thực thể ĐƠNVỊ. Trong sơ đồ ER, kiểu liên kết được biểu diễn bằng một hình thoi nối trực tiếp với các hình chữ nhật biểu diễn các kiểu thực thể tham gia vào liên kết. Hình 2-4 minh họa kiểu liên kết và thể hiện liên kết. a) Kiểu liên kết Figure 2.4 b) Thể hiện liên kết
  25. 20 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT Figure 2.5: Kiểu liên kết và thể hiện liên kết 2.1.2.4 Cấp liên kết, tên vai trò và kiểu liên kết đệ quy Cấp của một kiểu liên kết là số các kiểu thực thể tham gia vào kiểu liên kết đó. Một kiểu liên kết có thể có cấp 1, cấp 2, cấp 3, Ví dụ, kiểu liên kết giữa kiểu thực thể NHAˆNVIÊN và kiểu thực thể ĐƠNVỊ là một kiểu liên kết cấp 2. Kiểu liên kết giữa kiểu thực thể MÔNHỌC với chính nó là một kiểu liên kết cấp 1. Đôi khi chúng ta có thể coi một kiểu liên kết như một thuộc tính của một kiểu thực thể. Ví dụ, nếu kiểu thực thể NHAˆNVIÊN có thuộc tính Đơnvị để chỉ ra tên đơn vị mà nhân viên làm việc cho, thì thuộc tính Đơnvị biểu thị một kiểu liên kết. Nói cách khác, một thuộc tính của một kiểu thực thể hoặc có chức năng biểu thị một đặc trưng của kiểu thực thể, hoặc có chức năng biểu thị một kiểu liên kết giữa kiểu thực thể đó với các kiểu thực thể khác. Các thuộc tính biểu thị một kiểu liên kết có thể đơn trị hoặc đa trị tuỳ theo bản chất của mối liên kết. Các tên vai trò và các kiểu liên kết đệ quy: Mỗi một kiểu thực thể tham gia vào một kiểu liên kết có một vai trò cụ thể trong liên kết. Tên vai trò dùng để chỉ rõ vai trò của các thực thể của kiểu thực thể tham gia liên kết, nó giúp đỡ việc giải thích ý nghĩa của liên kết. Ví dụ, trong kiểu liên kết NHAˆNVIÊN ĐƠNVỊ, vai trò của các thực thể của kiểu thực thể NHAˆNVIÊN là nhân viên hoặc công nhân còn vai trò của các thực thể của kiểu thực thể ĐƠNVỊ là đơn vị hoặc nơi thuê công nhân. Nếu các kiểu thực thể tham gia vào kiểu liên kết là khác nhau thì tên vai trò là hoàn toàn không cần thiết bởi vì có thể sử dụng tên các kiểu thực thể làm tên vai trò. Tuy nhiên, trong một số trường hợp, một kiểu thực thể có thể tham gia vào một kiểu liên kết với các vai trò khác nhau. Trong những trường hợp như vậy, tên vai trò trở nên cần thiết để phân biệt ý nghĩa của mỗi sự tham gia. Các kiểu liên kết như vậy gọi là kiểu liên kết đệ quy. Ví dụ, trong số các nhân viên làm việc cho một đơn vị, có các nhân viên được phân công giám sát các nhân viên khác. Như vậy sẽ có một kiểu liên kết giữa các thực thể của kiểu thực thể NHAˆNVIÊN: NHAˆNVIÊN NHAˆNVIÊN. Kiểu thực thể NHAˆNVIÊN tham gia hai lần vào kiểu liên kết , một lần với vai trò người giám sát, một lần với vai trò người bị giám sát.
  26. 21 2.1.2.5 Các ràng buộc trên các kiểu liên kết Các kiểu liên kết thường có một số ràng buộc để hạn chế số các tổ hợp có thể của các thực thể có thể tham gia trong tập hợp liên kết tương ứng. Các ràng buộc này được xác định từ tình trạng của thế giới thực mà kiểu liên kết biểu diễn. Ví dụ, nếu công ty có quy chế là một nhân viên chỉ làm việc cho một đơn vị thì chúng ta phải mô tả ràng buộc này trong lược đồ. Có hai loại ràng buộc chính: tỷ số lực lượng và sự tham gia. Tỷ số lực lượng: Tỷ số lực lượng cho một kiểu liên kết chỉ ra số các thể hiện liên kết mà một thực thể có thể tham gia. Với các kiểu liên kết cấp 2, có thể có các tỷ số lực lượng 1:1, 1:N, và M:N. Một kiểu liên kết có tỷ số lực lượng 1:1 giữa hai kiểu thực thể A và B có nghĩa là trong kiểu liên kết đó, một thực thể của kiểu A chỉ liên kết với một thực thể của kiểu B và ngược lại, một thực thể của kiểu B chỉ liên kết với một thực thể của kiểu A. Tỷ số lực lượng 1:N có nghĩa là một thực thể của kiểu A có thể liên kết với nhiều thực thể của kiểu B nhưng một thực thể của kiểu B chỉ liên kết với một thực thể của kiểu A. Trong kiểu liên kết có tỷ số lực lượng M:N, mỗi thực thể của kiểu A có thể liên kết với nhiều thực thể của kiểu B và ngược lại, mỗi thực thể của kiểu B có thể liên kết với nhiều thực thể của kiểu A. Trong biểu diễn của lược đồ ER, các tỷ số lực lượng được biểu diễn bằng cách ghi 1, N, M trên các hình thoi biểu diễn kiểu liên kết . Figure 2.6: Tỷ số lực lượng của các kiểu liên kết Các ràng buộc tham gia và sự phụ thuộc tồn tại: Ràng buộc tham gia chỉ ra rằng có phải sự tồn tại của một kiểu thực thể phụ thuộc vào một kiểu thực thể khác thông qua một kiểu liên kết hay không. Có hai kiểu ràng buộc tham gia: ràng buộc tham gia toàn bộ và ràng buộc tham gia bộ phận. Tham gia toàn bộ nghĩa là tất cả các thực thể của kiểu thực thể phải tham gia vào kiểu liên kết còn tham gia bộ phận nghĩa là chỉ một bộ phận các thực thể của kiểu thực thể tham gia vào kiểu liên kết. Ví dụ, xét kiểu liên kết NHAˆNVIÊN ĐƠNVỊ. Trong thực tế, mỗi đơn vị phải có một người quản lý (là một nhân viên) nhưng không phải nhân viên nào cũng quản lý một đơn vị. Như vậy, sự tham gia của các thực thể đơn vị vào kiểu liên kết là toàn bộ còn sự tham gia của các thực thể nhân viên vào kiểu liên kết là bộ phận. Sự tham gia toàn bộ còn được gọi là sự phụ thuộc tồn tại. Trong lược đồ ER, sự tham gia toàn bộ được biểu thị bằng đường nối đôi từ kiểu thực thể đến kiểu liên kết. 2.1.2.6 Thuộc tính của các kiểu liên kết Các kiểu liên kết cũng có thể có các thuộc tính, giống như các thuộc tính của các kiểu thực thể. Ví dụ, kiểu liên kết giữa các kiểu thực thể NHAˆNVIÊN và DỰÁN có thể có thuộc tính Sốgiờ để ghi
  27. 22 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT lại số giờ làm việc của một nhân viên trên một dự án. Các thuộc tính của kiểu liên kết cũng được biểu diễn bằng một hình ô van và được nối với kiểu liên kết. Ví dụ: Figure 2.7 2.1.2.7 Các kiểu thực thể yếu Các kiểu thực thể không có các thuộc tính khoá cho chính mình được gọi là các kiểu thực thể yếu. Ngược lại, các kiểu thực thể thông thường (nghĩa là có thuộc tính khoá) được gọi là kiểu thực thể mạnh. Các thực thể của một kiểu thực thể yếu được xác định bằng cách liên kết với các thực thể cụ thể của một kiểu thực thể khác phối hợp với một số giá trị thuộc tính của nó. Ta gọi kiểu thực thể khác đó là kiểu thực thể xác định hoặc kiểu thực thể chủ. Ta gọi kiểu liên kết giữa kiểu thực thể yếu và kiểu thực thể chủ của nó là liên kết xác định của thực thể yếu. Một kiểu thực thể yếu luôn luôn có một ràng buộc tham gia toàn bộ (tồn tại phụ thuộc) vào liên kết xác định của nó bởi vì một kiểu thực thể yếu không thể được xác định mà không có kiểu thực thể chủ. Ví dụ, trong một công ty, con của nhân viên và nhân viên có thể hưởng chế độ bảo hiểm theo nhân viên. Như vậy, sẽ có một kiểu liên kết NHAˆNVIÊN . Đây là một kiểu liên kết có tỷ số lực lượng 1:N. Các thuộc tính của kiểu thực thể CON là Họtên, Ngaysinh, Giớitính. Hai người con của hai nhân viên khác nhau có thể có cùng giá trị cho các thuộc tính nhưng nó là hai thực thể khác nhau. Chúng chỉ được xác định như hai thực thể khác nhau sau khi xác định một thực thể nhân viên cụ thể có liên quan đến từng người phụ thuộc. Mỗi thực thể của kiểu thực thể NHAˆNVIÊN được gọi là chủ của các thực thể của kiểu thực thể CON liên kết với nó. Thông thường, các kiểu thực thể yếu có một khoá bộ phận, đó là một tập hợp các thuộc tính có thể xác định một cách duy nhất các thực thể yếu liên kết với cùng một thực thể chủ. Ví dụ, nếu hai người con của một nhân viên không bao giờ có tên giống nhau thì thuộc tính Họtên của kiểu thực thể CON là một khoá bộ phận. Trong trường hợp xấu nhất, thuộc tính phức hợp gồm tất cả các thuộc tính của thực thể yếu sẽ là một khoá bộ phận. Trong sơ đồ ER, kiểu thực thể yếu và kiểu liên kết xác định của nó được biểu diễn bằng một hình chữ nhật và một hình thoi nét đôi. Ví dụ:
  28. 23 Figure 2.8 2.1.3 Ví dụ về thiết kế mô hình ER Trong phần này, chúng ta xét ví dụ về việc xây dựng mô hình ER cho cơ sở dữ liệu công ty. Như ở trong phần I đã nói, bước đầu tiên trong việc thiết kế một cơ sở dữ liệu là tập hợp và phân tích các yêu cầu. Kết quả của bước này là một tập hợp các ghi chép súc tích về các yêu cầu người sử dụng cũng như tình trạng của nơi ta cần xây dựng cơ sở dữ liệu. Giả sử rằng sau khi tập hợp các yêu cầu và phân tích, hoạt động của công ty được ghi chép lại như sau: 1. Công ty được tổ chức thành các đơn vị. Mỗi đơn vị có một tên duy nhất, một mã số duy nhất, một nhân viên cụ thể quản lý đơn vị. Việc nhân viên quản lý đơn vị được ghi lại bằng ngày nhân viên đó bắt đầu quản lý. Một đơn vị có thể có nhiều địa điểm. 2. Mỗi đơn vị kiểm soát một số dự án. Một dự án có một tên duy nhất, một mã số duy nhất và một địa điểm. 3. Với mỗi nhân viên chúng ta lưu giữ lại Họ tên, Mã số, địa chỉ, lương, giới tính, ngày sinh. Một nhân viên chỉ làm việc cho một đơn vị nhưng có thể làm việc trên nhiều dự án do nhiều đơn vị kiểm soát. Chúng ta lưu giữ lại số giờ làm việc của mỗi nhân viên trên một dự án. Mỗi nhân viên có thể có một người giám sát trực tiếp, người đó cũng là một nhân viên. 4. Mỗi nhân viên có những người con. Những người này được hưởng bảo hiểm theo nhân viên. Với mỗi người con của nhân viên, chúng ta lưu giữ Họ tên, giới tính, ngày sinh . 2.1.3.1 Xác định các kiểu thực thể, các thuộc tính và các kiểu liên kết Theo các ghi chép ở trên, chúng ta có thể xác định các kiểu thực thể và các kiểu liên kết như sau: 1. CÔNGTY không phải là một kiểu thực thể vì ở đây ta có một công ty duy nhất. 2. ĐƠNVỊ là một kiểu thực thể với các thuộc tính Tên, Mãsố, Ngườiquảnlý, Ngàybắtđầu và Địađiểm. Các thuộc tính Tên, Mãsố, Địađiểm là các thuộc tính mô tả đơn vị, các thuộc tính Ngườiquảnlý, Ngàybắtđầu là các thuộc tính biểu thị một kiểu liên kết (với kiểu thực thể NHAˆNVIÊN). Các thuộc tính đều là đơn và đơn trị, trừ thuộc tính Địađiểm, nó là một thuộc tính đa trị (một đơn vị có nhiều địa điểm). Các thuộc tính Tên, Mãsố là các thuộc tính khóa (vì mỗi đơn vị có một tên và một mã số duy nhất). 3. Kiểu thực thể DỰÁN có các thuộc tính Tên, Mãsố, Địađiểm, Đơnvịkiểmsoát. Các thuộc tính Tên, Mãsố, Địa điểm là các thuộc tính mô tả DỰÁN, thuộc tính Đơnvịkiểmsoát biểu thị kiểu liên kết với kiểu thực thể ĐƠNVỊ (một đơn vị kiểm soát một số dự án). Các thuộc tính Tên, Mãsố là các thuộc tính khóa. 4. Kiểu thực NHAˆNVIÊN với các thuộc tính Họtên, Mãsố, Giới tính, Ngàysinh, Lương, Đơnvị, Ngườigiám- sát. Thuộc tính Họtên là một thuộc tính phức hợp (gồm Họđệm, Tên). Các thuộc tính Đơnvị, Ngườigiámsát mô tả các kiểu liên kết giữa kiểu thực thể NHAˆNVIÊN và các kiểu thực thể ĐƠNVỊ và NHAˆNVIÊN tương ứng. Thuộc tính Mãsố là thuộc tính khóa.
  29. 24 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT 5. Kiểu thực thể CON với các thuộc tính Nhânviên, Họtên, Giới tính, Ngàysinh. Thuộc tính Nhânviên mô tả kiểu liên kết với kiểu thực thể NHAˆNVIÊN. 6. Kiểu liên kết ĐƠNVỊ DỰÁN là kiểu liên kết có tỷ số lực lượng 1:N (một đơn vị kiểm soát một số dự án, một dự án do một đơn vị quản lý). Sự tham gia của DỰÁN vào kiểu liên kết là toàn bộ (bởi vì dự án nào cũng được một đơn vị kiểm soát). Nếu đơn vị nào cũng có dự án thì việc tham gia của ĐƠNVỊ vào kiểu liên kết là toàn bộ, ngược lại sự tham gia là bộ phận. 7. Kiểu liên kết NHAˆNVIÊN ĐƠNVỊ có tỷ số lực lượng N:1 (mỗi nhân viên làm việc cho một đơn vị nhưng mỗi đơn vị có nhiều nhân viên là việc). Sự tham gia của hai kiểu thực thể vào liên kết là toàn bộ. 8. Kiểu liên kết NHAˆNVIÊN ĐƠNVỊ có tỷ số lực lượng 1:1 (một nhân viên quản lý một đơn vị và một đơn vị có một nhân viên quản lý). Sự tham gia của kiểu thể NHAˆNVIÊN vào kiểu liên kết là bộ phận (bởi vì không phải nhân viên nào cũng quản lý đơn vị), ngược lại, sự tham gia của kiểu thực thể ĐƠNVỊ vào kiểu liên kết là toàn bộ (bởi vì đơn vị nào cũng phải có người quản lý). 9. Kiểu liên kết NHAˆNVIÊN NHAˆNVIÊN có tỷ số lực lượng 1:N (một nhân viên có thể giám sát nhiều nhân viên khác). Sự tham gia của của kiểu thực thể NHAˆNVIÊN (ở cả hai phía) là bộ phận (bởi vì không phải nhân viên nào cũng giám sát nhân viên khác, và không phải nhân viên nào cũng bị giám sát). Kiểu thực thể NHAˆNVIÊN ở đây đóng hai vai trò khác nhau: vai trò người giám sát và vai trò người bị giám sát. 10. Kiểu liên kết NHAˆNVIÊN DỰÁN là có tỷ số lực lượng là M:N (một nhân viên có thể làm việc trên nhiều dự án khác nhau và mỗi dự án có nhiều nhân viên làm việc). Sự tham gia của kiểu thực thể NHAˆNVIÊN là bộ phận (bởi vì không phải tất cả nhân viên đều làm việc trên dự án) ngược lại, sự tham gia của kiểu thực thể DỰÁN là toàn bộ (bởi vì dự án nào cũng phải có nhân viên làm việc). Kiểu liên kết này có một thuộc tính là Sốgiờ, ghi lại số giờ làm việc của một nhân viên trên một dự án. 11. Kiểu liên kết NHAˆNVIÊN CON biểu thị mối liên hệ giữa kiểu thực thể NHAˆNVIÊN và kiểu thực thể CON (một nhân viên có thể có những người con). Kiểu liên kết này có tỷ số lực lượng 1:N (một nhân viên có thể có nhiều người con nhưng mỗi con là con của chỉ một nhân viên). Sự tham gia của kiểu thực thể NHAˆNVIÊN là bộ phận (không phải nhân viên nào cũng có con), ngược lại, sự tham gia của kiểu thực thể CON là toàn bộ (người con nào cũng phải là con của một nhân viên). Ngoài ra, kiểu thực thể CON là một kiểu thực thể yếu. Sau khi phân tích như trên, để vẽ lược đồ ER ta loại bỏ các thuộc tính được xem như các kiểu liên kết ra khỏi các kiểu thực thể. Đó là các thuộc tính Ngườiquảnlý và Ngàybắtđầu của kiểu thực thể ĐƠNVỊ, thuộc tính Đơnvịkiểmsoát của kiểu thực thể DỰÁN, thuộc tính Đơnvị và thuộc tính Ngườigiámsát của kiểu thực thể NHAˆNVIÊN, thuộc tính Nhânviên của kiểu thực thể PHỤTHUỘC . Kết quả, chúng ta có lược đồ ER như sau:
  30. 25 Figure 2.9: Lược đồ ER “CÔNGTY”
  31. 26 CHƯƠNG 2. BÀI 2: MÔ HÌNH THỰC THỂ - LIÊN KẾT
  32. Chương 3 Bài 3: Tổng kết mô hình thực thể liên kết - Câu hỏi ôn tập 3.1 Tổng kết mô hình thực thể - liên kết và câu hỏi ôn tập1 Tổng kết mô hình thực thể - liên kết Bài học trước chúng ta đã thảo luận về vai trò của mô hình dữ liệu bậc cao trong quá trình thiết kế cơ sở dữ liệu. Ta đã làm quen với các khái niệm cơ bản của mô hình liên kết - thực thể: kiểu thực thể, kiểu liên kết, và các thuộc tính của chúng. Các kiểu thuộc tính khác nhau cũng đã được xem xét: thuộc tính đơn, thuộc tính phức hợp, thuộc tính đơn trị, thuộc tính đa trị, thuộc tính lưu trữ, thuộc tính suy diễn được và các thuộc tính có giá trị null. Thông qua một ví dụ cụ thể, ta đã tiến hành xây dựng mô hình ER “CÔNGTY”. 3.1.1 Câu hỏi ôn tập 1- Hãy nói về vai trò của mô hình dữ liệu bậc cao trong quá trình thiết kế cơ sở dữ liệu. 2- Liệt kê các trường hợp cần phải sử dụng giá trị null. 3- Định nghĩa các thuật ngữ sau: thực thể, thuộc tính, giá trị thuộc tính, thể hiện liên kết, thuộc tính phức hợp, thuộc tính đa trị, thuộc tính suy diễn được, thuộc tính phức tạp, thuộc tính khoá, miền giá trị. 4- Kiểu thực thể là gì? Tập thực thể là gì? Giải thích sự khác nhau giữa một thực thể, một kiểu thực thể và một tập thực thể. 5- Giải thích sự khác nhau giữa một thuộc tính và một tập giá trị. 6 - Kiểu liên kết là gì? Giải thích sự khác nhau giữa một thể hiện liên kết, một tập liên kết và một kiểu liên kết. 7- Vai trò tham gia là gì? Khi nào cần phải sử dụng các tên vai trò trong mô tả các kiểu liên kết. 8- Mô tả cách chỉ ra các ràng buộc cấu trúc trên các kiểu liên kết. 9- Với điều kiện nào một thuộc tính của một kiểu liên kết cấp 2 có thể chuyển thành một thuộc tính của một trong các kiểu thực thể tham gia vào kiểu liên kết. 10- Khi chúng ta nghĩ đến các liên kết như là các thuộc tính, các tập giá trị của các thuộc tính đó là gì? 11- Kiểu liên kết đệ quy là gì? Cho một số ví dụ về các kiểu liên kết đệ quy. 12- Khi nào khái niệm kiểu thực thể yếu được dùng trong mô hìn hoá cơ sở dữ liệu? Định nghĩa các thuật ngữ: kiểu thực thể chủ, kiểu thực thể yếu, khoá bộ phận, kiểu liên kết xác định. 1This content is available online at . 27
  33. 28 CHƯƠNG 3. BÀI 3: TỔNG KẾT MÔ HÌNH THỰC THỂ LIÊN KẾT - CÂU HỎI ÔN TẬP 3.1.2 Bài tập 3.1.2.1 Bài 1: Xây dựng mô hình ER cho cơ sở dữ liệu TRƯỜNG Hãy xây dựng lược đồ ER cho CSDL “TRƯỜNG”, dựa trên các ghi chép sau: 1) Trường được chia thành các trường con: Trường KHTN, Trường KHXH, Trường Công nghệ, Mỗi trường có một hiệu trưởng quản lý. Mỗi hiệu trưởng quản lý một trường. 2) Mỗi trường có nhiều khoa. Chẳng hạn, trường KHTN có các khoa Toán, Lý, Hoá, Mỗi một khoa chỉ thuộc về một trường. Thông tin về Khoa gồm Mã khoa, tên khoa, địa chỉ, số điện thoại, tên trường. 3) Mỗi Khoa cung cấp nhiều môn học. Mỗi môn học gồm có Tên môn học, mã số, số đơn vị học trình, trình độ, tên Khoa. 4) Mỗi môn học có thể có nhiều học phần.Mỗi học phần được lưu giữ bằng các thông tin: Mã học phần, Tên môn học, Tên giáo viên dạy, học kỳ. 5) Mỗi khoa có nhiều giáo viên làm việc, nhưng mỗi giáo viên chỉ làm việc cho một khoa. Mỗi một khoa có một chủ nhiệm khoa, đó là một giáo viên. 6) Mỗi giáo viên có thể dạy nhiều nhất là 4 học phần và cũng có thể không dạy học phần nào. 7) Mỗi sinh viên phải học nhiều học phần. 8) Mỗi một khoa có nhiều sinh viên, mỗi sinh viên chỉ thuộc về một khoa. Thông tin về mỗi sinh viên gồm: Mã sinh viên, Họ tên, địa chỉ, ngày sinh, giới tính, Lớp, Tên Khoa và chế độ đào tạo. 9) Mỗi sinh viên có một người giám sát (giáo viên chủ nhiệm), người đó là một giáo viên. 10) Sau mỗi học kỳ sẽ có một danh sách điểm để phân loại. Nó gồm các thông tin: Mã sinh viên, mã học phần, điểm bằng chữ, điểm bằng số. 3.1.2.2 Bài 2: Xây dựng mô hình ER cho cơ sở dữ liệu THƯ VIỆN. Hãy xây dựng lược đồ ER cho CSDL “THƯ VIỆN”, dựa trên các ghi chép sau: 1) Thư viện được chia ra thành các nhánh. Thông tin về mỗi nhánh gồm có Mã nhánh, Tên nhánh và Địa chỉ. 2) Mỗi cuốn sách trong thư viện có các thông tin về Mã sách, Tên sách Nhà xuất bản và Tác giả 3) Một tác giả có thể viết nhiều cuốn sách. Một cuốn sách có thể có nhiều tác giả viết. 4) Một nhà xuất bản xuất bản nhiều cuốn sách. Một cuốn sách do một nhà xuất bản xuất bản. Thông tin về Nhà xuất bản gồm có Tên, Địachỉ và Sốđiệnthoại. 5) Một cuốn sách có thể có nhiều bản sao được lưu trữ tại các nhánh. Thông tin về bản sao sách gồm Mã sách, số các bản sao. 6) Thư viện có những người mượn sách. Thông tin về những người mượn sách gồm có Số thẻ, Họ tên, Địa chỉ và Số điện thoại. 7) Sách được cho các người mượn mượn tại các nhánh. Thông tin về một lần mượn gồm có Ngày mượn và ngày trả.
  34. Chương 4 Bài 4: Mô hình quan hệ, các rằng buộc quan hệ 4.1 Mô hình quan hê, các rằng buộc quan hệ1 Mô hình quan hệ được Ted Codd đưa ra đầu tiên vào năm 1970 và gây được chú ý ngay tức khắc vì tính đơn giản và các cơ sở toán học của nó. Mô hình quan hệ sử dụng khái niệm quan hệ toán học như là khối xây dựng cơ sở và có cơ sở lý thuyết của nó trong lý thuyết tập hợp và logic vị từ bậc nhất. Trong chương này chúng ta sẽ nói về các đặc trưng cơ bản của mô hình, các ràng buộc của chúng và tập hợp các phép toán của mô hình quan hệ. 4.1.1 Các khái niệm của mô hình quan hệ Mô hình quan hệ biểu thị cơ sở dữ liệu như một tập các quan hệ. Mỗi quan hệ có thể được biểu diễn như một bảng giá trị, mỗi một dòng trong bảng biểu thị một tấp hợp các giá trị dữ liệu liên quan với nhau. Trong chương trước, chúng ta đã đưa ra các khái niệm về kiểu thực thể và kiểu liên kết như là các khái niệm để mô hình hoá dữ liệu của thế giới thực. Trong mô hình quan hệ, mỗi một dòng trong bảng biểu thị một sự kiện tương ứng với một thực thể hoặc một liên kết của thế giới thực. Tên bảng và tên các cột dùng để giúp giải thích ý nghĩa của các giá trị trong mỗi hàng. Mọi giá trị trong một cột đều cùng một kiểu dữ liệu. Theo thuật ngữ mô hình quan hệ hình thức, mỗi hàng được gọi là một bộ, mỗi đầu cột được gọi là một thuộc tính, và bảng được gọi là một quan hệ. Kiểu dữ liệu mô tả các kiểu của dữ liệu xuất hiện trong mỗi cột gọi là một miền. 4.1.1.1 Miền, thuộc tính, bộ và quan hệ Một miền D là một tập hợp các giá trị nguyên tử, điều đó có nghĩa là mỗi giá trị trong miền là không thể phân chia được trong phạm vi mô hình quan hệ. Để đặc tả một miền, người ta chỉ ra một tên, một kiểu dữ liệu và khuôn dạng dữ liệu. Một số ví dụ về định nghĩa miền: . Họ tên: Tập hợp các dãy chữ cái có độ dài . 29
  35. 30 CHƯƠNG 4. BÀI 4: MÔ HÌNH QUAN HỆ, CÁC RẰNG BUỘC QUAN HỆ dụng để mô tả một quan hệ, R được gọi là tên của quan hệ đó. Cấp của một quan hệ là số các thuộc tính của lược đồ quan hệ của nó. Ví dụ, ta có lược đồ cho quan hệ cấp 5: SINHVIÊN (Mãsố, Họtên, Ngàysinh, Giớitính, Địachỉ). Với lược đồ quan hệ này, SINHVIÊN là tên của quan hệ. Một quan hệ (hoặc trạng thái quan hệ) r của lược đồ quan hệ R(A1,A2, ,An) được ký hiệu là r(R), là tập hợp các n-bộ r = {t1, t2, , tn }. Mỗi n-bộ t là một danh sách có thứ tự của n giá trị, t = , trong đó mỗi vi ,1<= i <= n , là một phần tử của Dom(Ai) hoặc là một giá trị không xác định (null value). Giá trị thứ i của bộ t, tương ứng với thuộc tính Ai được ký hiệu là t[Ai] . Hình III-1 chỉ ra một ví dụ của quan hệ SINHVIÊN tương ứng với lược đồ quan hệ SINHVIÊN ở trên. Mỗi bộ trong quan hệ biểu diễn một thực thể sinh viên cụ thể. Quan hệ được biểu diễn như một bảng, trong đó mỗi bộ được hiển thị như một hàng và mỗi thuộc tính tương ứng với một đầu cột chỉ ra vai trò của các giá trị trong cột đó. Các giá trị không xác định biểu thị các thuộc tính mà giá trị của nó không biết được hoặc không tồn tại đối với từng bộ SINHVIÊN cụ thể. Figure 4.1: Quan hệ SINHVIÊN Định nghĩa quan hệ ở trên có thể phát biểu lại như sau: Một quan hệ r(R) là một quan hệ toán học cấp n trên các miền giá trị dom(A1), dom(A2), , dom(An), đó là tập con của tích Đề các của các miền giá trị xác định R: r( R) ⊆ (dom(A1) x dom(A2) x dom(An)). Tích Đềcác chỉ ra mọi tổ hợp có thể có của các giá trị từ các miền đã cho. Như vậy, nếu ta ký hiệu lực lượng của một miền D là [U+F0BD]D[U+F0BD] và giả thiết rằng mọi miền đều hữu hạn thì tổng số các bộ trong tích Đề cac là: [U+F0BD]dom(A1)[U+F0BD]*[U+F0BD]dom(A2)[U+F0BD]* *[U+F0BD]dom(An)[U+F0BD]. Ngoài tất cả các tổ hợp có thể có này, một trạng thái quan hệ ở một thời điểm cho trước - gọi là trạng thái quan hệ hiện tại - chỉ phản ánh các bộ giá trị biểu diễn một trạng thái cụ thể của thế giới thực. Nói chung, do trạng thái của thế giới thực thay đổi, quan hệ cũng bị thay đổi thành trạng thái quan hệ khác. Tuy nhiên, lược đồ R là ổn định, không thay đổi, trừ phi phải thêm vào một số thuộc tính để biểu diễn một thông tin mới chưa được lưu trữ trong quan hệ. Có thể xảy ra trường hợp nhiều thuộc tính có cùng một miền giá trị. Các thuộc tính chỉ ra các vai trò khác nhau đối với miền. Ví dụ, hai thuộc tính ĐịachỉNV và ĐịachỉĐV có cùng miền giá trị nhưng thuộc tính
  36. 31 thứ nhất tham chiếu đến địa chỉ của nhân viên còn địa chỉ thứ hai tham chiếu đến địa chỉ của đơn vị. Các đặc trưng của các quan hệ 4.1.1.1.1 Thứ tự của các bộ trong một quan hệ Một quan hệ được định nghĩa như một tập hợp các bộ. Các phần tử trong một tập hợp không có thứ tự, vì vậy các bộ trong một quan hệ không có một thứ tự cụ thể. Tuy nhiên, trong một tệp, các bản ghi được lưu trữ một cách vật lý trên đĩa vì vậy luôn có một thứ tự giữa các bản ghi. Thứ tự này chỉ rõ bản ghi thứ nhất, bản ghi thứ hai, , bản ghi thứ n. Một cách tương tự, khi ta biểu diễn một quan hệ như là một bảng, các hàng được hiển thị theo một thứ tự nhất định. Thứ tự các bộ không phải là một phần của định nghĩa quan hệ bởi vì một quan hệ cố gắng biểu diễn các sự vật ở mức trừu tượng hoặc lôgic. Có thể có nhiều thứ tự lôgic trên một quan hệ. Ví dụ, các bộ giá trị trong quan hệ SINHVIÊN ở hình 4-1 có thể sắp xếp theo nhiều cách khác nhau: theo thứ tự logic của Họtên, theo thứ tự logic của Mãsố, Định nghĩa quan hệ không chỉ ra thứ tự lôgic nào cả, vì vậy không có thứ tự lôgic nào hơn thứ tự lôgic khác. Các quan hệ chứa cùng một số hàng như nhau nhưng các hàng được sắp xếp khác nhau được xem như đồng nhất với nhau. Khi một quan hệ được cài đặt như một tệp, một thứ tự vật lý có thể được chỉ ra trên các bản ghi của tệp. 4.1.1.1.2 Thứ tự của các giá trị bên trong một bộ Theo định nghĩa quan hệ ở trên, một n-bộ là một danh sách có thứ tự của n giá trị. Như vậy thứ tự của các giá trị trong một bộ là quan trọng, từ đó suy ra thứ tự của các thuộc tính trong một lược đồ quan hệ cũng quan trọng. Tuy nhiên, ở mức lôgic, thứ tự của các thuộc tính và các giá trị của nó là không thực sự quan trọng khi giữ được sự tương ứng giữa các thuộc tính và các giá trị. Có thể đưa ra một định nghĩa khác về quan hệ, định nghĩa này sẽ làm cho thứ tự của các giá trị trong một bộ là không cần thiết. Theo định nghĩa này, một lược đồ quan hệ R = {A1, A2, ,An} là một tập hợp các thuộc tính và một quan hệ r(R) là một tập hợp hữu hạn các ánh xạ r = {t1, t2, , tm}, trong đó mỗi ti là một ánh xạ từ R vào D, trong đó D = dom(A1)[U+F0C8]dom(A2) [U+F0C8] [U+F0C8]dom(An). Trong định nghĩa này, t[Ai] phải ở trong dom(Ai) với 1 , ), trong đó mỗi cặp cho một giá trị của ánh xạ từ một thuộc tính Ai đến một giá trị vi của dom(Ai) . Vì tên thuộc tính xuất hiện cùng với giá trị của nó nên thứ tự của các thuộc tính là không quan trọng. Điều này làm nên ý nghĩa ở mức trừu tượng hoặc lôgic vì chẳng có lý do gì để thích có một giá trị thuộc tính xuất hiện trước một giá trị thuộc tính khác trong một bộ. Khi một quan hệ được cài đặt như một tệp, các thuộc tính được sắp xếp một cách vật lý như là các trường trong một bản ghi. Trong trường hợp đó chúng ta sẽ sử dụng định nghĩa thứ nhất của quan hệ, trong đó các giá trị của các thuộc tính trong một bộ là có thứ tự vì nó làm đơn giản rất nhiều khái niệm. Tuy nhiên, định nghĩa thứ hai là tổng quát hơn. 4.1.1.1.3 Các giá trị trong một bộ Mỗi giá trị trong một bộ là một giá trị nguyên tử, điều đó có nghĩa là nó không phân chia được thành các thành phần trong phạm vi của mô hình quan hệ. Như vậy, trong mô hình quan hệ không cho phép có các thuộc tính phức hợp và các thuộc tính đa trị. Các thuộc tính đa trị phải được biểu diễn bằng các quan hệ còn các thuộc tính phức hợp chỉ được biểu diễn bằng các thuộc tính thành phần đơn của nó. Các giá trị của một vài thuộc tính trong một bộ cụ thể có thể không biết được hoặc không thích ứng cho nó. Trường hợp đó, người ta sử dụng một giá trị đặc biệt gọi là giá trị null.Ví dụ, giả sử quan hệ SINHVIÊN có thuộc tính Sốđiệnthoạiởnhà. Trong một tập thể sinh viên, có người có điện thoại ở nhà, có người không có và cũng có người có nhưng không biết chắc. Với những trường hợp không có hoặc không biết chắc, thuộc tính Sốđiệnthoạiởnhà có giá trị null.
  37. 32 CHƯƠNG 4. BÀI 4: MÔ HÌNH QUAN HỆ, CÁC RẰNG BUỘC QUAN HỆ 4.1.1.1.4 Thể hiện của một quan hệ Một lược đồ quan hệ có thể được thể hiện như là một tuyên bố hoặc một khẳng định. Ví dụ lược đồ quan hệ SINHVIÊN ở trên khẳng định rằng, nói chung, một thực thể sinh viên có một mã số, họ tên, ngày sinh, giới tính, địa chỉ. Mỗi bộ trong quan hệ được thể hiện như là một sự kiện hoặc như một thể hiện cụ thể của một khẳng định. Ngoài các quan hệ biểu diễn các sự kiện về các thực thể, một số quan hệ có thể biểu diễn các sự kiện về mối liên kết. Ví dụ, lược đồ quan hệ NHAˆNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ) khẳng định các nhân viên làm việc với các dự án. Mỗi bộ trong quan hệ này liên kết một nhân viên với một dự án mà anh ta làm việc cho nó. Như vậy, mô hình quan hệ biểu diễn các sự kiện về thực thể và các sự kiện về liên kết dưới dạng duy nhất là các quan hệ. 4.1.2 Các ràng buộc quan hệ, lược đồ cơ sở dữ liệu quan hệ Trong phần này chúng ta thảo luận về các hạn chế trên các dữ liệu trong một lược đồ cơ sở dữ liệu quan hệ. Các hạn chế đó được gọi là các ràng buộc. Có các loại ràng buộc: ràng buộc miền, ràng buộc khoá, ràng buộc toàn vẹn thực thể và ràng buộc toàn vẹn tham chiếu. 4.1.2.1 Các ràng buộc miền Các ràng buộc miền chỉ ra rằng giá trị của mỗi thuộc tính A phải là một giá trị nguyên tử thuộc miền giá trị dom(A). Các kiểu dữ liệu liên kết với các miền bao gồm: các kiểu dữ liệu số chuẩn cho các số nguyên (short integer, integer, long integer), các số thực (float, double precision float). Ngoài ra còn các kiểu dữ liệu ký tự (dãy ký tự với độ dài cố định, dãy ký tự với độ dài thay đổi), ngày, thời gian và tiền tệ. Các loại miền khác có thể là các miền con của một kiểu dữ liệu hoặc một kiểu dữ liệu đếm được trong đó mọi giá trị có thể được liệt kê rõ ràng. 4.1.2.2 Ràng buộc khoá và ràng buộc trên các giá trị không xác định (null) Một quan hệ được định nghĩa như một tập hợp các bộ. Theo định nghĩa, các phần tử của một tập hợp là khác nhau, vì vậy, mọi bộ trong quan hệ phải khác nhau. Điều đó có nghĩa là không có hai bộ có cùng một tổ hợp giá trị cho tất cả các thuộc tính của chúng. Thông thường, có tồn tại các tập con của các thuộc tính của một lược đồ quan hệ có tính chất là không có hai bộ nào ở trong mọi trạng thái quan hệ r của R có cùng một tổ hợp giá trị cho các thuộc tính của nó. Giả sử chúng ta ký hiệu một tập con như vậy là SK, khi đó với hai bộ khác nhau bất kỳ t1 và t2 trong một trạng thái quan hệ r của R chúng ta có ràng buộc là t1[SK] 6= t2[SK]. Tập hợp thuộc tính SK như vậy được gọi là một siêu khoá của lược đồ quan hệ R. Một siêu khoá SK xác định rõ một ràng buộc về tính duy nhất, phát biểu rằng không có hai bộ khác nhau trong một trạng thái r của R có cùng một giá trị cho SK. Mỗi quan hệ có ít nhất là một siêu khoá mặc định, đó là tập hợp tất cả các thuộc tính của nó. Một khoá K của một lược đồ quan hệ R là một siêu khoá của R với tính chất là nếu bỏ đi bất kỳ thuộc tính A nào ra khỏi K thì sẽ còn lại một tập K không phải là siêu khoá của R. Như vậy, một khoá là một siêu khoá tối thiểu, nghĩa là đó là một siêu khoá mà ta không thể vứt bỏ thuộc tính nào ra khỏi nó mà vẫn giữ được ràng buộc về tính duy nhất. Ví dụ, xét quan hệ SINHVIÊN với các thuộc tính Mãsố, Họtên, Ngàysinh, Giớitính, Địachỉ. Thuộc tính {Mãsố} là một khoá của SINHVIÊN bởi vì không có hai bộ sinh viên có cùng một giá trị cho Mãsố. Mọi tập hợp thuộc tính có chứa Mãsố, vídụ {Mãsố, Họtên, Ngàysinh}, đều là một siêu khoá. Tuy nhiên, siêu khoá {Mãsố, Họtên, Ngàysinh} không phải là khoá bởi vì nếu bỏ đi thuộc tính Họtên hoặc Ngàysinh hoặc cả hai thì nó vẫn còn là một siêu khoá. Giá trị của một thuộc tính khoá có thể được sử dụng để xác định một cách duy nhất mỗi bộ trong một quan hệ. Ví dụ, giá trị 4515202 của Mãsố xác định một cách duy nhất bộ giá trị tương ứng với sinh viên Lê Vân trong quan hệ SINHVIÊN. Chú ý rằng một tập hợp thuộc tính tạo nên một khoá là một tính chất của lược đồ quan hệ. Điều ràng buộc là tính chất đó phải thỏa mãn trên mọi trạng thái của lược đồ. Một khoá
  38. 33 được xác định từ ý nghĩa của các thuộc tính và tính chất là bất biến, tính chất đó phải thỏa mãn khi chúng ta chèn thêm các bộ mới vào quan hệ. Ví dụ, ta không thể và không được chỉ định thuôc tính Họtên của quan hệ SINHVIÊN là khoá bởi vì không có gì đảm bảo rằng không tồn tại hai sinh viên có cùng họ tên. Nói chung, một lược đồ quan hệ có thể có nhiều hơn một khoá. Trong trường hợp đó, mỗi một khoá được gọi là một khoá dự tuyển. Thông thường ta phải chỉ định một trong các khoá dự tuyển làm khoá chính của quan hệ. Khoá chính là một khoá dự tuyển mà các giá trị của chúng được dùng để xác định các bộ trong quan hệ. Ta quy ước rằng, các thuộc tính tạo nên khoá chính của một lược đồ quan hệ được gạch dưới. Ví dụ: SINHVIÊN( Mãsố, Họtên, Ngàysinh, Giớitính, Địachỉ ). Chú ý rằng khi một lược đồ quan hệ có nhiều khoá dự tuyển, việc lựa chọn một khoá dự tuyển để làm khoá chính là tuỳ ý, tuy nhiên tốt nhất là chọn khoá chính gồm một thuộc tính hoặc có số các thuộc tính ít nhất. Một ràng buộc khác trên các thuộc tính chỉ rõ khi nào thì cho phép các giá trị null. Những thuộc tính luôn luôn phải có một giá trị xác định và hợp lệ thì bị ràng buộc là NOT NULL. 4.1.2.3 Cơ sở dữ liệu quan hệ và lược đồ cơ sở dữ liệu quan hệ Ở trên, chúng ta đã nói đến các lược đồ quan hệ đơn lẻ và các quan hệ đơn lẻ. Một cơ sở dữ liệu quan hệ thường gồm nhiều quan hệ với các bộ giá trị trong các quan hệ được liên kết với nhau theo nhiều cách. Trong phần này chúng ta sẽ định nghĩa một cơ sở dữ liệu quan hệ và một lược đồ cơ sở dữ liệu quan hệ. Một lược đồ cơ sở dữ liệu quan hệ S là một tập hợp các lược đồ quan hệ S = {R1,R2, ,Rn} và một tập các ràng buộc toàn vẹn. Một trạng thái cơ sở dữ liệu quan hệ (hoặc một cơ sở dữ liệu quan hệ) DB của S là một tập hợp các trạng thái quan hệ: DB = {r1, r2, , rn} sao cho mỗi ri là một trạng thái của Ri và sao cho các trạng thái quan hệ ri thoả mãn các ràng buộc toàn vẹn chỉ ra trong tập các ràng buộc toàn vẹn. Ví dụ, Trình bày một lược đồ cơ sở dữ liệu CÔNGTY và trình bày một cơ sở dữ liệu công ty. NHAˆNVIÊN(Họđệm, Tên, MãsốNV, Ngàysinh, Địachỉ, Giớitính, Lương, MãsốNGS, MãsốĐV) ĐƠNVỊ(TênĐV, MãsốĐV, MãsốNQL, Ngàybắtđầu) ĐƠNVỊ_ĐỊAĐIỂM(MãsốĐV, ĐịađiểmĐV) DỰÁN(TênDA, MãsốDA, ĐịađiểmDA, Mã sốĐV) NHAˆNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ) CON(MãsốNV, TênPT, Giớitính, Ngàysinh)
  39. 34 CHƯƠNG 4. BÀI 4: MÔ HÌNH QUAN HỆ, CÁC RẰNG BUỘC QUAN HỆ Figure 4.2: Cơ sở dữ liệu “CÔNGTY”
  40. 35 Figure 4.3: Cơ sở dữ liệu “CÔNGTY”
  41. 36 CHƯƠNG 4. BÀI 4: MÔ HÌNH QUAN HỆ, CÁC RẰNG BUỘC QUAN HỆ Figure 4.4: Cơ sở dữ liệu “CÔNGTY”
  42. 37 Figure 4.5: Cơ sở dữ liệu “CÔNGTY” Trong một lược đồ cơ sở dữ liệu quan hệ, các thuộc tính biểu diễn cùng một khái niệm thế giới thực có thể (hoặc không) có cùng tên như nhau trong các quan hệ khác nhau. Ngược lại, các thuộc tính biểu diễn các khái niệm khác nhau có thể có tên như nhau trong các quan hệ khác nhau. Ví dụ, trong cơ sở dữ liệu CÔNGTY ở trên, các thuộc tính MãsốNV, MãsôNGS, MãsốNQL có tên khác nhau nhưng đều biểu diễn một khái niệm đó là mã số nhân viên (bởi vì người giám sát hoặc người quản lý cũng là nhân viên). Trong lúc đó, thuộc tính Giớitính có mặt trong hai quan hệ NHAˆNVIÊN và CON, tuy nhiên Giớitính trong quan hệ NHAˆNVIÊN là biểu thị giới tính của nhân viên còn Giớitính trong CON là biểu thị giới tính của người con. Trong một số phiên bản trước của mô hình quan hệ, người ta yêu cầu rằng các thuộc tính biểu diễn cùng một khái niệm của thế giới thực thì phải có tên như nhau trong mọi quan hệ. Điều đó sẽ gây ra khó khăn khi cùng một khái niệm thế giới thực được sử dụng trong các vai trò khác nhau. Một hệ quản trị cơ sở dữ liệu phải có ngôn ngữ định nghĩa dữ liệu (Data definition language DDL) để định nghĩa lược đồ cơ sở dữ liệu quan hệ. Các hệ quản trị cơ sở dữ liệu hiện nay hầu như sử dụng SQL cho mục đích này. Các ràng buộc toàn vẹn được chỉ ra trên một lược đồ cơ sở dữ liệu và được tôn trọng làm thoả mãn trên mỗi trạng thái cơ sở dữ liệu của lược đồ này. Ngoài các ràng buộc miền và ràng buộc khoá còn có thêm các
  43. 38 CHƯƠNG 4. BÀI 4: MÔ HÌNH QUAN HỆ, CÁC RẰNG BUỘC QUAN HỆ ràng buộc được xem như một phần của mô hình quan hệ, đó là ràng buộc toàn vẹn thực thể và ràng buộc toàn vẹn tham chiếu. 4.1.2.4 Toàn vẹn thực thể, toàn vẹn tham chiếu và khoá ngoại Ràng buộc toàn vẹn thực thể được phát biểu là: khoá chính phải luôn luôn có giá trị xác định, nghĩa là không được phép có giá trị null. Sở dĩ có điều đó là do giá trị của khoá chính được sử dụng để xác định các bộ giá trị riêng biệt trong một quan hệ. Việc có giá trị null cho khoá chính kéo theo việc chúng ta không thể xác định được một số bộ giá trị. Ví dụ, nếu có hai hay nhiều hơn các bộ giá trị có giá trị null cho khoá chính thì chúng ta không có khả năng phân biệt chúng. Các ràng buộc khoá và ràng buộc toàn vẹn thực thể được chỉ ra trên các quan hệ riêng rẽ. Ràng buộc toàn vẹn tham chiếu được chỉ ra giữa hai quan hệ để duy trì sự tương ứng giữa các bộ của hai quan hệ. Một cách không hình thức, ràng buộc toàn vẹn tham chiếu được phát biểu là: một bộ giá trị trong một quan hệ có liên kết đến một quan hệ khác phải liên kết đến một bộ giá trị tồn tại trong quan hệ đó. Để định nghĩa toàn vẹn tham chiếu một cách hình thức hơn, trước tiên chúng ta đưa ra khái niệm khoá ngoài: Một tập hợp các thuộc tính FK trong một lược đồ quan hệ R1 là một khoá ngoài của R1 tham chiếu đến quan hệ R2 nếu nó thoả mãn hai quy tắc sau: qt1. Các thuộc tính trong FK có cùng miền giá trị như các thuộc tính của khoá chính PK của R2. Các thuộc tính FK được gọi là tham chiếu đến (hoặc là liên hệ đến) quan hệ R2. qt2. Một giá trị của FK trong một bộ t1 của trạng thái hiện tại r1(R1) hoặc có mặt như một giá trị của khoá chính của một bộ t2 nào đấy trong trạng thái hiện tại r2(R2), hoặc là null. Trong trường hợp này ta có t1[FK] = t2[PK] và ta nói rằng bộ t1 liên hệ (tham chiếu) đến bộ t2.R1 được gọi là quan hệ tham chiếu và R2 được gọi là quan hệ bị tham chiếu. Trong một cơ sở dữ liệu có nhiều quan hệ thường có nhiều ràng buộc toàn vẹn tham chiếu. Để chỉ ra các ràng buộc này, trước tiên ta phải có một hiểu biết rõ ràng về ý nghĩa hoặc vai trò của mỗi tập thuộc tính ở trong các lược đồ quan hệ khác nhau của cơ sở dữ liệu. Các ràng buộc toàn vẹn quy chiếu thường nảy sinh từ các mối liên kết giữa các thực thể được biểu diễn bằng các lược đồ quan hệ. Chú ý rằng một khoá ngoài có thể tham chiếu đến quan hệ của chính nó. Trong trường hợp đó, khoá ngoài biểu thị một liên kết đệ quy. Chúng ta có thể biểu diễn các ràng buộc tham chiếu bằng sơ đồ. Để làm điều đó ta vẽ một cạnh có hướng từ mỗi khoá ngoài đến quan hệ mà nó tham chiếu đến. NHAˆNVIÊN( Họđệm,Tên, MãsốNV, Ngàysinh, Địachỉ, Giớitính,Lương, MãsốNGS, MãsốĐV) ĐƠNVỊ ( TênĐV, MãsốĐV, MãsốNQL, Ngàybắtđầu) ĐƠNVỊ_ĐỊAĐIỂM( MãsốĐV, ĐịađiểmĐV) DỰÁN( TênDA, MãsốDA, ĐịađiểmDA, Mã sốĐV) NHAˆNVIÊN_DỰÁN( MãsốNV, MãsốDA, Sốgiờ) PHỤTHUỘC( MãsốNV, TênCon, Giớitính, Ngàysinh) Hình 4 [U+2011] 3. Lược đồ và sơ đồ tham chiếu Ngoài các ràng buộc toàn vẹn ở trên, cơ sở dữ liệu còn phải thoả mãn một số ràng buộc khác, như ràng buộc trạng thái, ràng buộc chuyển tiếp Các ràng buộc trạng thái xác định các ràng buộc mà một trạng thái vững chắc của cơ sở dữ liệu phải thoả mãn. Ví dụ về các ràng buộc đó là: “lương của một nhân viên không được vượt quá lương của người giám sát nhân viên đó” hoặc “số giờ nhiều nhất mà một nhân viên có thể làm việc trong một tuần trên tất cả các dự án là 56 giờ”. Các ràng buộc như vậy có thể được đặc tả và bắt tuân theo bằng cách sử dụng một ngôn ngữ đặc tả ràng buộc. Người ta có thể sử dụng các cơ cấu như là trigger hoặc assertion. Các ràng buộc chuyển tiếp có thể được định nghĩa để làm việc với những thay đổi trạng thái trong cơ sở dữ liệu. Ví dụ về ràng buộc này là: “ lương của một nhân viên chỉ có thể tăng”. Các ràng buộc như vậy thường được định nghĩa bằng cách sử dụng các quy tắc hoặc bằng các trigger.
  44. 39 4.1.3 Các phép toán trên mô hình quan hệ Trong phần này chúng ta thảo luận về các phép toán của mô hình quan hệ. Các phép toán của mô hình quan hệ có thể phân thành hai loại: các phép toán cập nhật và các phép toán đại số quan hệ. Các phép toán cập nhật được sử dụng để tạo ra một quan hệ đúng đắn. Các phép toán đại số quan hệ được sử dụng để đặc tả các phép lấy thông tin ra. 4.1.3.1 Các phép toán cập nhật Các phép toán cập nhật gồm ba phép toán cơ bản là chèn, xoá và sửa đổi. Phép chèn được dùng để chèn một bộ giá trị hoặc nhiều bộ giá trị vào một quan hệ. Phép xoá dùng để loại bỏ các bộ giá trị và phép sửa đổi dùng để sửa đổi các giá trị của một số thuộc tính trong các bộ giá trị đã có. Mỗi khi các phép toán cập nhật được áp dụng, các ràng buộc trên lược đồ cơ sở dữ liệu có thể bị vi phạm. Trong phần này chúng ta sẽ nói đến khả năng vi phạm các ràng buộc của từng phép toán và các kiểu hành động có thể thực hiện khi một ràng buộc bị vi phạm. 4.1.3.1.1 Phép chèn (Insert) Phép chèn cung cấp một danh sách các giá trị cho một bộ mới t được chèn vào trong một quan hệ R. Phép chèn có thể vi phạm các kiểu ràng buộc được mô tả ở trên. Các ràng buộc miền có thể bị vi phạm nếu một giá trị thuộc tính được cho không thuộc vào miền tương ứng. Các ràng buộc khoá có thể bị vi phạm nếu một giá trị khoá trong bộ mới t đã tồn tại trong một bộ khác ở trong quan hệ r(R). Sự toàn vẹn thực thể có thể bị vi phạm nếu khoá chính của bộ mới t là null. Sự toàn vẹn tham chiếu có thể bị vi phạm nếu một giá trị của một khoá ngoài trong t tham chiếu đến một bộ không tồn tại trong một quan hệ được tham chiếu. Ví dụ (với các bảng trong cơ sở dữ liệu CÔNGTY) : • Chèn bộ giá trị vào quan hệ NHAˆNVIÊN. Phép chèn này vi phạm ràng buộc toàn vẹn thực thể (giá trị null cho khoá chính). Phép chèn bị loại bỏ. • Chèn bộ giá trị vào quan hệ NHAˆNVIÊN. Phép chèn này vi phạm ràng buộc khoá, bới vì giá trị ‘NV002’ đã có ở trong bảng. Phép chèn bị loại bỏ. • Chèn bộ giá trị vào quan hệ NHAˆNVIÊN. Phép chèn này vi phạm ràng buộc toàn vẹn tham chiếu, trong quan hệ ĐƠNVỊ không có đơn vị có mã số = 7. Phép chèn bị loại bỏ. • Chèn bộ giá trị vào quan hệ NHAˆNVIÊN. Phép chèn thoả mãn tất cả các ràng buộc, vì thế nó được chấp nhận. Nếu một phép chèn vi phạm một hoặc nhiều ràng buộc, tuỳ chọn mặc định là loại bỏ phép chèn. Trong trường hợp này, thường là các hệ quản trị cơ sở dữ liệu có thể thông báo cho người sử dụng nguyên nhân của việc loại bỏ phép chèn. 4.1.3.1.2 Phép xoá (Delete) Phép xoá được sử dụng để xoá một hoặc nhiều bộ giá trị của một quan hệ. Phép xoá chỉ có thể vi phạm ràng buộc tham chiếu trong trường hợp bộ bị xoá được tham chiếu bởi một khoá ngoài từ các bộ khác trong cơ sở dữ liệu. Để chỉ rõ một phép xoá, cần phải đưa ra một điều kiện trên các thuộc tính của quan hệ để chọn các bộ sẽ bị xoá. Ví dụ: • Xoá một bộ giá trị của quan hệ NHAˆNVIÊN_DỰÁN có MãsốNV = ‘NV010’ và MãsốDA = 10. Phép xoá này được chấp nhận.
  45. 40 CHƯƠNG 4. BÀI 4: MÔ HÌNH QUAN HỆ, CÁC RẰNG BUỘC QUAN HỆ • Xoá bộ giá trị của NHAˆNVIÊN có MãsốNV = ‘ NV010’. Phép xoá này không chấp nhận được bởi vì có các bộ trong NHAˆNVIÊN_DỰÁN tham chiếu đến bộ này, như vậy là vi phạm ràng buộc toàn vẹn tham chiếu. • Xoá bộ giá trị của NHAˆNVIÊN có MãsốNV = ‘ NV002’. Phép xoá này cũng vi phạm ràng buộc toàn vẹn tham chiếu . Ba tuỳ chọn được sẵn sàng được sử dụng nếu một phép xoá gây ra sự vi phạm. Tuỳ chọn thứ nhất là loại bỏ phép xoá. Tuỳ chọn thứ hai là cố gắng lan truyền phép xoá (cascade the deletion) bằng cách xoá đồng thời các bộ tham chiếu đến bộ bị xoá. Tuỳ chọn thứ ba là sửa đổi các giá trị của các thuộc tính tham chiếu gây ra sự vi phạm. Mỗi giá trị như vậy hoặc là làm cho bằng null hoặc được thay đổi thành bộ có hiệu lực tham chiếu khác. Chú ý rằng, nếu một thuộc tính tham chiếu gây ra sự vi phạm là một phần của khoá chính thì không thể làm cho thành null, bởi vì nếu làm vậy thì sẽ vi phạm ràng buộc toàn vẹn thực thể. Có thể kết hợp cả ba tuỳ chọn ở trên. 4.1.3.1.3 Phép sửa đổi (Update) Phép toán sửa đổi được dùng để thay đổi các giá trị của một hoặc nhiều thuộc tính trong một (hoặc nhiều) bộ của một quan hệ R nào đấy. Để lựa chọn các bộ cần được thay đổi, người sử dụng phải chỉ ra một điều kiện trên các thuộc tính. Ví dụ: • Sửa đổi Lương của bộ NHAˆNVIÊN có MãsốNV = ‘NV018’ thành 2800. Phép sửa đổi này được chấp nhận. • Sửa đổi MãsốĐV của bộ NHAˆNVIÊN có MãsốNV = ‘NV018’ thành 7. Phép sửa đổi này vi phạm ràng buộc toàn vẹn tham chiếu. • Sửa đổi MãsốNV của bộ NHAˆNVIÊN có MãsốNV = ‘NV018’ thành ‘NV014’. Phép sửa đổi này vi phạm ràng buộc toàn vẹn thực thể và toàn vẹn tham chiếu. Việc sửa đổi một thuộc tính không phải là một khoá chính hoặcc một khoá ngoài thường không gây ra các vi phạm ràng buộc, hệ quản trị cơ sở dữ liệu chỉ cần kiểm tra để khẳng định rằng giá trị mới là thuộc miền và kiểu giá trị đúng đắn. Việc sửa đổi giá trị một khoá chính tương tự như việc xoá một bộ và chèn bộ khác vào chỗ của nó. Như vậy chúng ta trở về trường hợp đã thảo luận với phép chèn và phép xoá. Nếu một thuộc tính khoá ngoài bị sửa đổi thì hệ quản trị cơ sở dữ liệu phải đảm bảo rằng giá trị mới tham chiếu đến một bộ có tồn tại trong quan hệ được tham chiếu (hoặc là null).
  46. Chương 5 Bài 5: Chuyển đổi mô hình ER thành mô hình quan hệ 5.1 Chuyển đổi mô hình ER thành mô hình quan hệ1 Như đã thảo luận ở trên, bước tiếp theo sau việc xây dựng mô hình dữ liệu mức khái niệm, ta phải chuyển đổi mô hình đó thành một mô hình dữ liệu lôgic. Trong phần này chúng ta sẽ thảo luận về thuật toán chuyển đổi một mô hình ER thành ra mô hình quan hệ. 5.1.1 Các quy tắc chuyển đổi Thuật toán chuyển đổi được thực hiện theo các bước sau (dựa trên CSDL “CÔNG TY”): Bước 1 : Với mỗi kiểu thực thể thông thường E trong lược đồ ER, hãy tạo một quan hệ R chứa mọi thuộc tính đơn của E. Với các thuộc tính phức hợp, chỉ lấy các thuộc tính thành phần đơn của nó. Chọn một trong các thuộc tính khoá của E làm khoá chính cho R. Nếu khoá được chọn của E là phức hợp (gồm nhiều thuộc tính) thì tập các thuộc tính đơn đó sẽ cùng nhau tạo nên khoá chính của R. Ví dụ: Giả sử ta có kiểu thực thể ĐƠNVỊ với các thuộc tính là MãsốĐV, TênĐV, ĐịađiểmĐV trong đó các thuộc tính khoá là MãsốĐV, TênĐV (do mỗi đơn vị có một tên duy nhất), và ĐịađiểmĐV là một thuộc tính đa trị (do mỗi đơn vị có nhiều địa điểm). Khi đó kiểu thực thể ĐƠNVỊ được chuyển thành quan hệ ĐƠNVI với các thuộc tính MãsốĐV, TênĐV. Khoá chính của quan hệ là MãsốĐV (chọn một trong hai thuộc tính khoá của kiểu thực thể). Bước 2: Với mỗi kiểu thứ thể yếu W trong lược đồ ER cùng với kiểu thực thể chủ E, hãy tạo một quan hệ R chứa tất các các thành phần đơn (hoặc các thành phần đơn của các thuộc tính phức hợp) của W như là các thuộc tính của R. Đưa các thuộc tính khoá chính của các quan hệ tương ứng với kiểu thực thể chủ làm khoá ngoài của R. Các thuộc tính này sẽ xác định kiểu liên kết của W. Khoá chính của R là một tổ hợp của khoá chính của các quan hệ tương ứng với kiểu thực thể chủ và khoá bộ phận của kiểu thực thể yếu W nếu có. Ví dụ: Giả sử ta có kiểu liên kết NHAˆNVIÊN CON trong đó NHAˆNVIÊN là kiểu thực thể chủ với các thuộc tính MãsốNV, Họđệm, Tên, Ngàysinh, Giớitính. Thuộc tính khoá của NHAˆNVIÊN là MãsốNV. CON là kiểu thực thể phụ thuộc (vào thực thể NHAˆNVIÊN) với các thuộc tính là Họtêncon, Ngàysinh, Giớitính. Kiểu thực thể này không có thuộc tính khoá. Khi đó kiểu thực thể NHAˆNVIÊN được chuyển thành quan hệ NHAˆNVIÊN với các thuộc tính như trên. Kiểu thực thể CON được chuyển thành quan hệ CON với các thuộc tính MãsốNV, Họtêncon, Ngàysinh, Giớitính. Quan hệ này có khoá ngoài là MãsốNV, khoá chính là Mã sốNV, Họtêncon. 1This content is available online at . 41
  47. 42 CHƯƠNG 5. BÀI 5: CHUYỂN ĐỔI MÔ HÌNH ER THÀNH MÔ HÌNH QUAN HỆ Bước 3: Với mỗi kiểu liên kết 1:1 R trong lược đồ ER, hãy xác định các quan hệ S và T tương ứng với các kiểu thực thể tham gia trong R. Hãy chọn một trong các quan hệ, chẳng hạn S, và đưa khoá chính của T vào làm khoá ngoài trong S. Tốt nhất là chọn S là một kiểu thực thể tham gia toàn bộ vào R. Đưa tất các các thuộc tính đơn (hoặc các thành phần đơn của các thuộc tính phức hợp) của kiểu liên kết 1:1 R vào làm các thuộc tính của S. Chú ý: Có một cách chuyển đổi mối liên kết 1:1 nữa là nhập hai kiểu thực thể và mối liên kết thành một quan hệ. Cách này thường được áp dụng khi cả hai kiểu thực thể đều tham gia toàn bộ vào liên kết. Ví dụ: Giả sử ta có kiểu liên kết NHAˆNVIÊN ĐƠNVỊ, với các thuộc tính của các kiểu thực thể giống như ở trên. Kiểu liên kết là một kiểu liên kết 1:1, đồng thời sự tham gia của NHAˆNVIÊN vào kiểu liên kết là bộ phận (không phải nhân viên nào cũng quản lý đơn vị), sự tham gia của ĐƠNVỊ là đầy đủ (một đơn vị luôn luôn phải có một người quản lý). Khi đó, kiểu thực thể NHAˆNVIÊN sẽ được chuyển thành quan hệ NHAˆNVIÊN với các thuộc tính của nó, còn kiểu thực thể ĐƠNVỊ sẽ được chuyển thành quan hệ ĐƠNVỊ với các thuộc tính của kiểu thực thể ĐƠNVỊ cộng thêm với thuộc tính MãsốNV và thuộc tính của kiểu liên kết , nếu có. Thuộc tính MãsốNV sẽ là khoá ngoài cho quan hệ ĐƠNVỊ. Để làm rõ vai trò người quản lý, khi chuyển sang quan hệ ĐƠNVỊ, người ta đổi tên thuộc tính MãsốNV thành MãsốNQL (Mã số người quản lý). Ngoài ra, kiểu liên kết có một thuộc tính là Ngàybắtđầu, thuộc tính này cũng được đưa vào quan hệ ĐƠNVỊ. Bước 4: Với mỗi kiểu liên kết hai ngôi R kiểu 1:N, hãy xác định quan hệ S biểu diễn kiểu thực thể tham gia ở phía N của kiểu liên kết. Đưa khoá chính của quan hệ T biểu diễn kiểu thực thể tham gia vào R ở phía 1 vào làm khoá ngoài trong S. Làm như vậy là vì mỗi thực thể cụ thể của phía N được liên kết với nhiều nhất là một thực thể cụ thể của phía 1 của kiểu liên kết. Đưa các thuộc tính đơn (hoặc các thành phần đơn của các thuộc tính phức hợp) của kiểu liên kết 1:N vào làm các thuộc tính của S. Ví dụ: Giả sử ta có kiểu liên kết NHAˆNVIÊN ĐƠNVỊ, trong đó các kiểu thực thể NHAˆNVIÊN, ĐƠNVỊ là các kiểu thực thể ở trên. Kiểu liên kết là kiểu liên kết N:1 (một nhân viên chỉ làm việc cho một đơn vị và mỗi đơn vị có nhiều nhân viên làm việc cho). Khi đó, Kiểu thực thể ĐƠNVỊ sẽ được chuyển thành quan hệ ĐƠNVỊ với các thuộc tính của kiểu thực thể ĐƠNVỊ còn kiểu thực thể NHAˆNVIÊN sẽ được chuyển thành quan hệ NHAˆNVIÊN với các thuộc tính của kiểu thực thể NHAˆNVIÊN cộng thêm với thuộc tính MãsốĐV (là khoá chính của quan hệ ĐƠNVỊ). Thuộc tính MãsốĐV sẽ là thuộc tính khoá ngoài của quan hệ NHAˆNVIÊN. Bước 5: Với mỗi kiểu liên kết N:M hai ngôi R, hãy tạo ra một quan hệ mới S để biểu diễn R. Đưa các khoá chính của các quan hệ biểu diễn các kiểu thực thể tham gia vào làm khoá ngoài của S. Tổ hợp các khoá chính đó sẽ tạo nên khoá chính của S. Đưa tất cả các thuộc tính đơn (hoặc các thành phần đơn của các thuộc tính phức hợp) của kiểu liên kết N:M vào làm các thuộc tính của S. Chú ý rằng ta không thể biểu diễn một kiểu liên kết N:M bằng một thuộc tính khoá ngoài đơn giản trong một trong các quan hệ tham gia (như đã làm với các kiểu liên kết 1:1 và 1:N) vì tỷ số lực lượng N:M. Ví dụ: Giả sử ta có kiểu liên kết NHAˆNVIÊN DỰÁN. Kiểu thực thể NHAˆNVIÊN có các thuộc tính như trên với thuộc tính khoá là MãsốNV. Kiểu thực thể DỰÁN có các thuộc tính là MãsốDA, TênDA, ĐịađiểmDA trong đó thuộc tính khoá là MãsốDA. Kiểu liên kết là một kiểu liên kết N:M (một nhân viên có thể làm việc với nhiều dự án và mỗi dự án có nhiều nhân viên làm việc với). Kiểu liên kết này có một thuộc tính là Sốgiờ để lưu số giờ mà mỗi nhân viên làm việc cho một dự án. Khi đó kiểu liên kết sẽ được chuyển thành một quan hệ có tên là NHAˆNVIÊN_DỰ ÁN với các thuộc tính MãsốNV, MãsốDA, Sốgiờ trong đó hai thuộc tính MãsốNV, MãsốDA tạo thành khoá chính (phức hợp) cho quan hệ. Bước 6: Với mỗi thuộc tính đa trị A, hãy tạo ra một quan hệ mới R. Quan hệ R này sẽ chứa một thuộc tính tương ứng với A cộng với thuộc tính khoá K của quan hệ biểu diễn kiểu thực thể hoặc kiểu liên kết có thuộc tính là A làm khoá ngoài của R. Khoá chính của R là một tổ hợp của A và K. Nếu thuộc tính đa trị là phức hợp thì chúng ta chỉ đưa vào R các thành phần đơn của nó. Ví dụ: Xét kiểu thực thể ĐƠNVỊ ở trên. Thuộc tính ĐịađiểmĐV là một thuộc tính đa trị. Khi chuyển thành mô hình quan hệ nó sẽ được chuyển thành một quan hệ có khoá chính là MãsốĐV, Địa điểm và có
  48. 43 thể có thêm một số thuộc tính khác lưu thông tin về địa điểm. Bước 7: Với mỗi kiểu liên kết n ngôi R, trong đó n > 2, hãy tạo ra một quan hệ S để biểu diễn R. Đưa các khoá chính của các quan hệ biểu diễn các kiểu thực thể tham gia vào làm khoá ngoài của S. Đưa tất cả các thuộc tính đơn (hoặc các thành phần đơn của các thuộc tính phức hợp) của kiểu liên kết n-ngôi vào làm thuộc tính của S. Khoá chính của S thường là một tổ hợp các khoá chính của các quan hệ biểu diễn các kiểu thực thể tham gia. Tuy nhiên, nếu ràng buộc lực lượng trên một kiểu thực thể E nào đó tham gia vào R là 1 thì khoá chính của S không được chứa thuộc tính khoá ngoài tham chiếu đến quan hệ E tương ứng với kiểu thực thể E. Ví dụ: Giả sử chúng ta có kiểu liên kết ĐẠILÝ VẬTTƯ DỰÁN. Đây là một kiểu liên kết cấp ba. Giả sử rằng kiểu thực thể ĐẠILÝ có thuộc tính khoá là MãsốĐL, kiểu thực thể VẬTTƯ có thuộc tính khoá là MãsốVT, kiểu thực thể DỰÁN có thuộc tính khoá là MãsốDA còn kiểu liên kết có thuộc tính là Sốlượng để lưu số lượng vật tư mà một đai lý cung cấp cho môt dự án. Khi đó kiểu liên kết sẽ được chuyển thành một quan hệ có tên là CUNGCẤP với các thuộc tính MãsốĐL, MãsốVT , MãsốDA, Sốlượng và khoá chính gồm ba thuộc tính MãsốĐL, MãsốVT , MãsốDA. 5.1.2 Chuyển đổi mô hình cụ thể Trong những bài trước chúng ta đã phân tích và thiết kế mô hình ER cho bài toán CÔNGTY. Áp dụng các bước của thuật toán ở trên, chúng ta có mô hình quan hệ cho bài toán CÔNGTY như sau: NHAˆNVIÊN(Họđệm,Tên, MãsốNV, Ngàysinh, Địachỉ, Giớitính, Lương, MãsôNGS, MãsốĐV) ĐƠNVỊ(TênĐV, MãsốĐV, MãsốNQL, Ngàybắtđầu) ĐƠNVỊ_ĐỊAĐIỂM(MãsốĐV, ĐịađiểmĐV) DỰÁN(TênDA, MãsốDA, ĐịađiểmDA, MãsốĐV) NHAˆNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ) PHỤTHUỘC(MãsốNV, Têncon, Giớitính, Ngàysinh) Hình 5[U+2011]1. Lược đồ cơ sở dữ liệu “CÔNGTY” 5.1.3 Tổng kết và câu hỏi ôn tập 5.1.3.1 Tổng kết Trong bài 4 và 5 chúng ta đã trình bày các khái niệm cơ bản của mô hình dữ liệu quan hệ. Chương này bắt dầu bằng việc giới thiệu các khái niệm miền, thuộc tính và bộ giá trị. Lược đồ quan hệ được định nghĩa như một danh sách các thuộc tính mô tả cấu trúc của một quan hệ. Một quan hệ (hoặc trạng thái quan hệ) là một tập hợp các bộ giá trị phù hợp với lược đồ. Có nhiều đặc trưng làm phân biệt các quan hệ vớị các bảng hoặc các tệp thông thường. Trước tiên, các bộ trong một quan hệ là không có thứ tự. Đặc trưng thứ hai liên quan đến thứ tự của của các thuộc tính trong một lược đồ quan hệ và thứ tự tương ứng của các giá trị bên trong một bộ. Mặc dù ta đã đưa ra một định nghĩa quan hệ khác để chứng minh rằng hai thứ tự này là không cần thiết, tuy nhiên, để thuận tiện ta vẫn đòi hỏi các thuộc tính và các giá trị trong bộ là có thứ tự. Chúng ta cũng đã thảo luận về các giá trị trong các bộ và giới thiệu các giá trị null để biểu diễn thông tin bị thiếu hoặc không biết. Tiếp theo, chúng ta đã thảo luận về các ràng buộc mô hình quan hệ. Đó là các ràng buộc miền, ràng buộc khóa, các khái niệm về siêu khóa, khóa dự tuyển, khóa chính và ràng buộc NOT NULL trên các thuộc tính. Sau đó, chúng ta đã định nghĩa cơ sở dữ liệu và lược đồ cơ sở dữ liệu quan hệ. Các ràng buộc toàn vện thực thể và toàn vẹn tham chiếu cũng đã được định nghĩa và phân tích. Toàn vẹn thực thể ngăn cấm việc khóa chính có giá trị null. Toàn vẹn tham chiếu được sử dụng để duy trì sự nhất quán của việc tham chiếu trong các bộ từ các quan hệ khác nhau. Các phép cập nhật trên mô hình quan hệ gồm Insert, Delete, Update. Mỗi một phép toán có thể vi phạm các kiểu ràng buộc nhất định. Mỗi khi một phép toán đuợc áp dụng, trạng thái cơ sở dữ liệu sau khi phép toán được thực hiện phải được kiểm tra để đảm bảo rằng không có một ràng buộc nào bị vi phạm.