Bài giảng Thưu viện số - Chương 1: Tổng quan về thư viện số dữ liệu - Đỗ Quang Vinh
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thưu viện số - Chương 1: Tổng quan về thư viện số dữ liệu - Đỗ Quang Vinh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_thuu_vien_so_chuong_1_tong_quan_ve_thu_vien_so_du.ppt
Nội dung text: Bài giảng Thưu viện số - Chương 1: Tổng quan về thư viện số dữ liệu - Đỗ Quang Vinh
- BÀI GIẢNG THƯ VIỆN SỐ CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN SỐ DL TS. ĐỖ QUANG VINH HÀ NỘI - 2013
- NỘI DUNG I. TỔNG QUAN VỀ THƯ VIỆN SỐ DL II. MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL III. CHỈ MỤC TÀI LIỆU IV. TÌM KIẾM THÔNG TIN V. CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ VI. THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE 2
- I. TỔNG QUAN VỀ THƯ VIỆN SỐ DL ❑ TÍNH CẤP THIẾT – World Wide Web đã xâm nhập vào cuộc sống hàng ngày – Giao diện cho Web tiến triển từ duyệt đến tìm kiếm – DL là một trong những hướng nghiên cứu chính về Công nghệ Thông tin và Truyền thông ICT; Thư viện Thông tin LIS trên thế giới và ở Việt Nam hiện nay. 1. TÌNH HÌNH NGHIÊN CỨU VÀ PHÁT TRIỂN THƯ VIỆN SỐ TRÊN THẾ GIỚI VÀ Ở VIỆT NAM – Sự bùng nổ về nghiên cứu DL, các dự án và chương trình DL ở Mỹ và trên thế giới – Trọng tâm của các dự án DL ✓ Về công nghệ: các phương pháp và công nghệ mới về lưu trữ và tìm kiếm thông tin 3
- ✓ Về xã hội: khảo sát CSDL tài liệu và các vấn đề xã hội liên quan tới DL ❖ Nghiên cứu và phát triển DL ở Mỹ ▪ Có nhiều hoạt động và chương trình nghiên cứu DL đang được tiến hành ở Mỹ và số lượng tăng nhanh ▪ 2 dự án DL được tài trợ bởi chính phủ Mỹ là Dự án thư viện số - giai đoạn 2 (DLI-2) và Dự án thư viện số quốc tế ▪ Dự án thư viện số DLI: ✓ Dự án thư viện video số Informedia của Đại học Carnegie Mellon CMU 4
- ✓ Dự án dịch vụ thông tin số của Đại học California ở Berkeley ✓ Dự án Alexandria của Đại học California ở Santa Barbara ✓ Dự án Interspace của Đại học Illinois ở Urbana-Champaign ✓ Dự án UMDL của Đại học Michigan ✓ Dự án InfoBus của Đại học Stanford ▪ Các dự án DL chủ yếu khác ở Mỹ: ✓ Thư viện quốc hội (Library of Congress) ✓ Dự án công nghệ thư viện số DLT của NASA ✓ Dự án FedStats của hơn 70 cơ quan chính phủ khác nhau của Mỹ 5
- ✓ Dự án thư viện số của IBM ✓ Dự án thư viện số California CDL ✓ Chương trình thư viện số D-Lib của DARPA (the Defence Advanced Researh Project Agency) ✓ Dự án MOA của hai Đại học Cornel và Michigan ✓ Dự án Open Book của Đại học Yale ✓ Dự án hợp tác Red Sage của Đại học California ở San Francisco, Công ty AT&T Laboratories và Springer-Verlag ✓ Dự án TULIP của nhà xuất bản Elsevier Science Publisher 6
- ❖ DL ở các nước khác Tập trung vào các CSDL tài liệu, nói riêng vào nâng cao truy cập tới các CSDL tài liệu về lịch sử, văn hoá và nghệ thuật: Canada, Anh, Pháp, Đức, Nhật, Hàn quốc, Singapore, Trung quốc, Hồng Kông, Đài loan, Australia, New Zealand 7
- ❖ Việt Nam − Nhu cầu nghiên cứu DL bắt đầu từ khi hoạch định chiến lược phát triển thông tin - thư viện cho đến năm 2010, 2020, trước xu thế của sự chuyển hướng toàn cầu sang xã hội thông tin − Xây dựng DL lý tưởng, độc lập, với vốn tư liệu hoàn toàn số hoá, với toàn bộ dịch vụ chuyển sang phương thức điện tử, là không khả thi − Xu hướng sẽ xuất hiện nhiều thư viện điện tử là kết quả của quá trình tin học hoá, là các cổng vào thông tin và là một bộ phận của các thư viện lớn truyền thống ở Việt Nam 8
- ▪ Đại bộ phận thư viện sẽ đi theo con đường: kết hợp các nguồn tin truyền thống với hiện đại, bổ sung thêm các tạp chí điện tử toàn văn trên CD-ROM, đặt mua các tạp chí điện tử toàn văn trên mạng, số hoá một phần vốn tư liệu, tự động hoá các dịch vụ và tạo điều kiện cho NSD chủ động khai thác thông tin ▪ Hiện nay, một số phần mềm được cài đặt: ✓ PM Thư viện số Greenstone của dự án New Zealand Digital Library ở Đại học Quốc gia TP Hồ Chí Minh và nhiều trường Đại học khác ✓ PM Thư viện số VTLS ở Đại học Bách khoa Hà Nội ✓ PM Thư viện số Koha ở Đại học Quốc gia Hà Nội ✓ PM Thư viện số Dspace ở Đại học Đà Lạt ✓ PM thư viện điện tử ILIB của công ty CMC ở Thư viện Quốc gia Việt Nam ✓ PM thư viện điện tử LIBOL của công ty Tinh vân ở Cục Thông tin khoa học và công nghệ Quốc gia 9
- − Hệ phần mềm nguồn mở Greenstone rất phổ biến trong xây dựng thư viện số. PM cung cấp cách tổ chức thông tin và đưa thông tin lên Internet rất thuận tiện. Kho tài liệu do Greenstone tạo ra có thể duy trì, tìm kiếm và duyệt. Kho tài liệu dành cho mọi đối tượng độc giả và có thể mở rộng. PM được phát hành theo General Public License (GNU) với tinh thần là phần mềm nguồn mở. Xem thông tin chi tiết tại www.nzdl.org. Phần mềm Thư viện số Greenstone do Dự án Thư viện số New Zealand của trường Đại học Waikato triển khai. Có thể tải phần mềm từ www.nzdl.org. − Hệ phần mềm thư viện số Greenstone đang được Tổ chức Giáo dục, Khoa học và Văn hóa của Liên hợp quốc UNESCO ủng hộ và khuyến cáo các nước trên thế giới cài đặt và sử dụng. 10
- 2. ĐỊNH NGHĨA KHÔNG HÌNH THỨC ▪ Định nghĩa 1 (Arms W.Y.): DL là một kho thông tin có quản lý với các dịch vụ liên kết, trong đó thông tin được lưu trữ ở dạng số và có thể truy cập qua một mạng. ▪ Định nghĩa 2 (Chen H., Houston A.L.): DL là một thực thể liên quan tới sự tạo ra các nguồn tin và sự hoạt động thông tin qua các mạng toàn cầu. ▪ Định nghĩa 3 (Reddy R., Wladawsky-Berger I.): DL là các kho dữ liệu mạng về tài liệu văn bản số, ảnh, âm thanh, dữ liệu khoa học và phần mềm là lõi của Internet hiện nay và các kho dữ liệu số có thể truy cập phổ biến về tất cả tri thức của loài người trong tương lai. 11
- ▪ Định nghĩa 4 (Sun Microsystems): DL là sự mở rộng điện tử về các chức năng điển hình NSD thực hiện và các tài nguyên NSD truy cập trong thư viện truyền thống. ▪ Định nghĩa 5 (Witten I.H., Bainbridge D.): DL là các kho đối tượng số, bao gồm văn bản, video và audio cùng với các phương pháp truy cập và tìm kiếm, lựa chọn, tổ chức và bảo trì. ▪ Định nghĩa 6 (Liên đoàn Thư viện số - The Digital Library Federation): Thư viện số là những tổ chức cung cấp các nguồn lực gồm cả cán bộ chuyên môn để lựa chọn, xây dựng, truy cập tri thức, giải thích, phân phát, bảo tồn tính toàn vẹn và đảm bảo tính bền vững vượt thời gian của các kho tài liệu số, do đó chúng luôn sẵn sàng đáp ứng nhu cầu sử dụng của một cộng đồng cụ thể hoặc của một nhóm cộng đồng. Tóm lại, thư viện số là một kho thông tin số khổng lồ có tổ chức với các dịch vụ liên kết qua mạng. 12
- ❑ Ngoài ra, còn có một số định nghĩa khác về DL: ▪ “Thư viện số là thuật ngữ được chấp nhận rộng rãi như sự mô tả việc sử dụng công nghệ số của thư viện để thu thập, lưu trữ, bảo tồn và cung cấp sự truy cập đến thông tin" - Trung tâm Nghiên cứu và đổi mới thư viện Anh 13
- ▪ Thư viện số không phải chỉ là một thực thể đơn lẻ; Thư viện số phải có công nghệ để liên kết tài nguyên của nhiều dịch vụ; Sự liên kết giữa những thư viện điện tử và dịch vụ thông tin phải là trong suốt đối với người dùng tin đầu cuối; Sự truy nhập đến thư viện điện tử và dịch vụ thông tin là mục đích; Sưu tập số của thư viện số không chỉ giới hạn ở mẫu tìm của tài liệu; nó được mở rộng cả đến các đối tượng số mà chúng không thể được trình bày hoặc phổ biến ở dạng in ấn - Hiệp hội Thư viện nghiên cứu 14
- ▪ "Thư viện số là cơ quan/tổ chức có các nguồn lực, kể cả các nguồn nhân lực chuyên hoá, để lựa chọn, cấu trúc việc truy cập đến diễn giải, phổ biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu tập các công trình số hoá mà chúng ở dạng sẵn sàng để sử dụng một cách kinh tế cho một hoặc một số cộng đồng nhất định." - Liên đoàn Thư viện Hoa Kỳ 15
- ▪ Thư viện số là nơi trình bày những bộ sưu tập thông tin có tổ chức. Đối tượng của những bộ sưu tập đó là nguồn tài nguyên thông tin số hóa cùng với các phương thức: truy hồi, chọn lọc, truy cập, tổ chức và bảo trì bộ sưu tập đó. ▪ Người sử dụng: truy cập, chọn lọc, hiển thị tài liệu số ▪ Cán bộ thư viện: xây dựng, tổ chức, lưu hành 16
- ▪ Thư viện điện tử là loại thư viện "sử dụng các phương tiện điện tử trong thu thập, lưu trữ, xử lý, tìm kiếm và phổ biến thông tin" - Vũ Văn Sơn ▪ Thư viện điện tử là thư viện duy trì toàn bộ hay một phần đáng kể sưu tập của mình ở dạng máy tính có thể xử lý được như một phương thức thay thế, bổ sung cho những tài liệu in truyền thống hoặc tài liệu trên vi hình hiện đang chiếm ưu thế trong thư viện – B. Sloan 17
- ▪ “Thư viện điện tử là hệ thống thông tin phân tán cho phép tích hợp, bảo quản và sử dụng một cách hiệu quả những tập hợp đa dạng tài liệu điện tử, truy cập được ở dạng thuận tiện cho người sử dụng thông qua mạng truyền dữ liệu toàn cầu" - Chương trình thư viện điện tử của Nga 18
- ❑ LỢI ÍCH CỦA DL 1. Thư viện số mang thư viện đến người sử dụng 2. Máy tính được sử dụng để tìm kiếm và duyệt 3. Thông tin có thể được chia sẻ 4. Thông tin dễ dàng cập nhật hơn 5. Thông tin luôn sẵn có 6. Các dạng thông tin mới trở thành thực hiện được 7. Giá của DL ❑ PHÁT TRIỂN KỸ THUẬT 4 lĩnh vực kỹ thuật nổi bật đối với DL 1. Lưu trữ điện tử trở nên rẻ hơn giấy 2. Hiển thị máy tính cá nhân trở nên dùng thích hợp hơn 3. Mạng tốc độ cao trở nên phổ biến 4. Máy tính trở nên di động 19
- ▪ Ưu điểm và nhược điểm của DL ƯU ĐIỂM NHƯỢC ĐIỂM ✓ Không bị giới hạn về địa lý ✓ Truy cập hạn chế ✓ Tiết kiệm không gian ✓ Phần cứng/Phần mềm ✓ Sẵn có 24/24 ✓ Bản quyền ✓ Truy cập đồng thời ✓ Phụ thuộc vào nhà cung cấp ✓ Khả năng tìm kiếm ✓ Lưu trữ lâu dài ✓ Lưu trữ thuận tiện ✓ Mua quyền truy cập ✓ Kết nối mạng ✓ Chi phí thấp 20
- 3. CÁC KHÁI NIỆM CƠ BẢN ❑ Cơ sở dữ liệu tài liệu DL quản lý bất kỳ thông tin có thể được mã hoá thành dãy bit. Ví dụ: version số hoá của vật tải thông thường: văn bản, ảnh, âm thanh, đặc tả và thiết kế kỹ thuật ▪ Dữ liệu và Siêu dữ liệu − Thông tin lưu trữ trong dữ liệu có thể được phân chia thành dữ liệu và siêu dữ liệu. Dữ liệu là một thuật ngữ mô tả thông tin được mã hoá thành dạng số. − Siêu dữ liệu là dữ liệu về dữ liệu khác. Các loại siêu dữ liệu thông thường bao gồm + Siêu dữ liệu mô tả như thông tin thư mục; + Siêu dữ liệu cấu trúc về dạng và cấu trúc; + Siêu dữ liệu quản trị bao gồm các quyền, sự cho phép và thông tin khác được sử dụng để quản lý truy cập. 21
- − Sự phân biệt giữa dữ liệu và siêu dữ liệu thường phụ thuộc vào ngữ cảnh. Mục lục bản ghi hoặc tóm tắt thường được coi là siêu dữ liệu, bởi vì chúng mô tả dữ liệu khác, nhưng ở một mục lục trực tuyến hoặc một CSDL về tóm tắt chúng là dữ liệu. ✓ Siêu dữ liệu Metadata “Siêu dữ liệu Resource discovery là phần then chốt của bất kỳ nguồn tài liệu số. Nếu các nguồn tài liệu được tra cứu và hiểu trong môi trường phân bổ của World Wide Web, chúng cần được mô tả ngắn gọn, kết cấu rõ ràng phù hợp với quá trình xử lý của phần mềm máy tính. Hiện nay có nhiều tiêu chuẩn chính thức, từ hình thức đơn giản đến phức tạp, từ kết cấu lỏng đến chặt chẽ, từ các tiêu chuẩn độc quyền đến quốc tế.” (UNESCO) 22
- ▪ Đối tượng số + Không có một thuật ngữ chung được thiết lập đối với mục tin được lưu trữ trong DL. + Tổng quát nhất, tài liệu: là bất kỳ thứ gì có thể được lưu trữ trong một thư viện. Không có từ nào hàm ý bất kỳ thứ gì về nội dung, cấu trúc hoặc khung nhìn thông tin của NSD. + Chính xác hơn là đối tượng số được dùng để mô tả các đối tượng vật lý/ thông tin ở dạng số, mô tả một mục tin lưu trữ trong DL, điển hình gồm có dữ liệu, dữ liệu liên kết và một bộ nhận dạng. + Người ta còn gọi mỗi một mục tin trong DL là một tài liệu. 23
- + Dạng lưu trữ của đối tượng số Dạng thông tin được lưu trữ trong dữ liệu có thể rất khác nhau. Một mô hình mô phỏng dùng để huấn luyện phi công máy bay được lưu trữ như một số chương trình máy tính, cấu trúc dữ liệu, ảnh số hoá và dữ liệu khác. ▪ Máy tính và mạng + DL gồm có nhiều máy tính kết nối bằng một mạng truyền thông nói chung , Internet nói riêng + Máy tính trong DL có 3 chức năng chính: trợ giúp NSD tương tác với thư viện, lưu trữ CSDL tài liệu và cung cấp dịch vụ. + NSD User sử dụng máy khách Client + Kho lưu trữ Repository + Máy chủ Server + Gương (mirror) và cache + Proxy và gateway 24
- + Hệ phân tán: DL là một trong số hệ phân tán phức tạp nhất từng được xây dựng. + Hai loại dịch vụ điển hình được cung cấp bởi DL: Hệ thống định vị và hệ thống tìm kiếm. ✓Hệ thống định vị được dùng để nhận dạng và định vị thông tin. ✓Hệ thống tìm kiếm cung cấp các mục lục, chỉ mục và các dịch vụ khác để trợ giúp NSD tìm kiếm thông tin. 25
- Hình 1.1 - Máy tính trong thư viện số (W.Y.Arms) Kho lưu trữ NSD Hệ thống định vị Hệ thống tìm kiếm 26
- 4. NGHIÊN CỨU TIN HỌC TRONG DL a. Mô hình đối tượng DL lưu trữ và phân phát bất kỳ thông tin ở dạng số. Kết quả là, các bài toán nghiên cứu về biểu diễn và thao tác thông tin là đa dạng. NSD nhận thấy một công việc có thể được biểu diễn ở một máy tính là một quá trình lắp ráp các tệp và cấu trúc dữ liệu thành nhiều dạng. Quan hệ giữa các thành phần này và quan niệm về đối tượng của NSD được gọi là một mô hình đối tượng. 27
- b. Giao diện NSD Cải tiến cách NSD tương tác với thông tin trên máy tính là một chủ đề thú vị và phức tạp. Sự phát triển về các trình duyệt Web là một ví dụ về nghiên cứu sáng tạo ở các lĩnh vực như trực quan thông tin, phân lớp thông tin chứa trong tài liệu và trích rút một bản tóm tắt. c. Chỉ mục và Tìm kiếm thông tin Tìm kiếm thông tin là một chủ đề chính của thư viện. ▪ Siêu dữ liệu mô tả ▪ Chỉ mục tự động ▪ Xử lý ngôn ngữ tự nhiên ▪ Tài liệu phi văn bản 28
- d. Quản trị và bảo trì CSDL Quản trị CSDL là một chủ đề nghiên cứu được quan tâm trong DL. ▪ Tổ chức CSDL ▪ Lưu trữ và bảo trì ▪ Chuyển đổi e. Tính liên tác (interoperability) + Nhiều bài toán khó khăn nhất ở DL là các khía cạnh của tính liên tác, làm sao nhận được tính đa dạng của các hệ thống tính toán làm việc đồng thời. + Trên thế giới, nhiều DL độc lập đang được tạo ra với các chính sách quản lý và hệ thống tính toán khác nhau. + Tính liên tác và sự chuẩn hoá được xen kẽ nhau. Không may, quá trình tạo lập các chuẩn quốc tế thường đối lập với tính liên tác ở DL. 29
- + Tính liên tác bao gồm: ▪ Giao diện người sử dụng ▪ Đặt tên và định danh ▪ Dạng thức ▪ Siêu dữ liệu Siêu dữ liệu đóng vai trò quan trọng ở nhiều khía cạnh của DL, nhưng đặc biệt quan trọng đối với tính liên tác ▪ Tìm kiếm phân tán ▪ Giao thức mạng ▪ Giao thức tìm kiếm: giao thức Z39.50 ▪ Xác thực và an toàn thông tin ▪ Tính liên tác ngữ nghĩa Tính liên tác ngữ nghĩa xử lý với khả năng của NSD truy cập tới các lớp đối tượng số giống nhau, phân tán qua các CSDL không thuần nhất. 30
- 5. LẬP KẾ HOẠCH CHO DỰ ÁN XÂY DỰNG DL Tuy nhiên, sự xuất hiện của DL là điều tất yếu. Một DL thành công là một thư viện đáp ứng nhu cầu thông tin và truy cập của thị trường hiện nay và thị trường tiềm năng. Vốn tài liệu, người sử dụng và công nghệ là những vấn đề cần xem xét. ❑ Lý do xây dựng thư viện số − Lý do chính: DL phân phát thông tin tốt hơn thư viện truyền thống − Số lượng tài liệu ngày càng tăng 31
- − Sự phát triển của công nghệ thông tin và các hình thức xuất bản mới − Nhu cầu của người sử dụng thay đổi − Các hình thức tìm tin mới − Vai trò của thư viện thay đổi ❑ Các bước cơ bản của dự án xây dựng DL 1. Xác định dự án 2. Phác thảo kế hoạch triển khai DL 3. Thực hiện 32
- a. Xác định dự án Nêu mục đích, mục tiêu rõ ràng, xác định đối tượng độc giả và nội dung: − Phát triển hình ảnh và nhiệm vụ. Thư viện là các nguồn thông tin hàng đầu; là trung tâm thông tin quan trọng nhất dành cho sinh viên, giảng viên và nhân viên của trường đại học/ cao đẳng. Để thực hiện nhiệm vụ của mình, thư viện phát triển các kho tài liệu, tổ chức kho tài liệu để truy cập, cung cấp khả năng truy cập các nguồn thông tin khác, dạy người dùng các kỹ năng thư viện, tuyển dụng và đào tạo cán bộ các kỹ năng cần thiết để thư viện hoạt động, cung cấp phương tiện và dịch vụ thúc đẩy nghiên cứu và học tập. − Lập mục đích và mục tiêu Mục đích là mục tiêu dài hạn hình thành cùng với hình ảnh của tổ chức. Mục tiêu là những hoạt động cụ thể mà tổ chức muốn hoàn thành trong một giai đoạn nào đó, thường là trong vòng một năm. Mục tiêu mang tính ngắn hạn, chỉ tiêu phấn đấu có thể đạt được. 33
- b. Phác thảo kế hoạch triển khai thư viện số Xác định các nguồn yêu cầu và phác thảo các nhiệm vụ khác nhau, chiến lược và thời hạn để hoàn thành mục đích. Chiến lược do các phương pháp cấu thành, được thiết kế để hoàn thành mục đích và mục tiêu. Chiến lược bao gồm kế hoạch hành động, người phụ trách, thời hạn và các nguồn cần có. Bảng dưới đây là bản mẫu của một kế hoạch hành động. Mục Kết quả Các nguồn lực yêu Người phụ Ngày dự kiến đích mong đợi cầu/ Chi phí dự án trách hoàn thành 34
- ❑ Các nguồn lực yêu cầu − Nội dung vốn tài liệu số đáp ứng nhu cầu của đối tượng độc giả và mục tiêu của dự án − Nhân sự và những kỹ năng cần thiết để xây dựng, tổ chức và quản lý thư viện số và thức hiện các nhiệm vụ cần thiết trong xây dựng thư viện số − Hạ tầng công nghệ thông tin (Ví dụ: phần cứng, phần mềm, khả năng kết nối) − Phân bổ ngân sách − Hỗ trợ và hợp tác của các đơn vị chính tham gia − Khảo sát môi trường. Điểm chung của tất cả các định nghĩa và nhiệm vụ này là nhu cầu khảo sát môi trường kỹ lưỡng để có thể chuẩn bị một hình ảnh cho tương lai và chiến lược để đạt được tương lai đó ✓ Các công cụ cùng các tiêu chuẩn và giao thức tương ứng cho việc cung cấp thông tin và dịch vụ và mô tả việc bảo trì và đánh giá hệ thống sẽ được thực hiện nằm trong chiến lược xây dựng35 thư viện số.
- c. Thực hiện − Lựa chọn nội dung. Tiêu chí lựa chọn cần phải mở rộng − Tổ chức tài liệu gốc để số hoá, lưu giữ, truy cập, tìm kiếm và tra cứu. − Cung cấp dịch vụ. Nghiên cứu thị trường và cung cấp các dịch vụ phù hợp − Tìm kiếm và sử dụng các công nghệ và công cụ chuyên dụng cho kế hoạch − Bảo trì hệ thống. Liên tục giám sát và bảo trì hệ thống là biện pháp cần thiết để nâng cao chất lượng dịch vụ tốt hơn − Thực hiện các chiến lược marketing. Thư viện số cần được tiếp thị tới người dùng hiện tại và tiềm năng. Có rất nhiều cách xúc tiến việc sử dụng thư viện số 36
- − Giám sát và đánh giá hoạt động của thư viện. Đánh giá hoạt động định kỳ sẽ cho phép ban quản lý định hướng lại kế hoạch nhằm đáp ứng những thay đổi của môi trường. Nhu cầu tái định hướng có thể do những thay đổi công nghệ, chính sách ✓ Khảo sát môi trường Điểm chung của tất cả các định nghĩa và nhiệm vụ này là nhu cầu khảo sát môi trường kỹ lưỡng để có thể chuẩn bị một hình ảnh cho tương lai và chiến lược để đạt được tương lai đó. ✓ Kho tài liệu Tiêu chí lựa chọn tài liệu của tổ chức cần phải rõ ràng. Tài liệu lựa chọn phải phù hợp với tiêu chí đề ra: chủ đề, yêu cầu, tính duy nhất và giá trị. Tài liệu còn phải có giá trị sử dụng lâu dài. Đôi khi một ấn phẩn mới có thể thay thế ấn phẩm hiện có. 37
- ✓ Bản quyền Mục đích của thư viện số là cung cấp truy cập vốn tài liệu từ xa. Bản quyền là vấn đề quan trọng cần cân nhắc trong xây dựng thư viện số vì chức năng phân phối lại của thư viện số. ▪ Công nghệ − Có công nghệ để số hoá tài liệu in và tài liệu dạng thu nhỏ. Chí phí dành cho công nghệ tốn kém và đôi khi việc mua công nghệ có thể là sự lựa chọn tốt hơn. Ngoài ra, việc tạo ra các công cụ truy cập cần phải cân nhắc kỹ vì chi phí bỏ ra có thể rất cao. Công nghệ OCR vẫn chưa thực sự đáng tin cậy. − Tiếp nhận và xây dựng hạ tầng công nghệ thông tin cần thiết. Lựa chọn hệ thống thư viện số dựa vào nhu cầu và khả năng của cơ quan (Ví dụ: ngân sách, khả năng chuyên môn). Bạn nên lựa chọn hệ thống có bán trên thị trường hay hệ thống sử dụng phần mềm nguồn mở do chính bạn xây dựng? 38
- 6. Vấn đề Bản quyền trong thư viện số a. Khái niệm cơ bản ▪ Bản quyền (Copyright): thuật ngữ pháp lý mô tả quyền xác định cho người sáng tạo đối với tài liệu và các công trình nghệ thuật của họ. ▪ Vi phạm bản quyền (Copyright infringement): việc sử dụng tài liệu được bảo vệ bởi luật bản quyền không được phép của chủ sở hữu, hoặc cấp phép và/hoặc bán quyền sử dụng. ▪ Người sáng tạo (Creator): tác giả của tác phẩm, người mà công trình của họ được công nhận. Chủ sở hữu bản quyền. ▪ Nguyên tắc sử dụng không phải xin phép (Fair use principle): cho phép thư viện sao chụp tác phẩm. Kiểm tra bốn nhân tố sẽ đảm bảo thư viện quyết định việc sử dụng là phải xin phép hay không trong trường hợp có một bản sao thực làm ra. 39
- ▪ Học thuyết chấm dứt quyền sau lần bán đầu tiên (First sale doctrine): điều khoản cho phép thư viện, một khi đã bản sao tác phẩm đúng bản quyền, quyền phổ biến bản sao không cần phép của chủ sở hữu bản quyền. Lần bán đầu tiên đảm bảo các thư viện mượn sách hoặc tiến hành mượn liên thư viện không vi phạm luật bản quyền. ▪ Quyền sở hữu trí tuệ (Intellectual Property Right)): sáng tạo trí óc: sáng chế, tác phẩm văn học và nghệ thuật, biểu tượng, tên, ảnh và các thiết kế dùng trong thương mại. ▪ Quyền tinh thần (Moral rights): quyền dành cho như người sáng tạo tác phẩm, thực hiện hành động nếu ai đó gây sai trái hoặc tác phẩm bị xuyên tạc. 40
- ▪ WIPO - Tổ chức Sở hữu trí tuệ quốc tế là tổ chức chuyên môn của Liên hiệp quốc hoạt động trong việc phát triển một hệ thống sở hữu trí tuệ quốc tế truy cập được và ổn định dành cho sự sáng tạo, kích thích cải tiến và góp phần vào phát triển kinh tế trong khi bảo vệ được lợi ích chung. 41
- b. Quyền sở hữu trí tuệ là gì? ❖ Mở đầu ▪ Thư viện là cơ quan có nhiệm vụ cung cấp sự truy cập thông tin công bằng cho cộng đồng nó phục vụ. Quyền sở hữu trí tuệ và bản quyền ảnh hưởng đến nhiệm vụ này như thế nào? ▪ WIPO định nghĩa quyền sở hữu trí tuệ là “sáng tạo trí óc: sáng chế, tác phẩm văn học và nghệ thuật, biểu tượng, tên, ảnh và các thiết kế dùng trong thương mại.” ▪ Theo WIPO, quyền sở hữu trí tuệ được phân thành hai loại: sở hữu công nghiệp và bản quyền. ❖ Bản quyền là gì? ▪ Bản quyền là thuật ngữ pháp lý mô tả quyền của người sáng tạo đối với các tác phẩm văn học và nghệ thuật của họ. Bảo vệ bản quyền là tự động cho dù tác phẩm này có được đăng ký hay không. Ngay khi tác phẩm được viết ra, nó đã được bảo vệ. ▪ Bản quyền phức tạp và khác nhau giữa các nước. 42
- ❖ Ai là chủ sở hữu bản quyền? ▪ Nói chung, người sáng tạo ra tác phẩm là chủ sở hữu bản quyền. Trong trường hợp có từ hai người sáng tạo trở lên, điều quan trọng là cần có một bản cam kết viết ra xem ai là chủ sở hữu bản quyền. Mặt khác, đã có những ngoại lệ với quy định này, và ngoại lệ cũng khác nhau giữa các nước. ▪ Bản quyền cũng có thể được cấp lại (thí dụ, cho nhà xuất bản) và/hoặc hết thời hạn sau khi tác giả chết. ❖ Quyền dành riêng cho chủ sở hữu bản quyền ▪ Quyền tái bản tác phẩm (gồm sao chụp, sao chép, làm phim, ghi âm và quét) ▪ Đưa tác phẩm đến với công chúng lần đầu tiên 43
- ▪ Tuyên truyền tác phẩm với công chúng ▪ Trình diễn tác phẩm với công chúng (chiếu phim, chơi nhạc) ▪ Phóng tác (gồm dịch, kịch hoá, chuyển biên) ▪ Truyền tệp và ghi âm cho công chúng bằng cách sử dụng bất kỳ hình thức công nghệ nào (qua thư điện tử, phát thanh, ) ▪ Phát lại trên vô tuyến hoặc truyền hình. ❖ Bản quyền sẽ chấm dứt trong bao lâu? ▪ Khoảng thời gian bản quyền khác nhau giữa các nước. Ở Philippines, khoảng thời gian bản quyền chấm dứt sau khi người sáng tạo chết 50 năm. 44
- ▪ Ở Ôxtrâylia, từ tháng 1/2005, khoảng thời gian bản quyền là cuộc đời người sáng tạo công thêm 70 năm hoặc 70 năm từ khi tác phẩm được xuất bản lần đầu tiên. ▪ Các điều khoản ở Hoa Kỳ còn phức tạp hơn. ❖ Vi phạm bản quyền là gì? ▪ Vi phạm bản quyền là sử dụng tài liệu được bảo vệ bản quyền không được phép của chủ sở hữu, hoặc cấp phép và/hoặc bán trái phép. ❖ Các hoạt động không vi phạm bản quyền ▪ Đó là các hoạt động thuộc sử dụng không phải xin phép. ▪ Sử dụng thông tin, không nằm trong diện bảo vệ bản quyền. 45
- ❖ Các tác phẩm không được bảo vệ bản quyền ▪ Ý tưởng, quá trình, hệ thống, phương pháp hoặc hoạt động, khái niệm, nguyên lý, phát hiện hoặc siêu dữ liệu cũng như sự kiện nếu được diễn tả, giải thích, minh hoạ hoặc kèm trong một tác phẩm. ▪ Tin tức hàng ngày và các sự kiện linh tinh khác có tính chất bình thường của thông tin báo chí. ▪ Tài liệu luật, hành chính hoặc có tính pháp lý, cũng như các bản dịch chính thức của các tài liệu này. ▪ Tài liệu của chính phủ; tuy nhiên cần phải xin phép trước khi khai thác vì mục đích lợi nhuận. ▪ Tác giả của các bài nói chuyện, bài giảng, bài thuyết giáo, bài luận văn sẽ có độc quyền tạo ra bộ sưu tập các tác phẩm của họ. 46
- ❖ Quyền tinh thần ▪ Bổ sung cho bản quyền, người sáng tạo có các quyền tinh thần. Đó là các quyền dành cho người sáng tạo tác phẩm, thực hiện hành động nếu ai đó xâm phạm tác phẩm hoặc tác phẩm bị xuyên tạc. ❖ Học thuyết chấm dứt quyền sau lần bán đầu tiên là gì? ▪ Khi thư viện hoặc cá nhân mua hợp pháp một bản sao tác phẩm, Học thuyết chấm dứt quyền sau lần bán đầu tiên của luật bản quyền (17 U.S.C. Section 109) cho phép thư viện hoặc cá nhân này có thể thực hiện quyền dành riêng khác của bản quyền-quyền phổ biến bản sao-không cần phép của chủ sở hữu bản quyền 47
- ▪ Lần bán đầu tiên đảm bảo cho thư viện mượn sách và tiến hành các dịch vụ liên thư viện không cần cam kết không vi phạm bản quyền. ❖ Hướng dẫn sử dụng không phải xin phép Việc sao chép cá nhân một tác phẩm đã xuất bản ra một bản sao duy nhất, ở đây việc sao chép được thực hiện bởi một người tự nhiên chỉ cho mục đích nghiên cứu hoặc học tập cá nhân, sẽ được phép, không cần sự cho phép của chủ sở hữu bản quyền tác phẩm. Mặt khác, bản quyền sẽ không được mở rộng cho: ▪ Sao chép toàn bộ cuốn sách hoặc phần quan trọng của nó hoặc nhạc phẩm dưới dạng đồ hoạ bằng các phương tiện sao chụp; ▪ Tập hợp dữ liệu và các tài liệu khác; ▪ Chương trình máy tính. 48
- ▪ Bất kỳ tác phẩm nào khi sao chép có thể làm ảnh hưởng quyền lợi hợp pháp của tác giả. ▪ Việc sử dụng chương trình máy tính cùng với máy tính cho mục đích này, và để mở rộng chương trình máy tính đã có; ▪ Mục đích lưu trữ, và để thay thế bản sao đã có sở hữu luật pháp của một chương trình máy tính nếu bị mất, phá huỷ hoặc không sử dụng được nữa. 49
- ❖ Phân tích 4 yếu tố về sử dụng không phải xin phép ▪ Sử dụng việc kiểm tra sau đây để xác định việc sử dụng có phải là không cần xin phép hay không: – Mục đích và đặc điểm sử dụng là gì? Đó sử dụng có bản chất thương mại hay mục đích đào tạo phi lợi nhuận, – Bản chất của tác phẩm có bản quyền; – Số lượng và thực chất của phần được sử dụng so với toàn bộ tác phẩm; – Tác động của Việc sử dụng đến thị trường tiềm năng hoặc gía trị của tác phẩm được bảo vệ bản quyền. 50
- ❖ Quyền đặc biệt của thư viện Các thư viện được phép thực thi những quyền đặc biệt bổ sung cho việc sử dụng không phải xin phép. Một số quyền đó là: ▪ Lưu trữ những tác phẩm bị phá huỷ, hư hỏng, ăn cắp và mất. ▪ Sao chụp cho người dùng thư viện. ▪ Sao chụp cho những người dùng khác (mượn liên thư viện). ❖ Trình diễn và trưng bày trong dạy trực tiếp và đào tạo từ xa ▪ Các cơ quan giáo dục cũng được phép trưng bày và trình diễn tác phẩm khác trong các khoá học có giảng dạy trực tiếp, và mức độ ít hơn trong đào tạo từ xa. 51
- ❖ Bảo vệ bản quyền quốc tế ▪ Không có gì là bảo vệ bản quyền quốc tế, nhưng phần lớn các nước có bảo vệ các tác phẩm nước ngoài theo các hiệp ước và công ước quốc tế. ❖ Ghi nhớ ▪ Nếu không chắc chắn về các điều khoản của luật này, để áp dụng cụ thể, cần xin giấy phép sử dụng tài liệu từ chủ sở hữu bản quyền và/hoặc tư vấn luật sư vì luật bản quyền ở các nước khác nhau thì khác nhau. Mặt khác, cũng nên nhớ rằng, do công ước quốc tế, có sự dành cho nhau những đặc quyền trong luật này với các nước tham gia công ước, hiệp ước hoặc nghị định liên quân đến quyền sở hữu trí tuệ. 52
- c. Luật bản quyền hiện hành có áp dụng trong thời đại số hay không? ❖ Mở đầu ▪ Mục đích của luật bản quyền là cân bằng quyền của chủ sở hữu bản quyền và người dùng. Luật bản quyền hiện hành có áp dụng được trong thời đại số hay không? Thư viện mua thông tin để cung cấp bình đẳng cho cộng đồng của mình. Vì ngày càng có nhiều thông tin phổ biến dưới dạng số, nên thư viện cần phải chú ý để đảm bảo cho công chúng có thể được hưởng các quyền truy cập giống như với thông tin dạng in. 53
- ❖ Bản sao số ▪ Bản quyền dựa trên việc sao chép tài liệu. Trong thời đại in, việc sao chụp có thể nhận biết được, và một trong các quyền dành riêng chi chủ sở hữu bản quyền là sao chụp. Trong thời đại số, các bản sao số được tạo ra ngay khi tài liệu này được truy cập. ❖ Cấp phép và quyền sở hữu ▪ Ngày nay các thư viện không bổ sung tài liệu số để sở hữu riêng. Thay vào đó họ mua quyền truy cập, mà đòi hỏi đặt mua dài hạn liên tục ❖ Vấn đề bảo quản ▪ Luật bản quyền cho phép thư viện sao chụp tài liệu in và sao chép tài liệu điện tử với mục đích bảo quản. 54
- ❖ Đăng ký trước điện tử ▪ Luật bản quyền hạn chế việc đặt trước tài liệu điện tử ở các chương, bài báo đơn lẻ, một số biểu đồ và các minh hoạ khác, hoặc những phần nhỏ của tác phẩm. ▪ Truy cập cũng có thể hạn chế cho các thành viên của lớp và cần chấm dứt vào cuối khoá học này. Giấy phép cũng có thể cần thiết đối với những tài liệu mà sẽ được sử dụng lại sau này. ❖ Ngoại lệ đối với thư viện và cơ quan lưu trữ ▪ Theo Đạo luật bản quyền ở Hoa Kỳ, mục 404 của đạo luật bản quyền thiên niên kỷ số (DMCA) bổ sung mục 108 của đạo luật bản quyền. 55
- ▪ Mục “Hạn chế các quyền đặc biệt: Tái bản bởi thư viện và cơ quan lưu trữ” ❖ Kết luận ▪ Mặc dù DMCA đã có hiệu lực năm 2000, những vẫn còn những vấn đề bất ổn và các mối quan tâm về bản quyền trong thời đại số. Đó là vấn đề ở Hoa Kỳ cũng như ở bất kỳ nước nào. Một lần nữa, xin lưu ý rằng nên tư vấn luật sư về các vấn đề bản quyền cụ thể. ✓ Dùng Internet để tìm các luật trong nước bạn tác động đến bản quyền trong thời đại số. Nếu không có, hãy tìm các diều khoản bản quyền tác động đến thư viện ở nước bạn. 56
- ❑ TÀI LIỆU THAM KHẢO 1. Đỗ Quang Vinh (2009), Thư viện số - Chỉ mục và Tìm kiếm, Nxb Đại học Quốc gia Hà Nội. 2. Lourdes T.D. (2006), Thư viện số và truy cập mở tài liệu lưu trữ, Nguyễn Xuân Bình và nnk biên dịch, UNESCO, Hà Nội. 3. Arms W.Y. (2003), Digital Libraries, MIT Press, Cambridge. 4. Fox E.A. (2000), Advanced Digital Libraries, Virginia Polytechnic Institue and State University. 5. Lesk M. (2005), Understanding Digital Libraries, 2nd Edition, Morgan Kaufmann, San Francisco. 6. Witten I.H., Bainbridge D. (2003), How to Build a Digital Library, Morgan Kaufmann, San Francisco. 57
- KẾT THÚC ! TRÂN TRỌNG CÁM ƠN ! 58