Giáo trình Hệ thống tìm tin (Phần 2)

pdf 53 trang hapham 3110
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Hệ thống tìm tin (Phần 2)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_he_thong_tim_tin_phan_2.pdf

Nội dung text: Giáo trình Hệ thống tìm tin (Phần 2)

  1. CH ƯƠ NG 5 H TH NG TÌM TIN TH CƠNG H th ng tìm tin th cơng bao g m các thành ph n chính là h th ng m c l c, các b phi u th ư mc và các b phi u d ki n. 5.1. H th ng m c l c 5.1.1. Khái ni m H th ng m c l c th ư vi n (hay th ưng đưc g i là mc l c) là mt t p h p cĩ t ch c các bi u ghi ph n ánh v n tài li u c a m t kho tài li u hay m t b sưu t p nào đĩ. M t b sưu t p cĩ th bao g m m t ho c nhi u lo i hình tài li u nh ư sách, n ph m đnh k ỳ, b n đ, tranh nh, b ăng hình Thơng th ưng, m c lc ph n ánh v n tài li u c a m t th ư vi n ho c cơ quan thơng tin. Tuy nhiên, c ũng cĩ nh ng mc l c ph n ánh v n tài li u c a nhi u th ư vi n, cơ quan thơng tin nh m h tr cho vi c chia s ngu n l c thơng tin gi a các t ch c nh ư mc l c liên h p. Vi c t ch c m c l c tr nên c n thi t đi v i m t th ư vi n khi vn tài li u phát tri n đn m c khơng th ki m sốt đưc t ng tài li u trong kho. Mt th ư vi n t ư nhân nh ho c m t th ư vi n c a l p h c khơng nh t thi t ph i t ch c m c l c vì ng ưi s dng cĩ th nh tng quy n sách, b ăng ghi âm, b n đ và các tài li u khác theo các du hi u nh ư tác gi , nhan đ, ch đ, hình dáng, màu s c hay th m chí v trí ca tài li u trên m t giá sách c th . Nu v n tài li u l n h ơn m t chút thì th ư vi n cĩ th sp xp tài li u theo m t cách nào đĩ, ch ng h n nh ư phân nhĩm tài li u theo ch đ và cho phép ng ưi s dng t ch n tài li u trong kho. Khi v n tài li u quá ln đn m c khơng th s dng cách s p x p và tìm tài li u đơ n gi n thì th ư vi n ph i l p bi u ghi hay phi u mơ t chính th c cho t ng tài li u đ cĩ th d dàng tìm ki m, ki m kê và qu n lý tài li u. 5.1.2. Ch c n ăng ca m c l c Mc l c cĩ các ch c n ăng cơ bn là nh n d ng, t p h p, đánh giá hay ch n l c và xác đnh v trí ca tài li u. Các ch c n ăng này cĩ s ph thu c l n nhau. Ch c n ăng nh n dng hay tìm kim tài li u. Mc l c đưc xây d ng nh m t o điu ki n cho ng ưi s dng cĩ th đi chi u các d li u v tài li u đã bi t v i các bi u ghi trong m c l c đ xác đnh th ư vi n cĩ tài li u đĩ hay khơng. Nĩi cách khác, mc l c cho phép ng ưi s dng nh n d ng ho c tìm ki m tài li u d a trên các d li u đã bi t v tài li u nh ư tác gi , nhan đ, ch đ Ch c năng t p h p tài li u. Ch c n ăng này cho phép các bi u ghi c a các tài li u gi ng nhau ho c cĩ liên quan ch t ch vi nhau v mt ph ươ ng di n ho c d u hi u nào đĩ đưc t p h p vào m t ch trong m c l c. Ch ng h n, các tài li u v cùng m t ch đ đưc t p h p l i v i nhau trong m c l c ch đ hay m c l c phân lo i, các tài li u c a cùng m t tác gi đưc x p cùng nhau trong m c l c ch cái. Nh đĩ, ng ưi 59
  2. s dng cĩ th bi t đưc trong m t th ư vi n, c ơ quan thơng tin cĩ bao nhiêu tài li u ca m t tác gi nào đĩ ho c cĩ bao nhiêu tài li u v mt ch đ nào đĩ M t trong nh ng cách t t nh t đ th c hi n ch c n ăng t p h p tài li u là thơng qua quá trình ki m sốt tiêu đ chu n, đc bi t là xây d ng h th ng tham chi u (ch ch ) qua l i. Ch c n ăng đánh giá hay ch n l c tài li u. Ch c n ăng này cho phép ng ưi s dng l a ch n t nhi u bi u ghi nh ng tài li u thích h p nh t và tt nh t ch a đng ki n th c ho c thơng tin c n thi t. Ch ng h n, ng ưi s dng cĩ th la ch n m t l n xu t b n nào đĩ trong nhi u l n xu t b n khác nhau c a cùng m t tác ph m ho c l a ch n nh ng tài li u cĩ cùng m t n i dung nh ưng đưc vi t b i các tác gi khác nhau và đưc ch a trên các v t mang tin khác nhau Ch c n ăng xác đnh v trí tài li u. Mc l c ph n ánh đa ch lưu tr tài li u trong kho c a m t ho c mt s th ư vi n, c ơ quan thơng tin. Nh đĩ, ng ưi s dng cĩ th d dàng xác đnh đưc v trí ca tài li u cn tìm. 5.1.3. Các hình th c mc l c th cơng 5.1.3.1. Mc l c sách Mc l c sách là mc l c đưc ghi chép ho c in d ưi d ng các t p sách. M c l c sách th ưng là các danh m c tài li u đưc s p x p theo v n ch cái tên tác gi , nhan đ ho c theo ch đ. So v i m c l c phi u, m c l c sách cĩ ưu đim là cĩ đ nén cao, c ơ đng, cĩ th đem theo đ s dng mi n ơi và cĩ th xem l ưt nhanh. Tuy nhiên, mc l c sách cĩ hn ch là chi phí cp nh t cao nên m c l c sách khơng đưc c p nh t th ưng xuyên nh ư mc l c phi u. Hin nay mc l c sách vn đưc s dng cùng v i các lo i m c l c khác trong nhi u th ư vi n. ðc bi t, m c l c l c sách v n đưc s dng nh ư ph ươ ng ti n duy nh t đ truy c p các tài li u quí hi m trong m t s th ư vi n và cơ quan l ưu tr . 5.1.3.2. M c l c phi u Mc l c phi u là mc l c đưc t o thành t nh ng phi u mơ t (bi u ghi) vi kích th ưc khác nhau. Hi n nay, kích th ưc c a phi u chu n là 7,5 x 12,5 cm. Các phi u mơ t cĩ th đưc chép tay, đánh máy ho c đưc in t máy tính. Bên c nh nh ng h n ch nh ư thi u tính g n nén, chi m nhi u di n tích, khơng c ơ đng, m c l c phi u c ũng cĩ các ưu đim nh ư d cp nh t và cho phép nhi u ng ưi s dng cùng m t lúc. Hi n nay m c l c phi u v n đưc s dng trong nhi u th ư vi n. Cĩ nhi u lý do đ các th ư vi n duy trì mc l c phi u nh ư th ư vi n khơng cĩ kh năng và điu ki n trang b ph n m m và thi t b cn thi t cho m c l c đin t ; th ư vi n khơng cĩ kh năng chuy n đi h i c hồn tồn m c l c phi u sang m c l c đin t ho c đơ n gi n là do nĩ phù hp v i thĩi quen ca ng ưi s dng th ư vin. 5.1.4. Tiêu chí đánh giá ch t l ưng m c l c Dù đưc t ch c d ưi b t k ỳ hình th c nào, m t m c l c hi u qu ph i đm b o mt s tiêu chu n nh t đnh cho phép tra c u và qu n tr d dàng. Cĩ th đánh giá ch t l ưng c a m t m c l c d a trên các tiêu chí dưi đây. 60
  3. Tính linh ho t và c p nh t. Vi c b sung và thanh l c tài li u đưc ti n hành th ưng xuyên trong các th ư vi n, c ơ quan thơng tin. Mc l c ph i ph n ánh k p th i s thay đi trong v n tài li u c a th ư vi n, c ơ quan thơng tin. Tính linh ho t mc l c phi u cao h ơn so v i m c l c d ng sách. Cĩ th d dàng thêm vào hay lo i b các bi u ghi kh i các h p phi u khi c n thi t. So v i m c l c phi u thì m c l c sách khĩ c p nh t h ơn vì m t khi đã đưc in ra thì khơng th thêm vào ho c lo i b các bi u ghi đưc n a, tr khi xu t b n các ph tr ươ ng ho c tái b n. Tuy nhiên, vì hi n nay các m c l c này đưc biên so n b ng máy tính nên cĩ th thay đi các bi u ghi hi n cĩ m t cách linh ho t. Ví d , ch c n s d ng m t l nh đơn gi n là cĩ th thay đ i hàng lo t bi u ghi, trong khi v i m c l c phi u thì ph i s a t ng phi u m t. Tính thân thi n đ i v i ng ưi s d ng. Mc l c ph i đưc t ch c sao cho ng ưi s dng cĩ th tìm ki m nhanh chĩng và d dàng các bi u ghi. ðiu này địi h i cách sp x p các bi u ghi trong m c l c ph i khoa h c, phù hp v i thĩi quen tìm tin c a ng ưi dùng tin và các h ưng d n s dng ph i rõ ràng, d hi u. Tính kinh t . Mc l c ph i đưc t ch c vi các ph ươ ng án hp lý, cĩ tính đn chi phí xây d ng, duy trì mc l c c ũng nh ư hi u qu kinh t ca m c l c. Phi u dùng cho các m c l c phi u d sn xu t và chi phí khơng cao. Trong khi đĩ, giá thành biên so n và xu t b n m c l c sách t ươ ng đi cao n u nh ư ch sn xu t ít bn. N u s bn m c l c đưc xu t b n nhi u thì chi phí s th p h ơn so v i m c l c phi u. Tính s dng thu n ti n. Mc l c ph i g n nh , chi m ít di n tích và d dàng truy cp đi v i ng ưi s dng. 5.1.5. Các thành ph n c a h th ng m c l c Mt h th ng m c l c truy n th ng g m ba thành ph n là mc l c cơng c ng, m c lc cơng v và hp phi u tiêu đ chu n Mc l c cơng c ng (public access catalog) là mc l c dành cho ng ưi s dng truy cp t do. Tùy theo cách s p x p các phi u mơ t, cĩ th chia m c l c cơng c ng thành m c l c ch cái, m c l c phân lo i, m c l c ch đ. Mc lc cơng v là mc l c s dng n i b (th ưng là mc l c v trí, tng m c l c ch cái) ph c v cho ho t đng nghi p v ca nhân viên th ư vi n. Mc l c v trí ph n ánh t ch c kho tài li u c a m t th ư vi n. Các phi u mơ t trong m c l c đưc s p x p theo tr t t ca tài li u trên giá. Vì vy, m c l c v trí cịn đưc g i là mc l c x p giá. Các phi u mơ t ca m c l c v trí th ưng ph n ánh đy đ s lưng b n/t p và v trí ca các tài li u trong kho, đc bi t khi m t th ư vi n cĩ nhi u kho tài li u. M c l c v trí th ưng đưc bo qu n và s dng n i b b ph n t ch c kho. Các h p phi u tiêu đ chu n ch a các phi u th hi n các hình th c tên cá nhân và tp th , nhan đ th ng nh t, tùng th ư và các đ mc ch đ đã đưc l a ch n là các hình th c chu n đ s dng nh ư các tiêu đ trong m t m c l c c th . Các h p phi u tiêu đ chu n c ũng ch a danh m c các tham chi u dùng trong m c l c cơng c ng đ 61
  4. ch ch t dng khơng chu n sang d ng chu n đưc s dng làm tiêu đ. Các h p phi u này th ưng đưc s dng n i b . 5.1.6. H th ng m c l c ch cái (MLCC) 5.1.6.1. Khái ni m Mc l c ch cái là h th ng m c l c trong đĩ các phi u mơ t đưc s p x p theo tr t t ch cái tên tác gi ho c nhan đ tài li u đưc ph n ánh trong m c l c. Mc l c ch cái là h th ng tìm tin đưc t ch c theo s ơ đ tuy n tính. Trong m c lc ch cái, thơng tin v mi tài li u đưc trình bày trên m t phi u mơ t. Các phi u mơ t đưc s p x p d a trên các đc tr ưng hình th c c a tài li u là tên tác gi /nhan đ tài li u. Cách s p x p này cho phép ng ưi s dng cĩ th tr li đưc hai câu h i c ơ bn sau: 1) Th ư vi n cĩ hay khơng m t tài li u c th vi tên tác gi và/ho c nhan đ đã đưc bi t tr ưc; 2) Th ư vi n cĩ nh ng tác ph m nào c a m t tác gi c th . Mc l c ch cái ph n ánh đy đ và tồn di n v n tài li u c a th ư vi n vì thành ph n c a m c l c khơng ch cĩ các phi u mơ t chính mà cịn bao g m các phi u mơ t b sung và các phi u ch ch . 5.1.6.2. Cu trúc mc l c ch cái Các thành ph n c a m c l c ch cái bao g m các phi u mơ t, các phi u tiêu đ và các phi u ch ch . Phi u mơ t Phi u mơ t trình bày các y u t đc tr ưng c ơ bn c a mt tài li u dưi m t hình th c chu n hĩa giúp ng ưi s dng nh n d ng và phân bi t tài li u này v i các tài li u khác. Phi u mơ t cĩ kích th ưc theo qui đnh là 7,5 x 12,5cm . Cĩ hai lo i phi u mơ t là phi u mơ t chính và phi u mơ t b sung. Phi u mơ t chính ch a đy đ các d li u th ư mc cho phép nh n d ng tài li u và là thành ph n chính trong các h th ng m c l c. Phi u mơ t b sung ch a mơ t gi n l ưc, h tr cho phi u mơ t chính nh m m rng kh năng tìm tin cho ng ưi s dng. Ng ưi ta ch n m t trong các đim truy c p làm tiêu đ ca phi u mơ t chính. Các đim truy c p cịn l i đưc s dng làm các tiêu đ ca các phi u mơ t b sung. Tên tác gi và nhan đ th ưng đưc dùng làm tiêu đ ca phi u mơ t chính. Phi u tiêu đ Phi u tiêu đ đưc s dng đ phân chia gi i h n các phi u mơ t theo các t , c m t nh m t o điu ki n thu n ti n cho ng ưi s dng. Phi u tiêu đ đưc làm b ng lo i gi y c ng, cĩ kích th ưc 7,5 x 12,5 cm và cĩ ph n nhơ lên cao 1,5 cm ( đưc g i là g phi u) Cĩ hai lo i phi u tiêu đ là phi u tiêu đ chính và phi u tiêu đ ph . Phi u tiêu đ 2 chính cĩ ph n g nhơ phi u lên gi a, chi m /3 chi u r ng c a phi u. Phi u tiêu đ chính đưc s dng đ phân đnh gi i h n các vn ch cái ca ngơn ng đưc s dng ho c các tác gi ni ti ng, các c ơ quan, t ch c quan tr ng. 1 Phi u tiêu đ ph cĩ g nhơ lên bên ph i ho c bên trái và chi m /3 ho c ¼ chi u rng c a phi u. Phi u tiêu đ ph đưc s dng đ phân bi t các phi u trong cùng mt v n (ví d C, CH ho c N, NH) ho c các tác gi ni ti ng, tác gi cĩ nhi u tài li u. Phi u ch ch 62
  5. ð ki m sốt tính th ng nh t trong h th ng m c l c nh m t o điu ki n thu n ti n cho vi c s dng, bên c nh các phi u mơ t mc l c ch cái cịn cĩ các phi u ch ch (c ũng đưc x p theo v n ch cái). Phi u ch ch (“xem”, “dùng cho”) đưc s dng đ hưng d n ng ưi s dng đn tiêu đ mơ t th ng nh t đưc s dng trong m c l c. Ví d: Tr n T Xươ ng xem Tú Xươ ng Phi u ch ch qua l i (“c ũng xem”) đưc dùng đ hưng d n ng ưi s dng tìm thêm nh ng tiêu đ khác trong m c l c cĩ liên quan đn v n đ đang đưc tra c u. 5.1.6.3.Cách t ch c phi u mơ t trong mc l c ch cái Cĩ hai ki u s p x p phi u mơ t trong MLCC là ki u t đin và ki u phân đon. Mc l c ch cái ki u t đin. Cách t ch c theo ki u t đin đưc s dng ph bi n M cho đn nh ng n ăm 1990. Trong MLCC ki u t đin, t t c các phi u mơ t cĩ tiêu đ là tên tác gi , nhan đ tài liu, ch đ đưc x p chung theo tr t t ch cái, l n l ưt theo t ng t mt. Cách s p x p này đơ n gi n, d tra c u n u s phi u mơ t ít và tp trung trong m t ơ phi u. Tuy nhiên, khi th ư vi n phát tri n, cách s p x p này tr nên c ng k nh và ph c t p vì các phi u mơ t s đưc x p dàn tr i trong nhi u ơ phi u khác nhau. Khi đĩ, cách s p x p s tr nên ph c t p vì ph i cân nh c v trí ca các phi u mơ t. Ch ng h n, phi u mơ t các tác ph m c a Charles Dicken đưc sp x p sau hay tr ưc các phi u mơ t ca các tác ph m vi t v ơng? Ngồi ra, cịn xu t hi n m t v n đ khác là các phi u mơ t các tài li u v cùng m t ch đ b phân tán nhi u ch trong m c l c. Trên th c t , m c l c ki u t đin v n đưc s dng ph bi n vì ph n l n ng ưi s dng tìm tài li u v mt khía c nh c a v n đ nhi u hơn là tìm hi u v n đ mt cách tồn di n. Bên c nh đĩ, ng ưi s dng cĩ th s dng h th ng các phi u ch ch (“xem”, “c ũng xem”) đ tìm các khía c nh khác nhau ca các v n đ. Mc l c ch cái ki u phân đon. Mc l c ch cái phân đon đưc đư a vào s dng t nh ng n ăm 1930 đ kh c ph c nh ưc đim c a m c l c ki u t đin. M c l c ch cái đưc phân chia thành hai lo i là mc l c ch đ và mc l c ch cái tác gi /nhan đ. Cách s p x p phi u mơ t trong m c l c ch cái ki u phân đon đơ n gi n hơn trong m c l c ki u t đin và vi c tra c u c ũng d dàng h ơn tuy hi n t ưng tài li u v cùng m t ch đ b phân tán v n khơng kh c ph c đưc. Ngồi ra, v i cách sp x p này l i cĩ s bt ti n khác là tr ưc khi tra c u ng ưi s dng ph i xác đnh mình c n tìm theo tác gi , nhan đ hay ch đ đ s dng b ph n m c l c t ươ ng ng. Vì vy, ngưi s dng c n đưc h ưng d n và hu n luy n v cách tra c u các h th ng m c l c này. Cĩ mt s th ư vi n phân chia thành ba ph n riêng bi t là mc l c tác gi , m c l c nhan đ và mc l c ch đ. M c dù cách s p x p phi u mơ t trong h th ng này cĩ th đơ n gi n nh ưng cách tra c u l i ph c t p h ơn so v i h th ng đưc phân thành hai lo i m c l c. Ch ng h n, v i cách s p x p này, các phi u mơ t tác ph m c a Dickens đưc x p d ưi tên Dickens trong m c l c tác gi , các phi u mơ t vi tiêu đ là nhan 63
  6. đ ca các ti u thuy t riêng l ca Dickens đưc x p trong m c l c nhan đ và phi u mơ t các tài li u v Dickens đưc x p trong m c l c ch đ. Cách t ch c mc l c ch đ s đưc đ cp sau. Trong m c này ch đ cp cách t ch c m c l c ch cái tác gi và nhan đ đưc g i là mc l c ch cái (MLCC). Các qui t c t ch c. Qui t c t ch c chung nh t là t t c các phi u (bao g m phi u mơ t , phi u tiêu đ, phi u ch ch ) trong MLCC đ u đưc x p theo tr t t vn ch cái c a tng ngơn ng hay c a t ng h ngơn ng đưc ch n đ th hi n tiêu đ mơ t . Trong m t s tr ưng h p, các phi u đưc s p x p khơng theo nguyên t c này. Ví d , các tác ph m c a cùng m t tác gi đưc x p theo th t l n l ưt là tồn t p, tuy n t p và các tác ph m riêng l ( ph n này các tác ph m đưc x p theo tr t t ch cái tên tác ph m). Qui t c t ch c này đưc th hi n qua các qui t c c th sau đây. - Các phi u mơ t trong MLCC đưc x p theo tr t t vn ch cái đ u tiên c a tên tác gi ho c nhan đ tài li u. N u ch cái đ u tiên gi ng nhau thì căn c vào các ch cái ti p theo. Ví d : Nguy n Hi u Nguy n H u Ph ưc Nguy n Kh c Phê Khi x p các phi u mơ t b ng ti ng Vi t, ngồi tr t t ch cái cịn ph i theo tr t t các d u l n l ưt là khơng d u, d u huy n, s c, h i, ngã, n ng. - Trong m i v n ch cái, tên tác gi đưc vi t t t ph i x p tr ưc các tên tác gi đưc vi t đ y đ . - Các tác gi Vi t Nam đưc x p theo vn ch cái h, tên đm, tên riêng ho c bút danh. Các tác gi n ưc ngồi đưc x p theo h , tên riêng, tên đm đúng nh ư mơ t trên phi u. N u các tác gi trùng c h , tên thì phân bi t theo ngh nghi p hay th b c trong gia đình. Ví d : Nguy n Quang Sáng, ðo di n Nguy n Quang Sáng, Nhà v ăn - Phi u mơ t các tác ph m ca m t tác gi đưc x p t p trung vào m t ch và theo th t sau: + Tác ph m c a riêng tác gi ho c tác gi cùng vi t v i ng ưi khác đưc x p theo th t : tồn t p, tuy n t p, các tác ph m riêng l ; + Các tác ph m mà tác gi tham gia vào vi c xu t b n v i t ư cách là ng ưi biên so n, d ch, biên t p, hi u đính đưc x p theo vn ch cái nhan đ tài li u và khơng tính đn vai trị c a tác gi trong vi c xu t b n tài li u. +Các tác ph m nĩi v tác gi thì phi u mơ t b sung v tác gi đĩ đưc x p theo th t v n ch cái h tên ng ưi vi t ho c nhan đ c a tác ph m. - Tác gi cĩ nhi u tên g i khác nhau, tác gi n ưc ngồi đưc d ch ho c phiên âm theo nhi u cách khác nhau thì các phi u mơ t liên quan đn tác ph m hay b n thân tác gi đưc s p x p d ưi tên thơng d ng nh t và l p phi u ch ch cho các tên khác. Ví d : Phi u ch ch : 64
  7. Lê H u Trác Xem Hi Th ưng Lãn Ơng - Tác gi là t ch c, c ơ quan + Các t ch c chính tr , cơ quan nhà n ưc, các t ch c qu c gia và qu c t v i các tên g i trong các th i k ỳ khác nhau đưc s p x p t p trung dưi tên g i chính th c hi n nay c a t ch c ho c c ơ quan đĩ và cĩ phi u ch ch cho các tên g i c ũ. + Các t ch c chính tr đưc x p theo th t ch cái các t ch c tr c thu c. Ví d : ðng C ng s n Vi t nam. Ban bí th ư Ban ch p hành B chính tr ði h i Thành y Tnh y + Các l n đi h i, h i ngh ca các t ch c chính tr đưc x p theo tr t t ln dn ca các k ỳ đi h i, h i ngh . + Phi u mơ t ca các c ơ quan nhà nưc Vi t Nam đưc x p theo trình t : Hi n pháp, lu t Qu c h i Ch tch n ưc Chính ph - Sp x p các phi u mơ t theo v n ch cái nhan đ tài li u: + Các phi u mơ t cĩ tiêu đ bt đu b ng ch s thì khi x p ph i chuy n s thành ch và xp theo th t vn ch cái. Ví d: 1001 đêm đưc x p vào v n M - Mt nghìn l mt đêm + N u m t tác ph m đưc tái b n nhi u l n thì xp theo trình t th i gian ng ưc t mi đn c ũ (l n tái b n sau đưc x p lên trên l n xu t b n tr ưc). + N u m t tác ph m đưc xu t b n ho c tái b n b i nhi u nhà xu t b n khác nhau thì các phi u mơ t đưc x p theo tr t t sau: N ăm xu t b n – Nơi xu t b n – Nhà xu t b n. + Các m o t đng đu nhan đ, tiêu đ th ưng đưc b qua khi x p phi u mơ t, tr tr ưng h p đĩ là mt b ph n khơng th thi u đưc trong tên cá nhân - Sp x p các phi u ch ch : các phi u ch ch “c ũng xem” đưc x p tr ưc các phi u mơ t hay bi u ghi cĩ cùng tiêu đ. Các b ưc t ch c. Vi c t ch c các phi u mơ t trong MLCC bao g m các b ưc c th nh ư sau: - Bưc 1: Nhĩm s ơ b các phi u theo v n ch cái: các th ư vi n th ưng s dng các hp phi u, m i h p đưc chia thành nhi u ng ăn nh và đưc đánh d u theo tr t t ch cái đ nhĩm phi u s ơ b. - Bưc 2: X p phi u vào các ơ phi u trong t mc l c theo các qui t c s p x p phi u. - Bưc 3: L p các phi u h ưng d n, ch ch nu c n. 65
  8. 5.1.7.H th ng m c l c phân lo i 5.1.7.1. Khái ni m Mc l c phân lo i (MLPL) là h th ng m c l c trong đĩ các phi u mơ t đưc sp xp theo các mơn lo i tri th c d a trên m t h th ng phân lo i nào đĩ. Mc l c phân lo i ph n ánh kho tài li u c a th ư vi n theo n i dung các ngành khoa hc mt cách h th ng. Ưu đim c a m c l c phân loa là khơng b nh h ưng b i s thay đi thu t ng vì nĩ s dng các ký hi u, ch và/ho c s thay cho t ng . Nh ưc đim l n nh t c a MLPL là do đưc xây d ng d a trên m t khung phân lo i nh t đnh nên n u ng ưi dùng tin khơng quen v i các ký hi u phân lo i thì s gp khĩ kh ăn khi tra c u và nhi u khi c n cĩ s hưng d n c a nhân viên th ư vi n. Mc l c phân lo i là mt trong nh ng cơng c tra c u quan tr ng, đc bi t là trong các th ư vi n khơng t ch c kho m . MLPL giúp ng ưi dùng tin tra c u tài li u cn thi t theo các đ tài ho c các l ĩnh v c tri th c nh t đnh. MLPL là cơng c h tr nhân viên th ư vi n trong cơng tác b sung tài li u, tra c u tài li u, biên so n th ư mc, l a ch n tài li u cho các tri n lãm chuyên đ 5.1.7.2. C u trúc mc l c phân lo i Các b ph n c u thành ph n MLPL bao g m các phi u mơ t, các phi u tiêu đ, các phi u ch ch và phi u ng ăn. Phi u mơ t Các y u t trong phi u mơ t đưc trình bày th ng nh t theo mt qui t c mơ t th ư mc nh t đnh. Ký hi u phân lo i c a tài li u ph i đưc th hi n trên phi u mơ t. ði vi nh ng tài li u cĩ ni dung ph n ánh nhi u v n đ, ngh ĩa là cĩ t hai ký hi u phân lo i tr lên thì ph i cĩ phi u b sung cho các ký hi u phân lo i. M i ký hi u phân lo i ph i cĩ mt phi u mơ t và các phi u mơ t này s đưc s p x p các v trí khác nhau trong MLPL. Phi u tiêu đ Trong MLPL c ũng s dng các phi u tiêu đ cĩ g nhơ lên nh ư trong MLCC. Các phi u tiêu đ đưc chia thành nhi u c p t ươ ng đươ ng v i các l p trong khung phân lo i. Các phi u tiêu đ cĩ g nhơ gi a th ưng đưc dành cho các l p phân chia th nh t (tiêu đ cp 1), th hai (tiêu đ cp 2), đơi khi cho l p th ba (tiêu đ cp 3). Các phiu cĩ g nhơ bên ph i ho c bên trái dành cho các c p chia ti p theo. Trên g phi u tiêu đ ghi ký hi u phân lo i và tên đ mc phân lo i ca khung phân lo i đưc s dng. Trong thân phi u ghi ký hi u phân lo i và tên các m c con tr c thu c. Ví d dưi đây là phi u tiêu đ cp 1. Các phi u tiêu đ cp 3, c p 4 c ũng đưc mơ t tươ ng t . 66
  9. 3.Xã h i – Chính tri Gm các m c: 31. Th ng kê. H ch tốn. Phân tích kinh t 32. Chính tr 33. Kinh t . Khoa h c kinh t Các phi u ch ch Phi u ch ch qua l i (“c ũng xem”) h ưng d n ng ưi s dng tìm thêm các m c khác cĩ liên quan đ m rng n i dung và ph m vi tra c u. Phi u ch ch đi (“xem”) h ưng d n ng ưi s dng tìm tài li u đ mc chính xác trong tr ưng h p tài li u cĩ ni dung đưc ph n ánh nhi u m c nh ưng ch đưc x p mt m c nh t đnh. Phi u ng ăn Các phi u ng ăn cĩ kích th ưc b ng phi u mơ t nh ưng khác màu, đưc dùng đ phân cách các phi u mơ t cĩ cùng ký hi u phân lo i nh ưng khác nhau mt s đc đim khác nh ư ngơn ng , lo i hình tài li u 5.1.7.3. Cách t ch c phi u mơ t trong MLPL Sơ đ t ch c thơng tin đưc áp d ng trong MLPL là sơ đ đo, ngh ĩa là các phi u mơ t đưc s p x p theo kí hi u phân lo i th hi n n i dung tài li u. Trong MLPL, các phi u mơ t cĩ cùng ký hi u phân lo i đưc x p chung sau m i phiu tiêu đ trên đĩ ghi ký hi u phân lo i và tên đ mc tươ ng ng trong khung phân lo i. ð thu n ti n cho vi c tra c u, sau m i phi u tiêu đ ch nên x p kho ng 50 phi u mơ t. Các phi u mơ t trong t ng m c đưc x p theo t ng nhĩm ngơn ng và cĩ phi u ng ăn gi a các nhĩm ngơn ng . Trong m i nhĩm ngơn ng , các phi u mơ t đưc x p theo th t vn ch cái các tiêu đ mơ t (tên tác gi ho c nhan đ tài li u). Cũng cĩ th sp x p các phi u mơ t theo th t th i gian ng ưc c a n ăm xu t b n và các l n xu t b n tài li u (tài li u m i xu t b n đưc x p lên tr ưc các tài li u c ũ hơn) đ ưu tiên gi i thi u các tài li u m i. Mc l c phân lo i đưc ch a trong các h p phi u trong t mc l c. Trên m i h p phi u cĩ nhãn ghi ký hi u phân lo i và các m c ch a trong h p phiu. 5.1.7.4. H p phi u tra ch đ - ch cái Hp phi u tra ch đ-ch cái là cơng c h tr cho MLPL nh m giúp ng ưi s dng tra c u MLPL mt cách hi u qu . H p phi u tra ch đ-ch cái g m các đ mc ch đ đưc trình bày trên phi u (cĩ hình th c nh ư phiu mơ t và đưc g i là phi u tra ch đ-ch cái) ph n ánh n i dung c a các tài li u hi n cĩ ti th ư vi n. Vic t ch c h p phi u tra ch đ-ch cái th ưng đưc th c hi n đng th i v i vi c t ch c MLPL. Vi c l p các phi u tra ch đ-ch cái đưc th c hi n trên c ơ s phân lo i tài li u c a th ư vi n ho c c ơ quan thơng tin và theo các b ưc nh ư sau: 67
  10. - Da trên n i dung tài li u đ xác đnh ch đ đc tr ưng c a tài li u; - ði chi u ch đ va đưc xác đnh v i bng tra ch đ trong khung phân lo i đ bo đm s thng nh t thu t ng ; - Trình bày đ mc ch đ trên phi u thơng th ưng (7,5 x 12,5 cm). Mi ch đ đưc trình bày trên m t phi u. Ph n gĩc ph i c a phi u ghi ký hi u phân lo i c a đ mc ho c ti u đ mc. N u n i dung tài li u g m nhi u ch đ riêng bi t và đưc th hi n b ng nhi u ký hi u phân lo i thì mi ký hi u phân lo i ph i đưc th hi n trên m t phi u tra ch đ. Các phi u trong h p phi u ch đ-ch cái đưc s p x p theo v n ch cái c a các đ mc ch đ. 5.1.8. M c l c ch đ 5.1.8.1. Khái ni m Mc lc ch đ là h th ng m c l c trong đĩ các phi u mơ t đưc s p x p theo ch đ ca tài li u. Mc l c ch đ ph n ánh vn tài li u c a th ư vi n theo ch đ ca n i dung tài li u. M c l c ch đ đc bi t h u dng khi ph n ánh n i dung tài li u thu c các ngành khoa h c ng d ng. Vì vy, m c l c này th ưng đưc s dng trong các th ư vi n, c ơ quan thơng tin chuyên ngành. Mc l c ch đ giúp ng ưi dùng tin tìm tài li u c n thi t theo t ng ch đ c th . ði v i nhân viên th ư vi n, m c l c ch đ là cơng c h tr biên so n các th ư mc chuyên đ, tra c u theo yêu c u, tuyên truy n, gi i thi u tài li u theo các chuyên đ 5.1.8.2. C u trúc mc l c ch đ Phi u mơ t Phi u mơ t trình bày đy đ các y u t mơ t nh ư trong m c l c ch cái. phía trên gĩc bên trái c a phi u ghi ký hi u x p giá ca tài li u. Các đ mc ch đ ca tài li u và ph đ (n u cĩ) đưc li t kê phía d ưi các y u t mơ t. N u tài li u cĩ trên 2 đ mc ch đ thì ph i l p phi u b sung cho các ch đ. Phi u tiêu đ Trong m c l c ch đ cũng s dng các phi u tiêu đ (bao g m phi u tiêu đ chính và phi u tiêu đ ph ) đ th hi n các đ mc ch đ, ph đ và phân chia các phi u trong cùng ch đ. Th ư vi n cĩ th t lp các phi u tiêu đ ho c da trên m t b ng đ mc ch đ cĩ sn. Phi u ch ch Phi u ch ch “xem” ch t đ mc ch đ khơng thơng d ng sang đ mc ch đ thơng d ng. Phi u ch ch “c ũng xem” ch dn ng ưi s dng đn các đ mc ch đ khác cĩ liên quan vi ch đ mà ng ưi s dng quan tâm. 5.1.8.3. Cách t ch c phi u trong m c lc ch đ 68
  11. Các phi u tiêu đ đưc s p x p theo v n ch cái c a các đ mc ch đ, khơng phân bi t ch đ đơn hay ph c. Trong t ng đ mc ch đ, các phi u mơ t đưc s p xp theo tr t t ch cái các tiêu đ mơ t. Các phi u đưc ch a trong các h p phi u trong t mc l c. Trên m i h p phi u cĩ dán nhãn ghi đ mc ch đ đu và cu i h p phi u. 5.2. Các b phi u th ư m c B phi u th ư mc là cơng c ph n ánh các tài li u ho c thơng tin v nh ng v n đ và đ tài thu c di n ph c v ca c ơ quan thơng tin, thư vi n, khơng ph thu c vào lo i hình tài li u và nơi b o qu n chúng. Tùy theo nhi m v và đc đim c a t ch c, các c ơ quan thơng tin, th ư vi n cĩ th xây d ng các b phi u th ư mc nh ư b phi u tra c u chính, các b phi u chuyên đ, các b phi u th ư mc theo lo i hình tài li u, b phi u tra c u nhân v t, b phi u tra cu đa chí. 5.2.1. B phi u tra c u chính B phi u tra c u chính đưc s dng đ tr li các yêu c u tin chuyên đ theo di n ph c v ca c ơ quan thơng tin, th ư vi n. ðc đim c a b phi u tra cu chính là nĩ ph n ánh các tài li u v nh ng chuyên đ chính c ũng nh ư nh ng v n đ cĩ liên quan thu c di n bao quát đ tài c a c ơ quan thơng tin, th ư vi n, khơng ph thu c vào lo i hình và nơi b o qu n nh ng tài li u đĩ. B phi u tra c u chính khơng ch ph n ánh các sách chuyên kh o, các báo cáo và nh ng tài li u t ươ ng t mà cịn ph n ánh c các bài trích t các t p chí, tuy n t p và các ch ươ ng m c c a sách B phi u này th ưng đưc xây d ng trong các c ơ quan thơng tin ho c th ư vi n chuyên ngành. 5.2.2. Các b phi u chuyên đ Các b phi u chuyên đ đưc xây d ng theo nh ng v n đ/đ tài đưc nhi u ng ưi quan tâm và cĩ tính th i s . T ươ ng t b phi u tra c u chính, các b phi u này đưc s dng đ tr li các yêu c u tin chuyên đ. ðc đim c a các b phi u chuyên đ là chúng ph n ánh v n đ mt cách đy đ, tồn di n và ph n ánh nhi u lo i hình tài li u, khơng ph thu c vào n ơi b o qu n tài li u. 5.2.3. Các b phi u theo lo i hình tài li u Các b phi u theo lo i hình tài li u đưc s dng đ tr li nhng yêu c u cung cp các lo i hình tài li u nh t đnh ho c thơng tin v các lo i hình tài li u, khơng ph thu c vào n ơi b o qu n chúng. Các c ơ quan thơng tin, th ư vi n cĩ th xây d ng các b phi u theo lo i hình tài li u nh ư b phi u bài trích t báo, t p chí, b phi u báo cáo v các cơng trình nghiên c u khoa h c, b phi u catalo cơng nghi p, b phi u các cơng trình thi t k , th nghi m 5.3. Các b phi u d ki n 69
  12. Các b phi u tra d ki n đưc xây d ng đ tr li các yêu c u tin d ki n c th , giúp ng ưi dùng tin nhanh chĩng tìm đưc thơng tin c n thi t. Các b phi u d ki n l ưu tr các s li u ho c d ki n v mt đi t ưng ho c m t nhĩm đi t ưng nh t đnh nh ư các v t li u, thi t b , quy trình cơng ngh , các t ch c Các s li u/d ki n này đưc rút ra t mt ho c nhi u tài li u. Vì vy, khi s dng các b phi u d ki n, ng ưi dùng tin đưc gi i phĩng kh i các b ưc tìm tài li u và rút ra t nh ng tài li u tìm đưc nh ng thơng tin c n thi t. 5.3.1. B phi u các s n ph m, thi t b B phi u các s n ph m, thi t b đưc s dng đ tr li các yêu c u tin v các tính năng, các thơng s k thu t, đc đim k t c u, giá thành c a s n ph m ho c thi t b , các nhà sn xu t và cung c p s n ph m ho c thi t b Ngu n thu th p và b sung thơng tin cho b phi u s n ph m và thi t b bao g m nhi u lo i tài li u khác nhau nh ư các catalơ cơng nghi p c a các nhà s n xu t ho c cung c p trong và ngồi n ưc, các b ng giá, các t p chí khoa h c-cơng ngh và t p chí th ươ ng m i-cơng nghi p 5.3.2. B phi u d ki n v v t li u B phi u d ki n v vt li u cung c p d ki n v tính n ăng, cơng d ng, l ĩnh v c ng d ng, thành ph n hĩa h c, các tính ch t c ơ hc, cơng ngh ch to, giá thành, nhà sn xu t/cung c p c a các v t li u khác nhau. B phi u d ki n v vt li u th ưng đưc xây d ng trong các c ơ quan thơng tin chuyên ngành nh ư trung tâm thơng tin xây d ng, trung tâm thơng tin d t-may Ngu n thu th p và b sung thơng tin cho b phi u v t li u là các lo i tài li u nh ư các catalơ cơng nghi p c a các nhà sn xu t/cung c p, các tài li u đnh m c k thu t, s tay k thu t 5.3.3. B phi u các quy trình cơng ngh và sáng ki n B phi u các quy trình cơng ngh và sáng ki n cung c p thơng tin v các qui trình cơng ngh và các trang thi t b tiên ti n, các sáng ki n ci ti n k thu t đưc đ xut và áp d ng các c ơ s nghiên c u, s n xu t. B phi u này thu ng đưc xây d ng trong các c ơ quan thơng tin chuyên ngành. 70
  13. CH ƯƠ NG 6. H TH NG TÌM TIN T ð NG HĨA 6.1. Khái quát v h th ng tìm tin t đ ng hĩa 6.1.1. Khái ni m H th ng tìm tin t đ ng hĩa (HTTTT ðH) là h th ng tìm tin s dng máy tính đin t đ th c hi n m t s ch c n ăng. Mt h th ng tìm tin t đng hĩa bao g m các thành ph n c ơ bn sau: - H th ng cơng c logic- ng ngh ĩa; - Các ph ươ ng ti n k thu t đm b o th c hi n các chc n ăng c a h th ng; - Các c ơ s d li u; - Các y u t và ph ươ ng ti n đm b o v n hành h th ng. H th ng cơng c logic- ng ngh ĩa bao g m các cơng c x lý hình th c và ni dung tài li u nh ư các quy t c mơ t th ư m c, các kh m u trao đ i d li u, các ngơn ng tìm tin, các quy t c s dng các cơng c logic-ng ngh ĩa, các tiêu chu n phù hp ng ngh ĩa và mt s cơng c ng ngh ĩa khác. H th ng cơng c -ng ngh ĩa đĩng vai trị quan tr ng trong vi c x lý, trình bày, t ch c và tìm ki m thơng tin. Các ph ươ ng ti n k thu t bao g m ph n c ng, ph n m m và các thi t b vi n thơng. Mt h th ng phn c ng máy tính đin t bao g m m t b x lý trung tâm (CPU) và các thi t b ngo i vi. B x lý trung tâm th c hi n các ch c n ăng ch yu c a máy tính đin t . B x lý trung tâm cĩ ba kh i là kh i điu khi n, kh i tính tốn và b nh trong. B nh trong (RAM, ROM) ch a thơng tin đưc ghi tr ưc và đưc cung c p. RAM (Random-access memory) là b nh ch ch a thơng tin khi máy tính làm vi c. Thơng tin dng d li u ho c ch ương trình đưc nh p vào RAM khi b x lý trung tâm yêu c u. Thơng th ưng, thơng tin đưc nh p tr c ti p vào RAM t bàn phím ho c các thi t b nh p khác ho c đưc t i t các b nh ngồi (thi t b lưu tr ngo i vi). ROM (Read-only memory) là b nh cha các ch ươ ng trình điu khi n c ơ bn, các ph n m m h th ng và ng d ng do nhà sn xu t cung c p. Thơng tin đưc ch a trong ROM cĩ th đc đưc - ngh ĩa là cĩ th tìm l i đ b x lý trung tâm s dng, nh ưng khơng th xĩa, b sung ho c ch nh s a. Các thi t b ngo i vi th c hi n ch c n ăng nh p, xu t ho c l ưu tr thơng tin. Các thi t b nh p nh ư bàn phím, máy quét đưc s dng đ nh p thơng tin vào máy tính đin t , ngh ĩa là chuy n thơng tin t dng ngơn ng t nhiên sang d ng đc máy. Thơng tin đưc nh p vào máy tính d ưi d ng mã hĩa, m i ký t đưc bi u di n d ưi dng m t chu i các s nh phân. Cĩ nhi u h th ng mã dùng cho các lo i máy tính đin t khác nhau, trong đĩ cĩ hai h th ng mã quan tr ng là EBCDIC (Extended 71
  14. Binary Coded Decimal Interchange Code) và ASCII (American Standard Code for Information Interchange) Các thi t b xu t nh ư màn hình, máy in đưc s dng đ xu t thơng tin t máy tính đin t , ngh ĩa là chuy n thơng tin t dng đc máy sang d ng ngơn ng t nhiên. Các thi t b ngo i vi và ph ươ ng ti n lưu tr thơng tin đưc thi t k đ lưu gi thơng tin dng đc máy. Các thi t b này đưc xem nh ư b nh ngồi, b sung cho b nh trong h n ch ca b x lý trung tâm. B nh ngồi c a máy tính đin t bao gm băng t , đĩa quang, đĩa t (đĩa c ng và đĩa mm). Ph n m m là mt ch ươ ng trình ho c mt t p h p cĩ cu trúc các l nh cho phép máy tính th c hi n các ch c n ăng x lý thơng tin. Các l nh này cĩ th đưc bi u di n bng ngơn ng máy dng mã nh phân ho c b ng ngơn ng lp trình và sau đĩ đưc dch sang ngơn ng máy b ng các trình d ch. Cĩ hai lo i ph n m m là ph n m m h th ng và ph n m m ng d ng. Ph n m m h th ng là các ch ươ ng trình c n thi t đ th c hi n và điu khi n các ho t đng c a m t máy tính nh ư kh i đng máy tính, điu khi n xu t và nh p d li u Ph n m m ng d ng là ph n m m đưc thi t k đ th c hi n các nhi m v , ch c năng th ưng đưc ng ưi s dng máy tính yêu c u. C ũng gi ng nh ư các lo i ph n mm khác, ph n m m ng d ng đưc cung c p b i các nhà sn xu t máy tính ho c các cơng ty chuyên phát tri n ph n m m. Cĩ nhi u lo i ph n m m ng d ng nh ư ph n mm so n th o v ăn b n, ph n m m qu n tr d li u, ph n m m thi t k đ ha, ph n mm truy n thơng và các ph n m m chuyên d ng trong các l ĩnh v c khác. Cơ s d li u là thành ph n c ơ bn c a mt h th ng thơng tin t đng hĩa. Vì vy, cơ s d li u s đưc đ cp chi ti t h ơn nh ng ph n ti p theo trong ch ươ ng này. Các y u t và ph ươ ng ti n đm b o v n hành h th ng tìm tin bao g m nhân s và các tài li u h ưng d n nghi p v Nhân s làm vi c vi h th ng bao g m các nhĩm chuyên gia cĩ trách nhi m thi t k , xây d ng, v n hành, khai thác, b o trì h th ng và nh ng ng ưi dùng tin s dng h th ng đ tìm tin. 6.1.2 Phân lo i h th ngtìm tin t đng hĩa Cĩ th phân lo i h th ng tìm tin t đng hố da trên các c ơ s khác nhau. Sau đây là cách phân lo i d a trên mc đích cung c p d ch v , ph ươ ng th c truy c p và th h ca h th ng tìm tin t đng hĩa. 6.1.2.1. Phân lo i theo m c đích cung c p d ch v Theo m c đích cung c p d ch v , cĩ th phân các h th ng tìm tin t đng hĩa thành hai lo i là h th ng tìm tin n i b và h th ng tìm tin th ươ ng m i. H th ng tìm tin n i b đưc xây d ng nh m ph c v ng ưi s dng thu c m t t ch c nh t đnh. H th ng tìm tin th ươ ng m i cung c p d ch v truy c p các CSDL ho c ngân hàng d li u cho ng ưi s dng da trên c ơ ch th tr ưng. Ng ưi s dng thanh tốn phí dch v da trên m c đ s dng d ch v . 6.1.2.2. Phân lo i theo ph ươ ng th c truy c p 72
  15. Theo ph ươ ng th c truy c p CSDL, cĩ th chia các h th ng tìm tin t đng hĩa thành hai lo i là h th ng tìm tin c c b và h th ng tìm tin tr c tuy n. H th ng tìm tin c c b cung c p kh năng truy c p các CSDL đưc l ưu tr trên máy tính đin t ti ch trong khi h th ng tìm tin tr c tuy n cung c p kh năng truy c p các CSDL đưc l ưu tr trên các máy tính đin t xa thơng qua m ng máy tính và các ph ươ ng ti n vi n thơng. Nguyên lý và k thu t tìm tin trên hai h th ng này v cơ bn khơng cĩ s khác bi t. ðim khác bi t gi a h th ng tìm tin tr c tuy n v i h th ng tìm tin cc b là cơng ngh truy c p ph c t p h ơn, b t bu c ph i cĩ các ph ươ ng ti n vi n thơng đ đm b o ph ươ ng th c truy c p t xa. 6.1.2.3. Phân lo i theo th h c a h th ng tìm tin Theo th h ca h th ng tìm tin, cĩ th chia các h th ng tìm tin t đng hĩa thành ba lo i nh ư sau: - H th ng tìm tin th h th nh t: là h th ng cung c p kh năng tìm thơng tin th ư mc v i các l nh tìm dng dịng l nh. Cách s dng h th ng ph c t p, địi h i ng ưi s dng ph i cĩ nh ng k năng tìm tin nh t đnh. Vì vy, ng ưi s dng h th ng này ch yu là các chuyên gia thơng tin. - H th ng tìm tin th h th hai: là h th ng cung c p kh năng tìm thơng tin th ư mc và tồn v ăn v i các l nh tìm dng h th ng th c đơ n. Cách s dng h th ng này đơ n gi n h ơn so v i h th ng th h th nh t. Ng ưi s dng h th ng cĩ th là các chuyên gia ho c ng ưi s dng thơng th ưng. - H th ng tìm tin th h th ba: là h th ng cung c p kh năng tìm thơng tin đa ph ươ ng ti n, cho phép ng ưi s dng khai thác thơng tin m t cách d dàng qua các giao di n đ ha. 6.2. Các ch c năng ca h th ng tìm tin t đng hĩa 6.2.1. Tìm tin Ch c n ăng tìm tin cho phép tìm các bi u ghi trong CSDL đáp ng yêu c u tin c th ca ng ưi s dng. ð th c hi n vi c tìm tin trong h th ng, ngưi s dng ph i th hi n yêu c u tin b ng bi u th c tìm. Bi u th c tìm cĩ th bao g m v ăn b n v i ngơn ng t nhiên dng k t h p và/ho c các thu t ng tìm đưc k t h p v i nhau bi các tốn t tìm tin. Bi u th c tìm tin cĩ th áp d ng v i bi u ghi đy đ ho c ch a mt s các thơng s b sung gi i h n tìm trong m t vùng c a bi u ghi (ví d trong mt tr ưng nào đĩ). 6.2.1.1. Logic Bool Logic Bool cho phép ng ưi s dng k t h p nhi u khái ni m v i nhau m t cách logic đ xác đnh thơng tin c n thi t. Các phép tốn c a logic Bool cho phép th c hi n ba lo i quan h cơ bn gi a các khái ni m là quan h tươ ng giao, quan h kt h p và 73
  16. quan h lo i tr . Các tốn t Bool đưc s dng t ươ ng ng là AND, OR, và NOT. ðây là nh ng tốn t Bool đưc s dng ph bi n nh t trong các h th ng tìm tin. Tốn t AND đưc s dng đ tìm các bi u ghi đng th i ch a các thu t ng tìm đã đưc xác đnh. V i bi u th c tìm cĩ dng: A AND B, trong đĩ A, B là các thu t ng tìm thì kt qu tìm đưc là các bi u ghi đng th i ch a A và B. Tốn t OR cho phép tìm các bi u ghi th a mãn yêu c u là ch a ít nh t m t trong nh ng thu t ng tìm đã đưc xác đnh trong bi u th c tìm. Vi bi u th c tìm cĩ dng A OR B thì kt qu tìm đưc là các bi u ghi ch a m t trong hai thu t ng ho c ch a c hai thu t ng A và B. Tốn t NOT cho phép tìm các bi u ghi th a mãn yêu c u là ch ch a thu t ng tìm đng tr ưc tốn t và khơng ch a thu t ng tìm đng sau tốn t . N u bi u th c tìm cĩ dng A NOT B thì kt qu tìm đưc là các bi u ghi ch ch a thu t ng A và khơng ch a thu t ng B. Th t ca các thu t ng tìm trong bi u th c tìm v i tốn t NOT cĩ ý ngh ĩa quan tr ng. K t qu ca bi u th c tìm A NOT B s khác k t qu ca B NOT A. Ngồi các tốn t Bool nĩi trên, m t s h th ng cịn s dng tốn t XOR (Exclusive OR) nh ưng nĩi chung khơng h u ích đi v i ng ưi s dng vì ph n l n ng ưi s dng khơng hi u tốn t này. Tốn t XOR cho phép tìm các bi u ghi th a mãn điu ki n là ch ch a m t trong hai thu t ng đã đưc xác đnh, khơng đưc đng th i ch a c hai thu t ng . N u bi u th c tìm cĩ dng A XOR B thì kt qu tìm đưc là các bi u ghi ch ch a A ho c B, khơng bao g m các bi u ghi ch a c A và B. Du ngo c đơ n đưc s dng trong bi u th c tìm tin đ xác đnh trình t th c hi n các phép tốn Bool. N u trong bi u th c khơng s dng ngo c đơ n, h th ng s th c hi n các phép tốn theo trình t ưu tiên m c đnh (thơng th ưng theo th t NOT, AND, OR và t trái sang ph i). Ph n l n các h th ng th ươ ng m i khơng cho phép s dng k thu t tìm theo tr ng s thu t ng (weighted term) trong các bi u th c s dng các phép tốn Bool. Logic Bool cĩ ưu đim là logic rõ ràng và cĩ th d dàng vi t trình d ch cho logic này. H n ch ca logic Bool là ph n l n ng ưi s dng khơng t ư duy m t cách t nhiên trong các điu ki n c a logic Bool. Vì vy, logic này cĩ v nhân t o và đơi khi ng ưi s dng g p khĩ kh ăn khi bi u đt yêu c u tin ho c khi xem k t qu tìm đưc. Mt h n ch khác là các bi u th c Bool cĩ th cho nhi u k t qu tìm và khơng phân bi t m c đ thích h p c a các bi u ghi tìm đưc. Cĩ th kh c ph c h n ch này b ng cách tìm tinh l c v i các điu ki n nh ư ngơn ng , th i gian 6.2.1.2. Tốn t lân c n Tốn t lân c n đưc s dng đ qui đnh kho ng cách yêu c u gi a hai thu t ng tìm trong m t bi u ghi nh m tăng đ chính xác c a vi c tìm tin. Hình th c bi u di n tng quát ca tốn t lân c n là: Thu t ng tìm 1 trong “m” “ đơ n v ” ca thu t ng tìm 2 Tốn t kho ng cách “m” là mt s nguyên và các đơ n v là ký t, t , câu ho c đon văn. Ví d, v i bi u th c : “United” within five words of “American” ( m = 5 và đơ n v là t) 74
  17. H th ng tìm tin s tìm đưc các bi u ghi cĩ ch a “United States and American interests”; “United Airlines and American Airlines” và khơng tìm đưc bi u ghi cĩ ch a “United States of America and the American dream” Các h th ng tìm tin khác nhau cĩ th s dng các đơ n v ng ngh ĩa khác nhau đ xác đnh kho ng cách. Ví d, vi các bi u ghi cĩ cu trúc, đơ n v đ tính kho ng cách là ký t. Vi các bi u ghi cĩ ch a hình nh, đon v ăn gi a các hình nh cĩ th giúp tìm chính xác m t hình nh nào đĩ. Trong m t s tr ưng h p, tốn t lân c n xác đnh v trí ca thu t ng tìm th 2 đi v i thu t ng tìm th 1 (tr ưc ho c sau thu t ng tìm th 1) và trong mt kho ng cách đưc xác đnh. Ch ng h n, tốn t lân c n Adjacent (ADJ) th ưng qui đnh hai thu t ng ph i n m k nhau và ch theo m t chi u xuơi. Ví d, v i bi u th c: Information ADJ Science Kt qu tìm đưc bao g m các bi u ghi cĩ ch a “Information Science” và khơng bao g m các bi u ghi cĩ ch a “Science Information”. Mt tr ưng h p đc bi t khác là khi kho ng cách đưc xác đnh b ng zero cĩ ngh ĩa là nm trong cùng đơ n v ng ngh ĩa. Ví d, v i bi u th c: “Nuclear” within zero paragraphs of “clean-up” Kt qu tìm đưc bao g m các bi u ghi ch a “Nuclear” và “clean-up” trong cùng mt đon v ăn. Các h th ng tìm tin khác nhau cĩ th s dng các lo i tốn t lân c n khác nhau. Hơn n a, cách bi u đt cùng m t tốn t lân c n trong các h th ng tìm tin c ũng cĩ th khác nhau. 6.2.1.3. Tìm c m t chính xác Mt c m t bao g m hai ho c nhi u t và đưc xem nh ư mt đơ n v ng ngh ĩa đc lp. Ví d, “United States of America” là mt c m t bao g m bn t, đưc xác đnh nh ư mt thu t ng tìm th hi n m t khái ni m ng ngh ĩa c th (m t qu c gia) và cĩ th đưc s dng v i m t tốn t bt k ỳ trong s các tốn t đã đưc đ cp trên. Tốn t tìm c m t chính xác là mt tốn t đc bi t t ươ ng t tốn t lân c n (Adjacent) cho phép tìm các t nm k nhau và theo m t tr t t xác đnh. 6.2.1.4 Tốn t ch t t (truncation) K thu t tìm tin v i tốn t ch t t cho phép m rng m t thut ng tìm b ng cách ch t bt m t ph n c a thu t ng và tìm t t c các bi u ghi cĩ ch a ph n cịn l i c a thu t ng đĩ. Ví d, bi u th c tìm tin s dng tốn t ch t t vi ký hi u * nh ư sau: Fish* Khi đĩ, các bi u ghi cĩ ch a các thu t ng tìm nh ư: Fish; Fishbone; Fisher; Fisherman; Fishery; Fish hook; Fishing; Fishing line đu đưc xem là thích h p v i yêu c u tin và đu đưc li t kê trong k t qu tìm. K thu t ch t t cĩ tác d ng m rng k t qu tìm. Các h thng tìm tin cĩ th h tr k thu t ch t t bên trái (tìm ti p v ĩ ng ), ch t t bên ph i (tìm ti p đu ng ) ho c ch t c hai bên ca t . Cĩ mt s h th ng h tr k thu t ch t t bên trong t . Ví d: 75
  18. Bi u th c Thao tác c a h th ng *computer Các bi u ghi cĩ ch a “minicomputer”. “microcomputer” ho c “computer” đu đưc coi là thích h p comput* Các bi u ghi cĩ ch a “computers”, “computing”, “computes” đu đưc coi là thích hp *comput* Các bi u ghi cĩ ch a “microcomputers”. “minicomputing”, “compute” đu đưc coi là thích h p Multi$national Các bi u ghi cĩ ch a “multi-national”, “multinational” đu đư c coi l à th ích h p. 6.2.1.5. K thu t tìm so sánh K thu t tìm so sánh cho phép tìm theo các d u hi u đnh l ưng. Tốn t so sánh (=, , = ) đưc s dng trong nhi u h th ng tìm tin đ tìm theo giá tr s ho c dãy s (ho c ngày tháng). Ví d: (date>881014) (20,000 < salary < 100,000) 6.2.1.6. Ký t thay th Ký t thay th là mt ký t bàn phím nh ư du * ho c d u ? đưc s dng đ bi u di n m t ho c nhi u ký t khi tìm trong các CSDL. Ký t thay th đưc s dng đ thay th mt ho c nhi u t khi ng ưi s dng khơng bi t ký t th c ho c khơng mu n đánh tồn b mt t ho c đ tìm các c m t cĩ cùng t đu và t cu i. Ví d: - wom?m cĩ th cho k t qu là các bi u ghi ch a woman ho c women - cooking * classes cĩ th cho k t qu là các bi u ghi ch a “cooking school classes” ho c “cooking and wine tasting classes” 6.2.1.7. K thu t tìm theo tr ng s c a thu t ng Tìm theo tr ng s ca thu t ng (weighted term) là k thu t tìm cho phép tìm các t và cm t bng cách xác đnh t m quan tr ng c a t ng thu t ng theo cm nh n ca ng ưi s dng. Tr ng s là mt s t 0.0 đn 1.0 (ho c cĩ th là s nguyên) ch mc đ quan tr ng c a t ng thu t ng tìm trong t p h p các thu t ng . Ví d, trong mt bi u th c tìm v i nhi u thu t ng , ta cĩ th xác đnh cho t ng thu t ng tìm m t tr ng s ch tm quan tr ng c a thu t ng đĩ trong m i t ươ ng quan v i các thu t ng khác trong bi u th c tìm. Trong kt qu tìm, nh ng bi u ghi thích h p nh t s đưc sp x p đu tiên, theo tr ng s tươ ng quan đã đưc xác đnh. Ví d, v i bi u th c tìm: (TENNIS(.8) OR GOLF(.4)) AND CHAMPION(.6) 76
  19. Mt HTTT th c hi n bi u th c tìm này tru c h t cĩ th x lý tươ ng t nh ư vi m t bi u thc Bool thơng th ưng đ to ra m t t p k t qu ban đu, sau đĩ mi s dng các tr ng s đã xác đnh đ tính h ng cho t ng bi u ghi. N u TENNIS và CHAMPION xu t hi n trong m t bi u ghi thì bi u ghi đĩ s cĩ tr ng s .8 + .6 = 1.4. Nu hai thu t ng GOLF và CHAMPION xu t hi n, bi u ghi cĩ tr ng s .4 + .6 = 1.0. N u c hai thu t ng TENNIS và GOLF cùng xu t hi n v i CHAMPION, bi u ghi cĩ th cĩ tr ng s .8 + .4 + .6 = 1.8 ho c .8 + .6 = 1.4 n u ta ch s dng giá tr cao h ơn trong bi u th c OR. Khi đĩ, các bi u ghi trong k t qu tìm s đưc s p x p theo th t nh ư sau: 1. Bi u ghi ch a đng th i 3 thu t ng vi t ng tr ng s 1.8 2. Bi u ghi ch a TENNIS và CHAMPION v i t ng tr ng s 1.4 3. Bi u ghi ch a GOLF và CHAMPION v i t ng tr ng s 1.0 6.2.2. Hi n th kt qu Khi k t thúc tìm tin, ch c n ăng hi n th ca h th ng s h tr ng ưi s dng xác đnh các bi u ghi c n thi t và la ch n đ hi n th . Cĩ hai cách hi n th tĩm l ưc k t qu tìm c a m t bi u th c: trình bày các bi u ghi theo dịng và bng đ th . T nh ng trình bày tĩm l ưc này, ng ưi s dng cĩ th la ch n các bi u ghi c th và các tr ưng trong bi u ghi đ hi n th . H th ng c ũng cho phép di chuy n d dàng gi a các trình bày tĩm lưc và xem các bi u ghi c th . Nu bi u th c tìm khơng chính xác thì kt qu tìm cĩ th ch a nhi u bi u ghi khơng thích hp v i yêu c u tin ca ngưi s dng. M t s h th ng cung c p các ch c n ăng Tìm l i trong các k t qu tìm; L c l i kt qu tìm ho c ðánh d u các bi u ghi đưc ch n đ giúp ng ưi s dng ch n l c đưc các bi u ghi thích h p nh t. 6.2.2.1. S p x p kt qu tìm Trong các h th ng s dng tốn t Bool, k t qu tìm đưc hi n th là tng s các bi u ghi tìm đưc. T t c các bi u ghi tìm đưc đu th a mãn các điu ki n c a bi u th c Bool. Cĩ th d dàng tìm hi u lý do m t bi u ghi đưc l a ch n (ví d da vào các thu t ng đưc đánh d u) và đưc hi n th trong các bi u ghi tìm đưc. Các k t qu tìm cĩ th đưc s p x p theo m t d u hi u nào đĩ, ví d, theo nhan đ ho c theo trình t th i gian t mi đn cũ. Nu s dng cách sp x p da trên mc đ thích h p ca k t qu tìm đưc thì h th ng s hi n th bi u ghi cùng v i đim s v mc đ thích h p và mt mơ t bi u ghi ng n g n (th ưng trong cùng m t dịng trên màn hình). Vì mi bi u ghi th ưng ch đưc dành m t dịng trên màn hình khi hi n th ng n g n nên các h th ng ch hi n th mt ph n c a m t tr ưng trong bi u ghi (th ưng là tr ưng nhan đ) cùng v i đim s v mc đ thích h p ca bi u ghi. ðim s v mc đ thích h p là s đánh giá ca h th ng v mc đ đáp ng c a bi u ghi đi v i bi u th c tìm. ðiu này cho phép ng ưi s dng d dàng l a ch n các k t qu thích h p nh t v i yêu c u tin. ði v i ng ưi s dng, cách trình bày đim s c th v mc đ thích h p c a bi u ghi khĩ hi u h ơn cách trình bày các bi u ghi theo tng lo i m c đ thích h p. Ch ng h n, m t s h th ng phân ra các lo i m c đ thích h p và mi lo i đưc th hi n b ng m t màu. Nh ư vy, các bi u ghi cĩ mc đ thích h p 77
  20. khác nhau s đưc hi n th bng các màu khác nhau. M t s h th ng phân thành các mc đ nh ư cao, t ươ ng đi cao, trung bình, th p và khơng thích h p. Vi k thu t s dng màu, h th ng khơng c n ghi ch s v mc đ thích h p c a bi u ghi, nh vy cĩ th dành thêm ch đ hi n th nhan đ nhi u h ơn. Tuy nhiên, k thu t này c ũng gây khĩ kh ăn cho nh ng ng ưi s dng b lo n màu ho c mù màu. K thu t trình bày b ng đ th th hi n các m i liên quan thích h p c a các bi u ghi tìm đưc và cĩ th s dng. Ví d, cĩ th trình bày k t qu tìm b ng m t đ th 2 ho c 3 chi u, trong đĩ các đim trên đ th th hi n các bi u ghi và v trí ca các đim th hi n m i t ươ ng quan gi a các bi u ghi và vi yêu c u tin c a ng ưi s dng. Trong m t s tr ưng h p, các lo i màu c ũng đưc s dng trong k thu t hi n th này. K thu t này cho phép ng ưi s dng xem các nhĩm bi u ghi đưc phân theo ch đ và cĩ th xem tồn b mt nhĩm nào đĩ ho c chuy n qua m t nhĩm ch đ khác. Cách này c ũng t ươ ng t nh ư khi lưt xem các giá sách trong m t th ư vi n. V i cách này, ng ưi s dng cĩ th th y hi u qu ca bi u th c tìm c a mình h ơn là ch hi n th mt ít bi u ghi. Hiên nay cĩ nhi u h th ng h tr cho ng ưi s dng ch c n ăng l a ch n cách s p xp k t qu tìm theo ý mu n, ví d sp x p theo nhan đ, theo tác gi , n ăm xu t bn, 6.2.2.2. Gi i h n vùng hi n th ð ti t ki m th i gian, ng ưi s dng ch mu n xem nh ng thơng tin c n thi t nh t đ xác đnh bi u ghi cĩ thích h p hay khơng. N u bi u ghi đưc xem là thích h p thì ng ưi s dng m i c n hi n th đy đ bi u ghi đ xem chi ti t. Vì vy, tĩm l ưc kt qu tìm ph i đưc trình bày m t cách ch n l c và ph i hi n th nh ng thơng tin c n thi t cĩ th giúp ng ưi s dng xác đnh đưc m c đ thích h p c a bi u ghi. Ví d, nhan đ và tĩm t t cĩ th là thơng tin c n thi t và đ đ ng ưi s dng d đốn đưc mc đ thích h p c a m t bi u ghi. Vi c hi n th gi i h n trong hai tr ưng này cho phép h th ng trình bày các k t qu tìm đưc trong m t màn hình. ðiu này giúp ng ưi s dng cĩ th xem l ưt nhanh và nm đưc m c đ thích h p cĩ th cĩ ca các bi u ghi trên màn hình. 6.2.2.3. ðánh d u (highlighting) K thu t đánh d u giúp ng ưi s d ng nhanh chĩng t p trung vào nh ng ph n thích h p c a v ăn b n đ xem m c đ thích h p c a bi u ghi. ð đm khác nhau c a ph n đánh d u cho bi t m c đ quan tr ng c a t đưc đánh d u đi v i vi c l a ch n bi u ghi đĩ. Ph n l n các h th ng cho phép vi c hi n th mt tài li u bt đu t ph n đưc đánh d u đu tiên trong tài li u và sau đĩ chuy n sang ph n đưc đánh d u ti p theo. M t ch c n ăng khác h tr h th ng xác đnh đon v ăn trong tài li u thích hp nh t v i yêu c u tin và sau đĩ tài li u s đưc hi n th bt đu t đon v ăn này. Mt s h th ng cho phép ng ưi s dng hi n th mt tài li u theo th t các đon v ăn ho c các t cĩ tm quan tr ng nh t đi v i v trí xp h ng c a tài li u. Dưi đây là mt ví d v k thu t đánh d u khi hi n th kt qu tìm. 78
  21. This is the html version of the file G o o g l e automatically generates html versions of documents as we crawl the web. To link to or bookmark this page, use the following url: Google is neither affiliated with the authors of this page nor responsible for its content. These search terms have been f retrie syst highlighted: act val em A fact retrieval-system is characterized by extensive use of the fetch operation and by the use of indexed or direct access. One or few relations will participate in a query. Since the answers are already bound to a particular query type, it is also possible to bind the database structure to match the queries so that rapid responses are obtained. 10-2-2 Statistical Inference When the size of a response to a query is so large that the user cannot comprehend it, techniques of data reduction must be employed. The techniques required may range from simple cross-tabulations to extensive statistical processing in order to provide meaningful data. The process of obtaining these results is more complex than the simple request-response sequence. Many intermediate data elements are obtained from the database to be incorporated into the result. Hình 6.1 6.2.3. Các ch c n ăng khác Cĩ nhi u ch c n ăng ph tr giúp ng ưi s dng nh p bi u th c tìm, gi m b t th i gian l p bi u th c tìm, gi m b t xác su t nh p m t bi u ghi khơng chính xác. Ch c năng hi n th t vng cung c p thơng tin v các t cĩ trong c ơ s d li u và vai trị ca chúng trong các bi u ghi trong CSDL. Tìm li trong k t qu tìm và nh t ký tìm tin tĩm l ưc các ho t đ ng tìm tin tr ưc đĩ ca ng ưi s dng và cho phép ng ưi s dng truy c p các k t qu tìm tr ưc đĩ t cuc tìm hi n t i. Các bi u th c cĩ sn cho phép truy c p các bi u th c đưc t o ra và đưc l ưu l i trong nh ng cu c tìm tr ưc ca ng ưi s dng. 6.2.3.1. Hi n th t v ng Ch c n ăng hi n th t vng cung c p kh năng hi n th các t trong CSDL tài li u theo tr t t ch cái. M t cách logic, t t c các t trong CSDL đưc l ưu tr trong m t tr t t cùng v i s ca các bi u ghi cĩ ch a t đĩ. Ng ưi s dng cĩ th nh p m t t ho c mt ph n c a t và h th ng s hi n th các t xung quanh các t đưc nh p vào. Trong hình 6.2. là kt qu đưc hi n th trên màn hình n u ng ưi s dng nh p “comput”. H th ng cho bi t m t ph n c a t đưc ng ưi s dng nh p vào và sau đĩ hi n th các t khác tìm đưc trong CSDL theo tr t t vn ch cái c a ph n ti p theo t đã đưc nh p. Ng ưi s dng c ũng cĩ th xem các thu t ng khác trong CSDL nm phía tr ưc t đưc nh p vào. Ch c n ăng hi n th t vng cung c p thơng tin v các t chính xác trong CSDL và tác đng c a vi c s dng các t trong m t cu c tìm. 79
  22. Ch ng h n, khi xem t vng, ng ưi s dng cĩ th xác đnh tác đng c a vi c s dng k thu t ch t t đi v i m t thu t ng tìm và nh ng l i chính t cĩ th gp. Ví d, ng ưi s dng cĩ th bi t đưc khi nh p vào thu t ng tìm “compul*” thì h th ng s tìm “compulsion” ho c “compulsive” ho c “compulsory”. Vi ch c n ăng hi n th t vng, ng ưi s dng cĩ th bi t t n su t c a m t thu t ng tìm trong các bi u ghi đ quy t đnh tốn t tìm tin c n s dng. Ví d, khơng nên s dng tốn t OR vi các thu t ng tìm tin cĩ tn su t l n vì khi đĩ kt qu tìm cĩ th quá ln. Hình 6.2. Hi n th t v ng v i thu t ng đưc nh p vào là “comput” Thu t ng S l n xu t hi n Compromise 53 Comptroller 18 Compulsion 5 Compulsive 22 Compulsory 4 Comput Computation 265 Compute 1245 Computer 10800 Computerize 18 Computes 29 6.2.3.2. Tìm li trong k t qu tìm và nh t ký tìm tin Thơng th ưng, m t cu c tìm s to ra m t tp kt qu tìm ch a nhi u bi u ghi h ơn s bi u ghi mà ng ưi s dng mu n xem. Thay vì nh p đy đ mt bi u th c tìm mi, cĩ th s dng các k t qu tìm tr ưc đĩ nh ư mt danh m c đưc gi i h n đ lp m t bi u th c tìm m i và th c hi n nĩ (trong các k t qu đã tìm đưc). Thao tác này đem li k t qu tươ ng t nh ư khi l y bi u th c ban đu và thêm vào các thu t ng tìm khác vi tốn t kt h p là tốn t AND. ðây là quá trình tinh l c các k t qu ca l n tìm tr ưc đ tp trung vào các bi u ghi thích h p. Quá trình này đưc g i là tìm l i trong kt qu tìm. K thu t này c ũng đưc áp d ng khi m t ng ưi s dng dùng thơng tin phn h i thích h p đ điu ch nh m t cu c tìm tr ưc đĩ. Trong m t phiên truy c p h th ng, ng ưi s dng cĩ th th c hi n nhi u bi u th c tìm đ tìm đưc thơng tin c n thi t. H th ng cung c p nh t ký các cu c tìm đ h tr vi c s dng các cu c tìm tr ưc như nh ng đim kh i đu cho nh ng cu c tìm m i. Nh t ký tìm tin cho phép hi n th tt c các cu c tìm đã đưc th c hi n tr ưc đĩ trong phiên truy c p hi n hành. Bi u th c tìm cùng v i t ng s kt qu tìm đưc s đưc hi n th . 80
  23. 6.2.3.3. Bi u th c tìm đưc lp s n Ch c n ăng t o bi u th c tìm đưc l p s n cung c p kh năng đt tên cho m t bi u th c tìm và lưu l i đ cĩ th tìm l i và th c hi n trong phiên truy c p sau. Ng ưi s dng th ưng cĩ nhi u lĩnh v c quan tâm và đĩ là nh ng l ĩnh v c đưc tìm tin th ưng xuyên. Ch c n ăng này cho phép ng ưi s dng t o ra bi u th c th c hi n mt cu c tìm t p trung vào l ĩnh v c quan tâm t ng quát ln đu, sau đĩ cĩ th tìm l i bi u th c đĩ và b sung các điu ki n tìm khác đ tìm d li u hi n t i đang c n. Ví d, m t ng ưi s dng quan tâm đn v n đ đu t ư châu Âu. Thay vì luơn ph i t o l p m t bi u th c gi i h n tìm v i các thu t ng đa danh châu Âu và sau đĩ là các thu t ng đc tr ưng cho yêu c u tin c th , ng ưi s dng cĩ th to m t bi u th c tìm l p s n vi t t c các thu t ng đa danh c n thi t và s dng nĩ nh ư mt đim kh i đu cho các yêu c u tin sau. Nên t o bi u th c l p s n đ cĩ kt qu đy đ và tng quát vì bi u th c đưc t o ra m t l n nh ưng đưc s dng nhi u l n v i các thu t ng tìm b sung cho các yêu c u tin c th . Ch c n ăng t o bi u th c l p s n c ũng cho phép chèn các thay đi vào bi u th c v i các giá tr c th th i đim th c hi n. 6.3. Cơ s d li u (CSDL) 6.3.1. Mt s khái ni m c ơ b n 6.3.1.1.D li u D li u là mt chu i các ký hi u c ơ bn nh ư các s nguyên ho c các ký t và là giá tr ca m t thu c tính. [23] Tr ưc đây, d li u th ưng đưc s d ng đ ch các s li u khoa h c. Trên th c t , d li u cĩ th là mt danh sách tên cơng ty, m t danh m c các t khĩa, các s li u v nhi t đ, đ m, Cĩ hai lo i d li u là d li u s ơ cp và d li u cĩ cu trúc. D li u s ơ cp là d li u cĩ th thao tác nh ư mt th c th khơng th chia nh đưc, ví d nh ư mt ch s, mt ký t. D li u cĩ cu trúc là mt t p h p các d li u s ơ cp cĩ th t ch c và truy c p đưc. 6.3.1.2. Cu trúc d li u Cu trúc d li u là thu t ng đưc dùng đ ch mt s ơ đ t ch c các ph n t d li u /thơng tin cĩ liên quan v i nhau. Mt c u trúc d li u là m t t p h p các ph n t d li u, khơng nh t thi t ph i cĩ cùng m t d ng thu c tính. Ví d , m t c u trúc đưc g i là đa ch cĩ th bao g m các ph n t là đưng ph , thành ph , mã s thành ph . M t ph n t c a m t c u trúc cĩ th là c u trúc khác ho c m t véc t ơ (là m t bi n s ch a m t t p các đ i l ưng). Ví d , m t h s ơ sinh viên đưc g i là Sinh viên cĩ th ch a tên , đa ch (c u trúc khác), các mơn h c đă ng ký (m t véc t ơ) Dưi đây là mt s cu trúc d li u c ơ bn. Mng Trong tốn h c, m ng là các d li u đưc s p x p theo hình ch nh t. M ng là mt danh sách các giá tr /d li u cĩ cùng m t ki u và đưc đánh d u b ng m t ch s. 81
  24. Cĩ hai lo i m ng là mng m t chi u (cịn g i là véc t ơ) và mng hai chi u (cịn g i là ma tr n). Ví d, m t b ng gi bay là mt m ng hai chi u, trong đĩ các c t th hi n các chuy n bay khác nhau, các dịng th hi n các sân bay khác nhau. Mt giá tr s trong m ng th hi n th i gian m t chuy n bay nh t đnh s đn m t sân bay nh t đnh. Trong x lý d li u, m t ph n t ca m t m ng cĩ th là mt ki u ph n t d li u b t kỳ. M t t p tin là mt m ng các bi u ghi. M t byte là mt m ng các bit. M t m ng cĩ th ch a các c u trúc, ví d nh ư mng đa ch cũ, m i c u trúc c a nĩ đưc xác đnh trên. Danh sách Danh sách (list) là mt t p h p d li u đưc s p theo th t. Bi u ghi Bi u ghi là mt t p h p d li u cĩ liên quan v i nhau. Bi u ghi đưc t o thành b i các thành ph n đưc g i là tr ưng. Mi tr ưng ch a m t lo i thơng tin nh t đnh liên quan đn mt khía c nh ho c mt thu c tính c a đi t ưng đưc bi u ghi mơ t. Tr ưng cĩ th đưc xem nh ư mt đơ n v d li u đưc l ưu tr . Ví d, bi u ghi th ư mc c a m t CSDL v sách cĩ th bao g m các tr ưng nh ư: tr ưng tác gi ch a tên tác gi ; tr ưng nhan đ ch a nhan đ Tr ưng cĩ th đưc chia thành các đơ n v nh hơn đưc g i là tr ưng con. Ví d, tr ưng “xu t b n” cĩ th đưc chia thành các tr ưng con là nhà xu t b n, n ơi xu t b n và năm xu t b n. Cĩ hai lo i tr ưng là tr ưng khĩa ch và tr ưng khĩa th . Tr ưng khĩa ch là tr ưng ph n ánh thu c tính quan tr ng cĩ ý ngh ĩa xác đnh đi t ưng và/ho c phân bi t các bi u ghi v i nhau. Tr ưng khĩa th là tr ưng ph n ánh các thu c tính khác ca đi t ưng. Tp tin Tp tin (file) là mt t p h p d li u g m nhi u bi u ghi cĩ chung các đc tính c u trúc và ng ngh ĩa, đưc s dng đ mơ t mt l p đi t ưng. Da vào cách t ch c, cĩ th phân thành các lo i t p tin nh ư sau: - Tp tin k ti p: là tp h p các bi u ghi đưc sp xp thành m t dãy liên ti p. ð truy c p m t bi u ghi, ta ph i đc l n l ưt các bi u ghi tr ưc đĩ. - Tp tin truy c p tr c ti p: t p tin truy c p tr c ti p là tp h p các bi u ghi cĩ đánh s th t. Cĩ th truy c p m t bi u ghi b ng cách ch rõ s th t ca nĩ. - Tp đo: Mt CSDL cĩ c u trúc t p đ o th ưng bao g m các t p s ơ c p (t p ch /t p thu n) và các t p đ o k t h p v i t p s ơ c p.  Tp s ơ cp ch a t t c các bi u ghi ca CSDL và mi bi u ghi đưc đnh v bng m t đa ch (ví d nh ư s ca bi u ghi).  Tp đo bao g m các giá tr ca m t s tr ưng trong các bi u ghi c a t p sơ cp đưc ch n làm đim truy c p thơng tin. Thơng th ưng, đây là nh ng tr ưng ch a các thu c tính th ưng đưc s dng đ tìm đi tưng. Nh ư vy, t p đo cho phép truy c p các bi u ghi c a t p s ơ cp theo các giá tr ca m t s thu c tính c a đi t ưng đưc ph n ánh trong CSDL. Cơ s d li u 82
  25. Cơ s d li u là mt t p h p cĩ cu trúc các d liu cĩ quan h vi nhau và đưc lưu tr sao cho nh ng ng ưi s dng cĩ th m quy n cĩ th truy c p m t cách d dàng. CSDL bao g m m t ho c nhi u t p tin. Thơng tin trong các t p tin đưc ch a trong các bi u ghi. M i bi u ghi là mt đơ n v thơng tin c a CSDL và mi bi u ghi bao g m mt ho c nhi u tr ưng và tr ưng con. Xác đnh bi u ghi ch a nh ng tr ưng và tr ưng con nào là mt nhi m v quan tr ng trong quá trình thi t k CSDL. 6.3.1.3.H qu n tr CSDL H qu n tr CSDL là tp h p các ch ươ ng trình h tr ng ưi s dng qu n lý và khai thác CSDL v i các ch c n ăng cơ bn là mơ t d li u, c p nh t d li u và tìm ki m d li u. H qu n tr CSDL là cơng c qu n lý CSDL v i các mc tiêu c ơ bn nh ư sau: - Tích h p d li u đ ng ưi s dng cĩ th truy c p d dàng; - Bo đm ch t l ưng và tính tồn v n d li u; - Bo đm tính đc l p logic và vt lý ca d li u; - Cho phép ki m sốt tồn b CSDL. H qu n tr CSDL cung c p ngơn ng d li u đ h tr ng ưi s dng xây d ng cu trúc CSDL, mơ t, c p nh t và tìm ki m d li u. ð la ch n m t h qu n tr CSDL thích h p, c n da vào kh năng th c hi n các ch c n ăng nh ư to l p CSDL, nh p d li u, tìm tin, hi n th , in và an tồn d li u. 6.3.1.4. Ph n m m t ư li u Ph n m m t ư li u là ph n m m th c hi n các ch c n ăng qu n lý, l ưu tr và tìm ki m thơng tin v tài li u. Ph n m m t ư li u bao g m nhi u mơ đun th c hi n các ch c n ăng khác nhau nh ư thi t l p c u trúc CSDL, c p nh t d li u, tìm ki m d li u, hi n th kt qu tìm trên màn hình và in k t qu tìm. Ph n m m t ư li u cĩ các đc tính c ơ bn sau: - Cho phép ng ưi s dng t thi t l p c u trúc CSDL (ch yu là các CSDL th ư mc); - ðng th i qu n lý đưc nhi u CSDL; - Cho phép t o l p t p đo đ truy c p nhanh CSDL; - Cĩ th thay đi các bi u m u nh p d li u; - Cho phép s dng nhi u lo i tốn t tìm tin đ tìm tin trong các tr ưng; - Cĩ th hi n th và in t vng các thu t ng tìm; - Cĩ th thay đi format trình bày d li u đ hi n th ho c in k t qu tìm theo ý mu n. 6.3.2. Các lo i CSDL Cĩ th phân lo i CSDL d a trên nhi u c ơ s khác nhau. Sau đây s đ cp các cách phân lo i chính là theo tính ch t d li u, theo ph m vi bao quát đ tài và theo lo i hình tài li u. 6.3.2.1. Phân lo i theo tính ch t d li u 83
  26. Theo tính ch t d li u, cĩ th phân lo i các CSDL thành CSDL th ư mc, CSDL d ki n và CSDL tồn v ăn. CSDL th ư mc CSDL th ư mc (Bibliographic Databases) ch a d li u v tài li u và đơi khi cĩ các tĩm t t tài li u. ði t ưng đưc mơ t cĩ th là các tài li u chuyên kh o, bài trích t báo, t p chí, báo cáo khoa h c, lu n án CSDL th ư mc là thành ph n quan tr ng trong các h th ng tìm tin hi n nay. CSDL th ư mc cho phép ng ưi s dng truy c p các tài li u trong m t th ư vi n ho c m ng l ưi các th ư vi n theo các đc tr ưng hình th c và/ho c n i dung tài li u. Mt khác, CSDL th ư mc cho phép t o ra các s n ph m nh ư n ph m th ư mc, t p chí tĩm t t, m c l c d ng vi phim (microfilm), vi phi u (microfiche), Thơng tin trong CSDL th ư mc đưc t ch c theo s ơ đ kt h p. C u trúc m t CSDL th ư mc bao g m hai t p tin là tp thu n ( đưc t ch c theo s ơ đ tuy n tính) và tp đo ( đưc t ch c theo s ơ đ đo). Thành ph n c a t p thu n (cịn g i là tp ch ) là các bi u ghi ch a d li u v tài li u. M i bi u ghi ch a các y u t mơ t mt tài li u nh ư tên tác gi , nhan đ, các y u t xu t b n, các đc tr ưng s lưng, ký hi u phân lo i, đ mc ch đ, t khĩa, tĩm tt, chú gi i và đa ch lưu tr tài li u Tp đo ch a các đim truy c p đưc rút ra t các bi u ghi trong t p thu n mt cách t đng. CSDL d ki n CSDL d ki n ch a các thơng tin d ki n nh ư các s li u, d ki n c th v các đi tưng, các qui trình, ph ươ ng pháp, Thơng tin trong CSDL d ki n đưc rút ra t nhi u ngu n thơng tin và đưc x lý, biên t p l i. Vì vy, khi s dng CSDL này, ng ưi s dng khơng c n ph i tìm đn tài li u g c. CSDL tồn văn CSDL tồn v ăn (Full-text Databases) ch a tồn v ăn c a các tài li u cùng v i các d li u th ư mc và các thơng tin b sung khác. CSDL tồn v ăn t o điu ki n thu n l i cho ng ưi s dng truy c p các ngu n thơng tin c p mt. 6.3.2.2. Phân lo i theo ph m vi bao quát đ tài Theo ph m vi bao quát đ tài, cĩ th chia CSDL thành các nhĩm nh ư sau: - CSDL đnh h ưng vào mt ngành ln: là CSDL cung c p d li u v nhi u lĩnh v c khác nhau trong m t ngành l n nh ư nơng nghi p, mơi tr ưng, y t và bo v sc kh e - CSDL chuyên ngành h p: là CSDL cĩ ni dung liên quan đn mt cơng ngh ho c m t l ĩnh v c ng d ng c th . - CSDL đa ngành: là CSDL cĩ ni dung liên quan nhi u ngành khoa h c. 6.3.2.3. Phân lo i theo lo i hình tài li u CSDL theo lo i hình tài li u là CSDL bao quát nh ng lo i hình tài li u c th và th ưng cĩ ni dung đa ngành nh ư CSDL sách, CSDL t p chí, CSDL tiêu chu n, CSDL nhãn hi u hàng hĩa 6.3.3. Xây d ng CSDL 84
  27. Mt h th ng tìm tin cĩ th ch a nhi u lo i CSDL khác nhau nh ưng các CSDL ph bi n nh t trong các TV-CQTT là CSDL th ư m c và CSDL d ki n. Hi n nay cĩ nh ng ph ươ ng pháp k t h p cho phép xây d ng c hai lo i CSDL này trên m t c u trúc CSDL tích h p. Mc này ch đ cp cách xây d ng CSDL trong các h th ng tìm tin v i các ph n m m tìm tin v ăn b n. Xây d ng CSDL n m trong giai đon 2 c a qui trình thi t k m t h th ng tìm tin t đ ng hĩa. Nhi u quy t đ nh quan tr ng ph i đưc đưa ra khi thi t k CSDL và ho t đng c a h th ng tìm tin đưc xây d ng s ph thu c nhi u vào nh ng quy t đ nh này. Qui trình xây d ng CSDL bao g m các b ưc nh ư sau: Giai đon 1: Chu n b - Phân tích nhu c u tin (hi n t i và ti m n ăng) c a ng ưi s dng - Xác đnh ph m vi đi t ưng đưc ph n ánh trong CSDL (n i dung, th i gian, khơng gian) - Xác đnh lo i CSDL (th ư mc, d ki n, tồn v ăn ) - Thu th p thơng tin Giai đon 2:Thi t k CSDL . - Bưc 1: Xác đnh các đi t ưng và các tr ưng đưc s dng đ mơ t các đi t ưng: • Xác đnh thu c tính (tên, giá tr ) ca đi t ưng c n đưc ph n ánh. Vi c xác đnh các thu c tính ph i d a trên các nhu c u khai thác thơng tin v đi tưng (các đu ra d ki n c a CSDL, yêu c u đi v i các đu ra đ th a mãn nhu c u c a ng ưi s dng) • Xác đnh cu trúc CSDL: xác đnh các tr ưng (mơ t các thu c tính) và tr ưng con, nhãn tr ưng, ni dung, đ dài và các đc tr ưng khác c a các tr ưng và tr ưng con đưc t p h p trong CSDL. Cu trúc các tr ưng trong bi u ghi ph i đưc thi t k sao cho khơng cĩ s trùng l p ho c ph thu c v giá tr gi a các tr ưng nh m gi m t i đa s dư th a d li u. Mi lo i ph n m m tìm tin văn b n cĩ ph ươ ng th c riêng đ th c hi n nh ng cơng vi c này và các b ưc th c hi n trong các ch ươ ng trình cĩ th khác nhau. Th c ch t, đây chính là bưc t o tp ch (t p thu n) cho CSDL Tùy b n ch t c a d li u đưc t p h p trong CSDL, ng ưi thi t k cĩ th xác đnh các tr ưng và tr ưng con khác nhau. Ví d, ng ưi thi t k cĩ th s dng các tr ưng sau cho m t CSDL sách chuyên kh o đơ n gi n: • Tác gi • Nhan đ sách • Tên nhà xu t b n • Nơi xu t b n • Năm xu t b n • Giá • Ký hi u x p giá • S đă ng ký cá bi t • T khĩa 85
  28. Ng ưi thi t k cũng cĩ th tp h p m t s yu t thơng tin trong các tr ưng con ca cùng m t tr ưng. Ví d, cĩ th to l p m t tr ưng “Xu t b n” v i các tr ưng con là “N ơi xu t b n”, “Nhà xu t b n” và “N ăm xu t b n”. Bưc 2: Xây d ng cu trúc tp đo cho CSDL ðây là bưc t o cu trúc tp đo trong đĩ cĩ th th c hi n vi c tìm tin. Cơng vi c chính c a b ưc này là xác đnh các đim truy c p thơng tin trong CSDL . Các đim truy c p này là các giá tr c a các thu c tính c a đ i t ưng đưc ph n ánh trong CSDL và th ưng đưc s d ng đ tìm ki m đ i t ưng. ð cĩ th tìm tin đưc thì các tr ưng ch a các đim truy c p này ph i đưc ph n ánh trong t p đ o. Vì vy, ngưi thi t k ph i xác đ nh các tr ưng/tr ưng con cĩ th đưa vào t p đ o. Thơng th ưng, đĩ là nh ng tr ưng ch a các thu c tính th ưng đưc s d ng đ tìm ki m đ i t ưng. Vi c xác đnh các tr ưng này ph thu c vào đi t ưng đưc ph n ánh trong CSDL và thĩi quen tìm tin c a ng ưi s dng CSDL. Các ph n m m cĩ các k thu t khác nhau đ xác đnh các tr ưng cĩ th đư a vào t p đo và cách đư a các tr ưng đĩ vào t p đo, ví d nh ư đư a tồn b mt tr ưng/tr ưng con nào đĩ ho c m i m t t trong m t tr ưng nh t đnh ho c m i m t giá tr lp c a m t tr ưng/tr ưng con Ngưi thi t k ph i tuân theo các b ưc đã đưc qui đnh tr ưc đ xây d ng cu trúc tp đo. Bưc 3: T o l p phi u ti n máy (worksheet) Mt nhi m v quan tr ng khác c a giai đon thi t k CSDL là to l p phi u ti n máy, là mt bi u m u tr ng đưc s dng đ nh p d li u vào CSDL. Trong m t s ph n m m tìm tin v ăn bn, ng ưi thi t k ph i t o l p m t bi u m u cho nh ng ng ưi nh p d li u s dng đ nh p d li u vào CSDL. Bên c nh đĩ cũng cĩ mt s ph n mm tìm tin v ăn b n cho phép nh p d li u tr c ti p mà khơng c n t o l p bi u m u nào. Bu c 4: To l p format trình bày d li u Ng ưi thi t k CSDL ph i quy t đnh các d ng th c trình bày d li u cĩ th s dng khi xem l ưt CSDL ho c hi n th kt qu tìm đưc. M t s ph n m m cho phép ng ưi thi t k to ra m t ho c nhi u format hi n th các bi u ghi tìm đưc. Tuy nhiên, khơng ph i t t c các h th ng tìm tin đu cĩ ch c n ăng h tr hi n th các bi u ghi theo m t format đã la ch n. Các format trình bày d li u ph i đưc xây d ng d a trên các đu ra d ki n c a CSDL. Trên đây là các b ưc thi t k mt CSDL v i m t ph n m m tìm tin v ăn b n. Các bưc và ph ươ ng pháp th c hi n trong các ph n m m khác nhau cĩ th khác nhau, nh ưng v n cĩ mt s đim chung cơ bn. Giai đon 3: X lý thơng tin - X lý thơng tin: t ch c x lý thơng tin v các đi t ưng và đin thơng tin vào các phiu ti n máy ; - Ki m tra thơng tin đã x lý: ki m tra, ch nh s a n i dung các phi u ti n máy. Giai đon 4: Nh p d li u 86
  29. - Nh p d li u trong các phi u ti n máy đã đưc ki m tra. - Ki m tra, ch nh s a d li u trên máy tính. Giai đon 5: T ch c t p đ o và tìm th nghi m - T ch c t p đo: Trong m t s ph n m m tìm tin v ăn b n, t p đ o đưc to l p và đưc c p nh t ngay khi các bi u ghi m i đưc b sung ho c các bi u ghi hi n hành đưc xĩa/ch nh s a. Cịn trong m t s ph n m m khác thì vi c t o l p và c p nh t t p đo đưc th c hi n theo đt. - Tìm tin th nghi m: tìm th nghi m v i nhi u yêu c u tin và k thu t tìm khác nhau. Giai đon 6: Khai thác và hồn thi n - Khai thác CSDL ph c v ng ưi s dng và thu th p thơng tin ph n h i. - ðiu ch nh c u trúc, các đim truy cp, format hi n th d a trên ý ki n đánh giá ca ng ưi s dng. - Ti p t c c p nh t CSDL 6.3.4. Các tiêu chí đánh giá CSDL Các t ch c cĩ th t mình xây d ng các CSDL ho c mua các CSDL t nhi u nhà cung c p khác nhau. ð la ch n mt CSDL thích h p, các t ch c cĩ th s dng các tiêu chí đánh giá nh ư sau: - Mc đ bao quát: CSDL cĩ cung c p kh năng truy c p đn l ĩnh v c thích hp? CSDL cĩ đy đ? Ph m vi bao quát c a CSDL cĩ trùng v i các CSDL khác cùng m t l ĩnh v c? - Lo i CSDL và thơng tin đưc cung c p, bao g m thơng tin th ư mc, tồn văn, d ki n. - Mc đ cp nh t - Mc đ s dng thu n ti n: CSDL cĩ d s dng đi v i ng ưi dùng tin mc tiêu? - Các hình th c hi n th : Các l a ch n hi n th ni dung bi u ghi? Bi u ghi cĩ ch a tĩm t t? Cĩ bi u ghi tồn v ăn trong CSDL? - Ngơn ng đánh ch s: lo i ngơn ng đánh ch s đưc s dng? M c đ đc tr ưng c a vi c đánh ch s? T t c các y u t này cĩ thích h p v i tiêu chí tìm tin mong mu n (h s chính xác và đy đ)? - Giá - Tài li u h ưng d n và các cơng c h tr cĩ sn đ tr giúp vi c tìm tin trong CSDL, bao g m các khung phân lo i, T ðTC d ng in ho c đc máy 6.4. OPAC 6.4.1. Khái ni m Theo T đin Thơng tin-th ư vi n h c tr c tuy n (Online Dictionary of Library and Information Science –ODLIS), OPAC (Online Public Access Catalog – Mc l c cơng cng truy c p tr c tuy n) là mt CSDL ch a các bi u ghi th ư mc mơ t sách ho c 87
  30. các lo i tài li u khác trong v n tài li u c a m t th ư vi n ho c m t h th ng th ư vi n và cĩ th truy c p qua các máy tr m ho c thi t b đu cu i [26]. Mt OPAC khơng ph i ch đơ n thu n là s chuy n đi ph ươ ng th c l ưu tr ca mc l c t th cơng sang máy tính. M t OPAC ( mc t i thi u) ph i cung c p các đim truy c p theo tác gi , nhan đ, ch đ và t khĩa đn t t c các bi u ghi th ư mc và cho phép s dng các bi u th c tìm tin vi các tốn t Bool đ th c hi n các yêu cu tin c th . 6.4.2. Các tính n ăng cơ b n ca OPAC Là mt thành ph n c a h th ng th ư vi n tích h p, OPAC ph i th c hi n nhi u ch c n ăng ngồi ch c n ăng chính là tìm ki m các bi u ghi th ư mc. Ph n l n các OPAC cho phép ng ưi s dng tìm thơng tin v hi n tr ng l ưu hành c a tài li u c n tìm, ki m tra thơng tin v th i h n m ưn-tr tài li u và đă ng ký mưn tài li u. OPAC cĩ các tính n ăng c ơ bn nh ư sau: - Tìm tin v i các đim truy c p khác nhau nh ư tác gi , nhan đ, ch đ, ký hi u x p giá, tùng th ư - Ki m sốt các thu t ng tìm; - La ch n các kh mu đu ra đưc xác đnh tr ưc; - La ch n hi n th đy đ ho c trích d n ng n g n; - Hi n th b ng tra ho c t đin t chu n đ h tr ng ưi s dng. Mt b tiêu chí đy đ đưc mt nhĩm nghiên c u phát tri n vào n ăm 1994 đ đánh giá các OPAC đã li t kê các ch c n ăng đưc nhĩm thành các lo i nh ư sau: [17] - Các thu c tính c a CSDL: thơng tin đưc hi n th (ký hi u x p giá, tác gi , nhan đ, đ mc ch đ, hi n tr ng m ưn ) - Ki m sốt ho t đng: h th ng cung c p các giao di n v i dịng l nh ho c v i menu, cung c p cho ng ưi s dng kh năng đă ng ký mưn tài li u ho c đt tr ưc, xem các tài li u đang cho m ưn, t i các bi u ghi v máy tính c a mình; - Cung c p các kh năng tìm tin theo các k thu t nh ư tìm theo t khĩa, tìm v i các tốn t Bool, tốn t tìm lân c n, tìm gi i h n theo các đc tính - Các cơng c h tr tìm theo ch đ: kh năng duy t qua đ mc ch đ và hi n th các tham chi u qua l i; - Các đim truy c p: cung c p nhi u đim truy c p, cho phép ng ưi s dng tìm tài li u theo nhi u cách khác nhau. Ví d, ng ưi s dng cĩ th truy c p d li u thơng qua các tr ưng nh ư tác gi , nhan đ, ch đ - Các tùy ch n hi n th màn hình – ví d, cho phép ng ưi s dng l a ch n hi n th các tr ưng v i nhãn tr ưng, hi n th bi u ghi đy đ hay rút g n, hi n tr ng l ưu hành tài li u và ký hi u x p giá; - Các tùy ch n ki m sốt đu ra – ví d, ng ưi s dng cĩ th la ch n hi n th các tr ưng c th , hi n th kt qu ca nhi u cu c tìm, xác đnh các khĩa s p x p k t qu tìm và hi n th các bi u ghi tìm đưc theo tr t t gi m d n c a m c đ thích h p ; - Các tùy ch n các l nh – các l nh cĩ th c hi n vai trị gi ng nhau trong các ng cnh khác nhau? Cĩ cn m t cú pháp đưc chu n hĩa? Cĩ gi i h n s ký t đưc nh p vào? 88
  31. - Các ch c n ăng h tr ng ưi s dng – các ch c n ăng h ưng d n h c tr c tuy n, các thơng báo h ưng dn tng quát, các thơng báo h ưng d n theo ng cnh, thơng báo l i và ph n m m ki m tra l i chính t ; - Kh năng s dng OPAC qua truy c p t xa: cĩ các h ưng d n đă ng nh p/ đă ng xu t đy đ, cĩ các gi i h n v th i gian truy c p trong ngày? Hi n nay, b tiêu chí n ăm 1994 v n cĩ th áp d ng và vn đưc ti p t c phát tri n đ đáp ng yêu c u th c ti n. 6.4.3. Ưu đim và h n ch c a OPAC OPAC cĩ các tính n ăng đưc thi t k ch yu dành cho ng ưi s dng th ư vi n mc dù nhân viên th ư vi n c ũng s dng nĩ. So v i các h th ng m c l c truy n th ng, OPAC cĩ nh ng ưu đim sau: 1.OPAC cho phép ng ưi s dng cĩ th truy c p t mt đa đim b t k ỳ. Vì vy, mt nhà qu n lý hay m t k sư mt v ăn phịng chi nhánh cĩ th tra c u m c l c c a mt th ư vi n k thu t n m văn phịng t ng cơng ty. Tươ ng t , các h c sinh trung hc đang làm bài t p c ũng cĩ th s dng máy tính nhà đ tìm trong các m c l c cơng c ng nh ng cu n sách c n thi t. Cùng v i s ph bi n r ng rãi c a mng tồn cu, ng ưi s dng th ư vi n cĩ th truy c p ngu n thơng tin c a th ư vi n vào b t k ỳ lúc nào và t bt k ỳ đa đim nào. 2. Vic b o trì OPAC khơng t n nhi u cơng s c nh ư mc l c truy n th ng. N u cn, cĩ th cp nh t OPAC ngay b ng cách b sung ho c lo i b các bi u ghi khi tài li u đưc biên m c ho c đưc thanh l c.Tuy nhiên, vi c c p nh t m c l c th ưng đưc th c hi n hàng ngày ho c theo đnh k ỳ khác. Vì các bi u ghi c a m c l c đưc lưu tr trên đĩa c ng, cĩ th sao l ưu chúng m t cách thu n ti n trên b ăng t đ bo tồn d li u. 3. Cĩ th ng d ng OPAC theo nhi u ph ươ ng th c. Ví d, n u các th ư vi n đă ng ký tham gia các mng lưi th ư mc c th thì mt ph n các bi u ghi trong m c l c ca các th ư vi n này cĩ th truy c p tr c tuy n. Nhi u trung tâm th ư mc l ưu tr bn sao và các bi u ghi th ư mc khác nhau do các th ư vi n tham gia đĩng gĩp. Các bi u ghi này ph n ánh chính xác v n tài li u c a m t th ư vi n c th , bao g m c ký hi u xp giá ca tài li u. Các trung tâm th ư mc cung c p ngày càng nhi u các kh năng tìm thơng tin m nh, bao g m k thu t tìm theo t khĩa v i các tốn t tìm khác nhau cũng nh ư các cách tìm truy n th ng theo tác gi , nhan đ và ch đ. Vì vy, m t th ư vi n tham gia m t m ng l ưi th ư m c nào đĩ cĩ th s dng CSDL c a trung tâm th ư mc nh ư mc l c tr c tuy n c a mình. Tươ ng t , m t s dch v thơng tin tr c tuy n cung c p các kh năng t o “tp tin riêng” cho phép các khách hàng t o các tp tin th ư mc ho c d li u khác đ truy c p qua cùng m t ph n m m đưc s dng đ truy c p cơng c ng các tp d li u cĩ sn. Nh ng tp riêng nh ư vy cĩ th ch a m c l c tr c tuy n c a m t th ư vi n. Tùy vào qui mơ vn tài li u, các th ư vi n cĩ th ng d ng OPAC v i h th ng dịng l nh ho c h th ng menu. Trong các OPAC v i h th ng dịng l nh, ng ưi s dng nh p vào m t chu i tìm xác đnh tr ưng c n tìm, ti p theo là mt giá tr c th cn tìm trong tr ưng đĩ. Thơng th ưng, các t vi t t t d nh nh ư “A=”, “T=”, và “S=” đưc s dng cho các tr ưng tác gi , nhan đ và ch đ. Mt s h th ng dịng lnh cung c p các h ưng d n đy đ và chính xác h tr cho nh ng ng ưi mi s 89
  32. dng cĩ th tìm ki m m t cách nhanh chĩng. M t s h th ng địi h i ng ưi s dng ph i qua hu n luy n ban đu đ cĩ th s dng h th ng m t cách hi u qu . Vì vy, các h th ng menu thu n ti n h ơn đi v i ng ưi s dng khơng cĩ kinh nghi m ho c khơng th ưng xuyên. Ph n l n các phân h OPAC s dng ph n m m v i h th ng menu và cĩ th cũng cung c p h th ng dịng l nh cho ng ưi tìm tin cĩ kinh nghi m ho c các nhân viên th ư vi n. Các giao di n s dng menu r t c n thi t đi v i các t ch c ph c v khách hàng đa d ng và khơng cĩ điu ki n hu n luy n ng ưi s dng như các th ư vi n cơng cng. Các ph n m m tìm tin theo dịng l nh cĩ th tt đi v i các th ư vi n đi h c ho c chuyên bi t, n ơi cĩ th hu n luy n tr ưc k thu t tìm tin cho các gi ng viên, sinh viên, các nhà khoa h c và nh ng ng ưi s dng th ưng xuyên khác cĩ các yêu c u ph c t p. Ch đ tìm tin theo dịng l nh c ũng h u d ng đi v i các nhân viên tra c u khi b t đu các thao tác tìm tin ph c t p ho c khơng th th c hi n đưc v i cách tìm da trên h th ng menu. ðưc thi t k dành cho nh ng ng ưi m i b t đu s dng nên đc tr ưng c a các phân h OPAC s dng menu là khái ni m và thao tác d hi u. Các tùy ch n tìm ki m đưc xác đnh b ng các ch vi t t t ho c s và th ưng đưc li t kê trong các b ng hưng d n thao tác l a ch n. Các ch dn ng n g n gi i thích các b ưc tìm tin và trình bày cú pháp thích h p đi v i các bi u th c tìm tin. Thơng tin chi ti t h ơn đưc trình bày trong các màn hình tr giúp cĩ th bt lên b ng các phím ch c n ăng. 4. OPAC cho phép th c hi n nh ng thao tác tìm tin và xem k t qu tìm khơng th th c hi n đưc v i m c l c truy n th ng. OPAC cĩ th tìm các bi u ghi b ng cách k t hp các đim truy c p v i nhau. ð tìm tin, ng ưi s dng cĩ th s dng k t h p các thơng s mơ t thơng tin c n tìm. Ví d, m t ng ưi dùng tin c n tìm m t bài th ơ ca T Hu v Hu . N u s dng h th ng m c l c truy n th ng, ng ưi dùng tin ph i mt nhi u th i gian đ tìm đưc bài th ơ này. Nh ưng v i m t OPAC đưc xây d ng mt cách h p lý, ng ưi dùng tin cĩ th th c hi n yêu c u tin này m t cách d dàng và nhanh chĩng. Các OPAC s dng các b ng tra đ tìm các bi u ghi th ư mc. V i t t c các h th ng tích h p, các phân h OPAC cho phép tìm theo tác gi , nhan đ và ch đ nh ư các m c l c truy n th ng. Cịn các kh năng tìm tin theo các d u hi u khác s ph thu c vào t ng h th ng. Nhi u h th ng h tr tìm theo m t ho c nhi u đc đim nh n d ng bi u ghi nh ư s ki m sốt h th ng, ch s ISBN nh ưng các d u hi u này thích h p v i nhân viên th ư vi n h ơn là vi ng ưi s dng th ư vi n. Các du hi u tìm tin khác cĩ th bao gm các y u t xu t b n, ngơn ng , lo i hình tài li u Vi m t s h th ng tích h p, cĩ th s dng các d u hi u này đ gi i h n k t qu tìm c a bi u th c tìm đưc nh p tr ưc đĩ. ð tăng t i đa tính linh ho t, m t s h th ng tích h p cho phép th ư vi n ch n các tr ưng trong các bi u ghi đ đánh ch s đ tìm ki m. Trong nh ng tr ưng h p khác, các tr ưng đưc đánh ch s đưc nhà cung c p h th ng xác đnh tr ưc và s lưng tr ưng này th ưng đ ln đ đáp ng các yêu c u khác nhau c a th ư vi n. Các h th ng th ưng h tr các tốn t ch t t , các tốn t Bool đ kt h p logic nhi u thu t ng tìm. M t s h th ng cho phép tìm theo t khĩa trong các tr ưng đưc xác đnh, đc bi t các tr ưng tên tác gi tp th và tên h i th o, nhan đ, tùng th ư và đ mc 90
  33. ch đ. Nhi u h th ng th ư vi n tích h p cung c p các l nh tìm lân c n, tìm ký t thay th và các k thu t tìm khác th ưng g n li n v i các h th ng tìm tin văn bn. Các k thut này thích h p nh t v i các bi u ghi th ư mc ch a các tĩm t t ho c các đon v ăn bn dài nh ưng khĩ s dng hi u qu đi v i nh ng ng ưi tìm tin khơng đưc hu n luy n. Nu ch cĩ mt bi u ghi th ư mc đáp ng yêu c u tin thì bi u ghi đĩ th ưng đưc hi n th đy đ và ngay l p t c. Khi k t qu ca m t bi u th c tìm g m nhi u bi u ghi, ph n l n các phân h OPAC cung c p t ng s bi u ghi tìm đưc và hi n th các bi u ghi th ư mc rút g n bao g m m t s yu t mơ t nh ư tác gi , nhan đ, th i gian xu t b n và s xp giá. Sau đĩ, ng ưi tìm tin cĩ th yêu c u hi n th chi ti t h ơn t t c ho c m t s bi u ghi ch n l c. Khi khơng tìm đưc bi u ghi nào th a mãn bi u th c tìm tin, ph n l n các phân h OPAC hi n th mt danh m c x p theo v n ch cái các giá tr gn kh p nh t v i các thu t ng trong bi u th c tìm này. Nu h th ng cĩ áp d ng ki m sốt tiêu đ chu n, các tham chi u ch ch qua l i cho các tiêu đ khơng chu n ho c tiêu đ liên quan s đưc hi n th . Trong m t s tr ưng h p, tiêu đ chu n s đưc t đng thay th cho thu t ng khơng chu n N u khơng cĩ tham chi u ch ch qua l i, m t s h th ng s t đng đư a m t tên ho c t gn kh p nh t đ thay th mt thu t ng tìm khơng th tìm th y trong các bi u ghi th ư mc do l i đánh máy ho c l i chính t . ð m rng ch c n ăng c a mình, các h th ng th ư vi n tích h p t ăng c ưng kh năng tìm các ngu n l c thơng tin bên ngồi qua OPAC. Ch ng h n, các CSDL tra c u trên b ăng t ca các nhà xu t b n cĩ th đưc cài đt c c b và đưc li t kê nh ư mt tùy ch n trong menu c a OPAC. M t s nhà cung c p các ph n m m qu n tr th ư vi n tích h p c ũng cung c p các giao di n đn các s n ph m thơng tin trên CD-ROM, các dch v thơng tin tr c tuy n, và các website trên Internet. T gi a nh ng n ăm 1980, các OPAC h tr kh năng truy c p ngu n tài nguyên thơng tin ca các th ư vi n khác, ví d nh ư mng l ưi các th ư vi n trong vùng, các th ư vi n đi h c, Chu n Z39.50 đưc áp d ng r ng rãi cho m c đích này. Chu n Z39.50 xác đnh các kh năng trong m t ng d ng (các d ch v ng d ng) và giao th c đưc s dng đ truy n thơng gi a các ng d ng (Giao th c ng d ng tìm tin – Information Retrieval Application Protocol). ðĩ là chu n truy n thơng gi a các máy tính đ tìm ki m bi u ghi trong CSDL. M c tiêu c a chu n này là kh c ph c tính khơng t ươ ng thích c a các h th ng khác nhau liên quan đn vi c tìm tin trong nhi u CSDL (ví d giao di n ng ưi s dng th ng nh t, ngơn ng lnh, các ch c n ăng tìm tin c ơ bn). Phiên b n đu tiên đưc ANSI/NISO phê chu n n ăm 1992. M t phiên bn qu c t ca Z39.50, đưc g i là chu n tìm tin (SR-Search and Retrieval) đưc t ch c tiêu chu n qu c t ISO phê chu n n ăm 1991. Z39.50-1995, phiên b n m i nh t ca Z39.50, thay th cho SR nh ư chu n tìm tin qu c t . Bên c nh các ưu đim nêu trên, OPAC vn cịn nh ng hn ch nh ư sau: 1. ði v i nhi u ng ưi dùng tin, OPAC v n là h th ng tìm tin ch ưa hồn thi n và khĩ s dng. ð s dng OPAC hi u qu , ng ưi dùng tin ph i nm đưc các ki n th c và k năng c ơ bn nh ư ki n th c v các b ưc trong quá trình tìm tin, k năng xây d ng bi u th c tìm tin, k năng s dng máy tính c ơ bn S phát tri n theo h ưng ngày càng d s dng 91
  34. ca các ph n m m khác nh ư ph n m m so n th o v ăn b n, đc bi t là s phát tri n c a các cơng c tìm ki m trên Internet càng làm gia t ăng s kỳ vng c a ng ưi s dng đi v i các OPAC d s dng. 2. Quá trình tìm tin là mt quá trình l p đi l p l i, trong đĩ bi u th c tìm tin đưc tinh l c t t da trên k t qu tìm c a nh ng cu c tìm tr ưc đĩ. Trong khi đĩ, ph n l n OPAC v n đưc thi t k vi gi đnh là ngay t đu quá trình tìm tin ng ưi s dng cĩ th xác đnh m t bi u th c tìm chính xác và s tìm đưc các k t qu th a mãn yêu c u tin ngay trong m t cu c tìm. 3. Giao di n s dng ca OPAC các th h đu tiên khơng thân thi n và khơng cĩ nhi u l a ch n cho ng ưi s dng. ð to điu ki n thu n l i cho ng ưi s dng, các th ư vi n c ũng nh ư các nhà cung cp ph n m m đã áp d ng các gi i pháp hồn thi n OPAC nh ư sau: - ði v i CSDL c a th ư vi n: các th ư vi n th ưng xuyên c p nh t các bi u ghi trong CSDL; xem xét t n s xu t hi n c a các đ mc ch đ trong m c l c ca th ư vi n (m t đ mc ch đ liên k t v i m t s quá ít ho c quá nhi u bi u ghi th ư mc s ít cĩ giá tr đi v i ng ưi s dng th ư vi n) - Tăng c ưng h tr ng ưi s dng: b sung các tính n ăng hưng d n và h tr ng ưi s dng trong vi c tìm tin và xem k t qu tìm. ð OPAC thân thi n v i ng ưi s dng, vi c thi t k OPAC ph i đm b o các nguyên t c:  Các tính n ăng đnh v: các thơng báo đnh v ph i đưc hi n th th ưng xuyên đ ng ưi s dng bi t mình đang đâu, cĩ th đi ti p đn đâu;  T vng quen thu c v i ng ưi s dng: khơng s dng các t lĩng ho c mã s;  Các thơng báo h th ng ph i rõ ràng và trung l p;  Các h ưng d n h tr ph i cĩ sn trên t ng màn hình  Hồn thi n k thu t tìm tin: cung c p các l a ch n cho phép tìm l n l ưt theo t ng b ưc; h tr các l a ch n t vng trong quá trình tìm tin; b sung các tính n ăng tìm v ăn b n theo tr ng s (text weighting) và m rng bi u th c tìm d a trên thơng tin ph n h i v mc đ thích h p c a k t qu tìm. V i h th ng này, ng ưi s dng đưc đ ngh xác đnh các bi u ghi tìm đưc thích h p nh t, sau đĩ h th ng s lp l i bi u th c và tìm l i l n na. 6.4.3. Các th h OPAC 6.4.3.1. Th h OPAC th nh t Th h OPAC đu tiên xu t hi n đu nh ng n ăm 1980. V cơ bn, các OPAC này bao g m thơng tin th ư mc và các đim truy c p t ươ ng t các m c l c phi u. Các OPAC th h đu tiên v n hành d a trên nguyên t c so kh p chính xác, khơng ch p nh n l i c a d li u nh p vào. 6.4.3.2. Th h OPAC th hai OPAC th h th hai cung c p các kh năng tìm t t h ơn d a trên k thu t tìm theo t khĩa và hu k t h p các t khĩa. Các OPAC này th ưng đưc điu hành bng mt 92
  35. ngơn ng lnh đơ n gi n. Kh năng l a ch n các đim truy c p đưc m rng bao g m tìm theo t khĩa trong nhan đ, đ mc ch đ, tên tác gi và các bi u th c tìm s dng các tốn t Bool. Các OPAC th h th hai th ưng cung c p ít nh t hai m c giao di n cho ng ưi s dng ( đơ n gi n dành cho ng ưi mi s dng và nâng cao dành cho ng ưi cĩ kinh nghi m). 6.4.3.3.Th h OPAC th ba OPAC th h th ba kh c ph c đưc m t s hn ch ca OPAC th h th hai nh ư thi u s tr giúp, thi u các cơng c ki m sốt t vng tích h p Các OPAC th h th ba k t h p các tính n ăng đc tr ưng bi các ti n ích c a web. OPAC th h th ba bt đu đưc bán nh ư mt ph n c a các h th ng th ư vi n tích hp m i vào cu i nh ng n ăm 1990. OPAC th h th ba khác các th h tr ưc hai ph ươ ng di n chính: giao di n ng ưi- máy c a OPAC và các kh năng tìm tin đưc cung c p. OPAC th h th ba cĩ giao di n đ ha cho ng ưi dùng trong mơi tr ưng Windows và cung c p mt giao di n ngơn ng t nhiên ch p nh n các bi u th c tìm vi ngơn ng thơng th ưng. Các kh năng tìm tin bao g m các k thu t tìm tin khơng s dng tốn t Bool, tìm m rng các bi u ghi b ng các đim truy c p b sung đưc ki m sốt và khơng ki m sốt (ví d nh ư tiêu đ ca các ch ươ ng trong các cu n sách) và s dng các thu t ng đưc ch n l c t các bi u ghi tìm đưc đ hồn thi n chi n lưc tìm. Các bi u ghi tìm đưc thích h p nh t s đưc hi n th tr ưc tiên và kèm theo h ưng d n tùy thu c vào ng cnh. OPAC th h th ba cĩ mt s tính n ăng m i quan tr ng, bao g m: - Kh năng v n hành liên k t: vi kh năng truy c p tr c ti p các CSDL khác ngồi CSDL th ư mc chính, OPAC v n hành nh ư mt c ng n i đn các ngu n nh ư các CD- ROM n i mng và các CSDL s n cĩ trên Internet, bao g m các OPAC khác; kh năng tìm nhi u CSDL đng th i; kh năng áp d ng Z39.50; - Thân thi n v i ng ưi s dng: nhi u l a ch n giao di n cho ng ưi s dng (ví d, giao di n cho ng ưi s dng là tr em); h ưng d n s dng tùy thu c vào ng cnh; h tr tài li u tham kh o tr c tuy n nh ư t đin và bách khoa tồn th ư; m rng bi u th c tìm - Ch c n ăng: kh năng s dng đa ph ươ ng ti n, kh năng tìm ki m tồn v ăn, tìm ki m m rng, h tr nhi u phơng ch khác nhau 6.4.3.4. WebOPAC (WebPAC) Ti n b quan tr ng nh t c a OPAC th h th ba là s phát tri n c a WebOPAC (WebPAC). Theo ODILIS, WebPAC là mt OPAC s dng giao di n ng ưi dùng đ ha (GUI-Graphical User Interface) cĩ th truy c p đưc qua World Wide Web. Trong khi m t s OPAC th h th hai cĩ th truy c p đưc qua Internet v i giao th c TELNET thì WebPAC cĩ kh năng cung c p giao di n t ươ ng t các cơng c tìm ki m d a trên web khác. WebPAC cĩ các tính n ăng quan tr ng nh ư sau:  Giao di n ng ưi dùng đ ha là s kt h p các c a s vi các menu kéo - th (pull-drop menu), các bi u t ưng và mt thi t b tr đ thao tác.  Các ch c n ăng thơng th ưng c a các OPAC truy n th ng nh ư lưu tr các CSDL th ư mc, đơi khi bao g m c CSDL tồn v ăn; cho phép truy c p tr c ti p đn CSDL th ư mc c a m t th ư vi n qua thi t b đu cu i ho c máy 93