Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.26 MB, 63 trang )
16
Khổ mẫu phân loại – CDF: đƣợc thiết kế phản ánh thông tin về các số phân loại
và các định danh liên quan đƣợc tạo lập theo một khung phân loại chuẩn.
Khổ mẫu lƣ trữ dự liệu – HDF đƣợc thiết kế nhằm:
- Nhận dạng các yếu tố dữ liệu trong các thông báo về tƣ liệu của từng thƣ
viện
- Giao diện với các hệ thống điều khiển tự động nhƣ: mục lục liên hợp và
mƣợn liên thƣ viện, nập các xuất bản phảm nhiều kỳ (bổ sung)
- Dùng cho các chuyên gia thông tin – thƣ viện tham gia tạo lập và duy trì
thông tin về vốn tƣ liệu theo MARC21.
Khổ mẫu cộng đồng – CMDF: đƣợc thiết kế để mang các yếu tố mô tả các loại
nguồn lực không phải là thƣ mục. Nó ra đời nhằm đáp ứng nhu cầu thông tin của
cộng đồng.
Cấu trúc bản ghi Biên mục MARC21
Cấu trúc của một biểughi biênmục MARC21 [1, 3] gồm ba phần:
- Đầu biểu (LEADER): là một trƣờng dữ liệu đặc biệt có độ dài cố định 24
ký tự chứa các thông tin về quá trình xử lý bản ghi.
- Thƣ mục (DIRECTORY): là phần tiếp sau ngay đầu biểu, là một loạt
nhóm dữ liệu chỉ dẫn về các trƣờng dữ liệu có trong bản ghi.
- Các trƣờng dữ liệu:là những trƣờng của bản ghi chứa các dữ liệu mô tả.
Các trƣờng dữ liệu có thể có độ dài thay đổi (Variable Fields) hoặc độ dài
cố định (Fixed – Length Fields).
Bên trong vùng các trƣờng dữ liệu, mỗi trƣờng dữ liệu có hai loại mà xác định
nội dung là: Chỉ thị (gồm hai ký tự, nếu có) và dấu phân cách trƣờng con (gốm
hai ký tự). Giữa các trƣờng sẽ có mã kết thúc trƣờng. Cuối mỗi bản ghi có mã
kết thúc bản ghi.
Các trƣờng dữ liệu chia thành các khối sau đây:
00X. Khối trƣờng điều khiển (số và mã)
1XX. Khối trƣờng tiêu đề chính
2XX. Khối trƣờng nhan đề và thông tin liên quan đến nhan đề
3XX. Khối trƣờng mô tả đặc trƣng vật lý.
4XX. Khối trƣờng tùng thƣ.
5XX. Khối trƣờng tùng phụ chủ
6XX. Khối trƣờng điểm truy cập chủ đề
7XX. Khối trƣờng tiêu đề bổ sung
8XX. Khối trƣờng liên quan đến vốn tài liệu, nơi và vị trí lƣu giữ
9XX. Khối trƣờng cục bộ
Một số thuật ngữ trong MARC
Chỉ thị
Chỉ thị trƣờng là hai ký tự đầu tiên của mỗi trƣờng dữ liệu và đứng trƣớc dấu
phân cách trƣờng con. Mỗi chỉ thị có giá trị là một số con số hoặc một dấu trống
(#) khi không đƣợc xác định. Mỗi trƣờng có hai chỉ thị.
16
17
Trƣờng con
Trƣờng con xác định từng yếu tố dữ liệu riêng biệt của trƣờng dữ liệu. Mỗi
trƣờng có ít nhất một trƣờng con ký hiệu phân cách trƣờng con gồm hai ký tự:
dấu phân chác ($) và mã trƣờng con (a, b, c…1, 2, 3…)
Dữ liệu của các trƣờng
Dữ liệu của các trƣờng tuân thủ các chuẩn mô tả (ISBD) hoặc (AACR2)
Mã kết thúc trƣờng
Mã này sẽ đƣợc thiết lập ngầm định nhắm thông báo cho máy tính biết dấu hiện
kết thúc của các trƣờng trong bản ghi MARC.
2.1.2 Siêu dữ liệu:
Thuật ngữ :”siêu dữ liệu” đƣợc các chuyên gia công nghệ thông tin, thông
tin – thƣ viện của Việt Nam dịch thuật ngữ tiếng Anh “METADATA” [1, 2].
Siêu dữ liệu có thể định nghĩa đơn giản là dữ liệu về dữ liệu. Theo tiến sỹ
Warwick Carthri [Cathro, 1999], “siêu dữ liệu là những thành phần mô tả tài
nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tài nguyên thông tin”. Trong
tài liệu hƣớng dẫn số hoá tài liệu Moving theory into practice: digital imaging
tutorial [Kenney, 2001] , siêu dữ liệu đƣợc xác định là “ dữ liệu mô tả các thuộc
tính của đối tƣợng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh
và tổ chức. Siêu dữ liệu còn có thể đƣợc định nghĩa là dữ liệu có cấu trúc về dữ
liệu”. Gail Hodge định nghĩa siêu dữ liệu là “ thông tin có cấu trúc mà nó mô tả,
giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiểm, sử dụng và quản
lý hơn. Siêu dữ liệu đƣợc hiểu là dữ liệu về dữ liệu hoặc thông tin mô tả tài
nguyên thông tin.
Mục đích của siêu dữ liệu:
- Mục đích đầu tiên và cốt yếu nhất của siêu dữ liệu là góp phần mô tả và
tìm lại các tài liệu nguyên điện tử.
- Hỗ trợ cho việc sử dụng hiệu quả tài nguyên. Một khi tài nguyên đƣợc tìm
trong môi trƣờng điện tử, siêu dữ liệu cung cấp cho ngƣời sử dụng những
thông tin về kỹ thuật, về khuôn khổ kinh doanh (bản quyền, quyền truy
cập,…)
- Đảm bảo sự liên tác (interoperability) giữa các hệ thống. Những sơ đồ
siêu dữ liệu đƣợc thống nhất sẽ giúp cho các hệ thống có thể nhận dạng
đúng các yếu tố, có thể chuyển đổi dữ liệu dễ dàng, đảm bảo hoạt động
trên mạng hiệu quả hơn.
Một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và đƣợc nhiều ngƣời biết
đến là Yếu tố siêu dữ liệu cốt lõi Dublin Core (Dublin Core Metadata Ele mnet
Inuttiative). Tại cuộc Hội thảo về siêu dữ liệu do Trung tâm Thƣ viện máy tính
hoá OCLC ( Ohio Cumputer Libray Center) và Trung tâm Quốc gia về ứng dụng
siêu máy tính NCSA (National Center for Suppẻcomputing Application) phối
hợp tài trợ, tổ chức tại Dublin, Ohio, Mỹ, vào tháng 03/1995, các chuên gia đã
đè xuất bộ yếu tố siêu dữ liệu cốt lõi Dublin Core. Tập hợp yếu tố siêu dữ liệu
đƣợc gọi là “cốt lõi” (Core) vì nói đƣợc thiết kế đơn giản và chỉ bao quát 15 yếu
tố cốt lõi nhất (trong MARC21 có hơn 200 trƣờng và rất nhiều trƣờng con). Do
17
18
đƣợc đề xuất tại Hội thảo tổ chức tại Dunlin nên có tiền tố Dublin. Bộ yếu tố
siêu dữ liệu Dublin Core thƣờng đƣợc gọi tắt là Dublin Core. Tháng 06/2000,
Dublin Core đƣợc Uỷ ban châu Âu về tiêu chuẩn hoá/ Hệ thống tiêu chuẩn hoá
cho xã hội thông tin (CEN/ISSS – European Committee for Standarization /
Information Sociecty Standard System) [1,5] coi là tiêu chuẩn. Tháng 09/2001,
Dublin Core đƣợc ban hành thành tiêu chuẩn quốc gia Mỹ, gọi là tiêu chuẩn
“The Dublin Core Metadata Element Set” ANSI/NISO Z39.85-2001.
Khổ mẫu tiêu chuẩn siêu dữ liệu Dublin Core là tập hợp các yếu tố đơn giản
nhƣng hữu hiệu trong công việc mô tả một loạt nguồn tin trên mạng. DC gồm 15
yếu tố, mà ngữ nghĩa đƣợc xác lập của nhiều chuyên gia. Các yếu tố mô tả trong
DC đều không bắt buộc và có thể lặp, ngoài ra còn có một số lƣợng hạn chế các
từ hạn định và định ngữ có thể sử dụng để tiếp tục tinh chỉnh ý nghĩa các yếu tố.
Các yêu tố mô tả: 15 yếu tố
- Nhan đề: tên của tài liệu đƣợc đặt bởi tác giả hoặc nhà xuất bản.
- Tác giả (ngƣời sáng tác): cá nhân hoặc tổ chức sáng tạo ra nguồn thông
tin. Ví dụ: nhà văn, hoạ sỹ, nhà nhiếp ảnh, ngƣời minh hoạ.
- Chủ đề và từ khoá: là chủ đề của nguồn tin, điển hình, chủ đề có thể đƣợc
hiểu tƣơng đƣơng nhƣ từ khoá nhằm mô tả về một chủ đề hoặc một nội
dung của nguòn thông tin. Ngƣời ta rất khuyến khích việc sử dụng các
quyến từ vựng có kiểm soát và các khung phân loại.
- Mô tả: miêu tả nguyên văn về nội dung của nguồn thông tin, có thể bao
gồm cả tóm tắt trong trƣờng hợp tài liệu thành văn hoạc mô tả nội dung
trong trƣờng hợp không xác định rõ.
- Nhà xuất bản: một thực thể chịu trách nhiệm về việc xây dựng nên hình
thức của tài liệu. Ví dụ: nhà xuất bản, một khoa trong trƣờng đại học,
hoặc một tổ chức.
- Những ngƣời cộng tác: là cá nhân hoặc một tổ chức trên danh nghĩa cùng
một ngƣời đóng góp trong việc xây dựng nguồn thông tin, tuy nhiên đối
với những cá nhân hoặc tổ chức xây dựng nên nguồn tin thì họ chỉ đóng
vai trò phụ, thứ yếu. Ví dụ: ngƣời biên tập, ngƣời dịch, ngƣời hiệu đính…
- Thời gian xuất bản: thời gian xuất bản nguồn tin , đƣợc diễn tả theo cấu
trúc Năm/Tháng/Ngày/ Ví dụ: 1994-11-05
- Loại dữ liệu: kiểu mô tả cho nguồn thông tin, ví dụ: trang chủ, bài thơ,
quyển sách, báo cáo kỹ thuật, bài luận, từ điển, nhằm mục đích quốc tế
hoá, kiểu mô tả nên nguồn tin nến lấy trong danh sách đã đƣợc xây dựng.
- Khổ mẫu (định dạng): kiểu của dữ liệu tuỳ thuộc vào tài liệu, ví dụ: khối
lƣợng và thời gian của những nguồn thông tin. Kiểu dữ liệu đƣợc dùng để
mô tả cho nguồn thông tin, nhằm mục đích quốc tê hoá. Định dạng nguồn
tin nên chọn trong danh sách mới nhất do tổ chức quốc tế xây dựng.
- Yếu tố nhận dạng: mã nhận dạng là một từ hoặc con số đƣợc sử dụng để
nhận dạng nguồn thông tin. Ví dụ: các nguồn thông tin trên mạng bao
gồm cả URL và UNs. Có một số mã nhận dạng duy nhất nhƣ: ISBN, chỉ
18
19
-
-
số sách theo tiêu chuẩn quốc tế, hoặc một số tên tƣơng tự khác cũng có
thể đại diện cho yếu tố này.
Nguồn: những thông tin nguồn dữ liệu
Ngôn ngữ: Ngôn ngữ của nội dung thông tin.
Quan hệ: là một yêu tố nhận dạng về nguồn thông tin thứ hai có liên quan
đến nguồn thông tin hiện thời. Yếu tố này đƣợc sử dụng để mô tả cho mối
quan hệ của các nguồn thông tin, nhằm mục đích quốc tế hoá.
Phạm vi (mức độ bao phủ): không gian và thời gian tạo ra tài liệu
Bản quyền: sự xác định về quyền hạn của ngƣời quản lý nguồn thông tin.
Chia nhóm trong DC:
1- Các đối tƣợng về nội dung thông tin
o Nhan đề
o Chủ đề (từ khóa)
o Mô tả
o Nguồn
o Ngôn ngữ
o Quan hệ
o Phạm vi (mức độ bao phủ)
2- Các đối tƣợng liên quan đến sở hữu trí tuệ
o Tác giả (ngƣời sáng tác)
o Nhà xuất bản
o Nhà phân phối, cộng tác
o Quản lý bản quyền
3- Các đối tƣợng cá biệt
o Thời gian xuất bản
o Loại dữ liệu
o Khổ mẫu (định dạng)
o Yếu tố nhận dạng
Các từ chuẩn giới hạn của Dublin Core [1, 4]
- Lọc yếu tố mô tả: làm cho nghĩa của một yếu tố mô tả hẹp hơn hoặc cụ
thể hơn.
- Khung mã hoá: nhận diện các quy tắc trợ giúp diễn giải giá tị của một yếu
tố mô tả nào đó, bao gồm các từ vựng kiểm soát và các ký hiệu hình thức
hay các quy tắc cú pháp.
- Từ vựng cho các yếu tố mô tả: bộ sƣu tập; bộ dữ liệu; sự kiện; hình ảnh;
các nguồn dữ liệu có tƣơng tác; dịch vụ; phần mềm; âm thanh; văn bản.
Công cụ và phần mềm Dublin Core:
Công cụ:
- Các tiện ích
o Tạo siêu dữ liệu theo mẫu
o Công cụ tạo/ thay đổi mẫu
o Tự động trích dẫn/ tập hợ lại siêu dữ liệu
o Tự động tạo siêu dữ liệu
19
20
o
o
o
o
o
Chuyển đổi giữa các khổ mẫu siêu dữ liệu
Tự động tạo siêu dữ liệu
Chuyển đổi giữa các khổ mẫu siêu dữ liệu
Các môi trƣờng (công cụ) tích hợp
Các phần mềm thƣơng mại sẵn có.
Hƣớng dẫn sử dụng Duble Core:
- Hƣớng dẫn sử dụng cho những ngƣời không phải là chuyên gia về tạo
bản ghi mô tả Dublin Core.
- Cho các chuyên gia tham khảo về Dublin Core
- Giới thiệu và diễn giải về Dublin Core
Đặc điểm Dublin Core
- Tạo lập và duy trì bản ghi một cách dễ dàng.
- Ngữ nghĩa dễ hiểu
- Phạm vị sử dụng quốc tế rộng lớn với các phiên bản đa ngôn ngữ.
- Khả năng mở rộng các yếu tố thuận tiện
2.1.3 Ngôn ngữ đánh giá mở rộng XML
XML (eXtennsible Markup Language) là ngôn ngữ đánh dấu mở rộng có nguồn
gốc từ ngôn ngữ định dạng siêu văn bản HTML (Hyper Text Markup
Language), cả hai ngôn ngữ này đều bắt nguồn từ chuẩn ngôn ngữ định dạng
văn bản tổng quát có cấu trúc SGML (Structured General Markup Language).
XML là ngôn ngữ đƣợc định nghĩa bởi tổ chức mạng toàn cầu (Word Wide Web
Consortium), thƣờng đƣợc viết tắt theo cách chơi chữ là W3G. Đây là tổ chức
quốc tế định ra các chuẩn web và internet.
Cấu trúc XML
Một văn bản XML hình thành từ các thẻ (tag) với tên gọi phần tử (element).
Khác với ngôn ngữ HTML, số lƣợng và tên gọi trong XML là không hạn chế.
XML là ngôn ngữ tổng quát dụng định nghĩa dữ liệu thông qua các thẻ. Trong
HTML các thể đƣợc định nghĩa và quy định trƣớc [27]. Trong khi đó, với XML
ta có thể tuỳ ý định nghĩa mọi thẻ. Nhƣ vậy có thể coi XML nhƣ tập cha của
ngôn ngữ HTML. Dựa vào một số quy tắc, XML tự tồn tại và phát triển tự thân
thành các ngôn ngữ định nghĩa khác.
Điểm quan trọng nhất là XML cho phép dễ dàng xử lý, chuyển tải và trao đổi dữ
liệu giữa rất nhiều ứng dụng và tài liệu ngƣời dùng với các định dạng khác nhau.
Nếu đã quen với máy tính, hẳn ta biết rằng có rất nhiều định dạng tệp khác nhau.
Việc chuyển đổi dự liệu giữa chúng quả là nan giải mặc dù có không ít trình ứng
dụng hỗ trợ. Ví dụ nhƣ tệp .DOC, .XLS, .DBF, .MDB (lập trình Access), .TXT
(tệp văn bản), .RTF(Rich Text Format) và mới đây là .HTML. Chỉ riêng các tệp
văn bản thôi đã gặp rất nhiều khó khăn, nếu bận nhận đƣợc một tệp Word 2000
20
21
mà máy tính của bạn dùng Word 7.0, cố gắng lắm cũng chỉ đọc đƣợc phần văn
bản có các nội dung khác thƣờng bị biến dạng.
Trong XML, dữ liệu và định dạng đƣợc lƣu ở dạng văn bản và có thể dễ dàng
cấu hình cũng nhƣ thay đổi chúng bằng các trình soạn thảo thông thƣờng nếu
không có trong tay trình soạn thảo XML chuyên nghiệp. Dữ liệu và các thẻ
trong XML không mã hoá, không đòi hỏi bản quyền.
Tháng 12/1997, phiên bản đầu tiên XML 1.0 (Extensible Markup Language –
Ngôn ngữ đánh dấu mở rộng) ra đoìƣ và là chuẩn đơn giản của SGML. Từ đó,
nhiều công ty phần mềm đã chạy ứng dụng dựa trên XML đã ra đời. Điển hình
một số tuỳ biến ngôn ngữ định dạng dựa trên XML cho thấy sức mạnh của
XML:
- BITS – Banking Industry Technology Secretariat: ngôn ngữ văn
phòng về kỹ thuật nghiệp vụ ngân hàng.
- IFX – Financial Exchange: trao đổi dữ liệu tài chính.
- BIPS – Banking Internet Payment System: hệ thống thanh toán qua
internet của nghiệp vụ ngân hàng.
- TIM – Telecommunicaton Interchange Markup: định dạng trao đổi
viễn thông.
- EbXML – XML: kinh doanh điện tử
- PDML – Product Data Markup Language: ngôn ngữ định dạng dữ
liệu sản phẩm.
- FIX – Financial Information eXchange Protocol: giao thức trao đổi
thông tin tài chính.
- CML – Chemical Markup Language: ngôn ngữ định dạng trong
lĩnh vực hoá học, cho phép biểu diễn các công thức hoá học, cho
phép biểu diễn các công thức hoá học, hoá trị phân tử ở dạng đồ
hoạ.
Ƣu điểm của XML:
- Có thể tạo bản ghi thƣ mục một lần và xuất bản chúng theo các
dạng khác nhau.
- Hiển thị bản ghi thƣ mục trực tiếp trên trình duyết Web, search
engines (công cụ tìm kiếm) và các hệ thống thƣ viện tiềm năng
khác mà không cần chuyển đổi.
- Bản ghi thƣ mục có thể đƣợc chuyển đổi qua lại giữa XML và
MARC mà không bị tổn thất.
- Nhiều vấn đề tồn tại trong định dạng MARC đƣợc khắc phục, ví dụ
nhƣ việc kiểm soát tiêu chuẩn.
- Năm 1995, thƣ viện Quốc hội Mỹ bắt đầu nghiên cứu tính khả thi
của việc dùng SGML (Standard Generalized Markup Language Chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc) để mã
hoá định dạng MARC21. Sau đó, phiên bản MARC DTDs
(Document Type Definitions) định nghĩa laọi văn bản MARC để
21
22
định nghĩa dữ liệu MARC21 trong dạng thức SGML đƣợc phát
hành năm 1998. Cùng năm này, Thƣ viện Quốc hội Mỹ công bố
phần mềm chuyển đổi giữa MARC21 và SGML.
2.1.4 Khổ mẫu MARCXML
Khổ mẫu MARC21 đã đƣợc biết đến rộng rãi trên thế giới nhƣ một khổ
mẫu cho dữ liệu thƣ mục. MARC21 đƣợc ứng dụng rộng rãi trong việc xây
dựng các mục lục sách truy cập trực tuyến và trao đổi dữ liệu thƣ mục giữa các
thƣ viện. Xét về khía cạnh lý luận, MARC21 đƣợc coi là một khổ mẫu siêu dữ
liệu, nhƣng là siêu dữ liệu truyền thống. Với sự phát triển của những ứng dụng
XML, nhu cầu về khổ mẫu MARC21 trong môi trƣờng XML trở nên cấp bách
và đƣợc quan tâm.
Từ năm 1995, Thƣ viện Quốc hội Mỹ, đã có đề án phát triển MARC DTD.
MARC DTD có thể đƣợc dịch tạm là Định nghĩa phần tử tài liệu theo MARC.
Thuật ngữ “MARC DTD” đƣợc tạo ra từ cụm tiếng Anh Machine Readable
Cataloging Document Type Definition, đề cập đến việc ứng dụng ngôn ngữ
đánh dấu tổng quát chuẩn, viết tắt là SGML (Standard Generalized Markup
Language). SGML là một ký thuật trình bày tài liệu ở dạng máy tính đọc đƣợc,
đƣợc xây dựng thành tiêu chuẩn quốc tế ISO 8879 (Xử lý thông tin - Hệ thống
văn phòng và văn bản – Ngôn ngữ đánh dấu tổng quát chuẩn). SGML đƣợc phát
hiện để đáp ứng nhu cầu về chuẩn không độc quyền cho đánh dấu văn bản mà
dữ liệu máy tính có thể đọc đƣợc, có thể trao đổi giữa các môi trƣờng mã hoá
không giống nhau. SGML đƣợc sử dụng rộng rãi trong xuất bản nơi các tài liệu
đƣợc tạo ra bằng cách sử dụng những hệ thống máy tính khác nhau. SGML hỗ
trợ việc xác định tập hợp các yếu tố mô tả tài liệu.
Mục đích đầu tiên của dự án MARC DTD là tạo ra một DTD theo SGML chuẩn
để hỗ trợ việc chuyển đổi dữ liệu theo cấu trúc MARC sang dữ liệu theo cấu trúc
SGLM (và ngƣợc lại). Dữ liệu theo cấu trúc MARC là ứng dụng của các tiêu
chuẩn quốc tế về trao đổi thông tin ISO 2709 đã đƣợc thông qua từ hàng chục
năm trƣớc đây. Để việc chuyển đổi này đƣợc chuẩn hoá, cần thiết phải có DTD
chuẩn.
MARC DTD xử lý mỗi bản ghi thƣ mục nhƣ một tài liệu điện tử. Nó xác định
(định nghĩa) mọi yếu tố có thể trong bản ghi MARC theo một quy định riêng.
MARC XML DTD
Với sự phát triển của các ứng dụng ngôn ngữ XML trong tạo lập tài liệu điện tử,
Thƣ viện Quốc hội Mỹ đã phát triển MARC XML DTD. Phƣơng án này đƣợc
coi là hiệu quả hơn phƣơng án đầu tiên gọi là Lƣợc đồ MARCXML
(MARCXML Schema). MARC XML DTD đã xác định mỗi yếu tố theo XML.
Việc này tạo ra một bộ DTD rất lớn, khá phức tạp.
22
23
Về nguyên tắc, các yếu tố dữ liệu trong SGML đƣợc quy định bằng những cặp
thẻ. Để áp dụng cho dữ liệu theo MARC, mọi thẻ quy định yếu tố dữ liệu trong
SGML đề sử dụng tiền tố “mrc” (có lẽ là viết tắt từ chữ MARC để thể hiện sự
liên quan đến MARC). Điều này để đảm bảo không có sự trung lặp với những
DTD có thể sử dụng một số yếu tố MARC trong tạo lập tài liệu điện tử (thí dụ
nhƣ trong trƣờng hợp cho tài liệu theo kiêu TEL)
Mọi dữ liệu liên quan đến dữ liệu mô tả thƣ mục đề sử dụng tiền tố “mrcb”. Mọi
yếu tố trong nhóm DTD về kiểm soát tính nhất quán (MARC Authority DTD
group, bao gồm authority and classification records) bắt dầu bằng tiền tố
“mrca”.
Để làm cho DTD thể hiện đƣợc tính chất MARC, các trƣờng dữ liệu (yếu tố)
đƣợc thể hiện bằng số của nhãn trƣờng trong MARC và đi kèm với tiền tố Tiêu
đề tác giả, tƣơng ứng với trƣơng 100 của mARC; “mrc245” cho dữ liệu thuộc
trƣờng 245 của MARC. Có ngƣời cho rằng việc dùng có số là không thuận tiện
vì khó nhớ. Tuy nhiên, ngƣời ta cho rằng các chuyên gia làm việc lâu năm với
MARC đã quen thuộc với nhãn trƣờng ba chữ số MARC, do đó vấn đề này
không phải là điều phức tạp. Hơn nữa việc sử dụng con số tránh việc phải sử
dụng các từ làm thẻ nhãn trƣờng (thí dụ với tiếng Trung Quốc,…)
Hầu hết các nhãn trƣờng theo MARC đều có trƣờng con. Trong MARC DTD
ngƣời ta cũng sử dụng một mã ký tự làm thẻ cho trƣờng con. Trƣờng con sẽ
đƣợc gán cùng với thẻ nhãn trƣờng bằng dấu gạch ngang. Ví dự: mrcb245-a,
mrcb245-b, mrcb245-6.
Trong các bản ghi MARC, ngoài nhãn trƣờng, trƣờng con có chỉ thị. Để chỉ dẫn
rằng đây là dữ liệu liên quan đến chỉ thị, ngƣời ta đã đề xuất sử dụng các định
danh “i1” và “i2” chi chỉ thị 1 và chỉ thị 2.
Một số đặc trƣng khác của dữ liệu MARC là sự có mặt của một số trƣờng có độ
dài cố định, trong đó mỗi vị trí đều đƣợc quy định cụ thể loại dữ liệu. Thí dụ
những trƣờng này là trƣờng 006-008. Cú pháp đối với các trƣờng này sẽ nhƣ
sau:
Tiền tố chỉ thị nhãn trƣờng “mrcb” hoặc “mrca”;
Ba chữ chỉ thị nhãn trƣờng;
Mã dữ liệu và dấu gạch ngang;
Định danh số chỉ thị vị trí của dữ liệu theo MARC
Thí dụ: mrcb008-BK-22
Đối với phần đầu bản ghi, ngƣời ta đề nghị sử dụng tiền tố, mã dữ liệu và vị trí
của mã để làm thẻ meta. Quy định cụ thể nhƣ sau:
Tiền tố phần dầu biểu “mrcaldr” hoặc mrcbldr”;
Mã dữ liệu theo MARC, dấu gạch ngang;
Số định danh thông báo vị trí đối với mã dữ liệu
Thí dụ: mrcbldr-bd-05
23
24
Marc XML:
Metadata Object Description Schema – MODS
Nhóm nghiên cứu của Thƣ viện Quốc hội Mỹ dã phát triển một khuon khổ cho
thao tác với dữ liệu theo khổ mẫu MARC trong môi trƣờng XML. Trên cơ sở
những nghiên cứu về MARC – DTD, Thƣ viện quốc hội Mỹ cùng các nhóm
chuyên gia dã phát triển Sơ đồ mô tả đối tƣợng siêu dữ liệu – MODS ( viết tắt từ
tiếng Anh Metadata Object Description Schema). Mục đích của MODS là tạo
khổ mẫu để mang dữ liệu từ bản ghi MARC21 cũng nhƣ cho phép tạo bản ghi
môt tả của tài liệu điện tử nagy từ đầu theo SGML [1, 3].
2.2 Chuẩn trao đổi dữ liệu
Ngày nay, sự phát triển vƣợt bậc của công nghệ thông tin và viễn thông đã và
đang tạo ra nhiều cơ hội song cũng ít thách thức cho hoạt động thông tin – thƣ
viện. Ngay từ khi còn hoạt động trong môi trƣờng truyền thống, thực tế đã cho
thấy: Vốn tài liệu của cơ quan thông tin – thƣ viện không thể dáp ứng đƣợc hết
các nhu cầu của ngƣời dùng tin. Trong môi trƣờng hiện đại, ngƣời dùng tin chìm
ngập trong biển thông tin nhƣng lại rất khó khăn trong việc tìm kiếm đâu là
thông tin chất lƣợng, có giá trị, phù hợp với nhu cầu…Vì vây, hệ thống các cơ
quan thông tin – thƣ viện cần phải liên kết để khắc phục tình trạng phân tán về
nguồn thông tin. Đáp ứng nhu cầu thông tin ngày càng cao của ngƣời dùng tin.
Các cơ quan thông tin – thƣ viện không đáp ứng một cách nhanh chóng mà còn
đầy đủ về nội dung và hình thức tài liệu cho ngƣời dùng tin. Chính vì vậy cần có
sự trao đổi, hợp tác liên thông giữa các cơ quan thông tin – thƣ viện. Sử dụng lại
các bản ghi biên mục chuẩn, tiết kiệm thời gian, công sức, sự trùng lặp và kinh
phí xử lý tài liệu. Tuy nhiên, hiện nay, các cơ quan thông tin – thƣ viện chƣa có
sự liên thông, trao đổi thông tin/tài liệu.
Nguyên nhân chƣa có sự liên thông trao đổi
- Các quy tắc mô tả chƣa thống nhất.
- Công cụ sử dụng chƣa đáp ứng đƣợc nhu cầu trao đổi.
- Nền tảng về tiềm lực công nghệ thông tin chƣa có.
24
25
Hình 2. Chuẩn trao đổi dữ liệu [31]
Nội dung cần thống nhất liên thông
Thống nhất về quy tắc mô tả tài liệu: sử dụng MARC21
Thống nhất về định dạng chủ đề và phân loại tài liệu
Thống nhất về định chủ đề và phân loại tài liệu.
Thống nhất trong việc sử dụng phần mềm và các chuẩn công nghệ thông
tin.
Nội dung trao đổi
Trao đổi bản ghi biên mục
Thông qua tệp: ISO2709
MARC
Thông qua Z39.50
Trao đổi tài liệu
Tài liệu số
Các yếu tố và vấn đề liên quan đến liên thông chia sẻ nguồn lực thông tin
Hạ tầng công nghệ thông tin
Phần mềm
Tuân theo các chuẩn trong thƣ viện và các chuẩn công nghệ thông tin
Yếu tố con ngƣời: các nhà lãnh đạo, quản lý và các cán bộ thực thi
Có thể dẫn chứng ra mô hình liên thông Thƣ viện quốc gia và các tỉnh thành đã
triển khai trong nhiều năm qua.
Mục đích trao đổi thông tin
Nhập dữ liệu từ thƣ viện Tỉnh/Thành phố lên thƣ viện Quốc gia.
Thƣ viện Tỉnh/Thành phố truy cập, khai thác thông tin thƣ mục của Thƣ
viện Quốc gia.
Lƣu chiểu tài liệu điện tử.
25
26
Đảm bảo tính thống nhất và phát triển hệ thống.
Trao đổi liên thƣ viện.
Thực hiện quá trình trao đổi thông tin:
Các thƣ viện tỉnh xuất các bản ghi thƣ mục cần chuyển lên Thƣ viện quốc
gia ra tệp ISO 2790, hoặc dƣới dạng XML, hoặc dƣới dạng xuất nhập của
Ilib.
Thƣ viện tỉnh gửi tệp này lên cho Thƣ viện quốc gia thông qua mạng
WAN.
Thƣ viện Quốc gia kiểm tra lại tệp đã nhận và nhập chúng vào Cơ sở dữ
liệu thông qua Module Nhập/Xuất dữ liệu.
Các thƣ viện truy cập vào Web của Thƣ viện Quốc gia để khai thác thông
tin thƣ mục tại Thƣ viện Quốc gia trên các giao diện thân thiện với ngƣời
dùng tin.
Các thƣ viện tỉnh cũng có thể thực hiện tra cứu trên cơ sở dữ liệu của các
cơ quan thông tin – thƣ viện khác (trong nƣớc hoặc quốc tế) thông qua
giao thức Z39.50 tại chính thƣ viện mình hoặc nối vào trang Web của Thƣ
viện Quốc gia và quốc tế khác (Ví dụ nhƣ: tra cứu tại các cơ quan thông
tin – thƣ viện các trƣờng đại học trong nƣớc hay tra cứu vào thƣ viện
Quốc hội Mỹ,…) nhằm làm phong phú nguồn dữ liệu cho thƣ viện mình,
phục vụ ngƣời dùng tin ngày một tốt hơn.
Các thƣ viện tỉnh có thể sao các bản ghi từ cơ sơ dữ liệu của Thƣ viện
Quốc gia bằng cách sử dụng Module Nhập/Xuất dữ liệu.
2.3 Chuẩn tra cứu liên thƣ viện Z39.50
Z39.50 là một chuẩn tìm kiếm và khai thác thông tin giữa các cơ quan
thông tin – thƣ viện.
Ban đầu Z39.50 là một chuẩn quốc gia của Mỹ về khai thác thông tin. Tuy nhiên
hiện nay, Z39.50 đƣợc cả thế giới công nhận nhƣ là một chuẩn chung về khai
thác thông tin thay cho chuẩn tìm kiếm và khai thác thông tin. Là một chuẩn ứng
dụng mạng, vì vậy Z39.50 là một chuẩn mở nên nó cho phép trao đổi thông tin
giữa các hệ thống chạy trên phần mềm và các phần cứng khác.
Z39.50 đƣợc phát triển nhằm khắc phục những vấn đề liên quan đến việc tìm
kiếm trong cơ sở dữ liệu ví dụ nhƣ phải biết hệ thống menu, ngôn ngữ tìm
tin,…của mỗi hệ thống khác nhau. Z39.50 làm cho đơn giản hoá quá trình tìm
kiếm bằng việc sử dụng giao diện tìm kiếm quen thuộc của hệ thống đó để tìm
kiếm vốn tài liệu ở chính cơ quan thông tin – thƣ viện đó cũng nhƣ ở các cơ
quan thông tin – thƣ viện mà ứng dụng chuẩn này.
Các chức năng tra cứu
Z39.50 server: cung cấp cho các thƣ viện khách Z39.50 khả năng tra cứu cơ sở
dữ liệu của cơ quan thông tin – thƣ viện.
Z39.50 client: cung cấp cho cơ quan thông tin – thƣ viện khả năng tra cứu cơ sở
dữ liệu của các cơ quan thông tin – thƣ viện khác qua Z39.50.
26