1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Công nghệ thông tin >

1 Chuẩn biên mục và siêu dữ liệu:

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.26 MB, 63 trang )


16



Khổ mẫu phân loại – CDF: đƣợc thiết kế phản ánh thông tin về các số phân loại

và các định danh liên quan đƣợc tạo lập theo một khung phân loại chuẩn.

Khổ mẫu lƣ trữ dự liệu – HDF đƣợc thiết kế nhằm:

- Nhận dạng các yếu tố dữ liệu trong các thông báo về tƣ liệu của từng thƣ

viện

- Giao diện với các hệ thống điều khiển tự động nhƣ: mục lục liên hợp và

mƣợn liên thƣ viện, nập các xuất bản phảm nhiều kỳ (bổ sung)

- Dùng cho các chuyên gia thông tin – thƣ viện tham gia tạo lập và duy trì

thông tin về vốn tƣ liệu theo MARC21.

Khổ mẫu cộng đồng – CMDF: đƣợc thiết kế để mang các yếu tố mô tả các loại

nguồn lực không phải là thƣ mục. Nó ra đời nhằm đáp ứng nhu cầu thông tin của

cộng đồng.

Cấu trúc bản ghi Biên mục MARC21

Cấu trúc của một biểughi biênmục MARC21 [1, 3] gồm ba phần:

- Đầu biểu (LEADER): là một trƣờng dữ liệu đặc biệt có độ dài cố định 24

ký tự chứa các thông tin về quá trình xử lý bản ghi.

- Thƣ mục (DIRECTORY): là phần tiếp sau ngay đầu biểu, là một loạt

nhóm dữ liệu chỉ dẫn về các trƣờng dữ liệu có trong bản ghi.

- Các trƣờng dữ liệu:là những trƣờng của bản ghi chứa các dữ liệu mô tả.

Các trƣờng dữ liệu có thể có độ dài thay đổi (Variable Fields) hoặc độ dài

cố định (Fixed – Length Fields).

Bên trong vùng các trƣờng dữ liệu, mỗi trƣờng dữ liệu có hai loại mà xác định

nội dung là: Chỉ thị (gồm hai ký tự, nếu có) và dấu phân cách trƣờng con (gốm

hai ký tự). Giữa các trƣờng sẽ có mã kết thúc trƣờng. Cuối mỗi bản ghi có mã

kết thúc bản ghi.

Các trƣờng dữ liệu chia thành các khối sau đây:

00X. Khối trƣờng điều khiển (số và mã)

1XX. Khối trƣờng tiêu đề chính

2XX. Khối trƣờng nhan đề và thông tin liên quan đến nhan đề

3XX. Khối trƣờng mô tả đặc trƣng vật lý.

4XX. Khối trƣờng tùng thƣ.

5XX. Khối trƣờng tùng phụ chủ

6XX. Khối trƣờng điểm truy cập chủ đề

7XX. Khối trƣờng tiêu đề bổ sung

8XX. Khối trƣờng liên quan đến vốn tài liệu, nơi và vị trí lƣu giữ

9XX. Khối trƣờng cục bộ

Một số thuật ngữ trong MARC

Chỉ thị

Chỉ thị trƣờng là hai ký tự đầu tiên của mỗi trƣờng dữ liệu và đứng trƣớc dấu

phân cách trƣờng con. Mỗi chỉ thị có giá trị là một số con số hoặc một dấu trống

(#) khi không đƣợc xác định. Mỗi trƣờng có hai chỉ thị.

16



17



Trƣờng con

Trƣờng con xác định từng yếu tố dữ liệu riêng biệt của trƣờng dữ liệu. Mỗi

trƣờng có ít nhất một trƣờng con ký hiệu phân cách trƣờng con gồm hai ký tự:

dấu phân chác ($) và mã trƣờng con (a, b, c…1, 2, 3…)

Dữ liệu của các trƣờng

Dữ liệu của các trƣờng tuân thủ các chuẩn mô tả (ISBD) hoặc (AACR2)

Mã kết thúc trƣờng

Mã này sẽ đƣợc thiết lập ngầm định nhắm thông báo cho máy tính biết dấu hiện

kết thúc của các trƣờng trong bản ghi MARC.

2.1.2 Siêu dữ liệu:

Thuật ngữ :”siêu dữ liệu” đƣợc các chuyên gia công nghệ thông tin, thông

tin – thƣ viện của Việt Nam dịch thuật ngữ tiếng Anh “METADATA” [1, 2].

Siêu dữ liệu có thể định nghĩa đơn giản là dữ liệu về dữ liệu. Theo tiến sỹ

Warwick Carthri [Cathro, 1999], “siêu dữ liệu là những thành phần mô tả tài

nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tài nguyên thông tin”. Trong

tài liệu hƣớng dẫn số hoá tài liệu Moving theory into practice: digital imaging

tutorial [Kenney, 2001] , siêu dữ liệu đƣợc xác định là “ dữ liệu mô tả các thuộc

tính của đối tƣợng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh

và tổ chức. Siêu dữ liệu còn có thể đƣợc định nghĩa là dữ liệu có cấu trúc về dữ

liệu”. Gail Hodge định nghĩa siêu dữ liệu là “ thông tin có cấu trúc mà nó mô tả,

giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiểm, sử dụng và quản

lý hơn. Siêu dữ liệu đƣợc hiểu là dữ liệu về dữ liệu hoặc thông tin mô tả tài

nguyên thông tin.

Mục đích của siêu dữ liệu:

- Mục đích đầu tiên và cốt yếu nhất của siêu dữ liệu là góp phần mô tả và

tìm lại các tài liệu nguyên điện tử.

- Hỗ trợ cho việc sử dụng hiệu quả tài nguyên. Một khi tài nguyên đƣợc tìm

trong môi trƣờng điện tử, siêu dữ liệu cung cấp cho ngƣời sử dụng những

thông tin về kỹ thuật, về khuôn khổ kinh doanh (bản quyền, quyền truy

cập,…)

- Đảm bảo sự liên tác (interoperability) giữa các hệ thống. Những sơ đồ

siêu dữ liệu đƣợc thống nhất sẽ giúp cho các hệ thống có thể nhận dạng

đúng các yếu tố, có thể chuyển đổi dữ liệu dễ dàng, đảm bảo hoạt động

trên mạng hiệu quả hơn.

Một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và đƣợc nhiều ngƣời biết

đến là Yếu tố siêu dữ liệu cốt lõi Dublin Core (Dublin Core Metadata Ele mnet

Inuttiative). Tại cuộc Hội thảo về siêu dữ liệu do Trung tâm Thƣ viện máy tính

hoá OCLC ( Ohio Cumputer Libray Center) và Trung tâm Quốc gia về ứng dụng

siêu máy tính NCSA (National Center for Suppẻcomputing Application) phối

hợp tài trợ, tổ chức tại Dublin, Ohio, Mỹ, vào tháng 03/1995, các chuên gia đã

đè xuất bộ yếu tố siêu dữ liệu cốt lõi Dublin Core. Tập hợp yếu tố siêu dữ liệu

đƣợc gọi là “cốt lõi” (Core) vì nói đƣợc thiết kế đơn giản và chỉ bao quát 15 yếu

tố cốt lõi nhất (trong MARC21 có hơn 200 trƣờng và rất nhiều trƣờng con). Do

17



18



đƣợc đề xuất tại Hội thảo tổ chức tại Dunlin nên có tiền tố Dublin. Bộ yếu tố

siêu dữ liệu Dublin Core thƣờng đƣợc gọi tắt là Dublin Core. Tháng 06/2000,

Dublin Core đƣợc Uỷ ban châu Âu về tiêu chuẩn hoá/ Hệ thống tiêu chuẩn hoá

cho xã hội thông tin (CEN/ISSS – European Committee for Standarization /

Information Sociecty Standard System) [1,5] coi là tiêu chuẩn. Tháng 09/2001,

Dublin Core đƣợc ban hành thành tiêu chuẩn quốc gia Mỹ, gọi là tiêu chuẩn

“The Dublin Core Metadata Element Set” ANSI/NISO Z39.85-2001.

Khổ mẫu tiêu chuẩn siêu dữ liệu Dublin Core là tập hợp các yếu tố đơn giản

nhƣng hữu hiệu trong công việc mô tả một loạt nguồn tin trên mạng. DC gồm 15

yếu tố, mà ngữ nghĩa đƣợc xác lập của nhiều chuyên gia. Các yếu tố mô tả trong

DC đều không bắt buộc và có thể lặp, ngoài ra còn có một số lƣợng hạn chế các

từ hạn định và định ngữ có thể sử dụng để tiếp tục tinh chỉnh ý nghĩa các yếu tố.

Các yêu tố mô tả: 15 yếu tố

- Nhan đề: tên của tài liệu đƣợc đặt bởi tác giả hoặc nhà xuất bản.

- Tác giả (ngƣời sáng tác): cá nhân hoặc tổ chức sáng tạo ra nguồn thông

tin. Ví dụ: nhà văn, hoạ sỹ, nhà nhiếp ảnh, ngƣời minh hoạ.

- Chủ đề và từ khoá: là chủ đề của nguồn tin, điển hình, chủ đề có thể đƣợc

hiểu tƣơng đƣơng nhƣ từ khoá nhằm mô tả về một chủ đề hoặc một nội

dung của nguòn thông tin. Ngƣời ta rất khuyến khích việc sử dụng các

quyến từ vựng có kiểm soát và các khung phân loại.

- Mô tả: miêu tả nguyên văn về nội dung của nguồn thông tin, có thể bao

gồm cả tóm tắt trong trƣờng hợp tài liệu thành văn hoạc mô tả nội dung

trong trƣờng hợp không xác định rõ.

- Nhà xuất bản: một thực thể chịu trách nhiệm về việc xây dựng nên hình

thức của tài liệu. Ví dụ: nhà xuất bản, một khoa trong trƣờng đại học,

hoặc một tổ chức.

- Những ngƣời cộng tác: là cá nhân hoặc một tổ chức trên danh nghĩa cùng

một ngƣời đóng góp trong việc xây dựng nguồn thông tin, tuy nhiên đối

với những cá nhân hoặc tổ chức xây dựng nên nguồn tin thì họ chỉ đóng

vai trò phụ, thứ yếu. Ví dụ: ngƣời biên tập, ngƣời dịch, ngƣời hiệu đính…

- Thời gian xuất bản: thời gian xuất bản nguồn tin , đƣợc diễn tả theo cấu

trúc Năm/Tháng/Ngày/ Ví dụ: 1994-11-05

- Loại dữ liệu: kiểu mô tả cho nguồn thông tin, ví dụ: trang chủ, bài thơ,

quyển sách, báo cáo kỹ thuật, bài luận, từ điển, nhằm mục đích quốc tế

hoá, kiểu mô tả nên nguồn tin nến lấy trong danh sách đã đƣợc xây dựng.

- Khổ mẫu (định dạng): kiểu của dữ liệu tuỳ thuộc vào tài liệu, ví dụ: khối

lƣợng và thời gian của những nguồn thông tin. Kiểu dữ liệu đƣợc dùng để

mô tả cho nguồn thông tin, nhằm mục đích quốc tê hoá. Định dạng nguồn

tin nên chọn trong danh sách mới nhất do tổ chức quốc tế xây dựng.

- Yếu tố nhận dạng: mã nhận dạng là một từ hoặc con số đƣợc sử dụng để

nhận dạng nguồn thông tin. Ví dụ: các nguồn thông tin trên mạng bao

gồm cả URL và UNs. Có một số mã nhận dạng duy nhất nhƣ: ISBN, chỉ

18



19



-



-



số sách theo tiêu chuẩn quốc tế, hoặc một số tên tƣơng tự khác cũng có

thể đại diện cho yếu tố này.

Nguồn: những thông tin nguồn dữ liệu

Ngôn ngữ: Ngôn ngữ của nội dung thông tin.

Quan hệ: là một yêu tố nhận dạng về nguồn thông tin thứ hai có liên quan

đến nguồn thông tin hiện thời. Yếu tố này đƣợc sử dụng để mô tả cho mối

quan hệ của các nguồn thông tin, nhằm mục đích quốc tế hoá.

Phạm vi (mức độ bao phủ): không gian và thời gian tạo ra tài liệu

Bản quyền: sự xác định về quyền hạn của ngƣời quản lý nguồn thông tin.



Chia nhóm trong DC:

1- Các đối tƣợng về nội dung thông tin

o Nhan đề

o Chủ đề (từ khóa)

o Mô tả

o Nguồn

o Ngôn ngữ

o Quan hệ

o Phạm vi (mức độ bao phủ)

2- Các đối tƣợng liên quan đến sở hữu trí tuệ

o Tác giả (ngƣời sáng tác)

o Nhà xuất bản

o Nhà phân phối, cộng tác

o Quản lý bản quyền

3- Các đối tƣợng cá biệt

o Thời gian xuất bản

o Loại dữ liệu

o Khổ mẫu (định dạng)

o Yếu tố nhận dạng

Các từ chuẩn giới hạn của Dublin Core [1, 4]

- Lọc yếu tố mô tả: làm cho nghĩa của một yếu tố mô tả hẹp hơn hoặc cụ

thể hơn.

- Khung mã hoá: nhận diện các quy tắc trợ giúp diễn giải giá tị của một yếu

tố mô tả nào đó, bao gồm các từ vựng kiểm soát và các ký hiệu hình thức

hay các quy tắc cú pháp.

- Từ vựng cho các yếu tố mô tả: bộ sƣu tập; bộ dữ liệu; sự kiện; hình ảnh;

các nguồn dữ liệu có tƣơng tác; dịch vụ; phần mềm; âm thanh; văn bản.

Công cụ và phần mềm Dublin Core:

Công cụ:

- Các tiện ích

o Tạo siêu dữ liệu theo mẫu

o Công cụ tạo/ thay đổi mẫu

o Tự động trích dẫn/ tập hợ lại siêu dữ liệu

o Tự động tạo siêu dữ liệu

19



20



o

o

o

o

o



Chuyển đổi giữa các khổ mẫu siêu dữ liệu

Tự động tạo siêu dữ liệu

Chuyển đổi giữa các khổ mẫu siêu dữ liệu

Các môi trƣờng (công cụ) tích hợp

Các phần mềm thƣơng mại sẵn có.



Hƣớng dẫn sử dụng Duble Core:

- Hƣớng dẫn sử dụng cho những ngƣời không phải là chuyên gia về tạo

bản ghi mô tả Dublin Core.

- Cho các chuyên gia tham khảo về Dublin Core

- Giới thiệu và diễn giải về Dublin Core

Đặc điểm Dublin Core

- Tạo lập và duy trì bản ghi một cách dễ dàng.

- Ngữ nghĩa dễ hiểu

- Phạm vị sử dụng quốc tế rộng lớn với các phiên bản đa ngôn ngữ.

- Khả năng mở rộng các yếu tố thuận tiện

2.1.3 Ngôn ngữ đánh giá mở rộng XML

XML (eXtennsible Markup Language) là ngôn ngữ đánh dấu mở rộng có nguồn

gốc từ ngôn ngữ định dạng siêu văn bản HTML (Hyper Text Markup

Language), cả hai ngôn ngữ này đều bắt nguồn từ chuẩn ngôn ngữ định dạng

văn bản tổng quát có cấu trúc SGML (Structured General Markup Language).

XML là ngôn ngữ đƣợc định nghĩa bởi tổ chức mạng toàn cầu (Word Wide Web

Consortium), thƣờng đƣợc viết tắt theo cách chơi chữ là W3G. Đây là tổ chức

quốc tế định ra các chuẩn web và internet.

Cấu trúc XML

Một văn bản XML hình thành từ các thẻ (tag) với tên gọi phần tử (element).

Khác với ngôn ngữ HTML, số lƣợng và tên gọi trong XML là không hạn chế.

XML là ngôn ngữ tổng quát dụng định nghĩa dữ liệu thông qua các thẻ. Trong

HTML các thể đƣợc định nghĩa và quy định trƣớc [27]. Trong khi đó, với XML

ta có thể tuỳ ý định nghĩa mọi thẻ. Nhƣ vậy có thể coi XML nhƣ tập cha của

ngôn ngữ HTML. Dựa vào một số quy tắc, XML tự tồn tại và phát triển tự thân

thành các ngôn ngữ định nghĩa khác.

Điểm quan trọng nhất là XML cho phép dễ dàng xử lý, chuyển tải và trao đổi dữ

liệu giữa rất nhiều ứng dụng và tài liệu ngƣời dùng với các định dạng khác nhau.

Nếu đã quen với máy tính, hẳn ta biết rằng có rất nhiều định dạng tệp khác nhau.

Việc chuyển đổi dự liệu giữa chúng quả là nan giải mặc dù có không ít trình ứng

dụng hỗ trợ. Ví dụ nhƣ tệp .DOC, .XLS, .DBF, .MDB (lập trình Access), .TXT

(tệp văn bản), .RTF(Rich Text Format) và mới đây là .HTML. Chỉ riêng các tệp

văn bản thôi đã gặp rất nhiều khó khăn, nếu bận nhận đƣợc một tệp Word 2000

20



21



mà máy tính của bạn dùng Word 7.0, cố gắng lắm cũng chỉ đọc đƣợc phần văn

bản có các nội dung khác thƣờng bị biến dạng.

Trong XML, dữ liệu và định dạng đƣợc lƣu ở dạng văn bản và có thể dễ dàng

cấu hình cũng nhƣ thay đổi chúng bằng các trình soạn thảo thông thƣờng nếu

không có trong tay trình soạn thảo XML chuyên nghiệp. Dữ liệu và các thẻ

trong XML không mã hoá, không đòi hỏi bản quyền.

Tháng 12/1997, phiên bản đầu tiên XML 1.0 (Extensible Markup Language –

Ngôn ngữ đánh dấu mở rộng) ra đoìƣ và là chuẩn đơn giản của SGML. Từ đó,

nhiều công ty phần mềm đã chạy ứng dụng dựa trên XML đã ra đời. Điển hình

một số tuỳ biến ngôn ngữ định dạng dựa trên XML cho thấy sức mạnh của

XML:

- BITS – Banking Industry Technology Secretariat: ngôn ngữ văn

phòng về kỹ thuật nghiệp vụ ngân hàng.

- IFX – Financial Exchange: trao đổi dữ liệu tài chính.

- BIPS – Banking Internet Payment System: hệ thống thanh toán qua

internet của nghiệp vụ ngân hàng.

- TIM – Telecommunicaton Interchange Markup: định dạng trao đổi

viễn thông.

- EbXML – XML: kinh doanh điện tử

- PDML – Product Data Markup Language: ngôn ngữ định dạng dữ

liệu sản phẩm.

- FIX – Financial Information eXchange Protocol: giao thức trao đổi

thông tin tài chính.

- CML – Chemical Markup Language: ngôn ngữ định dạng trong

lĩnh vực hoá học, cho phép biểu diễn các công thức hoá học, cho

phép biểu diễn các công thức hoá học, hoá trị phân tử ở dạng đồ

hoạ.

Ƣu điểm của XML:

- Có thể tạo bản ghi thƣ mục một lần và xuất bản chúng theo các

dạng khác nhau.

- Hiển thị bản ghi thƣ mục trực tiếp trên trình duyết Web, search

engines (công cụ tìm kiếm) và các hệ thống thƣ viện tiềm năng

khác mà không cần chuyển đổi.

- Bản ghi thƣ mục có thể đƣợc chuyển đổi qua lại giữa XML và

MARC mà không bị tổn thất.

- Nhiều vấn đề tồn tại trong định dạng MARC đƣợc khắc phục, ví dụ

nhƣ việc kiểm soát tiêu chuẩn.

- Năm 1995, thƣ viện Quốc hội Mỹ bắt đầu nghiên cứu tính khả thi

của việc dùng SGML (Standard Generalized Markup Language Chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc) để mã

hoá định dạng MARC21. Sau đó, phiên bản MARC DTDs

(Document Type Definitions) định nghĩa laọi văn bản MARC để

21



22



định nghĩa dữ liệu MARC21 trong dạng thức SGML đƣợc phát

hành năm 1998. Cùng năm này, Thƣ viện Quốc hội Mỹ công bố

phần mềm chuyển đổi giữa MARC21 và SGML.

2.1.4 Khổ mẫu MARCXML

Khổ mẫu MARC21 đã đƣợc biết đến rộng rãi trên thế giới nhƣ một khổ

mẫu cho dữ liệu thƣ mục. MARC21 đƣợc ứng dụng rộng rãi trong việc xây

dựng các mục lục sách truy cập trực tuyến và trao đổi dữ liệu thƣ mục giữa các

thƣ viện. Xét về khía cạnh lý luận, MARC21 đƣợc coi là một khổ mẫu siêu dữ

liệu, nhƣng là siêu dữ liệu truyền thống. Với sự phát triển của những ứng dụng

XML, nhu cầu về khổ mẫu MARC21 trong môi trƣờng XML trở nên cấp bách

và đƣợc quan tâm.

Từ năm 1995, Thƣ viện Quốc hội Mỹ, đã có đề án phát triển MARC DTD.

MARC DTD có thể đƣợc dịch tạm là Định nghĩa phần tử tài liệu theo MARC.

Thuật ngữ “MARC DTD” đƣợc tạo ra từ cụm tiếng Anh Machine Readable

Cataloging Document Type Definition, đề cập đến việc ứng dụng ngôn ngữ

đánh dấu tổng quát chuẩn, viết tắt là SGML (Standard Generalized Markup

Language). SGML là một ký thuật trình bày tài liệu ở dạng máy tính đọc đƣợc,

đƣợc xây dựng thành tiêu chuẩn quốc tế ISO 8879 (Xử lý thông tin - Hệ thống

văn phòng và văn bản – Ngôn ngữ đánh dấu tổng quát chuẩn). SGML đƣợc phát

hiện để đáp ứng nhu cầu về chuẩn không độc quyền cho đánh dấu văn bản mà

dữ liệu máy tính có thể đọc đƣợc, có thể trao đổi giữa các môi trƣờng mã hoá

không giống nhau. SGML đƣợc sử dụng rộng rãi trong xuất bản nơi các tài liệu

đƣợc tạo ra bằng cách sử dụng những hệ thống máy tính khác nhau. SGML hỗ

trợ việc xác định tập hợp các yếu tố mô tả tài liệu.

Mục đích đầu tiên của dự án MARC DTD là tạo ra một DTD theo SGML chuẩn

để hỗ trợ việc chuyển đổi dữ liệu theo cấu trúc MARC sang dữ liệu theo cấu trúc

SGLM (và ngƣợc lại). Dữ liệu theo cấu trúc MARC là ứng dụng của các tiêu

chuẩn quốc tế về trao đổi thông tin ISO 2709 đã đƣợc thông qua từ hàng chục

năm trƣớc đây. Để việc chuyển đổi này đƣợc chuẩn hoá, cần thiết phải có DTD

chuẩn.

MARC DTD xử lý mỗi bản ghi thƣ mục nhƣ một tài liệu điện tử. Nó xác định

(định nghĩa) mọi yếu tố có thể trong bản ghi MARC theo một quy định riêng.

MARC XML DTD

Với sự phát triển của các ứng dụng ngôn ngữ XML trong tạo lập tài liệu điện tử,

Thƣ viện Quốc hội Mỹ đã phát triển MARC XML DTD. Phƣơng án này đƣợc

coi là hiệu quả hơn phƣơng án đầu tiên gọi là Lƣợc đồ MARCXML

(MARCXML Schema). MARC XML DTD đã xác định mỗi yếu tố theo XML.

Việc này tạo ra một bộ DTD rất lớn, khá phức tạp.



22



23



Về nguyên tắc, các yếu tố dữ liệu trong SGML đƣợc quy định bằng những cặp

thẻ. Để áp dụng cho dữ liệu theo MARC, mọi thẻ quy định yếu tố dữ liệu trong

SGML đề sử dụng tiền tố “mrc” (có lẽ là viết tắt từ chữ MARC để thể hiện sự

liên quan đến MARC). Điều này để đảm bảo không có sự trung lặp với những

DTD có thể sử dụng một số yếu tố MARC trong tạo lập tài liệu điện tử (thí dụ

nhƣ trong trƣờng hợp cho tài liệu theo kiêu TEL)

Mọi dữ liệu liên quan đến dữ liệu mô tả thƣ mục đề sử dụng tiền tố “mrcb”. Mọi

yếu tố trong nhóm DTD về kiểm soát tính nhất quán (MARC Authority DTD

group, bao gồm authority and classification records) bắt dầu bằng tiền tố

“mrca”.

Để làm cho DTD thể hiện đƣợc tính chất MARC, các trƣờng dữ liệu (yếu tố)

đƣợc thể hiện bằng số của nhãn trƣờng trong MARC và đi kèm với tiền tố Tiêu

đề tác giả, tƣơng ứng với trƣơng 100 của mARC; “mrc245” cho dữ liệu thuộc

trƣờng 245 của MARC. Có ngƣời cho rằng việc dùng có số là không thuận tiện

vì khó nhớ. Tuy nhiên, ngƣời ta cho rằng các chuyên gia làm việc lâu năm với

MARC đã quen thuộc với nhãn trƣờng ba chữ số MARC, do đó vấn đề này

không phải là điều phức tạp. Hơn nữa việc sử dụng con số tránh việc phải sử

dụng các từ làm thẻ nhãn trƣờng (thí dụ với tiếng Trung Quốc,…)

Hầu hết các nhãn trƣờng theo MARC đều có trƣờng con. Trong MARC DTD

ngƣời ta cũng sử dụng một mã ký tự làm thẻ cho trƣờng con. Trƣờng con sẽ

đƣợc gán cùng với thẻ nhãn trƣờng bằng dấu gạch ngang. Ví dự: mrcb245-a,

mrcb245-b, mrcb245-6.

Trong các bản ghi MARC, ngoài nhãn trƣờng, trƣờng con có chỉ thị. Để chỉ dẫn

rằng đây là dữ liệu liên quan đến chỉ thị, ngƣời ta đã đề xuất sử dụng các định

danh “i1” và “i2” chi chỉ thị 1 và chỉ thị 2.

Một số đặc trƣng khác của dữ liệu MARC là sự có mặt của một số trƣờng có độ

dài cố định, trong đó mỗi vị trí đều đƣợc quy định cụ thể loại dữ liệu. Thí dụ

những trƣờng này là trƣờng 006-008. Cú pháp đối với các trƣờng này sẽ nhƣ

sau:

 Tiền tố chỉ thị nhãn trƣờng “mrcb” hoặc “mrca”;

 Ba chữ chỉ thị nhãn trƣờng;

 Mã dữ liệu và dấu gạch ngang;

 Định danh số chỉ thị vị trí của dữ liệu theo MARC

Thí dụ: mrcb008-BK-22

Đối với phần đầu bản ghi, ngƣời ta đề nghị sử dụng tiền tố, mã dữ liệu và vị trí

của mã để làm thẻ meta. Quy định cụ thể nhƣ sau:

 Tiền tố phần dầu biểu “mrcaldr” hoặc mrcbldr”;

 Mã dữ liệu theo MARC, dấu gạch ngang;

 Số định danh thông báo vị trí đối với mã dữ liệu

Thí dụ: mrcbldr-bd-05

23



24



Marc XML:

Metadata Object Description Schema – MODS

Nhóm nghiên cứu của Thƣ viện Quốc hội Mỹ dã phát triển một khuon khổ cho

thao tác với dữ liệu theo khổ mẫu MARC trong môi trƣờng XML. Trên cơ sở

những nghiên cứu về MARC – DTD, Thƣ viện quốc hội Mỹ cùng các nhóm

chuyên gia dã phát triển Sơ đồ mô tả đối tƣợng siêu dữ liệu – MODS ( viết tắt từ

tiếng Anh Metadata Object Description Schema). Mục đích của MODS là tạo

khổ mẫu để mang dữ liệu từ bản ghi MARC21 cũng nhƣ cho phép tạo bản ghi

môt tả của tài liệu điện tử nagy từ đầu theo SGML [1, 3].

2.2 Chuẩn trao đổi dữ liệu

Ngày nay, sự phát triển vƣợt bậc của công nghệ thông tin và viễn thông đã và

đang tạo ra nhiều cơ hội song cũng ít thách thức cho hoạt động thông tin – thƣ

viện. Ngay từ khi còn hoạt động trong môi trƣờng truyền thống, thực tế đã cho

thấy: Vốn tài liệu của cơ quan thông tin – thƣ viện không thể dáp ứng đƣợc hết

các nhu cầu của ngƣời dùng tin. Trong môi trƣờng hiện đại, ngƣời dùng tin chìm

ngập trong biển thông tin nhƣng lại rất khó khăn trong việc tìm kiếm đâu là

thông tin chất lƣợng, có giá trị, phù hợp với nhu cầu…Vì vây, hệ thống các cơ

quan thông tin – thƣ viện cần phải liên kết để khắc phục tình trạng phân tán về

nguồn thông tin. Đáp ứng nhu cầu thông tin ngày càng cao của ngƣời dùng tin.

Các cơ quan thông tin – thƣ viện không đáp ứng một cách nhanh chóng mà còn

đầy đủ về nội dung và hình thức tài liệu cho ngƣời dùng tin. Chính vì vậy cần có

sự trao đổi, hợp tác liên thông giữa các cơ quan thông tin – thƣ viện. Sử dụng lại

các bản ghi biên mục chuẩn, tiết kiệm thời gian, công sức, sự trùng lặp và kinh

phí xử lý tài liệu. Tuy nhiên, hiện nay, các cơ quan thông tin – thƣ viện chƣa có

sự liên thông, trao đổi thông tin/tài liệu.

Nguyên nhân chƣa có sự liên thông trao đổi

- Các quy tắc mô tả chƣa thống nhất.

- Công cụ sử dụng chƣa đáp ứng đƣợc nhu cầu trao đổi.

- Nền tảng về tiềm lực công nghệ thông tin chƣa có.



24



25



Hình 2. Chuẩn trao đổi dữ liệu [31]



Nội dung cần thống nhất liên thông

 Thống nhất về quy tắc mô tả tài liệu: sử dụng MARC21

 Thống nhất về định dạng chủ đề và phân loại tài liệu

 Thống nhất về định chủ đề và phân loại tài liệu.

 Thống nhất trong việc sử dụng phần mềm và các chuẩn công nghệ thông

tin.

Nội dung trao đổi

 Trao đổi bản ghi biên mục

 Thông qua tệp: ISO2709

 MARC

 Thông qua Z39.50

 Trao đổi tài liệu

 Tài liệu số

Các yếu tố và vấn đề liên quan đến liên thông chia sẻ nguồn lực thông tin

 Hạ tầng công nghệ thông tin

 Phần mềm

 Tuân theo các chuẩn trong thƣ viện và các chuẩn công nghệ thông tin

 Yếu tố con ngƣời: các nhà lãnh đạo, quản lý và các cán bộ thực thi

Có thể dẫn chứng ra mô hình liên thông Thƣ viện quốc gia và các tỉnh thành đã

triển khai trong nhiều năm qua.

Mục đích trao đổi thông tin

 Nhập dữ liệu từ thƣ viện Tỉnh/Thành phố lên thƣ viện Quốc gia.

 Thƣ viện Tỉnh/Thành phố truy cập, khai thác thông tin thƣ mục của Thƣ

viện Quốc gia.

 Lƣu chiểu tài liệu điện tử.

25



Xem Thêm
Tải bản đầy đủ (.pdf) (63 trang)

×