Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (508.7 KB, 47 trang )
Bài thu hoạch Biểu diễn tri thức & Suy luận
HVTH: Lê Bảo Trung – CH1301112
Bước 1: Xác định lĩnh vực và phạm vi của Ontology
Trong giai đoạn này cần xác định mục đích của việc xây dựng ontology là gì? Phục
vụ đối tượng nào? Ontology sắp xây dựng cần có đặc điểm gì, liên quan đến lĩnh vực,
phạm vi nào. Quá trình khai thác, quản lý và bảo trì ontology được thực hiện ra sao?
Bước 2: Xem xét việc sử dụng lại các ontology có sẵn
Cấu trúc của một Ontology bao gồm 3 tầng: tầng trừu tượng (Abstract), tầng miền
xác định (Domain) và tầng mở rộng (Extension). Trong đó tầng trừu tượng có tính tái sử
dụng rất cao, tầng miền xác định có thể tái sử dụng trong một lĩnh vực nhất định. Cộng
đồng Ontology cũng đang lớn mạnh và có rất nhiều Ontology đã được tạo ra, với tâm
huyết của nhiều chuyên gia. Do đó trước khi bắt đầu xây dựng ontology, cần xét đến khả
năng sử dụng lại các ontology đã có. Nếu có thể sử dụng lại một phần các ontology đã có,
chi phí bỏ ra cho quá trình xây dựng ontology sẽ giảm đi rất nhiều.
Bước 3: Liệt kê các thuật ngữ quan trọng
Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy
khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các
lớp trong ontology tương ứng. Tất nhiên không phải thuật ngữ nào cũng đưa vào
ontology, vì chưa chắc đã định vị được cho thuật ngữ đó. Do đó cần phải liệt kê các thuật
ngữ, để xác định ngữ nghĩa cho các thuật ngữ đó, cũng như cân nhắc về phạm vi của
ontology. Việc liệt kê các thuật ngữ còn cho thấy được phần nào tổng quan về các khái
niệm trong lĩnh vực đó, giúp cho các bước tiếp theo được thuận lợi.
Bước 4: Xác định các lớp và phân cấp của các lớp
Công việc xác định các lớp không chỉ đơn giản là tiến hành tìm hiểu về ngữ nghĩa
của các thuật ngữ đã có để có được các mô tả cho thuật ngữ đó, mà còn phải định vị cho
các lớp mới, loại bỏ ra khỏi ontology nếu nằm ngoài phạm vi của ontology hay hợp nhất
với các lớp đã có nếu có nhiều thuật ngữ có ngữ nghĩa như nhau (đồng nghĩa, hay đa
ngôn ngữ). Ngoài ra không phải thuật ngữ nào cũng mang tính chất như một lớp.
10
Bài thu hoạch Biểu diễn tri thức & Suy luận
HVTH: Lê Bảo Trung – CH1301112
Một công việc cần phải tiến hành song song với việc xác định các lớp là xác định
phân cấp của các lớp đó. Việc này giúp định vị các lớp dễ dàng hơn.
Có một số phương pháp tiếp cận trong việc xác định phân cấp của các lớp:
•
Phương pháp từ trên xuống (top-down): bắt đầu với định nghĩa của các lớp
tổng quát nhất trong lĩnh vực và sau đó chuyên biệt hóa các khái niệm đó. Ví dụ: Trong
Ontology về quản lý nhân sự, ta bắt đầu với lớp Người, sau đó chuyên biệt hóa lớp Người
đó bằng cách tạo ra các lớp con của lớp Người như : Kỹ sư, Công nhân, Bác sỹ,… Lớp
Kỹ sư cũng có thể chuyên biệt hóa bằng cách tạo ra các lớp con như Kỹ sư CNTT, Kỹ sư
điện, Kỹ sư cơ khí, …
•
Phương pháp từ dưới lên (bottom-up): bắt đầu với định nghĩa của các lớp
cụ thể nhất, như các lá trong cây phân cấp. Sau đó gộp các lớp đó lại thành các khái tổng
quát hơn. Ví dụ: ta bắt đầu với việc định nghĩa các lớp như: nhân viên lễ tân, nhân viên
vệ sinh, nhân viên kỹ thuật. Sau đó tạo ra một lớp chung hơn cho các lớp đó là lớp nhân
viên.
•
Phương pháp kết hợp: kết hợp giữa phương pháp từ trên xuống và từ dưới
lên: bắt đầu từ định nghĩa các lớp dễ thấy trước và sau đó tổng quát hóa và chuyên biệt
hóa các lớp đó một cách thích hợp. Ví dụ ta bắt đầu với lớp nhân viên trước, là thuật ngữ
hay gặp nhất trong quản lý nhân sự. Sau đó chúng ta có thể chuyên biệt hóa thành các lớp
con: nhân viên lễ tân, nhân viên vệ sinh,… hoặc tổng quát hóa lên thành lớp Người.
Bước 5: Xác định các thuộc tính
Để xác định thuộc tính cho các lớp, ta quay trở lại danh sách các thuật ngữ đã liệt
kê được. Hầu hết các thuật ngữ còn lại (sau khi đã xác định lớp) là thuộc tính của các lớp
đó. Với mỗi thuộc tính tìm được, ta phải xác định xem nó mô tả cho lớp nào. Các thuộc
tính đó sẽ trở thành thuộc tính của các lớp xác định. Ví dụ lớp Người có các thuộc tính
sau: Họ, Tên, Ngày sinh, Giới tính, Nghề nghiệp, Địa chỉ, Điện thoại,…
11
Bài thu hoạch Biểu diễn tri thức & Suy luận
HVTH: Lê Bảo Trung – CH1301112
Bước 6: Xác định ràng buộc của các thuộc tính
Các thuộc tính có thể có nhiều khía cạnh khác nhau: như kiểu giá trị, các giá trị cho
phép, số các thuộc tính (lực lượng), và các đặc trưng khác mà giá trị của thuộc tính có thể
nhận. Ví dụ: “Năm sinh” của một “nhân viên” chỉ có duy nhất và là số nguyên, có thể
nhận giá trị từ 1948 đến 1990. Cần phải xác định các ràng buộc cho một thuộc tính càng
chặt chẽ càng tốt, để tránh trường hợp nhập dữ liệu sai, dẫn đến đổ vỡ của các ứng dụng
sử dụng Ontology này.
Bước 7: Tạo các thể hiện / thực thể
Bước cuối cùng là tạo ra các thể hiện của các lớp trong sự phân cấp. Việc tạo thể
hiện cho một lớp là quá trình điền các thông tin vào các thuộc tính của lớp đó.
12
Bài thu hoạch Biểu diễn tri thức & Suy luận
HVTH: Lê Bảo Trung – CH1301112
III. CƠ SỞ TRI THỨC TÍNH TOÁN ĐỐI TƯỢNG ONTOLOGY
Có rất nhiều phương pháp đại diện cho tri thức [2], [4], [9].Những phương pháp này
đang được quan tâm và hữu dụng cho nhiều ứng dụng, tuy nhiên chúng không đủ mạnh
và rất khó sử dụng cho việc xây dựng hệ cơ sở tri thức trong các lĩnh vực tri thức khác
nhau.
Cơ sở tri thức tính toán đối tượng Ontology (COKB-ONT) và các mô hình của nó đã
được thiết lập từ cách hướng đối tượng để biểu diễn tri thức cùng với các kỹ thuật lập để
tính toán hình thức. Đã có nhiều kết quả và các công cụ cho các phương pháp hướng đối
tượng, và một số nguyên tắc cũng như kỹ thuật, cách này còn cho chúng ta một phương
pháp mô hình hóa việc giải toán và thiết kế thuật toán .Các mô hình này rất hữu ích cho
việc xây dựng các thành phần và tri thức cơ sở cho toàn bộ hệ tri thức cơ bản trong lĩnh
vực giáo dục.
1 Các thành phần của mô hình COKB
Mô hình tri thức của các cơ sở tính toán đối tượng (mô hình COKB) bao gồm 6
thành phần:
(C, H, R, Ops, Funcs, Rules)
Ý nghĩa của các thành phần như sau:
-
C: Tập các khái niệm của các đối tượng tính toán (C- Object).
H: Tập các quan hệ phân cấp có liên quan của các khái niệm
R: Tập các mối quan hệ về các khái niệm.
Ops: Tập các toán tử.
Funcs: Tập các hàm.
Rules: Tập các luật
Mỗi khái niệm trong C là một lớp của C-Objects. Cấu trúc C-objects có thể được
mô hình hóa bằng (Attrs, F, Facts, Rules).
13
Bài thu hoạch Biểu diễn tri thức & Suy luận
-
HVTH: Lê Bảo Trung – CH1301112
Attrs là một tập các thuộc tính
F là một tập hợp các phương trình được gọi là quan hệ tính toán
Facts là tập hợp các thuộc tính hoặc sự kiện của đối tượng.
Rules là tập các quy tắc suy luận dựa trên Facts.
Một đối tượng cũng có những trạng thái cơ bản để giải những bài toán trên các
thuộc tính của nó. Những đối tượng được trang bị những khả năng giải toán như:
1. Xác định bao đóng của một tập các thuộc tính
2. Suy luận và đưa lời giải cho các bài toán dạng: Xác định một số thuộc tính từ các
thuộc tính khác.
3. Thực hiện tính toán
4. Đề xuất hoàn thiện giả thiết nếu cần.
Đây là những quan hệ đại diện chuyên biệt giữa những khái niệm trong tập C; H
đại diện những quan hệ đặc biệt trên C. Quan hệ này được đặt trước trên tập C, và H có
thể được xem như biểu đồ Hasse cho mối quan hệ đó. R là tập các quan hệ còn lại trên
tập C, và trong trường hợp quan hệ r là một quan hệ nhị phân thì nó có thể có những tính
chất như phản xạ, đối xứng… Trong hình học phẳng và hình học giải tích, có rất nhiều
quan hệ như: “thuộc về” một điểm và đường thẳng, quan hệ “song song” giữa hai đoạn
thẳng, quan hệ “vuông góc” giữa hai đoạn thẳng, quan hệ bằng nhau giữa các tam giác…
Tập Ops bao gồm các toán tử trên C. Thành phần này đại diện cho một phần tri
thức về các toán tử trên các đối tượng. Hầu hết các lĩnh vực tri thức có một thành phần
bao gồm các toán tử.
Tập Funcs bao gồm các hàm trên C-objects. Tri thức về các hàm này cũng phổ
biến như tri thức trên hầu hết các lĩnh vực tri thức trong thực tế, đặc biệt là lĩnh vực khoa
học tự nhiên như Toán, vật lý…
Tập Rules thể hiện các quy tắc suy luận, những quy tắc này tượng trưng cho các
báo cáo, định lý, nguyên tắc, công thức…Hầu hết các quy tắc đầu có thể được viết dưới
dạng “if
14
Bài thu hoạch Biểu diễn tri thức & Suy luận
HVTH: Lê Bảo Trung – CH1301112
hợp các sự kiện với phân loại nhất định.Vì vậy, chúng tôi sử dụng các quy tắc suy diễn
trong mô hình COKB. Sự kiện phải được phân loại để các quy tắc thành phần có thể được
xác định và xử lý trong các công cụ suy luận của hệ thống cơ sở tri thức hoặc các hệ
thống thông minh.
Cơ sở tri thức trên mô hình COKB có thể được tổ chức bởi các thành phần sau:
1. Từ điển các khái niệm về loại của các đối tượng, các thuộc tính, các toán tử, các
hàm, quan hệ và các khái niệm liên quan.
2. Bảng mô tả cho các cấu trúc và các đặc trưng của các đối tượng. Ví dụ, chúng ta
có thể yêu cầu một hình tam giác để tính toán và cung cấp cho chúng ta các thuộc
3.
4.
5.
6.
7.
tính của nó.
Các bảng tượng trưng cho mối liên hệ phân cấp của các khái niệm.
Các bảng tượng trưng cho các mối quan hệ khác của các khái niệm.
Các bảng mô tả tri thức về các toán tử
Các bảng đại diện cho tri thức về các hàm
Các bảng mô tả cho các loại sự kiện. Ví dụ, một quan hệ thực tế bao gồm các loại
của mối quan hệ và danh sách của các đối tượng liên quan.
8. Các bảng mô tả cho các quy tắc. Ví dụ, một quy tắc suy luận bao gồm một phần
giả thuyết và phần kết luận. Cả hai đều là danh sách các sự kiện.
9. Danh sách hay tập hợp các quy tắc.
10. Danh sách các bài toán mẫu
4. Các loại sự kiện trong mô hình COKB
Trong mô hình COKB có 11 loại sự kiện được chấp nhận.
Các loại các sự kiện đã được đề xuất từ nghiên cứu về các yêu cầu thực tế và các
bài toán khác nhau trong lĩnh vực tri thức. Các loại sự kiện như sau:
-
Sự kiện loại 1: thông tin về loại đối tượng.
Sự kiện loại 2: xác định một đối tượng hoặc một thuộc tính của một đối tượng.
Sự kiện loại 3: xác định một đối tượng hoặc một thuộc tính của một đối tượng
bằng một giá trị hoặc một hằng số biểu thức.
15
Bài thu hoạch Biểu diễn tri thức & Suy luận
-
HVTH: Lê Bảo Trung – CH1301112
Sự kiện loại 4: bình đẳng trên các đối tượng hoặc các thuộc tính của các đối tượng.
Loại sự kiện này cũng rất phổ biến, và có nhiều bài toán liên quan đến cơ sở tri
-
thức
Sự kiện loại 5: sự phụ thuộc của một đối tượng với các đối tượng khác bằng một
-
phương trình chung.
Sự kiện loại 6: mối liên hệ trên các đối tượng hoặc các thuộc tính của các đối
tượng. Trong hầu hết các bái toán có những sự kiện thuộc loại 6 như hai đường
thẳng song song, một đường thẳng vuông góc với một mặt phẳng, một điểm thuộc
-
về một đoạn thẳng.
Sự kiện loại 7: xác định của một hàm.
Sự kiện loại 8: xác định của một hàm bởi một giá trị hoặc biểu thức là một hằng
-
số.
Sự kiện loại 9: đẳng thức giữa một đối tượng và một hàm
Sự kiện loại 10: đẳng thức giữa hai hàm
Sự kiện loại 11: sự phụ thuộc của một hàm với các hàm khác hoặc các đối tượng
khác của một phương trình.Các mô hình trên và các loại sự kiện có thể được sử
dụng để biểu diễn cho tri thức trong các ứng dụng thực tế. Thuật toán thống nhất
các sự kiện đã được hình thành và sử dụng trên nhiều ứng dụng khác nhau
5. Phương pháp thiết kế
Trong phần tiếp theo sẽ trình bày quá trình để xây dựng một hệ thống cơ sở tri thức
giải quyết một số bài toán cao cấp. Bên cạnh đó, kỹ thuật trong từng giai đoạn sẽ được
trình bày.
a) Cấu trúc của hệ thống
Một hệ thống hỗ trợ tìm kiếm, truy vấn và giải quyết các vấn đề toán học cao cấp, có
cấu trúc của một hệ chuyên gia. Chúng tôi có thể thiết kế hệ thống bao gồm sáu thành
phần:
-
Các cơ sở tri thức.
Các công cụ suy luận.
Giải thích cho các thành phần
Bộ nhớ làm việc.
16