Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.05 MB, 220 trang )
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Đường (line) cũng là một đối tượng không gian được tạo thành bởi một chuỗi các điểm
liên kết với nhau (vd đường giao thông với các thuộc tính như tập hợp các toạ độ (x,y), cấp mặt
đường, chiều rộng, số làn xe,…). Đường có chiều dài, nhưng không có chiều rộng và diện tích.
Điểm nút (node) là một loại điểm đặt biệt thể hiện điểm đầu hoặc cuối của đường hoặc là
điểm gặp nhau của hai hoặc nhiều đường (vd như ngã ba đường giao thông).
Điểm chuyển hướng (vertex) là một loại điểm đặc biệt thể hiện vị trí mà tại đó đường đổi
hướng, nhưng chưa phải là điểm đầu cuối hoặc giao nhau.
Vùng (polygon) là một diện tích khép kín. Có thể là vùng đơn (ví dụ vùng một loại rừng)
vùng phức nếu có chứa vùng con bên trong (ví dụ vùng một loại rừng nhưng có chứa hồ nước
bên trong).
Điểm lưới (grid cell) là một vùng dạng ô vuông hoặc chữ nhật (thường dùng trong raster
GIS).
2.3.
Mô hình hoá thế giới hiện thực với GIS
Có thể nói trung tâm của bất kỳ hệ thống GIS nào cũng là mô hình dữ liệu. Mô hình dữ
liệu có thể hiểu như là một tập hợp cấu trúc để mô tả và thể hiện các đối tượng và các quá trình
trong một môi trường số (digital environment) của máy tính. Người sử dụng GIS giao diện với
GIS để thực hiện các nhiệm vụ như xây dựng bản đồ, truy cập dữ liệu, phân tích phù hợp sử
dụng đất,v.v… Bởi vì các dạng bài toán phải được thực hiện chịu ảnh hưởng rất nhiều vào cách
thức mà thế giới hiện thực được mô hình hoá, cho nên việc lựa chọn dạng mô hình dữ liệu phù
hợp có ý nghĩa vô cùng quan trong xác định sự thành công của một dự án GIS. Người sử dụng
cần phải nhận thức được về tính chất các mô hình khác nhau vì nó ảnh hưởng đến hiệu quả của
việc xử lý dữ liệu (Laurini & Thompson, 1992)
Khi mô hình hoá thế giới hiện thực để thể hiện trong GIS, để thuận tiện ta thường gộp
các đối tượng hình học cùng loại vào với nhau (ví dụ như tất cả các đối tượng địa điểm khách
hàng sử dụng một lại hình dịch vụ nào đó; hoặc như hệ thống sông ngòi ở dạng đường có thể tập
hợp lưu trữ cùng nhau). Tập hợp các đối tượng này có cùng một hình thức thể hiện và mang một
nội dung thông tin được sử dụng rất rộng rãi trong GIS và được gọi là một lớp. Việc tập hợp theo
lớp như vậy làm cho việc lưu trữ và truy cập dữ liệu hiệu quả hơn. Ngoài ra nó cũng giúp cho
việc cập nhật, đính chính dữ liệu cũng như xây dựng các mối quan hệ giữa các đối tượng dễ dàng
hơn nhiều (ví dụ như việc bổ sung, thêm bớt các khu vực hành chính, các đường giao
thông,v.v… vào cơ sở dữ liệu đã có sẵn). Tóm lại mỗi một loại thông tin không gian hoặc chủ
đề khác nhau có cùng một cách thể hiện hình học như nhau (ví dụ như điểm, đường hoặc vùng)
được biết đến như là một lớp thông tin (layer).
106
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Hình 2.2: Lớp thông tin trong GIS
Mỗi lớp thông tin lại có mô hình, cấu trúc dữ liệu chi tiết hơn. Về nguyên lý, lớp thông
tin là tập hợp các dữ liệu địa lý về một khía cạnh nào đó của đối tượng địa lý thực tế. Do đó nó
sẽ mang cấu trúc chung cho loại dữ liệu đó.
Không giống như các dạng dữ liệu thông thường khác, dữ liệu địa lý phức tạp hơn, nó
bao gồm các thông tin về vị trí, các quan hệ topo và các thuộc tính phi không gian. Khía cạnh
không gian và topo của dữ liệu địa lý chính là điểm khác biệt rõ ràng nhất trong các hệ xử lý số
liệu không gian và các hệ xử lý số liệu thông dụng khác ví dụ như số liệu ngân hàng, thư viện.
Dữ liệu không gian luôn được tham chiếu đến vị trí của đối tượng trên bề mặt trái đất
bằng cách sử dụng các hệ toạ độ thông dụng mà ta đã xét tới ở những phần trước.
Mọi dữ liệu địa lý đều có thể được mô hình hoá thành ba thành phần cơ bản của quan
niệm topo - điểm, đường, vùng. Bất kỳ một đối tượng tự nhiên nào về nguyên tắc đều được biểu
diễn dưới dạng điểm, đường, vùng và các thông tin đi kèm. Các thông tin đi kèm có thể là tên
của đối tượng. Các thông tin khác đặt ở các bảng số liệu khác khi có nhu cầu tra cứu, thông qua
tên của đối tượng có thể nối trực tiếp với đối tượng đó để đem lại toàn bộ thông tin cho người sử
dụng.
107
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Bảng 2.1: Các hình thức thể hiện dữ liệu địa lý
Điểm
Đường
Vùng
Dữ liệu đặc trưng
Vị trí khảo cổ học
Đường giao thông
Vùng đất
Các đối tượng diện
tích
Tâm điểm vùng
Đưòng ranh giới
hành chính
Vùng điều tra dân
số
Topo mạng
Điểm nút (ngã ba
ngã tư)
Đường nối (phố)
Vùng (khối phố)
Ghi chép đo đạc
Các trạm khí tượng
Đường bay
Vùng diện tích lấy
mẫu
Dữ liệu địa hình bề
mặt
Các điểm độ cao
Đường bình độ
Vùng phân độ cao
tương đối
Chú thích chữ
Tên địa ranh
Tên đường,
sông,…
Tên vùng
Ký hiệu bản đồ
Ký hiệu điểm
Ký hiệu đường
Ký hiệu vùng
Mô hình dữ liệu địa lý bao gồm 4 thành phần sau (Zerger, 2000):
1.
Mã khoá,
2.
Định vị,
3.
Thành phần phi không gian,
4.
Thành phần không gian.
Mã khoá là mã số duy nhất cho thực thể, đặc trưng duy nhất cho thực thể, để phân biệt
thực thể này với thực thể khác.
Định vị xác định vị trí của thực thể trên thực tế. Thông thường người ta dùng các hệ toạ
độ để xác định toạ độ cho thực thể. Có nhiều hệ toạ độ khác nhau.
Thành phần phi không gian: là thành phần chứa đựng các số liệu về thuộc tính của thực
thể. Các thuộc tính này có thể là định lượng hoặc định tính. Thành phần phi không gian chứa
đựng các thuộc tính của đối tượng địa lý.
Bảng 2.2: Minh hoạ các đối tượng không gian và các thuộc tính đi kèm
Đối tượng
địa lý
Mã
khoá
Trường học
Tên gọi
Định vị
Thành
phần
không
gian
Thành phần phi không
gian
Định lượng
Định tính
Toạ độ một Khoảng
Số lượng học Giáo dục
điểm
cách tới sinh
một
108
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
trường
khác
Giếng nước
Số ID
Toạ độ vị trí Chiều sâu
trên mặt đất
Kích
giếng
thước Mục đích sử
dụng
Mạch nước Tên gọi
ngầm
Toạ độ trên Thể tích
mặt đất
Lưu
nước
lượng Sự thay đổi
mức nước
Mây
Toạ độ một Thể tích
điểm theo
thời gian
Dạng mây
Đường sắt
Vùng
Số hoặc Toạ độ theo Diện tích
tên gọi
đường bao
Quốc gia
2.4.
Mã
Tên gọi
Mức độ tập
trung
Toạ độ điểm Nối
2 Lưu
lượng Sự sử dụng
đầu cuối
thành phố vận chuyển
Thành phần
Toạ độ theo Các quốc GND (Tổng Có
chiến
ranh giới
gia láng sản
phẩm tranh
với
riềng
quốc nội)
quốc
gia
láng riềng
không?
Mức đo (loại dữ liệu)
Một điều quan trọng khi sử dụng GIS là chúng ta cần hiểu bản đồ không phải chỉ là một
hiển thị bởi các đối tượng hình học như là các vùng mầu, đường và điểm, mà đó là một tập hợp
các dữ liệu số có các mức đo (levels of measurement) và chính xác (accuracy) khác nhau. Có
năm loại dữ liệu, hay nói cách khác là có năm mức đo của dữ liệu như sau (Zeger, 2000):
•
Mức 1: Ghi danh
•
Mức 2: Cấp bậc
•
Mức 3: Chỉ số
•
Mức 4: Khoảng
•
Mức 5: Tỷ lệ
Sau đây là bảng ghi các đặc điểm của các loại dữ liệu:
Bảng 2.3: Đặc điểm của các loại dữ liệu
Mức đo
Định nghĩa
Ví dụ
Con số được dùng để nghi
danh
0 = Không có rừng
(Loại dữ liệu)
Ghi danh
1 = Rừng gỗ
2 = Rừng bụi
Cấp bậc
Con số được dùng để so
sánh giá trị
109
0 = Kém thích hợp
1 = Thích hợp trung bình
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
2 = Rất thích hợp
Chỉ số
Con số được dùng để chỉ sự
có/không, đúng/sai
Con số được dùng để đo sự
chênh lệch giữa các giá trị
Khoảng
Tỷ lệ
0 = Không có/sai
15 = 15oC
Hệ đo đạc có điểm mốc 0
tyệt đối
1 = Có/đúng
28 = 28oC
0 = 0 km độ cao
5 = 5 km độ cao
Mức đo còn được hiểu như sự phân loại bản đồ theo ý nghĩa của các giá con số gắn cho
các đối tượng trên bản đồ. Ta cần phải biết mức đo của bản đồ, hay nói cách khác là dử liệu của
bản đồ là ở loại nào theo bảng trên bởi vì nó quyết định các phép phân tích chồng xếp bản đồ có
thể được thực hiện ở mức nào. Mức đo càng cao thì càng có nhiều phép tính chồng xếp bản đồ
có thể được phép thực hiện.
Bảng dưới đây tổng hợp các phép phân tích dữ liệu có thể được sử dụng đối với mỗi mức
độ đo của dữ liệu, và các chức năng tương ứng trong phần mềm phổ thông ArcView. Khi thực
hiện chồng xếp bản đồ có các mức độ đo dữ liệu khác nhau, ta chỉ được sử dụng các phép phân
tích mà áp dụng được cho bản đồ có mức thấp hơn.
Bảng 2.4: Các phép phân tích áp dụng cho các mức dữ liệu
Mức đo của dữ liệu
Chức năng tương ứng trong
ArcView
Ghi danh
Phép kết hợp
Logic Boolean
Cấp bậc
Minimum, Maximum, Phép
kết hợp
Boolean, Minimize,
Maximize, Cross
Chỉ số
Boolean, Đếm (Cộng),
Nhân, Phép kết hợp
Boolean, Cross, Minimize,
Maximize, Các phép toán
(Cộng và Nhân)
Khoảng
Minimum, Maximum, Phép
kết hợp, Các phép số học
Boolean, Cross, Minimize,
Maximize, Các phép toán
Tỷ lệ
2.5.
Các phương pháp phân tích
có thể thực hiện được
Minimum, Maximum, Phép
kết hợp, Các phép số học
Boolean, Cross, Minimize,
Maximize, Các phép toán
Mô hình dữ liệu: Raster và Vector
Con người nhận thức hiện tượng thực tế qua hình dáng bên ngoài, để chuyển chúng vào máy tính
người ta cấu trúc hình dạng đó theo một trong 2 cách: Raster và Vector (Bernhardsen,1999).
110
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Hình 2.3: Mô hình Raster và mô hình Vector
2.5.1
Mô hình Raster
Trong mô hình raster, chúng ta chia thế giới thực ra làm những điểm lưới. Các điểm lưới
có thể mang một giá trị thuộc tính nào đó dựa trên một hoặc vài hệ thống mã hoá. Trường hợp
mã hoá đơn giản nhất là nhị phân (binary encoding), ví dụ như việc xuất hiện (1) hay không xuất
hiện (0) thảm thực vật; nhưng ở ví dụ khác thì hệ thống điểm nổi (floating points) sẽ được sử
dung, ví dụ như độ cao của điểm lưới so với mặt biển. Trong model này, mỗi một loại thông tin
chủ đề được lưu như một lưới (grid) riêng.
Hãy xét một lớp thông tin có cấu trúc raster. Trên hình vẽ 2.4 là một thể hiện bản đồ đất.
mỗi vùng được đánh dấu bằng các ô theo các giá trị khác nhau. Ta có được một lưới các ô có giá
trị khác nhau. Nếu gắn nước giá trị = 1, rừng = 2, đất nông nghiệp = 3 ta sẽ có một mảng số liệu
từ các giá trị 1,2,3:
Hình 2.4: Biểu diễn raster dữ liệu theo lưới điểm
111
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Hai cấu trúc lưu trữ raster cơ bản là cấu trúc lưu mã chi tiết (exhaustive enumeration) và
cấu trúc lưu mã chạy dài (run-length encoding). Đối với cấu trúc lưu mã chi tiết, mỗi một điểm
lưới được gắn với 1 giá trị duy nhất, vì vậy ở đây dữ liệu không được nén gọn. Còn cấu trúc lưu
mã chạy dài có ý nghĩa như là một kỹ thuật nén dữ liệu nếu raster chứa các nhóm điểm lưới có
cùng một giá trị. Khi đó thay vì phải lưu trữ riêng cho từng điểm lưới, cấu trúc này lưu trữ theo
từng thành phần có một giá trị duy nhất và số lượng điểm lưới chứa đựng giá trị đó. Nếu tất cả
các điểm lưới đều có các giá trị khác nhau thì cấu trúc này làm tăng gấp đôi bộ nhớ, tuy nhiên
nếu có 2 hoặc hơn số điểm lưới trùng giá trị thì cấu trúc này làm giảm bộ nhớ. Nếu càng có
nhiều điểm lưới liên tục có giá trị giống nhau thì mức độ nén càng đạt được cao. Cấu trúc này
đặc biệt thích hợp cho việc mã hoá ảnh đơn sắc hoặc ảnh nhị phân (Zerger, 2000).
Hình 2.5: Cấu trúc Raster – Lưu mã chi tiết (Exhaustive representation)
Hình 2.6: Cấu trúc Raster – Lưu mã chạy dài ( Run-length encoding)
2.5.2. Mô hình Vector
Trong mô hình Vector, dữ liệu được thể hiện bởi các đường hoặc cung định vị bởi các
điểm đầu và cuối và giao nhau tại các điểm nút (node). Vị trí của các điểm nút này và mối quan
hệ topo được lưu trữ một cách rõ ràng. Các đối tượng được xác định bởi ranh giới của chúng và
các đường cong được thể hiện như là một chuỗi các cung nối nhau. Trong vector GIS các đối
tượng địa lý được thể hiện một cách rõ ràng và kèm theo chúng là các thuộc tính chủ đề.
Có những phương pháp khác nhau để tổ chức cơ sở dữ liệu 2 mặt này (mặt không gian và
mặt thuộc tính chủ đề). Thông thường, hệ thống vector bao gồm 2 thành phần: thành phần quản
112
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
lý dữ liệu không gian và thành phần quản lý dữ liệu chuyên đề. Hệ thống này được gọi là hệ
thống tổ chức hybrid.
Hình 3.7: Mô hình Vector
Trong mô hình vector, dữ liệu địa lý được thể hiện dưới dạng các toạ độ. Các đơn vị cơ
bản của thông tin không gian là điểm, đường (cung) và vùng. Mỗi một đơn vị này được cấu
thành bởi một chuỗi một hoặc nhiều điểm có toạ độ, ví dụ như đường là một tập hợp các điểm có
liên quan đến nhau, còn vùng là tập hợp các đường có liên quan đến nhau.
Toạ độ là cặp số thể hiện khoảng cách nằm ngang theo dọc theo trục trực giao, hoặc là bộ
ba số thể hiện các khoảng cách nằm ngang và thẳng đứng. Toạ độ thường thể hiện vị trí của bề
mặt trái đất tương đối với các vị trí khác.
Điểm dùng để khái quát cho một đối tượng bởi toạ độ x/y của chúng. Điểm dùng để thể
hiện cho đối tượng quá nhỏ không đủ để có thể hiện bằng đường hoặc vùng (ví dụ như vị trí của
công trình trên một bản đồ tỷ lệ nhỏ).
Đường là tập hợp các toạ độ thể hiện hình dạng đối tượng địa lý mà quá hẹp để có thể
được hiển thị như là một vùng tại mức tỷ lệ cho trước (ví dụ như đường đồng mức, tâm điểm
đường giao thông, sông rạch,v.v…), hoặc là các đối tượng đường không gắn liền với diện tích
(ví dụ như ranh giới vùng hành chính). Khái niệm đường và cung (arc) trong GIS là một.
Vùng được dùng để thể hiện đối tượng có diện tích. Vùng được xác định bởi các đường
tạo thành đường bao của nó và một điểm bên trong để làm nhiệm vụ nhận dạng. Vùng thường đi
kèm với thuộc tính mô tả đối tượng địa lý mà nó thể hiện.
Điểm
Đường
Hinh 2.8: Minh hoạ đối tượng địa lý trong GIS
113
Vùng
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Có vài mô hình lưu trữ và quản lý thông tin vector. Mỗi một mô hình đều có các ưu điểm
và nhược điểm riêng. Các mô hình lưu trữ điển hình gồm (Burrough & McDonnell, 1998):
a)
Cấu trúc liệt kê toạ độ 'spaghetti'
b)
Cấu trúc từ điển vertex
c)
Cấu trúc mã hoá đôi độc lập bản đồ DIME
d)
Cấu trúc cung/nút ARC/NODE
Hình 2.9: Cấu trúc liệt kê toạ độ
a) Cấu trúc liệt kê toạ độ 'spaghetti':
•
Đơn giản
•
Dễ quản lý
•
Không chứa đựng được quan hệ topo
•
Nhiều trùng lặp, vì vậy chiếm nhiều bộ nhớ
•
Thường dùng trong CAC (bản đồ học vi tính)
114
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Bộ môn tính toán thuỷ văn
Hình 2.10: Cấu truc từ điển vertex
b) Cấu trúc từ điển vertex (Vertex dictionary):
•
tránh được trùng lắp, nhưng vẫn không có quan hệ topo
Hình 2.11: Cấu trúc mã hoá đôi
c) Cấu trúc mã hoá đôi độc lập bản đồ (Dual Independent Map Encoding- DIME):
115
Kỹ thuật viễn thám và hệ thống thông tin địa lý
Hình 2.12:
(ARC/NODE)
.
Cấu
trúc
Bộ môn tính toán thuỷ văn
cung/nút
d) Cấu trúc cung/nút (ARC/NODE)
Cấu trúc cung/nút (Arc/Node) lần đầu tiên được phát triển đề dùng trong tổng điều tra dân số
Hoa Kỳ năm 1980 dưới dạng khởi điểm là cấu trúc mã hoá đôi độc lập bản đồ DIME. Trong cấu
trúc này cung (acr) là đơn vị cơ bản nhất trên bản đồ. Hình dạng và chiều dài của cung được xác
định bởi vị trí của các nút (node) và điểm rẽ (vertice).
Điểm nút khác biệt với điểm rẽ ở chỗ điểm nút là một đối tượng chứa quan hệ topo còn
điểm rẽ chỉ là một đối tượng điểm đơn giản xác định bởi toạ đô x/y mà không chứa đựng mối
quan hệ topo nào.
Hướng của cung được ghi rõ ràng theo thứ tự của những điểm nút đầu và cuối. Với
hướng xác định thì hai bên (phải, trái) cũng được xác định.
Tệp thông tin lưu trữ tất cả các thông tin cần thiết về cung, bao gồm:
1.
Mã khoá cung
2.
Mã khoá điểm nút đầu
3.
Mã khoá điểm nút cuối
4.
Mã khóa vùng ở phía bên phải của cung
5.
Mã khoá vùng ở phía bên trái của cung
6.
Toạ độ X/Y của điểm nút đầu, điểm nút cuối
7.
Toạ độ X/Y của tất cả các điểm rẽ
Điểm nút chứa đựng thông tin topo quan trọng vì nó là điểm giao nhau của các đối tượng
đường. Trong cấu trúc dữ liệu Arc/Node thì đối tượng điểm cũng có thể được coi như một đường
với điểm nút đầu và cuối có cùng một toạ độ X/Y.
Quan hệ topo có ý nghĩ quan trọng sau đây (Demers,1997):
a)
Cho phép thực hiện các phép phân tích mà đòi hỏi thông tin về sự kết nối giữa các phần
tử đường;
b)
Cho phép thực hiện các quá trình cần sử dụng dữ liệu về tính thứ tự của các đối tượng
đường;
c)
Cho phép xác định tính chất của các đơn vị vùng kề sát;
d)
Cho phép tự động hoá một số quá trình phát hiện lỗi;
e)
Làm thuận tiện hơn các phép tìm kiếm trong các bài toán vùng lân cận (neighbourhood);
f)
Làm thuận tiện hơn việc truy cập các phần tử thuộc tính gắn liền với dữ liệu;
116