Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.42 MB, 56 trang )
Giả sử số lớp đối tượng cần phân loại trên ảnh viễn thám trong phương
pháp phân loại không kiểm định là k:
• Chọn ra k vector làm tâm (mean) cho k lớp khởi đầu. Giá trị vector tâm
được xem là giá trị trung bình của lớp;
• Tính khoảng cách từ mỗi vector pixel đến vector trung bình của lớp đó (thực
hiện với tất cả các vector trong một lần lặp). Nếu khoảng cách này là nhỏ nhất,
pixel đó thuộc lớp đã cho;
• Tính lại trung bình của nhóm mới hình thành;
• Nếu tất cả các tâm giữ nguyên, thuật toán K – means dừng. Nếu không, quay
lại bước 2 và tiếp tục cho đến khi kết quả ổn định.
Hình 2.4 Ảnh Landsat khu vực Nam trung bộ (2001) và kết quả giải đoán không kiểm định
theo thuật toán K – means (5 lớp, số lần lặp 5)
Sau phân loại ảnh không kiểm định bằng thuật toán K – means, cần phải
xem xét các lớp:
1. Lớp có quá ít phần tử có thể bỏ;
2. Hai lớp có đặc trưng gần giống nhau có thể kết hợp chúng lại một;
3. Một lớp nào đó quá lớn có thể chia nhỏ thành các lớp khác nhau.
Số các lớp do người giải đoán định trước; Số lần lặp càng lớn, kết quả
càng chính xác nhưng cần nhiều thời gian giải đoán hơn.
37
Thuật toán ISODATA
Thuật toán phân loại không kiểm định ISODATA được Duda và Hart đề
xuất năm 1973 mang đặc tính của cả phương pháp phân loại không kiểm định và
phân loại có kiểm định. ISODATA được xây dựng trên cơ sở thuật toán K –
means nhưng bổ sung thêm 3 quá trình: khử cụm, tách cụm, gom cụm. Thuật
toán này được xem như là dạng của phương pháp phân loại khoảng cách ngắn
nhất trong phân loại có kiểm định. Phương pháp phân loại Isodata sẽ tính toán
cách thức phân lớp trong không gian dữ liệu, sau đó nhóm đi nhóm lại các pixel
bằng kỹ thuật khoảng cách tối thiểu (minimum distance). Mỗi lần nhóm lại các
lớp này sẽ tính toán lại cách thức phân lớp và phân loại lại các pixel theo cách
thức phân lớp mới. Quá trình này sẽ tiếp tục lặp đi lặp lại đến khi số các pixel
trong mỗi lớp nhỏ hơn ngưỡng thay đổi pixel đã chọn hoặc đạt tối đa số lần lặp
đi lặp lại đó. Để tiến hành phân loại không kiểm định dùng thuật toán
ISODATA đầu vào cần các thông số sau:
1.N là số phân lớp lớn nhất được xác định trên ảnh. Mỗi phân lớp được coi
ứng với mỗi đối tượng cần giải đoán. Như vậy, số lượng tối đa số đối
tượng cần giải đoán trên ảnh vệ tinh là N. Thuật toán ISODATA bắt đầu
với việc chọn N điểm ảnh nào đó như là trọng tâm của N lớp. Trong
trường hợp phân lớp nào đó chứa quá ít phần tử (pixel) có thể bỏ qua và
số lượng phân lớp sẽ nhỏ hơn N.
2. T là ngưỡng – khoảng cách lớn nhất giữa các pixel để chúng có thể nằm
trong một phân lớp.
3. M là số lần lặp tối đa.
37
Hình 2.5 Sơ đồ thuật toán ISODATA
Hình 2.6: Ảnh Landsat khu vực Nam trung bộ (2001) và kết quả giải đoán không kiểm
định theo thuật toán Isodata (5 lớp, số lần lặp 5)
2.3.2 Phân loại bằng thuật toán xác suất cực đại (maximum likehood)
Trong viễn thám và được xem như thuật toán chuẩn để so sánh với các
thuật toán khác. Trong phương pháp này, mỗi pixel được tính xác suất thuộc
37
một lớp nào đó và được gán vào lớp có xác suất cao nhât; Thuật toán xác suất
cực đại (Maximum likelihood) được sử dụng rất thông dụng Thuật toán xác suất
cực đại có rất nhiều ưu việt nếu xét theo quan điểm xác suất. So với các thuật
toán phân loại tự động có kiểm định khác, độ chính xác của kết quả phân loại
dùng thuật toán xác suất cực đại là cao hơn.
Giả sử ta có lớp Ωk. Khi đấy, xác suất để một pixel ảnh nào đó nằm trong
lớp Ωk được xác định dựa trên công thức Bayer:
P(Ω ) * p( xi / Ω )
k
k
p(Ω / xi ) =
k
k
∑ P(Ω j ) * p( xi / Ω j )
j =1
Trong đó P(Ωi) là xác suất tiền định của loại Ω (ví dụ 50% xác suất thuộc
loại A thì P(ΩA) = 0.5). P(xj/ Ωk) – xác suất điều kiện có thể xem x thuộc loại
k
Ω.Thông thường P(Ωk) và ∑ P(Ω ) * p( x / Ω )
được xem như bằng nhau
j
i
j
j =1
cho tất cả các
loại Ωk, do đó P(Ωk/xi) chỉ phụ thuộc vào P(xi/ Ωk). Khi đó pixel xi sẽ
nằm trong lớp mà nó có xác suất cao nhất. Trong phương pháp này, ngoài xác
suất xuất hiện của pixel trong một lớp còn sử dụng xác suất xuất hiện của một
lớp trong vùng P(Ωk).Trong trường hợp dữ liệu ảnh phân bố theo quy luật chuẩn
Gauss, xác suất P(Ωk/xi) có thể được viết như sau:
1
−
exp{− ( X − µ c ).Covc 1( X − µ c )T }
k
1
2
(2π ) 2 . | Cov | 2
c
Những chú ý khi dùng thuật toán xác suất cực đại
p(Ω / xi ) =
k
1
Số lượng pixel trong mẫu giải đoán (kích thước mẫu giải đoán) phải đủ
lớn để các giá trị trung bình, ma trận phương sai, hiệp phương sai tính cho một
lớp nào đó có giá trị đúng với thực tiễn;
Nếu tương quan giữa các kênh ảnh là gần nhau, ma trận nghịch đảo của
ma trận phương sai và hiệp phương sai sẽ không ổn định. Trong trường hợp này
để nâng cao độ chính xác của kết quả phân loại cần phải giảm số kênh của ảnh
bằng phương pháp phân tích thành phần chính (PCA).
37
Phương pháp phân loại xác suất tối đa chỉ tối ưu trên cơ sở giả thuyết
phân bố dữ liệu theo luật phân bố chuẩn Gauss. Trong trường hợp dữ liệu ảnh
không phân bố theo quy luật chuẩn Gauss thì không nên dùng phương pháp
phân loại này.
Hình 2.7: Kết quả Giải đoán ảnh theo thuật toán Maximum Likelihood (ảnh
Landsat,1977, Elkton, Maryland).
2.3.3 Thuật toán phân loại hình hộp (PARALLEPIPED)
Thuật toán phân loại hình hộp (parallelepiped) là một trong những thuật
toán được ứng dụng rộng rãi nhất trong phân loại tự động có kiểm định ảnh viễn
thám.
Ưu điểm của thuật toán này là đơn giản và dễ hiểu, khả năng tính toán
nhanh so với các thuật toán phân loại khác.
nhược điểm cơ bản: kết quả giải đoán không cao trong trường hợp có sự
tương quan giữa hai kênh ảnh. Ngoài ra, do khoảng chia cách giữa các hình hộp
là đáng kể, những pixel nằm trong vùng này sẽ không được xử lý. Trong một
trường hợp khác, khi có sự trùng lắp phần nào giữa hai hình hộp, thuật toán
phân loại hình hộp sẽ chỉ định pixel vào hộp đầu tiên.
Để xây dựng hình hộp cho từng loại đối tượng cần phải xác định được
kích thước các cạnh của hình hộp. Kích thước của hình hộp có thể xác định bằng
37
nhiều cách khác nhau (giá trị phổ lớn nhất và nhỏ nhất của mẫu giải đoán; do
người giải đoán tự đặt,...). Các pixel có giá trị nằm trong không gian giới hạn
bởi các hình hộp sẽ được phân loại vào loại tương ứng. Nhũng pixel có giá trị
nằm ngoài tất cả các hình hộp sẽ không được xử lý và được gán nhãn là loại
khác (loại không được quan tâm).
Cách xây dựng hình hộp thông dụng :
- Đối với mỗi lớp đối tượng c tại kênh phổ k: tính giá trị phổ trung bình
μck giá trị độ lệch trung bình σck;
- Pixel sẽ nằm trong lớp k nếu như giá trị độ xám DN thỏa mãn điều kiện
sau:
µ ck − 2σ ck ≤ DN ≤ µ ck + 2σ ck
c – kí hiệu lớp đối tượng;
k – kênh phổ.
2.3.4 Thuật toán khoảng cách ngắn nhất (minimum distance)
Phương pháp phân loại khoảng cách ngắn nhất (Minimum distancce) là
một trong những thuật toán phân loại thông dụng đơn giản nhất;Với mỗi mẫu
phân loại, tính giá trị vector phổ trung bình của lớp;Đối với từng pixel ảnh
D = ( DN ijk − µ ck ) 2 + ( DN ijk − µ cl ) 2
không nằm trong vùng lấy mẫu, tính khoảng cách Euclidean đến vector trung
bình μck. Pixel sẽ thuộc lớp mà khoảng cách đến nó là nhỏ nhât.
Ưu điểm của thuật toán phân loại khoảng cách ngắn nhất là tốc độ tính toán
nhanh, chỉ chậm hơn thuật toán hình hộp. Ngoài ra, tất cả các pixel sẽ được phân
vào loại tương ứng. Tuy nhiên, thuật toán phân loại khoảng cách ngắn nhất cũng
có nhược điểm cơ bản là do không quan tâm đến đặc trưng phân bố của mẫu giải
đoán, vì thế dù khoảng cách ngắn nhất nhưng thực tế pixel không thuộc vào
chính loại đó.
37
Hình 2.8 Ví dụ kết quả phân loại theo thuật toán khoảng cách ngắn nhất
2.3.5 Thuật toán khoảng cách MAHALANOBIS
Phương pháp phân loại tự động có kiểm định dùng thuật toán khoảng cách
Mahalanobis là một trường hợp riêng của thuật toán phân loại khoảng cách ngắn
nhất bằng cách sử dụng ma trận phương sai – hiệp phương sai trong tính toán.
Sau khi lấy dữ liệu mẫu, tiến hành tính khoảng cách Mahalanobis từ các pixel
ảnh nằm ngoài vùng mẫu đến vector phổ trung bình của các vùng mẫu trên.
Pixel sẽ thuộc phân lớp mà khoảng cách Mahalanobis đến nó là ngắn nhất.
Trong đó D làD = ( X − M Mahalanobis, X – M ) lớp c, X – giá trị của
khoảng cách )T (Cov −1)( c − phân
c
c
c
pixel cần tính khoảng cách,
Mc
- giá trị phổ trung bình của mẫu giải đoán phân lớp c,
Covc - ma trận phương sai – hiệp phương sai của mẫu giải đoán phân lớp c,
−
Covc 1 - ma trận nghịch đảo ma trận phương sai – hiệp phương sai,
T – hàm số chuyển đổi ma trận.
Phương pháp phân loại theo khoảng cách Mahalanobis cho kết quả phân
loại chính xác hơn so với thuật toán khoảng cách ngắn nhất và thuật toán hình
hộp do có tính đến ma trận phương sai – hiệp phương sai. Tuy nhiên nhược
điểm của phương pháp này là tốc độ tính toán chậm, trong trường hợp dữ liệu
37
ảnh không theo quy luật phân bố chuẩn Gauss độ chính xác sẽ giảm do ma trận
phương sai – hiệp phương sai có giá trị lớn. Thuật toán khoảng cách
Mahalanobis thường được sử dụng trong trường hợp các kênh ảnh có độ tương
quan không lớn. Nếu độ tương quan giữa các kênh ảnh cao, ta sử dụng khoảng
cách Euclidean. Tình trạng này xảy ra khi phân loại các đối tượng đồng nhất
(thảm thực vật, đất,...).
2.4 XÂY DỰNG PHƯƠNG PHÁP XỬ LÝ ẢNH QUICKBIRD NHẰM TỰ
ĐỘNG HÓA PHÂN LOẠI RỪNG NGẬP MẶN
Nghiên cứu đặc trưng phản xạ phổ của thực vật ngập mặn và nước trên
ảnh QuickBird cho thấy, ở dải phổ đỏ và cận hồng ngoại chứa nhiều thông tin
nhất để phân loại chúng. Từ phân tích đặc trưng phản xạ phổ, trong đồ án đề
xuất phương pháp tự động hóa phân loại thực vật ngập mặn và nước như sau:
Hình 2.9 Mô hình tự động hóa phân loại rừng ngập mặn trên ảnh QuickBird
Bước 1: Lựa chọn các dải sóng mang nhiều thông tin nhât về đối tượng
nghiên cứu.
37
Bước 2: Trừ ảnh: kênh 4 – kênh 3. Trên kết quả trừ ảnh, thực vật có giá trị
dương, nước có giá trị âm
Trừ ảnh: kênh 3 – kênh 4, trên ảnh kết quả, nước có giá trị dương, thực
vật có giá trị âm.
Bước 3: Sử dụng hàm số Step nhằm đưa các pixel có giá trị dương về 1,
các pixel có giá trị âm về 0.
Bước 4: thực hiện tổ hợp màu ảnh nhị phân nhằm thể hiện ranh giới giữa
nước và đất liền kết quả phân loại thực vật ngập mặn.
CHƯƠNG III: PHÂN LOẠI RỪNG NGẬP MẶN BẰNG DỮ LIỆU ẢNH
VỆ TINH QUICBIRD
3.1 Tông quan về khu vực nghiên cứu
Khu vực nghiên cứu được chọn là rừng ngập mặn Sundarbans ở khu vực
biên giới Ấn Độ – Bangladesh. Sundarbans là một trong những khu rừng lớn
nhất trên thế giới (140000 ha), nằm trên vùng đồng bằng của sông Hằng, sông
Brahmaputra và Meghna đổ ra vịnh Bengal. Phần lớn của Sundarbans nằm ở
Bangladesh (ở các phía Đông, Nam, Bắc) trong khi phần còn lại thuộc Tây
Bengal, Ấn Độ) nằm ở phía Tây. Khu vực bao gồm một mạng lưới các kênh
rạch, đảo nhỏ, bãi bùn với hệ thực vật rừng ngập mặn, là khu vực sinh thái điển
hình có sự đa dạng sinh học cao. Đây là khu vực sinh sống của loài hổ Bengal,
các loài bò sát (cá sấu nước mặn, trăn Ấn Độ) cùng 260 loài chim cùng số lượng
lớn các loài động vật không xương sống.
37