3 Các phương pháp phân loại ảnh viễn thám

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.42 MB, 56 trang )

Giả sử số lớp đối tượng cần phân loại trên ảnh viễn thám trong phương

pháp phân loại không kiểm định là k:

• Chọn ra k vector làm tâm (mean) cho k lớp khởi đầu. Giá trị vector tâm

được xem là giá trị trung bình của lớp;

• Tính khoảng cách từ mỗi vector pixel đến vector trung bình của lớp đó (thực

hiện với tất cả các vector trong một lần lặp). Nếu khoảng cách này là nhỏ nhất,

pixel đó thuộc lớp đã cho;

• Tính lại trung bình của nhóm mới hình thành;

• Nếu tất cả các tâm giữ nguyên, thuật toán K – means dừng. Nếu không, quay

lại bước 2 và tiếp tục cho đến khi kết quả ổn định.

Hình 2.4 Ảnh Landsat khu vực Nam trung bộ (2001) và kết quả giải đoán không kiểm định

theo thuật toán K – means (5 lớp, số lần lặp 5)

Sau phân loại ảnh không kiểm định bằng thuật toán K – means, cần phải

xem xét các lớp:

1. Lớp có quá ít phần tử có thể bỏ;

2. Hai lớp có đặc trưng gần giống nhau có thể kết hợp chúng lại một;

3. Một lớp nào đó quá lớn có thể chia nhỏ thành các lớp khác nhau.

Số các lớp do người giải đoán định trước; Số lần lặp càng lớn, kết quả

càng chính xác nhưng cần nhiều thời gian giải đoán hơn.

37

 Thuật toán ISODATA

Thuật toán phân loại không kiểm định ISODATA được Duda và Hart đề

xuất năm 1973 mang đặc tính của cả phương pháp phân loại không kiểm định và

phân loại có kiểm định. ISODATA được xây dựng trên cơ sở thuật toán K –

means nhưng bổ sung thêm 3 quá trình: khử cụm, tách cụm, gom cụm. Thuật

toán này được xem như là dạng của phương pháp phân loại khoảng cách ngắn

nhất trong phân loại có kiểm định. Phương pháp phân loại Isodata sẽ tính toán

cách thức phân lớp trong không gian dữ liệu, sau đó nhóm đi nhóm lại các pixel

bằng kỹ thuật khoảng cách tối thiểu (minimum distance). Mỗi lần nhóm lại các

lớp này sẽ tính toán lại cách thức phân lớp và phân loại lại các pixel theo cách

thức phân lớp mới. Quá trình này sẽ tiếp tục lặp đi lặp lại đến khi số các pixel

trong mỗi lớp nhỏ hơn ngưỡng thay đổi pixel đã chọn hoặc đạt tối đa số lần lặp

đi lặp lại đó. Để tiến hành phân loại không kiểm định dùng thuật toán

ISODATA đầu vào cần các thông số sau:

1.N là số phân lớp lớn nhất được xác định trên ảnh. Mỗi phân lớp được coi

ứng với mỗi đối tượng cần giải đoán. Như vậy, số lượng tối đa số đối

tượng cần giải đoán trên ảnh vệ tinh là N. Thuật toán ISODATA bắt đầu

với việc chọn N điểm ảnh nào đó như là trọng tâm của N lớp. Trong

trường hợp phân lớp nào đó chứa quá ít phần tử (pixel) có thể bỏ qua và

số lượng phân lớp sẽ nhỏ hơn N.

2. T là ngưỡng – khoảng cách lớn nhất giữa các pixel để chúng có thể nằm

trong một phân lớp.

3. M là số lần lặp tối đa.

37

Hình 2.5 Sơ đồ thuật toán ISODATA

Hình 2.6: Ảnh Landsat khu vực Nam trung bộ (2001) và kết quả giải đoán không kiểm

định theo thuật toán Isodata (5 lớp, số lần lặp 5)

2.3.2 Phân loại bằng thuật toán xác suất cực đại (maximum likehood)

Trong viễn thám và được xem như thuật toán chuẩn để so sánh với các

thuật toán khác. Trong phương pháp này, mỗi pixel được tính xác suất thuộc

37

một lớp nào đó và được gán vào lớp có xác suất cao nhât; Thuật toán xác suất

cực đại (Maximum likelihood) được sử dụng rất thông dụng Thuật toán xác suất

cực đại có rất nhiều ưu việt nếu xét theo quan điểm xác suất. So với các thuật

toán phân loại tự động có kiểm định khác, độ chính xác của kết quả phân loại

dùng thuật toán xác suất cực đại là cao hơn.

Giả sử ta có lớp Ωk. Khi đấy, xác suất để một pixel ảnh nào đó nằm trong

lớp Ωk được xác định dựa trên công thức Bayer:

P(Ω ) * p( xi / Ω )

k

k

p(Ω / xi ) =

k

k

∑ P(Ω j ) * p( xi / Ω j )

j =1

Trong đó P(Ωi) là xác suất tiền định của loại Ω (ví dụ 50% xác suất thuộc

loại A thì P(ΩA) = 0.5). P(xj/ Ωk) – xác suất điều kiện có thể xem x thuộc loại

k

Ω.Thông thường P(Ωk) và ∑ P(Ω ) * p( x / Ω )

được xem như bằng nhau

j

i

j

j =1

cho tất cả các

loại Ωk, do đó P(Ωk/xi) chỉ phụ thuộc vào P(xi/ Ωk). Khi đó pixel xi sẽ

nằm trong lớp mà nó có xác suất cao nhất. Trong phương pháp này, ngoài xác

suất xuất hiện của pixel trong một lớp còn sử dụng xác suất xuất hiện của một

lớp trong vùng P(Ωk).Trong trường hợp dữ liệu ảnh phân bố theo quy luật chuẩn

Gauss, xác suất P(Ωk/xi) có thể được viết như sau:

1

−

exp{− ( X − µ c ).Covc 1( X − µ c )T }

k

1

2

(2π ) 2 . | Cov | 2

c

Những chú ý khi dùng thuật toán xác suất cực đại

p(Ω / xi ) =

k



1

Số lượng pixel trong mẫu giải đoán (kích thước mẫu giải đoán) phải đủ

lớn để các giá trị trung bình, ma trận phương sai, hiệp phương sai tính cho một

lớp nào đó có giá trị đúng với thực tiễn;

Nếu tương quan giữa các kênh ảnh là gần nhau, ma trận nghịch đảo của

ma trận phương sai và hiệp phương sai sẽ không ổn định. Trong trường hợp này

để nâng cao độ chính xác của kết quả phân loại cần phải giảm số kênh của ảnh

bằng phương pháp phân tích thành phần chính (PCA).

37

Phương pháp phân loại xác suất tối đa chỉ tối ưu trên cơ sở giả thuyết

phân bố dữ liệu theo luật phân bố chuẩn Gauss. Trong trường hợp dữ liệu ảnh

không phân bố theo quy luật chuẩn Gauss thì không nên dùng phương pháp

phân loại này.

Hình 2.7: Kết quả Giải đoán ảnh theo thuật toán Maximum Likelihood (ảnh

Landsat,1977, Elkton, Maryland).

2.3.3 Thuật toán phân loại hình hộp (PARALLEPIPED)

Thuật toán phân loại hình hộp (parallelepiped) là một trong những thuật

toán được ứng dụng rộng rãi nhất trong phân loại tự động có kiểm định ảnh viễn

thám.

Ưu điểm của thuật toán này là đơn giản và dễ hiểu, khả năng tính toán

nhanh so với các thuật toán phân loại khác.

nhược điểm cơ bản: kết quả giải đoán không cao trong trường hợp có sự

tương quan giữa hai kênh ảnh. Ngoài ra, do khoảng chia cách giữa các hình hộp

là đáng kể, những pixel nằm trong vùng này sẽ không được xử lý. Trong một

trường hợp khác, khi có sự trùng lắp phần nào giữa hai hình hộp, thuật toán

phân loại hình hộp sẽ chỉ định pixel vào hộp đầu tiên.

Để xây dựng hình hộp cho từng loại đối tượng cần phải xác định được

kích thước các cạnh của hình hộp. Kích thước của hình hộp có thể xác định bằng

37

nhiều cách khác nhau (giá trị phổ lớn nhất và nhỏ nhất của mẫu giải đoán; do

người giải đoán tự đặt,...). Các pixel có giá trị nằm trong không gian giới hạn

bởi các hình hộp sẽ được phân loại vào loại tương ứng. Nhũng pixel có giá trị

nằm ngoài tất cả các hình hộp sẽ không được xử lý và được gán nhãn là loại

khác (loại không được quan tâm).

Cách xây dựng hình hộp thông dụng :

- Đối với mỗi lớp đối tượng c tại kênh phổ k: tính giá trị phổ trung bình

μck giá trị độ lệch trung bình σck;

- Pixel sẽ nằm trong lớp k nếu như giá trị độ xám DN thỏa mãn điều kiện

sau:

µ ck − 2σ ck ≤ DN ≤ µ ck + 2σ ck

c – kí hiệu lớp đối tượng;

k – kênh phổ.

2.3.4 Thuật toán khoảng cách ngắn nhất (minimum distance)

Phương pháp phân loại khoảng cách ngắn nhất (Minimum distancce) là

một trong những thuật toán phân loại thông dụng đơn giản nhất;Với mỗi mẫu

phân loại, tính giá trị vector phổ trung bình của lớp;Đối với từng pixel ảnh

D = ( DN ijk − µ ck ) 2 + ( DN ijk − µ cl ) 2

không nằm trong vùng lấy mẫu, tính khoảng cách Euclidean đến vector trung

bình μck. Pixel sẽ thuộc lớp mà khoảng cách đến nó là nhỏ nhât.

Ưu điểm của thuật toán phân loại khoảng cách ngắn nhất là tốc độ tính toán

nhanh, chỉ chậm hơn thuật toán hình hộp. Ngoài ra, tất cả các pixel sẽ được phân

vào loại tương ứng. Tuy nhiên, thuật toán phân loại khoảng cách ngắn nhất cũng

có nhược điểm cơ bản là do không quan tâm đến đặc trưng phân bố của mẫu giải

đoán, vì thế dù khoảng cách ngắn nhất nhưng thực tế pixel không thuộc vào

chính loại đó.

37

Hình 2.8 Ví dụ kết quả phân loại theo thuật toán khoảng cách ngắn nhất

2.3.5 Thuật toán khoảng cách MAHALANOBIS

Phương pháp phân loại tự động có kiểm định dùng thuật toán khoảng cách

Mahalanobis là một trường hợp riêng của thuật toán phân loại khoảng cách ngắn

nhất bằng cách sử dụng ma trận phương sai – hiệp phương sai trong tính toán.

Sau khi lấy dữ liệu mẫu, tiến hành tính khoảng cách Mahalanobis từ các pixel

ảnh nằm ngoài vùng mẫu đến vector phổ trung bình của các vùng mẫu trên.

Pixel sẽ thuộc phân lớp mà khoảng cách Mahalanobis đến nó là ngắn nhất.

Trong đó D làD = ( X − M Mahalanobis, X – M ) lớp c, X – giá trị của

khoảng cách )T (Cov −1)( c − phân

c

c

c

pixel cần tính khoảng cách,

Mc

- giá trị phổ trung bình của mẫu giải đoán phân lớp c,

Covc - ma trận phương sai – hiệp phương sai của mẫu giải đoán phân lớp c,

−

Covc 1 - ma trận nghịch đảo ma trận phương sai – hiệp phương sai,

T – hàm số chuyển đổi ma trận.

Phương pháp phân loại theo khoảng cách Mahalanobis cho kết quả phân

loại chính xác hơn so với thuật toán khoảng cách ngắn nhất và thuật toán hình

hộp do có tính đến ma trận phương sai – hiệp phương sai. Tuy nhiên nhược

điểm của phương pháp này là tốc độ tính toán chậm, trong trường hợp dữ liệu

37

ảnh không theo quy luật phân bố chuẩn Gauss độ chính xác sẽ giảm do ma trận

phương sai – hiệp phương sai có giá trị lớn. Thuật toán khoảng cách

Mahalanobis thường được sử dụng trong trường hợp các kênh ảnh có độ tương

quan không lớn. Nếu độ tương quan giữa các kênh ảnh cao, ta sử dụng khoảng

cách Euclidean. Tình trạng này xảy ra khi phân loại các đối tượng đồng nhất

(thảm thực vật, đất,...).

2.4 XÂY DỰNG PHƯƠNG PHÁP XỬ LÝ ẢNH QUICKBIRD NHẰM TỰ

ĐỘNG HÓA PHÂN LOẠI RỪNG NGẬP MẶN

Nghiên cứu đặc trưng phản xạ phổ của thực vật ngập mặn và nước trên

ảnh QuickBird cho thấy, ở dải phổ đỏ và cận hồng ngoại chứa nhiều thông tin

nhất để phân loại chúng. Từ phân tích đặc trưng phản xạ phổ, trong đồ án đề

xuất phương pháp tự động hóa phân loại thực vật ngập mặn và nước như sau:

Hình 2.9 Mô hình tự động hóa phân loại rừng ngập mặn trên ảnh QuickBird

Bước 1: Lựa chọn các dải sóng mang nhiều thông tin nhât về đối tượng

nghiên cứu.

37

Bước 2: Trừ ảnh: kênh 4 – kênh 3. Trên kết quả trừ ảnh, thực vật có giá trị

dương, nước có giá trị âm

Trừ ảnh: kênh 3 – kênh 4, trên ảnh kết quả, nước có giá trị dương, thực

vật có giá trị âm.

Bước 3: Sử dụng hàm số Step nhằm đưa các pixel có giá trị dương về 1,

các pixel có giá trị âm về 0.

Bước 4: thực hiện tổ hợp màu ảnh nhị phân nhằm thể hiện ranh giới giữa

nước và đất liền  kết quả phân loại thực vật ngập mặn.

CHƯƠNG III: PHÂN LOẠI RỪNG NGẬP MẶN BẰNG DỮ LIỆU ẢNH

VỆ TINH QUICBIRD

3.1 Tông quan về khu vực nghiên cứu

Khu vực nghiên cứu được chọn là rừng ngập mặn Sundarbans ở khu vực

biên giới Ấn Độ – Bangladesh. Sundarbans là một trong những khu rừng lớn

nhất trên thế giới (140000 ha), nằm trên vùng đồng bằng của sông Hằng, sông

Brahmaputra và Meghna đổ ra vịnh Bengal. Phần lớn của Sundarbans nằm ở

Bangladesh (ở các phía Đông, Nam, Bắc) trong khi phần còn lại thuộc Tây

Bengal, Ấn Độ) nằm ở phía Tây. Khu vực bao gồm một mạng lưới các kênh

rạch, đảo nhỏ, bãi bùn với hệ thực vật rừng ngập mặn, là khu vực sinh thái điển

hình có sự đa dạng sinh học cao. Đây là khu vực sinh sống của loài hổ Bengal,

các loài bò sát (cá sấu nước mặn, trăn Ấn Độ) cùng 260 loài chim cùng số lượng

lớn các loài động vật không xương sống.

37

Xem Thêm

3 Các phương pháp phân loại ảnh viễn thám

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về