1. Trang chủ >
  2. Công nghệ thông tin >
  3. Đồ họa >

3 Các phương pháp phân loại ảnh viễn thám

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.42 MB, 56 trang )


Giả sử số lớp đối tượng cần phân loại trên ảnh viễn thám trong phương

pháp phân loại không kiểm định là k:

• Chọn ra k vector làm tâm (mean) cho k lớp khởi đầu. Giá trị vector tâm

được xem là giá trị trung bình của lớp;

• Tính khoảng cách từ mỗi vector pixel đến vector trung bình của lớp đó (thực

hiện với tất cả các vector trong một lần lặp). Nếu khoảng cách này là nhỏ nhất,

pixel đó thuộc lớp đã cho;

• Tính lại trung bình của nhóm mới hình thành;

• Nếu tất cả các tâm giữ nguyên, thuật toán K – means dừng. Nếu không, quay

lại bước 2 và tiếp tục cho đến khi kết quả ổn định.



Hình 2.4 Ảnh Landsat khu vực Nam trung bộ (2001) và kết quả giải đoán không kiểm định

theo thuật toán K – means (5 lớp, số lần lặp 5)



Sau phân loại ảnh không kiểm định bằng thuật toán K – means, cần phải

xem xét các lớp:

1. Lớp có quá ít phần tử có thể bỏ;

2. Hai lớp có đặc trưng gần giống nhau có thể kết hợp chúng lại một;

3. Một lớp nào đó quá lớn có thể chia nhỏ thành các lớp khác nhau.

Số các lớp do người giải đoán định trước; Số lần lặp càng lớn, kết quả

càng chính xác nhưng cần nhiều thời gian giải đoán hơn.

37



 Thuật toán ISODATA

Thuật toán phân loại không kiểm định ISODATA được Duda và Hart đề

xuất năm 1973 mang đặc tính của cả phương pháp phân loại không kiểm định và

phân loại có kiểm định. ISODATA được xây dựng trên cơ sở thuật toán K –

means nhưng bổ sung thêm 3 quá trình: khử cụm, tách cụm, gom cụm. Thuật

toán này được xem như là dạng của phương pháp phân loại khoảng cách ngắn

nhất trong phân loại có kiểm định. Phương pháp phân loại Isodata sẽ tính toán

cách thức phân lớp trong không gian dữ liệu, sau đó nhóm đi nhóm lại các pixel

bằng kỹ thuật khoảng cách tối thiểu (minimum distance). Mỗi lần nhóm lại các

lớp này sẽ tính toán lại cách thức phân lớp và phân loại lại các pixel theo cách

thức phân lớp mới. Quá trình này sẽ tiếp tục lặp đi lặp lại đến khi số các pixel

trong mỗi lớp nhỏ hơn ngưỡng thay đổi pixel đã chọn hoặc đạt tối đa số lần lặp

đi lặp lại đó. Để tiến hành phân loại không kiểm định dùng thuật toán

ISODATA đầu vào cần các thông số sau:

1.N là số phân lớp lớn nhất được xác định trên ảnh. Mỗi phân lớp được coi

ứng với mỗi đối tượng cần giải đoán. Như vậy, số lượng tối đa số đối

tượng cần giải đoán trên ảnh vệ tinh là N. Thuật toán ISODATA bắt đầu

với việc chọn N điểm ảnh nào đó như là trọng tâm của N lớp. Trong

trường hợp phân lớp nào đó chứa quá ít phần tử (pixel) có thể bỏ qua và

số lượng phân lớp sẽ nhỏ hơn N.

2. T là ngưỡng – khoảng cách lớn nhất giữa các pixel để chúng có thể nằm

trong một phân lớp.

3. M là số lần lặp tối đa.



37



Hình 2.5 Sơ đồ thuật toán ISODATA



Hình 2.6: Ảnh Landsat khu vực Nam trung bộ (2001) và kết quả giải đoán không kiểm

định theo thuật toán Isodata (5 lớp, số lần lặp 5)



2.3.2 Phân loại bằng thuật toán xác suất cực đại (maximum likehood)

Trong viễn thám và được xem như thuật toán chuẩn để so sánh với các

thuật toán khác. Trong phương pháp này, mỗi pixel được tính xác suất thuộc

37



một lớp nào đó và được gán vào lớp có xác suất cao nhât; Thuật toán xác suất

cực đại (Maximum likelihood) được sử dụng rất thông dụng Thuật toán xác suất

cực đại có rất nhiều ưu việt nếu xét theo quan điểm xác suất. So với các thuật

toán phân loại tự động có kiểm định khác, độ chính xác của kết quả phân loại

dùng thuật toán xác suất cực đại là cao hơn.

Giả sử ta có lớp Ωk. Khi đấy, xác suất để một pixel ảnh nào đó nằm trong

lớp Ωk được xác định dựa trên công thức Bayer:

P(Ω ) * p( xi / Ω )

k

k

p(Ω / xi ) =

k

k

∑ P(Ω j ) * p( xi / Ω j )

j =1

Trong đó P(Ωi) là xác suất tiền định của loại Ω (ví dụ 50% xác suất thuộc

loại A thì P(ΩA) = 0.5). P(xj/ Ωk) – xác suất điều kiện có thể xem x thuộc loại

k

Ω.Thông thường P(Ωk) và ∑ P(Ω ) * p( x / Ω )

được xem như bằng nhau

j

i

j

j =1

cho tất cả các

loại Ωk, do đó P(Ωk/xi) chỉ phụ thuộc vào P(xi/ Ωk). Khi đó pixel xi sẽ

nằm trong lớp mà nó có xác suất cao nhất. Trong phương pháp này, ngoài xác

suất xuất hiện của pixel trong một lớp còn sử dụng xác suất xuất hiện của một

lớp trong vùng P(Ωk).Trong trường hợp dữ liệu ảnh phân bố theo quy luật chuẩn

Gauss, xác suất P(Ωk/xi) có thể được viết như sau:

1



exp{− ( X − µ c ).Covc 1( X − µ c )T }

k

1

2

(2π ) 2 . | Cov | 2

c

Những chú ý khi dùng thuật toán xác suất cực đại



p(Ω / xi ) =

k





1



Số lượng pixel trong mẫu giải đoán (kích thước mẫu giải đoán) phải đủ

lớn để các giá trị trung bình, ma trận phương sai, hiệp phương sai tính cho một

lớp nào đó có giá trị đúng với thực tiễn;

Nếu tương quan giữa các kênh ảnh là gần nhau, ma trận nghịch đảo của

ma trận phương sai và hiệp phương sai sẽ không ổn định. Trong trường hợp này

để nâng cao độ chính xác của kết quả phân loại cần phải giảm số kênh của ảnh

bằng phương pháp phân tích thành phần chính (PCA).

37



Phương pháp phân loại xác suất tối đa chỉ tối ưu trên cơ sở giả thuyết

phân bố dữ liệu theo luật phân bố chuẩn Gauss. Trong trường hợp dữ liệu ảnh

không phân bố theo quy luật chuẩn Gauss thì không nên dùng phương pháp

phân loại này.



Hình 2.7: Kết quả Giải đoán ảnh theo thuật toán Maximum Likelihood (ảnh

Landsat,1977, Elkton, Maryland).



2.3.3 Thuật toán phân loại hình hộp (PARALLEPIPED)

Thuật toán phân loại hình hộp (parallelepiped) là một trong những thuật

toán được ứng dụng rộng rãi nhất trong phân loại tự động có kiểm định ảnh viễn

thám.

Ưu điểm của thuật toán này là đơn giản và dễ hiểu, khả năng tính toán

nhanh so với các thuật toán phân loại khác.

nhược điểm cơ bản: kết quả giải đoán không cao trong trường hợp có sự

tương quan giữa hai kênh ảnh. Ngoài ra, do khoảng chia cách giữa các hình hộp

là đáng kể, những pixel nằm trong vùng này sẽ không được xử lý. Trong một

trường hợp khác, khi có sự trùng lắp phần nào giữa hai hình hộp, thuật toán

phân loại hình hộp sẽ chỉ định pixel vào hộp đầu tiên.

Để xây dựng hình hộp cho từng loại đối tượng cần phải xác định được

kích thước các cạnh của hình hộp. Kích thước của hình hộp có thể xác định bằng

37



nhiều cách khác nhau (giá trị phổ lớn nhất và nhỏ nhất của mẫu giải đoán; do

người giải đoán tự đặt,...). Các pixel có giá trị nằm trong không gian giới hạn

bởi các hình hộp sẽ được phân loại vào loại tương ứng. Nhũng pixel có giá trị

nằm ngoài tất cả các hình hộp sẽ không được xử lý và được gán nhãn là loại

khác (loại không được quan tâm).

Cách xây dựng hình hộp thông dụng :

- Đối với mỗi lớp đối tượng c tại kênh phổ k: tính giá trị phổ trung bình

μck giá trị độ lệch trung bình σck;

- Pixel sẽ nằm trong lớp k nếu như giá trị độ xám DN thỏa mãn điều kiện

sau:



µ ck − 2σ ck ≤ DN ≤ µ ck + 2σ ck

c – kí hiệu lớp đối tượng;

k – kênh phổ.

2.3.4 Thuật toán khoảng cách ngắn nhất (minimum distance)

Phương pháp phân loại khoảng cách ngắn nhất (Minimum distancce) là

một trong những thuật toán phân loại thông dụng đơn giản nhất;Với mỗi mẫu

phân loại, tính giá trị vector phổ trung bình của lớp;Đối với từng pixel ảnh



D = ( DN ijk − µ ck ) 2 + ( DN ijk − µ cl ) 2

không nằm trong vùng lấy mẫu, tính khoảng cách Euclidean đến vector trung

bình μck. Pixel sẽ thuộc lớp mà khoảng cách đến nó là nhỏ nhât.

Ưu điểm của thuật toán phân loại khoảng cách ngắn nhất là tốc độ tính toán

nhanh, chỉ chậm hơn thuật toán hình hộp. Ngoài ra, tất cả các pixel sẽ được phân

vào loại tương ứng. Tuy nhiên, thuật toán phân loại khoảng cách ngắn nhất cũng

có nhược điểm cơ bản là do không quan tâm đến đặc trưng phân bố của mẫu giải

đoán, vì thế dù khoảng cách ngắn nhất nhưng thực tế pixel không thuộc vào

chính loại đó.

37



Hình 2.8 Ví dụ kết quả phân loại theo thuật toán khoảng cách ngắn nhất



2.3.5 Thuật toán khoảng cách MAHALANOBIS

Phương pháp phân loại tự động có kiểm định dùng thuật toán khoảng cách

Mahalanobis là một trường hợp riêng của thuật toán phân loại khoảng cách ngắn

nhất bằng cách sử dụng ma trận phương sai – hiệp phương sai trong tính toán.

Sau khi lấy dữ liệu mẫu, tiến hành tính khoảng cách Mahalanobis từ các pixel

ảnh nằm ngoài vùng mẫu đến vector phổ trung bình của các vùng mẫu trên.

Pixel sẽ thuộc phân lớp mà khoảng cách Mahalanobis đến nó là ngắn nhất.

Trong đó D làD = ( X − M Mahalanobis, X – M ) lớp c, X – giá trị của

khoảng cách )T (Cov −1)( c − phân

c

c

c

pixel cần tính khoảng cách,

Mc



- giá trị phổ trung bình của mẫu giải đoán phân lớp c,



Covc - ma trận phương sai – hiệp phương sai của mẫu giải đoán phân lớp c,



Covc 1 - ma trận nghịch đảo ma trận phương sai – hiệp phương sai,

T – hàm số chuyển đổi ma trận.

Phương pháp phân loại theo khoảng cách Mahalanobis cho kết quả phân

loại chính xác hơn so với thuật toán khoảng cách ngắn nhất và thuật toán hình

hộp do có tính đến ma trận phương sai – hiệp phương sai. Tuy nhiên nhược

điểm của phương pháp này là tốc độ tính toán chậm, trong trường hợp dữ liệu



37



ảnh không theo quy luật phân bố chuẩn Gauss độ chính xác sẽ giảm do ma trận

phương sai – hiệp phương sai có giá trị lớn. Thuật toán khoảng cách

Mahalanobis thường được sử dụng trong trường hợp các kênh ảnh có độ tương

quan không lớn. Nếu độ tương quan giữa các kênh ảnh cao, ta sử dụng khoảng

cách Euclidean. Tình trạng này xảy ra khi phân loại các đối tượng đồng nhất

(thảm thực vật, đất,...).

2.4 XÂY DỰNG PHƯƠNG PHÁP XỬ LÝ ẢNH QUICKBIRD NHẰM TỰ

ĐỘNG HÓA PHÂN LOẠI RỪNG NGẬP MẶN

Nghiên cứu đặc trưng phản xạ phổ của thực vật ngập mặn và nước trên

ảnh QuickBird cho thấy, ở dải phổ đỏ và cận hồng ngoại chứa nhiều thông tin

nhất để phân loại chúng. Từ phân tích đặc trưng phản xạ phổ, trong đồ án đề

xuất phương pháp tự động hóa phân loại thực vật ngập mặn và nước như sau:



Hình 2.9 Mô hình tự động hóa phân loại rừng ngập mặn trên ảnh QuickBird



Bước 1: Lựa chọn các dải sóng mang nhiều thông tin nhât về đối tượng

nghiên cứu.



37



Bước 2: Trừ ảnh: kênh 4 – kênh 3. Trên kết quả trừ ảnh, thực vật có giá trị

dương, nước có giá trị âm

Trừ ảnh: kênh 3 – kênh 4, trên ảnh kết quả, nước có giá trị dương, thực

vật có giá trị âm.

Bước 3: Sử dụng hàm số Step nhằm đưa các pixel có giá trị dương về 1,

các pixel có giá trị âm về 0.

Bước 4: thực hiện tổ hợp màu ảnh nhị phân nhằm thể hiện ranh giới giữa

nước và đất liền  kết quả phân loại thực vật ngập mặn.



CHƯƠNG III: PHÂN LOẠI RỪNG NGẬP MẶN BẰNG DỮ LIỆU ẢNH

VỆ TINH QUICBIRD

3.1 Tông quan về khu vực nghiên cứu

Khu vực nghiên cứu được chọn là rừng ngập mặn Sundarbans ở khu vực

biên giới Ấn Độ – Bangladesh. Sundarbans là một trong những khu rừng lớn

nhất trên thế giới (140000 ha), nằm trên vùng đồng bằng của sông Hằng, sông

Brahmaputra và Meghna đổ ra vịnh Bengal. Phần lớn của Sundarbans nằm ở

Bangladesh (ở các phía Đông, Nam, Bắc) trong khi phần còn lại thuộc Tây

Bengal, Ấn Độ) nằm ở phía Tây. Khu vực bao gồm một mạng lưới các kênh

rạch, đảo nhỏ, bãi bùn với hệ thực vật rừng ngập mặn, là khu vực sinh thái điển

hình có sự đa dạng sinh học cao. Đây là khu vực sinh sống của loài hổ Bengal,

các loài bò sát (cá sấu nước mặn, trăn Ấn Độ) cùng 260 loài chim cùng số lượng

lớn các loài động vật không xương sống.



37



Xem Thêm
Tải bản đầy đủ (.doc) (56 trang)

×