1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Công nghệ thông tin >

2 Phát hiện mặt ngƣời trong xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.87 MB, 67 trang )


1.2.2 Những khó khăn của bài toán phát hiện khuôn mặt

Bài toán nhận dạng mặt ngƣời là bài toán đã đƣợc nghiên cứu từ

những năm 70. Tuy nhiên, đây là một bài toán khó nên những nghiên cứu

hiện tại vẫn chƣa đạt đƣợc kết quả mong muốn. Chính vì thế vấn đề này

vẫn đang đƣợc nhiều nhóm trên thế giới quan tâm nghiên cứu. Khó khăn

của bài toán nhận dạng mặt ngƣời nói chung và bài toán phát hiện khuôn

mặt nói riêng có thể kể nhƣ sau:

1.2.2.1 Tƣ thế, góc chụp

Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì góc chụp giữa

camera và khuôn mặt. Chẳng hạn nhƣ: chụp thẳng, chụp nghiêng, chụp từ

trên xuống, chụp từ dƣới lên,... Với các tƣ thế khác nhau, các thành phần

trên khuôn mặt nhƣ mắt, mũi, miệng có thể bị khuất một phần hoặc thậm

chí khuất hết.



Hình 1.3: Hƣớng mặt nghiêng



Hình 1.4: Máy ảnh đặt phía trên và sau lƣng ngƣời chụp

1.2.2.2 Sự xuất hiện hoặc thiếu một số thành phần của khuôn mặt

Các đặc trƣng nhƣ: Râu mép, râu hàm, mắt kính,... có thể xuất hiện

hoặc không. Vấn đề này làm cho bài toán càng trở nên khó hơn rất nhiều.



11



Hình 1.5: Ngƣời đeo kính đen và đội mũ

1.2.2.3 Sự biểu cảm của khuôn mặt

Biểu cảm của khuôn mặt ngƣời có thể làm ảnh hƣởng đáng kể lên

các thông số của khuôn mặt. Chẳng hạn, cùng một khuôn mặt một ngƣời,

nhƣng có thể sẽ rất khác khi họ cƣời hoặc sợ hãi,...



Hình 1.6: Một khuôn mặt biểu cảm phức tạp

1.2.2.4 Sự che khuất:

Khuôn mặt có thể bị che khuất bởi các đối tƣợng khác hoặc các

khuôn mặt khác.



Hình 1.7: Khuôn mặt bị che khuất một phần

12



1.2.2.5 Điều kiện của ảnh

Ảnh đƣợc chụp trong các điều kiện khác nhau về: chiếu sáng, về tính

chất camera (máy kỹ thuật số, máy hồng ngoại,...) ảnh hƣởng rất nhiều đến

chất lƣợng ảnh khuôn mặt.



Hình 1.8: Ảnh chụp trong nhà



Hình 1.9: Ảnh chụp ngoài trời



Hình 1.10: Ảnh chụp ngƣợc sáng

13



Hình 1.11: Ảnh bị chói do đèn

Một vài ví dụ cho việc các hệ thống phát hiện và nhận dạng mặt

ngƣời hoạt động không hiệu quả:

Vào năm 2001, Sở cảnh sát Tampa đã lắp đặt một hệ thống camera

có gắn phần mềm nhận diện khuôn mặt tại quận Ybor City vốn nổi tiếng về

các hoạt động về đêm nhằm giảm bớt tỉ lệ tội phạm trong khu vực này.

Nhƣng kế hoạch này đã hoàn toàn thất bại, và nó bị đình chỉ vào năm 2003

do thiếu hiệu quả. Bởi những ngƣời sống trong khu vực này đã đeo mặt nạ

và thực hiện hành vi phạm tội khiến cho camera không thể nhận diện đƣợc

bất kỳ ai.

Sân bay Logan ở Boston cũng đã nhờ những ngƣời tình nguyện thực

hiện hai bài kiểm tra hệ thống nhận diện khuôn mặt riêng biệt tại các điểm

chốt an ninh của sân bay. Sau một khoảng thời gian kiểm tra 3 tháng, kết

quả thu đƣợc thật đáng thất vọng. Theo nhƣ Trung tâm thông tin bảo mật

điện tử, hệ thống này chỉ đạt tỉ lệ chính xác là 61.4%, buộc các nhà quản lý

sân bay phải tính đến những lựa chọn an ninh khác.



14



CHƢƠNG 2



PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH

THEO HƢỚNG TIẾP CẬN THÀNH PHẦN

2.1 Sử dụng kỹ thuật PCA

2.1.1 Các khái niệm cơ bản

Phần này giới thiệu về các khái niệm toán học sẽ đƣợc sử dụng trong

PCA. Các khái niệm đó bao gồm: Độ lệch chuẩn (Standard deviation),

phƣơng sai (variance), hiệp phƣơng sai (covariance), vec tơ riêng

(eigenvector), giá trị riêng (eigenvalue).

2.1.1.1 Độ lệch chuẩn

Để hiểu độ lệch chuẩn, chúng ta cần một tập dữ liệu. Giả sử

ta có tập:

X = [1 2 4 6 12 15 25 45 68 67 65 98]

X là ký hiệu đại diện cho tập số, mỗi số riêng biệt đƣợc ký hiệu X i

(Ví dụ X3 = 4). Phần tử đầu tiên là X1 và n là số lƣợng phần tử của tập hợp.

Khi đó trung bình của mẫu có công thức:





X



n



i 1



Xi



n



X Là ký hiệu trung bình của mẫu, tuy nhiên trung bình mẫu không



nói lên đƣợc nhiều điều ngoại trừ cho ta biết nó là một điểm giữa. Ví dụ với

hai tập dữ liệu

[0 8 12 20] và



[8 9 11 12]



Có trung bình mẫu bằng nhau nhƣng lại khá khác nhau. Sự khác biệt

ở đây chính là khoảng cách của dữ liệu. Và độ lệch chuẩn là đại lƣợng để

đo khoảng cách này. Ta có thể hiểu độ lệch chuẩn là khoảng cách trung

bình từ trung bình mẫu đến các điểm của dữ liệu.

Ta có công thức: s 







n



i 1



(X i  X i )2

(n  1)



15



Tập hợp 1



X

0

8

12

20

Total

Divided by (n-1)

Square Root



Tập hợp 2



Xi

8

9

11

12

Total

Divided by (n-1)

Square Root



(𝑋 − 𝑋)

-10

-2

2

10



(𝑋 − 𝑋)2

100

4

4

100

208

69.33

8.3266



(𝑋 𝑖 − 𝑋)

-2

-1

1

2



(𝑋 𝑖 − 𝑋)2

4

1

1

4

10

3.333

1.8257



Ta có thể dễ dàng nhận thấy tập dữ liệu 1 có độ lệch chuẩn lớn hơn

có khoảng cách lớn hơn tập dữ liệu 2.

2.1.1.2 Phƣơng sai

Phƣơng sai là một đại lƣợng khác dùng để đo khoảng cách của dữ

liệu. Ta có công thức: s



2









n



i 1



(X i  X )2



(n  1)



.



Dễ thấy phƣơng sai chính là bình phƣơng độ lệch chuẩn.

2.1.1.3 Hiệp phƣơng sai

Ta thấy rằng 2 đại lƣợng độ lệch chuẩn và phƣơng sai chỉ sử dụng

đƣợc trong 1 chiều. Trong thực tế dữ liệu có thể có rất nhiều chiều. Một ví

dụ đơn giản ta có dữ liệu về cân nặng và điểm số của toàn bộ sinh viên

trong lớp K15-T4. Đối với dữ liệu này, độ lệch chuẩn và phƣơng sai chỉ

tính đƣợc trên từng chiều riêng biệt và ta không thấy đƣợc mối liên hệ giữa

2 chiều này.



16



Xem Thêm
Tải bản đầy đủ (.pdf) (67 trang)

×