Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.87 MB, 67 trang )
1.2.2 Những khó khăn của bài toán phát hiện khuôn mặt
Bài toán nhận dạng mặt ngƣời là bài toán đã đƣợc nghiên cứu từ
những năm 70. Tuy nhiên, đây là một bài toán khó nên những nghiên cứu
hiện tại vẫn chƣa đạt đƣợc kết quả mong muốn. Chính vì thế vấn đề này
vẫn đang đƣợc nhiều nhóm trên thế giới quan tâm nghiên cứu. Khó khăn
của bài toán nhận dạng mặt ngƣời nói chung và bài toán phát hiện khuôn
mặt nói riêng có thể kể nhƣ sau:
1.2.2.1 Tƣ thế, góc chụp
Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì góc chụp giữa
camera và khuôn mặt. Chẳng hạn nhƣ: chụp thẳng, chụp nghiêng, chụp từ
trên xuống, chụp từ dƣới lên,... Với các tƣ thế khác nhau, các thành phần
trên khuôn mặt nhƣ mắt, mũi, miệng có thể bị khuất một phần hoặc thậm
chí khuất hết.
Hình 1.3: Hƣớng mặt nghiêng
Hình 1.4: Máy ảnh đặt phía trên và sau lƣng ngƣời chụp
1.2.2.2 Sự xuất hiện hoặc thiếu một số thành phần của khuôn mặt
Các đặc trƣng nhƣ: Râu mép, râu hàm, mắt kính,... có thể xuất hiện
hoặc không. Vấn đề này làm cho bài toán càng trở nên khó hơn rất nhiều.
11
Hình 1.5: Ngƣời đeo kính đen và đội mũ
1.2.2.3 Sự biểu cảm của khuôn mặt
Biểu cảm của khuôn mặt ngƣời có thể làm ảnh hƣởng đáng kể lên
các thông số của khuôn mặt. Chẳng hạn, cùng một khuôn mặt một ngƣời,
nhƣng có thể sẽ rất khác khi họ cƣời hoặc sợ hãi,...
Hình 1.6: Một khuôn mặt biểu cảm phức tạp
1.2.2.4 Sự che khuất:
Khuôn mặt có thể bị che khuất bởi các đối tƣợng khác hoặc các
khuôn mặt khác.
Hình 1.7: Khuôn mặt bị che khuất một phần
12
1.2.2.5 Điều kiện của ảnh
Ảnh đƣợc chụp trong các điều kiện khác nhau về: chiếu sáng, về tính
chất camera (máy kỹ thuật số, máy hồng ngoại,...) ảnh hƣởng rất nhiều đến
chất lƣợng ảnh khuôn mặt.
Hình 1.8: Ảnh chụp trong nhà
Hình 1.9: Ảnh chụp ngoài trời
Hình 1.10: Ảnh chụp ngƣợc sáng
13
Hình 1.11: Ảnh bị chói do đèn
Một vài ví dụ cho việc các hệ thống phát hiện và nhận dạng mặt
ngƣời hoạt động không hiệu quả:
Vào năm 2001, Sở cảnh sát Tampa đã lắp đặt một hệ thống camera
có gắn phần mềm nhận diện khuôn mặt tại quận Ybor City vốn nổi tiếng về
các hoạt động về đêm nhằm giảm bớt tỉ lệ tội phạm trong khu vực này.
Nhƣng kế hoạch này đã hoàn toàn thất bại, và nó bị đình chỉ vào năm 2003
do thiếu hiệu quả. Bởi những ngƣời sống trong khu vực này đã đeo mặt nạ
và thực hiện hành vi phạm tội khiến cho camera không thể nhận diện đƣợc
bất kỳ ai.
Sân bay Logan ở Boston cũng đã nhờ những ngƣời tình nguyện thực
hiện hai bài kiểm tra hệ thống nhận diện khuôn mặt riêng biệt tại các điểm
chốt an ninh của sân bay. Sau một khoảng thời gian kiểm tra 3 tháng, kết
quả thu đƣợc thật đáng thất vọng. Theo nhƣ Trung tâm thông tin bảo mật
điện tử, hệ thống này chỉ đạt tỉ lệ chính xác là 61.4%, buộc các nhà quản lý
sân bay phải tính đến những lựa chọn an ninh khác.
14
CHƢƠNG 2
PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH
THEO HƢỚNG TIẾP CẬN THÀNH PHẦN
2.1 Sử dụng kỹ thuật PCA
2.1.1 Các khái niệm cơ bản
Phần này giới thiệu về các khái niệm toán học sẽ đƣợc sử dụng trong
PCA. Các khái niệm đó bao gồm: Độ lệch chuẩn (Standard deviation),
phƣơng sai (variance), hiệp phƣơng sai (covariance), vec tơ riêng
(eigenvector), giá trị riêng (eigenvalue).
2.1.1.1 Độ lệch chuẩn
Để hiểu độ lệch chuẩn, chúng ta cần một tập dữ liệu. Giả sử
ta có tập:
X = [1 2 4 6 12 15 25 45 68 67 65 98]
X là ký hiệu đại diện cho tập số, mỗi số riêng biệt đƣợc ký hiệu X i
(Ví dụ X3 = 4). Phần tử đầu tiên là X1 và n là số lƣợng phần tử của tập hợp.
Khi đó trung bình của mẫu có công thức:
X
n
i 1
Xi
n
X Là ký hiệu trung bình của mẫu, tuy nhiên trung bình mẫu không
nói lên đƣợc nhiều điều ngoại trừ cho ta biết nó là một điểm giữa. Ví dụ với
hai tập dữ liệu
[0 8 12 20] và
[8 9 11 12]
Có trung bình mẫu bằng nhau nhƣng lại khá khác nhau. Sự khác biệt
ở đây chính là khoảng cách của dữ liệu. Và độ lệch chuẩn là đại lƣợng để
đo khoảng cách này. Ta có thể hiểu độ lệch chuẩn là khoảng cách trung
bình từ trung bình mẫu đến các điểm của dữ liệu.
Ta có công thức: s
n
i 1
(X i X i )2
(n 1)
15
Tập hợp 1
X
0
8
12
20
Total
Divided by (n-1)
Square Root
Tập hợp 2
Xi
8
9
11
12
Total
Divided by (n-1)
Square Root
(𝑋 − 𝑋)
-10
-2
2
10
(𝑋 − 𝑋)2
100
4
4
100
208
69.33
8.3266
(𝑋 𝑖 − 𝑋)
-2
-1
1
2
(𝑋 𝑖 − 𝑋)2
4
1
1
4
10
3.333
1.8257
Ta có thể dễ dàng nhận thấy tập dữ liệu 1 có độ lệch chuẩn lớn hơn
có khoảng cách lớn hơn tập dữ liệu 2.
2.1.1.2 Phƣơng sai
Phƣơng sai là một đại lƣợng khác dùng để đo khoảng cách của dữ
liệu. Ta có công thức: s
2
n
i 1
(X i X )2
(n 1)
.
Dễ thấy phƣơng sai chính là bình phƣơng độ lệch chuẩn.
2.1.1.3 Hiệp phƣơng sai
Ta thấy rằng 2 đại lƣợng độ lệch chuẩn và phƣơng sai chỉ sử dụng
đƣợc trong 1 chiều. Trong thực tế dữ liệu có thể có rất nhiều chiều. Một ví
dụ đơn giản ta có dữ liệu về cân nặng và điểm số của toàn bộ sinh viên
trong lớp K15-T4. Đối với dữ liệu này, độ lệch chuẩn và phƣơng sai chỉ
tính đƣợc trên từng chiều riêng biệt và ta không thấy đƣợc mối liên hệ giữa
2 chiều này.
16