Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (853.9 KB, 156 trang )
Tự Động Hóa Đài 116
GVHD:
Phan Đình Mãi – Nguyễn Thanh Liêm
Để tăng tính linh hoạt cho hệ thống tự động và giảm dung lượng lưu trữ ta dùng kỹ
thuật tổng hợp tiếng nói
2. Các Tiêu Chuẩn Cần Thỏa Mãn Khi Tổng Hợp Tiếng Nói:
Tiếng nói tổng hợp dù sao cũng không phải là tiếng nói thực cho nên không thể
giống hoàn toàn tiếng nói tự nhiên. Tuy nhiên khi sử dụng kỹ thuật này, cần thỏa một số
tiêu chuẩn tối thiểu:
− Đạt độ trung thực tương đối : mọi người có thể hiểu được mà không cần học hỏi
hoặc tập trung nghe cao độ. Nếu không đạt được điều này thì tiếng nói tổng hợp sẽ không
thể sử dụng được trong thực tế vì sẽ làm người nghe khó chịu.
− Có thể thay thế con người để phục vụ trong các hệ thống điện thoại, hệ thống dịch
vụ công cộng, robot .
− Khối lượng lưu trữ không quá lớn để tiện sử dụng và có thể phổ biến nhiều nơi
3. Các Phương Pháp Tổng Hợp Âm Cho Tiếng Việt .
Có 2 hướng tổng hợp tiếng nói chính là tổng hợp dựa vào việc phân tích tần số và
tổng hợp dựa vào việc ghép âm.
Đối với hướng phân tích tần số, ta phân tích các đặc trưng tiếng nói để tìm ra tần số,
pha. Khi tổng hợp sẽ tái tạo tiếng nói từ các đặc tính này. Hướng này rất phức tạp và chất
lượng âm còn kém. Trong khi đó, hướng tổng hợp dựa vào việc ghép âm dễ dàng được hiện
thực trên máy tính hơn.
3.1. Ghép từng từ đơn:
Tính chất tiếng Việt là âm của từ đầu không ảnh hưởng âm các từ sau. Do đó ta có thể
ghép các từ thành một câu.
Phương pháp này đạt độ tự nhiên cao nhất và cách hiện thực đơn giản nhất.
Tiếng Việt phổ thông có khoảng 6000 từ. Nếu ta thu với tần số lấy mẫu 8KHz, 8
bit/mẫu, mono, nén PCM. Mỗi từ thu trong 0.8 giây (tốc độ đọc chậm nhất) thì khối lượng
âm thanh cần lưu trữ là:
6000 * 8000 * 1 * (1/2) * 0.8 = 19,200,000 bytes .
Khối lượng dữ liệu của phương pháp này là khá lớn. Mặt khác ta không thể thu âm hết
đủ các từ đã có trong tiếng Việt vì tiếng Việt có rất nhiều từ vay mượn từ các thứ tiếng khác.
Nhận xét:
− Với phương pháp này, khối lượng lưu trữ âm dùng cho ứng dụng khá lớn(khoảng
2000 từ) so với phương pháp ghép âm loại một. Nhưng với dung lượng đĩa cứng ngày nay
thì vấn đề lưu trữ không là vấn đề đáng lo ngại.
− Mức độ ảnh hưởng của từ đi trước với từ đi sau là không đáng kể và có thể chấp
nhận được.
3.2. Ghép âm theo các âm tiết cơ bản nhất:
SVTH: Nguyễn Hữu Phú – Trần Lê Trung
Trang 62
Tự Động Hóa Đài 116
GVHD:
Phan Đình Mãi – Nguyễn Thanh Liêm
Ví dụ: "bằng" được ghép từ [b]+[ằ]+[ng]
Phương pháp này có khối lượng lưu trữ nhỏ nhất vì chỉ có 28 phụ âm và 68 nguyên âm
cùng các biến thể thanh. Khối lượng lưu trữ:
(16+68) * 8000 * 1 * (1/2) *0.8 = 268,800 bytes
Tuy nhiên, phương pháp này rất khó hiện thực vì:
Khi phụ âm có vai trò làm phụ âm cuối, chúng được phát âm khác với khi chúng làm
phụ âm đầu. Phụ âm đầu mở ra để kết hợp với nguyên âm, phụ âm cuối khép lại không kết
hợp với nguyên âm nữa.
Cần chú ý khi phát âm nguyên âm trong trường hợp âm cuối là loại tắc (vô thanh) ví
dụ như p, t, c.Khi này thanh điệu không thể hiện trên phụ âm cuối mà thể hiện ở giai đoạn
chuyển tiếp từ nguyên âm sang âm cuối.
Do đó chất lượng âm của phương pháp này cũng còn hạn chế.
3.3. Ghép âm từ hai âm loại 1:
Ví du: "bằng" được ghép từ [b] + [ ằng] .
Một từ được tách ra làm hai phần là phụ âm đầu và vần. điều này căn cứ trên đặc điểm
tiếng Việt là phụ âm đầu ít phụ thuộc vào phần vần và thanh điệu. Trong phụ âm đầu được
cắt rất ngắn chỉ còn lại âm bật (thông thường vào khoảng 0.15 giây). Phần vần cũng được
cắt bỏ ở phần đầu một lượng tưng ứng.
Phương pháp này cho chất lượng âm thanh tương đương so với phương pháp ghép từ
đơn. Theo phương pháp này ta tách được 28 phụ âm đầu và 650 phần vần. Với cách thu âm
như trước thì khối lượng lưu trữ sẽ là:
650 * 8000 * 1 * (1/2) * (0.8 - 0.15) + 28 * 8000 * 1 * (1/2) * 0.15 =
1,706,800 ~ 1.7 Mbytes
SVTH: Nguyễn Hữu Phú – Trần Lê Trung
Trang 63
Tự Động Hóa Đài 116
GVHD:
Phan Đình Mãi – Nguyễn Thanh Liêm
HÌNH MÔ TẢ CÁCH GHÉP HAI ÂM THÀNH TỪ
Để dùng phương pháp ghép hai từ âm loại 1 ta có bảng thống kê các phần vần như sau:
BẢNG THỐNG KÊ VẦN TIẾNG VIỆT
a
e
ê
I
o
ô
ơ
u
ư
y
ác
ãi
ãm
ãn
ão
au
ảy
ằm
ằn
ấc
ẫm
ẫn
âu
ây
éc
á
é
ế
í
ó
ố
ớ
ú
ứ
ỳ
ạc
ại
ạm
ạn
ạo
áu
ãy
ẳm
ẳn
ậc
ậm
ận
ấu
ấy
em
SVTH: Nguyễn Hữu Phú – Trần Lê Trung
à
è
ề
ì
ò
ồ
ờ
ù
ừ
ỳ
ai
am
an
ao
áp
àu
ắc
ẵm
ắp
âm
ân
ấp
ầu
ầy
ém
ạ
ẽ
ệ
ị
ọ
ộ
ợ
ụ
ự
ỵ
ài
ám
án
áo
ạp
ay
ặc
ặm
ặp
ấm
ấn
ập
ẩu
ẩy
èm
ả
ẻ
ể
ỉ
ỏ
ổ
ở
ủ
ử
ỷ
ái
àm
àn
ào
át
áy
ăm
ăn
ắt
ầm
ần
ất
ẫu
ẫy
ẻm
ã
ẽ
ễ
Ĩ
õ
ỗ
ỡ
ũ
ữ
ỹ
ải
ảm
ản
ảo
ạt
ày
ắm
ắn
ặt
ẩm
ẩn
ật
ậu
ậy
ẽm
Trang 64
Tự Động Hóa Đài 116
ẹm
ẹn
ẹo
ếm
ếp
ều
ỉa
ỉm
ịn
iu
óa
óe
ỏi
ỏm
ỏn
ọt
ội
ốm
ốn
ộp
ởi
ởm
ởn
ợt
ụa
uễ
ũi
ũm
ũn
uy
ưa
ức
ừu
ỵt
ảng
ảnh
ẳng
ẩng
ẻng
ếnh
iếc
iềm
iện
iếu
ính
oạc
oãi
oạn
GVHD:
en
eo
ép
ệm
ệp
ểu
ĩa
ịm
ip
íu
òa
òe
õi
õm
õn
ốc
ổi
ồm
ồn
ốt
ỡi
ỡm
ỡn
ua
úc
uệ
ụi
ụm
ụn
úy
ứa
ực
ứu
ách
ãng
ãnh
ẵng
ẫng
ẽng
ềnh
iệc
iên
iếp
iều
ình
oai
oàm
oản
SVTH: Nguyễn Hữu Phú – Trần Lê Trung
én
éo
ẹp
ễm
ết
ệu
ịa
in
íp
ìu
ỏa
ỏe
ọi
ọm
ọn
ộc
ỗi
ổm
ổn
ột
ợi
ợm
ợn
úa
ục
ui
um
un
úp
ùy
ừa
ừm
ựu
ạch
ạng
ạnh
ặng
ậng
ẹng
ểnh
iểm
iến
iệp
iểu
ỉnh
oái
oạm
oãn
èn
èo
ét
ên
ệt
ia
im
ín
ịp
ỉu
õa
oi
om
on
óp
ôi
óc
ỗm
ỗn
ơi
ơm
ơn
ớp
ùa
uế
úi
úm
ún
ụp
ủy
ửa
ứt
ửu
ang
anh
ăng
âng
eng
ếch
ễnh
iễm
iền
iết
iễu
ĩnh
oại
oan
oáp
Phan Đình Mãi – Nguyễn Thanh Liêm
ẻn
ẻo
ẹt
ến
êu
ía
ím
ìn
ít
ĩu
ọa
ói
óm
ón
ọp
ối
ọc
ộm
ộn
ới
ớm
ớn
ợp
ủa
uề
ùi
ùm
ùn
út
ũy
ữa
ựt
ữu
áng
ánh
ắng
ấng
éng
ệch
ích
iệm
iển
iệt
iệu
ịnh
oài
oán
oát
ẽn
ẽo
êm
ển
ếu
ìa
ìm
ỉn
ịt
oa
oe
òi
òm
òn
ót
ồi
ôm
ôn
ốp
ời
ờm
ờn
ớt
ũa
uể
ủi
ủm
ủn
ụt
ụy
ựa
ưu
ýt
àng
ành
ằng
ầng
èng
ênh
ịch
iếm
iễn
iêu
inh
oác
oải
oàn
oạt
Trang 65