Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.93 MB, 167 trang )
Tất cả 3 số này đều là những số ngẫu nhiên 3 chữ số hợp lệ
Lưu ý: Chúng ta có thể tìm một bảng số ngẫu nhiên bằng cách tra cứu trong sách thống kê.
Chúng ta cũng có thể tạo ra bảng số ngẫu nhiên bằng cách dùng chương trình Epi-Info. Trước
tiên chúng ta vào chương trình Epitable, chọn trình đơn Sample rồi chọn trình đơn con Random
number table (Bảng số ngẫu nhiên). Khi đó trên màn hình sẽ có kết quả như sau
_ Describe Compare Study Sample Probability Setup
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
_________+----------------------------------------------------------+___________
_________¦ +-[_]------- Random number table generator ------------+¦___________
_________¦ ¦
¦¦___________
_________¦ ¦
How many random numbers
550
¦¦___________
_________¦ ¦
How many digits per number
5
¦¦___________
_________¦ ¦
¦¦___________
_________¦ ¦
¦¦___________
_________¦ ¦
Calculate _
Reset
_
Quit
_
¦¦___________
_________¦ ¦
____________
____________
____________
¦¦___________
_________¦ ¦
¦¦___________
_________¦ +------------------------------------------------------+¦___________
_________+----------------------------------------------------------+___________
________________________________________________________________________________
________________________________________________________________________________
____________________________________________________________________¦¦__________
___________________________________________________________________¦¦¦¦_________
__________________________________________________________________¦¦¦¦¦¦________
_________________________________________________________________¦¦¦¦¦¦¦¦_______
F1-Help F3-Move F4-Zoom F5-Print F6-Next F9-_ F10-Quit
Mem:224824
Chúng ta nhập vào số các số ngẫu nhiên mà chúng ta muốn tạo ra (How many random
numbers): thí dụ như 60 và nhập vào số các chữ số có trong số ngẫu nhiên (How many digits
per number), thí dụ như 3, chúng ta sẽ có kết quả sau.
_ Describe Compare Study Sample Probability Setup
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
_________+----------------------------------------------------------+___________
_________¦ +----------- Random number table generator ------------+¦___________
_________¦ ¦
¦¦___________
_________¦ ¦
How many random numbers
60
¦¦___________
_____+-[_] Files Edit Search
[]-+_____
_____¦454 712 771 345 042 124 978 077 899 904 914 680 374 784 925
¦_____
_____¦133 359 974 535 150 661 443 010 944 509 897 462 692 565 277
-_____
_____¦487 622 044 787 542 892 801 795 586 689 510 109 682 209 261
______
_____¦456 577 455 221 199 460 010 198 588 416 215 216 098 291 423
______
_____¦
______
_____¦
______
_____¦
______
_____¦
______
_____¦
______
_____¦
_____
_____+-¤---- 5:2 ------________________________________________________-+_____
__________________________________________________________________¦¦¦¦¦¦________
_________________________________________________________________¦¦¦¦¦¦¦¦_______
F1-Help F3-Move F4-Zoom F5-Print F6-Next F9-_ F10-Quit
Mem:223680
Bước 3:
Chọn một số có chữ số mong muốn. Chọn đố tượng tương ứng trên bản danh sách điều tra để
đưa vào nghiên cứu trừ khi:
(i) số được chọn đã được chọn từ trước
73
(ii) Số được chọn lớn hơn số lớn nhất có trong danh sách.
Bước 4:
Khảo sát số bên cạnh trong bảng số ngẫu nhiên và tiến hành như trong bước 2 và 3, số tiếp theo
có thể được chọn bất kì chỗ nào trong bảng số ngẫu nhiên. Cách đơn giản nhất là đi xuống dọc
theo cột (nếu hết cột này thì lại đếm qua cột bên cạnh) cho đến khi số nghiên cứu được chọn từ
danh sách điều tra bằng với số mẫu cần thiết. Ðiểm cần lưu ý là chọn hàng và cột đầu tiên phải
ngẫu nhiên.
Chọn mẫu ngẫu nhiên dùng chương trình Epi-Info
Trước tiên chúng ta vào chương trình Epitable, chọn trình đơn Sample rồi chọn trình đơn con
Random number list (Bảng số ngẫu nhiên). Khi đó trên màn hình sẽ có kết quả như sau (Xem
hình 3).
_ Describe Compare Study Sample Probability Setup
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
_________+--+-[_]-------- Random number List generator ------------++___________
_________¦ ¦
¦¦___________
_________¦ ¦
How many random numbers
100
¦¦___________
_________¦ ¦
Minimum range of numbers
0
¦¦___________
_________¦ ¦
Maximum range of numbers
1000
¦¦___________
_________¦ ¦
¦¦___________
_________¦ ¦
[ ] Drawing with replacement
¦¦___________
_________¦ ¦
¦¦___________
_________¦ ¦
Calculate _
Reset
_
Quit
_
¦¦___________
_________¦ ¦
____________
____________
____________
¦¦___________
_________¦ ¦
¦¦___________
_________+--+------------------------------------------------------++___________
________________________________________________________________________________
________________________________________________________________________________
____________________________________________________________________¦¦__________
___________________________________________________________________¦¦¦¦_________
__________________________________________________________________¦¦¦¦¦¦________
_________________________________________________________________¦¦¦¦¦¦¦¦_______
F1-Help F3-Move F4-Zoom F5-Print F6-Next F9-_ F10-Quit
Mem:224504
Nếu chúng ta muốn có danh sách gồm 50 số ngẫu nhiên trong phạm vi từ 1 đến 457 ta nhập giá
trị 30 vào ô How many radom numbers; 1 vào ô Minimumrange of numbers và 457 vào ô
Maximum range of number. Ta sẽ có kết quả sau:
74
_ Describe Compare Study Sample Probability Setup
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
_________+--+------------ Random number List generator ------------++___________
_________¦ ¦
¦¦___________
_________¦ ¦
How many random numbers
50
¦¦___________
_________¦ ¦
Minimum range of numbers
1
¦¦___________
_____+-[_] Files Edit Search
[]-+_____
_____¦
6
10
15
22
35
43
¦_____
_____¦
50
80
81
83
105
105
-_____
_____¦
126
157
158
164
191
194
______
_____¦
215
221
224
227
234
236
______
_____¦
243
243
255
256
283
285
______
_____¦
295
319
324
326
333
343
______
_____¦
347
355
369
377
378
384
______
_____¦
393
414
421
434
435
435
______
_____¦
447
449
______
_____¦
_____
_____+-¤--- 10:2 ------________________________________________________-+_____
__________________________________________________________________¦¦¦¦¦¦________
_________________________________________________________________¦¦¦¦¦¦¦¦_______
F1-Help F3-Move F4-Zoom F5-Print F6-Next F9-_ F10-Quit
Mem:223360
Như vậy chúng ta sẽ chọn các đối tượng số 6, 10, 15, 22, ...., và 449 trong khung mẫu để đưa
vào mẫu.
Ưu và khuyết của phương pháp lấy mẫu ngẫu nhiên đơn:
Phương pháp lấy mẫu ngẫu nhiên đơn đòi hỏi phải có danh sách của toàn bộ dân số khảo sát.
Danh sách này có thể không có hoặc có nhưng không hoàn toàn và lỗi thời. Nếu không có được
danh sách hay chi phí lập danh sách rất tốn kém thì không thể sử dụng phương pháp ngẫu nhiên
được. Ðây là khuyết điểm chính của phương pháp lẫy mẫu này.
Tuy vậy, khi có hay khi có thể lập danh sách của toàn bộ dân số một cách dễ dàng thì phương
pháp này là phương pháp lấy mẫu đơn giản và có tính đại diện cao.
2. Phương pháp lấy mẫu hệ thống:
Thay vì rút chọn ngẫu nhiên người ta có thể chọn những đối tượng có một khoảng cách nhất
định, phương pháp này được gọi là phương pháp rút chọn hệ thống. Thí dụ, lấy mẫu hệ thống là
chọn các đối tượng mang số 8, 17, 26, 35, 44, 53, ... vào mẫu. Phương pháp lấy mẫu hệ thống
cũng có giá trị như lấymẫu ngẫu nhiên nếu không có tính tuần hoàn của các đối tượng. Tuy vậy,
cần biết rằng phương pháp mẫu ngẫu nhiên đơn luôn luôn tốt hơn bởi vì nó không cần thiết giả
định này. Phương pháp lấy mẫu hệ thống đặc biệt có giá trị khi chúng ta không thể có được toàn
bộ danh sách lấy mẫu ở vào thời điểm lấy mẫu. Thí dụ như chúng ta có thể lấy mẫu hệ thống để
chọn những bệnh nhân có số hồ sơ nhập viện cách nhau một khoảng nhất định.
3. Phương pháp lấy mẫu phân tầng
Lấy mẫu phân tầng được dùng khi dân số bao gồm các nhóm khác biệt hay tầng (strata), khác
nhau về các đặc tính nghiên cứu và bản thân sự khác biệt này cũng cần quan tâm. Những thí dụ
thường gặp là các nhóm tuổi, nhóm giới tính hay những vùng địa lí hay sinh thái khác nhau
trong quốc gia. Một mẫu ngẫu nhiên đơn được rút ra từ mỗi tầng để đảm bảo rằng chúng đủ đại
diện. Ước lượng chung cũng sẽ chính xác hơn dựa vào phương pháp lấy mẫu ngẫu nhiên đơn
không xét đến cấu trúc của các nhóm nhỏ trong dân số. Chiến lược thường dùdng là chọn các cá
nhân trong tầng với tỉ lệ như nhau, nghĩa là có cùng chung một phân số lấy mẫu (sampling
fraction) cho các tầng. Dù vậy, đôi khi cũng cần phải thay đổi để cỡ mâu của mỗi tầng không
quá nhỏ.
75
Bảng 1. Kết quả một mẫu phân tầng được tiến hành để ước lượng tỉ suất bệnh hiện mắc của một
bệnh trong một quốc gia có ba vùng địa lí chính. Tỉ suất bệnh hiện mắc chung được tính bằng
cách cộng số các người bệnh ước lượng được trong mỗi vùng và chia cho tổng số dân (Câu hỏi
thảo luận: Các tầng có cùng một phân số lấy mẫu hay không?)
Khu vực
Dân số
Ðồng bằng ven
biển
Cỡ mẫu
Số bị bệnh
Tỉ suất
hiện mắc
bệnh tổng số bệnh
ước lượng
1500000
200
120
0,6
900000
Vùng núi
150000
50
5
0,1
15000
Bán hoang mạc
300000
50
15
0,3
90000
1950000
300
140
0,52*
1005000
Tổng số
Thí dụ: Người ta muốn ước lượng tỉ suất hiện mắc của một bệnh trong một quốc gia với 3 vùng
sinh thái chính, vùng đồng bằng ven biển, vùng núi và vùng bán hoang mạc. Bởi vì dân số phân
phối đồng đều trong quốc gia, và bởi vì người ta nghĩ rằng đặc trưng sinh thái có thể ảnh hưởng
đến tỉ suất hiện mắc của bệnh, người ta chọn mẫu phân tầng. Bảng 1 trình bày kết quả thu được
với tỉ suất mắc toàn bộ trong mỗi vùng.
Tỉ suất mắc toàn bộ chung được tính bằng cách ước lượng số người bị bệnh trong mỗi vùng. Thí
dụ trong vùng đồng bằng ven biển tỉ suất hiện mắc của mẫu là 120/200 hay 0,6. Áp dụng số này
cho tổng số dân số trong vùng đồng bằng ven biển cho số ước lượng 0,5 x 150.000 = 90.000. Số
người bị bệnh của vùng núi và vùng hoang mạc được tính theo cách tương tự là 15000 và 90000.
Tổng số người mắc bệnh trong toàn quốc gia là 1.050.000. Kích thước dân số là 1.950.000 cho
nên tỉ số mắc toàn bộ chung là 1.050.000/1.950.000 = 0,52.
Lưu ý rằng con số này không giống với tỉ suất hiện mắc của mẫu là 140/300 = 0,47. Hai con số
này chỉ giống nhau khi dùng phân số lấy mẫu giống nhau cho mỗi tầng (nhưng điều này không
đúng trong trường hợp này). Việc tính toán sai số chuẩn của tỉ suất mắc hiện mắc cho toàn bộ
dân số dựa trên sự kết hợp các sai số chuẩn của các tỉ suất hiện mắc của mỗi vùng. Có thể sử
dụng phần mềm Epi-Info hoặc xem Moser và Kalton để biết thêm chi tiết.
4. Lấy mẫu cụm
Nếu chi phí phụ trội không nhiều, nên điều tra tất cả các đơn vị bậc hai từ một đơn vị bậc một
được chọn trong lược đồ lấy mẫu hai bậc. Ðiều đó được gọi là lấy mẫu cụm (cluster sampling)
và đơn vị lấy mẫu bậc một được gọi là cụm (cluster) trong trường hợp này. Có thể đạt được lược
đồ xác suất bằng nhau bằng cách lấy mẫu ngẫu nhiên đơn các cụm bất kể chúng có kích thươc
bằng nhau hay không.
Lấy mẫu cụm được dùng nếu có ích lợi được phân phát cho mọi người tham gia và nếu chỉ phân
phát quyền lợi cho một số thành viên của đơn vị là không thích hợp và không đạo đức. Thí dụ,
trog khi lấy mẫu trường để ước lượng tỉ suất hiện mắc của bệnh khi muốn sử dụng một phương
pháp điều trị có hiệu quả cho tất cả người bị bệnh, người ta sẽ khám cho tất cả các học sinh
trong các trường được chọn chứ không khám một mẫu trong đó.
5. Lấy mẫu nhiều bậc
Lấy mẫu nhiều bậc được tiến hành trong trong nhiều bậc dùng các cấu trúc đẳng cấp
(hierarchical structure) của dân số. Thí dụ, lấy mẫu 2 bậc (two stage sampling) có thể bao gồm
lần thứ nhất lấy một mẫu ngẫu nhiên các trường học và sau đó lấy mẫu ngẫu nhiên các trẻ em
trong các trường đã được chọn. Các trường hợp được gọi là đơn vị bậc một (first stage units hay
primary sampling units) và trẻ em là đơn vị bậc hai (second stage units - secondary sampling
units). Ưu điểm là tài nguyên có thể tập trung tại một số địa điểm và không cần cơ cấu lấy mẫu
76