Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 65 trang )
bình được gọi là z-giá trị. Về z-giá trị, cuộc điều tra đã yêu cầuxác suất mà một
phép đo mới sẽ có một giá trị z giữa -1 và 1, giữa- 2 và2, và giữa -3 và 3. Quy
luật 68-95-99.7 đã trả lời cho những câu hỏi về 68%, 95%, và 99.7%
Đối với quy luật 68-95-99.7,68% số
giá trị nằm trong khoảng 1 lần độ
lệch chuẩn so với trị trung bình,
khoảng 95% số giá trị trong khoảng
hai lần độ lệch chuẩn và khoảng
99.7% nằm trong khoảng 3 lần độ
lệch chuẩn.
Biến ngẫu nhiên x có số trung bình là 0 và phương sai là 1 thì z được gọi là
biến ngẫu nhiên chuẩn hóa,và được tính bằng công thức .Sau đây là ví dụ minh
họa về biến ngẫu nhiên được chuẩn hóa:
2. VÍ DỤ A:
Chiều cao của một nhóm nam giới được phân phối chuẩn với số trung bình
là 70 in và độ lệch chuẩn là 2.5 in.
a. Tìm xác suất để giá trị z là 67.5 in và 72.5 in
b. Tìm xác suất để 67.5
c. Tìm khoảng giá trị của x, đối xứng với giá trị trung bình,chứa 90% chiều cao.
Giải
Đối với dân số này, µ = 70 và σ = 2,5.
a.
Sử dụng công thức
= -1
để chuẩn hóa các biến
và
Trong bản phân phối này, 67,5 tương ứng với một giá trị z là -1, có nghĩa
là giá trịđộ lệch chuẩn dưới trung bình. Chiều cao 72,5 nhập tương ứngmột z-giá
trị là 1, có nghĩa là độ lệch chuẩn trên trung bình.
b. Z-giá trị của 65in là hoặc -2, và z-giá trị của 75in là
hoặc 2.
Xác suất 95% số giá trị trong khoảng hai lần độ lệch chuẩn so với giá trị
trung bình.. Đồ thị dưới đây sẽ khẳng định dự đoán này. (Xem lưu ý 13c để nhớ
lại cách vẽ đường cong này)
c. Bạn đã biết rằng 68% chiều cao rơi vào khoảng -1 ≤ z ≤ 1 ,tương ứng
với
67,5 ≤ x ≤ 72,5 . Bạn cũng biết rằng 95% chiều cao rơi vàokhoảng 65≤
x ≤ 75. Vì vậy, bạn có thể đoán rằng một khoảng thời gian khoảng 66 ≤ x ≤
74 sẽ chứa 90% độ cao. Sử dụng máy tính và thử nghiệm và tìm lỗi để được kết
quả chính xác nhất. Màn hình máy tính dưới đây cho thấy rằng khoảng 65,8875
≤ x ≤ 74,1125 chứa 90,003% dữ liệu.
Sử dụng giá trị z và nguyên tắc 68-9599.7 giúp bạn họcvề dân số từ một mẫu
phân bố chuẩn lấy từ những người đó?
Bạn có thể kết luận, choví dụ, rằng xác
suất là 68% số giá trị nằm trong khoảng
1 độ lệch chuẩn so với trị trung bình .
Không thực sự như vậy, các dân số có
thể hoặc không nằm trong khoảng này,
vì vậy khả năng mà nó có là 0 hoặc 1.
Nhưng bạn có thể khẳng định giá trị
trung bình dân số nằm trong một
khoảng cụ thể.
II. Khoảng tin cậy
Giả sử một mẫu từ phương sai tổng thể có phân bố chuẩn với kích thước n
và giá trị trung bình , và độ lệch chuẩn của phương sai tổng thể σ. Khi đó
khoảng tin cậy p% là một khoảng xung quanh giá trị trung bìnhtrong đó bạn có
thể khẳng định rằng p% là trung bình của tổng thể,µ. Nếu z là độ lệch chuẩn từ
giá trị trung bình thì p% là dữ liệu phân bố chuẩn, các khoảng tin cậy p% là
-<µ<+
Khoảng tin cậy cũng có thể được thể hiện như
µ=
hay µ = (- , + )
Trong tình huống thực tế, bạn có thể không biết độ lệch chuẩn tổng thể.
Tuy nhiên, nếu cỡ mẫu đủ lớn, thường n > 30, bạn có thể sử dụng độ lệch chuẩn
mẫu, s, trongđặt khi tính toán khoảng tin cậy.
1. Ví dụ
VÍ DỤ A:
Lớp học của bạn có được một mẫu của 30 phép đo chiều dài của dây, với
giá trị trung bình là 32,4 cm và độ lệch chuẩn 0,8 cm. Bạn không thể nói rằng
trung bình dân số là chính xác32,4 cm. Nhưng bạn có thể mô tả khoảng tin cậy
của của giá trị trung bình tổng thể (chiều dài thực tế của dây) nằm trong một
khoảng. Ví dụ, khi biết rằng 95% dữ liệu phân bố chuẩn có một giá trị z giữa -2
và 2, bạn có thể nói rằng 95% dộ tin cậy giá trị trung bình của tổng thể nằm
trong khoảng ( 32.4 – ; 32.4 + ) hoặc (32.1; 32.7).
Nguyên tắc 68-95-99.7 rất hữu ích trong trường hợp như thế này, nhưng
đôi khi bạn muốn độ tin cậy là một tỉ lệ phần trăm khác 68%, 95%, hay 99,7%.
Bạn có thể tìm thấy sự liên quan của giá trị z bằng thử nghiệm với một đường
cong chuẩn và cố gắng để tìm thấy một khu vực đối xứng với giá trị trung bình
mà có tỷ lệ phần trăm mong muốn của tổng diện tích. Đây là giá trị z ứng với
những khoảng tin cậy hay được sử dụng:
Khoảng tin cậy
Giá trị z
90 %
1.645
99% 99.9%
2.576 3.291
Trong ví dụ sau, khoảng tin cậy được tính bằng z-giá trị từ bảng này.
VÍ DỤ B:
Jackson là huấn luyện viên cuộc đua xe 100 m. Ông ta bấm giờ chạy của
mình là 11,47s. Kinh nghiệm trong các khóa đào tạo trước đó chỉ ra rằng độ lệch
chuẩn cho thời gian đua là 0,28 s.
a. Tìm các khoảng tin cậy 95%.
b. Những khoảng tin cậy tương ứng với 2,3 độ lệch chuẩn?
c. Tìm khoảng tin cậy 90%.
Giải
Bởi vì chỉ biết được thời gian một lần chạy, giá trị cho n là 1. Một khoảng
tin cậy được cho như: (11.47 – ; 11.47 – ). Đây là khoảng bắt đầu và kết thúc
11.47 0.28z
a. Từ quy tắc 68-95-99.7, z có giá trị cho 95% là
khoảng hai lần độ lệch chuẩn.Khoảng bắt đầu và
kết thúc là khoảng tin cậy, sau đó, là 11,47 0,28
(2). Huấn luyện viên cho rằng 95% độ tin cậy
thời gian thực tế là giữa khoảng 10,91 và 12,03
s.
b.Từ suy đoán-và-kiểm tra, khoảng bắt đầu và
kết thúc là 11,47 0,28 (2.3), có nghĩa là, hoặc
giữa 10,826 và 12,114 s, có một xác suất của N
(10,826, 12,114, 11.47, 0.28), hoặc .9786. Một
giá trị có độ lệch chuẩn 2.3 tương ứng với một
khoảng tin cậy 98%.
c. Sử dụng bảng ở trang 748, huấn luyện viên
cho rằng 90% độ tin cậy thời gian thực tế là giữa
11,47 0,28 (1.645), hoặc giữa 11,01 và 11,93 s.
Trong ví dụ B, huấn luyện viên chỉ dựa vào thời gian của một lần đo duy
nhất. Nếu có bốn người, thay vì chỉ có một, cùng tính thời gian chạy, và giá trị
trung bình của những lần đo được là 11,47 s, sau đó là 95% sẽ rơi vào khoảng
bắt đầu và kết thúc 11.47 , làm cho nó nằm giữa 11,19 và 11,75 s. Nói chung,
lớn hơn kích thước mẫu, hẹp khoảng tin cậy của giá trị trung bình của phương
sai tổng thể.
III. Bài tập
3.1
Thực hành kỹ năng của bạn
1. Theo dõi các đường cong chuẩn ở bên phải trang
giấy.Hãy vẽ thêm các đương đẻ chứng minh quy tắc
68-95-99.7.
2. Một tập hợp các dữ liệu phân phối có giá trị trung bình là 63 và độ lệch
chuẩn là 1.4. Tìm giá trị z cho mỗi giá trị dữ liệu
a. 64,4
b. 58,8
c. 65,2
d. 62
3. Một tập hợp các dữ liệu phân phối có giá trị trung bình là 125 và độ lệch
chuẩn là 2.4 Tìm giá trị z cho mỗi giá trị dữ liệu
a. z = -1
b. z = 2
c. z = 2,9
d. z = - 0,5
3.2 Lý do và Áp dụng
4 . Thời gian đi lại trung bình giữa hai điểm dừng xe
buýt là 58 phút với độ lệch chuẩn là 4,5 phút .
a . Tìm giá trị z cho một chuyến đi mà phải mất
66,1 phút
b . Tìm các giá trị z cho một chuyến đi mà phải
mất 55 phút .
c . Tìm xác suất mà các chuyến đi xe buýt mất từ
55 đến 66,1 phút .
5 . Một tập hợp các dữ liệu phân phối có giá tri trung bình 47s và độ lệch
chuẩn là 0,6 s. Tìm tỷ lệphầntrăm của dữ liệu trong các khoảng:
a . từ 45s đến 47s
b . trên 1.5s hoặc dưới trung bình
6. ÁP DỤNG Năm mươi nghiên cứu gần đây về vận tốc của ô tô cho thấy thời
lượng trung bình là 31 mi / gal với độ lệch chuẩn là 2,6 mi / gal . Giả sử đó là
phân phối chuẩn, tìm khoảng tin cậy 95 % .
7 . ÁP DỤNG Một hãng hàng không cho biết , trong vòng 60 ngày qua, trung
bình bán được 207,5 vé cho hành khách bay 7:24 sáng. Độ lệch chuẩn của dữ
liệu là 12 hành khách.
a. Giả sử đây là phân phối chuẩn , tìm khoảng tin cậy 95 % .
b.Nếu máy bay có 225 ghế ngồi , thì máy bay có bị quá tải hay không ?
3.3 Xem xét
8. Chọn một số thực ngẫu nhiên trong khoảng tử 0 đến 50, theo phân phối xác
suất ở bên phải. Tìm các giá trị mô tả