Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 65 trang )
BÀI 13.1:
PHÂN BỐ XÁC SUẤT
Sẽ có một ngày suy luận thống kê là cần thiết cho công dân giống như khả
năng đọc và viết.
“Tôi đã làm một cuộc khảo sát và 22% trẻ em trong ngôi trường này có đôi
mắt màu xanh, vì thế 22% dân số quanh khu vực này phải có đôi mắt màu xanh”
Sean tuyên bố. “Chính xác 22%?” Yiscah hỏi.
Một trong những ứng dạng chính của thống kê là để tìm hiểu về một tập
hợp rộng lớn, chẳng hạn như dân cư của một thành phố, bằng cách nhìn vào tập
hợp nhỏ hơn, chẳng hạn như học sinh trong một trường. Tập hợp lớn được gọi
là dân số, và tập hợp nhỏ hơn là một mẫu của dân số.
Các con số tương ứng mô tả toàn bộ dân số được gọi là thông số
Khi bạn kiểm tra xác xuất trong chương 12. Bạn sử dụng các biến ngẫu
nhiên rời rạc. Các dữ liệu có giá trị nguyên, chẳng hạn như 5 cái đầu, 3 cái đuôi,
hoặc 454 học sinh. Tuy nhiên đôi khi dữ liệu có thể đưa vào bất kì giá trị thực
trong một khoảng nào đó. Nó được đại diện bởi một biến ngẫu nhiên liên tục.
Bạn có thể nói rằng tất cả mọi người là 15 hoặc 16 tuổi, nhưng thực sự không có
ai chinhs xác 16, bởi vì một người là chính xác 16 chỉ tại một khoảng khắc. Tuổi
của bạn là biến liên tục, và có vô hạn lứa tuổi.
I.
1.
Điều tra:
Độ dài bút chì
Bạn sẽ cần: Thước đo (cm), bút chì, giấy kẻ ô vuông.
Trong điều tra này, bạn sẽ khám phá sự khác biệt giữa biến ngẫu nhiên rời
rạc và liên tục.
Bắt đầu bằng cách thu thập tất cả bút chì mà nhóm bạn có.
•
Bước 1: Đo bút chì của bạn chính xác đến một phần mười của một cm. Trước
khi bạn chia sẽ dữ liệu với các nhóm khác, dự đoán hình dạng của một biểu đồ
•
của lớp dữ liệu.
Bước 2: Chia sẽ tất cả các phép đo để lớp có một tập hợp các dữ liệu. Trên giấy
vẽ đồ thị, vẽ một biểu đồ với các cột đại diện cho một cm gia tăng trong chiều
•
dài bút chì.
Bước 3: Chia tổng số bút chì cho mõi cột của bút chì. Làm mới biểu đồ, sử dụng
•
các thương số như các giá trị trên trục y.
Bước 4: Kiểm tra rằng diện tích biểu đồ thứ hai của bạn là một. Tại sao điều này
•
phải đúng ?
Bước 5: Hãy tưởng tượng rằng bạn thu thập càng nhiều bút chì và vẽ một biểu
đồ sử dụng phương pháp mô tả trong bước 3. Phác họa biểu đồ của nhiều bút chì
•
có chiều dài vô hạn sẽ trông như thế nào. Đưa ra lí do cho câu trả lời của bạn.
Bước 6: Hãy tưởng tượng làm một cuộc khảo sát rất đầy đủ và chính xác của tất
cả các bút chì trên thế giới. Giả sử rằng sự phân bố đó giống như sự phân bố bút
chì trong mẫu của bạn. Cũng giả sử rằng bạn sử dụng vô số cột rất hẹp.
Để gần đúng ý tưởng này, phác thảo trên đầu biểu
đồ của bạn một đường cong trơn, như hình bên phải. Làm
cho khu vực giữa đường cong và trục hoành giống như
khu vực của biểu đồ. Chắc chắn rằng khu vực thêm được
bao bọc bởi đường cong trên biểu đồ giống như khu vực cắt đứt các góc của cột
như bạn mịn ra hình dạng.
•
Bước 7: Đặt ít làm chiều dài của bút chì. Sử dụng biểu đồ trong bước 6 để ước
tính diện tích của các khu vực khác nhau giưa đường cong và trục x, thỏa mãn
các điều kiện
a. x < 10
b. 11 < x <12
x > 12.5
x = 11
Biểu đồ bạn vẽ trong bước 3 của cuộc điều tra, đưa ra các tỉ lệ của bút chì trong
c.
d.
2.
các cột, là một biểu đồ tần số tương đối. Nó cho thấy tỉ lệ của giá trị của một
biến ngẫu nhiên rời rạc chứa trong mõi cột. Đường cong liên tục bạn đã vẽ trong
bước 6 sấp xỉ một biến ngẫu nhiên liên tục của tập vô hạn
VÍ DỤ A: Một máy phát điện số chọn một số ngẫu
nhiên từ 0 – 6 theo phân bố xác suất bên phải. Bởi vì số
ngẫu nhiên có thể nhận một giá trị nào của x với 0
≤
x
≤
6,
đồ thị là một đồ thị liên tục. Tìm xác suất để chọn được một
số là:
a.
b.
c.
Bé hơn 2
Giữa 2.5 và 3.5
Lớn hơn 4
GIẢI
Đầu tiên lư ý rằng khu vực bóng mờ cho toàn bộ phân phối có diện tích là
1, để tìm xác suất của một tập hợp các kết quả, tìm diện tích của khu vực tương
a.
ứng với nó
Khu vực giữa 0 và 2 là một hình chư nhật với chiều rộng 2 chiều dài 2. Diện tích
của nó là 2.2, hoặc 4. Vì thế xác suất chọn ngẫu nhiên được một số giữa 0 và 2
b.
là 4.
Khu vực giữa 2.5 và 3.5 là một hình chữ nhật với chiều rộng 1 và chiều dài 2.
Diện tích của nó là 2. Vì thế xác suất là 2 để chọn ngẫu nhiên được một số giữa
c.
2.5 và 3.5.
Khu vực giữa 4 và 6 là một tam giác với chiều rộng là 2 và chiều cao là 2. Diện
tích của tam giác là 2. Vì thế xác suất là 2.
Trong chương 2 bạn đã được tìm hiểu 3 phương pháp trọng tâm đẻ mô tả
một tập dữ liệu có ý nghĩa, trung bình và mode. Với một phân bố xác suất bạn
không có một tập hữu hạn các dữ liệu. Vì thế những thống kê phải được xác
định và tính toán theo những cách hơi khác nhau.
Các đại lượng cơ bản của phân bố xác suất.
Mode (yếu vị ) : Giá trị hoặc những giá trị mà tại đó đồ thị đạt giá trị lớn nhất
II.
•
của nó.
•
Trung bình: Số d sao cho đường x = d chia khu vực trên thành 2 phần với diện
•
tích bằng nhau.
Kì vọng (giá trị trung bình): trung bình cộng của gía trị xác suất. Vì thế, hoành
độ của trọng tâm, hoặc điểm cân bằng của khu vực cũng là giá trị trung bình.
1. VÍ DỤ B:
Một số lượng lớn người dân được yêu cầu hoàn
thành một câu đố. Thời gian làm của mõi người được
ghi nhận.Các dữ liệu thể hiện trong đồ thị phân bố xác
suất bên phải, với thời gian dao động giữa 0 và 8 giây.
a.
b.
c.
Tim mode
Tìm trung bình
Tìm giá trị trung bình (kì vọng)
Giải
Chú ý rằng khu vực bóng mờ có diện tích bằng 1.
Yếu vị là hoành độ của điểm cao nhất, 2 giây.
Tìm đường thẳng đứng mà chia tam giác trên thành hai khu
a.
b.
vực, mõi khu vực có diện tích là 0.5. Một vài thử nghiệm
cho thấy trung bình khoảng 3 s. Tam giác nhỏ hơn có cạnh đáy là 5 và chiều
cao khoảng 2.
A ~ 0.5 x 5 x 0.2 ~ 0.5
Vì thế khoảng một nửa diện tích của tam giác nhỏ hơn nằm sau 3. Để tính
chính xác trung bình, bạn ó thể dùng phương trình của các đường hình thành
ranh giới của khu vực. Phương trình của đường thẳng đi qua (2, 0.25) và (8, 0)
là y = -(x -8)/24. Dùng phương trình này để tìm gái trị của trung bình, d, vì thế
diện tích tam gaics bên phải ó trung bình là 0.5.
A = 0.5bh = 0.5(8 – d)[-(d – 8)/24]
0.5 = 0.5(8 – d)[-(d – 8)/24]
1 = -(- d^2 -16d – 64)/24
- 24 = - d^2 -16d – 64
- d^2 -16d – 40 = 0
d ~ 3.101, 12.899
Diện tích của tam giác băng ½ tích của
cạnh đáy (8 – d) và chiều cao. Chiều cao là
gái trị của y tại x = d.
Giải tìm d khi diện tích là 0.5
Chia hia vế cho 0.5 và nhân nhị thức.
Nhân hai vế cho -24
Viết phương trình bậc 2 theo hình thức
chung
Sử dụng công thức bậc hai để giải ra d.
Gía trị thứ 2 là bên ngoài của miền xác định, vì vậy trung bình của phân
phối là khoảng 3.101.
c.
Bằng cách cắt ra hình tam giác và cân bằng nó trên đầu tẩy của 1 bút chì, bạn có
thể nhận được một ước lượng khá tốt mà giá trị trung binh là 3.33 in.
BÀI TẬP
III.1 Trả lời các bài tập 1-4 ở trang 729 cho mỗi phân phối dưới đây.
III.
1.
2.
3.
4.
Tìm chiều cao của hộp lưới trên trục y để diện tích là 1.
Tìm xác suất mà một giá trị được chọn ngấu nhiên sẽ nhỏ hơn 3.
Ước tính trung bình.
Ước tính giá trị trung bình.
III.2 Giả sử mõi người trong lớp bạn lựa chọn một bộ 4 số từ 1 đến 8
(cho phép lặp đi lặp lại) và mỗi người tính toán giá trị trung bình
của tập hợp của mình.
a. phát thảo một biểu đồ có thể có của các giá trị trung bình. Giải thích lí
do cho biểu đồ của bạn.
b. Dựa vào biểu đồ của bạn, ước tính giá trị trung bình và trung bình của
phân phối của bạn.
3.3 12. bảng này liệt kê các lứa tuổi của Chủ tịch và Phó Chủ tịch của Hoa
Kì khi lần đầu tiên họ nhận chức.
President
Washington
J. Adams
Jefferson
Madison
Monroe
J. Q. Adams
Jackson
Van Buren
W. Harrison
Tyler
Polk
Taylor
Fillmore
Pierce
Buchanon
Lincoln
A Johnson
Grant
Hayes
Garfield
Arthur
Cleveland
B Harrison
Tuổi
57
61
57
57
58
57
61
54
68
51
49
64
50
48
65
52
56
46
54
49
50
47
55
President
Mckinley
T. Rốevelt
Taft
Wilson
Harding
Coolidge
Hoover
F. D. Roosevelt
Truman
Eisenhower
Kennedy
L. B. Johnson
Nixon
Ford
Carter
Reagan
G. H. W. Bush
W. Clinton
G. W. Bush
Phó tổng thống
J. Adams
Jefferson
Burr
G. H. Clinton
Gerry
Tompkins
Calhoun
Van Buren
R. M. Johnson
Tyler
Dallas
Fillmore
King
Breckinridge
Hamlin
A. Johnson
Colfax
Wilson
Wheeler
Arthur
Hendricks
Morton
Stevenson
a.
Tuổi
53
53
45
65
68
42
42
50
56
50
52
49
66
36
51
56
45
61
56
51
65
64
57
Phó tổng thống
Hobart
T. Roosevelt
Fairbanks
Sherman
Marshall
Coolidge
Dawes
Curtis
Wallace
Truman
Barkley
Nixon
L. B. Johnson
Humphrey
Agnew
Ford
Rockefeller
Mondale
G. H. W. Bush
Quayle
Gore
7 Cheney
Nhập dữ liệu của hai danh sách vào máy tính riêng của bạn và tính giá trị trung
bình, độ lệch chuẩn, s, trung bình và IQR của mõi danh sách. So sách các dữ liệu
b.
được thiết lập dựa trên các thống kê này.
Vẽ một biểu đồ cho mõi tập dữ liệu. sử dụng cùng một phạm vi và kích cỡ cho
mõi đồ thị. Mô tả cách thức biểu đồ phản ánh số liệu thống kê cho mỗi bộ dữ
c.
liệu.
Tính toán cho mỗi muc và tạo ra hai danh sách mới để chuyển đổi các lứa tuổi
d.
trong danh sách thành một quy mô tiêu chuẩn hóa ( dịch lại)
Vùng biến thiên của các gía trị trong mỗi bản phân phối là gì? Giải thích những
e.
f.
đại diện của phân phối mới.
Vẽ biểu đồ cho mỗi tiêu chuẩn hóa. Sử dụng miền – 3.5 ≤ x ≤ 3.5.
So sánh và mô tả các đồ thị.
3.4
giả sử bạn tung 1 cặp xúc sắc cân xứng 5 lần. Xác suất để tổng là 8 ít nhất 3
lần?
BÀI 13.2:
PHÂN PHỐI CHUẨN
Trong chương 12 bạn đã tìm hiểu phân phối nhị thức, (p + q), cho biến ngẫu
nhiên rời rạc. Số các phép thử được đại diện bởi n, và p và q đại diện chỉ đại
diện cho haikeets quả của mỗi ặ kiện. Trong bài này bạn sẽ khám phá ra một số
tính chất của phân phối xác suất.
I.
1.
Điều tra
Cái chuông
Xét số đầu, x, khi 15 đòng xu cân xứng được tung cùng một lúc. Phân phối
xác suất, P(x), là một phân phối nhị thức, bởi vì có chính xác hai kết quả có thể
cho mỗi lần tung là đầu hoặc đuôi.
•
Bước 1: Phân phối xác suất nhị thức cho thử nghiệm này là
p
là xác suất xuất hiện dầu cho mỗi lần tung đồng xu. Tạo một bản tính cho hàm
này với mục bảng tạo giá trị nguyên của x từ 0đến 15. Bạn nên dùng giá trị nào
•
cho p?. Gái trị của x cho P(x) đạt gái trị lớn nhất.
Bước 2: Tạo hai danh sách, L1 và L2. Các mục trong danh sách L1 nên chứa tất
cả các giá trị có thể xẩy ra của x. Nhập các giá trị tương ứng của P(x) trong danh
sách L2. Bạn có thể thực hiện nhanh bằng cách xác định L2 như sự bieeur diễn
của Y1 (L1). Hoàn thành bản dưới đây. Tổng các giá trị trong danh sách 2 là bao
nhiêu? Tại sao câu trả lời này có ý nghĩa?
Đầu
P(x)
0
1
2
....
15
•
Bước 3: Tạo ra một biểu đồ tần số tương đối cho thấy sự phân bố của đầu. Sử
dụng danh sách 2 như tần số. Mô tả hình dạng và vùng gái trị của biểu đồ. Giá
•
trị lớn nhất là bao nhiêu?
Bước 4: vẽ đồ thị P(x) sử dụng cửa sổ với miền xác định quen thuộc, chẳng hạn
như [0,18.8, 1, -0.01, 0.25, 0.1]. Bạn có thể bậc chế độ ẩn các trục để thấy tất cả
các điểm. Giá trị nào của x để hàm số xác định? Viết một mô tả ngắn gọn cho
biểu đồ. Bao gồm hình dạng và ước tính của bạn cho mode, trung bình, và giá trị
trung bình của phân phối.Làm thế nào đẻ biểu đồ này khác với biểu đồ trong
bước 3?
•
Bước 5: vẽ đồ thị
sử dụng một cửa sổ với miền xác định
quen thuộc, chẳng hạn như [0, 47, 1, -0.01, -0.25, 0.1]. Những thử nghiệm lý
thuyết này mô tả phương trình nào?. Một lần nũa, viết mô tả ngắn gọn cho biểu
đồ bao gồm hình dạng, tập xác định và vùng giá trị, và ước tính của bạn cho
mode, trung bình và giá trị trung bình của phân phối. So sánh đồ thị này với đồ
•
thị trong bước 4.
Bước 6: Nhập các giá trị được xác định của x và P(x) trong các danh sách L1 và
L2. Sau đó tìm giá trị tủng bình và đọ lệch chuẩn của phân phối.[ Xem Lưu ý
•
tính 2B để hiểu làm thế nào để tìm số liệu thống kê của bảng tần số.]
Bước 7: Nếu số đồng tiền tăng lên. Câu trả lời cho bước 6 và 7 có thay đổi
không? Viết dự đoán của bạn và sau đó xác minh chúng.
Như tăng lên càng lớn, phân phối nhị thức trông càng giống đường cong
liên tục hình chuông bên phải. Sự phân phối dân số lớn có
hình dạng này. Chiều cao, kích thước quần áo và những
điểm kiểm tra là một vài ví dụ. Trong thực tế đường cong
hình chuông rất phổ biến, nó được gọi là đường cong chuẩn, và phân phối hình
chuông được gọi là phân phối chuẩn.
Các đường cong chuẩn thường phân phối của một mẫu hay toàn bộ dân
số. Bạn có thể sử dụng x và s để đại diện cho giá trị trung bình và độ lệch chuẩn
của một mẫu, nhưng bạn sử dụng muy và sigma ( phát âm là “mew” và “sigma”)
để đại diện cho giá trị trung bình và độ lệch chuẩn của toàn bộ dân số.