1. Trang chủ >
  2. Khoa học xã hội >
  3. Giáo dục học >

ỨNG DỤNG CỦA THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 65 trang )


BÀI 13.1:



PHÂN BỐ XÁC SUẤT



Sẽ có một ngày suy luận thống kê là cần thiết cho công dân giống như khả

năng đọc và viết.

“Tôi đã làm một cuộc khảo sát và 22% trẻ em trong ngôi trường này có đôi

mắt màu xanh, vì thế 22% dân số quanh khu vực này phải có đôi mắt màu xanh”

Sean tuyên bố. “Chính xác 22%?” Yiscah hỏi.

Một trong những ứng dạng chính của thống kê là để tìm hiểu về một tập

hợp rộng lớn, chẳng hạn như dân cư của một thành phố, bằng cách nhìn vào tập

hợp nhỏ hơn, chẳng hạn như học sinh trong một trường. Tập hợp lớn được gọi

là dân số, và tập hợp nhỏ hơn là một mẫu của dân số.

Các con số tương ứng mô tả toàn bộ dân số được gọi là thông số



Khi bạn kiểm tra xác xuất trong chương 12. Bạn sử dụng các biến ngẫu

nhiên rời rạc. Các dữ liệu có giá trị nguyên, chẳng hạn như 5 cái đầu, 3 cái đuôi,

hoặc 454 học sinh. Tuy nhiên đôi khi dữ liệu có thể đưa vào bất kì giá trị thực

trong một khoảng nào đó. Nó được đại diện bởi một biến ngẫu nhiên liên tục.

Bạn có thể nói rằng tất cả mọi người là 15 hoặc 16 tuổi, nhưng thực sự không có

ai chinhs xác 16, bởi vì một người là chính xác 16 chỉ tại một khoảng khắc. Tuổi

của bạn là biến liên tục, và có vô hạn lứa tuổi.



I.

1.



Điều tra:

Độ dài bút chì

Bạn sẽ cần: Thước đo (cm), bút chì, giấy kẻ ô vuông.

Trong điều tra này, bạn sẽ khám phá sự khác biệt giữa biến ngẫu nhiên rời



rạc và liên tục.

Bắt đầu bằng cách thu thập tất cả bút chì mà nhóm bạn có.





Bước 1: Đo bút chì của bạn chính xác đến một phần mười của một cm. Trước

khi bạn chia sẽ dữ liệu với các nhóm khác, dự đoán hình dạng của một biểu đồ







của lớp dữ liệu.

Bước 2: Chia sẽ tất cả các phép đo để lớp có một tập hợp các dữ liệu. Trên giấy

vẽ đồ thị, vẽ một biểu đồ với các cột đại diện cho một cm gia tăng trong chiều







dài bút chì.

Bước 3: Chia tổng số bút chì cho mõi cột của bút chì. Làm mới biểu đồ, sử dụng







các thương số như các giá trị trên trục y.

Bước 4: Kiểm tra rằng diện tích biểu đồ thứ hai của bạn là một. Tại sao điều này







phải đúng ?

Bước 5: Hãy tưởng tượng rằng bạn thu thập càng nhiều bút chì và vẽ một biểu

đồ sử dụng phương pháp mô tả trong bước 3. Phác họa biểu đồ của nhiều bút chì







có chiều dài vô hạn sẽ trông như thế nào. Đưa ra lí do cho câu trả lời của bạn.

Bước 6: Hãy tưởng tượng làm một cuộc khảo sát rất đầy đủ và chính xác của tất

cả các bút chì trên thế giới. Giả sử rằng sự phân bố đó giống như sự phân bố bút

chì trong mẫu của bạn. Cũng giả sử rằng bạn sử dụng vô số cột rất hẹp.

Để gần đúng ý tưởng này, phác thảo trên đầu biểu

đồ của bạn một đường cong trơn, như hình bên phải. Làm

cho khu vực giữa đường cong và trục hoành giống như

khu vực của biểu đồ. Chắc chắn rằng khu vực thêm được

bao bọc bởi đường cong trên biểu đồ giống như khu vực cắt đứt các góc của cột

như bạn mịn ra hình dạng.







Bước 7: Đặt ít làm chiều dài của bút chì. Sử dụng biểu đồ trong bước 6 để ước

tính diện tích của các khu vực khác nhau giưa đường cong và trục x, thỏa mãn

các điều kiện

a. x < 10

b. 11 < x <12



x > 12.5

x = 11

Biểu đồ bạn vẽ trong bước 3 của cuộc điều tra, đưa ra các tỉ lệ của bút chì trong

c.

d.



2.



các cột, là một biểu đồ tần số tương đối. Nó cho thấy tỉ lệ của giá trị của một

biến ngẫu nhiên rời rạc chứa trong mõi cột. Đường cong liên tục bạn đã vẽ trong

bước 6 sấp xỉ một biến ngẫu nhiên liên tục của tập vô hạn

VÍ DỤ A: Một máy phát điện số chọn một số ngẫu

nhiên từ 0 – 6 theo phân bố xác suất bên phải. Bởi vì số

ngẫu nhiên có thể nhận một giá trị nào của x với 0







x







6,



đồ thị là một đồ thị liên tục. Tìm xác suất để chọn được một

số là:

a.

b.

c.



Bé hơn 2

Giữa 2.5 và 3.5

Lớn hơn 4



GIẢI

Đầu tiên lư ý rằng khu vực bóng mờ cho toàn bộ phân phối có diện tích là

1, để tìm xác suất của một tập hợp các kết quả, tìm diện tích của khu vực tương

a.



ứng với nó

Khu vực giữa 0 và 2 là một hình chư nhật với chiều rộng 2 chiều dài 2. Diện tích

của nó là 2.2, hoặc 4. Vì thế xác suất chọn ngẫu nhiên được một số giữa 0 và 2



b.



là 4.

Khu vực giữa 2.5 và 3.5 là một hình chữ nhật với chiều rộng 1 và chiều dài 2.

Diện tích của nó là 2. Vì thế xác suất là 2 để chọn ngẫu nhiên được một số giữa



c.



2.5 và 3.5.

Khu vực giữa 4 và 6 là một tam giác với chiều rộng là 2 và chiều cao là 2. Diện

tích của tam giác là 2. Vì thế xác suất là 2.

Trong chương 2 bạn đã được tìm hiểu 3 phương pháp trọng tâm đẻ mô tả

một tập dữ liệu có ý nghĩa, trung bình và mode. Với một phân bố xác suất bạn

không có một tập hữu hạn các dữ liệu. Vì thế những thống kê phải được xác

định và tính toán theo những cách hơi khác nhau.

Các đại lượng cơ bản của phân bố xác suất.

Mode (yếu vị ) : Giá trị hoặc những giá trị mà tại đó đồ thị đạt giá trị lớn nhất

II.







của nó.







Trung bình: Số d sao cho đường x = d chia khu vực trên thành 2 phần với diện







tích bằng nhau.

Kì vọng (giá trị trung bình): trung bình cộng của gía trị xác suất. Vì thế, hoành

độ của trọng tâm, hoặc điểm cân bằng của khu vực cũng là giá trị trung bình.

1. VÍ DỤ B:

Một số lượng lớn người dân được yêu cầu hoàn

thành một câu đố. Thời gian làm của mõi người được

ghi nhận.Các dữ liệu thể hiện trong đồ thị phân bố xác

suất bên phải, với thời gian dao động giữa 0 và 8 giây.

a.

b.

c.



Tim mode

Tìm trung bình

Tìm giá trị trung bình (kì vọng)



Giải

Chú ý rằng khu vực bóng mờ có diện tích bằng 1.

Yếu vị là hoành độ của điểm cao nhất, 2 giây.

Tìm đường thẳng đứng mà chia tam giác trên thành hai khu

a.



b.



vực, mõi khu vực có diện tích là 0.5. Một vài thử nghiệm

cho thấy trung bình khoảng 3 s. Tam giác nhỏ hơn có cạnh đáy là 5 và chiều

cao khoảng 2.

A ~ 0.5 x 5 x 0.2 ~ 0.5

Vì thế khoảng một nửa diện tích của tam giác nhỏ hơn nằm sau 3. Để tính

chính xác trung bình, bạn ó thể dùng phương trình của các đường hình thành

ranh giới của khu vực. Phương trình của đường thẳng đi qua (2, 0.25) và (8, 0)

là y = -(x -8)/24. Dùng phương trình này để tìm gái trị của trung bình, d, vì thế

diện tích tam gaics bên phải ó trung bình là 0.5.

A = 0.5bh = 0.5(8 – d)[-(d – 8)/24]

0.5 = 0.5(8 – d)[-(d – 8)/24]

1 = -(- d^2 -16d – 64)/24

- 24 = - d^2 -16d – 64

- d^2 -16d – 40 = 0

d ~ 3.101, 12.899



Diện tích của tam giác băng ½ tích của

cạnh đáy (8 – d) và chiều cao. Chiều cao là

gái trị của y tại x = d.

Giải tìm d khi diện tích là 0.5

Chia hia vế cho 0.5 và nhân nhị thức.

Nhân hai vế cho -24

Viết phương trình bậc 2 theo hình thức

chung



Sử dụng công thức bậc hai để giải ra d.



Gía trị thứ 2 là bên ngoài của miền xác định, vì vậy trung bình của phân

phối là khoảng 3.101.

c.



Bằng cách cắt ra hình tam giác và cân bằng nó trên đầu tẩy của 1 bút chì, bạn có

thể nhận được một ước lượng khá tốt mà giá trị trung binh là 3.33 in.



BÀI TẬP

III.1 Trả lời các bài tập 1-4 ở trang 729 cho mỗi phân phối dưới đây.



III.



1.

2.

3.

4.



Tìm chiều cao của hộp lưới trên trục y để diện tích là 1.

Tìm xác suất mà một giá trị được chọn ngấu nhiên sẽ nhỏ hơn 3.

Ước tính trung bình.

Ước tính giá trị trung bình.

III.2 Giả sử mõi người trong lớp bạn lựa chọn một bộ 4 số từ 1 đến 8

(cho phép lặp đi lặp lại) và mỗi người tính toán giá trị trung bình

của tập hợp của mình.



a. phát thảo một biểu đồ có thể có của các giá trị trung bình. Giải thích lí

do cho biểu đồ của bạn.

b. Dựa vào biểu đồ của bạn, ước tính giá trị trung bình và trung bình của

phân phối của bạn.



3.3 12. bảng này liệt kê các lứa tuổi của Chủ tịch và Phó Chủ tịch của Hoa

Kì khi lần đầu tiên họ nhận chức.

President

Washington

J. Adams

Jefferson

Madison

Monroe

J. Q. Adams

Jackson

Van Buren

W. Harrison

Tyler

Polk

Taylor

Fillmore

Pierce

Buchanon

Lincoln

A Johnson

Grant

Hayes

Garfield

Arthur

Cleveland

B Harrison



Tuổi

57

61

57

57

58

57

61

54

68

51

49

64

50

48

65

52

56

46

54

49

50

47

55



President

Mckinley

T. Rốevelt

Taft

Wilson

Harding

Coolidge

Hoover

F. D. Roosevelt

Truman

Eisenhower

Kennedy

L. B. Johnson

Nixon

Ford

Carter

Reagan

G. H. W. Bush

W. Clinton

G. W. Bush



Phó tổng thống

J. Adams

Jefferson

Burr

G. H. Clinton

Gerry

Tompkins

Calhoun

Van Buren

R. M. Johnson

Tyler

Dallas

Fillmore

King

Breckinridge

Hamlin

A. Johnson

Colfax

Wilson

Wheeler

Arthur

Hendricks

Morton

Stevenson

a.



Tuổi

53

53

45

65

68

42

42

50

56

50

52

49

66

36

51

56

45

61

56

51

65

64

57



Phó tổng thống

Hobart

T. Roosevelt

Fairbanks

Sherman

Marshall

Coolidge

Dawes

Curtis

Wallace

Truman

Barkley

Nixon

L. B. Johnson

Humphrey

Agnew

Ford

Rockefeller

Mondale

G. H. W. Bush

Quayle

Gore

7 Cheney



Nhập dữ liệu của hai danh sách vào máy tính riêng của bạn và tính giá trị trung

bình, độ lệch chuẩn, s, trung bình và IQR của mõi danh sách. So sách các dữ liệu



b.



được thiết lập dựa trên các thống kê này.

Vẽ một biểu đồ cho mõi tập dữ liệu. sử dụng cùng một phạm vi và kích cỡ cho

mõi đồ thị. Mô tả cách thức biểu đồ phản ánh số liệu thống kê cho mỗi bộ dữ



c.



liệu.

Tính toán cho mỗi muc và tạo ra hai danh sách mới để chuyển đổi các lứa tuổi



d.



trong danh sách thành một quy mô tiêu chuẩn hóa ( dịch lại)

Vùng biến thiên của các gía trị trong mỗi bản phân phối là gì? Giải thích những



e.

f.



đại diện của phân phối mới.

Vẽ biểu đồ cho mỗi tiêu chuẩn hóa. Sử dụng miền – 3.5 ≤ x ≤ 3.5.

So sánh và mô tả các đồ thị.



3.4



giả sử bạn tung 1 cặp xúc sắc cân xứng 5 lần. Xác suất để tổng là 8 ít nhất 3

lần?



BÀI 13.2:



PHÂN PHỐI CHUẨN



Trong chương 12 bạn đã tìm hiểu phân phối nhị thức, (p + q), cho biến ngẫu

nhiên rời rạc. Số các phép thử được đại diện bởi n, và p và q đại diện chỉ đại

diện cho haikeets quả của mỗi ặ kiện. Trong bài này bạn sẽ khám phá ra một số

tính chất của phân phối xác suất.



I.

1.



Điều tra

Cái chuông



Xét số đầu, x, khi 15 đòng xu cân xứng được tung cùng một lúc. Phân phối

xác suất, P(x), là một phân phối nhị thức, bởi vì có chính xác hai kết quả có thể

cho mỗi lần tung là đầu hoặc đuôi.





Bước 1: Phân phối xác suất nhị thức cho thử nghiệm này là



p



là xác suất xuất hiện dầu cho mỗi lần tung đồng xu. Tạo một bản tính cho hàm

này với mục bảng tạo giá trị nguyên của x từ 0đến 15. Bạn nên dùng giá trị nào





cho p?. Gái trị của x cho P(x) đạt gái trị lớn nhất.

Bước 2: Tạo hai danh sách, L1 và L2. Các mục trong danh sách L1 nên chứa tất

cả các giá trị có thể xẩy ra của x. Nhập các giá trị tương ứng của P(x) trong danh

sách L2. Bạn có thể thực hiện nhanh bằng cách xác định L2 như sự bieeur diễn

của Y1 (L1). Hoàn thành bản dưới đây. Tổng các giá trị trong danh sách 2 là bao

nhiêu? Tại sao câu trả lời này có ý nghĩa?



Đầu

P(x)



0



1



2



....



15







Bước 3: Tạo ra một biểu đồ tần số tương đối cho thấy sự phân bố của đầu. Sử

dụng danh sách 2 như tần số. Mô tả hình dạng và vùng gái trị của biểu đồ. Giá







trị lớn nhất là bao nhiêu?

Bước 4: vẽ đồ thị P(x) sử dụng cửa sổ với miền xác định quen thuộc, chẳng hạn

như [0,18.8, 1, -0.01, 0.25, 0.1]. Bạn có thể bậc chế độ ẩn các trục để thấy tất cả

các điểm. Giá trị nào của x để hàm số xác định? Viết một mô tả ngắn gọn cho

biểu đồ. Bao gồm hình dạng và ước tính của bạn cho mode, trung bình, và giá trị

trung bình của phân phối.Làm thế nào đẻ biểu đồ này khác với biểu đồ trong

bước 3?







Bước 5: vẽ đồ thị



sử dụng một cửa sổ với miền xác định



quen thuộc, chẳng hạn như [0, 47, 1, -0.01, -0.25, 0.1]. Những thử nghiệm lý

thuyết này mô tả phương trình nào?. Một lần nũa, viết mô tả ngắn gọn cho biểu

đồ bao gồm hình dạng, tập xác định và vùng giá trị, và ước tính của bạn cho

mode, trung bình và giá trị trung bình của phân phối. So sánh đồ thị này với đồ





thị trong bước 4.

Bước 6: Nhập các giá trị được xác định của x và P(x) trong các danh sách L1 và

L2. Sau đó tìm giá trị tủng bình và đọ lệch chuẩn của phân phối.[ Xem Lưu ý







tính 2B để hiểu làm thế nào để tìm số liệu thống kê của bảng tần số.]

Bước 7: Nếu số đồng tiền tăng lên. Câu trả lời cho bước 6 và 7 có thay đổi

không? Viết dự đoán của bạn và sau đó xác minh chúng.

Như tăng lên càng lớn, phân phối nhị thức trông càng giống đường cong

liên tục hình chuông bên phải. Sự phân phối dân số lớn có

hình dạng này. Chiều cao, kích thước quần áo và những

điểm kiểm tra là một vài ví dụ. Trong thực tế đường cong

hình chuông rất phổ biến, nó được gọi là đường cong chuẩn, và phân phối hình

chuông được gọi là phân phối chuẩn.

Các đường cong chuẩn thường phân phối của một mẫu hay toàn bộ dân

số. Bạn có thể sử dụng x và s để đại diện cho giá trị trung bình và độ lệch chuẩn

của một mẫu, nhưng bạn sử dụng muy và sigma ( phát âm là “mew” và “sigma”)

để đại diện cho giá trị trung bình và độ lệch chuẩn của toàn bộ dân số.



Xem Thêm
Tải bản đầy đủ (.docx) (65 trang)

×