1. Trang chủ >
  2. Khoa học xã hội >
  3. Giáo dục học >

II. Định lý giới hạn trung tâm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 65 trang )


1. Định lý

1.Gía trị trung bình của mẫu phân phối gần chuẩn

2. Gía trị trung bình tổng thể xấp xỉ giá trị trung bình của phân phối giá trị

trung bình mẫu.

3. Độ lệch chuẩn của giá trị trung bình mẫu là xấp xỉ độ lệch chuẩn tổng

thể chia cho căn bậc hai của n,hoặc

Mỗi xấp xỉ càng nhỏ với giá trị n càng lớn.



2. Ví dụ:

VÍ DỤ A:

Một công ty dược phẩm tuyên bố

rằng thuốc kháng kháng sinh của họ

chứa trung bình 324 mg thành phần

trong mỗi viên thuốc. Học sinh lớp

hóa học phân tích 25 viên thuốc để

xác địnhphần trong mỗi viên thuốc.

Kết quả của họ nằm ở bảng bên

phải,đơn vị mg.. Nếu tuyên bố của

công ti là chính xác thì xác suất có thể

là bao nhiêu?



Giải:

Giá trị trung bình mẫu của học sinh là 319,96 mg. Bạn muốn biết xác

suất mà mộtmẫu có giá trị trung bình là 319.96hay nhỏ hơn giá trị trung bình

tổng thể là324 mg.

Phần đầu tiên của Định lý giới hạn trung tâm nói rằng, nếu bạn lấy nhiều

mẫu, thì phân bố trung bình lấy từ nhiều mẫu sẽ tuân theo luật phân bố chuẩn.

Vì vậy, nếu ban biết giá trị trung bình và đôl lệch chuẩn của phân phối giá trị



trung bình,thì bạn có thể sử dụng tính chất của phân phối chuẩn để xác định xác

suất trong phạm vi của giá trị trung bình, chẳng hạn như 319,96 mg hoặc ít hơn.



Phần thứ hai của Định lý giới hạn trung tâm cho biết giá trị trung bình đó

cũng tương tự như giá trị trung bình tổng thể, trong đó công ty cho biết là 324

mg.Và phần thứ ba của Định lý giới hạn trung tâm nói rằng độ lệch chuẩn của

phân phối giá trị trung bình bằng độ lệch chuẩn tổng thể chia cho căn bậc hai

của kích thước mẫu,hoặc. Bạn không biết tiêu chuẩnđộ lệch của tổng thể, nhưng

bạn có thể cho rằng đó là độ lệch chuẩn của mẫu, là 12,75 mg. Sau đóphép phân

phối giá tri trung bình là , hoặc 2,55 mg.

Tổng hợp tất cả lại với nhau, bạn sẽ thấy rằng xác suất giá trị trung bình

của 319,96 mg hoặc ít hơn là N (0, 319,96, 324, 2,55), hoặc 0,057.Chỉ có 5,7%

cơ hội cho giá trị trung bình của mẩu là 319,96 mg hoặc ít hơn. Vì vậy, trên thực

tế giá trị trung bình của mẩu là 319,96 mg là khá hiếm, và công ti sẽ bị yêu cầu

bồi thường.Ví dụ A suy luận minh họa. Suy luận liên quan đến việc tạo ra một

giả thuyết về một hoặc nhiều thông số tổng thể ("Giá trị trung bình là 324 mg"),

quyết định những gì sẽ làm cho các giả thuyết"không thể xảy ra," thu thập dữ

liệu, và một trong hai bác bỏ giả thuyết hoặc để cho nó đứng, dựa trên xác suất.

Kiểm định giả thuyết này là cơ sở nghiên cứu trong nhiều lĩnh vực, bao gồm cả

lĩnh vực y tế.

VÍ DỤ B:

Một công ty kiểm tra sức khỏe thường xuyên thực hiện trên một công

nhân cho thấy rằng một sản phẩm mới được sử dụng cho làm sạch có thể gây ra

giảm số lượng tế bào bạch cầu trong máu.Công ty phải tiến hành ra sao?



Đây là hình ảnh phóng đại của các tế

bào máu sử dụng màu quét cho thấy

các tế bào máu trắng (màu xanh), các tế

bào máu đỏ (màu đỏ), và tiểu cầu(màu

hồng). Các tế bào bạch cầu hoạt động

trong cáchệ thống miễn dịch, các tế bào

hồng cầu mang ôxy thông qua cơ thể,

và tiểu cầu giúp chữa lành vết thương.

Giải pháp:

Công ty có thể làm theo các bước sau để quyết định liệu họ có nên được

quan tâm về tác động của sản phẩm làm sạch





Bước 1 Với thống kê này bạn không thể quyết định chắc chắn liệu các sản phẩm

làm sạch có tác dụng trênsố lượng tế bào máu trắng. Bạn chỉ có thể khẳng định

nó có thể có tác dụng hay không.Trên thực tế, bạn muốn quyết định có hay

không một thống kê mẫu kết quả là "không thể xảy ra."Với việc làmđó, bạn đặt

giả thuyết rằng sản phẩm làm sạch không có tác dụng, điều này được gọi là giả

thuyết. Sau đó, bạn quyết định những gì sẽ làm cho giả thuyết "không thể xảy

ra." giả sử bạnquyết định rằng nếu con số trung bình của các tế bào máu trắng

bạn nhận được từ dữ liệu mẫu là ít hơn 5%có thể xảy ra, sau đó bạn sẽ bác bỏ







giả thuyết.

Bước 2 Bạn lấy một mẫu ngẫu nhiên gồm 36 công nhân và tìm thấy họ có một

số lượng bạch cầu trung bình của7075 tế bào mỗi milimét khối (tế bào/mm3).

Bạn tìm kiếm thông tin y tế và thấy rằng một tổng thể người lớn khỏe mạnh có

số lượng bạch cầu trung bình của 7500 tế bào/mm3 vàđộ lệch chuẩn của 1250 tế







bào/mm3

Bước 3: bởi định lý giới hạn trung tâm, giá tri trung bình của nhiều mẫu sẽ là

7500 tế bào/mm3 với độ lệch chuẩn , hoặc 208 tế bào/mm3. Xác suất mà một

mẫu sẽ có giá trị trung bình 7075 hoặc ít hơn là N (0, 7075, 7500, 208), hoặc

0,0205. Điều này có nghĩa rằng có 2%cơ hội cho điều đó, nếu giá trị trung bình

tổng thể là 7500 tế bào, một mẫu sẽ có giá trị trung bình 7075 tế bào hoặc ít

hơn.







Bước 4: Bởi vì xác suất của giả thuyết của bạn dưới 5%, nên giả thuyết rằng

các sản phẩm làm sạch không có tác dụng, là không thể xảy ra và bạn bác bỏ nó.

Công ty nên dừng lạisử dụng sản phẩm làm sạch và cân nhắc việc thử nghiệm .

Nếu bạn đã quyết định trước rằng bạn sẽ bác bỏ giả thuyết thống kê ít hơn

1% có thể xảy ra, bạn không thể bác bỏ giả thiết đấy.Không thể bác bỏ giả

thuyết không có nghĩa là giả thuyết là đúng,chỉ rằng nó không phải những gì bạn

quyết định gọi sai. Kiểm định giả thiết bằng cách bác bỏ sẽ không thực hiện

được nếu thống kê mẫu có một xác suất ít hơn 5% hoặc 10%.Khi giả thuyết bị

bác bỏ, thống kê gọi đó là một "biến cố chắc chắn."

Như bạn đã đọc trên trang 748, 90% dữ

liệu trong một đường cong chuẩn nằm

trong 1.645σ của giá trị trung bình. Vì

vậy, 5% là ít hơn 1.645σ dưới giá trị

trung bình và 5% là nhiều hơn1.645

trên giá trị trung bình.



III. Bài tập

3.1 Thực hành kỹ năng của bạn

1. Từ giá trị trung bình tổng thể là 200 và độ lệch chuẩn 12, tìm xác suất

a. Một giá trị của 195 hoặc ít hơn.

b. Kích thước mẫu n = 4 giá trị trung bình 195 hoặc ít hơn.

c. Kích thước mẫu n = 9 giá tri trung bình 195

hoặc ít hơn.

d. Kích thước mẫu n = 36 gia trị trung bình 195 hoặc ít hơn.

2. Đối với mỗi tổng thể và mẫu, xác định giá trị trung bình của mẫu có thể chỉ

ra biến cố chấc chắn độ lệch chuẩn của tổng thể

a.σ = 80,µ = 10, n = 25

b.σ = 130,µ = 6, n = 36

c.σ = 18,µ = 2, n = 64

d. σ= 0,52,µ = 0.1, n = 10



3.2 Lý do và Áp dụng

3. Penny Adler đã làm việc nhiều năm như chuyên gia tính toán trong

cùng một văn phòng. Theo tính toán của mình, cô mất khoảng 23 phút đẻ đén

phòng làm việc mỗi ngày, với độ lệch chuẩn là 4,1 phút. Khi cô rời khỏi nhà, cô

nhận thấy rằng cô ấy đến tại văn phòng phải mất 25 phút. Xác suất mà cô sẽ bị

trễ là bao nhiêu ?

4. Thanh kẹo " You Gotta Be Nutz" có trọng

lượng trung bình 75,3 g và độ lệch chuẩn 4,7

g.Nhà sản xuất muốn tránh khiếu nại rằng bất kỳ

thanh kẹo nào quá nhẹ, vì vậy họ quyết định quảng

cáo t "trọng lượng đảm bảo tối thiểu’’

a. Trọng lượng nào nhà sản xuất nên quảng cáo nếu họ muốn 80% của các

thanh kẹo đáp ứng hoặc vượt quá trọng lượng tối thiểu? (Phác thảođường cong

bình thường với bóng, và viết một câu hoàn chỉnhsử dụng câu trả lời bằng số

của bạn.)

b. Trọng lượng nào nhà sản xuất nên quảng cáo nếu họ muốn 90% của các thanh

kẹo để đáp ứnghoặc vượt quá trọng lượng tối thiểu? (Phác thảo một đường cong

bình thường bóng và viết hoàn chỉnhsử dụng câu trả lời bằng số của bạn.)

c. Trọng lượng nào nhà sản xuất nên quảng cáo nếu họ muốn 95% của các

thanh kẹo để đáp ứnghoặcvượt quá trọng lượng tối thiểu? (Phác thảo một đường

cong bình thường bóng và viết hoàn chỉnhsử dụng câu trả lời bằng số của bạn.)

5. ÁP DỤNG:

Một công ty phát triển bất động sản muốn

hủy một nhà máy bỏ hoang và xây

dựngchung cư cao tầng tại vị trí của nó.

Trước khi tiến hành kế hoạch này, các

công ty kiểm tra địa điểm các chất độc gây

ô nhiễm. Năm mươi mẫu ngẫu nhiên thu

thập từ các địa điểm khác nhau xung quanh

các địa điểm và phân tích cadmium (Cd).

Nếu nồng độ trung bình cadmium trong đất

là 0,8 mg / kg hoặc cao hơn,địa điểm này

làtuyên bố bị ô nhiễm và các nhà phát triển

sẽ loại bỏ nó kế hoạch vì dự án sẽ là quá



tốn kém. kết quảcủa việc lấy mẫu được thể

hiện trong bảng bên phải.

a. Bao nhiêu mẫu bị ô nhiễm?

b. Tìm giá trị trung bình và độ lệch chuẩn của số liệu này

c. Nếu nồng độ thực sự của cadmium trong đất0,8 mg / kg, xác suất của những

kết quả này là gì?

d. Các nhà phát triển sẽ xây dựng các chung cư cao tầng k?

3.3 Xem xét

6. Xét hàm số f (x) = 16.8x + 405.

a. Tìm f (-19,5). b. Tìm x sao cho f (x) = 501,096.

c. Viết các phương trình của hai đường thẳng song song có 2,4 đơn vị trên và

dướiđường y = f (x).

7. Tìm đường trung tuyến-trung bình cho những dữ liệu này, và xác định căn

bậc hai của giá trị trung bình.



Thăm dò

khoảng tin cậy của dữ liệu hai chiều

Giả sử bạn có một cuộc thăm dò của 50 cử tri được chọn ngẫu nhiên trong

tiểu bị thất bại k?ỳ có thể bang của bạn và thấy rằng 53%sẽ bỏ phiếu "có" trên

một đề xuất mà có thể tăng thuế để hỗ trợ các trường họcĐề xuất na có thể là đề

xuất sẽ thất bại? Làm thế nào có thể nó rằng các đề xuất sẽ vượt qua? (Nếumột

đề xuất là phải vượt qua, ít nhất 50% dân số phải bỏ phiếu "có.") Nếu thăm dò ý

kiến của bạncho thấy 78% mẫu của bạn hỗ trợ các đề xuất? Sau đó như thế nào

nhất định bạn có thể màcác đề xuất sẽ vượt qua?

Bạn đã học về khoảng tin cậy trong Bài học 13,4, và khám phá biến dữ

liệu, chẳng hạn như độ tuổi và chiều cao. Trong tình hình bầu cử này, tuy nhiên,

các dữ liệu này là hai chiều. Đó là,có hai giá trị có thể cho mỗi giá trị dữ liệu,

"có" hoặc "không". Trong thăm dò này, bạn sẽsử dụng Fathom để mô phỏng



các kết quả của các cuộc thăm dò 100 ngẫu nhiên của 50 cử tri và làm cho giả

thuyếtvề những gì các kết quả của một cuộc thăm dò mẫu cho phép bạn để kết

luận về ý kiến của dân.

Hoạt động

Cử tri bỏ phiếu





Bước 1 Bắt đầu Fathom. Từ menu File, chọn Open, và mở tập tin

Polling.ftm. Bạn sẽ thấy một cửa sổ tương tự như hình dưới đây.



Có hai bộ thu thập: thăm dò ý kiến, trong đó có 50 ý kiến (hoặc "có" hoặc

"không"),và các biện pháp từ thăm dò ý kiến, trong đó có kết quả (tỷ lệ phần

trăm người đã nói"có") từ mỗi 100 các cuộc thăm dò của một mẫu ngẫu nhiên

của 50 cử tri. Bảng trường hợp bên trái cho thấy kết quả của một cuộc thăm dò,

và biểu đồ thể hiện sự phân bố các kết từ 100 cuộc thăm dò. Biểu đồ cũng cho

thấy 2.5th phần trăm và phần trăm 97.5th trong số 100 kết quả, vì vậy 95% các

kết quả nằm giữa đường màu xanh và màu đỏ tương đương với khoảng tin cậy

95%.

Thanh trượt p , kiểm soát tỷ lệ phần trăm thực sự của cử tri trong dân số

những người ủng hộ đề xuất sử dụng các mô phỏng,thay đổi giá trị của p bằng

cách sử dụng thanh trượt hoặc gõ vào một giá trị. Sau đó nhấn “Collect more

measures” để mô phỏng tiến hành 100 cuộc thăm dò của 50 cử tri được chọn

ngẫu nhiên . Bạn sẽ thấy bảng trường hợp , biểu đồ,và các giá trị phần trăm thay

đổi.





Bước 2: Nhìn vào cửa sổ Fathom trên trang 760 , trong đó cho thấy kết quả cho

một dân số với p=5 .Phải chăng kết quả bỏ phiếu là 53% có thể xảy ra nếu chính

xác là 50% dân số ủng hộ đề xuất ?kết quả là 78% có thể xảy ra không? (cùng



với việc thăm dò này ,hãy xem xét một kết quả có thể xảy ra nếu nó nằm trong





khoảng tin cậy 95%)

Bước 3: Làm việc với một cộng sự để ước tính 2,5 lần và 97,5 lần giá trị phần

trăm cho p =0;0,1;0,2…và như vậy cho đến 1. Với mỗi giá trị của p, đặt thanh

trượt ,thu thập một tập các phương pháp mới và nhập các giá trị phần trăm vào

bảng như hình dưới đây. Sau đó nhập “có” hoặc “không”vào cột thứ 3 hoặc cột

thứ 4,có tùy thuộc vào kết quả là 53% và 78% rơi vào khoảng tin cậy 95%

p



2.5 lần phần trăm



97.5 lần phần



Kết quả 53% có



Kết quả 78%



trăm



thể xảy ra không



có thể xảy ra



?



không?



0

1

2





Bước 4: Sao chép đồ thị ở dưới cho kết quả là 53% và 78%. Một điểm cho mỗi

hàng trong bảng trên. Những điểm (0,không) là đã được điền vào







Bước 5: Phân tích đồ thị của bạn ở bước 4 và tính toán càng chính xác càng

tốt ,nơi mà những điểm thay đổi từ “không” thành “có” và ngược lại . Nếu cần

thiết khám phá các giá trị của p giữa những người trong bảng của bạn chẳng hạn

như 0.35 . Vẽ các điểm bổ sung vào đồ thị của bạn . Với giá trị nào của p là kết







quả bỏ phiếu của 53% và 78% là có thể xảy ra ?

Bước 6: Bây giờ bạn đã nghiên cứu những kết quả bỏ phiếu nào là có thể xảy ra,

rằng bạn biết tỷ lệ thực tế của người dân bỏ phiếu “ có” . Sử dụng các quan sát

của bạn để lam cho giả thuyết ngược lại. Có nghĩa là, một đề xuất có khả năng



vượt qua một thăm giò cho thấy 53% người ủng hộ? 78% người ủng hộ? Giải

thích lý do của bạn.



BÀI 13.5:



DỮ LIỆU HAI CHIỀU VÀ SỰ TƯƠNG QUAN



Một biện pháp thống kê thường được sử dụng kết hợp tuyến tính được gọi

là “ hệ số tương quan”. Một sụ kết hợp tuyến tính giữa hai biến được gọi là “

tương quan” . Trong một cuộc điều tra bạn sẽ sử dụng một máy tính để khám

phá tính chất của hệ số tương quan cho một mẫu hai chiều.

I. Sự điều tra

1. Tìm kiếm mối liên quan





Bước 1. Làm việc với nhóm của bạn để tạo ra một cuộc khảo sát với 5 câu hỏi

mà tất cả các câu hỏi được trả lời bằng số hoặc sử dụng mẫu điều tra sau đây.



1.



Đêm qua bạn làm bài tập về nhà mất bao nhiêu phút?



2.



Bạn mất bao nhiêu phút để nói chuyện, gọi điện thoại, email hoặc viết thư cho

bạn bè?



3.



Bạn mất bao nhiêu phút để xem tivi hoặc nghe nhạc?



4.



Vào thời gian nào thì bạn đi ngủ?



5.



Bạn có bao nhiêu lớp học?







Bước 2. Dự đoán với của bạn về những thế mạnh của mối tương quan giữa các

cặp biến. Ví dụ như , bạn có thể quyết định số phút của bài tập về nhà là tương

quan vững chắc với số phút các lớp học. Xem xét từng cặp trong 10 cặp biến và

xác định những kết hợp mà bạn tin rằng sẽ xảy ra.

Sự tương quan dương ( như là một sụ phát triển hay có xu hướng tăng )



i)



Sự tương quan âm ( như là sự phát triển hay là có xu hướng giảm ).



ii)



Sự tương quan yếu.



iii)





Bước 3. Thu thập dữ liệu từ mỗi học sinh trong lớp của bạn. Sau đó nhập dữ liệu

vào 5 danh sách máy tính. Vẽ những điểm cho mỗi danh sách , và tìm hệ số

tương quan.[► Nhìn thấy Calculator Note 13F để học cách tìm hệ số tương

quan .◄] Bạn có thể phân chia công việc cho những thành viên trong nhóm của

bạn. Mô tả mối quan hệ giữa sự xuất hiện của đồ thị và giá trị của hệ số tương

quan.







Bước 4. Viết một đoạn văn mô tả việc khám phá các mối tương quan của bạn.

Bao gồm bất kì những cặp không tương quan mà bạn tìm thấy một cách ngẫu

nhiên. Bạn đx thu thập một mẫu nhỏ và không phải là ngẫu nhiên. Bạn có nghĩ

rằng các mối quan hệ vẫn sẽ xảy ra , Nếu bạn thu thập câu trả lời từ một mẫu

ngẫu nhiên của toàn bộ học sinh trường bạn?

HỆ SỐ TƯƠNG QUAN

Hệ số tương quan r có thể được tính với công thức:

r=



=



Nếu giá trị của r dần đến giá trị



thì cho thấy mối tương quan mạnh



mẽ,và nếu giá trị của r dần đến 0 thì cho thấy không tương quan



Chú ý rằng định nghĩa của hệ số tương quan bao gồm không đề cập đến

bất kỳ đường cụ thể nào,mặc dù nó mô tả cách tìm hiểu về một đường phù hợp

với mỗi tập dữ liệu hai chiều. Ngược lại , góc không vuông bạn đã được học

trong Chương 3 mô tả cách tìm đường thẳng cụ thể phù hợp với một bộ dữ liệu

Thông thường dữ liệu hai chiều được thu thập từ bài học hoặc thí nghiệm

trong đó một biến đại diện cho một số điều kiện và đại diện cho các phép đo dựa

trên điều kiện đó, như trong ví dụ tiếp theo. Trong thống kê các biến x và y

thường được gọi là các biến giải và phản ứng thay vì các biến độc lập và các

biến phụ thuộc

2. Ví dụ : Kiane thuộc nhiều ủy ban và chú ý là những nhóm khác nhau có số

lượng khác nhau của số lần đưa ra quyết định. Cô tự hỏi rằng nếu thời gian cần

thiết để thực hiện một quyết định là liên quan tuyến tính đến kích thước của ủy

ban. Vì vậy cô đã thu thập một số dữ liệu. Tìm hệ số tương quan của những dữ

liệu này và giải thích kết quả của bạn

Kích

thước

(người



4



6



7



9



9



11



15



15



18



20



21



24



25



Xem Thêm
Tải bản đầy đủ (.docx) (65 trang)

×