Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 65 trang )
1. Định lý
1.Gía trị trung bình của mẫu phân phối gần chuẩn
2. Gía trị trung bình tổng thể xấp xỉ giá trị trung bình của phân phối giá trị
trung bình mẫu.
3. Độ lệch chuẩn của giá trị trung bình mẫu là xấp xỉ độ lệch chuẩn tổng
thể chia cho căn bậc hai của n,hoặc
Mỗi xấp xỉ càng nhỏ với giá trị n càng lớn.
2. Ví dụ:
VÍ DỤ A:
Một công ty dược phẩm tuyên bố
rằng thuốc kháng kháng sinh của họ
chứa trung bình 324 mg thành phần
trong mỗi viên thuốc. Học sinh lớp
hóa học phân tích 25 viên thuốc để
xác địnhphần trong mỗi viên thuốc.
Kết quả của họ nằm ở bảng bên
phải,đơn vị mg.. Nếu tuyên bố của
công ti là chính xác thì xác suất có thể
là bao nhiêu?
Giải:
Giá trị trung bình mẫu của học sinh là 319,96 mg. Bạn muốn biết xác
suất mà mộtmẫu có giá trị trung bình là 319.96hay nhỏ hơn giá trị trung bình
tổng thể là324 mg.
Phần đầu tiên của Định lý giới hạn trung tâm nói rằng, nếu bạn lấy nhiều
mẫu, thì phân bố trung bình lấy từ nhiều mẫu sẽ tuân theo luật phân bố chuẩn.
Vì vậy, nếu ban biết giá trị trung bình và đôl lệch chuẩn của phân phối giá trị
trung bình,thì bạn có thể sử dụng tính chất của phân phối chuẩn để xác định xác
suất trong phạm vi của giá trị trung bình, chẳng hạn như 319,96 mg hoặc ít hơn.
Phần thứ hai của Định lý giới hạn trung tâm cho biết giá trị trung bình đó
cũng tương tự như giá trị trung bình tổng thể, trong đó công ty cho biết là 324
mg.Và phần thứ ba của Định lý giới hạn trung tâm nói rằng độ lệch chuẩn của
phân phối giá trị trung bình bằng độ lệch chuẩn tổng thể chia cho căn bậc hai
của kích thước mẫu,hoặc. Bạn không biết tiêu chuẩnđộ lệch của tổng thể, nhưng
bạn có thể cho rằng đó là độ lệch chuẩn của mẫu, là 12,75 mg. Sau đóphép phân
phối giá tri trung bình là , hoặc 2,55 mg.
Tổng hợp tất cả lại với nhau, bạn sẽ thấy rằng xác suất giá trị trung bình
của 319,96 mg hoặc ít hơn là N (0, 319,96, 324, 2,55), hoặc 0,057.Chỉ có 5,7%
cơ hội cho giá trị trung bình của mẩu là 319,96 mg hoặc ít hơn. Vì vậy, trên thực
tế giá trị trung bình của mẩu là 319,96 mg là khá hiếm, và công ti sẽ bị yêu cầu
bồi thường.Ví dụ A suy luận minh họa. Suy luận liên quan đến việc tạo ra một
giả thuyết về một hoặc nhiều thông số tổng thể ("Giá trị trung bình là 324 mg"),
quyết định những gì sẽ làm cho các giả thuyết"không thể xảy ra," thu thập dữ
liệu, và một trong hai bác bỏ giả thuyết hoặc để cho nó đứng, dựa trên xác suất.
Kiểm định giả thuyết này là cơ sở nghiên cứu trong nhiều lĩnh vực, bao gồm cả
lĩnh vực y tế.
VÍ DỤ B:
Một công ty kiểm tra sức khỏe thường xuyên thực hiện trên một công
nhân cho thấy rằng một sản phẩm mới được sử dụng cho làm sạch có thể gây ra
giảm số lượng tế bào bạch cầu trong máu.Công ty phải tiến hành ra sao?
Đây là hình ảnh phóng đại của các tế
bào máu sử dụng màu quét cho thấy
các tế bào máu trắng (màu xanh), các tế
bào máu đỏ (màu đỏ), và tiểu cầu(màu
hồng). Các tế bào bạch cầu hoạt động
trong cáchệ thống miễn dịch, các tế bào
hồng cầu mang ôxy thông qua cơ thể,
và tiểu cầu giúp chữa lành vết thương.
Giải pháp:
Công ty có thể làm theo các bước sau để quyết định liệu họ có nên được
quan tâm về tác động của sản phẩm làm sạch
•
Bước 1 Với thống kê này bạn không thể quyết định chắc chắn liệu các sản phẩm
làm sạch có tác dụng trênsố lượng tế bào máu trắng. Bạn chỉ có thể khẳng định
nó có thể có tác dụng hay không.Trên thực tế, bạn muốn quyết định có hay
không một thống kê mẫu kết quả là "không thể xảy ra."Với việc làmđó, bạn đặt
giả thuyết rằng sản phẩm làm sạch không có tác dụng, điều này được gọi là giả
thuyết. Sau đó, bạn quyết định những gì sẽ làm cho giả thuyết "không thể xảy
ra." giả sử bạnquyết định rằng nếu con số trung bình của các tế bào máu trắng
bạn nhận được từ dữ liệu mẫu là ít hơn 5%có thể xảy ra, sau đó bạn sẽ bác bỏ
•
giả thuyết.
Bước 2 Bạn lấy một mẫu ngẫu nhiên gồm 36 công nhân và tìm thấy họ có một
số lượng bạch cầu trung bình của7075 tế bào mỗi milimét khối (tế bào/mm3).
Bạn tìm kiếm thông tin y tế và thấy rằng một tổng thể người lớn khỏe mạnh có
số lượng bạch cầu trung bình của 7500 tế bào/mm3 vàđộ lệch chuẩn của 1250 tế
•
bào/mm3
Bước 3: bởi định lý giới hạn trung tâm, giá tri trung bình của nhiều mẫu sẽ là
7500 tế bào/mm3 với độ lệch chuẩn , hoặc 208 tế bào/mm3. Xác suất mà một
mẫu sẽ có giá trị trung bình 7075 hoặc ít hơn là N (0, 7075, 7500, 208), hoặc
0,0205. Điều này có nghĩa rằng có 2%cơ hội cho điều đó, nếu giá trị trung bình
tổng thể là 7500 tế bào, một mẫu sẽ có giá trị trung bình 7075 tế bào hoặc ít
hơn.
•
Bước 4: Bởi vì xác suất của giả thuyết của bạn dưới 5%, nên giả thuyết rằng
các sản phẩm làm sạch không có tác dụng, là không thể xảy ra và bạn bác bỏ nó.
Công ty nên dừng lạisử dụng sản phẩm làm sạch và cân nhắc việc thử nghiệm .
Nếu bạn đã quyết định trước rằng bạn sẽ bác bỏ giả thuyết thống kê ít hơn
1% có thể xảy ra, bạn không thể bác bỏ giả thiết đấy.Không thể bác bỏ giả
thuyết không có nghĩa là giả thuyết là đúng,chỉ rằng nó không phải những gì bạn
quyết định gọi sai. Kiểm định giả thiết bằng cách bác bỏ sẽ không thực hiện
được nếu thống kê mẫu có một xác suất ít hơn 5% hoặc 10%.Khi giả thuyết bị
bác bỏ, thống kê gọi đó là một "biến cố chắc chắn."
Như bạn đã đọc trên trang 748, 90% dữ
liệu trong một đường cong chuẩn nằm
trong 1.645σ của giá trị trung bình. Vì
vậy, 5% là ít hơn 1.645σ dưới giá trị
trung bình và 5% là nhiều hơn1.645
trên giá trị trung bình.
III. Bài tập
3.1 Thực hành kỹ năng của bạn
1. Từ giá trị trung bình tổng thể là 200 và độ lệch chuẩn 12, tìm xác suất
a. Một giá trị của 195 hoặc ít hơn.
b. Kích thước mẫu n = 4 giá trị trung bình 195 hoặc ít hơn.
c. Kích thước mẫu n = 9 giá tri trung bình 195
hoặc ít hơn.
d. Kích thước mẫu n = 36 gia trị trung bình 195 hoặc ít hơn.
2. Đối với mỗi tổng thể và mẫu, xác định giá trị trung bình của mẫu có thể chỉ
ra biến cố chấc chắn độ lệch chuẩn của tổng thể
a.σ = 80,µ = 10, n = 25
b.σ = 130,µ = 6, n = 36
c.σ = 18,µ = 2, n = 64
d. σ= 0,52,µ = 0.1, n = 10
3.2 Lý do và Áp dụng
3. Penny Adler đã làm việc nhiều năm như chuyên gia tính toán trong
cùng một văn phòng. Theo tính toán của mình, cô mất khoảng 23 phút đẻ đén
phòng làm việc mỗi ngày, với độ lệch chuẩn là 4,1 phút. Khi cô rời khỏi nhà, cô
nhận thấy rằng cô ấy đến tại văn phòng phải mất 25 phút. Xác suất mà cô sẽ bị
trễ là bao nhiêu ?
4. Thanh kẹo " You Gotta Be Nutz" có trọng
lượng trung bình 75,3 g và độ lệch chuẩn 4,7
g.Nhà sản xuất muốn tránh khiếu nại rằng bất kỳ
thanh kẹo nào quá nhẹ, vì vậy họ quyết định quảng
cáo t "trọng lượng đảm bảo tối thiểu’’
a. Trọng lượng nào nhà sản xuất nên quảng cáo nếu họ muốn 80% của các
thanh kẹo đáp ứng hoặc vượt quá trọng lượng tối thiểu? (Phác thảođường cong
bình thường với bóng, và viết một câu hoàn chỉnhsử dụng câu trả lời bằng số
của bạn.)
b. Trọng lượng nào nhà sản xuất nên quảng cáo nếu họ muốn 90% của các thanh
kẹo để đáp ứnghoặc vượt quá trọng lượng tối thiểu? (Phác thảo một đường cong
bình thường bóng và viết hoàn chỉnhsử dụng câu trả lời bằng số của bạn.)
c. Trọng lượng nào nhà sản xuất nên quảng cáo nếu họ muốn 95% của các
thanh kẹo để đáp ứnghoặcvượt quá trọng lượng tối thiểu? (Phác thảo một đường
cong bình thường bóng và viết hoàn chỉnhsử dụng câu trả lời bằng số của bạn.)
5. ÁP DỤNG:
Một công ty phát triển bất động sản muốn
hủy một nhà máy bỏ hoang và xây
dựngchung cư cao tầng tại vị trí của nó.
Trước khi tiến hành kế hoạch này, các
công ty kiểm tra địa điểm các chất độc gây
ô nhiễm. Năm mươi mẫu ngẫu nhiên thu
thập từ các địa điểm khác nhau xung quanh
các địa điểm và phân tích cadmium (Cd).
Nếu nồng độ trung bình cadmium trong đất
là 0,8 mg / kg hoặc cao hơn,địa điểm này
làtuyên bố bị ô nhiễm và các nhà phát triển
sẽ loại bỏ nó kế hoạch vì dự án sẽ là quá
tốn kém. kết quảcủa việc lấy mẫu được thể
hiện trong bảng bên phải.
a. Bao nhiêu mẫu bị ô nhiễm?
b. Tìm giá trị trung bình và độ lệch chuẩn của số liệu này
c. Nếu nồng độ thực sự của cadmium trong đất0,8 mg / kg, xác suất của những
kết quả này là gì?
d. Các nhà phát triển sẽ xây dựng các chung cư cao tầng k?
3.3 Xem xét
6. Xét hàm số f (x) = 16.8x + 405.
a. Tìm f (-19,5). b. Tìm x sao cho f (x) = 501,096.
c. Viết các phương trình của hai đường thẳng song song có 2,4 đơn vị trên và
dướiđường y = f (x).
7. Tìm đường trung tuyến-trung bình cho những dữ liệu này, và xác định căn
bậc hai của giá trị trung bình.
Thăm dò
khoảng tin cậy của dữ liệu hai chiều
Giả sử bạn có một cuộc thăm dò của 50 cử tri được chọn ngẫu nhiên trong
tiểu bị thất bại k?ỳ có thể bang của bạn và thấy rằng 53%sẽ bỏ phiếu "có" trên
một đề xuất mà có thể tăng thuế để hỗ trợ các trường họcĐề xuất na có thể là đề
xuất sẽ thất bại? Làm thế nào có thể nó rằng các đề xuất sẽ vượt qua? (Nếumột
đề xuất là phải vượt qua, ít nhất 50% dân số phải bỏ phiếu "có.") Nếu thăm dò ý
kiến của bạncho thấy 78% mẫu của bạn hỗ trợ các đề xuất? Sau đó như thế nào
nhất định bạn có thể màcác đề xuất sẽ vượt qua?
Bạn đã học về khoảng tin cậy trong Bài học 13,4, và khám phá biến dữ
liệu, chẳng hạn như độ tuổi và chiều cao. Trong tình hình bầu cử này, tuy nhiên,
các dữ liệu này là hai chiều. Đó là,có hai giá trị có thể cho mỗi giá trị dữ liệu,
"có" hoặc "không". Trong thăm dò này, bạn sẽsử dụng Fathom để mô phỏng
các kết quả của các cuộc thăm dò 100 ngẫu nhiên của 50 cử tri và làm cho giả
thuyếtvề những gì các kết quả của một cuộc thăm dò mẫu cho phép bạn để kết
luận về ý kiến của dân.
Hoạt động
Cử tri bỏ phiếu
•
Bước 1 Bắt đầu Fathom. Từ menu File, chọn Open, và mở tập tin
Polling.ftm. Bạn sẽ thấy một cửa sổ tương tự như hình dưới đây.
Có hai bộ thu thập: thăm dò ý kiến, trong đó có 50 ý kiến (hoặc "có" hoặc
"không"),và các biện pháp từ thăm dò ý kiến, trong đó có kết quả (tỷ lệ phần
trăm người đã nói"có") từ mỗi 100 các cuộc thăm dò của một mẫu ngẫu nhiên
của 50 cử tri. Bảng trường hợp bên trái cho thấy kết quả của một cuộc thăm dò,
và biểu đồ thể hiện sự phân bố các kết từ 100 cuộc thăm dò. Biểu đồ cũng cho
thấy 2.5th phần trăm và phần trăm 97.5th trong số 100 kết quả, vì vậy 95% các
kết quả nằm giữa đường màu xanh và màu đỏ tương đương với khoảng tin cậy
95%.
Thanh trượt p , kiểm soát tỷ lệ phần trăm thực sự của cử tri trong dân số
những người ủng hộ đề xuất sử dụng các mô phỏng,thay đổi giá trị của p bằng
cách sử dụng thanh trượt hoặc gõ vào một giá trị. Sau đó nhấn “Collect more
measures” để mô phỏng tiến hành 100 cuộc thăm dò của 50 cử tri được chọn
ngẫu nhiên . Bạn sẽ thấy bảng trường hợp , biểu đồ,và các giá trị phần trăm thay
đổi.
•
Bước 2: Nhìn vào cửa sổ Fathom trên trang 760 , trong đó cho thấy kết quả cho
một dân số với p=5 .Phải chăng kết quả bỏ phiếu là 53% có thể xảy ra nếu chính
xác là 50% dân số ủng hộ đề xuất ?kết quả là 78% có thể xảy ra không? (cùng
với việc thăm dò này ,hãy xem xét một kết quả có thể xảy ra nếu nó nằm trong
•
khoảng tin cậy 95%)
Bước 3: Làm việc với một cộng sự để ước tính 2,5 lần và 97,5 lần giá trị phần
trăm cho p =0;0,1;0,2…và như vậy cho đến 1. Với mỗi giá trị của p, đặt thanh
trượt ,thu thập một tập các phương pháp mới và nhập các giá trị phần trăm vào
bảng như hình dưới đây. Sau đó nhập “có” hoặc “không”vào cột thứ 3 hoặc cột
thứ 4,có tùy thuộc vào kết quả là 53% và 78% rơi vào khoảng tin cậy 95%
p
2.5 lần phần trăm
97.5 lần phần
Kết quả 53% có
Kết quả 78%
trăm
thể xảy ra không
có thể xảy ra
?
không?
0
1
2
•
Bước 4: Sao chép đồ thị ở dưới cho kết quả là 53% và 78%. Một điểm cho mỗi
hàng trong bảng trên. Những điểm (0,không) là đã được điền vào
•
Bước 5: Phân tích đồ thị của bạn ở bước 4 và tính toán càng chính xác càng
tốt ,nơi mà những điểm thay đổi từ “không” thành “có” và ngược lại . Nếu cần
thiết khám phá các giá trị của p giữa những người trong bảng của bạn chẳng hạn
như 0.35 . Vẽ các điểm bổ sung vào đồ thị của bạn . Với giá trị nào của p là kết
•
quả bỏ phiếu của 53% và 78% là có thể xảy ra ?
Bước 6: Bây giờ bạn đã nghiên cứu những kết quả bỏ phiếu nào là có thể xảy ra,
rằng bạn biết tỷ lệ thực tế của người dân bỏ phiếu “ có” . Sử dụng các quan sát
của bạn để lam cho giả thuyết ngược lại. Có nghĩa là, một đề xuất có khả năng
vượt qua một thăm giò cho thấy 53% người ủng hộ? 78% người ủng hộ? Giải
thích lý do của bạn.
BÀI 13.5:
DỮ LIỆU HAI CHIỀU VÀ SỰ TƯƠNG QUAN
Một biện pháp thống kê thường được sử dụng kết hợp tuyến tính được gọi
là “ hệ số tương quan”. Một sụ kết hợp tuyến tính giữa hai biến được gọi là “
tương quan” . Trong một cuộc điều tra bạn sẽ sử dụng một máy tính để khám
phá tính chất của hệ số tương quan cho một mẫu hai chiều.
I. Sự điều tra
1. Tìm kiếm mối liên quan
•
Bước 1. Làm việc với nhóm của bạn để tạo ra một cuộc khảo sát với 5 câu hỏi
mà tất cả các câu hỏi được trả lời bằng số hoặc sử dụng mẫu điều tra sau đây.
1.
Đêm qua bạn làm bài tập về nhà mất bao nhiêu phút?
2.
Bạn mất bao nhiêu phút để nói chuyện, gọi điện thoại, email hoặc viết thư cho
bạn bè?
3.
Bạn mất bao nhiêu phút để xem tivi hoặc nghe nhạc?
4.
Vào thời gian nào thì bạn đi ngủ?
5.
Bạn có bao nhiêu lớp học?
•
Bước 2. Dự đoán với của bạn về những thế mạnh của mối tương quan giữa các
cặp biến. Ví dụ như , bạn có thể quyết định số phút của bài tập về nhà là tương
quan vững chắc với số phút các lớp học. Xem xét từng cặp trong 10 cặp biến và
xác định những kết hợp mà bạn tin rằng sẽ xảy ra.
Sự tương quan dương ( như là một sụ phát triển hay có xu hướng tăng )
i)
Sự tương quan âm ( như là sự phát triển hay là có xu hướng giảm ).
ii)
Sự tương quan yếu.
iii)
•
Bước 3. Thu thập dữ liệu từ mỗi học sinh trong lớp của bạn. Sau đó nhập dữ liệu
vào 5 danh sách máy tính. Vẽ những điểm cho mỗi danh sách , và tìm hệ số
tương quan.[► Nhìn thấy Calculator Note 13F để học cách tìm hệ số tương
quan .◄] Bạn có thể phân chia công việc cho những thành viên trong nhóm của
bạn. Mô tả mối quan hệ giữa sự xuất hiện của đồ thị và giá trị của hệ số tương
quan.
•
Bước 4. Viết một đoạn văn mô tả việc khám phá các mối tương quan của bạn.
Bao gồm bất kì những cặp không tương quan mà bạn tìm thấy một cách ngẫu
nhiên. Bạn đx thu thập một mẫu nhỏ và không phải là ngẫu nhiên. Bạn có nghĩ
rằng các mối quan hệ vẫn sẽ xảy ra , Nếu bạn thu thập câu trả lời từ một mẫu
ngẫu nhiên của toàn bộ học sinh trường bạn?
HỆ SỐ TƯƠNG QUAN
Hệ số tương quan r có thể được tính với công thức:
r=
=
Nếu giá trị của r dần đến giá trị
thì cho thấy mối tương quan mạnh
mẽ,và nếu giá trị của r dần đến 0 thì cho thấy không tương quan
Chú ý rằng định nghĩa của hệ số tương quan bao gồm không đề cập đến
bất kỳ đường cụ thể nào,mặc dù nó mô tả cách tìm hiểu về một đường phù hợp
với mỗi tập dữ liệu hai chiều. Ngược lại , góc không vuông bạn đã được học
trong Chương 3 mô tả cách tìm đường thẳng cụ thể phù hợp với một bộ dữ liệu
Thông thường dữ liệu hai chiều được thu thập từ bài học hoặc thí nghiệm
trong đó một biến đại diện cho một số điều kiện và đại diện cho các phép đo dựa
trên điều kiện đó, như trong ví dụ tiếp theo. Trong thống kê các biến x và y
thường được gọi là các biến giải và phản ứng thay vì các biến độc lập và các
biến phụ thuộc
2. Ví dụ : Kiane thuộc nhiều ủy ban và chú ý là những nhóm khác nhau có số
lượng khác nhau của số lần đưa ra quyết định. Cô tự hỏi rằng nếu thời gian cần
thiết để thực hiện một quyết định là liên quan tuyến tính đến kích thước của ủy
ban. Vì vậy cô đã thu thập một số dữ liệu. Tìm hệ số tương quan của những dữ
liệu này và giải thích kết quả của bạn
Kích
thước
(người
4
6
7
9
9
11
15
15
18
20
21
24
25