Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (457.84 KB, 62 trang )
Do vậy, phân phối chuẩn được dùng khá phổ biến trong cả suy luận thống kê
và trong mô hình hóa thống kê. Ví dụ, chúng ta đưa ra giả thiết nhiễu trong hồi
quy và các mô hình chuỗi thời gian là kết quả của một số lớn các hiệu ứng nhỏ với
phương sai hữu hạn, dẫn tới phân phối của chúng là chuẩn. Từ đó các ước lượng
thực nghiệm thường được coi là có phân phối gần giống phân phối chuẩn. Tính chất
lý thuyết của phân phối chuẩn như một luật giới hạn phù hợp với bằng chứng thực
nghiệm. Hai khía cạnh trên đây hỗ trợ và khuyến khích sử dụng rộng rãi phân phối
chuẩn trong các suy luận thống kê.
1.1.1
Định lý giới hạn trung tâm cổ điển
Phần dưới đây trình bày và chứng minh định lý giới hạn trung tâm cổ điển, đây
là một kết quả nổi tiếng nên nhắc lại để so sánh với một vài kết quả sẽ được trình
bày trong phần tiếp theo.
Định lý 1.1 (Lindeberg-Lévy). Cho một dãy các biến ngẫu nhiên độc lập cùng
phân phối {Xi } , i = 1, ..., n, với trung bình µ và phương sai σ 2 < ∞. Khi đó đại
lượng
1 n Xi − µ
Sn = √ ∑
n i=1 σ
(1.1)
hội tụ theo phân phối tới luật chuẩn tắc N (0, 1).
Chứng minh. Trước hết ký hiệu Zi là biến chuẩn hóa của Xi , có trung bình 0 và
phương sai 1, Zi =
Xi −µ
σ .
Các Zi được xác định, và chúng có cùng hàm đặc trưng
φZ (t). Khi đó hàm đặc trưng của Sn được cho bởi
n
φSn (t) = ∏ e
itZi n−1/2
i=1
= φZ
t
√
n
n
Khai triển chuỗi McLaurin hàm đặc trưng của Zi dẫn tới
φZ
t
√
n
2
t
2t
≈ 1 + i √ E (Zi ) + i
E Zi2 .
n
2n
8
Bởi vậy hàm đặc trưng của tổng Sn là
n
t2
φSn (t) ≈ 1 −
2n
a
Vì lim 1 + n
n→∞
n
.
= ea nên
t2
lim φSn (t) = e− 2
n→∞
Đây là hàm đặc trưng của phân phối chuẩn N (0, 1).
Định lý Lindeberg-Lévy là một trong rất nhiều các phiên bản của định lý giới
hạn trung tâm, được trình bày trong luận văn này như một bước đệm để xây dựng
định lý giới hạn trung tâm tổng quát, sẽ được nghiên cứu trong phần tiếp theo.
1.1.2
Định lý giới hạn trung tâm suy rộng
Trong định lý giới hạn trung tâm cổ điển trên đây, các biến ngẫu nhiên Xi được
giả thiết là có phương sai hữu hạn. Khi phương sai của các thành phần đó bằng vô
cùng, thì chúng ta phải giải quyết như thế nào? Câu hỏi đó sẽ được trả lời trong
phần tiếp theo. Định lý giới hạn trung tâm suy rộng, nới lỏng giả thiết về tính hữu
hạn của phương sai, xác định một họ phân phối mới, mà phân phối chuẩn là một
trường hợp đặc biệt, chắc chắn phù hợp hơn với điều kiện thực tế.
Trước tiên ta đưa ra khái niệm về tính ổn định của phân phối xác suất như sau:
Định nghĩa 1.1 (Tính ổn đinh, Gnedenko và Komogrov 1954). Hàm phân phối
F(x) được gọi là ổn định nếu với bất kỳ các số dương c1 , c2 và các số thực d1 , d2
đều tồn tại các số c > 0 và d sao cho
F (c1 x + d1 ) F (c2 x + d2 ) = F (cx + d)
(1.2)
Cơ sở xuất phát để xây dựng định lý giới hạn trung tâm suy rộng được dựa trên
khẳng định: Phân phối ổn định là luật giới hạn cho tổng chuẩn hóa
Sn =
X1 +X2 + · · · +Xn
−Dn .
Cn
9
Kết quả này do Lévy (1924) đưa ra và được phát biểu chính thức trong định lý
sau đây:
Định lý 1.2 (Lévy). Hàm phân phối F(x) là ổn định khi và chỉ khi nó là phân phối
giới hạn của
Sn =
X1 +X2 + · · · +Xn
−Dn .
Cn
(1.3)
với một dãy {Xi } các biến ngẫu nhiên độc lập cùng phân phối nào đó.
Chứng minh. Ta sẽ chứng minh điều kiện cần của Định lý, còn điều kiện đủ có thể
tham khảo trong [Limit Distributions for Sums of Independent Random Variables
Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley, Reading (trang163)].
Giả sử Sn hội tụ đến một phân phối giới hạn xác định F (x). Ta sẽ chỉ ra F (x) là ổn
định. Theo bổ đề được trình bày trong [Limit Distributions for Sums of Independent Random Variables Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley,
Reading (trang146)], nếu X có phân phối không suy biến, thì đại lượng vô hướng
Cn phải thỏa mãn
lim Cn = ∞
n→∞
Cn+1
=1
n→∞ Cn
lim
Lấy hai số dương c1 , c2 sao cho c1 < c2 . Với mọi ε , l ≥ lε , chọn một số m sao cho
0≤
Cho hai số thực d1 , d2 , đặt Cn =
C1
c1
Cm c2
− <ε
C1 c1
và Dn =
C1 D1 +Cm Dm +d1C1 +d2Cm
.
Cn
Khi đó, tổng
(1.3) được viết lại thành
C1 X1 + ... + Xn
Cm Xl+1 + ... + Xl+m
− D1 − δ1 +
− Dm − δ2 .
Cn
C1
Cn
Cm
Vì Sn hội tụ đến F (x), nên hai số hạng trên hội tụ (Định lý 2, trang 42, Limit Distributions for Sums of Independent Random Variables Gnedenko, B. & Kolmogorov,
A. (1954), Addison-Wesley, Reading ), tương ứng đến F c−1 x + d1 và
1
10
F c−1 x + d2 . Nói một cách khác, vì phân phối giới hạn của tổng chuẩn hóa (1.3)
2
là F (x), do đó
F (x) = F c−1 x + d1 .F c−1 x + d2
1
2
Bởi vậy (1.2) được thỏa mãn và F (x) là ổn định.
Theo định lý trên, nếu phân phối giới hạn của (1.3) tồn tại, thì nó phải là ổn
định. Tuy nhiên, định lý đó không cung cấp thông tin về điều kiện cho sự tồn tại
như vậy, trừ trường hợp các Xi có phương sai hữu hạn, phân phối chuẩn tắc là phân
phối giới hạn duy nhất.
Kết quả trình bày tiếp sau đây sẽ hoàn thiện phiên bản suy rộng của Định lý
giới hạn trung tâm. Trước tiên ta giới thiệu khái niệm về miền hút.
Định nghĩa 1.2 (Miền hút). Nếu tổng chuẩn hóa (1.3), với các số thực Cn và Dn
được lựa chọn phù hợp, hội tụ dến phân phối giới hạn S, thì Xi (hoặc phân phối của
nó) được gọi là bị hút bởi S; miền hút của S là tập hợp tất cả các phân phối được
hút bởi S.
Từ định nghĩa trên và từ Định lý giới hạn trung tâm cổ điển, rõ ràng rằng mọi
phân phối với phương sai hữu hạn đều được hút bởi luật chuẩn. Định lý sau đây
cho thấy khi thay thế điều kiện phương sai hữu hạn bằng một điều kiện nhẹ hơn về
dáng điệu của phân phối ỏ phần đuôi, tổng chuẩn hóa (1.3) sẽ có một phân phối
giới hạn, và theo kết quả của định lý đã nêu phía trên, phân phối giới hạn đó phải
là ổn định.
Định nghĩa 1.3 (Hàm biến đổi chậm). Hàm không âm l (x) được gọi là một hàm
biến đổi chậm ở vô cực, nếu ∀x > 0
l (tx)
=1
t→∞ l (t)
lim
.
Định lý sau chỉ ra mỗi liên hệ giữa miền hút và tính biến đổi chậm của hàm
phân phối:
11
Định lý 1.3. Ký hiệu u (x) =
x
t 2 dF (t). Lúc đó hàm phân phối F (x) thuộc miền
−x
hút của một phân phối ổn định nếu và chỉ nếu
1. lim u(x) = x2−α l (x) ,
x→∞
1−F(x)
1−F(x)+F(−x)
x→∞
2. lim
F(−x)
1−F(x)+F(−x)
x→∞
= p và lim
= q,
với 0 < α ≤ 2 (được gọi là số mũ đặc trưng của phân phối ổn định), l là hàm biến
đổi chậm và p, q ∈ R.
Có thể chứng minh giả thiết 1 tương đương với
x2 [1 − F (x) + F (−x)] 2 − α
=
lim
< ∞.
x→∞
u (x)
α
(1.4)
Điều này về cơ bản có nghĩa định lý trên đúng đối với phân phối có đuôi nặng biến
đổi chính qui. Giả thiết 2 và 3 là tương tự như giả thiết 1, để cập riêng cho dáng
điệu của đuôi trái và đuôi phải. Khi X đối xứng, ta có ngay p = q = 1 .
2
Chứng minh. Ta chỉ chứng minh điều kiện cần của Định lý, điều kiện đủ có thể
tham khảo trong [Feller,W. (1966), An Introduction to Probability Theory and its
Applications, John Wiley & Sons, New York, trang 304]. Ta sử dụng các định lý
trong [Feller,W. (1966), An Introduction to Probability Theory and its Applications, John Wiley & Sons, New York, trang 301], liên quan đến sự hội tụ của tổng
chuẩn hóa (1.3). Sử dụng ký hiệu đại lượng vô cùng bé, có thể viết lại các điều kiện
của Định lý thành
a)
v2 (x) =
2
+x
tdF (t)
= o [u (x)] ;
−x
b) lim nt 2 dFn (t) = Ω {dt}, với Ω là một độ đo nói chung,
n→∞
c) n [1 − F (η ) + F (−η )] < ε , cho mọi n ∈ N với η đủ lớn.
Chúng ta bắt đầu bằng điều kiện a.
Nếu đồng thời lim v (x) hữu hạn và lim u (x) bằng ∞, khi đó điều kiện (a) được
thỏa mãn.
x→∞
x→∞
12
Nếu cả hai giới hạn trên đều hữu hạn, ta chỉ cần tìm một hằng số quy tâm thích hợp
để đưa vế trái của biểu thức về 0, do đó lim v (x) = 0.
x→∞
Nếu cả hai giới hạn trên đều không tồn tại, thì điều kiện 1 được đảm bảo nếu
u (x) tiến ra vô cùng nhanh hơn v2 (x). Theo bất đẳng thức Schwarz ta có:
[v (x) − v (a)]2 ≤ u (x) [1 − F (a) + F (−a)]
với x > a. Do đó điều kiện là được thỏa mãn với
lim u (x) = ∞.
x→∞
Điều kiện c là dễ dàng suy ra từ (1.4). Như vậy chỉ còn kiểm tra điều kiện b, theo
giả thiết 1 có thể chọn Cn sao cho
n
2 u (Cn )
Cn
n→∞
lim
= 1,
lim n2 u (Cn x)
n→∞ Cn
= x2−α .
Nếu α = 2, điều kiện b được thỏa mãn nếu lấy độ đo Ω tập trung tại gốc tọa độ.
Nếu α < 2, điều kiện b và c tương đương với
lim n2 u+ (Cn x)
n→∞ Cn
n
lim C2 u− (Cn x)
n→∞ n
= px2−α
= qx2−α
ký hiệu
+x
u+ (x) =
0
t 2 dF (t); u− (x) =
t 2 dF (t).
−x
0
Và lập luận tương tự như phần trên, ta có kết quả riêng cho u+ (x) và u− (x).
Như vậy chúng đã chứng minh tổng chuẩn hóa hội tụ tới một giới hạn. Theo định
lý (1.2), phân phối giới hạn phải là ổn định. Chứng minh đã được hoàn thành.
Ghi chú 1.1. Khi giới hạn (1.4) bằng 0, ta có α = 2, tương ứng với phân phối
Gauss, và điều kiện
x2 [1 − F (x) + F (−x)]
= 0.
x→∞
u (x)
lim
13
Có thể được dùng như một sự nới lỏng giả định phương sai hữu hạn trong định lý
giới hạn trung tâm cổ điển.
Ví dụ 1.1. Ta đưa ra ví dụ minh họa, về một phân phối không thỏa mãn các định
lý giới hạn trung tâm cổ điển nhưng thỏa mãn các điều kiện miền hút của luật ổn
định. Đó là phân phối Cauchy được định nghĩa là
f (x) =
1
π (1 + x2 )
F (x) =
1 1
− arctan (x) ,
2 π
với x ∈ R. Phân phối này không có kỳ vọng (và do đó nó không có mômen cấp cao
hơn). Lưu ý rằng phân phối này là đối xứng, do đó F (−x) = 1 − F (x) và áp dụng
(1.4) ta thu được
lim
2x2 [1−F(x)]
x→∞ 1 +x t 2 dt
π
2
= lim
x→∞
−x 1+t
2 2 π
π x 2 −arctan(x)
2
x→∞ π [x−arctan(x)]
= lim
= lim
x→∞
[
1
2x2 [ 1 − π arctan(x)]
2
+x
1
π [t−arctan(t)]−x
]
x[ π −arctan(x)]
2
1−
arctan(x)
x
=1
bởi vì cả tử số và mẫu số đều tiến tới 1. Do đó tổng của các biến ngẫu nhiên
Cauchy được thu hút bởi một phân phối ổn định với đặc số mũ là 1 (là một phân
phối Cauchy).
Hệ quả sau của đinh lý (1.3), Gnedenko và Kolmogorov (1954) đã đưa ra kết
quả sau, mô tả các đăc tính cần thiết của các hằng số chuẩn hóa Cn và Dn trong
(1.3).
Hệ quả 1.1. Các đại lượng vô hướng Cn và Dn của (1.3) phải có dạng:
√
Cn = α n
√ +∞xdF (x) nếu 1 < α ≤ 2
αn
n
−∞
1
Dn =
ℑ ln φ n− α
nếu α = 1
0 nếu α < 1
14
(1.5)
1.2
Phân phối ổn định
Kết quả phần trước chỉ ra tầm quan trọng của phối ổn định: Mặc dù miền hút
của của luật chuẩn là khá rộng và bao gồm tất cả các phân phối với phương sai hữu
hạn, khi xử lý các hiện tượng với phương sai vô hạn cũng có thể tồn tại một phân
phối giới hạn, miễn là các giả thiết của Định lý (1.3) được thỏa mãn, và giới hạn
này thuộc loại phân phối ổn định. Phần tiếp theo tiến hành mô tả các thuộc tính
chính và đặc điểm chính của phân phối ổn định.
1.2.1
Định nghĩa
Mặc dù những tính ổn định đã được xác định trong (1.3), ta sẽ cung cấp thêm
một vài định nghĩa tương đương có tính minh họa nhiều hơn, theo phương pháp
tiếp cận của Samorodnitsky và Taqqu (1994).
Định nghĩa 1.4 (Tính chia được vô hạn). Một biến ngẫu nhiên X được gọi là chia
được vô hạn nếu và chỉ nếu mọi n ∈ N, nó có thể được biểu diễn dưới dạng tổng
của n biến ngẫu nhiên độc lập có cùng phân phối, nghĩa là
(1.6)
X = Xn,1 + Xn,2 + ... + Xn,n .
Từ định nghĩa trên, điều kiện đủ của chia được vô hạn là hàm đặc trưng của X
được viết bằng lũy thừa bậc n của một số hàm đặc trưng khác phụ thuộc vào n. Ví
dụ: phân phối chuẩn, Poisson, Cauchy tất cả đều có tính chia được vô hạn.
Ví dụ 1.2. Tất cả các phân phối chuẩn là chia được vô hạn.
Nếu xét một biến ngẫu nhiên X ∼ N µ , σ 2 , có thể viết dưới dạng tổng của hai
biến ngẫu nhiên X1 và X2 với phân phối N
µ/2, σ 2/2
. Tổng quát cho bất kỳ n, X có
thể được viết dưới dạng tổng của n biến ngẫu nhiên Xi với phân phối N
µ/n, σ 2/n
.
Có thể chứng minh được rằng (xem Gnedenko, B. & Kolmogorov, A. (1954), Limit
Distributions for Sums of Independent Random Variables, Addison-Wesley, Read15
ing.) hàm đặc trưng của luật chia được vô hạn phải có dạng
+∞
1 + u2
itu
itu
dG (u) ,
e −1−
φ (t) = exp iδ t +
1 + u2
u2
(1.7)
−∞
với δ là một hằng số thực và G (u) là một hàm không giảm có biến phân bị chặn.
Khi u = 0, hàm dưới dấu tích phân được định nghĩa là
−t 2/ .
2
Sau đây là một định
nghĩa tương đương với tính chia được vô hạn, đôi khi được gọi là công thức Lévy.
Đặt
u
M (u) =
−∞
+∞
N (u) =
u
1 + v2
dG (v)
v2
∀u < 0;
1 + v2
dG (v)
v2
∀u > 0;
δ 2 = G 0+ − G 0− .
Khi đó (1.7) được viết lại thành
δ2 2
t +
φ (t) = exp iδ t −
2
0
−∞
+∞
+
0
iut
dM (u) +
1 + u2
iut
iut
e −1−
dN (u)
1 + u2
eiut − 1 −
(1.8)
Tiếp đây là định nghĩa trực quan hơn của phân phối ổn định.
Định nghĩa 1.5 (Tính ổn định, Samorodnitsky và Taqqu 1994). Một biến ngẫu
nhiên X được gọi là có phân phối ổn định nếu và chỉ nếu cho các số dương bất kỳ
c1 , c2 , tồn tại một số dương c và một số thực d sao cho
cX + d = c1 X1 + c2 X2 ,
(1.9)
với X1 và X2 độc lập và có cùng phân phối với X. Nếu d = 0, X được gọi là ổn định
chặt.
16
Chú ý định nghĩa trên là tương đương với (1.3) đã sử dụng trong phần trước.
Một định nghĩa khác tương đương và trực quan hơn, được bắt nguồn từ (1.9).
Định nghĩa 1.6 (Ổn định). Một biến ngầu nhiên X được gọi là có phân phối ổn
định nếu và chỉ nếu cho một số tự nhiên bất kỳ n ≥ 2, tồn tại nột số dương Cn và
Dn sao cho
X=
X1 + X2 + ... + Xn
− Dn
Cn
(1.10)
Xi là bản sao độc lập của X. Nếu Dn = 0, X được gọi là ổn định chặt.
Như vậy, một biến ngẫu nhiên là ổn định nếu nó có thể được chia nhỏ ra thành
một loạt các biến ngầu nhiên giống hệt nhau thông qua các hằng số chuẩn hóa.
Từ định nghĩa (1.10), phân phối ổn định đại diện cho trường hợp đặc biệt chia
được vô hạn. Trái với (1.6), những số hạng Xi trong (1.10) có phân phối giống X
sau khi điều chỉnh tỉ lệ theo hằng số Cn .
Ví dụ 1.3. Phân phối chuẩn là ổn định. Thật vậy xét biến ngẫu nhiên X ∼ N µ , σ 2 .
Tổng của n bản sao độc lập của X có phân phối N nµ , nσ 2 . Vì vậy thiết lập
√
+...+Xn
− Dn .
Cn = n và Dn = (n − 1) µ , khi đó X = X1 +X2Cn
Định nghĩa 1.7 (Ổn định, miền hút). Một biến ngẫu nhiên X được gọi là ổn định
nếu nó có một miền hút khác rỗng, tức là nếu có một dãy các biến ngẫu nhiên Yi
độc lập, cùng phân phối sao cho
∑n Yi
d
i=1
− Dn − X
→
Cn
chọn Cn > 0 và Dn .
1.2.2
Hàm đặc trưng của phân phối ổn định
Cách đơn giản nhất để mô tả phân phối ổn định là đưa ra dạng hàm đặc trưng
của nó.
17
Định lý 1.4. Hàm đặc trưng của biến ngẫu nhiên ổn định S1 (α , β , γ , δ1 ) có dạng
φ1 (t) =
với 0 < α
πα
exp iδ1t − γ α |t|α 1 − iβ sgn (t) tan
2
exp iδ t − γ |t| 1 + iβ 2 sgn (t) ln |t|
1
π
β
2, −1
nếu α = 1
nếu α = 1
(1.11)
1, γ > 0 và δ ∈ R. Ngược lại nếu một biến ngẫu nhiên có
hàm đặc trưng dạng (1.11) thì biến ngẫu nhiên đó có phân phối ổn định.
Chứng minh. Chú ý định nghĩa ổn định (1.2) có thể hiểu dưới dạng hàm đặc trưng
ln φ
t
= ln φ
c
t
c1
t
c2
+ ln φ
+ iβ t,
với β = (d − d1 − d2 ). Vì phân phối ổn định là chia được vô hạn, nên ta sử dụng
biều thức (1.8) để viết lại biểu thức trên như sau
σ2 2
t
ln φ
= idct − 2 t +
c
2c
−∞
+∞
eiut − 1 −
+
0
t
σ2
ln φ
= idc1 t − 2 t 2 +
c
2c1
+
e
0
iut
−∞
+∞
+
0
iut
dM (cu) +
1 + u2
iut
dN (cu) ,
1 + u2
eiut − 1 −
iut
dM (c1 u) +
1 + u2
σ2 2
iut
dN (c1 u) + idc2 t − 2 t +
−1−
1 + u2
2c2
0
+
eiut − 1 −
0
−∞
+∞
0
eiut − 1 −
iut
dM (c2 u) +
1 + u2
eiut − 1 −
iut
dN (c2 u) .
1 + u2
18
(1.12)