1 Định lý giới hạn trung tâm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (457.84 KB, 62 trang )

Do vậy, phân phối chuẩn được dùng khá phổ biến trong cả suy luận thống kê

và trong mô hình hóa thống kê. Ví dụ, chúng ta đưa ra giả thiết nhiễu trong hồi

quy và các mô hình chuỗi thời gian là kết quả của một số lớn các hiệu ứng nhỏ với

phương sai hữu hạn, dẫn tới phân phối của chúng là chuẩn. Từ đó các ước lượng

thực nghiệm thường được coi là có phân phối gần giống phân phối chuẩn. Tính chất

lý thuyết của phân phối chuẩn như một luật giới hạn phù hợp với bằng chứng thực

nghiệm. Hai khía cạnh trên đây hỗ trợ và khuyến khích sử dụng rộng rãi phân phối

chuẩn trong các suy luận thống kê.

1.1.1

Định lý giới hạn trung tâm cổ điển

Phần dưới đây trình bày và chứng minh định lý giới hạn trung tâm cổ điển, đây

là một kết quả nổi tiếng nên nhắc lại để so sánh với một vài kết quả sẽ được trình

bày trong phần tiếp theo.

Định lý 1.1 (Lindeberg-Lévy). Cho một dãy các biến ngẫu nhiên độc lập cùng

phân phối {Xi } , i = 1, ..., n, với trung bình µ và phương sai σ 2 < ∞. Khi đó đại

lượng

1 n Xi − µ

Sn = √ ∑

n i=1 σ

(1.1)

hội tụ theo phân phối tới luật chuẩn tắc N (0, 1).

Chứng minh. Trước hết ký hiệu Zi là biến chuẩn hóa của Xi , có trung bình 0 và

phương sai 1, Zi =

Xi −µ

σ .

Các Zi được xác định, và chúng có cùng hàm đặc trưng

φZ (t). Khi đó hàm đặc trưng của Sn được cho bởi

n

φSn (t) = ∏ e

itZi n−1/2

i=1

= φZ

t

√

n

n

Khai triển chuỗi McLaurin hàm đặc trưng của Zi dẫn tới

φZ

t

√

n

2

t

2t

≈ 1 + i √ E (Zi ) + i

E Zi2 .

n

2n

8

Bởi vậy hàm đặc trưng của tổng Sn là

n

t2

φSn (t) ≈ 1 −

2n

a

Vì lim 1 + n

n→∞

n

.

= ea nên

t2

lim φSn (t) = e− 2

n→∞

Đây là hàm đặc trưng của phân phối chuẩn N (0, 1).

Định lý Lindeberg-Lévy là một trong rất nhiều các phiên bản của định lý giới

hạn trung tâm, được trình bày trong luận văn này như một bước đệm để xây dựng

định lý giới hạn trung tâm tổng quát, sẽ được nghiên cứu trong phần tiếp theo.

1.1.2

Định lý giới hạn trung tâm suy rộng

Trong định lý giới hạn trung tâm cổ điển trên đây, các biến ngẫu nhiên Xi được

giả thiết là có phương sai hữu hạn. Khi phương sai của các thành phần đó bằng vô

cùng, thì chúng ta phải giải quyết như thế nào? Câu hỏi đó sẽ được trả lời trong

phần tiếp theo. Định lý giới hạn trung tâm suy rộng, nới lỏng giả thiết về tính hữu

hạn của phương sai, xác định một họ phân phối mới, mà phân phối chuẩn là một

trường hợp đặc biệt, chắc chắn phù hợp hơn với điều kiện thực tế.

Trước tiên ta đưa ra khái niệm về tính ổn định của phân phối xác suất như sau:

Định nghĩa 1.1 (Tính ổn đinh, Gnedenko và Komogrov 1954). Hàm phân phối

F(x) được gọi là ổn định nếu với bất kỳ các số dương c1 , c2 và các số thực d1 , d2

đều tồn tại các số c > 0 và d sao cho

F (c1 x + d1 ) F (c2 x + d2 ) = F (cx + d)

(1.2)

Cơ sở xuất phát để xây dựng định lý giới hạn trung tâm suy rộng được dựa trên

khẳng định: Phân phối ổn định là luật giới hạn cho tổng chuẩn hóa

Sn =

X1 +X2 + · · · +Xn

−Dn .

Cn

9

Kết quả này do Lévy (1924) đưa ra và được phát biểu chính thức trong định lý

sau đây:

Định lý 1.2 (Lévy). Hàm phân phối F(x) là ổn định khi và chỉ khi nó là phân phối

giới hạn của

Sn =

X1 +X2 + · · · +Xn

−Dn .

Cn

(1.3)

với một dãy {Xi } các biến ngẫu nhiên độc lập cùng phân phối nào đó.

Chứng minh. Ta sẽ chứng minh điều kiện cần của Định lý, còn điều kiện đủ có thể

tham khảo trong [Limit Distributions for Sums of Independent Random Variables

Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley, Reading (trang163)].

Giả sử Sn hội tụ đến một phân phối giới hạn xác định F (x). Ta sẽ chỉ ra F (x) là ổn

định. Theo bổ đề được trình bày trong [Limit Distributions for Sums of Independent Random Variables Gnedenko, B. & Kolmogorov, A. (1954), Addison-Wesley,

Reading (trang146)], nếu X có phân phối không suy biến, thì đại lượng vô hướng

Cn phải thỏa mãn

lim Cn = ∞

n→∞

Cn+1

=1

n→∞ Cn

lim

Lấy hai số dương c1 , c2 sao cho c1 < c2 . Với mọi ε , l ≥ lε , chọn một số m sao cho

0≤

Cho hai số thực d1 , d2 , đặt Cn =

C1

c1

Cm c2

− <ε

C1 c1

và Dn =

C1 D1 +Cm Dm +d1C1 +d2Cm

.

Cn

Khi đó, tổng

(1.3) được viết lại thành

C1 X1 + ... + Xn

Cm Xl+1 + ... + Xl+m

− D1 − δ1 +

− Dm − δ2 .

Cn

C1

Cn

Cm

Vì Sn hội tụ đến F (x), nên hai số hạng trên hội tụ (Định lý 2, trang 42, Limit Distributions for Sums of Independent Random Variables Gnedenko, B. & Kolmogorov,

A. (1954), Addison-Wesley, Reading ), tương ứng đến F c−1 x + d1 và

1

10

F c−1 x + d2 . Nói một cách khác, vì phân phối giới hạn của tổng chuẩn hóa (1.3)

2

là F (x), do đó

F (x) = F c−1 x + d1 .F c−1 x + d2

1

2

Bởi vậy (1.2) được thỏa mãn và F (x) là ổn định.

Theo định lý trên, nếu phân phối giới hạn của (1.3) tồn tại, thì nó phải là ổn

định. Tuy nhiên, định lý đó không cung cấp thông tin về điều kiện cho sự tồn tại

như vậy, trừ trường hợp các Xi có phương sai hữu hạn, phân phối chuẩn tắc là phân

phối giới hạn duy nhất.

Kết quả trình bày tiếp sau đây sẽ hoàn thiện phiên bản suy rộng của Định lý

giới hạn trung tâm. Trước tiên ta giới thiệu khái niệm về miền hút.

Định nghĩa 1.2 (Miền hút). Nếu tổng chuẩn hóa (1.3), với các số thực Cn và Dn

được lựa chọn phù hợp, hội tụ dến phân phối giới hạn S, thì Xi (hoặc phân phối của

nó) được gọi là bị hút bởi S; miền hút của S là tập hợp tất cả các phân phối được

hút bởi S.

Từ định nghĩa trên và từ Định lý giới hạn trung tâm cổ điển, rõ ràng rằng mọi

phân phối với phương sai hữu hạn đều được hút bởi luật chuẩn. Định lý sau đây

cho thấy khi thay thế điều kiện phương sai hữu hạn bằng một điều kiện nhẹ hơn về

dáng điệu của phân phối ỏ phần đuôi, tổng chuẩn hóa (1.3) sẽ có một phân phối

giới hạn, và theo kết quả của định lý đã nêu phía trên, phân phối giới hạn đó phải

là ổn định.

Định nghĩa 1.3 (Hàm biến đổi chậm). Hàm không âm l (x) được gọi là một hàm

biến đổi chậm ở vô cực, nếu ∀x > 0

l (tx)

=1

t→∞ l (t)

lim

.

Định lý sau chỉ ra mỗi liên hệ giữa miền hút và tính biến đổi chậm của hàm

phân phối:

11

Định lý 1.3. Ký hiệu u (x) =

x

t 2 dF (t). Lúc đó hàm phân phối F (x) thuộc miền

−x

hút của một phân phối ổn định nếu và chỉ nếu

1. lim u(x) = x2−α l (x) ,

x→∞

1−F(x)

1−F(x)+F(−x)

x→∞

2. lim

F(−x)

1−F(x)+F(−x)

x→∞

= p và lim

= q,

với 0 < α ≤ 2 (được gọi là số mũ đặc trưng của phân phối ổn định), l là hàm biến

đổi chậm và p, q ∈ R.

Có thể chứng minh giả thiết 1 tương đương với

x2 [1 − F (x) + F (−x)] 2 − α

=

lim

< ∞.

x→∞

u (x)

α

(1.4)

Điều này về cơ bản có nghĩa định lý trên đúng đối với phân phối có đuôi nặng biến

đổi chính qui. Giả thiết 2 và 3 là tương tự như giả thiết 1, để cập riêng cho dáng

điệu của đuôi trái và đuôi phải. Khi X đối xứng, ta có ngay p = q = 1 .

2

Chứng minh. Ta chỉ chứng minh điều kiện cần của Định lý, điều kiện đủ có thể

tham khảo trong [Feller,W. (1966), An Introduction to Probability Theory and its

Applications, John Wiley & Sons, New York, trang 304]. Ta sử dụng các định lý

trong [Feller,W. (1966), An Introduction to Probability Theory and its Applications, John Wiley & Sons, New York, trang 301], liên quan đến sự hội tụ của tổng

chuẩn hóa (1.3). Sử dụng ký hiệu đại lượng vô cùng bé, có thể viết lại các điều kiện

của Định lý thành

a)

v2 (x) =

2

+x

tdF (t)

= o [u (x)] ;

−x

b) lim nt 2 dFn (t) = Ω {dt}, với Ω là một độ đo nói chung,

n→∞

c) n [1 − F (η ) + F (−η )] < ε , cho mọi n ∈ N với η đủ lớn.

Chúng ta bắt đầu bằng điều kiện a.

Nếu đồng thời lim v (x) hữu hạn và lim u (x) bằng ∞, khi đó điều kiện (a) được

thỏa mãn.

x→∞

x→∞

12

Nếu cả hai giới hạn trên đều hữu hạn, ta chỉ cần tìm một hằng số quy tâm thích hợp

để đưa vế trái của biểu thức về 0, do đó lim v (x) = 0.

x→∞

Nếu cả hai giới hạn trên đều không tồn tại, thì điều kiện 1 được đảm bảo nếu

u (x) tiến ra vô cùng nhanh hơn v2 (x). Theo bất đẳng thức Schwarz ta có:

[v (x) − v (a)]2 ≤ u (x) [1 − F (a) + F (−a)]

với x > a. Do đó điều kiện là được thỏa mãn với

lim u (x) = ∞.

x→∞

Điều kiện c là dễ dàng suy ra từ (1.4). Như vậy chỉ còn kiểm tra điều kiện b, theo

giả thiết 1 có thể chọn Cn sao cho

n

2 u (Cn )

Cn

n→∞

lim

= 1,

lim n2 u (Cn x)

n→∞ Cn

= x2−α .

Nếu α = 2, điều kiện b được thỏa mãn nếu lấy độ đo Ω tập trung tại gốc tọa độ.

Nếu α < 2, điều kiện b và c tương đương với

lim n2 u+ (Cn x)

n→∞ Cn

n

lim C2 u− (Cn x)

n→∞ n

= px2−α

= qx2−α

ký hiệu

+x

u+ (x) =

0

t 2 dF (t); u− (x) =

t 2 dF (t).

−x

0

Và lập luận tương tự như phần trên, ta có kết quả riêng cho u+ (x) và u− (x).

Như vậy chúng đã chứng minh tổng chuẩn hóa hội tụ tới một giới hạn. Theo định

lý (1.2), phân phối giới hạn phải là ổn định. Chứng minh đã được hoàn thành.

Ghi chú 1.1. Khi giới hạn (1.4) bằng 0, ta có α = 2, tương ứng với phân phối

Gauss, và điều kiện

x2 [1 − F (x) + F (−x)]

= 0.

x→∞

u (x)

lim

13

Có thể được dùng như một sự nới lỏng giả định phương sai hữu hạn trong định lý

giới hạn trung tâm cổ điển.

Ví dụ 1.1. Ta đưa ra ví dụ minh họa, về một phân phối không thỏa mãn các định

lý giới hạn trung tâm cổ điển nhưng thỏa mãn các điều kiện miền hút của luật ổn

định. Đó là phân phối Cauchy được định nghĩa là

f (x) =

1

π (1 + x2 )

F (x) =

1 1

− arctan (x) ,

2 π

với x ∈ R. Phân phối này không có kỳ vọng (và do đó nó không có mômen cấp cao

hơn). Lưu ý rằng phân phối này là đối xứng, do đó F (−x) = 1 − F (x) và áp dụng

(1.4) ta thu được

lim

2x2 [1−F(x)]

x→∞ 1 +x t 2 dt

π

2

= lim

x→∞

−x 1+t

2 2 π

π x 2 −arctan(x)

2

x→∞ π [x−arctan(x)]

= lim

= lim

x→∞

[

1

2x2 [ 1 − π arctan(x)]

2

+x

1

π [t−arctan(t)]−x

]

x[ π −arctan(x)]

2

1−

arctan(x)

x

=1

bởi vì cả tử số và mẫu số đều tiến tới 1. Do đó tổng của các biến ngẫu nhiên

Cauchy được thu hút bởi một phân phối ổn định với đặc số mũ là 1 (là một phân

phối Cauchy).

Hệ quả sau của đinh lý (1.3), Gnedenko và Kolmogorov (1954) đã đưa ra kết

quả sau, mô tả các đăc tính cần thiết của các hằng số chuẩn hóa Cn và Dn trong

(1.3).

Hệ quả 1.1. Các đại lượng vô hướng Cn và Dn của (1.3) phải có dạng:

√

Cn = α n



 √ +∞xdF (x) nếu 1 < α ≤ 2

 αn

 n





−∞

1

Dn =

ℑ ln φ n− α

nếu α = 1











0 nếu α < 1

14

(1.5)

1.2

Phân phối ổn định

Kết quả phần trước chỉ ra tầm quan trọng của phối ổn định: Mặc dù miền hút

của của luật chuẩn là khá rộng và bao gồm tất cả các phân phối với phương sai hữu

hạn, khi xử lý các hiện tượng với phương sai vô hạn cũng có thể tồn tại một phân

phối giới hạn, miễn là các giả thiết của Định lý (1.3) được thỏa mãn, và giới hạn

này thuộc loại phân phối ổn định. Phần tiếp theo tiến hành mô tả các thuộc tính

chính và đặc điểm chính của phân phối ổn định.

1.2.1

Định nghĩa

Mặc dù những tính ổn định đã được xác định trong (1.3), ta sẽ cung cấp thêm

một vài định nghĩa tương đương có tính minh họa nhiều hơn, theo phương pháp

tiếp cận của Samorodnitsky và Taqqu (1994).

Định nghĩa 1.4 (Tính chia được vô hạn). Một biến ngẫu nhiên X được gọi là chia

được vô hạn nếu và chỉ nếu mọi n ∈ N, nó có thể được biểu diễn dưới dạng tổng

của n biến ngẫu nhiên độc lập có cùng phân phối, nghĩa là

(1.6)

X = Xn,1 + Xn,2 + ... + Xn,n .

Từ định nghĩa trên, điều kiện đủ của chia được vô hạn là hàm đặc trưng của X

được viết bằng lũy thừa bậc n của một số hàm đặc trưng khác phụ thuộc vào n. Ví

dụ: phân phối chuẩn, Poisson, Cauchy tất cả đều có tính chia được vô hạn.

Ví dụ 1.2. Tất cả các phân phối chuẩn là chia được vô hạn.

Nếu xét một biến ngẫu nhiên X ∼ N µ , σ 2 , có thể viết dưới dạng tổng của hai

biến ngẫu nhiên X1 và X2 với phân phối N

µ/2, σ 2/2

. Tổng quát cho bất kỳ n, X có

thể được viết dưới dạng tổng của n biến ngẫu nhiên Xi với phân phối N

µ/n, σ 2/n

.

Có thể chứng minh được rằng (xem Gnedenko, B. & Kolmogorov, A. (1954), Limit

Distributions for Sums of Independent Random Variables, Addison-Wesley, Read15

ing.) hàm đặc trưng của luật chia được vô hạn phải có dạng





+∞





1 + u2

itu

itu

dG (u) ,

e −1−

φ (t) = exp iδ t +





1 + u2

u2

(1.7)

−∞

với δ là một hằng số thực và G (u) là một hàm không giảm có biến phân bị chặn.

Khi u = 0, hàm dưới dấu tích phân được định nghĩa là

−t 2/ .

2

Sau đây là một định

nghĩa tương đương với tính chia được vô hạn, đôi khi được gọi là công thức Lévy.

Đặt

u

M (u) =

−∞

+∞

N (u) =

u

1 + v2

dG (v)

v2

∀u < 0;

1 + v2

dG (v)

v2

∀u > 0;

δ 2 = G 0+ − G 0− .

Khi đó (1.7) được viết lại thành

δ2 2

t +

φ (t) = exp iδ t −

2

0

−∞

+∞

+

0

iut

dM (u) +

1 + u2





iut

iut

e −1−

dN (u)



1 + u2

eiut − 1 −

(1.8)

Tiếp đây là định nghĩa trực quan hơn của phân phối ổn định.

Định nghĩa 1.5 (Tính ổn định, Samorodnitsky và Taqqu 1994). Một biến ngẫu

nhiên X được gọi là có phân phối ổn định nếu và chỉ nếu cho các số dương bất kỳ

c1 , c2 , tồn tại một số dương c và một số thực d sao cho

cX + d = c1 X1 + c2 X2 ,

(1.9)

với X1 và X2 độc lập và có cùng phân phối với X. Nếu d = 0, X được gọi là ổn định

chặt.

16

Xem Thêm

1 Định lý giới hạn trung tâm

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về