Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (457.84 KB, 62 trang )
Vì ước lượng này là tổ hợp tuyến tính của các thống kê thứ tự, nó có phân phối
tiệm cận với phân phối chuẩn. Một nghiên cứu dùng phương pháp mô phỏng Monte
Carlo chỉ ra rằng sai lệch tiệm cận của ước lượng đó là bé hơn 0.4%.
Có thể áp dụng phương pháp tương tự để ước lượng α . Ta xác định tham số
dáng điệu đuôi của phân phối thông qua ước lượng
zf =
q f − q1− f
2γ
(2.2)
Sau đó sử dụng một bảng thích hợp cho giá trị của α có phân vị lý thuyết phù hợp
với z f . Lựa chọn mức f là một vấn đề khó khăn. Vì ta cần ước lượng tham số dáng
điệu đuôi nên phải chọn giá trị của f đủ lớn. Tuy nhiên, nếu giá trị của f quá lớn
thì sẽ dẫn tới sự gia tăng độ biến động mẫu. Một nghiên cứu bằng phương pháp
Monte Carlo chỉ ra rằng các giá trị phân vị từ 0.95 đến 0.97 sẽ khống chế được sự
biến động giá trị thực của α
Một ước lượng tinh tế và mở rộng hơn phương pháp ước lượng phân vị cơ sở do
McCulloch đề xuất (1986) sau đó. Xét phân phối S1 (α , β , γ , δ ). Các phân vị
q.95 − q.05
q.75 − q.25
q.95 + q.05 − 2q.5
νβ =
q.95 − q.05
να =
(2.3)
không phụ thuộc vào γ và δ . Dựa vào nhận xét đó, tác giả lập bảng là một hàm của
α và β . Từ đó ước lượng hai tham số trên bằng cách đối chiếu sự tương thích giá
trị của hàm số đó tính từ mẫu số liệu và tính theo phân phối lý thuyết.
Khi có được ước lượng của α và β , chúng ta chuyển sang ước lượng tham số tỷ
lệ γ . Các giá trị của đại lượng
νγ =
q.75 − q.25
γ
được lập thành bảng như là hàm của α và β , như vậy
γ=
q.75 − q.25
νγ α , β
35
.
(2.4)
Cuối cùng tham số vị trí δ được ước lượng như sau. Trước hết xét phép biến đổi
δ + β γ tan πα α = 1
2
ζ=
δ α = 1
Đại lượng
νγ =
ζ − q.5
γ
được lập thành bảng như là một hàm của α và β , từ đó ζ = q.5 + γνζ α , β và
δ = ζ − β γ tan
2.2
πα
.
2
(2.5)
Phương pháp dựa trên hàm đặc trưng
Ý tưởng ước lượng tham số cho phân phối ổn định bằng hàm đặc trưng thực
nghiệm do Press (1972) và Paulson, Holcomb và Leitch (1975) phát triển. Ý tưởng
của cách tiếp cận này là tính toán số để tìm được giá trị của các tham số làm cực
tiểu khoảng cách giữa hàm đặc trưng thực nghiệm và hàm đặc trưng lý thuyết. Cho
một mẫu y có n đơn vị, hàm phân phối thực nghiệm là
φ (t) =
1
n
n
∑ eity j =
j=1
1
n
n
∑ [cos (ty j ) − i sin (ty j )].
(2.6)
j=1
Cách tiếp cận trên nhằm làm cực tiểu giá trị của tích phân
+∞
−∞
2
φ (t) − φ (t) ω (t) dt
(2.7)
theo các tham số ổn định, với ω (t) là hàm trọng số được lựa chọn thích hợp để tiện
2
tính toán. Các tác giả đề xuất sử dụng ω (t) = e−t và tích phân trên được tính bằng
phương pháp cầu phương số. Bằng phương pháp mô phỏng các tác giả đã chỉ ra
rằng thủ tục ước lượng như trên chỉ hiệu quả đối với giá trị của γ gần 1 và giá trị δ
gần 0. Do đó họ đề xuất sử dụng phương pháp ước lượng hai bước, bước thứ nhất
36
tìm ra ước lượng thô cho các tham số vị trí và tỷ lệ. Sau đó dùng các ước lượng thô
đó để chuẩn hóa số liệu đưa về trường hợp δ = 0 và γ = 1 và áp dụng thủ tục ước
lượng nói trên.
Một cách tiếp cận khác được Koutrouvelis (1980) đề xuất. Tác giả này nhận
thấy logarithm của hàm đặc trưng theo cách tham số hóa 1 (1.11) được biểu diễn
với α = 1 thành
ln φ1 (t) = −|γ t|α + i δ t + |γ t|α sgn (t) β tan
πα
.
2
(2.8)
Phần thực của biểu thức trên là
ℜ [ln φ1 (t)] = −γ α |t|α ,
Bởi vậy
ln {−ℜ [ln φ1 (t)]} = α ln |t| + α ln γ .
(2.9)
Tương tự phần ảo của (1.64) được viết
ℑ [ln φ1 (t)] = δ t + |γ t|α sgn (t) β tan
πα
.
2
(2.10)
Do đó phương pháp tiếp cận theo đề xuất trên theo phương pháp bao gồm các bước:
1. Ước lượng γ và δ bằng phương pháp phân vị và tiêu chuẩn hóa các dữ liệu
2. Tính toán hàm đặc trưng thực nghiệm (1.62) và các giá trị mẫu của (1.65), (1.66)
qua
ℜ ln φ1 (t) = ln φ1 (t)
ℑ ln φ1 (t) = arctan
ℜ φ1 (t)
ℑ φ (t)
1
.
Việc xác định các điểm dùng để tính giá trị của hàm đặc trưng được tiến hành dựa
vào một bảng tra cứu lập sẵn (Koutrouvelis 1980).
3. Hồi quy ln −ℜ ln φ1 (t)
theo biến X = ln |t| (của 1.65); α bằng hệ số dốc
thu được, còn α lnγ bằng hệ số chặn chia cho α .
4. Hồi quy phần ảo của hàm đặc trưng thực nghiệm theo t và |γ t|α sgn(t) (của 1.66)
để đạt được ước lượng cập nhật của β và cho δ .
37
Phương pháp tiếp cận này về sau được Koutrouvelis (1981) cải tiến bằng cách
sử dụng phương pháp hồi quy bình phương bé nhất suy rộng lặp với phương sai của
các sai số hồi quy được lấy làm trọng số.
Một kỹ thuật tinh tế khai thác các hàm đặc trưng gần đây được Kogon và
Williams (1998) đưa ra . Các tác giả sử dụng dạng tham số hóa 0 của hàm đặc
trưng (1.23). Trong trường hợp này, sử dụng phương trình hồi quy như phần trước,
ta có
ln {−ℜ [ln φ0 (ti )]} = α ln |ti | + α ln γ + ui ,
πα
|γ ti |α −1 − 1 + vi .
ℑ [ln φ0 (ti )] = δ ti + β γ ti tan
2
(2.11)
Ngoài việc sử dụng cách tham số hóa khác, sự khác biệt giữa cách tiếp cận này
với cách tiếp cận của Koutrouvelis (1980) nằm ở sự lựa chọn các điểm mà tại đó
hàm đặc trưng được ước lượng. Thay vì việc tra bảng, Kogon và Williams (1998)
sử dụng một khoảng cố định độc lập với các tham số tỷ lệ và vị trí. Quan sát thấy
hàm đặc trưng mẫu được xác định và bằng bản sao lý thuyết của nó tại t = 0. Vì
vậy khoảng giá trị tối ưu được đề xuất là t ∈ [0.1, 1.0]. Kiểm tra bằng mô phỏng
cho thấy số lượng tối ưu các điểm cách đều nhau trong khoảng nêu trên nên là 10.
Một nghiên cứu mô phỏng chi tiết đã chỉ ra phương pháp ước lượng này có hiệu
quả khá ấn tượng. Nói chung, nó có vẻ tốt hơn phương pháp phân vị ( McCulloch
1986). Tuy nhiên, hiệu quả của nó kém hơn phương pháp bình phương bé nhất suy
rộng của Koutrouvelis (1981), nhất là khi α nhỏ. Tuy vậy, tính kém chính xác này
được bù đắp lại bằng công thức tính toán đơn giản của nó, vì không yêu cầu tra
bảng và cũng không phải dùng phương pháp lặp.
2.3
Phương pháp hợp lý cực đại
Phương pháp hợp lý cực đại lần đầu tiên được Du-Mouchel (1973a) đưa ra và
chỉ ra rằng ước lượng này phù hợp với lý thuyết tiệm cận tiêu chuẩn. Tác giả chú ý
38
hàm hợp lý có hình dáng lạ vì
lim
α →0,x→δ
L (x; α , δ ) = +∞.
Do đó xuất hiện điểm kỳ dị khi giá trị của quan sát gần tới tham số vị trí δ . Khi
biết δ , điều này không thể xảy ra vì P (X = δ ) = 0. Vấn đề này có thể khắc phục
bằng cách hạn chế các giá trị chấp nhận được của α để ε < α ≤ 2, với ε nhỏ tùy ý.
Vì hàm hợp lý không liên tục tại α = 1, ta sẽ loại trừ giá trị tham số này. Ký hiệu
không gian mẫu hạn chế là Θ, và C là môt tập con mở tùy ý của Θ. Khi đó
1. Hàm mật độ f (x; θ ) liên tục θ ∈ Θ và có đạo hàm riêng cấp một, cấp hai liên
tục ∀x và ∀θ0 ∈ Cc , ở đây Cc là phần bù của C.
2. Hàm mật độ đồng thời của mẫu thỏa mãn
Eθ0 sup ln
θ ∈Cc
∏n f (xi ; θ )
i=1
< ∞,
n
∏i=1 f (xi ; θ0 )
∀θ0 ∈ Cc .
3. Cho g(θ ) và H(θ ) tương ứng là gradient và ma trận Hessian của hàm hợp lý.
Khi đó tồn tại một hàm m(x) sao cho
+∞
−∞
m(x) f (x; θ )dx ≤ M < +∞,
giá trị tuyệt đối của định thức H(θ ) bị chặn bởi m(x).
4. ∀θ ∈ Cc , E [g (θ )] = 0 và I(θ ) = −E [H (θ )]
5. ∀θ ∈ ⊖ và ∀θ0
∈ Cc ,
+∞
−∞
| f (x; θ ) − f (x; θ0 )| dx > 0.
6. Ma trận thông tin I không suy biến ∀θ ∈ Cc .
Định lý 2.1 (Ước lượng hợp lý cực đại). Với mọi θ ∈ Θ ước lượng hợp lý cực đại
là vững và tiệm cận chuẩn với ma trận phương sai- hiệp phương sai I −1 (θ )
Trong thực tế, xấp xỉ chuẩn chỉ đúng với các giá trị nhất định của α và β ; vì khi
hai tham số này xấp xỉ tới giới hạn của chúng, hàm hợp lý sẽ suy biến với một cỡ
mẫu cố định. Tuy vậy, kết quả này đẹp và khuyến khích người ta lựa chọn sử dụng
phương pháp hợp lý cực đại thay vì dùng các phương pháp khác đã nêu trên đây.
39
Thật đáng tiếc, phương pháp này bị cản trở rõ rệt vì hàm mật độ không có dạng
hiển. Vì vậy để đánh giá hàm hợp lý phải dùng biến đổi ngược hàm đặc trưng đối
với từng vector tham số khác nhau, do đó rất tốn thời gian tính toán.
Đề xuất đầu tiên để vượt qua khó khăn này được DuMouchel (1971) đưa ra.
Ông đề nghị phân chia dữ liệu thành thành các khoảng có độ rộng cố định. Sau
đó dùng phép biến đổi Fourier nhanh để đạt được hàm mật độ của nhóm quan sát
trung tâm và mở rộng tiệm cận (1.42) cho giá trị quan sát biên. Thông tin bị mất
mát liên quan đến kỹ thuật ghép nhóm được phân tích trong DuMouchel (1975).
Gần đây, hai phương pháp tính toán ước lượng hợp lý cực đại đã được đưa
ra. Phương pháp thứ nhất là của Nolan (2002), sử dụng biểu diễn chuỗi của Nolan
(1997) được báo cáo trong (1.40). Phương pháp thứ hai, do Mittnik, Rachev, Doganoglu và Chenyao (1999) đưa ra, sử dụng phép biến đổi phân cực tuyến tính Fourier
nhanh của hàm đặc trưng. Cả hai phương pháp cho thấy giảm đáng kể sai số bình
phương trung bình so với phương pháp phân vị của McCulloch (1986).
2.4
Kiểm định đánh giá dáng điệu đuôi của phân
phối ổn định
Theo nguyên tắc, vì phân phối ổn định có bốn tham số chứ không phải hai tham
số như phân phối chuẩn, nên chắc chắn dùng phân phối ổn định sẽ có thể khớp với
dữ liệu tốt hơn phân phối chuẩn. Tuy nhiên trong nhiều trường hợp, dữ liệu thực
nghiệm lại khá gần với phân phối Gauss. Do vậy, về mặt phương pháp luận, việc
tiến hành kiểm định phân biệt giữa hai loại phân phối đó là rất quan trọng.
Vấn đề lựa chọn giữa phân phối chuẩn và phân phối ổn định được DuMouchel
(1983) đưa ra đầu tiên. Như ta đã thấy ở trên đây, đối với các giá trị nằm trong miền
giới hạn của không gian tham số, mọi ước lượng hợp lý cực đại sẽ có phân phối
tiệm cận chuẩn. Mặt khác, khi α gần đến 2, ước lượng đó sẽ có sai số chuẩn gần
tới 0. Điều này gây nên một vấn đề lớn cho việc tiến hành các phép kiểm định.
40
Vì khó khăn đó, người ta thường tiến hành việc kiểm định so sánh hai loại phân
phối nêu trên bằng các kỹ thuật trực quan. Bên cạnh kỹ thuật so sánh đồ thị của các
hàm mật độ, người ta còn dùng kỹ thuật so sánh các đồ thị p − p và q − q.
41
Chương 3
Mô hình thống kê đối với phân
phối ổn định
3.1
Mô hình tuyến tính với nhiễu ổn định
Sử dụng phân phối nặng đuôi là khá phổ biến trong việc mô hình hóa sai số
của các mô hình hồi quy tuyến tính. Phương pháp ước lượng bình phương bé nhất
cổ điển, khi phân phối sai số nặng đuôi mang lại ước lượng không hiệu quả, chịu
ảnh hưởng quá nhiều bởi tác động của các quan sát xa trung tâm.
Trình bày một cách hình thức, cho ma trận cỡ n × k của các biến giải thích X
và một vector k × 1 của tham số θ , ước lượng bình phương bé nhất cổ điển của mô
hình hồi quy tuyến tính khi sai số ε ∼ S1 (α , β , γ , 0) sẽ là
θ = θ + X ′X
−1
X′ .
ε
Do đó ước lượng này có phương sai vô hạn với bất kỳ α < 2. Khi α > 1, mặc dù
ước lượng là không chệch và vững, nhưng tốc độ hội tụ của ước lượng sẽ có bậc
n1/α −1 chứ không phải n−1/2 .
42
Các tính chất của ước lượng hợp lý cực đại đối với trường hợp đối xứng đã được
McCulloch (1998a) phân tích. Trong đó, tác giả chỉ ra rằng ước lượng hợp lý cực
đại của mô hình hồi quy với nhiễu ổn định có thể diễn giải như ước lượng bằng
phương pháp bình phương bé nhất có trọng số, với các trọng số giảm dần theo giá
trị của sai số ( các quan sát cực biên có trọng số bé hơn),
w (εi ) = −
3.2
∂ ln L (θ |εi ) 1
.
∂θ
εi
Mô hình hồi quy đối với các sai số α − ổn định
không chuẩn
Xem xét mô hình hồi quy
k
yi =
∑ xij β j + εi ,
i = 1, ..., N
(3.1)
j=1
với yi là các giá trị quan sát của một biến số phụ thuộc, xi j là giá trị quan sát của
các biến độc lập, β j là các hệ số chưa biết cần ước lượng và εi là các sai số độc lập
và cùng phân phối. Phương trình trên có thể viết dưới dạng ma trân như sau:
y = Xβ + ε,
(3.2)
với
y1
x11
x21
y2
y = . ,X = .
.
.
.
.
yN
xN1
x12
...
x1k
x22
.
.
.
...
..
.
x2k
.
.
.
xN2
...
xNk
β1
ε1
β 2
ε2
,β = . ,ε = .
.
.
.
.
βk
εN
(3.3)
Ước lượng bình phương bé nhất cổ điển của β là
βOLS = X ′ X
43
−1
X ′ y,
(3.4)