PDA

View Full Version : Đề tài ktl dự báo giá vàng



tranngoc90
21-06-2010, 06:56 AM
Chương trình Giảng dạy Kinh tế Fulbright
Các phương pháp phân tích
Đề cương Đề án Môn học

BÁO CÁO SƠ BỘ ĐỀ CƯƠNG MÔN HỌC
Đề tài

ỨNG DỤNG MÔ HÌNH ARIMA TRONG DỰ BÁO GIÁ VÀNG


I. Bối cảnh và sự cần thiết của đề tài
Mong muốn biết trước những điều trong tương lai luôn là mục tiêu và là mơ ước của con người. Ngày nay con người đã tìm râ rất nhiều cách để dự báo để biết trước những điều có thể xẩy ra trong tương lai. Mô hình ARIMA là một trong những mô hình về dự báo dự đoán giá trị của biến số (hoặc một dãy biến số) tại một số điểm trong tương lai căn cứ vào những dữ liệu trong quá khứ. Một trong những điều quan tâm của tất cả mọi người đó là dự báo giá vàng, nhằm phục vụ cho công việc kinh doanh có nhân, tổ chức hay hoạch định chiến lược của một quốc gia. Như vậy tìm ra được mô hình để dự báo những biến động của giá vàng trên thế giới và trong nước có một ý nghĩa vô cùng quan trọng. Trong giới hạn của đề tài này chúng tôi đề xuất mô hình ARIMA để dự báo giá vàng.
Sơ lược về các vấn đề của dự báo và phương pháp
Một cách phân loại vấn đề dự báo là quan tâm đến thang thời gian liên quan đến dự báo, có nghĩa là dự báo đến thời gian nào trong tương lai. Ngắn, trung và dài hạn là loại thông thường, những dự báo này mang tính chất xu hướng và chiến lược.
Phương pháp dự báo có thể được chia thành vài cách khác nhau:
• Phương pháp định tính – khi không có một công thức toán học chính thức nào, thường do dữ liệu sẵn có không được xem như là đại diện cho tương lai (dự báo dài hạn)
• Phương pháp hồi quy – là sự mở rộng của hồi quy tuyến tính khi mà một biến cố được xem là liên quan tuyến tính đến số lượng các biến cố không phụ thuộc khác.
• Các phương pháp giải thông qua hệ phương trình – khi số biến cố phụ thuộc tương tác với nhau thông qua một loại phương trình (như trong mô hình kinh tế)
• Phương pháp theo chuỗi thời gian, khi chúng ta có một biến số thay đổi theo thời gian và giá trị tương lai của nó có liên quan đến giá trị trong quá khứ.
II. Số liệu
- Nguồn số cập nhật giao dịch giá vàng ở Ngân hàng EXIMBANK
- Số liệu giá vàng bán tại tại Sàn giao dịch số I . TP Hồ Chí Minh từ ngày 02/01/2007 đến ngày 09/01/2007
III. Cơ sở lý thuyết
1. Phương pháp phân tích theo chuỗi thời gian mô hình ARIMA
Năm 1976 George Box và Gwilym Jenkins nghiên cứu mô hình ARIMA (Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình trượt), và tên của họ thường được dùng để gọi tên các quá trình ARIMA tổng quát, áp dụng vào việc phân tích và dự báo các chuỗi thời gian. Phương pháp Box-Jenkins với bốn bước lặp:
- Nhận dạng mô hình thử nghiệm
- Ước lượng
- Kiểm định bằng chẩn đoán
- Dự báo.

3.1.1 Cơ sở lý thuyết
Các phương pháp này liên quan tới biến số thay đổi theo thời gian và có thể nói là chỉ phụ thuộc vào thời gian hiện tại và giá trị trước đây nó có (có nghĩa là, nó không phụ thuộc vào bất kỳ biến số nào hoặc yếu tố bên ngoài nào). Nếu Yt là giá trị của biến số tại thời điểm t, sau đó phương trình cho Yt là
Yt = f(Yt-1, Yt-2, ..., Y0, t)
Có nghĩa là, giá trị của biến số tại thời điểm t đơn thuần là phương trình giá trị trước đó và thời gian, không có biến số nào/yếu tố nào là liên quan đến biến số này. Mục đích của phương pháp phân tích theo chuỗi thời gian là tìm ra bản chất của phương trình f, và vì vậy cho chúng ta dự báo giá trị cho Yt
Phương pháp chuỗi thời gian đặc biệt tốt cho dự báo ngắn hạn, khi hành vi trong quá khứ của một biến số cụ thể là một chỉ tiêu tốt cho hành vi trong tương lai của nó, ít nhất trong ngắn hạn. Mục đích của phân tích là để thấy rõ một số mối quan hệ giữa giá trị Yt được quan sát đến nay để cho phép chúng ta dự báo giá trị Yt trong tương lai.
2.1.2 Nhận dạng mô hình
Xét tính dừng của chuổi số liệu
Điều trước tiên cần phải lưu ý là hầu hết các chuỗi thời gian đều không dừng, và các thành phần AR và MA của mô hình ARIMA chỉ liên quan đến các chuỗi thời gian dừng. Quý trình ngẫu nhiên của Yt được xem là dừng nếu trung bình và phương sai của quá trình không thay đổi theo thời gian và giá đồng phương sai giữa hai thời đoạn chỉ phụ thuộc vào khoảng cách độ trễ về thời gian giữa các thời đoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính.
- Trung bình E(Yt) = μ = const
- Phương sai Var(Yt) = σ2 = const
- Đồng phương sai: Covar(Yt, Yt-k) = gk
Tính dừng của một chuổi thời gian có thể được nhận biết dựa trên đồ thị của chuổi thời gian, đồ thị của hàm tự tương quan mẫu hay kiểm định Dickey – Fuller
- Dựa trên đồ thị Yt = f(t) một cách trực quan chuổi Yt có tính dừng nếu đồ thị hàm số cho trung bình và phương sai của giá trị Yt không thay đổi theo thời gian.
- Dựa vào hàm tự tương quan mẫu (SAC)
=
Nếu SAC=f(t) của chuổi thời gian giảm mạnh và tắt dần về 0 thì chuổi có tính dừng.
Kiểm định Dickey-Fuller (kiểm định nghiệm đơn vị) nhằm xác định xem chuỗi thời gian
có phải là Bước Ngẫu Nhiên (Random Walk; nghĩa là Yt = 1*Yt-1 + et) hay không. Nếu
chuỗi là Bước Ngẫu Nhiên thì không có tính dừng. Tuy nhiên, Nếu chuỗi không có tính
dừng thì chưa chắc là Bước Ngẫu Nhiên.
Để biến đổi chuỗi không dừng thành chuỗi dừng, thông thường nếu lấy sai phân một lần
hoặc hai lần thì sẽ được một chuỗi kết quả có tính dừng.
• Chuỗi gốc: Yt
• Chuỗi sai phân bậc 1: Wt = Yt – Yt-1
• Chuỗi sai phân bậc 2: Vt = Wt – Wt-1


Mô hình ARIMA
Theo Box- Jenkin mọi quá trình ngẫu nhiên có tính dừng đều có thể biểu diễn bằng mô
hình Tự Hồi Qui Kết Hợp Trung Bình Trượt ARIMA.
- Mô Hình Tự Hồi Qui Bậc p - AR(p)
Trong mô hình tự hồi qui quá trình phụ thuộc vào tổng có trọng số của các giá trị quá khứ
và số hạng nhiều ngẫu nhiên
Yt = φ1Yt-1 + φ2Yt-2 + ...+φpYt-p +δ +εt
- Mô Hình Trung Bình Trượt Bậc q – MA(q)
Trong mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng có trọng số của
các ngẫu nhiên hiện hành có độ trễ
Yt = μ +εt −θ1εt-1 −θ2εt-2 −...−θqεt-q
- Mô Hình Hồi Quy Kết Hợp Trung Bình Trượt - ARIMA(p,d,q)
Phương trình tổng quát của mô hình ARIMA là:
Yt = φ1Yt-1 + φ2Yt-2 + ...+φpYt-p +δ +εt − θ1εt-1 −θ2εt-2 −...−θqεt-q
Nhận dạng mô hình
Nhận dạng mô hình ARIMA(p,d,q) là tìm các giá trị thích hợp của p, d, q. Với d là bậc sai phân của chuỗi thời gian được khảo sát, p là bậc tự hồi qui và q là bậc trung bình trượt. Việc xác định p và q sẽ phụ thuộc vào các đồ thị SPAC = f(t) và SAC = f(t). Với SAC đã được giới thiệu ở trên và SPAC là Tự Tương Quan Riêng Phần Mẫu (Sample Partial Auto-
Correlation); nghĩa là tương quan giữa Yt và Yt-p sau khi đã loại bỏ tác động của các Y
trung gian.
- Chọn mô hình AR(p) nếu đồ thị SPAC có giá trị cao tại độ trễ 1, 2, ..., p và giảm nhiều sau p và dạng hàm SAC giảm dần.
- Chọn mô hình MA(q) nếu đồ thị SAC có giá trị cao tại độ trễ 1, 2, ..., q và giảm nhiều sau q và dạng hàm SPAC giảm dần
Ước lượng các thông số của mô hình ARIMA(p, d, q)
Các thông số fi và qj của mô hình ARIMA sẽ được xác định theo phương pháp bình phương tối thiểu (OLS-Ordinary Least Square) sao cho:
Kiểm tra chẩn đoán mô hình
Sau khi xác định p, d, q và các fi , qj; nghĩa là đã xác định được phương trình cho mô hình
ARIMA, điều cần phải làm là tiến hành kiểm định xem số hạng et của mô hình có phải là
một nhiễu trắng (white noise, nhiễu ngẫu nhiên thuần túy) hay không. Đây là yêu cầu của
một mô hình tốt.
Về mặt lý thuyết, et được tạo ra bởi quá trình nhiều trắng nếu:
- εt tuân theo phân phối chuẩn
- Cov(εt , εt-k¬) = 0
Việc kiểm định tính nhiễu trắng sẽ dựa trên đồ thị SAC của chuỗi et.
Dự báo
Dựa trên phương trình của mô hình ARIMA, tiến hành xác định giá trị dự báo điểm và
khoảng tin cậy của dự báo.
• Dự báo điểm:
• Khoảng tin cậy: ˆ ( ) ˆ ( )
− kσ < Y < + kσ
Với độ tin cậy 95%, k =2.



IV. Mô hình và phương pháp nghiên cứu
Đồ thị biểu diễn giá vàng

Thống kê mô tả dữ liệu
Số quan sát 278
Trung bình 1334.486
Độ lệch chuẩn 104.4295
Giá trị lớn nhất 1640
Giá trị nhỏ nhất 1190
Khoảng 439
Trung vị 1298
Max (Yt – Yt-1) 60
Như vậy sự biến động giá vàng trong toàn bộ giá trị quan sát diễn ra khá mạnh, Khoảng giao động giữa 2 ngày liên tiếp lớn nhất là 60 nghìn đồng
2. Nhận dạng mô hình ARIMA(p, d, q)

Sử dụng kiểm định Dickey-Fuller ta thấy, chuổi dữ liệu giá vàng dừng ơ d = 0, có hy vọng rằng chuổi giá vàng là một chuổi ngẫu nhiên.


Hệ số tương quan SAC chọn đầu tiên 0.975 là rất mạnh ngay cả ở mức ý nghĩa 1%. Hệ số tương quan cho những giai đoạn đầu tiên tắt dần xuống 0, vì vậy ta có thể kết luận dãy này là tịnh. Vì vậy ta sử dụng mô hình AR(1).
Hệ số tương quan mẫu SPAC số đầu tiên là 0.985 giảm xuống dưới mức 5% ở số thứ 2 và giảm dần. Vì vậy ta có thêm mô hình MA(1)
Mô hình ARIMA kiến nghị là (1,0,1). ngoài ra ta cũng có thể tham khảo thêm các mô hình (1,1,1) và (1,2,1).
2.2. Ước lượng các tham số
Cơ bản có hai cách để ước lượng những tham số  ,  :
1. Sử dụng Eview chạy hồi quy các dạng mô hình ARIMA.Xem xét nhiều giá trị khác nhau và chọn giá trị (hay tập giá trị, nếu ước lượng nhiều hơn một tham số) sao cho tổng của những bình phương phần dư đạt giá trị nhỏ nhất.

Bảng 2.1. Kết quả các tham số của các mô hình được ước lượng

Mô hình 1 Mô hình 2 Mô hình 3
DS12.inf Coef. z DS12.inf Coef. z DS12.inf Coef. z
inf inf R2
_cons _cons _cons
ARMA ARMA ARMA
Ma ar ar
L1. L1. L1.
ARMA12 ARMA12 ma
Ma ar L1.
L1. L1. ARMA12
ar
L1.
ma
L1.
2.3. Kiểm định mô hình
Sau khi ước lượng các tham số của một mô hình ARIMA được nhận dạng thử, chúng ta cần phải kiểm định để kiểm nghiệm rằng mô hình là thích hợp. Có hai cách thức cơ bản để thực hiện điều này:
1. Xem xét những phần dư - để xem nó theo dạng nào chưa được biết không.
2. Xem xét những thống kê lấy mẫu của giải pháp tối ưu hiện tại (sai số chuẩn, ma trận tương quan...)-kiểm tra xem có thể đơn giản hoá mô hình không.
Bảng 2.2. Kết quả các thông số kiểm định
Model Obs Chi-Square ll(model) df AIC BIC
Mô hình 1
Mô hình 2
Mô hình 3
Dựa vào Bảng 2.1 và Bảng 2.2 với các tiêu chuẩn kiểm định được lựa chọn là z, Chi-Square ( ), AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion), mô hình phù hợp nhất và được lựa chọn là Mô hình .
2.4. Dự báo bằng mô hình ARIMA
Mô hình ARIMA (1,0,1)
Tuy nhiên, để sử dụng một mô hình được nhận dạng cho dự báo, cần phải mở rộng mô hình (2.8) trở thành:
Yt = φ1Yt + δ +εt − θ1εt
Khi sử dụng phương trình này để dự báo một thời đoạn tiếp theo - nghĩa là, Yt+1 - chúng ta tăng những chỉ số lên một, từ đầu đến cuối, như trong phương trình (2.9).
Yt+1 = φ1Yt-1 + δ +εt+1 − θ1εt-1 (2.10)
Số hạng εt+1 sẽ không biết được vì giá trị kỳ vọng của những sai số ngẫu nhiên tương lai bằng 0, nhưng từ mô hình đã thích hợp, chúng ta có thể thay thế những giá trị εt
Đối với những giá trị Y ban đầu của quá trình dự báo, chúng ta sẽ biết những giá trị Yt,. Tuy nhiên, sau một lúc, những giá trị Y trong phương trình (2.10) sẽ là những giá trị được dự báo chứ không phải là những giá trị quá khứ. Vì vậy các giá trị thực tế cần phải được cập nhật liên tục để cải thiện độ tin cậy của các giá trị dự báo.
V. Tài liệu tham khảo
1. Webside: www.eximbank.com.vn (Ngân hàng EXIMBANK)
2. “Hệ thống dự báo điều khiển kế hoạch ra quyết định” Loan Lê. Nhà xuất bản thống kê năm 2000.
3. “Kinh tế lượng ứng dụng” tác giả Nguyễn Thống. Nhà xuất bản Đại Học Quốc Gia. TP-HCM năm 2000.
4. “Nhập môn kinh tế lượng với các ứng dụng” Ramu Ramanathan, Người dịch Thục Đoan/Cao Hào Thi

Dependent Variable: PG
Method: Least Squares
Date: 12/07/07 Time: 02:38
Sample(adjusted): 2 278
Included observations: 277 after adjusting endpoints
Convergence achieved after 52 iterations
Backcast: 1
Variable Coefficient Std. Error t-Statistic Prob.
C 3591.058 27228.14 0.131888 0.8952
AR(1) 0.999489 0.006161 162.2197 0.0000
MA(1) 0.003581 0.061090 0.058627 0.9533
R-squared 0.989968 Mean dependent var 1334.856
Adjusted R-squared 0.989895 S.D. dependent var 104.4359
S.E. of regression 10.49816 Akaike info criterion 7.551048
Sum squared resid 30197.91 Schwarz criterion 7.590297
Log likelihood -1042.820 F-statistic 13519.90
Durbin-Watson stat 1.993379 Prob(F-statistic) 0.000000
Inverted AR Roots 1.00
Inverted MA Roots -.00