Prognoza w oparciu o szereg czasowy

Nie każdy z nas zdaje sobie sprawę, że niemal w każdej dziedzinie życia występują zjawiska, które są prognozowane. Na początku, w celu jak najlepszego zrozumienia istoty prognozowania, należałoby przytoczyć definicję przewidywania. M. Cieślak definiuje przewidywanie jako wnioskowanie o zdarzeniach nieznanych na podstawie zdarzeń znanych.[1] Przykład z jakim każdy z nas spotyka się na co dzień jest telewizyjna prognoza pogody, która jest niczym innym jak próbą przewidywania przyszłości. Tej próbie starają się sprostać rządy, poprzez ocenę przyszłego bezrobocia czy inflacji. Innym przykładem mogą być samorządy prognozujące popyt na lokalne produkty  bądź wielkość migracji w gminie. Następny przykład – uczelnie wyższe, które  starają się przewidzieć liczbę kandydatów na studia. Najczęściej jednak prognozowanie wykorzystywane jest przez przedsiębiorstwa, które wykorzystują je do maksymalizacji zysków bądź minimalizacji strat.

Czym jest prognoza?

           Pojęcie prognozy związane jest z pojęciem szeregów czasowych. Każdy szereg czasowy musi posiadać dwie zmienne – deterministyczną i losową. Czas pełni rolę zmiennej deterministycznej, natomiast zmienna losowa jest zmienną badaną. Niezwykle ważne jest, aby pomiar wartości użytych w badanym zjawisku dokonywany był w równych odstępach czasu.

Analiza szeregów czasowych ma na celu wykrycie natury zjawiska na podstawie dokonywanych obserwacji oraz prognozowania w celu przewidzenia przyszłości. W literaturze przedmiotu istnieje wiele metod prognozowania szeregów czasowych. Wybór odpowiedniej metody, dającej poprawne i zadowalające wyniki, uzależniony jest od składowych badanego szeregu czasowego.  Polega to na  wyróżnieniu składnika systematycznego, określeniu czy dany szereg czasowy posiada trend, czy występuje w nim sezonowość lub cykliczność. Dodatkowo w analizie szeregów występuje także część czysto losowa nazywana białym szumem, utrudniająca identyfikację struktury badanego zjawiska. Proces ten  nosi nazwę dekompozycji szeregu. Najczęściej, w pierwszej fazie analizy, do identyfikacji ww. składowych szeregu czasowego wykorzystuje się metody graficzne.

Jak zauważa P.Dittmann, użycie wykresów w analizie pozwala stwierdzić czy odchylenia danych od pozostałych występują jako wahania przypadkowe lub wahania okresowe, jak również, czy zostały popełnione błędy przy rejestracji danych lub wystąpiła gwałtowna zmiana obserwowanego zjawiska (np. spadek produkcji z powodu przerwy w dostawie prądu). Ma to szczególne znaczenie w szeregach o mniejszej liczebności, w których każde wahanie przypadkowe może mieć znaczący wpływ na prognozę. Dlatego w takich przypadkach może być konieczne zastąpienie wartości odstających średnią.

Innym ważnym elementem w analizie szeregów, na który zwraca uwagę P. Dittmann, jest obserwacja punktów zwrotnych.  W punktach tych następuje zmiana kierunku tendencji rozwojowej bądź zmiana tempa wzrostu lub spadku wartości zmiennej (M. Cieślak).

Identyfikacja trendu

Jest jedną z prostszych części analizy szeregów czasowych, szczególnie gdy występuje trend monotoniczny, czyli stale rosnący lub malejący. Pierwszym etapem w identyfikacji trendu jest lokalne uśrednianie danych, czyli wygładzanie. Niesystematyczne składniki poszczególnych obserwacji znoszą się wzajemnie. Najbardziej rozpowszechnioną metodą jest użycie średniej ruchomej.   Działanie jej polega na zastąpieniu każdego elementu szeregu zwykłą lub ważoną średnią n sąsiadujących wartości, gdzie n jest szerokością okna wygładzania (Box i Jenkins 1976, Velleman i Hoaglin 1981). W szeregach, w których wstępują obserwacje odstające, średnią ruchomą można zastąpić medianą, która jest na nie mniej podatna. Dzięki temu uzyskamy bardziej gładkie i rzetelne krzywe. Jednak metoda ta nie jest pozbawiona wad, gdyż uniemożliwia stosowanie wag, a ponadto w przypadku braku obserwacji odstających, wykorzystanie mediany spowoduje, że krzywe będą bardziej postrzępione. 

Sezonowość

Do analizy wykorzystuje się wykresy autokorelacji i autokorelacji cząstkowej. W rzeczywistości zdarza się, że występuje zarówno trend i sezonowość. Współwystępowanie tych składników szeregu czasowego nie jest niczym niezwykłym. Przykładem może być szereg czasowy przedstawiony przez Boxa i Jenkinsa,  reprezentujący miesięczne wielkości pasażerów międzynarodowej linii lotniczej.  Z danych tych można zaobserwować ciągły, niemalże równomierny wzrost liczby pasażerów. Co roku w danych miesięcznych można wyróżnić prawie identyczny wzorzec. Każdego roku, w miesiącach wakacyjnych, znacznie wzrastała liczba pasażerów w porównaniu do pozostałych miesięcy.  Amplituda zmian sezonowych wzrasta wraz z ogólnym trendem. Inaczej mówiąc, wahania sezonowe są proporcjonalne do trendu. Sezonowość taka nazywana jest multiplikatywną.

Modele i funkcje prognozowania

Model addytywny zakłada, że wartości zmiennej prognozowanej są sumą składowych szeregu czasowego.

W modelu multiplikatywnym z kolei przyjmuje się, że obserwowane wartości zmiennej prognozowanej są iloczynem składowych szeregu czasowego.

Oba te modele można zapisać w następujący sposób:

Model addytywny: X t = T t *C t+S t +I t

Model multiplikatywny: X t = T t *C t *S t *I t

Warunkiem niezbędnym do przeprowadzenia prawidłowej prognozy jest stacjonarność szeregu.  W rzeczywistości zdarza się często, że szeregi są niestacjonarne. Dotyczy to np. szeregów notowań giełdowych. Dlatego dodatkowo wyróżnia się szeregi niestacjonarne oraz niestacjonarne, które można sprowadzić do stacjonarności. Szereg niestacjonarny, który da się sprowadzić do stacjonarności nazywany jest szeregiem zintegrowanym.

Szereg aby był stacjonarny musi spełniać trzy warunki:

  • Posiadać stałą wartość oczekiwaną
  • Posiadać stałą wariancję
  • Posiadać kowariancję w okresie t

W sprowadzaniu szeregów do stacjonarności pomaga kilka prostych czynności. Gdy szereg posiada trend, aby uzyskać stałą wartość oczekiwaną, należy dokonać różnicowania. Jeśli posiada rozrzuty lub odchylenia w celu uzyskania stałej wariancji, należy posłużyć się logarytmowaniem. W zależności od tego, po którym razie szereg został doprowadzony do stacjonarności, nosi nazwę szeregu zintegrowanego rzędu I lub II itp.

Wyróżnia się trzy podstawowe funkcje prognoz:

  • PREPARACYJNA (do podejmowania decyzji)
  • AKTYWIZUJĄCA (pobudzenie do działań)
  • INFORMACYJNA (dostarcza informacji o badanym zjawisku)

Błąd prognozy

W celu dokonania oceny danego modelu wykorzystywane są błędy prognozy. W prognozowaniu  możemy wyróżnić błąd dokładności prognozy nazywany błędem Ex ante oraz błąd trafności prognozy określany jako błąd Ex post. Błędy typu Ex ante stwierdzają, czy prognoza jest akceptowalna. Prognoza może być dopuszczalna, gdy jest obdarzona przez jej odbiorcę stopniem zaufania, wystarczającym do tego, by mogła być wykorzystana do celu, dla którego została ustalona( M. Cieślak)

Zupełnie inną rolę pełnią błędy typu Ex post, których trafność jest określana po upływie czasu, na jaki została wyznaczona prognoza. Do najbardziej znanych typów błędów Ex post zalicza się:

  • Bezwzględny błąd prognozy
  • Względny błąd prognozy
  • Średni kwadratowy błąd prognozy
  • Średni względny błąd prognozy

 

Do oceny jakości modeli typu ARIMA najlepiej nadaje się kryterium informacyjne Akaike (w skrócie AIC), kryterium bayesowskie Schwarza (SBIC lub BIC) oraz kryterium Hannana-Quinn (HQ).

 


[1]              Prognozowanie gospodarcze metody i zastosowania, praca zbiorowa pod red. M. Cieślak, Wydawnictwo Naukowe PWN, Warszawa 2005, s. 18.

0 Komentarzy

Napisz komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

*

SalesMan Sprzedaż i Negocjacje ©2018

lub

Zaloguj się używając swojego loginu i hasła

lub     

Nie pamiętasz hasła ?

lub

Create Account