Exponential smoothing at mga modelo ng pagtataya ng serye ng oras. Pagtataya sa pamamagitan ng exponential smoothing (ES, exponential smoothing)

Extrapolation ay isang pamamaraan siyentipikong pananaliksik, na batay sa pamamahagi ng nakaraan at kasalukuyang mga uso, pattern, mga relasyon sa hinaharap na pag-unlad ng bagay sa pagtataya. Kasama sa mga pamamaraan ng extrapolation moving average method, exponential smoothing method, hindi bababa sa mga parisukat.

Exponential smoothing na paraan pinaka-epektibo sa pagbuo ng mga medium-term na pagtataya. Ito ay katanggap-tanggap kapag ang pagtataya ay isang panahon lamang sa unahan. Ang mga pangunahing bentahe nito ay ang pagiging simple ng pamamaraan ng pagkalkula at ang kakayahang isaalang-alang ang mga timbang ng paunang impormasyon. Ang gumaganang formula ng exponential smoothing method ay:

Mayroong dalawang problema sa pagtataya gamit ang pamamaraang ito:

  • pagpili ng halaga ng smoothing parameter na α;
  • pagpapasiya ng inisyal na halaga Uo.

Ang halaga ng α ay nakasalalay gaano kabilis bumababa ang bigat ng impluwensya ng mga nakaraang obserbasyon. Ang mas malaking α, mas kaunting impluwensya ng mga nakaraang taon. Kung ang halaga ng α ay malapit sa pagkakaisa, ito ay humahantong sa pagsasaalang-alang sa forecast pangunahin ang impluwensya ng mga pinakabagong obserbasyon lamang. Kung ang halaga ng α ay malapit sa zero, kung gayon ang mga timbang kung saan ang mga antas ng serye ng oras ay natimbang nang dahan-dahan, i.e. isinasaalang-alang ng forecast ang lahat (o halos lahat) ng mga nakaraang obserbasyon.

Kaya, kung may kumpiyansa na ang mga paunang kondisyon kung saan binuo ang forecast ay maaasahan, isang maliit na halaga ng smoothing parameter (α→0) ang dapat gamitin. Kapag ang smoothing parameter ay maliit, ang function sa ilalim ng pag-aaral ay kumikilos tulad ng average ng isang malaking bilang nakaraang mga antas. Kung walang sapat na kumpiyansa sa mga paunang kondisyon ng pagtataya, kung gayon ang isang malaking halaga ng α ay dapat gamitin, na hahantong sa pagsasaalang-alang sa pagtataya pangunahin ang impluwensya ng mga kamakailang obserbasyon.

Walang eksaktong paraan para sa pagpili ng pinakamainam na halaga ng smoothing parameter na α. Sa ilang mga kaso, iminungkahi ng may-akda ng pamamaraang ito, si Propesor Brown, na matukoy ang halaga ng α batay sa haba ng agwat ng pagpapakinis. Sa kasong ito, ang α ay kinakalkula ng formula:

kung saan ang n ay ang bilang ng mga obserbasyon na kasama sa pagitan ng smoothing.

Uo problema sa pagpili (exponentially weighted initial average) ay nalulutas sa mga sumusunod na paraan:

  • kung mayroong data sa pag-unlad ng kababalaghan sa nakaraan, maaari mong gamitin ang arithmetic mean at katumbas ng Uo dito;
  • kung walang ganoong impormasyon, ang unang unang halaga ng forecast base Y1 ay gagamitin bilang Uo.

Maaari ka ring gumamit ng mga opinyon ng eksperto.

Tandaan na kapag nag-aaral ng pang-ekonomiyang serye ng oras at pagtataya ng mga prosesong pang-ekonomiya, ang exponential smoothing na paraan ay hindi palaging "gumagana". Ito ay dahil sa ang katunayan na ang mga serye ng pang-ekonomiyang oras ay masyadong maikli (15-20 obserbasyon), at sa kaso kapag ang mga rate ng paglago at paglago ay mataas, ang pamamaraang ito ay walang "panahon" upang ipakita ang lahat ng mga pagbabago.

Isang halimbawa ng paglalapat ng exponential smoothing na paraan upang bumuo ng isang hula

Isang gawain . May mga datos na nagpapakita ng antas ng kawalan ng trabaho sa rehiyon, %

  • Bumuo ng pagtataya ng rate ng kawalan ng trabaho sa rehiyon para sa mga buwan ng Nobyembre, Disyembre, Enero, gamit ang mga pamamaraan: moving average, exponential smoothing, least squares.
  • Kalkulahin ang mga error sa mga resultang pagtataya gamit ang bawat pamamaraan.
  • Ihambing ang mga resulta na nakuha, gumawa ng mga konklusyon.

Exponential smoothing solution

1) Tukuyin ang halaga ng smoothing parameter sa pamamagitan ng formula:

kung saan ang n ay ang bilang ng mga obserbasyon na kasama sa pagitan ng smoothing. α = 2/ (10+1) = 0.2

2) Tinutukoy namin ang paunang halaga ng Uo sa dalawang paraan:
Paraan I (aritmetika mean) Uo = (2.99 + 2.66 + 2.63 + 2.56 + 2.40 + 2.22 + 1.97 + 1.72 + 1.56 + 1.42)/ 10 = 22.13/10 = 2.21
Paraan II (kinuha namin ang unang halaga ng base ng pagtataya) Uo = 2.99

3) Kalkulahin ang exponentially weighted average para sa bawat panahon gamit ang formula

kung saan ang t ay ang panahon bago ang panahon ng pagtataya; t+1 – panahon ng pagtataya; Ut+1 - hinulaang tagapagpahiwatig; α - smoothing parameter; Ang Уt ay ang aktwal na halaga ng pinag-aralan na tagapagpahiwatig para sa panahon bago ang pagtataya; Ut - exponentially weighted average para sa panahon bago ang forecast period.

Halimbawa:
Ufeb \u003d 2.99 * 0.2 + (1-0.2) * 2.21 \u003d 2.37 (I method)
Umart \u003d 2.66 * 0.2 + (1-0.2) * 2.37 \u003d 2.43 (I method), atbp.

Ufeb \u003d 2.99 * 0.2 + (1-0.2) * 2.99 \u003d 2.99 (II na pamamaraan)
Umart \u003d 2.66 * 0.2 + (1-0.2) * 2.99 \u003d 2.92 (II na pamamaraan)
Uapr \u003d 2.63 * 0.2 + (1-0.2) * 2.92 \u003d 2.86 (II na pamamaraan), atbp.

4) Gamit ang parehong formula, kinakalkula namin ang hinulaang halaga
Unovember \u003d 1.42 * 0.2 + (1-0.2) * 2.08 \u003d 1.95 (I method)
Unovember \u003d 1.42 * 0.2 + (1-0.2) * 2.18 \u003d 2.03 (II na pamamaraan)
Inilalagay namin ang mga resulta sa isang talahanayan.

5) Kalkulahin ang average na kamag-anak na error gamit ang formula:

ε = 209.58/10 = 20.96% (paraan I)
ε = 255.63/10 = 25.56% (paraan II)

Sa bawat kaso katumpakan ng hula ay kasiya-siya dahil ang average kamag-anak na pagkakamali ay nasa loob ng hanay ng 20-50%.

Ang pagkakaroon ng paglutas ng problemang ito sa pamamagitan ng mga pamamaraan moving average at hindi bababa sa mga parisukat Gumawa tayo ng mga konklusyon.

Ang isang simple at lohikal na malinaw na modelo ng serye ng oras ay may sumusunod na anyo:

Y t = b + e t

y, = b + rn (11.5)

kung saan ang b ay isang pare-pareho, ang e ay isang random na error. Ang pare-parehong b ay medyo stable sa bawat agwat ng oras, ngunit maaari ring magbago nang dahan-dahan sa paglipas ng panahon. Ang isang intuitive na paraan upang kunin ang halaga ng b mula sa data ay ang paggamit ng moving average smoothing, kung saan ang mga pinakabagong obserbasyon ay binibigyan ng mas mataas na timbang kaysa sa mga penultimate, ang mga penultimate ay mas natimbang kaysa sa mga penultimate, at iba pa. Simple exponential smoothing lang yan. Dito, ang exponentially decreasing weights ay itinalaga sa mas lumang mga obserbasyon, habang, hindi katulad ng moving average, lahat ng nakaraang obserbasyon ng serye ay isinasaalang-alang, at hindi lamang ang mga nahulog sa isang partikular na window. Ang eksaktong formula para sa simpleng exponential smoothing ay:

S t = a y t + (1 - a) S t -1

Kapag ang formula na ito ay inilapat nang recursively, ang bawat bagong smoothed value (na isa ring hula) ay kinakalkula bilang weighted average ng kasalukuyang obserbasyon at ang smoothed series. Malinaw, ang resulta ng smoothing ay depende sa parameter a . Kung ang a ay 1, ang mga nakaraang obserbasyon ay ganap na hindi papansinin. Kung ang a ay 0, ang kasalukuyang mga obserbasyon ay binabalewala. Ang mga halaga ng isang sa pagitan ng 0 at 1 ay nagbibigay ng mga intermediate na resulta. Pananaliksik mula sa obserbasyon ay nagpakita na ang simpleng exponential smoothing ay kadalasang nagbibigay ng medyo tumpak na hula.

Sa pagsasagawa, kadalasang inirerekomenda na kumuha ng mas mababa sa 0.30. Gayunpaman, ang pagpili ng mas mataas sa 0.30 kung minsan ay nagbibigay ng mas tumpak na hula. Nangangahulugan ito na mas mahusay pa ring tantyahin ang pinakamainam na halaga ng isang mula sa totoong data kaysa gumamit ng mga pangkalahatang rekomendasyon.

Sa pagsasagawa, ang pinakamainam na parameter ng smoothing ay madalas na hinahanap gamit ang isang grid search procedure. Ang posibleng hanay ng mga halaga ng parameter ay nahahati sa isang grid na may isang tiyak na hakbang. Halimbawa, isaalang-alang ang isang grid ng mga halaga mula sa a = 0.1 hanggang a = 0.9 na may hakbang na 0.1. Ang halaga ng a ay pipiliin kung saan ang kabuuan ng mga parisukat (o ibig sabihin ng mga parisukat) ng mga nalalabi (mga sinusunod na halaga ay binawasan ang mga hula sa isang hakbang sa unahan) ay minimal.

Microsoft Excel ay may function na Exponential Smoothing, na karaniwang ginagamit upang pakinisin ang mga antas ng isang empirical na serye ng oras batay sa simpleng paraan ng exponential smoothing. Upang tawagan ang function na ito, piliin ang Tools Þ Data Analysis mula sa menu bar. Magbubukas ang window ng Data Analysis sa screen, kung saan dapat mong piliin ang value na Exponential Smoothing (Exponential smoothing). Bilang resulta, lalabas ang dialog box ng Exponential Smoothing.

Sa dialog box ng Exponential Smoothing, halos pareho ang mga parameter na itinakda tulad ng sa Moving Average na dialog box na tinalakay sa itaas.

1. Input Range (Input data) - sa field na ito, isang hanay ng mga cell na naglalaman ng mga halaga ng parameter na pinag-aaralan ay ipinasok.

2. Mga Label - ang checkbox na ito ay may check kung
ang unang row (column) sa input range ay naglalaman ng header. Kung nawawala ang header, dapat i-clear ang checkbox. Sa kasong ito, awtomatikong mabubuo ang mga karaniwang pangalan para sa data ng saklaw ng output.

3. Damping factor - ilagay ang halaga ng napiling exponential smoothing factor a sa field na ito. Ang default na halaga ay a = 0.3.

4. Mga opsyon sa output - sa pangkat na ito, bilang karagdagan sa pagtukoy ng hanay ng mga cell para sa output data sa Output Range field, maaari mo ring hilingin na awtomatikong mag-plot ng isang graph, kung saan kailangan mong suriin ang pagpipiliang Output ng Tsart, at kalkulahin ang pamantayan mga error, kung saan kailangan mong suriin ang opsyon na Standard Errog (Standard error).

Gawain 2. Sa pamamagitan ng paggamit Mga programa sa Microsoft Excel, gamit ang Exponential Smoothing function, batay sa data sa dami ng output ng Gawain 1, kalkulahin ang mga smoothed na antas ng output at mga karaniwang error. Pagkatapos ay ipakita ang aktwal at hinulaang data gamit ang isang tsart. Pahiwatig: dapat kang makakuha ng isang talahanayan at graph na katulad ng ginawa sa gawain 1, ngunit may iba't ibang mga smoothed na antas at karaniwang mga error.

Paraan ng analytical alignment

kung saan ang mga teoretikal na halaga ng serye ng oras ay kinakalkula ayon sa kaukulang analytical equation sa oras t.

Ang pagpapasiya ng teoretikal (kinakalkula) na mga halaga ay ginawa batay sa tinatawag na sapat matematikal na modelo, alin ang pinakamahusay na paraan ipinapakita ang pangunahing kalakaran sa pagbuo ng serye ng oras.

Ang pinakasimpleng mga modelo (mga formula) na nagpapahayag ng trend ng pag-unlad ay ang mga sumusunod:

Linear function na ang graph ay isang tuwid na linya:

Exponential function:

Y t = a 0 * a 1 t

Power function ng pangalawang order, ang graph kung saan ay isang parabola:

Y t = a 0 + a 1 * t + a 2 * t 2

Logarithmic function:

Y t = a 0 + a 1 * ln t

Ang mga parameter ng function ay karaniwang kinakalkula gamit ang least squares method, kung saan ang pinakamababang punto ng kabuuan ng squared deviations sa pagitan ng theoretical at empirical na antas ay kinukuha bilang solusyon:

kung saan - nakahanay (kinakalkula) mga antas, at Yt - aktwal na mga antas.

Ang mga parameter ng equation na nagbibigay-kasiyahan sa kundisyong ito ay matatagpuan sa pamamagitan ng paglutas ng sistema ng mga normal na equation. Batay sa nahanap na equation ng trend, kinakalkula ang mga nakahanay na antas.

tuwid na linya ng pagkakahanay ay ginagamit sa mga kaso kung saan ang absolute gains ay halos pare-pareho, i.e. kapag nagbago ang mga antas sa pag-unlad ng aritmetika(o malapit dito).

Paghahanay sa pamamagitan ng exponential function nalalapat kapag ang serye ay sumasalamin sa pag-unlad sa geometric na propesyon, i.e. Ang mga kadahilanan ng paglago ng chain ay halos pare-pareho.

Paghahanay sa pamamagitan ng function ng kapangyarihan (parabola ng pangalawang pagkakasunud-sunod) ay ginagamit kapag ang serye ng oras ay nagbabago na may pare-pareho ang mga rate ng paglago ng chain.

Pag-level sa pamamagitan ng logarithmic function ay ginagamit kapag ang serye ay sumasalamin sa pag-unlad na may mas mabagal na paglago sa pagtatapos ng panahon, i.e. kapag ang pagtaas sa mga huling antas ng serye ng oras ay nagiging zero.

Ayon sa kinakalkula na mga parameter, ang trend model ng function ay synthesize, i.e. pagkuha ng mga halaga a 0 , a 1 , a ,2 at palitan ang mga ito sa nais na equation.

Ang kawastuhan ng mga kalkulasyon ng mga antas ng analytical ay maaaring masuri ng sumusunod na kondisyon: ang kabuuan ng mga halaga ng serye ng empirikal ay dapat tumugma sa kabuuan ng mga kinakalkula na antas ng nakahanay na serye. Sa kasong ito, ang isang maliit na error sa mga kalkulasyon ay maaaring mangyari dahil sa pag-ikot ng mga kinakalkula na halaga:

Upang masuri ang katumpakan ng modelo ng trend, ginagamit ang koepisyent ng pagpapasiya:

kung saan ang pagkakaiba ng teoretikal na data na nakuha mula sa modelo ng trend, at ang pagkakaiba ng empirical na data.

Ang modelo ng trend ay sapat sa prosesong pinag-aaralan at sumasalamin sa takbo ng pag-unlad nito sa mga halaga ng R 2 malapit sa 1.

Pagkatapos piliin ang pinaka-sapat na modelo, maaari kang gumawa ng pagtataya para sa alinman sa mga panahon. Kapag gumagawa ng mga pagtataya, gumagana ang mga ito hindi sa isang punto, ngunit sa isang pagtatantya ng pagitan, na tinutukoy ang tinatawag na mga agwat ng kumpiyansa ng forecast. Ang halaga ng agwat ng kumpiyansa ay tinutukoy sa pangkalahatang pananaw sa sumusunod na paraan:

nasaan ang ibig sabihin karaniwang lihis mula sa uso ta- tabular na halaga ng t-test ng Mag-aaral sa antas ng kabuluhan a, na depende sa antas ng kahalagahan a(%) at bilang ng mga antas ng kalayaan k = n- t. Ang halaga - ay tinutukoy ng formula:

kung saan at ang aktwal at kinakalkula na mga halaga ng mga antas ng dynamic na serye; P - bilang ng mga antas ng hilera; t- ang bilang ng mga parameter sa trend equation (para sa straight line equation t - 2, para sa 2nd order parabola equation t = 3).

Pagkatapos mga kinakailangang kalkulasyon ang agwat kung saan matatagpuan ang hinulaang halaga na may tiyak na posibilidad ay tinutukoy.

Ang paggamit ng Microsoft Excel upang bumuo ng mga modelo ng trend ay medyo simple. Una, dapat ipakita ang empirical time series bilang isang chart ng isa sa mga sumusunod na uri: histogram, bar chart, graph, scatter chart, area chart, at pagkatapos ay i-right click sa isa sa mga data marker sa chart. Bilang resulta, ang mismong serye ng oras ay mai-highlight sa chart, at magbubukas ang menu ng konteksto sa screen. Mula sa menu na ito, piliin ang Add Trendline command. Ipapakita ang dialog box na Magdagdag ng Trendline.

Sa tab na Uri ng dialog box na ito, napili ang kinakailangang uri ng trend:

1. linear (Linear);

2. logarithmic (Logarithmic);

3. polynomial, mula sa ika-2 hanggang ika-6 na antas kasama (Polinomial);

4. kapangyarihan (Power);

5. exponential (Exponential);

6. moving average, na may indikasyon ng smoothing period mula 2 hanggang 15 (Moving Average).

Sa tab na Mga Opsyon ng dialog box na ito, nakatakda ang mga karagdagang opsyon sa trend.

1. Pangalan ng Trendline (Pangalan ng pinakinis na kurba) - sa pangkat na ito, ang pangalan ay pinili, na ipapakita sa tsart upang ipahiwatig ang function na ginamit upang pakinisin ang serye ng oras. Posible ang mga sumusunod na opsyon:

♦ Awtomatiko - Kapag ang radio button ay nakatakda sa posisyong ito, ang Microsoft Excel ay awtomatikong bumubuo ng pangalan ng trend smoothing function batay sa napiling uri ng trend, tulad ng Linear (Linear function).

♦ Custom - Kapag ang radio button ay nakatakda sa posisyong ito, maaari mong ilagay ang iyong sariling pangalan para sa trend function sa kahon sa kanan, hanggang sa 256 character ang haba.

2. Pagtataya (Forecast) - sa pangkat na ito maaari mong tukuyin kung gaano karaming mga yugto sa unahan (field Forward) ang gusto mong i-proyekto ang isang trend line sa hinaharap at kung gaano karaming mga period pabalik (field Backward) ang gusto mong i-project ang isang trend line sa nakaraan (ang mga field na ito ay hindi available sa moving average mode ).

3. Itakda ang intercept (Curve intercept na may Y-axis sa isang punto) - ang checkbox na ito at ang input field na matatagpuan sa kanan ay nagbibigay-daan sa iyo na direktang tukuyin ang punto kung saan dapat mag-intersect ang trend line sa Y-axis (ang mga field na ito ay hindi available. para sa lahat ng mga mode).

4. Ipakita ang equation sa chart - kapag ang opsyon na ito ay nilagyan ng check, isang equation na naglalarawan sa smoothing trend line ay ipapakita sa chart.

5. Ipakita ang R-squared value sa tsart R2)- kapag nilagyan ng check ang checkbox na ito, ipapakita ng diagram ang halaga ng coefficient of determination.

Ang mga error bar ay maaari ding ipakita kasama ng isang trend line sa isang time series chart. Upang magpasok ng mga error bar, pumili ng serye ng data, i-right-click ito, at piliin ang Format ng Data Series na command mula sa pop-up na menu ng konteksto. Magbubukas ang dialog ng Format Data Series sa screen, kung saan dapat kang pumunta sa tab na Y Error Bars (Y-errors).

Sa tab na ito, gamit ang switch ng halaga ng Error, pipiliin mo ang uri ng mga bar at ang opsyon para sa pagkalkula ng mga ito, depende sa uri ng error.

1. Fixed value (Fixed value) - kapag ang switch ay nakatakda sa posisyong ito, ang pare-parehong halaga na tinukoy sa counter field sa kanan ay kukunin bilang pinapayagang halaga ng error;

2. Porsyento (Kamag-anak na halaga) - kapag ang switch ay nakatakda sa posisyong ito, ang pinahihintulutang paglihis ay kinakalkula para sa bawat punto ng data, batay sa halaga ng porsyento na tinukoy sa counter field sa kanan;

3. Standard deviation(s) - kapag ang switch ay nakatakda sa posisyong ito, para sa bawat data point, ang karaniwang lihis, na pagkatapos ay i-multiply sa numerong tinukoy sa counter field sa kanan (multiplier);

4. Standard error (Standard error) - kapag ang switch ay nakatakda sa posisyong ito, ang karaniwang halaga mga error, pare-pareho para sa lahat ng mga item ng data;

5. Custom (Custom) - kapag ang switch ay nakatakda sa posisyong ito, isang arbitrary na hanay ng mga halaga ng paglihis ang ipinasok sa positibo at / o negatibong panig(maaari kang magpasok ng mga link sa isang hanay ng mga cell).

Maaari ding i-format ang mga error bar. Upang gawin ito, piliin ang mga ito sa pamamagitan ng pag-click sa kanang pindutan ng mouse at piliin ang utos ng Format Error Bars mula sa pop-up na menu ng konteksto.

Gawain 3. Gamit ang programang Microsoft Excel, batay sa data sa dami ng isyu ng Gawain 1, dapat kang:

Magpakita ng time series bilang isang graph na binuo gamit ang Chart Wizard. Pagkatapos ay magdagdag ng linya ng trend, na pinipili ang pinakaangkop na bersyon ng equation.

Ipakita ang mga resulta sa anyo ng isang talahanayan na "Pagpili ng equation ng trend":

Talahanayan "Pagpipilian ng equation ng trend"

Ipakita ang napiling equation sa graphically, paglalagay ng data sa pangalan ng nakuhang function at ang halaga ng approximation reliability (R 2).

Gawain 4. Sagutin ang mga sumusunod na tanong:

1. Kapag pinag-aaralan ang trend para sa isang tiyak na set ng data, ang koepisyent ng determinasyon para sa linear na modelo ay naging 0.95, para sa logarithmic na modelo - 0.8, at para sa polynomial ng ikatlong antas - 0.9636. Aling trend model ang pinakasapat para sa prosesong pinag-aaralan:

a) linear;

b) logarithmic;

c) polynomial ng 3rd degree.

2. Ayon sa datos na ipinakita sa gawain 1, hulaan ang dami ng output noong 2003. Anong pangkalahatang kalakaran sa pag-uugali ng pinag-aralan na dami ang sumusunod mula sa mga resulta ng iyong pagtataya:

a) may pagbaba sa produksyon;

b) nananatili ang produksyon sa parehong antas;

c) mayroong pagtaas sa produksyon.

Sa materyal na ito, ang mga pangunahing katangian ng serye ng oras, mga modelo ng agnas ng serye ng oras, pati na rin ang mga pangunahing pamamaraan ng pagpapakinis ng serye - ang paraan ng paglipat ng average, exponential smoothing at analytical alignment ay isinasaalang-alang. Upang malutas ang mga problemang ito, nag-aalok ang Microsoft Excel ng mga tool tulad ng Moving Average (Moving Average) at Exponential Smoothing (Exponential Smoothing), na nagbibigay-daan sa iyong pakinisin ang mga antas ng isang empirical time series, pati na rin ang Add Trendiine command (Magdagdag ng trend line ), na nagpapahintulot sa iyo na bumuo ng mga modelo ng trend at gumawa ng isang pagtataya batay sa magagamit na mga halaga ng serye ng oras.

P.S. Para paganahin ang Data Analysis Package, piliin ang Tools → Data Analysis command (Tools → Data Analysis).

Kung nawawala ang Pagsusuri ng Data, dapat mong gawin ang mga sumusunod na hakbang:

1. Piliin ang command Tools → Add-in (Add-ins).

2. Piliin ang Analysis ToolPak mula sa iminungkahing listahan ng mga setting, at pagkatapos ay i-click ang OK. Pagkatapos nito, mada-download at makokonekta ang Data Analysis customization package sa Excel. Ang kaukulang command ay lalabas sa Tools menu.


©2015-2019 site
Lahat ng karapatan ay pag-aari ng kanilang mga may-akda. Hindi inaangkin ng site na ito ang pagiging may-akda, ngunit nagbibigay ng libreng paggamit.
Petsa ng paggawa ng page: 2016-04-27

Ang pagtukoy at pagsusuri ng takbo ng isang serye ng panahon ay kadalasang ginagawa sa tulong ng pagkakahanay o pagpapakinis nito. Ang exponential smoothing ay isa sa pinakasimple at pinakakaraniwang diskarte sa pag-align ng serye. Ang exponential smoothing ay maaaring kinakatawan bilang isang filter, ang input na kung saan ay sunud-sunod na natanggap ng mga miyembro ng orihinal na serye, at ang kasalukuyang mga halaga ng exponential average ay nabuo sa output.

Maging isang time series.

Ang exponential smoothing ng serye ay isinasagawa ayon sa paulit-ulit na formula: , .

Ang mas maliit na α, mas na-filter, pinipigilan ang mga pagbabago sa orihinal na serye at ingay.

Kung ang recursive na relasyon na ito ay patuloy na ginagamit, kung gayon ang exponential average ay maaaring ipahayag sa mga tuntunin ng mga halaga ng time series X.

Kung ang mas naunang data ay umiiral sa oras na magsimula ang smoothing, kung gayon ang arithmetic average ng lahat o ilan sa mga available na data ay maaaring gamitin bilang paunang halaga.

Matapos ang hitsura ng mga gawa ni R. Brown, ang exponential smoothing ay kadalasang ginagamit upang malutas ang problema ng panandaliang pagtataya ng mga serye ng oras.

Pagbubuo ng problema

Hayaang maibigay ang time series: .

Ito ay kinakailangan upang malutas ang problema ng pagtataya ng serye ng oras, i.e. hanapin

Forecasting horizon, ito ay kinakailangan na

Upang isaalang-alang ang pagkaluma ng data, ipinakilala namin ang isang hindi tumataas na pagkakasunud-sunod ng mga timbang , pagkatapos

Kayumangging modelo

Ipagpalagay na ang D ay maliit (short-term forecast), pagkatapos ay upang malutas ang naturang problema, gamitin kayumangging modelo.

Kung isasaalang-alang natin ang pagtataya ng isang hakbang sa unahan, kung gayon - ang pagkakamali ng pagtataya na ito, at ang bagong pagtataya ay nakuha bilang isang resulta ng pagsasaayos ng nakaraang pagtataya, na isinasaalang-alang ang pagkakamali nito - ang kakanyahan ng pagbagay.

Sa panandaliang pagtataya, kanais-nais na ipakita ang mga bagong pagbabago sa lalong madaling panahon at sa parehong oras ay "linisin" ang serye mula sa mga random na pagbabagu-bago hangga't maaari. yun. dagdagan ang bigat ng mga kamakailang obserbasyon: .

Sa kabilang banda, para maayos ang mga random na paglihis, dapat bawasan ang α: .

yun. magkasalungat ang dalawang pangangailangang ito. Ang paghahanap para sa isang halaga ng kompromiso ng α ay ang problema ng pag-optimize ng modelo. Karaniwan, ang α ay kinukuha mula sa pagitan (0.1/3).

Mga halimbawa

Trabaho ng exponential smoothing sa α=0.2 sa data ng buwanang ulat sa mga benta ng isang dayuhang tatak ng kotse sa Russia para sa panahon mula Enero 2007 hanggang Oktubre 2008. Napansin namin ang matalim na pagbaba noong Enero at Pebrero, kapag ang mga benta ay tradisyonal na bumababa at tumataas nang maaga tag-init.

Mga problema

Gumagana lang ang modelo sa isang maliit na horizon ng forecast. Ang mga pagbabago sa uso at pana-panahon ay hindi isinasaalang-alang. Upang isaalang-alang ang kanilang impluwensya, iminungkahi na gamitin ang mga sumusunod na modelo: Holt (isinasaalang-alang linear na kalakaran) Holt-Winters (multiplicative exponential trend at seasonality), Theil-Wage (additive linear trend at seasonality).

9 5. Paraan ng exponential smoothing. Pagpili ng isang smoothing constant

Kapag gumagamit ng paraan ng least squares upang matukoy ang predictive trend (trend), ipinapalagay nang maaga na ang lahat ng retrospective data (obserbasyon) ay may parehong nilalaman ng impormasyon. Malinaw, magiging mas lohikal na isaalang-alang ang proseso ng pagbabawas ng paunang impormasyon, iyon ay, ang hindi pantay na halaga ng mga datos na ito para sa pagbuo ng isang pagtataya. Ito ay nakakamit sa exponential smoothing na paraan sa pamamagitan ng pagbibigay sa mga huling obserbasyon ng serye ng oras (iyon ay, ang mga halaga kaagad bago ang forecast lead period) ng mas makabuluhang "mga timbang" kumpara sa mga unang obserbasyon. Ang mga bentahe ng exponential smoothing method ay dapat ding isama ang pagiging simple ng computational operations at ang flexibility ng paglalarawan ng iba't ibang process dynamics. Ang pamamaraan ay natagpuan ang pinakamahusay na aplikasyon para sa pagpapatupad ng mga medium-term na pagtataya.

5.1. Ang kakanyahan ng exponential smoothing na paraan

Ang kakanyahan ng pamamaraan ay ang mga serye ng oras ay pinakinis gamit ang isang timbang na "moving average", kung saan ang mga timbang ay sumusunod sa exponential law. Sa madaling salita, mas malayo sa dulo ng serye ng oras ang punto kung saan kinakalkula ang weighted moving average, mas kaunting "partisipasyon ang kinakailangan" sa pagbuo ng forecast.

Hayaang ang orihinal na dynamic na serye ay binubuo ng mga antas (mga bahagi ng serye) y t , t = 1 , 2 ,...,n . Para sa bawat m sunud-sunod na antas ng seryeng ito

(m

dynamic na serye na may isang hakbang na katumbas ng isa. Kung ang m ay isang kakaibang numero, at mas mainam na kumuha ng kakaibang bilang ng mga antas, dahil sa kasong ito ang kinakalkula na halaga ng antas ay nasa gitna ng agwat ng pagpapakinis at madaling palitan ang aktwal na halaga dito, kung gayon ang ang sumusunod na formula ay maaaring isulat upang matukoy ang moving average:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t−ξ

i= t−ξ

2ξ + 1

kung saan ang y t ay ang halaga ng moving average para sa moment t (t = 1 , 2 ,...,n );

i ay ang ordinal na numero ng antas sa pagitan ng pagpapakinis.

Ang halaga ng ξ ay tinutukoy mula sa tagal ng agwat ng pagpapakinis.

Dahil ang

m =2 ξ +1

para sa kakaiba m, pagkatapos

ξ = m 2 − 1 .

Ang pagkalkula ng moving average para sa isang malaking bilang ng mga antas ay maaaring gawing simple sa pamamagitan ng pagtukoy ng sunud-sunod na mga halaga ng moving average na recursively:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Ngunit dahil sa katotohanan na ang pinakabagong mga obserbasyon ay kailangang bigyan ng higit na "timbang", ang paglipat ng average ay kailangang bigyang-kahulugan nang iba. Ito ay nakasalalay sa katotohanan na ang halaga na nakuha sa pamamagitan ng pag-average ay pinapalitan hindi ang gitnang termino ng average na pagitan, ngunit ang huling termino nito. Alinsunod dito, ang huling expression ay maaaring muling isulat bilang

Mi = Mi + 1

y i− y i− m

Dito ang moving average, na nauugnay sa dulo ng interval, ay tinutukoy ng bagong simbolo M i . Sa esensya, ang M i ay katumbas ng y t shifted ξ na mga hakbang sa kanan, iyon ay, M i = y t + ξ , kung saan i = t + ξ .

Isinasaalang-alang na ang M i − 1 ay isang pagtatantya ng y i − m , expression (5.1)

maaaring isulat muli sa anyo

y i+ 1

M i − 1 ,

M i tinukoy sa pamamagitan ng pagpapahayag (5.1).

kung saan ang M i ang tantiya

Kung ang mga kalkulasyon (5.2) ay paulit-ulit sa pagdating ng bagong impormasyon

at muling isulat sa ibang anyo, pagkatapos ay makakakuha tayo ng isang smoothed observation function:

Q i= α y i+ (1 − α ) Q i− 1 ,

o sa katumbas na anyo

Q t= α y t+ (1 − α ) Q t− 1

Ang mga kalkulasyon na isinagawa sa pamamagitan ng expression (5.3) sa bawat bagong obserbasyon ay tinatawag na exponential smoothing. Sa huling expression, upang makilala ang exponential smoothing mula sa moving average, ang notation na Q ay ipinakilala sa halip na M . Ang halaga α , which is

Ang analogue ng m 1 ay tinatawag na smoothing constant. Ang mga halaga ng α ay nakasalalay

pagitan [0, 1] . Kung ang α ay kinakatawan bilang isang serye

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

madaling makita na ang "mga timbang" ay bumababa nang husto sa oras. Halimbawa, para sa α = 0 , 2 ang nakukuha natin

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Ang kabuuan ng serye ay may posibilidad sa pagkakaisa, at ang mga tuntunin ng kabuuan ay bumababa sa paglipas ng panahon.

Ang halaga ng Q t sa expression (5.3) ay ang exponential average ng unang order, iyon ay, ang average na nakuha nang direkta mula sa

pagpapakinis ng data ng pagmamasid (pangunahing pagpapakinis). Minsan kapag bumubuo ng mga istatistikal na modelo, kapaki-pakinabang na gumamit ng pagkalkula ng mga exponential average ng mas mataas na mga order, iyon ay, mga average na nakuha sa pamamagitan ng paulit-ulit na exponential smoothing.

Ang pangkalahatang notasyon sa recursive form ng exponential mean ng order k ay

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Ang halaga ng k ay nag-iiba sa loob ng 1, 2, …, p ,p+1 , kung saan ang p ay ang pagkakasunud-sunod ng predictive polynomial (linear, quadratic, at iba pa).

Batay sa formula na ito, para sa exponential average ng una, pangalawa at pangatlong order, ang mga expression

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Pagtukoy sa mga parameter ng predictive model gamit ang exponential smoothing method

Malinaw, upang makabuo ng mga predictive na halaga batay sa dynamic na serye gamit ang exponential smoothing method, kinakailangan upang kalkulahin ang mga coefficient ng trend equation sa pamamagitan ng exponential average. Ang mga pagtatantya ng mga koepisyent ay tinutukoy ng pangunahing teorama ng Brown-Meyer, na nag-uugnay sa mga coefficient ng predictive polynomial sa mga exponential average ng kaukulang mga order:

(− 1 )

aˆ p

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑j

p=0

p! (k− 1 ) !j = 0

kung saan ang aˆ p ay mga pagtatantya ng mga coefficient ng polynomial ng degree p .

Ang mga coefficient ay matatagpuan sa pamamagitan ng paglutas ng sistema (p + 1 ) ng mga equation na сp + 1

hindi kilala.

Kaya, para sa isang linear na modelo

aˆ 0 = 2 Q t (1 ) − Q t (2); aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

para sa isang parisukat na modelo

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Ang forecast ay ipinatupad ayon sa napiling polynomial, ayon sa pagkakabanggit, para sa linear na modelo

ˆyt + τ = aˆ0 + aˆ1 τ ;

para sa isang parisukat na modelo

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

kung saan ang τ ay ang hakbang ng hula.

Dapat tandaan na ang mga exponential average na Q t (k ) ay maaaring kalkulahin lamang gamit ang isang kilalang (pinili) na parameter, alam ang mga paunang kondisyon Q 0 (k ) .

Mga pagtatantya ng mga paunang kundisyon, sa partikular, para sa isang linear na modelo

Q(1)= a

1 − α

Q(2 ) = a − 2 (1 − α ) a

para sa isang parisukat na modelo

Q(1)= a

1 − α

+ (1 − α )(2 − α ) a

2(1−α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q(3)=a

3(1−α )

(1 − α )(4 − 3 α ) a

kung saan ang mga coefficients a 0 at a 1 ay kinakalkula ng least squares method.

Ang halaga ng smoothing parameter na α ay tinatayang kinakalkula ng formula

α ≈ m 2 + 1,

kung saan ang m ay ang bilang ng mga obserbasyon (mga halaga) sa pagitan ng pagpapakinis. Ang pagkakasunud-sunod ng pagkalkula ng mga predictive na halaga ay ipinapakita sa

Pagkalkula ng mga coefficient ng isang serye sa pamamagitan ng paraan ng hindi bababa sa mga parisukat

Pagpapasiya ng agwat ng pagpapakinis

Pagkalkula ng smoothing constant

Pagkalkula ng mga paunang kondisyon

Pag-compute ng mga exponential average

Pagkalkula ng mga pagtatantya a 0 , a 1 , atbp.

Pagkalkula ng mga halaga ng pagtataya ng isang serye

kanin. 5.1. Ang pagkakasunud-sunod ng pagkalkula ng mga halaga ng pagtataya

Bilang halimbawa, isaalang-alang ang pamamaraan para sa pagkuha ng predictive na halaga ng uptime ng produkto, na ipinahayag ng oras sa pagitan ng mga pagkabigo.

Ang paunang data ay ibinubuod sa talahanayan. 5.1.

Pumili kami ng isang linear na modelo ng pagtataya sa anyong y t = a 0 + a 1 τ

Ang solusyon ay magagawa sa mga sumusunod na paunang halaga:

a 0 , 0 = 64, 2; a 1 , 0 = 31.5; α = 0.305.

Talahanayan 5.1. Paunang data

Numero ng pagmamasid, t

Haba ng hakbang, hula, τ

MTBF, y (oras)

Para sa mga halagang ito, ang nakalkulang "smoothed" coefficients para sa

y 2 mga halaga ay magiging pantay

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 ) − Q (2 )

31, 9 ,

1−α

sa ilalim ng mga paunang kondisyon

1 − α

A 0 , 0 −

isang 1, 0

= −7 , 6

1 − α

= −79 , 4

at mga exponential average

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q(2)

= α Q (1)

+ (1 −α ) Q (2 ) = −47 , 5 .

Ang "smoothed" na halaga na y 2 ay kinakalkula ng formula

Q i (1)

Q i (2 )

isang 0,i

isang 1,i

ˆyt

Kaya (Talahanayan 5.2), ang linear predictive na modelo ay may anyo

ˆy t + τ = 224.5+ 32τ .

Kalkulahin natin ang mga hinulaang halaga para sa mga panahon ng lead na 2 taon (τ = 1 ), 4 na taon (τ = 2 ) at iba pa, ang oras sa pagitan ng mga pagkabigo ng produkto (Talahanayan 5.3).

Talahanayan 5.3. Mga halaga ng pagtatayaˆy t

Ang equation

t+2

t+4

t+6

t+8

t+20

regression

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224.5+ 32τ

Dapat tandaan na ang kabuuang "timbang" ng mga huling m na halaga ng serye ng oras ay maaaring kalkulahin ng formula

c = 1 − (m (− 1 ) m ) . m+ 1

Kaya, para sa huling dalawang obserbasyon ng serye (m = 2 ) ang halaga c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Pagpili ng mga paunang kundisyon at pagpapasiya ng pare-pareho ang smoothing

Tulad ng sumusunod mula sa expression

Q t= α y t+ (1 − α ) Q t− 1 ,

kapag nagsasagawa ng exponential smoothing, kinakailangang malaman ang paunang (nakaraang) halaga ng smoothed function. Sa ilang mga kaso, ang unang obserbasyon ay maaaring kunin bilang paunang halaga; mas madalas, ang mga paunang kondisyon ay tinutukoy ayon sa mga expression (5.4) at (5.5). Sa kasong ito, ang mga halaga ay 0 , 0 , a 1 , 0

at ang isang 2 , 0 ay tinutukoy ng pinakamaliit na paraan ng mga parisukat.

Kung hindi talaga tayo nagtitiwala sa napiling paunang halaga, kung gayon sa pamamagitan ng pagkuha ng malaking halaga ng smoothing constant na α sa pamamagitan ng k obserbasyon, magdadala tayo

"timbang" ng paunang halaga hanggang sa halaga (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Kaya, ang pagpili ng smoothing constant (o ang bilang ng mga obserbasyon sa moving average) ay nagsasangkot ng trade-off. Karaniwan, tulad ng ipinapakita ng kasanayan, ang halaga ng patuloy na pag-smoothing ay nasa saklaw mula 0.01 hanggang 0.3.

May ilang mga transition na kilala na nagpapahintulot sa isa na makahanap ng tinatayang pagtatantya ng α . Ang una ay sumusunod mula sa kondisyon na ang moving average at ang exponential average ay pantay

α \u003d m 2 + 1,

kung saan ang m ay ang bilang ng mga obserbasyon sa pagitan ng smoothing. Ang iba pang mga diskarte ay nauugnay sa katumpakan ng hula.

Kaya, posibleng matukoy ang α batay sa ugnayan ng Meyer:

α ≈ S y ,

kung saan ang S y ay ang karaniwang error ng modelo;

Ang S 1 ay ang mean square error ng orihinal na serye.

Gayunpaman, ang paggamit ng huling ratio ay kumplikado sa pamamagitan ng katotohanan na napakahirap na mapagkakatiwalaan na matukoy ang S y at S 1 mula sa paunang impormasyon.

Kadalasan ang smoothing parameter, at sa parehong oras ang coefficients a 0 , 0 at a 0 , 1

ay pinili bilang pinakamainam depende sa criterion

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

sa pamamagitan ng paglutas ng algebraic system ng mga equation, na nakukuha sa pamamagitan ng equating ng derivatives sa zero

∂S2

∂S2

∂S2

∂a0, 0

∂ isang 1, 0

∂a2, 0

Kaya, para sa isang linear na modelo ng pagtataya, ang paunang pamantayan ay katumbas ng

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j=0

Ang solusyon ng sistemang ito sa tulong ng isang computer ay hindi nagpapakita ng anumang mga paghihirap.

Para sa isang makatwirang pagpili ng α, maaari mo ring gamitin ang generalised smoothing procedure, na nagbibigay-daan sa iyong makuha ang mga sumusunod na relasyon na nauugnay sa forecast variance at smoothing parameter para sa isang linear na modelo:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

para sa isang parisukat na modelo

S p 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

kung saan β = 1 α ;Sy– RMS approximation ng paunang dynamic na serye.

04/02/2011 – Ang pagnanais ng tao na iangat ang tabing ng hinaharap at mahulaan ang takbo ng mga pangyayari ay may mahabang kasaysayan gaya ng kanyang mga pagtatangka na maunawaan ang mundo sa paligid niya. Malinaw na ang medyo malakas na mahahalagang motibo (teoretikal at praktikal) ay sumasailalim sa interes sa hula. Ang pagtataya ay nagsisilbing pinakamahalagang paraan para sa pagsubok ng mga siyentipikong teorya at hypotheses. Ang kakayahang mahulaan ang hinaharap ay isang mahalagang bahagi ng kamalayan, kung wala ang buhay ng tao mismo ay imposible.

Ang konsepto ng "forecasting" (mula sa Greek. prognosis - foresight, prediction) ay nangangahulugang ang proseso ng pagbuo ng probabilistikong paghatol tungkol sa estado ng isang phenomenon o proseso sa hinaharap, ito ay ang kaalaman sa kung ano ang hindi pa, ngunit kung ano ang maaaring dumating sa malapit o malayong hinaharap.

Ang nilalaman ng hula ay mas kumplikado kaysa sa hula. Sa isang banda, sinasalamin nito ang pinaka-malamang na estado ng bagay, at sa kabilang banda, tinutukoy nito ang mga paraan at paraan upang makamit ang ninanais na resulta. Sa batayan ng impormasyong nakuha sa isang predictive na paraan, ang ilang mga desisyon ay ginawa upang makamit ang ninanais na layunin.

Dapat pansinin na ang dinamika ng mga prosesong pang-ekonomiya sa mga modernong kondisyon ay nailalarawan sa pamamagitan ng kawalang-tatag at kawalan ng katiyakan, na nagpapahirap sa paggamit ng mga tradisyonal na pamamaraan ng pagtataya.

Exponential Smoothing at Prediction Models nabibilang sa klase ng mga pamamaraan ng adaptive forecasting, ang pangunahing katangian kung saan ay ang kakayahang patuloy na isaalang-alang ang ebolusyon ng mga dinamikong katangian ng mga prosesong pinag-aaralan, umangkop sa dinamika na ito, na nagbibigay, sa partikular, ang mas malaki ang timbang at ang mas mataas ang halaga ng impormasyon ng mga magagamit na obserbasyon, mas malapit ang mga ito sa kasalukuyang sandali sa oras . Ang kahulugan ng termino ay nagbibigay-daan sa iyo ang adaptive forecasting na i-update ang mga pagtataya na may kaunting pagkaantala at paggamit ng medyo simpleng mga pamamaraan sa matematika.

Ang exponential smoothing method ay malayang natuklasan kayumanggi(Brown R.G. Statistical forecasting para sa inventory control, 1959) at Holt(Holt C.C. Forecasting Seasonal and Trends by Exponentially Weighted Moving Averages, 1957). Ang exponential smoothing, tulad ng moving average na paraan, ay gumagamit ng mga nakaraang halaga ng serye ng oras para sa pagtataya.

Ang kakanyahan ng exponential smoothing na paraan ay ang serye ng oras ay pinapakinis gamit ang weighted moving average, kung saan ang mga timbang ay sumusunod sa exponential law. Ang isang weighted moving average na may exponentially distributed weights ay nagpapakilala sa halaga ng proseso sa dulo ng smoothing interval, iyon ay, ito ay ang average na katangian ng mga huling antas ng serye. Ito ang ari-arian na ginagamit para sa pagtataya.

Ang normal na exponential smoothing ay inilalapat kapag walang trend o seasonality sa data. Sa kasong ito, ang hula ay isang weighted average ng lahat ng available na nakaraang mga halaga ng serye; sa kasong ito, ang mga timbang ay bumababa nang geometriko sa paglipas ng panahon habang lumilipat tayo sa nakaraan (paatras). Samakatuwid (hindi tulad ng moving average na paraan) walang punto kung saan ang mga timbang ay masira, ibig sabihin, zero. Ang isang pragmatically malinaw na modelo ng simpleng exponential smoothing ay maaaring isulat tulad ng sumusunod (lahat ng mga formula ng artikulo ay maaaring ma-download mula sa link na ibinigay):

Ipakita natin ang exponential na katangian ng pagbaba sa mga bigat ng mga halaga ng serye ng oras - mula sa kasalukuyan hanggang sa nakaraan, mula sa nakaraan hanggang sa nakaraan-nakaraan, at iba pa:

Kung ang formula ay inilapat nang recursively, ang bawat bagong smoothed value (na isa ring hula) ay kalkulahin bilang weighted average ng kasalukuyang obserbasyon at ang smoothed series. Malinaw, ang resulta ng smoothing ay depende sa adaptation parameter alpha. Maaari itong bigyang-kahulugan bilang isang kadahilanan ng diskwento na nagpapakilala sa sukatan ng pagbabawas ng data sa bawat yunit ng oras. Bukod dito, ang impluwensya ng data sa forecast ay bumababa nang malaki sa "edad" ng data. Depende sa impluwensya ng data sa forecast sa iba't ibang coefficient alpha ipinapakita sa Figure 1.

Figure 1. Depende sa impluwensya ng data sa forecast para sa iba't ibang adaptation coefficient

Dapat tandaan na ang halaga ng smoothing parameter ay hindi maaaring katumbas ng 0 o 1, dahil sa kasong ito ang mismong ideya ng exponential smoothing ay tinanggihan. Kaya kung alpha katumbas ng 1, pagkatapos ay ang hinulaang halaga F t+1 tumutugma sa kasalukuyang halaga ng row Xt, habang ang exponential model ay may posibilidad sa pinakasimpleng "muwang-muwang" na modelo, iyon ay, sa kasong ito, ang pagtataya ay isang ganap na walang kuwentang proseso. Kung ang alpha katumbas ng 0, pagkatapos ay ang paunang halaga ng pagtataya F0 (paunang halaga) ay sabay na magiging isang pagtataya para sa lahat ng kasunod na mga sandali ng serye, iyon ay, ang pagtataya sa kasong ito ay magmumukhang isang regular na pahalang na linya.

Gayunpaman, isaalang-alang natin ang mga variant ng smoothing parameter na malapit sa 1 o 0. Kaya, kung alpha malapit sa 1, pagkatapos ay ang mga nakaraang obserbasyon ng serye ng oras ay halos ganap na hindi pinansin. Kung alpha malapit sa 0, pagkatapos ay binabalewala ang kasalukuyang mga obserbasyon. Mga halaga alpha sa pagitan ng 0 at 1 ay nagbibigay ng mga intermediate na resulta. Ayon sa ilang mga may-akda, ang pinakamainam na halaga alpha ay nasa hanay mula 0.05 hanggang 0.30. Gayunpaman, kung minsan alpha, higit sa 0.30 ay nagbibigay ng mas mahusay na hula.

Sa pangkalahatan, mas mahusay na suriin ang pinakamainam alpha batay sa raw data (gamit ang grid search), sa halip na gumamit ng mga artipisyal na rekomendasyon. Gayunpaman, kung ang halaga alpha, mas malaki sa 0.3 ang nagpapaliit ng bilang ng mga espesyal na pamantayan, ito ay nagpapahiwatig na ang isa pang diskarte sa pagtataya (gamit ang isang trend o seasonality) ay nakakapagbigay ng mas tumpak na mga resulta. Upang mahanap ang pinakamainam na halaga alpha(iyon ay, pag-minimize ng mga espesyal na pamantayan) ay ginagamit quasi-Newtonian likelihood-maximization algorithm(probability), na mas mahusay kaysa sa karaniwang enumeration sa grid.

Isulat muli natin ang equation (1) sa anyo ng alternatibong variant na nagbibigay-daan sa atin na suriin kung paano "natututo" ang exponential smoothing model mula sa mga nakaraang pagkakamali nito:

Ang equation (3) ay malinaw na nagpapakita na ang pagtataya para sa panahon t+1 maaaring magbago sa direksyon ng pagtaas, kung sakaling lumampas sa aktwal na halaga ng serye ng oras sa panahon t higit sa halaga ng pagtataya, at kabaliktaran, ang pagtataya para sa panahon t+1 dapat bawasan kung X t mas mababa sa F t.

Tandaan na kapag gumagamit ng mga exponential smoothing na pamamaraan, ang isang mahalagang isyu ay palaging ang pagpapasiya ng mga paunang kundisyon (ang paunang predictive na halaga F0). Ang proseso ng pagpili ng paunang halaga ng smoothed series ay tinatawag na initialization ( pagsisimula), o, sa madaling salita, “nagpapainit” (“ nagpapainit”) mga modelo. Ang punto ay ang paunang halaga ng smoothed na proseso ay maaaring makabuluhang makaapekto sa forecast para sa mga kasunod na obserbasyon. Sa kabilang banda, ang impluwensya ng pagpili ay bumababa sa haba ng serye at nagiging hindi kritikal para sa napakalaking bilang ng mga obserbasyon. Si Brown ang unang nagmungkahi ng paggamit ng average ng time series bilang panimulang halaga. Iminumungkahi ng ibang mga may-akda na gamitin ang unang aktwal na halaga ng serye ng oras bilang paunang pagtataya.

Sa kalagitnaan ng huling siglo, iminungkahi ni Holt na palawigin ang simpleng exponential smoothing model sa pamamagitan ng pagsasama ng growth factor ( paglago kadahilanan), o kung hindi man ang trend ( salik ng kalakaran). Bilang resulta, ang modelo ng Holt ay maaaring isulat bilang mga sumusunod:

Ang pamamaraang ito ay nagpapahintulot sa iyo na isaalang-alang ang pagkakaroon ng isang linear na trend sa data. Nang maglaon, iminungkahi ang iba pang mga uri ng uso: exponential, damped, atbp.

Mga taglamig iminungkahi na pagbutihin ang modelo ng Holt sa mga tuntunin ng posibilidad na ilarawan ang impluwensya ng mga seasonal na kadahilanan (Winters P.R. Forecasting Sales sa pamamagitan ng Exponentially Weighted Moving Averages, 1960).

Sa partikular, pinalawak pa niya ang modelo ng Holt sa pamamagitan ng pagsasama ng karagdagang equation na naglalarawan sa pag-uugali pana-panahong bahagi(sangkap). Ang sistema ng mga equation ng Winters model ay ang mga sumusunod:

Ang fraction sa unang equation ay nagsisilbing ibukod ang seasonality mula sa orihinal na serye. Pagkatapos ng pagbubukod ng seasonality (ayon sa paraan ng seasonal decomposition Censusako) gumagana ang algorithm sa "purong" data, kung saan walang mga pana-panahong pagbabago. Lumilitaw na ang mga ito sa panghuling pagtataya (15), kapag ang "malinis" na pagtataya, na kinakalkula halos ng pamamaraan ng Holt, ay pinarami ng seasonal na bahagi ( index ng seasonality).