Varianssin inflaatiokerroin (VIF) - yleiskatsaus, kaava, käyttö

Varianssin inflaatiokerroin (VIF) mittaa monikollineaarisuuden vakavuutta regressioanalyysissä. Regressioanalyysi Regressioanalyysi on joukko tilastollisia menetelmiä riippuvaisen muuttujan ja yhden tai useamman itsenäisen muuttujan välisten suhteiden arvioimiseksi. Sitä voidaan käyttää muuttujien välisen suhteen vahvuuden arviointiin ja niiden välisen tulevan suhteen mallintamiseen. . Se on tilastollinen käsite, joka osoittaa regressiokertoimen varianssin kasvun kollineaarisuuden seurauksena.

Varianssin inflaatiokerroin

Yhteenveto

  • Varianssin inflaatiokerrointa (VIF) käytetään havaitsemaan monikollineaarisuuden vakavuus tavallisessa pienimmän neliön (OLS) regressioanalyysissä.
  • Monikollinaarisuus suurentaa varianssia ja tyypin II virhettä. Se tekee muuttujan kertoimesta johdonmukaisen, mutta epäluotettavan.
  • VIF mittaa monikollinaarisuuden aiheuttamien paisuneiden varianssien määrää.

Varianssin inflaatiokerroin ja monikollinaarisuus

Tavallisessa pienimmän neliösumman (OLS) regressioanalyysissä monikollineaarisuus on olemassa, kun kaksi tai useampi itsenäinen muuttuja Riippumaton muuttuja Riippumaton muuttuja on syöte, oletus tai ohjain, jota muutetaan sen vaikutuksen arvioimiseksi riippuvaan muuttujaan (tulos) . osoittavat lineaarisen suhteen niiden välillä. Esimerkiksi, kun analysoidaan yritysten koon ja tuoton suhdetta osakekursseihin regressiomallissa, markkina-arvot ja tuotot ovat riippumattomia muuttujia.

Yrityksen markkina-arvo Markkina-arvo Markkina-arvo (Market Cap) on yhtiön ulkona olevien osakkeiden viimeisin markkina-arvo. Markkina-arvo on yhtä suuri kuin nykyinen osakekurssi kerrottuna ulkona olevien osakkeiden määrällä. Sijoittava yhteisö käyttää usein markkina-arvoa yritysten sijoittamiseen, ja sen kokonaistuotot korreloivat voimakkaasti. Kun yritys ansaitsee kasvavia tuloja, se kasvaa myös kooltaan. Se johtaa monikollineaarisuusongelmaan OLS-regressioanalyysissä. Jos regressiomallin itsenäisillä muuttujilla on täysin ennustettavissa oleva lineaarinen suhde, se tunnetaan täydellisenä monikollinaarisuutena.

Monikollinaarisuudessa regressiokertoimet ovat edelleen yhdenmukaisia, mutta eivät enää luotettavia, koska standardivirheet ovat paisuneet. Se tarkoittaa, että mallin ennakointiteho ei vähene, mutta kertoimet eivät välttämättä ole tilastollisesti merkitseviä tyypin II virheen kanssa tyypin II virhe Tilastollisen hypoteesin testauksessa tyypin II virhe on tilanne, jossa hypoteesitesti ei hylkää nullhypoteesia, jonka mukaan on väärä. Toisessa .

Siksi, jos muuttujien kertoimet eivät ole erikseen merkitseviä - ei voida hylätä t-testissä, mutta ne voivat yhdessä selittää riippuvan muuttujan varianssin F-testin hyljinnällä ja korkealla määrityskertoimella (R2), monikollinaarisuus saattaa olla olemassa. Se on yksi menetelmistä monikollinaarisuuden havaitsemiseksi.

VIF on toinen yleisesti käytetty työkalu sen havaitsemiseksi, onko regressiomallissa monikollinaarisuus. Se mittaa kuinka paljon arvioidun regressiokertoimen varianssi (tai keskivirhe) on paisunut kollineaarisuuden vuoksi.

Varianssin inflaatiokertoimen käyttö

VIF voidaan laskea seuraavalla kaavalla:

Varianssin inflaatiokerroin - kaava

Missä Ri2 edustaa säätämätöntä määrityskerrointa i: n riippumattoman muuttujan regressiolle muille. VIF: n vastavuoroisuus tunnetaan nimellä toleranssi. Joko VIF: ää tai toleranssia voidaan käyttää monikollineaarisuuden havaitsemiseen henkilökohtaisista mieltymyksistä riippuen.

Jos Ri2 on yhtä suuri kuin 0, jäljellä olevien itsenäisten muuttujien varianssia ei voida ennustaa i: n riippumattoman muuttujan perusteella. Siksi, kun VIF tai toleranssi on yhtä suuri kuin 1, i: tä riippumatonta muuttujaa ei korreloida jäljellä olevien kanssa, mikä tarkoittaa, että monikollinaarisuutta ei ole olemassa tässä regressiomallissa. Tässä tapauksessa i: n regressiokertoimen varianssi ei ole liian suuri.

Yleensä VIF yli 4 tai toleranssi alle 0,25 osoittaa, että monikollinaarisuus saattaa olla olemassa, ja lisätutkimuksia tarvitaan. Kun VIF on yli 10 tai toleranssi on alle 0,1, on huomattava monikollineaarisuus, joka on korjattava.

On kuitenkin myös tilanteita, joissa korkeat VFI-arvot voidaan ohittaa turvallisesti kärsimättä monikollineaarisuudesta. Seuraavassa on kolme tällaista tilannetta:

1. Korkeat VIF: t esiintyvät vain kontrollimuuttujissa, mutta eivät kiinnostavissa muuttujissa. Tässä tapauksessa kiinnostavat muuttujat eivät ole kolineaarisia toisilleen tai kontrollimuuttujille. Regressiokertoimet eivät vaikuta.

2. Kun korkeat VIF-arvot johtuvat tuotteiden tai muiden muuttujien voimien sisällyttämisestä, monikollinaarisuus ei aiheuta kielteisiä vaikutuksia. Esimerkiksi regressiomalli sisältää sekä x että x2 riippumattomina muuttujina.

3. Kun nuken muuttujalla, joka edustaa useampaa kuin kahta luokkaa, on korkea VIF, monikollineaarisuutta ei välttämättä ole. Muuttujilla on aina korkeat VIF-arvot, jos luokassa on pieni osa tapauksia riippumatta siitä, ovatko kategoriset muuttujat korreloineet muiden muuttujien kanssa.

Monikollinaarisuuden korjaus

Koska monikollinaarisuus paisuttaa kertoimien varianssin ja aiheuttaa tyypin II virheitä, on välttämätöntä havaita ja korjata se. Alla on lueteltu kaksi yksinkertaista ja yleisesti käytettyä tapaa korjata monikollinaarisuus:

1. Ensimmäinen on poistaa yksi (tai useampi) erittäin korreloivista muuttujista. Koska muuttujien tarjoamat tiedot ovat tarpeettomia, poistaminen ei vaikuta suuresti määrityskertoimeen.

2. Toinen menetelmä on käyttää pääkomponenttianalyysiä (PCA) tai osittaista pienimmän neliösumman regressiota (PLS) OLS-regression sijasta. PLS-regressio voi pienentää muuttujat pienempään joukkoon ilman korrelaatiota niiden välillä. PCA: ssa luodaan uusia korreloimattomia muuttujia. Se minimoi tietojen menetyksen ja parantaa mallin ennustettavuutta.

Lisää resursseja

Rahoitus on maailmanlaajuisen Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ -sertifikaatin virallinen toimittaja Certified Banking & Credit Analyst (CBCA) ™ -sertifikaatti on maailmanlaajuinen luottotietojen analyytikoiden standardi, joka kattaa rahoituksen, kirjanpidon, luottotutkimukset, kassavirta-analyysit , kovenanttimallinnus, lainojen takaisinmaksut ja paljon muuta. sertifiointiohjelma, joka on suunniteltu auttamaan kaikkia tulemaan maailmanluokan rahoitusanalyytikoiksi. Alla olevista lisäresursseista on hyötyä urasi jatkamiseksi:

  • Rahoituksen perustilastokäsitteet Rahoituksen perustilastokäsitteet Tilastojen vahva tuntemus on ratkaisevan tärkeää, jotta voimme paremmin ymmärtää taloutta. Lisäksi tilastokonseptit voivat auttaa sijoittajia seuraamaan
  • Ennustamismenetelmät Ennustamismenetelmät Suosituimmat ennustamismenetelmät. Tässä artikkelissa selitämme neljän tyyppisiä tulojen ennustamismenetelmiä, joita rahoitusanalyytikot käyttävät tulojen ennustamiseen.
  • Moninkertainen lineaarinen regressio Moninkertainen lineaarinen regressio Moninkertainen lineaarinen regressio viittaa tilastolliseen tekniikkaan, jota käytetään riippuvan muuttujan tuloksen ennustamiseen riippumattomien muuttujien arvon perusteella
  • Satunnaismuuttuja Satunnaismuuttuja Satunnaismuuttuja (stokastinen muuttuja) on tilastomuuttujatyyppi, jonka mahdolliset arvot riippuvat tietyn satunnaisen ilmiön tuloksista

Uusimmat viestit