Aðfallsgreining
Línuleg aðfallsgreining (e. linear regression analysis) eða aðhvarfsgreining (e. Regression analysis) er notuð til að lýsa og meta tengsl á milli einnar háðrar breytu (dependent variable) og einnar eða fleiri óháðra breyta (e. independent variables) eða skýribreyta (e. regressors/explanatory variables).
Það er sterk hefð fyrir því að kalla háðu breytuna Y og skýribreyturna X. Ef að skýribreyturnar eru fleiri en ein eru þær kallaðar X1 X2 …… Xn.
Efnisyfirlit |
[breyta] Tilgangurinn með því að nota línulega aðfallsgreiningu
Aðfallsgreining er notuð í þrenns konar tilgangi:
- Hún er notuð til að athuga hvort tilteknar skýribreytur X hafi marktæk áhrif á Y. Við gætum t.d. haft áhuga á að svara því hvort menntun, þ.e. fjöldi ára sem fólk hefur menntað sig hafi áhrif á tekjur og aðfallsgreining getur svarað þessari spurningu fyrir okkur.
- Til að athuga hvaða áhrif það hefur á háðu breytuna Y þegar ein eða fleiri skýribreyta breytist. Við gætum t.d. notað aðfallsgreiningu til að svara því hve mikið tekjurnar breytast (væntanlega hve mikið tekjurnar hækka) þegar fólk bætir einu ári við menntun sína
- Aðfallsgreining er notuð til að spá fyrir um gildi á Y fyrir tiltekin gildi á skýribreytunum. Á sama hátt getum við spáð fyrir um tekjur einstaklings með 20 ára nám að baki með því að nota aðfallsgreiningu.
Ef að við höfum ástæðu til að ætla að tiltekin jafnbila breyta eins og menntun hafi áhrif á aðra jafnbilabreytu eins og laun og ef að við höfum jafnframt ástæðu til að ætla að sambandið þarna á milli sé línulegt þá blasir við að nota aðfallsgreiningu til að leita svara við því hvort menntun hafi áhrif á laun og hve mikil þau séu.
[breyta] Fullkomið línulegt samband
Við gefum okkur að sambandið á milli breytanna sé línulegt þegar við notum línulega aðfallsgreiningu til að svara spurningunum eins og hefur menntun áhrif á laun? Þetta felur í sér að við gefum okkur að sambandi X og Y sé rétt lýst með formúlunni:
<math>Y= \alpha + \beta X</math>
Þessi jafna lýsir háðu breytunni Y sem línulegu falli af skýribreytunni X og samkvæmt henni er sambandið á milli X og Y fullkomið. Þegar línan sem fellur að þessum gögnum er metin sést að fyrir hvert gildi X er aðeins eitt gildi á Y mögulegt. Þetta er kallað fullkomið (e. exact) eða löggengt (e. deterministic) samband á milli breyta. Stuðlarnir <math>\alpha</math> og <math>\beta</math> ákvarða hæð og halla línunnar. <math>\alpha</math> kallast skurðpunktur (e. intercept) og hann segir til um gildi Y þegar X er 0. <math>\beta</math> er hallatala línunnar (e. slope) og hún segir til um hversu mikið Y breytist þegar X breytist um eina einingu. Þegar að X breytist um eina einingu þá breytist Y um <math>\beta</math> einingar. Ef að Y=10.000X þá er hallatalan <math>\beta =10.000</math>, þ.e. fyrir hverja einingu upp X-breytuna er farið 10.000 einingar upp Y-breytuna. Hallatalan gefur þar af leiðandi til kynna hve mikil áhrif X hefur á Y því að hún segir til um hve hratt Y breytist þegar X breytist um eina einingu (e. rate of change).
[breyta] Ófullkomið línulegt samband
Ólíkt fullkomnu sambandi milli tveggja breyta þá er ófullkomið samband (e. inexact) það þegar ekki er unnt að draga beina línu í gegnum alla punktanna líkt og hægt var þegar sambandið á milli breytanna er fullkomið. Þegar að sambandi á milli tveggja breyta er ófullkomið þá er ekki einungis eitt gildi á Y mögulegt fyrir tiltekið gildi á X heldur mörg. Þar af leiðandi er ekki hægt að segja til um gildi Y með fullkominni vissu heldur er einungis hægt að spá fyrir um það með tilteknum líkum og sú spá felur ávalt í sér einhverja villu. Jafnan sem lýsir sambandi þessara breyta er því á forminu:
<math>Y= \alpha + \beta X + \epsilon</math>
[breyta] Hvað ber að hafa í huga
Línuleg aðfallsgreining virkar einungis ef gögnin eru línulega aðgreinanlegir (þ.e. að hægt sé að aðskilja gögnin í tvo hluta með því að draga beina línu í gegnum þau).
Þessi gögn er hægt að framkvæma línulega aðfallsgreininu á.
Hér er hinsvegar ómögulegt að aðgreina gögnin með því að draga eina línu sem aðskilur þau.
[breyta] Aðrar leiðir til að línulega aðgreina gögn
Stigulaðferð (e. gradient descent) ekki rétt staðsetning?!
Texti að stórum hluta fenginn af: [1]
--Hrafn Þorri 14:35, 5. október 2005 (GMT) Er þetta copyrighted texti??