Gervitauganet

Úr ISIRWiki, frjálsu upplýsingasafni ISIR
Stökkva á: flakk, leita

Tauganet (e. Artificial Neural Net, ANN) er marglaga skynjunarnet (e. Multilayer Perceptron). Tauganet tilheyra stærri flokki gervigreindar sem kallast vélræn þekkingaröflun (e. machine learning).

Ein af margskonar útfærslum af marglaga tauganeti

Hugmyndin um tauganet er upprunin úr rannsóknum á því hvernig mannsheilinn virkar, þ.e.a.s. hvernig hægt er að smíða stóra og aðlögunarhæfa ákvörðunarmiðstöð með því að sameina ógrynni einfaldra ákvörðunartaka/skynjara (í heila taugaþræðir). Tölvunarfræðin hefur þó ekki alltaf beinan áhuga á að kanna eða skilja nákvæmlega hvernig mannheilinn virkar heldur vilja tölvunarfræðingar nota þessa tiltölulega einingaskiptu og "einföldu" hönnun til að smíða vitrænar vélar. Hafa þarf í huga að g-tauganet og líffræðileg tauganet eru oftar en ekki mjög frábrugðin hvoru öðru. Því þarf að fara sérstaklega varlega í allar útskýringar og samlíkingar.


Efnisyfirlit

Grunneining tauganeta

Skynjarinn (e. Perceptron) er grunnvinnslueiningin í tauganetum. Sigmoid fall er oftast notað sem færslu fall (e. transferfunction) í skynjurum.

Almenna hugtakið 'skynjari' er notað yfir ANN á þann hátt að einn perceptron getur sagt já/nei við ákveðinni spurningu (eða flokkun). Uppbygging þessa skynjara er svo mismunandi (hvort sem þeir eru net af taugungum eða einungis ein einföld sigmoid function, o.þ.h.). Skynjari hefur skilgreind inntök og úttök og getur svo haft n-mörg falin lög sem liggja á milli þeirra (e. multilayer perceptron).


Marglaga tauganet

... (e. multilayer perceptron)

Þjálfun tauganeta

Það er til tvennskonar meigin aðferðir við þjálfun tauganeta: umséð þjálfun (e. supervised) og óumséð þjálfun (e. unsupervised).

Umséð þjálfun. Yfirleitt er líftíma tauganetsins þá skipt i tvö stig: þjálfunarstig og notkunarstig. Í þjálfunar stiginu er venjulegt fall (e. fitness function) notað til að sjá hversu nálægt útkoma tauganetsins er miðað við æskilega útkomu sem þjálfunargildin gefa. Með öðrum orðum þá eru tauganet oft (ekki alltaf) notuð þegar vitað er hver útkoman á að vera og þau þjálfuð í samræmi við það.

Afturvirk útbreiðsla er síðan notuð til að leiðrétta lóð (e. weights) tauganetsins svo það nálgist æskilega útkomu meira. Þegar þjálfunarstiginu lýkur þá eru lóð tauganetsins skorðuð af og ekki breytt aftur í notkunarstiginu.

Óumséð þjálfun. Oftast er þá notast við Hebbian lærdómsregluna sem í stuttu máli er: virkir taugunar tengjast saman. ("Neurons that fire together, wire together").

fyrir hvern taugung þá
fyrir hvern taugasíma taugungs þá
ef taugungur símans er virkur og þessi taugunur er einnig virkur þá
auka vægi símans (e. increase synapse's weight)
annars
minnka vægi símans (e. decrease synapse's weight)
lok
lok
lok

Ofmátun og vanmátun þjálfunargilda

Ofmátun (e. overfitting) er ástand sem myndast þegar tauganetið hefur verið þjálfað of lengi með sömu gögnunum. Ofmátun lýsir sér í því að tauganetið hættir að geta flokkað á réttan hátt önnur inntök en nákvæmlega þau sem það hefur áður séð í þjálfunarfasanum. Þ.e.a.s. netið hættir að geta alhæft út frá reynslunni (e. generalize). Mesta hættan er á að ofmátun eigi sér stað þegar þjálfunarsafn er of lítið (of fá stök) eða ef það er of einsleitt (ef dæmin eru fá eða þau öll eru nánast eins). Það sem gerst hefur í netinu við ofmátun er það að vigtarvektoriarnir (w_x) hafa náð of nákvæmum gildum og tauganetið tekur mið af niðurstöðu (flokkun) sem er byggð á of fáum svörum.

Vanmátun (e. overgeneralization) kemur fram þegar tauganetið lærir ekki af þjálfunargildunum og þar af leiðandi segist það þekkja hvaða gildi sem er jafnvel þótt ekkert svipað gildi hafi nokkurntíman verið gefið til þjálfunar.

Tegundir g-tauganeta

Skipta má gervitauganetum niður með ýmsum hætti:

- Eftir notkun:
Flokkun (Classification),
Klössun (Clustering),
Nálgun falls (Function approximation),
Spá eða áætlun (Prediction)
- Eftir tegundum innri tenginga:
Statísk (Feedforward),
Dýnamísk(Feedback)
- Eftir grannfræði:
Einnar lags,
Fjöllaga,
Hálf/full Endurlaga (Limited/fully recurrent),
Sjálf-skipulögð
- Eftir Þjálfunaraðferð:
Leiðbeinandi (Supervised),
Sjálfstæð (Unsupervised)

Algengast er að einingar tauganeta sé raðað upp þannig að upplýsingarnar fari í eina átt, svonefnd feed-forward net, sem líta þá út eitthvað í þessa veru:

HÉR VANTAR MYND

Hér er FF net með 4 inntakssellum 2 úttakssellum og 3 sellum í falda laginu. Allar sellur senda til allra sella í næsta lagi fyrir ofan.

Tauganet af þessu tagi eru statisk líkt og sérhæfð tauganeti í auga, eftir að þau hafa lært verður þeim ekki auðveldlega breytt. Þau hafa það sem líkja má við langtíma minni en ekkert skammtímaminni. Þau hafa hins vegar mjög mikla aðlögunarhæfni og geta túlkað gögn sem þau hafa aldrei séð áður. Ef reynt er að bæta við "þekkingu" netanna eftir þjálfun, kemur upp staða sem nefnd er “catastrophic forgetting”. Eina leiðin til þess að þjálfa þau aftur t.d. þegar ný mynstur koma upp sem það getur ekki túlkað, er að bæta þeim við fyrri upplýsingar og þjálfa netið frá grunni (sjá kafla hér að ofan).

Notkun Tauganeta

Tauganet eru t.d. notuð til að flokka/þekkja (e. classification) og við línulega aðfallsgreiningu (e. linear regression). G-tauganet hafa þó mjög vítt notkunarsvið þar sem um er að ræða örsmáan heila sem hægt er að þjálfa til að sinna ýmsum verkum.

Innlend fyrirtæki

Tenglar
Nafnrými
Útgáfur
Aðgerðir
Flakk
Verkfæri