Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2016. június 20., hétfő

Anki - SM2 algoritmus-variánsa

.
Az előző ANKI blogposzt után felmerült egy sokkal-sokkal izgalmasabb kérdés. Mi legyen a flashcard kikérdezési -sorrend, alkalmazott -időintervallum két ismétlés között, -ismétlésszám etc.

ANKI-nál szépen dokumentált a dolog indoklással, milyen algoritmust használ és, miért. Maga az alapkérdés abszolút adatbányászatot is érintő interdiszciplináris feladat. Prediktálható-e tanulói szempontból opimálisan, azaz (a) jól, (b) minimálisan, (c) teljesen valamint (d) megbízhatóan a következő flashcard (mondjuk most így azonosítója) ANKI-ban?

Érdekes módon az ANKI "nem bízik" a tudományban. Noha már SM6-nál jár a supermemo-algoritmus, az ANKI-szerző az SM2- egy egyszerűsített ám  továbbgondolt, felhasználói inputtól jobban függő, algoritmus-verziót részesíti előnyben. Ne az algoritmus akarjon mindent kitalálni esetleg rosszul.

Így hirtelenjében végiggondolva, reálisnak tűnik az ANKI visszafogottabb hozzáállása. Hiába akarná támogatni az adatbányász énem az automatizáltan működő algoritmust, lássuk be, egészen egyszerűen, elvi alapon is, kevés a géppel olvasható input-infója bármilyen potenciális algoritmusnak, amiből jól meghatározható /szabályozható lenne dolog, nem látszik megspórolhatónak a felhasználói input.

Mégha a szoftver pontosan detektálná is a flashcard-ra adott írásos vagy szóbeli válaszunkat (ami önmagában lehetetlennel határosan nagyon nehéz kihívás még manapság is), akkor sem tudhatja semmilyen algoritmus milyen élmény volt bennünk a reagálás/recall, 100% vegytisztán algoritmikus úton.

Ha viszont kell a felhasználói input/kategorizálás, akkor nekem speciel se az ANKI, se az SM recall-kategorizálása nem tetszik. Az utóbbi valóban látszólag feleslegesen sok kategóriát tartalmaz, az ANKI viszont túlegyszerűsít ráadásul nem túl szimpatikus kategória-nevekkel. Számomra mintha a kettő között lenne a jó út (és hozzá sokkal-sokkal precízebb megnevezésű és tartalmú recall-kategórianevekkel). Mármint, hogy hogyan idéztük fel a flashcard-válaszokat.

Egészen egyszerűen a recall-kategorizálásnak, (a) triviálisnak, (b) automatikusnak, (c) jónak kell lennie, különben "nem ér semmit" (többe kerül a leves, mint a hús). Megkockáztatva, hogy érdemes lehet megfontolni a kikukázását a felhasználói inputnak, ha ez nem érhető el. Vagy jók (könnyűek és megbízhatók) a recall-kategóriák és akkor jöhetnek a szofisztikáltabb EF- és OF-kalkulálások (Easiness and Optimal factors) vagy szimplán ignorálni érdemes a felhasználói kategorizálást egyformának tekintve a tanulói recall-nehézségeket.

Azt azonban szigorúan rögzíteném, hogy a felhasználói input kidobása, csak és kizárólag ismétlési fázisban kéne kidobásra kerülnie és nem valamiféle vegyes kombinált tanulási-ismétlési fázisban.

Nagyon hajlok afelé, hogy a tanulást és ANKI-ismétlést nagyon is külön kéne kezelni és menedzselni. Megelőlegezve/megcélozva azt a bizalmat, hogy jól tanultunk korábban és ezért az ismétlés/recall már minden tanulási elemre konvergál a közel azonoshoz. Magyarán én a tanulásba fektetnék energiát és fókuszt (inkább ANKI nélkül, mint ANKI-val). Nem pedig egy kevert/zajos folyamatot próbálnék meg így-úgy optimalizálni. Egyszerűen elvi alapon sem látszik helyesnek ugyanis a dolog.

Az meg, hogy hogyan kéne tanulni ANKI-ismétlés elött mindenképpen egy külön poszt témája kell legyen.

Nincsenek megjegyzések:

Megjegyzés küldése