Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2013. november 14., csütörtök

Kép egy friss szövegbányászati monográfiából.

.
Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications

A fenti 1000+ oldalas hatalmas, fajsúlyos, 2012-es megjelenésű szakkönyv érdekes struktúrában tárgyalja a szövegbányászatot.
I: Szövegbnyászati alapok és elvek
II: Tutorialok (közel 30 db), ez a könyv legnagyobb része (kb.: kétharmada)
III. Haladó témák.

A három nagy kereskedelmi szövegbányászós szoftvert veszi alapul (sorrendben: IBM SPSS Modeler Premium, SAS Text Miner, Statistica Text Miner). Ez is közrejátszhatott abban, hogy relatíve olcsó a könyv ;) Mondjuk a Rapidminer és Knime vonatkozó moduljainak említése meg fájdalmasan hiányzik.

Van a könyv első lapjain egy remek ábra. Amikor ennyi információ van belesűrítve egy vizuálisan ütős ábrába, akkor meg tud lágyulni a legszőrős szívűbb olvasó is :)

Az ábra a szövegbányászat  fontos területeit hivatott összefoglalóan mutatni. Mondjuk a felső nyil értelmét nem tudtam így korán reggel azonosítani.


Nincsenek megjegyzések:

Megjegyzés küldése