Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2010. július 21., szerda

Adatbányászat és PhD keresztezése



Mottó: Egyre többet tudunk egyre kisebb(specifikusabb) dolgokról, aminek természetes extrapolációja, hogy a végén mindent fogunk tudni a semmiről...


Miért szerezzek doktori fokozatot? Mi lesz utána?

Inspiráló blogpost jelent meg tegnap délelött, szakmai társblogon. Azóta próbálom többszöri nekifutással rendszerezni és valamennyire normálisan formába önteni tárgybeli gondolataimat. Nem mondanám, hogy hiánytalan és megnyugtató sikerrel jártam, de egy első körös draft verzióra rányomtam a sendet. :o)


BEVEZETÉSként annyit mindenképpen szeretnék jelezni, hogy

* a társblogon publikálóktól eltérően, mint ugyan szintén egyetemet végzett, de se (rendszerváltás elötti világ szerinti) kisdoktori/kandidátusi, se PhD tudományos fokozat vonzáskörzetbe sose nem került emberként írom az alábbi soraimat. Mondhatni a dilettánsok bátorságával és be nem avatottságával, de ugyanakkor kívülállóságával.

* hasonlóan az "adatbányászat és etika" témához ezt a témát is szeretném tágabb kontextusban, felülről-lefelé haladva végiggondolni.

* alapvetően külön kéne választani az üzleti kutatást (vállalatok finanszírozzák, piaci kontroll alatt) és a 'publikus' akadémiai kutatást (közpénzen finanszírozódik, eseti adhoc külső tőkével kombinálva, (reflexív) önkontroll alatt). Nyílván érdemes lehet e szétválasztás mentén is firtatni érdekesebb aspektusokat, de ez most nem célom ebben a postban.

* alapvetően külön kellene választani a magyar és nemzetközi PhD-k megközelítését. Ami nálunk van az specifikusan terhelt (1) a rendszerváltás elötti múlttal, (2) országnagyság, -erő miatt merülhetnek fel más szempontok is PhD-képzés meg -érték terén. Az alábbi postban viszont ilyen irányba szintén nem térnék ki részletesebben.

* és persze érdemes lehetne az adatbányász-specifikumokat megnézni a PhD-zés szempontjából. De ezt is csak nagyon érintőlegesen teszem.


PROBLÉMA FELVETÉSE: milyen is a tudományos (azon belül kutató adatbányász) élet egy külső szemlélőnek?

* Az én olvasatomban a ma tudományos kutatása egyre inkább elszakad a valóságtól, és hozzá egyre kevésbé van érdeklődő/értő közönség. Ennek két látványos jele:

1. Intellektuális imposztorok
Benne a híres fejezettel, hogy a két szerző fizikus hogyan publikált egy neves szaklapban egy direkte teljesen értelmetlen tanulmányt, ami minden szűrőn átment (nyomtatásban megjelent)

2. "Brittudósok" búlvár-posványa. Erről már megemlékeztem itt a blogon, most nem veszem elő ismét.

* A régmúlt polihisztorsága és a ma tudományos káosza között nagyon hiányzik egy fontos lépcső az egyetlen emberen ugyan túlmutató, de a káosznál koherensebb összefoglalás, tudományterületenként.

* Mi a tudományos kutatás célja? Lényeges, hasznos, tovalendítő, nagy problémán dolgozni, hozzáadott értéket képezni? Vagy inkább a publikálás, a kéz kezet mos alapú impaktfaktor-menedzselés, a leadminisztrálás, a patinás akadémiai székbe való beleöregedés a cél? És hozzá gyártani a problémát (esetleg megoldással), amit esetleg senkit nem is érdekel? Betűket ontani? Mindezt erőforrás-szétforgácsoló és/vagy rejtett párhuzamosságokkal, redundanciákkal, a hatékonyság és hasznosság egyre nagyobb eliminálásával? Presztízs? Hatalom? Pozició? Hasznosság? Helyes önértékelésre alapozás? Alázat? Miről szól inkább az egész történet?

* Mennyire cél a meglévő tudást aggregálni, jól kereshetővé tenni, közösségi kontroll alá vonni, nyitottá tenni?

* Mekkora a lényeges és felesleges kutatás aránya? Az én olvasatomban kvázi végtelen sok (és csak nő és nő) a művi/gyártott probléma, meg a rájuk elpazarolt pénz és energia. Aminek visszacsatolásos fékentartására itthon előszeretettel alkalmazzák a divatos, de leginkább kártékony módszert, a fűnyíró elve menti költségcsökkentést.

* Én még értelmes hozzászólást nem láttam abban a témában, hogy egy Magyarországnak hány PhD-ző/PhD-zett kutatóra van szüksége, egészségesen? És mennyiért, mi várható el tőlük reálisan, tervezhetően? Vagy a probléma annyira "nyitott végű", hogy egy szót sem érdemel?

* Mennyire van tér a kretivitás kifutásának, vagy éppenhogy mennyire fuldoklik a kötelező terhek súlya alatt?

* Mennyi a jól feltett kérdés aránya az össze feltett kérdések között?

* David Hilbert a múlt század elején felállt egy konferencián és egy évszázadnyi kutatásra elegendő nehéz, de laikust is lenyűgöző problémát vázolt előadásában. Vagy felemlíthetném Erdős Pál híres, saját pénzzel fínanszírozott, nagy kérdéseit/problémáit, meg "nagy könyvét" a matematikáról. Mintha mára eltüntek volna a nagy kérdések. Helyükre kismilliárdnyi, apró, sokszor senkit nem érdeklő kérdés került, főleg a kutató tevékenység "lepapírozására".

stb.


MEGOLDATLAN KÉRDÉSEK lajstromozása:

* Hogyan minősítődjenek a cikkek -> közösségi értékelés, netán feketelista képzéssel, kontraszelekció-ellenes és/vagy publikációs zajcsökkentés célzattal. Egy cikk hasznossága nem abban van, hogy impact-faktort növelhet, hanem, hogy az érdeklődőnek az elolvasás fáradtsága megérte-e. Egy ember relatíve nagyon kevés cikket tud elolvasni a teljes életében

* Közösségi kontroll erősítése dialógusokban való támogatandó részvétel. Erre egy szerintem jó hazai példa az én olvasatomban a Szkeptikus Társaság az önjelölt "parazsenik" és a kutató szféra között.

* Adott kutatási téma, taxonómiába szervezése, információs felaggregálása, ha szükséges akkor moderálása, karbantartása, naprakészen tartása, nyitott kérdések súlyozott nyílvántartásával (izgalmasság vs. nehézség vs. perspektivikusság etc. szempontok alapján), a közösségi erőforrások valamint kontroll jegyében, párhuzamosságok, felesleges overheadek elkerülésének céljával, akár alulról felfelé, akár felülről lefelé is haladva.

* A mennyiséghez képest nem elég sokszínű az én olvasatomban a kutatói társadalom (hierarchiája). A rendszerezést és tapasztalatokra építést sokkal jobb alapokra is lehet helyezni, mint hogy nagy százalékban redundáns könyvek ezrei jelennek meg folyamatosan. Érdemes megnézni, hogy "data mining" címén mi az amazon.com könyvajánlata, a múltra és a jövőre egyaránt. Még a címek elolvasásába is belefárad az ember.

stb.


(SZEM)PONTOK, szubjektív alapon, egy virtuális PhD-ző felé

* Az ideális kutató az én felfogásomban, kezdetben egyedül és/vagy közösségben és/vagy hierarchiában is jól tud dolgozni/kutatni. Míg idősebb korára viszont pozitív inspirációt adni, motiválni, tapasztalatot/tudást átadni/tanítani/megírni, embereket (minél többszörös áttéttel) vonzani tud. Akire figyelnek, aki szavainak súlya van.

* Legyen varázslatos előadó és/vagy író: szakma felé is, laikus külvilág felé is. Hogy mire is gondolok: pár név elhúnyt nagy tudósaink közül: Öveges József, Simonyi Károly (fizika), Scharnitzky Viktor, Nemetz Tibor (matematika). Vagy napjainkból Babai László. Ha a laikusok bevonását nézzük, akkor friss és látványos példa Albert-Barabási László könyvei.

* Helyes (őszinte és pontos) önértékelés elvégzése. Hol helyezkedik el az ember a közösségben, a tehetsége, a képessége alapján, mire lesz elég az ereje.

* A jó kérdések feltevésének tökélyrevitele.

* A mérhető és kontrollálható, számonkérhető dolgok favorizálása, kezdetben versenyeken indulni, későbbiekben versenyt szervezni.

* Az idő helyes kezelése (time-management értelemben).

* Ha van család, akkor szerepének helyes megtalálása. Ne gát legyen. Meg ne kötelező mutatvány/nyűg, hanem inspiráljon, erőt adjon... Ez persze általában véve is (alaptémától függetlenül is ) igaz, de attól még hangsúlyozandó, szvsz.

* Pénz helyének megtalálása. Ésszerű megélhetés illetve pénzcsinálás kontextusának definiálása. A lokális hazai/nemzeti viszonyok figyelembevételével.

* (Anyagi) függetlenség. Ellenállni mind a Google-szerű erődemonstráló pusztító módon lerabló (multis) hiénáknak, mind a kutatói szférában kívűlállónak is érzékelhető kicsinyes koncon marakodásnak.

* Nyelvtanulás szerepének értékelése. Hány nyelvet, milyen szinten, hogyan használva/karbantarva. A Google egyes állásait már PhD-hez szereti kötni, implicit megkövetelve a két nyelv tudását, amit esetleg nem is kell a munkához használni. (Ez az én olvasatomban a munkavállaló energiájának óriási pazarlása: az egyre nagyobb Google és egyre kiszolgáltatottabb munkavállaló kontextusában. A tendencia az, hogy az az ideális jelölt, aki egészséges, nem akar családot, bagóért jön dolgozni, huszonegykét éves, frissen (akár lehetőleg PhD-)diplomázott, de sok éves tapasztalata van már. Egy-két év lerablás után lehet tőle megválni)

* Naprakészség ösvényének megtalálása a világ történéseit illetően. Hogyan, milyen zajszűréssel, mekkora energiával legyen a kutató up-to-date.

* A megfelelő tanár/mentor választása. Ez annyira triviális, hogy különösebben nem is ragoznám. Azt megjegyezném, hogy talán itt is igaz, hogy madarat tolláról... Van mentor, akinél a cím és pozició jön össze könnyedén esetleg identitásilag nehezen vállalható tevékenységek révén. És nemes ellenpéldakánt létezik ez Erdős Pál nevéhez köthető "Erdős-szám" játék. Nem lehet kérdés melyik a rokonszenvesebb.

* Jó kutatásirány megtalálása. Hasznosság, (életre szóló) érdeklődés, tehetség hármasára optimalizálva.

* Egész életre kitartson a munkakedv, energia, lendület, kutatói izgalom a befásulás ellenében. A vicc kategóriája, hogy ezt a pontot le kell külön írni, de a saját tapasztalatom vezérel ebben.

* Kutatói munka overheadjének minimalizálása. Sok felesleges dolgot kényszeríthet az emberre az élet, a felettes, olykor az ember saját hülyesége. Olykor már-már az lehet az érzésünk, hogy az idő haladtával egyre többet. Ez mind-mind az idő értékes hányadát, energiát és a munkakedvet roncsolja.

* A közösség helyes kontextusának megtalálása. Még ha az értékes kutatás is, még manapság is, produkál kírívó aszkézist: Poincaré-sejtés orosz tudósa.

* Közösségi tevékenység, kezdve avval, hogy egy-egy jó/segítő szó kollégának (ez sem triviális, sajnos), konstruktív és nem öncélú szociális háló, blog/fórum/honlap -> web1, web2, webN, ahol 'N' végig fut a természetes számok értelmezhető készletén :o). A későbbiekben (tan)könyvírás, ami szólhat mind a szakmának, történhet beavató céllal az átlagembernek.

stb.

2 megjegyzés:

  1. Mint az inspiráló poszt szerzője, elsősorban a problémafelvetésekre reagálnék, mert elég negatív színben tünteti fel a teljes kutatói világot.

    Egyetértek azzal az állítással, hogy a tudományos cikkek jelentős része csak a publikációs lista növelését szolgálja és biztosan nem egészséges, hogy naponta(!) több mint 20 ezer tudományos cikk jelenik meg. Azt hiszem, hogy itt is igaz az a tétel, hogy az emberek 10%-a produkálja az értékes eredmények 90%-át, de lehet hogy 5-95 vagy 2-98 az arány. Viszont azt semmiképp nem szabad elvitatni, hogy az a néhány százalék óriásit lendít előre a világon, lényeges ügyekben.

    Épp tegnap böngésztem a KDD innovációs díjat megkapók listáját az alábbi linken, ahol mindenkiről rövid leírás volt. Ezek az emberek olyan eredményeket adtak a világnak, amik most többmillió informatikai és egyéb rendszer alapját képezik.
    http://www.kdd.org/awards_innovation.php

    Valóban hatalmas a jel/zaj arány a publikációkban, de pont ezért fontos a hitelesség és a hírnév tudományos körökben, akár az egyes kutatók, akár a konferenciák, folyóiratok szintjén. A problémát itthon abban látom, hogy nagyon kevesen publikálnak ezekre a hiteles, kiemelt fórumokra és így kiesnek a terület nemzetközi elitjéből. Ha ez azért van, mert tényleg a világ mögött járunk, akkor az szomorú. Ha viszont csak az önbizalom és tapasztalat hiányából fakad, akkor ezt ideje elkezdeni fejleszteni...

    VálaszTörlés
  2. Jogos kiegészítés, örülök neki. :o)

    VálaszTörlés