Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2017. május 4., csütörtök

"Házasság első látásra"

.
A társválasztás és adatbányászat keresztezése klasszikus és időben talán legelső nagy - posztokon átívelő - témája ennek a blognak. Íme az előzmények:

Társkeresés és adatbányászat témát érintő blogpostjaim:
Társkeresés adatbányász alapokon
Társkeresés - Numerátorok
Dr. Helen Fisher mint a szerelem "brittudósa"?
Dr. Helen Fisher kérdőíve társkereséshez
Dr. Helen Fisher - Zárszó
Társkeresés adatbányászati támogatással
Beszéd, mint a sikeres párkapcsolat prediktora?


Az RTL-n most indult egy külföldről adaptált egy olyan címbeli valóságshow, aminek homlokterében az a speciális szituáció áll, hogy férfiak és nők úgy házasodnak, hogy az esküvő napján az anyakönyvvezető elött, közvetlenül az "igen" kimondása elött látják először egymást.

Na ez egy újabb dimenziót ad annak az engem 8+ éve foglalkoztató alapproblémának, hogy lehet-e tudományos eszközökkel "kívülről" támogatni párok egymásratalálási folyamatát.

Úgy tűnik a népek vevők az új show-ra (abban az értelemben, hogy foglalkoznak a dologgal), az indexes comment.blog.hu is rácuppant a témára, rövid időn belül már három rövidebb-hosszabb blogposztot is publikálódott sixx-től, generálódott hozzájuk lassan 200-hoz közelítő komment is. Már csak az a kérdés, hogy lesz-e belőle "hogyvolt". :)
2017.május 8-án kiderült íródik a hogyvolt is, Jean Moriarty által:
1x01-02
1x03-04

Két alapvető aspektusa van a témának (nézőpontomból):
(1) E blogot érintő adatbányász-szakmai
(2) Tévés és egyéb körítéses

Az utóbbi tévés aspektussal kezdem, hogy gyorsan túl lehessek a kötelező és számomra kevéssé érdekes/releváns ám nem megspórolható körökön.

* Szabad-e így házasodni?
- Sixx első témabeli posztjához rögtön politikát kapcsolt bulváros felcsigázás mentén "Semjén Zsolt legvadabb rémálma". Alapvető módon befolyásolva ezzel a rákövetkező kommentfolyamot is. Magam részéről nem tudom, sőt nem is fogadnék rá nagy pénzben, hogy paláver-szinten veri-e ki a biztosítékot Semjén Zsoltnál. Igaz, én a boltzáras történet megtapasztalt lefolyására sem tettem volna fel egyetlen lyukas garast sem, aztán mégis megéltük úgy ahogyan az megesett. Szóval nem releváns a politikát érintő véleményem.
- Én magam azt gondolom, nemhogy szabad, meg nem látni hozzá semmi akadályt (korrekt ügyrendezés mellett csak természetesen). De azonban ellenben viszont az esküvőt megelőző előzetes 30 napos kötelező adminisztatív kűrt is eltörölném, annyira idejétmúlt felesleges atrocitás a nemzettesttel szemben.

* Lehetséges-e előzetesen előírt 30 napos követelmény mellett hitelesen leforgatni az egész valóságshowt, póriasan fogalmazva ordas nagy kamu-e az egész?
- Egyfelöl az FB-n van olyan jogi vélemény, hogy a szereplők RTL-es szerződéskötése nem tartalmazhat alanyi jogról való lemondást (családjogi szerződés kapcsán történő szabad véleménynyilvánítás joga). Ahogy szerzői jogról sem mondhat le szerző semmilyen szerződésben, merthogy a szerző intakt tartozéka a saját szerzői joga. Szóval, hogy per definitionem kamu.
- Másfelöl látott már olyat a világ, hogy a jogot megkerüli a világ. A világnak a legelkerekedettebb szeme láttára. Ehhez csak egy picit kell körülnézni például a magyar közélet valóságshowjában. ;) Szóval tőlem símán lehet, hogy nem kamu, minden jogi csürcsavarás/kockázat ellenére sem.

* Komoly-e házasság?
- Az ötletfelvetés számomra egészen biztosan, különben nem lenne ez a blogposzt sem, ugye. :)
- Minden más nyitott kérdés az "igen" és "nem" két véglete által átölelt teljes spektrumon, másképpen fogalmazva nem tudom.
- Elvben valóságshow-s pénzkeresési céllal símán bevállalható a dolog, relevánsabb hátrány nélkül, azaz ha már valaki bevállal egy valóságshow-s szereplést, akkor már nem kell osszon-szorozzon egy házaságkötés (és válás).

* Jó műsor-e, nézhető-e?
- Az első adást láttam, ennek alapján számomra nézhetetlen. Letöltés után, többszöri megszakítással, nagyon kis adagokban, ámde pörgetés nélkül végül is abszolváltam a teljes megnézést.
- Halálra idegesített az egész cucc, én feszengtem a legjobban, nem a szereplők.

* Jó ötlet-e valóságshow-val fertőzni magát az alapgondolatot (házasodás nulla kapcsolati-előzménnyel)
- Számomra, amennyiben komoly és nem Ranschburg Jenős "Családi kör" típusú cucc az egész, akkor az intimszféra megsértése (így nem vagyok rá kiváncsi).
- Ráadásul a tévé kikerülhetetlenül ab ovo torzít a megjelenítés során, bármiféle érdemi elemzést alapvetően tönkretevő módon.
- Hiába no, nem vagyok edzett, sosem bírtam a műfajt. A Virtuózokban is sok más mellett pont a valóságshow-s feelinget nem bírom. Nem valószínű, hogy megnézek még egy adást.

* Scripted-e a reality?
- Én a "nem"-et tippelném magamtól.
- Egyetértek sixx-szel, hogy előbb-utóbb kibukna a méteres kékeres lóláb, ha ekkorát kamuzna összeesküvés jelleggel az RTL. Amit el tudok képzelni az a minimális direkt belenyúlás, minden más "hangulatfokozást", "érdeklődésfenntartást/-generálást" a castingra, interjúkra, vágásra hagyva.
-  De fogadni tuti nem fogadnék rá vagy ellene.

* Ezek az "RTL-szervezte" házasságok mennyire lesznek hosszúéletűek?
- Az amerikai - AI/MI inspirálta kapcsolatos - visszamérések jelentős eredményeket mutatnak, életképes, növekvő piacot generáltak. De ott nyilván:
(1) Jóval nagyobb merítési méretek (már évekkel ezelött is 1.6 milla, csak a Chemistry-ben)  vannak a magyarhoz képest, pláne a jóval szűkebb RTL-valóságshow szintjén, ahol van 8 pár így-úgy összerakva. Lássuk be a legjobb ki sem talált algoritmus is azonnal felteszi mindkét kezét... ;)
(2) Amcsiban nincs valóságshow-körítés, az egész megmarad az intimszférában. Ráadásul házasság sem kötelező, mint az RTL-nél.
(3) Nem kell rögtön az első körben győzni: csak annyi a cél, hogy esélyesebb jelöltek rendelődjenek össze. Míg az RTL-nél nehezen hisszük, hogy a résztvevők újabb esélyt kapnának: maximum egy második évadban... :DDDD
(4) Ne felejtsük el, hogy mi magyarok gyakran kapjuk az ívet, hogy túlzottan egyénieskedők vagyunk. Amire csak erősíthet opcionálisan a túlzásbavitt válogatás, horribile dictu "felüllövés" az igényekben.
(5) Ismerve az RTL meg a valóságshow lelkivilágát, működését, kötve hiszi az ember, hogy prioritás volt a kapcsolatok hosszútávú sikeressége. A pénz, reklám, marketing más követelményeket támaszt a sztori-eladhatóság mezsgyéjén. Magyarán szakmai szempontból túl nagy következetéseket én nem vonnék le az RTL-es cucc kapcsán.
- Szóval én egyetlen tévéshow-s házas kapcsolatra sem tennék nagy pénzt, szemben az amcsis verzióval (ahol viszont igen).

És akkor ta-da-dam, jöjjön a lényeg, a tárgyat illető domain-specifikus szakmázás. :)

Elöljáróban a most idetévők számára írom, hogy nem kell (túl)misztifikálni, meg csodaszernek látni az egész AI/MI-s alapú társkeresést. Mindösszesen annyiról van szó (de ennyiről viszont igen), hogy sokszor eleve nagyon alacsony sikeres perspektívájú pártalálási valószínűségeket próbál javítani matematikai eszközökkel. Kiszórja a relevánsan esélytelen összerendeléseket, a nagyobb valószínűséggel bíró párjelöltek közé esélyesebbeket próbál tenni. Az egész adatbányászat általános célja is ebben ragadható meg leginkább. Semmi extra, ennyi....

Van a Földön 3.5-3.5 milliárd fickó illetve csajszi, egyenként sokszor meglehetősen bonyolultan komplex - ám számok nyelvére is leképezhető - lélekkel. Közülük sokan szerethetnek párosodni, mitöbb sokan meg is tették a múltban, jó sok tapasztalat-tömeget generálva. Mindez ideális terep elemzésre a "big data"-fanatikus adatbányásznak, mivelhogy a data mining/science arról szól, hogy nagytömegű adatban kell rejtett mintázatot találni, például osztályozási(vagy speciálisan prediktálási) célzattal.

A téma nekem kétszámjegyű éves fixa ideám (és az adatbányászat csak erősített ebben, meg plusz löketet adott), amikor még híre sem volt legalábbis itthon a dolognak. Ma már elmondható, hogy Amerikában is sokan csinálják (pl.: eHarmony, Match, Chemistry, 4-500 kérdéses kérdőívvel!!), de itthon is (elsőként talán a Randivonal kísérletezett vele). Kell-e erősebb bizonyíték mindehhez, hogy képes voltam egy valóságshow-epizódot pörgetés nélkül végignézni az ügyben. :DDDD

Kérdés milyen magyarázóváltozók alapján mennyire hatékonyan lehet előrejelezni egy párkapcsolat sikerességét (feltéve, hogy ez a cél, nem pedig teszemazt például egy jólsikerült egyéjszakás kaland, ami szintén lehet valakinek valós releváns [szűkített] scope).Mindehhez "csupán csak" pár dolog kell
(1) kérdőívvel fel kell mérni a párkapcsolatra-kandidálókat,
* akik egyrészt fizetnek sokszor ezért a lehetőségért,
* másrészt érdekük az őszinte válaszadás,
* harmadrészt nehéz "meghackelni" egy komoly kérdőívet, mivel nincs "jó" és "rossz" válasz az egyébként szokásosan sok kérdésre.
(2) kell egy matching-algoritmus, amit sokféleképpen lehet implementálni; speciális "távolság"-fogalommal dolgozó klaszterezéstől elkezdve, [0-1] valószínűség-intervallumba leképező prediktálásig terjedően, opcionálisan megfejelve kombinatórikus optimalizálással.
(3) Opcionálisan párkapcsolati együttműködési "munka" infói alapján tuningolni

Az első tervezési kiindulás az lehet, hogy párkapcsolatban vannak
(a) peremfeltételek és van a
(b) együttmunkálkodási párkapcsolatépítési folyamat.
A dolog nem triviális, hiszen van aki vitatja az (a) hangsúlyos szerepét. Az adatbányászat értelemszerűen az első pont (pl.: kérdőív-alapú) feltérképezésében, illetve "algoritmusba-keverésében" tud érdemit mondani, segíteni könnyebben, mondván a harmóniát támogató peremfeltételek, harmónikusabb együttműködést vetíthetnek előre, relevánsabb léptékben.

A (kérdőíves) adatgyűjtés második tervezési vízválasztója rögtön az lehet, hogy hány %-ban alapozódik személyes explicit mondjuk így "kulturális" információkra, vagy perszonálisan befolyásolhatatlan hormonháztartásos "implicit" információkra (amire egész rendszert épített dr.Helen Fisher antropológus, a Chemistry-ben). Az "explicit" kiindulás problémája, hogy zajos/megtévesztő lehet, míg az "implicit" kiindulás problémája meg, hogy esetleg túl kevéssé releváns.

Egy következő tervezési vízválasztó, hogy szemben a csajokkal a fickók picit könnyebben/szívesebben hagyatkoznak első benyomásaikra pozitív érzés megléte esetén, sőt tartanak ki mellette, könnyebben jön a szerelem átlagos viszonyok között is. Amúgy ez a valóságshow első adásából is lejött (nem mintha ez jelentene akármit is). Az egész data mining approach kvintesszenciája, hogy a kétsebességes (ad absurdum fordított felállású) relációt tudhatja egyensúlyba hozni, horribile dictu harmonizálni a kezdeti párkapcsolatépítési szakaszban.

Ez rögtön felveti azt a releváns kérdést hogy szemben azzal, hogy hány százalékban sikeres a gépi matching, sokkal fontosabb a sikerességet abban mérni, hogy a párkapcsolatra kandidálók, elhiszik-e ennek a gépi matchingnek:
* hogy potenciálisan hatékonyan tudnak előzetesen zajt/felesleges köröket eliminálni, időrabló, sokszor kevéssé élvezetes meg szükségtelen mentális próbatételeket csökkenteni a párkeresési folyamatból.
* hogy fontosabb az esélytelen jelöltek könnyű kiszórása, a még mindig sok esélyes jelöltekre redukálásával.
* hogy a félresikló kezdeti kommunikációk, bénázások elhibázott konkluzióinak/következményeinek hatása csökkenthető (első benyomások kevesebb rossz "outliert" generálnak).
* hogy az "ördögnél egy fokkal szebb legyen a fickó" gondolat tudhat teljesen más (jelenidejű) megvilágítást nyerni a sok problémát implikáló "válogatási stressz" kontextusában.

A következő releváns vízválasztó, hogy meddig extrapoláljuk tovább a gépi-matching-es kérdéskört. Én mindig csak addig gondolkodtam eddig, hogy email-címcseréig van szerepe a gépeknek, algoritmusoknak, onnantól 100%-ban "emberi" a folytatás. De végül is logikus ötlet, hogy a régi korok praktikus kiházasításához hasonlóan a gép házasítson ki. Csak míg régen, szülői/gazdasági megfontolások voltak a párosító motivációs erők, ma már a szerelem, romantika, vágyak, kulturális és egyéb háttér lehet a rendező elv a gépi matching számára. De nem csak motivációs erő megléte a közös, hanem a minősége, hiszen mindkettő "külső" típusú (hiszen kívülről jön mind a szülői presszió, mind a gépi matching hatása, ami tovább erősíti a ma is létező párválasztáshoz köthető környezeti nyomást)

Utolsó releváns tervezési vízválasztónak a valóságshow kontextusában említhető specifikumokat említeném:

* Tévés zaj, plusz torzító nyomás. Marhára nem mindegy, hogy a párok maguk belsőleg intézik a saját ilyetén spéci házasságukat, avagy kamera elött.Élve az előfeltételezéssel, hogy nem kamu az RTL egész show-ja.

* Szakemberi verifikáció/rásegítés illetve dinamikus személyreszabás a kérdőíves felmérés nyomán. Nyilván ez egy költséges extra/bónusz a tisztán gépi illetve általános kérdőívezéshez képest, de távolról sem triviális, hogy jobb eredményt ad, analóg módon a dimenzióredukció információveszteség melletti sokszor jobb minőségű végeredmény-előállításhoz.

* És talán a legeslegfontosabb: a házasodásban érintettek köre. Egy Megasztárba/Csillag születikbe jelentkeznek 1-2.000-en maximum, amibe beletartozik a fahangú zuhany alatti kornyikáló lúzer madarak is. Egy ilyen házasságba jóval kevesebben jelentkeznek, és belőlük is, csak 8 pár kerül ki, ami kiválasztást nyilván befolyásolja, hogy milyen sztori kapcsolható hozzájuk, még tovább torzítva az egészet. Na most evvel lehet szembeállítani, hogy dr.Helen Fisher 1.6 millió ember adataival rendelkezik. Érezhető, hogy "kicsit" más az alapnagyságrend a [gépi] matchinghez. ;)

Szumma-szummárum: miközben a tévéshow önmagában hidegen hagy, az azért nagyon érdekelne, hogy ha bármiképpen tudna-e ez a spéci házasodási módi terjedni, tévés valóságshow nélkül természetesen, akkor milyen tapasztalatokat hozna. Szívesen elolvasnék erről egy összefoglaló tanulmányt, akkor is, ha szívesebben hiszek a fentebb említett csupáncsak emailcím-cserés verzióban.

Nincsenek megjegyzések:

Megjegyzés küldése