Big data
A Big Data (...) nem fér hozzá az egyszerihez. A Big Data teljesen vak az eseményre. Az emberi jövőt, a történelmet nem statisztikailag a valószínű, hanem a valószínűtlen, az egyszeri, az esemény fogja meghatározni. A Big Data tehát vak a jövőre is.
A mai Big Data-eufória nagyon hasonlít a 18. század statisztika-eufóriájára. Akkor hamarosan ellenállás ébredt a statisztikai ész ellen, mindenekelőtt a romantikusok részéről. Az átlag és a normalitás megvetése a romantika alapaffektusa. A statisztikailag valószínűvel az egyszerit, a valószínűtlent, a váratlant szegezik szembe. A romantika a szokatlant, az abnormálist és a szélsőségest kultiválta a statisztikai normalitással szemben.
Az emberek a billentyűzet előtti magányukban roppant fura dolgokat ismernek be - olykor (például randioldalakon vagy ha szakmai tanácsokra keresnek rá) azért, mert ennek van következménye a való életben, máskor pedig éppen azért, mert nincs következmény: úgy könnyíthetnek a lelkükön, úgy vallhatják meg vágyaikat, félelmeiket, hogy azzal egyetlen valódi személyből sem váltanak ki döbbenetét, rémületet vagy még rosszabbat. De akár van következmény, akár nincs, az emberek ilyenkor nem csupán megnyomnak egy gombot vagy elfordítanak egy kart, hanem begépelik a sok-sok trillió lehetséges karaktersorozat egyikét, hogy körvonalazzák gondolataikat a maguk robbanásveszélyes, kombinatorikus, mérhetetlen valójában.
A Google-keresések adatait nem az emberi psziché megértését segítő eszköznek szánták. A Google-t arra találták ki, hogy az emberek mindenfélét megtudjanak a világról, nem arra, hogy a kutatók tudjanak meg mindenfélét az emberekről. De mint kiderült, a nyomok, amelyeket a tudást hajhászva hagyunk magunk után a neten, elképesztő mértékben árulkodók.
A mikroszkóp megmutatta nekünk, hogy a tó vizének egyetlen cseppjében jóval több van, mint amennyit szabad szemmel látni vélünk benne. A teleszkóp megmutatta, hogy az éjjeli égbolton több a néznivaló, mint amennyit szabad szemmel látni vélünk. Az újszerű, digitális adatok pedig most azt mutatják meg, hogy az emberi társadalomban is több van, mint amennyit látni vélünk benne. A Big Data lehet korunk mikroszkópja vagy teleszkópja.
Nem mondom, hogy a Big Data nem tartalmaz információt. Van ott információ bőven. Csak az a gond - és ez a középponti kérdés -, hogy egyre nagyobb szénakazalban kell keresnünk a tűt.
Az adattudós célja az, hogy megértse a világot. Ha kontraintuitív eredményt kapunk, még több adattudomány segítségével magyarázatot találhatunk arra, hogy miért nem olyan a világ, amilyennek látszik.
A Big Data-forradalom nem igazán a több és több adat összegyűjtéséről szól. Hanem a megfelelő adatok összegyűjtéséről.
Azzal, hogy rengeteg adatot összegyűjtünk a világ problémáiról, megtesszük az első lépést a leküzdésük felé.