Az emberi intelligencia elméletében két alapvetően eltérő megközelítés létezik. Az egyik az intelligenciát alkalmazkodóképességnek tekinti, vagyis az új feltételekhez való alkalmazkodás képességének. A másik viszont azt mondja, hogy az intelligencia tanulással jön létre, ahol a tanulás nemcsak puszta memorizálást jelent, hanem a tanulási képesség elsajátítását és nagy mennyiségű bemenet kezelését is. Végül is az úszást vagy a kerékpározást is meg kell tanulnod, tehát az intelligencia mint tanulás koncepciója lényegében azt mondja, hogy minél többet tanulsz, annál intelligensebb vagy. A mai világ egyik fontos mesterséges intelligenciája a Google keresőmotor. Hogyan és mire használja az intelligenciát?
A nagy adatmennyiségekkel való munka a Google szakterülete. Elsőként kezdte el indexelni az oldalakat nemcsak tartalmuk szerint, hanem egy olyan tényező alapján is, amelyet idézési indexnek nevezhetnénk – minél több hivatkozás mutat más oldalakról az adott oldalra, annál jelentősebbnek tekintik. Ez a megközelítés önmagában biztosította a Google dominanciáját más keresőmotorokkal szemben, mert a Google gyakrabban kínált relevánsabb oldalakat. És abból, hogyan csapd be a Google-t, hogy fontosabbnak tekintse az oldaladat, önálló ágazat lett – a SEO (Search Engine Optimization) –, amelyből ma már számos szakember él sikeresen.
A Google mesterséges intelligenciára irányuló törekvéseit éppen az vezérli, hogy hatalmas adatbázisokkal dolgozik, amelyeket össze lehet kapcsolni és keresni bennük kölcsönös kapcsolatokat. A hatalmas adatgyűjtemények például lehetővé tették a Google számára, hogy idővel és hellyel megcímkézett fényképeket vegyen, és belőlük háromdimenziós modelleket állítson össze azokból az épületekből, amelyeket az emberek lefényképeztek.
Az egész indexelési folyamat nagyobb részben automatikus. A webes kereső robotok (crawlerek) bejárják a webet a hivatkozások struktúrája mentén, elemzik és osztályozzák a talált tartalmat. Azt, hogy mely oldalakat fogják átkutatni és milyen gyakran, a Googlebot vezérlőprogram irányítja, amely koordinálja a keresést. A keresés néha lehetetlen, mert az oldal bejelentkezést igényel, a crawlerek általi keresés tiltott rajta, vagy bemenetek alapján generálódik. Ezt nevezik deep webnek.
Deep web vs. dark web
Néhány ember összetéveszti a deep webet (amely nem érhető el normál kereséssel) és a dark webet, amelyek illegális oldalak, speciális protokollok (mint például a Tor) alatt elrejtve – de ez valami teljesen más! A deep web alá jellemzően olyan adatbázisok tartoznak, amelyek lekérdezésekre válaszolnak, míg a dark web aktívan rejti magát a törvény szeme elől.
A következő lépés a talált oldalak elemzése, amikor a Google megállapítja, hogy nem duplikátumról van-e szó, és abban az esetben, ha az oldalak többsége hasonló, kiválasztja a legjelentősebbet az egész weboldal képviselőjeként – ezt nevezik kanonikus hivatkozásnak. Az oldalakon aztán kulcsszavakat keres, amelyek osztályozzák (indexelik) az oldalt, és megpróbálja felismerni a tartalmat és kontextust is, például meghatározni, hogy az oldal melyik országban található és milyen nyelveket használ.
A Google-keresés úgy történik, hogy a lekérdezés alapján a Google meghatározza a legrelevánsabb eredményeket nemcsak a kulcshivatkozások tekintetében, hanem abban is, hogy más oldalak hogyan hivatkoznak a célra, és egyeznek-e a nyelvek és a kérdező helye. Ha azt írod be, hogy „számítógép szervizt“ szeretnél, a Google tudja, hogy valószínűleg egy jó értékelésekkel rendelkező szervizt keresel a környékeden, és nem például Ausztráliában.
A Google rendszer tanul és profiloz a lekérdezések alapján, de a keresési eredmények alapján is – amikor további oldalakon keresel eredményeket és nem találtad meg őket rögtön az elején, akkor tudja, hogy valami nem volt rendben az eredményekkel, és megpróbálja meghatározni a profilodat, vagyis hogy mit keresel jellemzően, mire kérdezel rá. Az adaptív keresésnek negatív hatásai vannak a magánéletre és pénzzé tehető, mert a Google jobban célozhat rád hirdetéseket, de szükséges ahhoz, hogy a Google tudja, mit is keresel valójában és mi a jó eredmény éppen neked.
De ez nem az egész rendszer, mert az internet folyamatosan változik, oldalak és néha egész weboldalak tűnnek el – és ezért a Google folyamatosan ismétli a folyamatot újra és újra, hogy alkalmazkodjon a folyamatosan változó információtengerhez és ahhoz is, ami éppen népszerű és amit az emberek leggyakrabban keresnek. Tulajdonképpen egy állandó tanulási és újratanulási folyamatról van szó, amely képessé teszi a keresőmotort arra, hogy relevánsan és ugyanakkor nagyon gyorsan válaszoljon.
A Google keresőmotor egy olyan mesterséges intelligencia, amelyet a mindennapi életben talán a leggyakrabban használsz. Nem mintha aktívan befolyásolhatnád a viselkedését, de a működése relevánsabb eredményeket biztosít számodra. Még ha ez bizonyos etikai problémákat is magával hoz.