PageRank

Googlen algoritmin sydän on ollut PageRankin eli linkkivoiman laskeminen. Tästä websivujen demokratiasta ollaan nyt siirtymässä toisenlaiseen demokratiaan.

Googlen algoritmin sydän on ollut PageRankin eli linkkivoiman laskeminen. Tästä websivujen demokratiasta ollaan nyt siirtymässä toisenlaiseen demokratiaan.

Syy Googlen ylivertaisuuteen hakukoneena on ollut sen kyky selvittää yksittäiseen websivuun muilta sivuilta johtavat linkit. Tässä tehtävässä täytyy käydä läpi jokaikinen webin sivu, ja selvittää, millaisia sivulta ulospäin johtavia linkkejä itse kussakin sivussa on.

Google siis selvittää kunkin yksittäisen sivun "äänestyskäyttäytymisen". Äänestyksen tuloksena sivut asetetaan tärkeysjärjestykseen.

Sivun sijoittumiseen tietyllä hakusanalla Googlen hakutuloksissa vaikuttaa toisaalta kyseisen sivun tärkeys ja toisaalta se, kuinka hyvin sivu vastaa hakijan tekemään hakuun. Tässä kirjoituksessa käsitellään lähinnä tärkeyttä ja sen määräytymistä äänestyksessä. Vastaavuudesta sitten joskus toisella kerralla ...

Selvitän seuraavassa lyhyesti, mutta toivoakseni täsmällisesti, miten PageRank lasketaan. PageRankin laskentakaava ja sen tulkinta on esitelty Sergey Brinin ja Lawrence "Larry" Pagen opiskeluaikaisessa julkaisussa The Anatomy of a Large-Scale Hypertextual Web Search Engine vuodelta 1998.

Yksittäisen sivun PageRank on websivuja satunnaisesti surffaavan henkilön todennäköisyys olla tällä tietyllä yksittäisellä sivulla

Lyhyesti sanottuna: Yksittäisen sivun PageRank on websivuja satunnaisesti surffaavan henkilön todennäköisyys olla tällä tietyllä yksittäisellä sivulla. Ja pidemmin sanottuna: Satunnainen surffailija heitetään umpimähkään jollekin websivulle. Tältä sivulta hän jatkaa matkaansa satunnaisesti valittua linkkiä pitkin eteenpäin - ja jatkaa matkaansa loputtomasti. Lisäksi laskentakaavassa on vakio, joka kertoo todennäköisyyden satunnaisen surffailijan kyllästymiselle klikkailuun, jolloin hänet heitetäänkin jälleen umpimähkään jollekin webin sivulle. Mikäli surffailija päätyy umpikujaan, eli sivuun, josta ei johda linkkejä minnekään, heitetään hänet jälleen umpimähkään jollekin sivulle.

Seuraava Wikipedian kuva näyttää webin, jossa on yksitoista palloa eli sivua ja näiden sivujen väliset linkitykset. Pallojen koot kuvastavat sivujen PageRank-arvoja.

PageRank

Näemme, että eniten linkkivoimaa on sivulla B. Sen PageRank on 38,4 %. Toisin sanoen tätä kuvassa näkyvää webiä satunnaisesti surffaavalla on 38,4%:n todennäköisyys olla sivulla B.

Muut sivut siis "äänestävät" sivun B tärkeimmäksi sivuksi. Kuvaa tarkastelemalla nähdäänkin, että tälle sivulle johtaa eniten linkkejä muilta sivuilta. Toisena on sivu C, vaikka sillä on vain yksi sivulle johtava linkki. Sivulla B oleva satunnainen surffailijahan jatkaa matkaansa linkkiä pitkin aina sivulle C ja nostaa siten sivun C todennäköisyyttä.

Kultakin sivulta eteenpäin menevä linkki vie siis kohdesivulle kyseisen sivun linkkivoiman jaettuna eteenpäin menevien linkkien määrällä. Jos sivulta siis johtaa eteenpäin viisi linkkiä, saa kukin kohdesivu 20% linkittävän sivun linkkivoimasta.

PageRank on Googlen algoritmin sydän ja sielu ja se kannattaa edelleenkin pitää mielessä esimerkiksi sivustonsa rakenteen suunnittelussa. Tärkeää sivua ei ainakaan kannata haudata syvälle rakenteeseen. Monesti suositeltavin ja luontevin ratkaisu on linkittää kaikki sivut kaikilta sivuilta, varsinkin jos sivuja on alle 100 ja jos ei erityisesti tiedetä, mitkä sivut tarvitsevat buustia nettinäkyvyyteensä.

PageRank on vain yksi osa Googlen algoritmia. Osa, jonka merkitys on ollut vähenemään päin. Tämän kirjoitelman tarkoituksena on kuitenkin nostaa esille tämän alkuperäisen Googlen sydämen demokraattisuus. Googlen nimeksikin annettiin alunperin BackRub, vuonna 1996. Nimi tarkoittaa selän hierontaa ja kuvastaa sivulle tulevia linkkejä. Googlen alkuaikoina web olikin olemukseltaan Tim Berners-Leen hengessä oikeastaan vain joukko sivuja, joiden välillä oli linkkejä. Demokraattisuus tällä näyttämöllä tarkoitti sitä, että jokaisella sivulla oli yksi ääni, jonka se antoi omien linkkiensä kautta eteenpäin.

Nykyään webin näyttämö on moninverroin monimutkaisempi, mutta väitän, että Google pyrkii yhä samankaltaiseen demokraattisuuteen omissa tuloksissaan. BackRubin eli Googlen kehittämistä avitti se, että sen laskemisessa voitiin hyödyntää pitkälle kehittynyttä todennäköisyys- ja matriisilaskentaa. Kun PageRankin oivallus oli tehty, oli haasteena oikeastaan vain kaikkien webin sivujen läpikäyminen, mikä vaatikin tuolloin - ja vaatii toki edelleen - valtavaa tietokonekapasiteettia.

BackRubin nerous: vastaavuus ankkuritekstistä, tärkeys PageRankista

Kuten aiemmin mainitsin, tarkoitukseni ei ole käsitellä sivujen vastaavuutta hakijan tekemään hakuun. En malta kuitenkaan olla mainitsematta, että Googlen alkuperäisessä algoritmissa oli lisäksi toinenkin mullistava tekijä, joka yhdessä PageRankin kanssa teki siitä tuon ajan muihin hakukoneisiin verrattuna ylivertaisen - linkittävän sivun linkissä oleva teksti eli ankkuriteksti. Nämä kertoivat Googlelle, mistä linkitetyssä sivussa oli kysymys. BackRubin nerous oli siinä, että se antoi kokonaan uudet vastaukset niin sivun vastaavuuteen hakuun kuin sivun tärkeyteenkin. Vastaavuus tuli ankkuritekstistä ja tärkeys PageRankista.

Kun sivut äänestävät toisiaan, niin eihän se tietenkään oikeasti mitään demokratiaa ole. Sivut eivät ole kansa. Äänten pitäisi tulla kansalaisilta, ihmisiltä.

Tämän päivän webissä Google pystyy kuitenkin hyödyntämään sosiaalisen median signaaleja, tai tähän kirjoitelmaan paremmin sopivammin: ihmisten äänestyskäyttäytymistä. Ihmiset "äänestävät" toisiaan ja toistensa tekemiä sisältöjä eri tavoin webissä, tykkäämällä, twiittaamalla, olemalla kavereita, suosittelemalla, jne. Miten Google ottaa tämän kaiken huomioon hakutulostensa järjestyksessä, on epäselvää.

Vuonna 2011 julkaistu Google+ tarjoaa joka tapauksessa Googlelle oman alustan tämänkaltaisten tietojen keräämiseen. Googlella on patentti Agent Rankille vuodelta 2009, jossa hahmotellaan yksittäisten ihmisten mainetta yhtenä tekijänä hakutulosten järjestämisessä. Patentissa viitataan myös suoraan PageRank-algoritmiin yhtenä mahdollisuutena tämän maineen laskemisessa.

Hakukoneoptimointi on politiikkaa ja hakukoneoptimoijat sofisteja

Mikäli Googlen hakutulosten järjestys määräytyy demokraattisen prosessin seurauksena, muuttuuko esimerkiksi hakukoneoptimointi sitten politiikaksi?

Hakukoneoptimoijahan pystyy tarjoamaan tietoa siitä, mitä sellaista ihmiset haluavat johon ei vielä mikään (web)palvelu tarjoa hyvää vastausta. Hakukoneoptimoijan osaamiseen turvautuminen on kuin gallupin tekemistä. Hakukoneoptimoija pystyy myös auttamaan viestin muokkaamisessa tehokkaammaksi ja vaikuttavammaksi. Tulevaisuuden hakukoneoptimoija on myös sosiaalisen median asiantuntija, joka auttaa eri toimijoita verkottumaan ja toimimaan tarkoituksenmukaisesti Facebookissa, Twitterissä tai Google+:ssa.

Niinpä, tulevaisuuden hakukoneoptimoijat saattavat olla kuin antiikin Kreikassa kierrelleitä sofisteja, jotka maksua vastaan opettivat puhetaitoa, logiikkaa ja muita taitoja, joita tarvittiin politiikkaan osallistumiseen ja siinä menestymiseen. Sofistien perimät palkkiot olivat tyypillisesti suuria. Platon syytti heitä rahanhimoisiksi viisastelijoiksi ja nykyäänkin sofismilla on kielteinen kaiku. Myönnettävä on, että sofistien ei voida sanoa pyrkineen syvempään viisauteen vaan kuten sanottua, väittelytaidon opettamiseen politiikkaan osallistuville vapaille miehille. Sofistien huono maine saattaa olla myös seurausta siitä, että jälkimaailma on saanut lukea heistä oikeastaan vain kriitikoidensa Platonin ja Aristoteleen teoksista.

Itse haluaisin nähdä hakukoneoptimoinnin roolina myös demokratian lujittamisen ja avustamisen. Platonin kritiikki sofismia kohtaan kiertyy kuitenkin siihen tosiseikkaan, että hän ei nähnyt demokratiaa toimivana valtiojärjestelmänä eikä todellakaan arvostanut sofistien demokratiaa tukevaa opetustyötä.

Kirjoittaja: Jussi Honkanen





Tagit: hakukoneoptimointi, pagerank, demokratia, sofistit



Samoilla tageilla varustettuja:

Hakukoneoptimoinnin salaisuus

Tagipilvi:

demokratia  hakukoneoptimointi  pagerank  salaisuus  sofistit