Google surfar ständigt webbsidor i jakt på ord. Varje ord lagras ihop med adresser till alla de webbsidor det hittats på. När vi sedan söker på ett ord, så visar Google de sidor där ordet finns och radar upp träffarna efter sannolikheten att det var vad vi tänkte på. (Troligast överst) Ett kriterium är vilka andra ord som står i närheten. En sökning på “stockholms stad” ska ju i första hand visa de sidor där de två orden finns invid varann, i den ordningen.
När man stavar fel på vanliga ord brukar Google fråga om man menade “xxx”. Genom att klicka på Googles föreslagna sökning, får man träff på den stavningen, och Google får statistik på vad folk ser som rätt stavning. Vilket med tiden säger Google vad som är allmänt ansedd korrekt stavning. (Det skulle även kunna användas i Googles översättningstjänst; Google Translate. Både “rätta” och “felaktiga” stavningar. Google vill ju kunna översätta även felstavade texter. Min gissning)
När Google läser igenom webbsidor så registrerar man även länkar. När samma länk hittas ofta, så anses många tycka sidan som länken pekar på, är intressant. Då hamnar sidan högre upp som sökresultat. (Detta medför en lätt rundgång, då sidor många länkat till, oftare kommer att länkas till igen) Sedan utgår jag ifrån att Google loggar vilka föreslagna länkar man klickar på. Det säger dem hur nöjda folk är med sökförslagen. Google kan då bli bättre. Troligen lagras även den IP-adress och/ eller dator/ mobil som gjorde sökningen. Så varje individ får passande sökresultat, och med tiden blir mer och mer nöjd. Detta innebär förstås också en lätt rundgång där folk blir mer och mer inne i sina cirklar. Kanske Google blandar upp sökresultaten med chansningar och ser om sökaren klickar på det. Då kan Google bli bättre.
Troligen formar Google även sökningen efter språk. Dels varje ord för sig (även om det inte är vattentätt), kanske region sökaren befinner sig i, kanske vilket språk man har sin browser inställd på, kanske ens tidigare klickade sökresultat; vilket språk/ region de sidorna tillhörde.
För några år sedan brukade Google också ha en cashad bild av sidan invid länken. Det hjälpte eftersom sidan kunde tagits ned när man klickade på Googles länk. Idag vet jag inte hur de gör, för det händer “aldrig” att en länk de visar har tagits ned.
När Google var nytt så kunde det dröja innan saker som nyligen var publicerade, gick att hitta hos dem. Jag var nyfiken på detta och brukade kolla då och då. Ofta fick man vänta. Snabbast gick det att hitta nya publiceringar på amerikanska välbesökta nyhetssidor. Idag är de snabbare, men utbudet av webbsidor ökar oerhört snabbt idag, så man undrar hur de kan hinna med att surfa webben efter allting. Deras arkiv över hela världens webbsidor, måste vara enormt! Och nu lagrar de bilder också.
Ett skäl till Googles succé är förstås de miljontals sökord som väller in varje minut. (Sekund?) Av dessa lär Google väldigt mycket. Bäst i sin klass är de på att ständigt få pulsen på vad världens befolkning tänker på. Just nu.
Baksidan är förstås den monopolliknande maktställningen. Hur lätt som helst kan de censurera vissa sökresultat. Detta sker troligen så sparsamt att det inte märks. Och de flesta av oss är nog tacksamma för att slippa en del. Mer känt är att de kan lyfta upp resultat, efter betalning. De är märkta med gult, men även följande resultat skulle kunna manipuleras. Med det enorma utbudet av webbsidor, blir det svårt att kolla. Om man skulle vilja.
Kapitalism, fri marknad, yttrandefrihet och informationsfrihet tenderar att kvävas av monopolliknande situationer. Vi i Sverige minns radiomonopolet. Googles nästan totala dominans har kritiserats. EU har talat om saken, och den 27 november 2014 kom ett uttalande, om att Google borde brytas upp.
RSS
Facebook