Wissenschaftler der Stanford University haben eine Reihe neuer Techniken entwickelt, die gemeinsam in der Lage sind, Rankings von Webseiten bis zu fünf mal schneller zu berechnen, als dies die Suchroutine von Google bisher ermöglichte. Aufgrund eines solchen Geschwindigkeitsgewinns könnte es möglich werden, personalisierte Webseiten-Rankings zu berechnen, die sich nach individuellen Bedürfnissen richten oder für bestimmte Themen konfiguriert wurden.
Der so genannte Computing PageRank, also der Algorithmus, der bei Google die Sucharbeit leistet, benötigt zum Durchsuchen und Ordnen einer Millarde Webseiten mehrere Tage. Momentan bietet Google die Suche in drei Millarden Seiten an. Jede personalisierte oder themen-sensitive Suchanfrage würde eine weitere mehrtägige Berechnung nach sich ziehen. Das Ergebniss würde jedoch neben brauchbaren auch immer noch unzählige irrelevante Treffer liefern.
Um PageRank zu beschleunigen, entwickelte das Team aus Stanford drei Methoden aus dem Bereich der numerischen linearen Algebra ("Extrapolation", "BlockRank" und "Adaptives PageRank"). "Weitere Geschwindigkeitszuwächse sind möglich, wenn wir alle diese Methoden gemeinsam benutzen", sagt Kamvar. "Erste Experimente zeigen, dass durch die Kombination der Methoden die Berechnung von PageRank um bis zu fünf mal schneller läuft. Dennoch gibt es einige ungelöste Aufgaben. Mit dem themen-basierten PageRank sind wir momentan schon weiter, als mit dem personalisierten Ranking."
Die schnellere Methode wird jedoch keinen Einfluss auf die Geschwindigkeit bei der Ausgabe von Ergebnissen zu Suchanfragen bei Google haben, weil die Rankings schon im Voraus berechnet werden und nicht erst im Moment der Anfrage.
Das Stanford-Team besteht aus den Studenten Sepandar Kamvar und Taher Haveliwala, dem Mathematiker Gene Golub und dem Informatikprofessor Christopher Manning. Ihre Arbeit wurde von der National Science Foundation unterstützt. >aus *Wissenschaftler entwickeln Techniken, um Webseiten-Rankings wie bei Google, bis zu fünf mal schneller berechnen zu können. Schnelligkeitsgewinn könnte 'themen-sensitive' Suchanfragen ermöglichen*. 13. Mai 2003.
Verwandte Themen
> "The anatomy of a large-scale hypertextual web search engine" von Sergey Brin und Lawrence Page. "In diesem Artikel stellen wir Google vor, den Prototypen einer Suchmaschine, die in großem Umfang die in Hypertext enthaltenen Strukturen nutzt."
> "The google cluster architecture" von Luiz André Barroso, Jeffrey Dean und Urs Hölzle. IEEE Micro, März/April 2003.
> "Exploiting the block structure of the web for computing pagerank" von Taher Haveliwala und Sepandar Kamvar.
> "The second eigenvalue of the google matrix" von Taher Haveliwala und Sepandar Kamvar.
> word burstiness: Scanning von Online-Trends. 7. März 2003.
| permaLink