Unos investigadores de la Universidad de Stanford han desarrollado nuevas técnicas que combinadas pueden permitir ejecutar el cálculo de ranking de páginas web, como el utilizado en el buscador Google, hasta cinco veces más rápido. La mejora del método de Google puede hacer viable el cálculo de posicionamientos de páginas personalizados para los intereses individuales o en función de un tema en particular.
Calcular el PageRank, algoritmo de posicionamiento en el que se basa el buscador Google, para mil millones páginas web, puede llevar varios días. Google actualmente busca y ordena jerárquicamente tres mil millones de páginas. La graduación personalizada o sensible al tema requeriría un cómputo separado que llevaría muchos días, pero su rentabilidad sería menor tiempo perdido por resultados de búsqueda irrelevantes.
Para acelerar el PageRank, el equipo de Stanford desarrolló un trío de técnicas en álgebra lineal numérica (métodos de 'extrapolación', 'BlockRank', y 'PageRank Adaptivo'). "Cuando utilizamos todos estos métodos se hacen posibles velocidades mucho mayores", ha dicho Sepandar Kamvar. "Nuestros experimentos preliminares demuestran que la combinación de los métodos hará el cómputo de PageRank hasta un factor de cinco más rápido. Sin embargo, todavía hay varias cuestiones para solucionar. Estamos más cerca de un PageRank basado en la temática que a una jerarquización personalizada".
El método más rápido no afectará a la rapidez con que Google presenta los resultados a las búsquedas de los usuarios, porque las graduaciones se computan por adelantado y no en el momento en que se solicita una búsqueda.
El equipo de Stanford incluye a los estudiantes graduados Sepandar Kamvar y Taher Haveliwala, al conocido analista numérico Gene Golub y al profesor de informática Christopher Manning. El trabajo fue respaldado por la National Science Foundation. >de *Researchers Develop Techniques for Computing Google-Style Web Rankings Up to Five Times Faster. Speed-up may make 'topic-sensitive' page rankings feasible*. 13 de mayo, 2003
contexto relacionado
> the anatomy of a large-scale hypertextual web search engine by sergey brin and lawrence page. "in this paper, we present google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext."
> the google cluster architecture by luiz andré barroso, jeffrey dean and urs hölzle. IEEE Micro, marzo-abril, 2003
> exploiting the block structure of the web for computing pagerank by taher haveliwala and sepandar kamvar.
> the second eigenvalue of the google matrix by taher haveliwala and sepandar kamvar.
> explosividad de la palabra: exploración de tendencias on-line. 7 de marzo, 2003
imago
> arnold schönberg: producción de música por algoritmos
| permaLink