Jon Kleinberg, professor d'informàtica en la universitat de Cornell, Ithaca, N.Y., ha desenvolupat un mètode perquè una computadora trobi els assumptes que dominen en una discussió en un determinat moment mitjançant la recerca d'explosions sobtades, ràpides, de paraules en grans col·leccions de documents. Entre d'altres proves del mètode, ha explorat els discursos presidencials sobre l'Estat de la Unión des de 1790 fins l'actualitat i ha creat una llista de paraules que reflecteix misteriosament algunes tendències històriques. La tècnica suggereix molts usos en extracció intel·ligent de dades (data mining), incloent recerques a Internet o l'estudi de tendències socials segons el que es reflecteix en les pàgines Web.
Kleinberg diu que se li va ocórrer la idea de buscar en un cert temps mentre que intentava ensortir-se'n amb el seu propi devesall de correu electrònic entrant. Ell va raonar que quan un assumpte important sorgeix en la discussió, les paraules clau relacionades amb l'assumpte mostren un augment sobtat en freqüència. Una recerca d'aquestes paraules podria proporcionar maneres teòriques de categoritzar els missatges.
Ell ha idear un algorisme de la recerca que busca la 'explosivitat', amidant no només el nombre de vegades que apareixen les paraules, sinó també el coeficient d'increment d'aquests nombres en un cert termini de temps. Els programes basats en el seu algorisme poden explorar textos que varien en el temps i assenyalar les paraules més 'explosives'. "El mètode està inspirat en els models de probabilitat usats per a analitzar el comportament de les xarxes de comunicació, on la 'explosivitat' ocorre en el tràfic a causa de la congestió i als punts calents", explica.
Fa alguns anys, va suggerir que una manera de trobar els llocs més útils de la Web sobre un tema en particular seria atendre a la manera com s'enllacen entre si. Els llocs que 'són enllaçats' per molts uns altres són probablement 'autoritats'. Els llocs que 's'enllacen' a molts d'altres són probablement 'distribuïdors'. Les majors autoritats en un assumpte serien els quals són enllaçats més sovint pels distribuïdors més actius, raona. Una variació en aquesta idea és utilitzada per Google, i una versió més formal s'està utilitzant en un nou motor de recerca anomenat Teoma. >de *Buzzwords of history, revealed by computer scans, indicate new ways of searching the Web*. 18 de febrer, 2003.
context relacionat
> daypop word bursts. 'word bursts' són usos intensificats de certes paraules en weblogs durant el darrers dos dies. són indicadors sobre el que els webloggers estan escrivint en aquest moment. utilitat disponible des del 26 de febrer, 2003
> unificant amb només alguns enllaços aleatoris: xarxes 'small-world' en simulacions. 4 de febrer, 2003
> how does 'six degrees of separation' work? explanation is personal networking. 23 d'agost, 2000. revisió de kleinberg sobre un treball previ de steven h. strogatz i duncan watts.
> authoritative sources in a hyperlinked environment by jon m. kleinberg [pdf]. introducció a l'algorisme 'hits' (hyperlink-induced topic search). 1998.
imago
> ràfegues de paraules de l'administració amerikana.
| permaLink