Por @Alvy — 18 de marzo de 2005

Amazon no deja de sorprender: ahora está analizando los textos de su enorme catálogo de libros y junto al título muestra las denominadas SIPs: Statistically Improbable Phrases (Frases Estadísticamente Improbables).

Por ejemplo para Cluetrain Manifesto muestra networked markets y market conversation; para Gödel, Escher, Bach chunked description y subjunctive instant replay; para Don Quixote, hundred ducados y errant chivalry; para Cosmos, microbiology experiments e interstellar spaceflight.

Parece que aciertan con frases que son muy destacadas en un libro respecto a cuánto se usan en otros libros. Así lo explican en sus páginas: Statistically Improbable Phrases:

Amazon.com's Statistically Improbable Phrases, or «SIPs», show you the interesting, distinctive, or unlikely phrases that occur in the text of books in Search Inside the Book. Our computers scan the text of all books in the Search Inside program. If they find a phrase that occurs a large number of times in a particular book relative to how many times it occurs across all Search Inside books, that phrase is a SIP in that book.
La de cosas que se pueden inventar cuando tienes el texto completo de todos los libros guardado en tus servidores.

(Vía Joho the Blog.)

Compartir en Flipboard Publicar / Tuitear Publicar