No se si alguien se dio cuenta ya de esto. En las páginas de Slashdot hace tiempo que aparece publicidad de texto (sólo a veces - prueba a hacer reloads). Es decir: en vez de un banner gráfico convencional, en la cabecera de la página se ve un «banner de texto» de 5 × 1.
El aspecto recuerda al de la publicidad de texto (AdWords) de Google, aunque en horizontal en vez de vertical.
Mmmm... todo un misterio digno de Sherlock Holmes ;-)
Bien, si se echa un vistazo al código fuente de la página se encuentra este script en la página de Slashdot:
<script language="JavaScript">
<!--
var full_url = document.URL;
var google_page_url = null;
if(full_url.match(/(^.*comments.pl\?).*(sid=[0-9\/]*).*$/)) {
google_page_url = RegExp.$1 + RegExp.$2;
}
google_ad_client = 'slashdot_728x90';
google_ad_width = 728;
google_ad_height = 90;
// -->
</script>
<script language="JavaScript"
src="http://pagead.googlesyndication.com/ca/show_ads.js"></script>
Vaya... «googlesyndication.com». En las páginas sobre publicidad de Slashdot/OSDN no se explica que lo que venden puedan ser espacios de texto sino únicamente gráficos. No he encontrado más referencias a este otro tipo de publicidad en su web. Google en cambio comenta muy por encima que su sistema de sindicación de publicidad se aplica a los «términos de búsqueda» en sites que combinan su buscador, como AOL, Netscape, Earthlink y otros. Pero no dice qué pasa si el usuario no hace una búsqueda. Y el contenido del banner-texto de Slashdot no es fruto de una búsqueda: es una página convenional.
Mi teoría a lo Sherlock Holmes es esta: como se está demostrando que la publicidad contextual es más efectiva que los clásicos banners, y que los enlaces de texto son en muchas ocasiones mejores que los banners a los ojos de los usuarios (que han desarrollado «ceguera selectiva») Google está yendo un paso más allá y tiene desarrollado un sistema de publicidad contextual mejor del que otras empresas publiciarias pudieran soñar nunca.
Desarrollaron los AdWords que son un excelente y efectivo sistema publicitario cuando la gente busca términos o palabras «clave» (que es lo que «compra» el anunciante, por ej. «hipotecas» o «viajes a australia»). Y ahora pueden utilizar algo parecido para correr esas campañas publicitarias en otros sites, pero no solo cuando el usuario «busca algo» sino también cuando navega — como parece demostrar el ejemplo de Slashdot. Si navegas un rato por allí verás que cuando salen módulos de texto están relacionados con el contenido de la página. A veces no sale nada (y aparecen campañas de ONGs).
El problema es que para que esto funcione (dado que el usuario no ha buscado nada) hay que categorizar las páginas donde se incluyen los anuncios, según su contenido. Es decir, indicarle al sistema de publicidad (adserver) que la página blablabla.com/xyz/tal.html es una página de «ciencia», para que muestre campañas publicitarias relacionadas. Esto se puede hacer manualmente — pero es una pesadilla. De hecho, puede llegar a ser muy complejo, porque hay demasiadas secciones en cualquier web, y por supuesto muchos webs incontrolables por ahí (por ejemplo, páginas personales). Y cuando una página de un foro está abierta, los usuarios pueden escribir de lo que quieran... a saber qué tema decirle al adserver que trata.
Idealmente, el sistema publicitario podría inteligentemente deducir «al vuelo» el contexto y categorización, cuando el usuario solicita la página web. Primero analiza la página semánticamente, decide de qué trata (NASA + laboratorio + neutrino + matemáticas + temperatura... = «ciencia y tecnología» = «anuncios de baterías solares y similares») y así lanzar la publicidad adecuada. Hay que hacer análisis semántico, que Google ya sabe hacer. Y si necesita mejorarlo hay otras empresas que saben hacerlo mejor. Oops! La semana pasada Google compró Applied Semantics, que se dedica precisamente a esto.
En cualquier caso, aplicar todo esto en «tiempo real» puede ser caro computacionalmente, como en cualquier web dinámico. Qué horror. El ingeniero responsable de mantener eso funcionando diría que sería mucho mejor tenerlo todo en caché para pre-procesarlo en tiempo no-real y tenerlo ya preparado para cada página que exista y que un usuario pueda ver.
Y, ¿dónde está la mayor, mejor y más completa y actualizada caché de toda la Internet del mundo?
Casualmente en Google.
Como diría Anthony Blake: «Hey, todo lo que han leído no es real, es fruto de su imaginación» ;-)
Actualización: Dirson.Google.com tiene (hace tiempo) este comentario al respecto y un formulario desde el que se pueden comprobar palabras y URLs - si bien no se aventuran teorías sobre el «cómo funciona». Por otro lado, creo haber dado con un ejemplo que demuestra que la segmentación se hace en base a las páginas en la caché de Google, a nivel de página individual (no de dominio ni directorio).
Actualización (2005): Meses después este sistema de publicidad se denominaría AdSense y supondría toda una revolución tanto para Google como para el resto de Internet.