Por @Alvy — 14 de enero de 2003

Desde principios de enero, Telefónica (de España) está instalado un servicio de proxy/caché en su Red IP, que afecta a todos los usuarios de ADSL españoles, incluyendo a los de proveedores como la propia Telefónica, Terra, Ya.com, Wanadoo y otros.

Este tipo de sistemas proxy/caché se instala en la Red para mejorar los tiempos de respuesta: cuando se pide un contenido (HTML o gráficos), y si dicho contenido ya ha sido pedido por otra persona (por ej. la portada de tu periódico favorito, un fichero de varios MB de una película), el proxy/caché devuelve dicho contenido de forma rápida en vez de tener que el usuario tenga que volver a ir al servidor original. En cierto modo (desde el punto de vista del proveedor) el usuario navega más tiempo en una zona de red «interna», y sólo sale de ella cuando los contenidos no están cacheados, con los consiguientes ahorros en comunicaciones.

Telefónica hizo algunas pruebas con este sistema durante los últimos meses de 2002 y el resultado fueron quejas tremendas de los usuarios españoles, acostumbrados a navegar con su IP fija y pública por la Red, sin pasar por ningún «proxy transparente» ni nada parecido. Las quejas iban desde comentarios como «las páginas no cargan», «están capturando nuestros datos oh dios mío conspiración gran hermano», «netmeeting no me funciona»... solo faltaba lo de «y el micro-ondas se me ha estropeado». Como diría el Gran Lebowsky: «Gilipollesssses para assssustar a afisionadossss».

La situación no tiene tanto de terrible: estos sistemas proxy-cachés no son en realidad «nuevos», y llevan años funcionando: mejoran la navegación, aunque a veces pueden presentar algunos problemas si no están correctamente configurados o fallan (o dependiendo de cómo diseñen y programen las páginas algunos webmasters). En el 99% de los casos me atrevería a afirmar que no hay problemas para lo usuarios de a pie.

Mi consejo es no fiarse de todo lo que se publica por ahí (tanto en sitios serios como en «alternativos», especialmente en foros y publicaciones protesta) porque hay una desinformación y demagogia sobre el tema del proxy-cachés que es para flipar. Esto durará unas semanas hasta que la gente vea que no pasa nada ni se acaba el mundo.

Algunas explicaciones sobre comentarios que se han leído por ahí:

«Los contenidos del web XYZ o de mi web no se actualizan»
A veces no, pero antiguamente pasaba igual a veces... Dos trucos fáciles de usar y que no causan problemas, aplicables desde el punto de vista de los usuarios (que más de uno ya conocerá) son:

1. Reload: Si ves que una página no se actualiza o parece anticuada (está cacheada), basta usar Reload o Super-Reload en el navegador para ver si se actualiza. El Super-Reload es Ctrl-Reload en Explorer, Mayúsculas-Reload en Netscape, Opción-Reload en los Macintosh (Explorer). Normalmente con eso la página funciona correctamente.

2. Cambiar URL (parámetros falsos): Si lo anterior no funciona, o en caso de duda sobre si una página está cacheada o no, un truco especialmente útil para webmasters, webloggers y gente que actualiza sus páginas muy a menudo: basta añadirle a la URL un parámetro falso para cambiarla, que sea otra y por tanto se pida «fresca». Por ej, pide

http://www.hiperespacio.com/?xyz

en vez de la URL original que sería

http://www.hiperespacio.com

si la página tiene otros parámetros, añádelos al final como

http://www.blahblahblah.com/?item=tal [...] &otro=xyz

«Al final de esta noticia se da algún truco para evitar la caché: el meta no-cache»

Mala idea. El web que ponga metas «no-cache» en todas sus páginas ya puede ir preparando más hardware y bandwidth ($). Se estará cargando una de las principales funcionalidades del HTTP y de todos los navegadores: poder cachear contenidos estáticos -- además de empeorar probablemente mucho el tiempo de carga de sus páginas... lo cual se traducirá en visitantes descontentos porque «ese web me va lento». El meta 'no-cache' se ha usado históricamente sólo para páginas de contenidos muy dinámicos (ej. páginas con cotizaciones de bolsa o noticias, como news.google.com). Poner no-cache en todas las páginas web de un site es sencillamente un craso error.

¿Qué garantía tengo de que la gente pueda estar viendo una versión actualizada de mi web?
En una palabra: Ninguna. Pero tampoco la tenías antes de que existieran los proxy/cachés (si el usuario configuraba mal su navegador, por ejemplo, con «comprobar caché sólo una vez al día»). Todo depende de si el proxy/caché «expira» correctamente las páginas o no (y también de si comprueba correctamente si han cambiado o no). Como eso depende de si se configura bien el proxy [labor de Telefónica] y luego de si funciona bien o no [o si se cuelga o no], todo esto depende de Telefónica y «se le supone» que lo hará bien. A finales del 2002 esto falló y bastante. A mi me ha sucedido, por ejemplo, ver el mismo contenido de mi web durante más de 24 horas (a pesar de haberlo actualizado y de pedir los reloads e incluso super-reloads) -- el único truco definitivo para esto es lo del parámetro falso ?xyz explicado antes.

«¿No disminuirá el número de visitantes reales?»
El de los visitantes «reales» seguro que no ;-) porque son reales. El de los que figuran en tus informes de tráfico, puede. Teóricamente cuando tu navegador pide (GET) una página, la petición la recibe el proxy/caché, que a su vez hace otro GET de la página «real» para comprobar si ha cambiado o no (y mantenerla o expirarla en su caché). Pero, de nuevo: que esto funcione depende de la configuración que le pongan. Tu servidor web debe devolver un 304 «Not Modified» al browser+proxy si la página no ha cambiado, en vez de un 200 «Ok» que es lo normal. En algunas pruebas de hace meses esto no funcionaba (no había «hits» en los logs).

Hay que comprobar que al contar páginas en los logs se contabilizan correctamente tanto los 200 como los 304s. Pero si el proxy no hace GETs para comprobar las páginas, tu servidor web no recibirá hits, por tanto se pueden observar «menos visitas» aparentes. Lo cual en realidad a ti debería darte igual, porque los «usuarios reales» siguen ahí: olvídate de las métricas obsoletas como las páginas vistas, los hits y todo eso. Por si te sirve de algo en algún sitio he leído que una bajada de un ~ 10% en páginas / visitas puede ser lo normal (habrá que ver).

Pero esto por ejemplo no afecta a la publicidad, que es lo que preocupa a muchos webmasters. Los códigos de publicidad suelen ser llamadas a GIFs que llevan (o puedes hacer que lleven) parámetros aleatorios [generados con un javascript]: aunque la página HTML se cachee, los GIFs de este tipo se piden de nuevo, así que puede pasar que se pierdan 'paginas vistas' aunque se sigan sirviendo los mismos banners.

También puede pasar [efecto proxy] que se vea a todos los visitantes desde la misma IP (la del proxy/s) como pasa con ONO.com, que tiene un proxy hace siglos. Esto se arregla configurando correctamente tus servidores web para leer unas cabeceras: Via, Forwarded, X-Forwarded-For, Client-IP y ponerlas en tus logs como si fueran la IP original -- hay info sobre esto para administradores de servidores webs en las páginas informativas de Telefonica.

A modo de conclusión: Sobre este tema por desgracia todo el mundo está viendo lo malo en vez de lo bueno. Entre las ventajas: navegación más rápida, servidores webs más descargados, download de ficheros más veloces, y un largo etc. Y no hay que olvidar que sólo afecta a los puertos como el 80 (estándar HTTP: Web) y a otros (también los estándar) de protocolos de Real Media, QuickTime y Windows Media... todo lo demás como el correo, los messengers, etc. no se ve afectado en nada de nada por el proxy/caché.

Actualización: Buena info y enlaces sobre el tema en Caravantes.com. El proxy-caché que está usando Telefónica es un producto de Inktomi. Leído en es.comp.redes.adsl: «Una cosa curiosa (y en cierta manera esperable) es que si desde tu ADSL accedes a un servidor [web/hosting] almacenado en otro ADSL... no accedes a través del proxy, accedes directamente, con tu IP. El proxy lo han debido de poner solo para cuando se tiene que salir de la red IP de los ADSLs de Teléfonica.»

Compartir en Flipboard Publicar / Tuitear Publicar