Por @Alvy — 27 de abril de 2022

What The Fuck… Woman Shrugging

Nuestros queridos y preciados datos personales. Los malvados algoritmos de las megacorporaciones. La explicación de los tejemanejes secretos de de los servidores de las nubes de internet con nuestros bits, proverbialmente a cambio de «cosas gratis». Ah, ¡cuántas guerras digitales se han librado en su nombre!

Pues resulta que ahora Google, Meta y otras empresas tendrán que explicar cómo funcionan sus algoritmos según la nueva legislación de la Unión Europea (The Verge). pero por otro lado Google podría entregar un enlace al trabajo de 1998 El algoritmo de clasificación PageRank: cómo poner en orden la Web [PDF] y arreando, como se suele decir.

Es sabido que al menos en Google, y simplemente en cuanto al algoritmo de búsqueda y clasificación, puede haber más de 200 factores que influyan en los resultados, así que fácil no va a ser esa explicación – por no hablar de que probablemente consideren que es un «secreto industrial» y cosas así. La última revelación respecto a todo este lío es que Facebook no tiene ni idea de lo que hace con tus datos ni a dónde van (Vice), un gran WTF surgido de unos documentos que se han filtrado… de seguridad tampoco parece que entiendan mucho en Facebook. Dicen internamente no tener «ni un nivel de control adecuado ni explicabilidad sobre cómo se utilizan esos datos». Me encanta sobre todo el concepto de explicabilidad.

Además de esto, Marc Andreessen, cofundador de Netscape, es en cuanto a eso de «explicar los algoritmos» de la teoría de que:

No hay algoritmo.

Algo que luego explica con una prosa más elaborada:

No hay un algoritmo per se; hay un nido gigantesco de código y de modelos, además de una enorme cantidad de arbitrariedad, criterio humano y «juicio». La transparencia per se no dice mucho; res ipsa loquitur.

En castellano: «Es la misma cosa la que habla».

También tenemos a Gianluca Mauro explicando por qué eso de «abrir y explicar los algoritmos» puede no ser tan buena idea:

Los algoritmos de IA son software que aprende de los datos con los que se alimenta. Esto significa que su comportamiento depende tanto del software como de los datos, y abrir sólo uno de ellos [datos o código] no garantiza que el sistema pueda ser analizado adecuadamente.

Pongamos un ejemplo extremo: se abre un algoritmo para detectar tuits políticos violentos y la gente piensa que está construido de forma justa. A continuación, los datos con los que lo alimentas contienen sólo tuits de partidos de derechas. El resultado estará sesgado.

Y esto es sólo parte de la complejidad del asunto.

_____
Traducciones cortesía de DeepL.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar