Me entretuve sacando estos datos: en el gráfico aparecen las 52 capitales de provincia españolas y cuánto hay escrito sobre ellas en Wikipedia. La fuente son las páginas de la propia enciclopedia; todas tienen una estructura bastante similar y en las que es fácil contar palabras; usé la extensión Word Counter Plus para Chrome, que va bien. (Están incluidas las ciudades autónomas de Ceuta y Melilla, pero no Santiago de Compostela ni Mérida aunque son capitales de comunidades.)
Los artículos oscilan entre 10.000 y 30.000 palabras; el promedio son unas 15.000. Entre los más largos hay ocho de unas 25.000. Algunos son «artificialmente» un poco más largos porque incluyen largas listas de referencias de «ciudades hermanadas», personajes famosos nacidos en la ciudad o imágenes de monumentos y lugares emblemáticos.
Por lo general y como cabría esperar las ciudades más grandes en población (Madrid, Valencia, Sevilla) tienen artículos de mayor extensión; en cambio Barcelona o Zaragoza están comparativamente más abajo en la gráfica. También es cierto que la «importancia» de la capital –si eso tuviera relación directa con el tamaño de sus artículos– es un poco «relativa» en algunas provincias: puede que haya varias ciudades grandes y relevantes como para merecer más texto. (De hecho se podría hacer esta misma gráfica con provincias o comunidades autónomas, igual me pongo si me aburro).
También hice este otro ejercicio (de los que he extraído los cinco por arriba y cinco por abajo):
Es básicamente una reordenación de la tabla teniendo en cuenta la población de cada provincia. Cuando se mira así Madrid o Barcelona pasan a la cola (con sólo 9 y 12 palabras en Wikipedia por cada 1.000 habitantes, respectivamente) mientras que Zamora alcanza las 390 y Pontevedra o Ávila unas 300. Son cifras bastante altas; si fueran algo más grandes alguna de estas ciudades podría llegar a tener una palabra en su descripción en la Wikipedia por cada habitante.
La inspiración de este entretenido a la par fútil ejercicio de datos proviene de un gráfico equivalente de las palabras de Wikipedia para cada estado de los Estados Unidos, publicado en Data is Beautiful, que me pareció curioso.
Relacionado: