Tomajazz y los enlaces recomendados + la curiosidad ⇒ eso de (la Estadística + la Ciencia de Datos) en acción
En Tomajazz, cada artículo publicado incluye al final tres recomendaciones automáticas generadas por el plugin Jetpack de WordPress. Estas sugerencias, que enlazan a otras entradas del sitio, permiten al lector habitual o al visitante ocasional continuar navegando por contenidos relacionados. Pero, ¿qué ocurre si seguimos una de esas recomendaciones, y luego otra, y otra más?
Basándome en algunas observaciones, movido por la curiosidad y con algo de ayuda de Python, realicé un pequeño estudio: medir la longitud de las cadenas de recomendaciones que se pueden recorrer desde cada entrada de Tomajazz. El resultado es, cuando mínimo, sorprendente.
En algunos casos, estas cadenas se extienden a lo largo de miles de artículos. En otros (como por ejemplo, el que empieza en https://tomajazz.com/web/jazzx5187-cutout-shadow-bird-call-chickadee-cutout-minipodcast/ y lleva a https://tomajazz.com/web/hdo-489-frimpro-podcast/, a https://tomajazz.com/web/pandelis-karayorgis-quintet-circuitous-driff-records-2013/ y a https://tomajazz.com/web/jazzx5184-pandelis-karayorgis-double-trio-catapult-cliff-pools-minipodcast/) apenas alcanzan cuatro pasos, al menos a la fecha de realización del estudio, a finales de mayo de 2025. El histograma que acompaña este artículo muestra la distribución de estas longitudes. La mediana se sitúa en 7262, pero tal y como se ha indicado también hay cadenas tan cortas como de 4 entradas.
Este estudio, aunque informal, se enmarca dentro del ámbito de la ciencia de datos y plantea preguntas interesantes sobre la estructura de navegación en sitios web culturales como Tomajazz. ¿Qué determina la longitud de una cadena? ¿Es una cuestión de topología de enlaces? ¿De antigüedad de las entradas? ¿De afinidad temática? Son, por fortuna, más preguntas que respuestas.
Sea como sea, este análisis revela que Tomajazz no solo es un archivo de contenidos, sino también un laberinto de caminos posibles para el lector curioso… y el campo de futuras investigaciones y mejoras sobre el particular.
Tomajazz: © Pachi Tapiz, 2025
📊 Resumen estadístico de la longitud de las cadenas de enlaces recomendados en Tomajazz
- Media: 6190,5
- Mediana: 7262
- Desviación típica: 2565,26
- Coeficiente de variación: 0,4144
- Mínimo: 4
- Percentil 1: 4
- Percentil 5: 6
- Percentil 10: 21
- Percentil 15: 7262
- Percentil 25: 7262
- Percentil 75: 7263
- Percentil 90: 7266
- Percentil 99: 7279
- Máximo: 7434
Ejemplos y explicaciones sobres las distintas longitudes de las cadenas de los enlaces recomendados
- Longitud 4 (la menor longitud posible): hay un total de 281 cadenas
Un ejemplo, centrado en los especiales de Joan Cortès que repasaban los años 2023 y 2024 en imágenes.
https://tomajazz.com/web/2023-en-25-imagenes-1/ / https://tomajazz.com/web/2023-en-25-imagenes-2/ / https://tomajazz.com/web/2024-en-25-imagenes-1/ / https://tomajazz.com/web/2024-en-25-imagenes-2/ - Longitud 5: hay un total de 161 cadenas
Un ejemplo, centrado en el enorme pianista Horace Tapscott, y en el que se incluían también a los no menos grandes pianistas Bill Evans y Paul Bley:
https://tomajazz.com/web/365-razones-para-amar-el-jazz-una-grabacion-the-dark-tree-horace-tapscott-273/ / https://tomajazz.com/web/jazzx5276-horace-tapscott-the-dark-tree-the-dark-tre-hatology-1991-minipodcast-de-jazz-por-pachi-tapiz/ / https://tomajazz.com/web/tomajazz-recomienda-un-tema-the-dark-tree-horace-tapscott-1989/ / https://tomajazz.com/web/horace-tapscott-with-the-pan-afrikan-peoples-arkestra-ancestral-echoes-the-covina-sessions-1976-dark-tree-roots-series-2021-grabacion-de-jazz-por-pachi-tapiz/ / https://tomajazz.com/web/hdo-510-tres-gigantes-del-piano-bill-evans-paul-bley-y-horace-tapscott-podcast/ - A continuación aparecen cadenas de longitud 6, 7 y así hasta la longitud 47 (únicamente faltan las de longitud 46). En algunos casos hay una única cadena con esa longitud, siendo las más frecuentes las de longitud 4, 5, 6 y 7.
A continuación se produce un salto y las siguientes cadenas que aparecen son las de longitud 199. Aparecen algunas cadenas con longitud mayor de 200, hasta llegar a las de longitud 310.
A continuación se produce un gran salto en la longitud y las siguientes cadenas que aparecen son las de longitud 7262, que es la moda y la mediana del conjunto de longitudes. A partir de ahí aparecen distintos valores para la longitud de las cadenas de recomendaciones hasta llegar al 7434, que es la cadena de mayor longitud.
📊 Un histograma interactivo
Nota. El estudio comenzó a realizarse a finales de mayo del año 2025. En primer lugar se recopiló toda la información y a continuación se realizó su estudio.
La programación se realizó en Python. Para el análisis exploratorio de los datos y su organización, además de Python se utilizaron SQL y Excel, y en menor medida (aunque de un modo más visual), R.
Descubre más desde Tomajazz
Suscríbete y recibe las últimas entradas en tu correo electrónico.