Acaba de terminar la conferencia RecSys 2021 sobre algoritmos de recomendación. El modo híbrido no ha simplificado las interacciones, pero las interesantes presentaciones se siguieron unas a otras y lograron presentar ideas nuevas de vez en cuando. Ese es el caso de la ponencia principal de la mano de Cynthia Liem (Universidad Tecnológica de Delft).
Cynthia tiene la particular combinación de dos talentos: es investigadora en ciencias informáticas y una pianista con mucho talento. Construyó su ponencia sobre esas competencias dobles, titulándola «Notas clave y claves y notas: perspectivas de una pianista sobre las recomendaciones» en la conferencia RecSys2021. Me resulto especialmente interesante, ya que arroja luz sobre las limitaciones de los algoritmos de recomendación.
Si solo tienes 30 segundos
En su ponencia en la conferencia RecSys 2021 sobre algoritmos de recomendación, Cynthia Liem destacó varios puntos débiles en los algoritmos de recomendación sobre música:
- No permiten la clasificación entre diversas versiones de la misma canción.
- Se basan en la reacción de la primera vez que se oye para decidir si incluir o excluir tipos de canciones distintas.
- Pueden permitirnos descubrir partes nuevas del mundo que nos rodea.
- Deberían incluir la característica de volver a exponer al usuario al contenido que no les gustó la primera vez.
La música (clásica) es cuestión de interpretación
Como música clásica, Cynthia ha señalado un hecho evidente que solemos olvidar: La música clásica gira en torno a la interpretación, puesto que la interpretación original del compositor no ha sobrevivido y cada músico reinterpreta su trabajo «a su manera». En otras palabras, el músico interpreta las intenciones del compositor según su historia, lo que resulta en versiones muy distintas. Aprecio profundamente el modo en que Cynthia ilustra esta capacidad de interpretación usando el ejemplo del Ave Maria de Gounod.
El resulta es un elemento esencial de la manera en que consumimos contenido musical online: hay disponibles varias versiones de la misma canción y no podemos diferenciarlas a primera vista. Los algoritmos de recomendación, por el momento, no ayudan en este aspecto.
Si los algoritmos de recomendación hubiesen existido en su época, Bach habría sido eliminado.
Spotify: duplicar el contenido perjudica la experiencia del usuario
El problema de la duplicación resulta evidente en cualquier plataforma de música, y no se limita a la música clásica. Estos son los resultados de buscar en Spotify una canción de jazz ampliamente conocida, Mack the Knife. Como puedes ver, hay tantas versiones que elegir no es nada fácil.
Pero todas las interpretaciones son muy distintas, así que en este caso el algoritmo de recomendación no es de gran ayuda.
Apreciar el contenido exige tiempo y una exposición repetida
La otra idea cardinal que desarrolla Cynthia gira en torno a la exposición a un tipo nuevo de contenido. Al igual que ocurre con ciertos platos, que solo empiezas a apreciarlos tras haberlos comido varias veces, tienes que consumir un tipo de contenido nuevo en varias ocasiones para que empiece a gustarte. El error de los algoritmos de recomendación es que pueden ocultar todo un rango de contenido tras una primera exposición fallida.
No olvidemos que la popularidad de una obra musical se produce habitualmente tras la muerte de su autor. Bach murió en 1750, y su música no se hizo popular hasta mucho más tarde. Tal y como Cynthia nos recuerda: «si los algoritmos de recomendación hubiesen existido en su época, Bach habría sido eliminado».
La experiencia de Cynthia con el Magma Duo resulta enriquecedora en este aspecto. Usando el ejemplo del compositor holandés Matthijs Vermeulen, Cynthia ha mostrado que, a medida que aumenta el número de conciertos al que asiste un usuario, menos alejados están de su música. Por lo tanto, un algoritmo de recomendación que favorece la diversidad debería incluir una característica de seguir exponiendo al usuario al contenido que no le ha gustado.
¿Cómo descubrir lo que todavía no conoces?
El tema de explorar un dominio está íntimamente ligado con nuestra percepción de la extensión de dicho dominio. O en otras palabras, ¿cómo vamos a descubrir lo que todavía no sabemos que existe? Este problema es especialmente pronunciado en el campo de la música, puesto que existe una variedad infinita de estilos y siempre consumimos lo mismo. Los algoritmos de recomendación pueden ser aquí de gran ayuda, siempre y cuando estén programados correctamente.
La biblioteca pública solía delimitar visualmente el mundo del conocimiento.
En mi opinión, la discusión sobre los límites del conocimiento es completamente fascinante. Cynthia lo ilustró de manera muy clara: la biblioteca. Para aquellos de nosotros que vivimos la época previa a Internet, la biblioteca pública delimita de manera visual el mundo del conocimiento. Internet ha eliminado la percepción física de la experiencia hasta tal punto que los Millennials ya no comprenden la idea de ordenar los datos. Este artículo publicado en The Verge muestra que a los jóvenes el concepto de clasificación en un ordenador les resulta desconocido. Como resultado, los archivos se guardan de manera caótica, obstaculizando marcadamente el descubrimiento y la innovación.
Sin divagar demasiado, me gustaría recordarte que la estructuración del conocimiento es uno de los pilares de la capacidad del ser humana de crear. Darwin no habría desarrollado su teoría de la evolución sin organizar su comprensión en un libro normal y corriente. El sociólogo Lühmann no habría escrito 70 libros y 500 artículos sin su sistema Zettelkasten. En ambos casos, «ordenar» la información fue la clave del éxito.
Conclusión
Esta discusión sobre los límites de los algoritmos de recomendación nos lleva a comprender mejor nuestro papel como humanos. No me cansaré de repetir que los algoritmos son herramientas y que a esa inteligencia artificial solo puede cobrar vida gracias a la inteligencia humana. Al igual que el artista cuyo trabajo refleja su personalidad, las posibilidades del algoritmo quedan definidas por su diseñador. Así que yo creo que cualquier diseño algorítmico debe basarse en objetivos claramente definidos, y el siguiente paso es que debes usar las métricas que usan con atención para cumplir esos objetivos. Pero a menudo es precisamente ahí donde reside el problema. Tal y como la imagen que hay más abajo ilustra en clave de humor, los errores en la elección de métricas son comunes y tienen consecuencias desastrosas para la experiencia del usuario.
Publicado en Data y IT.