Acaba de terminar la conferencia RecSys 2021 sobre algoritmos de recomendación. El modo hÃbrido no ha simplificado las interacciones, pero las interesantes presentaciones se siguieron unas a otras y lograron presentar ideas nuevas de vez en cuando. Ese es el caso de la ponencia principal de la mano de Cynthia Liem (Universidad Tecnológica de Delft).
Cynthia tiene la particular combinación de dos talentos: es investigadora en ciencias informáticas y una pianista con mucho talento. Construyó su ponencia sobre esas competencias dobles, titulándola «Notas clave y claves y notas: perspectivas de una pianista sobre las recomendaciones» en la conferencia RecSys2021. Me resulto especialmente interesante, ya que arroja luz sobre las limitaciones de los algoritmos de recomendación.
Si solo tienes 30 segundos
En su ponencia en la conferencia RecSys 2021 sobre algoritmos de recomendación, Cynthia Liem destacó varios puntos débiles en los algoritmos de recomendación sobre música:
- No permiten la clasificación entre diversas versiones de la misma canción.
- Se basan en la reacción de la primera vez que se oye para decidir si incluir o excluir tipos de canciones distintas.
- Pueden permitirnos descubrir partes nuevas del mundo que nos rodea.
- DeberÃan incluir la caracterÃstica de volver a exponer al usuario al contenido que no les gustó la primera vez.
La música (clásica) es cuestión de interpretación
Como música clásica, Cynthia ha señalado un hecho evidente que solemos olvidar: La música clásica gira en torno a la interpretación, puesto que la interpretación original del compositor no ha sobrevivido y cada músico reinterpreta su trabajo «a su manera». En otras palabras, el músico interpreta las intenciones del compositor según su historia, lo que resulta en versiones muy distintas. Aprecio profundamente el modo en que Cynthia ilustra esta capacidad de interpretación usando el ejemplo del Ave Maria de Gounod.
El resulta es un elemento esencial de la manera en que consumimos contenido musical online: hay disponibles varias versiones de la misma canción y no podemos diferenciarlas a primera vista. Los algoritmos de recomendación, por el momento, no ayudan en este aspecto.
Si los algoritmos de recomendación hubiesen existido en su época, Bach habrÃa sido eliminado.
Spotify: duplicar el contenido perjudica la experiencia del usuario
El problema de la duplicación resulta evidente en cualquier plataforma de música, y no se limita a la música clásica. Estos son los resultados de buscar en Spotify una canción de jazz ampliamente conocida, Mack the Knife.
Como puedes ver, hay tantas versiones que elegir no es nada fácil.
Pero todas las interpretaciones son muy distintas, asà que en este caso el algoritmo de recomendación no es de gran ayuda.
Apreciar el contenido exige tiempo y una exposición repetida
La otra idea cardinal que desarrolla Cynthia gira en torno a la exposición a un tipo nuevo de contenido. Al igual que ocurre con ciertos platos, que solo empiezas a apreciarlos tras haberlos comido varias veces, tienes que consumir un tipo de contenido nuevo en varias ocasiones para que empiece a gustarte. El error de los algoritmos de recomendación es que pueden ocultar todo un rango de contenido tras una primera exposición fallida.
No olvidemos que la popularidad de una obra musical se produce habitualmente tras la muerte de su autor. Bach murió en 1750, y su música no se hizo popular hasta mucho más tarde. Tal y como Cynthia nos recuerda: «si los algoritmos de recomendación hubiesen existido en su época, Bach habrÃa sido eliminado».
La experiencia de Cynthia con el Magma Duo resulta enriquecedora en este aspecto. Usando el ejemplo del compositor holandés Matthijs Vermeulen, Cynthia ha mostrado que, a medida que aumenta el número de conciertos al que asiste un usuario, menos alejados están de su música. Por lo tanto, un algoritmo de recomendación que favorece la diversidad deberÃa incluir una caracterÃstica de seguir exponiendo al usuario al contenido que no le ha gustado.
¿Cómo descubrir lo que todavÃa no conoces?
El tema de explorar un dominio está Ãntimamente ligado con nuestra percepción de la extensión de dicho dominio. O en otras palabras, ¿cómo vamos a descubrir lo que todavÃa no sabemos que existe? Este problema es especialmente pronunciado en el campo de la música, puesto que existe una variedad infinita de estilos y siempre consumimos lo mismo. Los algoritmos de recomendación pueden ser aquà de gran ayuda, siempre y cuando estén programados correctamente.
La biblioteca pública solÃa delimitar visualmente el mundo del conocimiento.
En mi opinión, la discusión sobre los lÃmites del conocimiento es completamente fascinante. Cynthia lo ilustró de manera muy clara: la biblioteca. Para aquellos de nosotros que vivimos la época previa a Internet, la biblioteca pública delimita de manera visual el mundo del conocimiento. Internet ha eliminado la percepción fÃsica de la experiencia hasta tal punto que los Millennials ya no comprenden la idea de ordenar los datos. Este artÃculo publicado en The Verge muestra que a los jóvenes el concepto de clasificación en un ordenador les resulta desconocido. Como resultado, los archivos se guardan de manera caótica, obstaculizando marcadamente el descubrimiento y la innovación.
Sin divagar demasiado, me gustarÃa recordarte que la estructuración del conocimiento es uno de los pilares de la capacidad del ser humana de crear. Darwin no habrÃa desarrollado su teorÃa de la evolución sin organizar su comprensión en un libro normal y corriente. El sociólogo Lühmann no habrÃa escrito 70 libros y 500 artÃculos sin su sistema Zettelkasten. En ambos casos, «ordenar» la información fue la clave del éxito.
Conclusión
Esta discusión sobre los lÃmites de los algoritmos de recomendación nos lleva a comprender mejor nuestro papel como humanos. No me cansaré de repetir que los algoritmos son herramientas y que a esa inteligencia artificial solo puede cobrar vida gracias a la inteligencia humana. Al igual que el artista cuyo trabajo refleja su personalidad, las posibilidades del algoritmo quedan definidas por su diseñador. Asà que yo creo que cualquier diseño algorÃtmico debe basarse en objetivos claramente definidos, y el siguiente paso es que debes usar las métricas que usan con atención para cumplir esos objetivos. Pero a menudo es precisamente ahà donde reside el problema. Tal y como la imagen que hay más abajo ilustra en clave de humor, los errores en la elección de métricas son comunes y tienen consecuencias desastrosas para la experiencia del usuario.
Posted in Data y IT.