Cuando YouTube nos recomienda videos que se alinean con nuestras inquietudes actuales, cuando Amazon sugiere productos que podrían captar nuestro interés, ¿qué está en juego? Los algoritmos de recomendación. Sistemas de gran sofisticación que buscan personalizar aún más la experiencia del usuario, con el riesgo de generar efectos de polarización no siempre deseables. Y de plantear preguntas acerca de la combinación a gran escala de información que nos concierne y proviene de diversas fuentes...
Cuando empresas como Amazon, Google o Facebook invirtieron en el sector de Internet y marcaron su territorio donde decenas de miles de start-ups habían fracasado, se encontraron con un problema particular: ¿Cómo fidelizar al visitante? ¿Cómo hacer que quiera regresar y, en el caso de sitios de información o streaming, permanezca tanto tiempo como sea posible?
Mientras despejaban este territorio virgen, los gigantes de la web inventaron métodos inéditos para seducir al visitante mediante algoritmos de recomendación.
Estos algoritmos se desarrollaron con el objetivo de:
- Hacer la experiencia del usuario lo más agradable posible;
- Presentar al visitante un contenido que se ajuste lo más posible a lo que desea descubrir;
- Incrementar el rendimiento de varios indicadores clave (duración de visionado de video, tiempo de lectura, gasto promedio, etc.);
- Filtrar la información de manera que se adapte a cada uno.
La palabra clave aquí es: personalización. Para un medio como Facebook, esto representa una hazaña. Más de dos mil millones de usuarios se benefician de un feed de noticias único y actualizado a cada segundo.
Observemos también el caso de YouTube. El líder de video en línea almacena miles de millones de videos y recibe nuevos cada día. Sin embargo, cuando te conectas a YouTube, esta plataforma solo te recomienda unas pocas decenas de clips, con una selección que cambia en cada visita, pero que se esmera –no siempre de manera muy sutil, es verdad– por proponerte un programa que pueda captar tu interés. ¿Cómo procede YouTube para proponerte contenidos que te hagan regresar y descubrir aún más videos? Principalmente combinando los temas de tu interés en un momento dado con los de otros usuarios que presentan un perfil similar al tuyo.
Todos los grandes actores digitales rápidamente captaron las oportunidades que brindaba el vasto reservorio de datos de los internautas. Hoy en día, estos algoritmos de recomendación son implementados por un gran número de sitios web. Están diseñados para identificar en todo momento nuevos contenidos apropiados. Los ejemplos más conocidos son:
- Los posts o las sugerencias de amistad de Facebook, Instagram o Twitter;
- Los productos recomendados por Amazon o Alibaba;
- Los clips propuestos por YouTube o TikTok;
- Los artículos destacados por sitios de noticias;
- Los destinos y actividades sugeridas por sitios de viajes como Booking y TripAdvisor.
La eficiencia de este enfoque es indiscutible. Por ejemplo, en Netflix, el 80% de las películas más vistas son el resultado de los algoritmos de recomendación.
¿Cómo operan los algoritmos de recomendación?
¿Cómo proceden los gigantes de la web para dirigirse de manera tan precisa a cada uno de nosotros? Sus algoritmos de recomendación utilizan técnicas de filtrado para identificar patrones. Los principales mecanismos puestos en acción son los siguientes.
El filtrado colaborativo
El filtrado colaborativo (collaborative filtering) es uno de los algoritmos de recomendación más usados y efectivos. Se basa en la premisa de que si dos personas han disfrutado del mismo contenido en el pasado, probablemente les gusten las mismas cosas en el futuro.
La ventaja del filtrado colaborativo es que no es absolutamente directivo. Se basa únicamente en el historial del usuario. Sin embargo, esta aproximación tiene el defecto de reducir la diversidad del contenido presentado al internauta. Los usuarios no están expuestos a perspectivas distintas, sino esencialmente a información alineada con sus convicciones preexistentes.
Basado en el contenido
La aproximación basada en el contenido (content-based) analiza un conjunto de contenidos sin tomar en cuenta los hábitos de otros usuarios. Se enfoca en las similitudes para hacer recomendaciones. El tema de un contenido se identifica catalogando las palabras más relevantes y luego comparándolas con las de otros artículos
La popularidad
Con este tipo de algoritmo, se presume que si frecuentas un sitio particular, probablemente aprecies las páginas que reciben más visitas. En claro, recomienda los contenidos más populares. La ventaja de tal algoritmo es que se puede aplicar a nuevos usuarios del sitio.
Los riesgos de la polarización
Los algoritmos de recomendación ofrecen muchos beneficios para los usuarios, ya que usualmente las recomendaciones personalizadas son pertinentes. Sin embargo, también pueden tener varios inconvenientes y algunos tienen consecuencias societales.
Así, el número de personas que sostienen opiniones extremas sobre temas como la política o el cambio climático ha incrementado notablemente. Esta «polarización» puede ser peligrosa, ya que es capaz de debilitar el espíritu crítico o, más simplemente, la capacidad de explorar nuevas perspectivas.
En el mismo contexto, la SACEM reveló que el 99% de las pistas más escuchadas en Spotify representan solo el 10% del catálogo. Aún más inquietante, el 20% de las pistas nunca se ofrecen al público.
El problema principal relacionado con la cruzada de datos y la integración de información externa a la plataforma. ¿Quién no se ha sorprendido al hacer una búsqueda en Google sobre los grandes pianistas de jazz para luego ver que YouTube sugiere videos relacionados con este tema o Facebook ofrece inscribirse en grupos de aficionados al jazz?
Todos estos factores pueden alimentar la polarización pero también demuestran una invasión cada vez mayor en la vida privada de las personas. Y por lo tanto, generan la necesidad de establecer medidas de protección adecuadas.