La línea que separa la inteligencia artificial de la inteligencia humana se vuelve cada vez más difusa. Y una de las distinciones fundamentales entre ambas radica en la capacidad para transmitir y comprender emociones. Aquí, los humanos llevaban la delantera. Hasta que apareció EQ-Bench. Así que, ¿en qué consiste exactamente? Eso es lo que vamos a explorar.
¿Qué es EQ-Bench?
Lanzado el 11 de diciembre de 2023, EQ-Bench es un benchmark diseñado para evaluar aspectos de la inteligencia emocional en los grandes modelos de lenguaje (LLM, por sus siglas en inglés). El propósito es, por lo tanto, ayudarles a comprender mejor las emociones complejas y las interacciones sociales. Al hacerlo, son capaces de predecir la intensidad de los estados emocionales durante una conversación.
De hecho, los modelos emplean un conjunto de técnicas computacionales para entender la inteligencia emocional (cálculo, razonamiento, reconocimiento de patrones…). Por ejemplo, fruncir el ceño suele ser indicativo de molestia. Pero no siempre, pueden existir matices. Y estos son mucho más pronunciados en la vida real que en las bases de datos en las que se entrenan los LLM.
El rol de EQ-Bench es precisamente evaluar la capacidad de los modelos para interpretar estos matices dentro de un diálogo.
¿Cómo funciona EQ-Bench?
Para dotar a los LLM de inteligencia emocional, EQ-Bench retoma las técnicas básicas de los tests psicométricos tradicionales, con algunas variaciones. De esta manera, el modelo lee un diálogo y evalúa la respuesta emocional. Debe ser capaz de predecir la magnitud de 4 emociones presentadas. El resultado entonces se califica sin la intervención de un juez (lo cual evita el sesgo de longitud).
Gracias a su modo de operación, EQ-Bench ha logrado producir resultados en fuerte correlación con las preferencias humanas y las pruebas de referencia multi-dominios (MMLU).
¿Por qué es importante entrenar a los LLM en inteligencia emocional?
Las emociones gobiernan a los seres humanos. Al permitir que los grandes modelos de lenguaje profundicen su comprensión de emociones complejas, se les posibilita acercarse aún más a la inteligencia humana.
Y esto puede resultar útil en todos los campos de actividad. Aquí tenemos algunos ejemplos:
- Marketing: los algoritmos pueden analizar con mayor precisión los comentarios de los clientes en las redes sociales. Pero más importante aún, con EQ-Bench, son capaces de anticipar las reacciones. Así, el chatbot podría adaptar su discurso según la emoción detectada, especialmente si se busca incentivar una compra.
- Robótica: un robot de compañía equipado con IA emocional podría comprender y responder de mejor manera a las necesidades emocionales de sus usuarios.
- Educación: los asistentes virtuales dedicados al aprendizaje podrían identificar fácilmente cuándo un estudiante se siente aburrido o no comprende bien un concepto. A partir de ahí, el asistente podría ajustar su método de enseñanza para optimizar el aprendizaje.
Desde la toma de decisiones hasta las interacciones interpersonales, la inteligencia emocional está en todas partes. Los robots que la incorporan plenamente son, por lo tanto, capaces de responder mejor a las expectativas de los seres humanos.
¿Estamos en el camino hacia una convergencia entre la inteligencia humana y la inteligencia artificial?
Antes de responder a esta pregunta, es importante reflexionar sobre el concepto mismo de inteligencia emocional. Esta se divide en cuatro áreas:
- La percepción de las emociones (señales no verbales);
- La utilización de las emociones;
- La comprensión de las emociones;
- La regulación de las emociones.
Y EQ-Bench se enfoca en un aspecto de la inteligencia emocional: la comprensión de las emociones. Esto se refiere a la capacidad de entender e interpretar emociones complejas y su significado en contextos sociales.
Actualmente, este representa un verdadero desafío para los modelos, ya que están entrenados sobre emociones fijas (y a menudo exageradas). A partir de una emoción percibida, los modelos de inteligencia artificial tienden a sacar una conclusión estática. Sin embargo, las emociones humanas son fluctuantes y matizadas. Pueden cambiar abruptamente a medida que ocurren eventos. El desafío de EQ-Bench es, precisamente, integrar todos los factores que pueden influir en las emociones, y comprender todos sus matices.
Aunque EQ-Bench representa un avance significativo en la comprensión de la inteligencia emocional, todavía estamos lejos de una alineación perfecta entre la IA y la inteligencia humana.
Entre tanto, siempre es posible mejorar los grandes modelos de lenguaje. Y eso comienza con una formación en data science.