Las redes neuronales artificiales están en el centro de los avances espectaculares que la inteligencia artificial ha conocido recientemente. ¿Cómo funcionan y qué las hace tan poderosas?
El modelo matemático de las redes neuronales artificiales (RNA) fue propuesto inicialmente en 1943 por dos investigadores de la Universidad de Chicago: Warren McCullough y Walter Pitts. En un artículo del diario Brain Theory, enunciaron una teoría articulada alrededor de la neurona como elemento fundamental de la actividad de reacción a eventos externos.
Hubo que esperar hasta 1957 para que se desarrollara el primer prototipo que explotara las RNA: el Perceptrón de Frank Rosenblatt. Este intentaba realizar tareas de reconocimiento a partir de un algoritmo de aprendizaje repetitivo. Sin embargo, en esa época, las computadoras no eran lo suficientemente potentes para procesar los volúmenes de datos necesarios para una evaluación práctica de situaciones del mundo real. Esto fue lo que constataron Marvin Minsky y Seymour Papert en el libro Perceptrons (1969), donde destacaban las limitaciones de las redes neuronales. La investigación marcaría una pausa durante casi dos décadas.
Un primer avance tuvo lugar en 1986 cuando David Rumelhart, Geoffrey Hinton, y Ronald Williams publicaron un ensayo sobre la retropropagación progresiva, una técnica de aprendizaje que revitalizó el interés por las redes neuronales.
Sin embargo, fue necesario esperar el auge del Big Data y las computadoras masivamente paralelas para que las redes neuronales dispusieran de una capacidad de procesamiento adecuada. En 2012, un hito fue alcanzado cuando el equipo de Alex Krizhevsky ganó la competencia ImageNet sobre el reconocimiento de imágenes.
¿Qué es una red neuronal artificial?
Una red neuronal artificial aprende analizando ejemplos predefinidos. Se entrena para desarrollar un modelo matemático predictivo, por ejemplo, el reconocimiento de objetos en una imagen. Para ello, una RNA se apoya en un gran número de procesadores organizados en capas y operando en paralelo. Se consideran tres tipos de capas.
1. Capa de entrada
Esta capa es la que recibe la información en bruto. En comparación, podemos considerar que los nervios ópticos perciben una imagen antes de analizarla.
2. Capas intermedias ocultas
Los datos en bruto transitan por varias capas que cada una realiza un análisis parcial de la información antes de transmitirla a la siguiente.
3. Capa de salida
La última capa produce el resultado final, es decir, la información analizada.
Ajuste de las capas
En realidad, este proceso puede realizarse varias veces, en cuyo caso la RNA sigue una fase de aprendizaje durante la cual ajusta sus pesos, es decir, la importancia de cada una de las capas.
Inferencias
La red puede progresivamente realizar inferencias, es decir, predicciones o deducciones aplicables a nuevos datos.
¿Cuáles son los tipos de redes neuronales?
Redes feedforward
En una RNA de este tipo, la información circula en una sola dirección, de la entrada a la salida.
Redes recurrentes (RNN)
Los RNN manejan capas recurrentes: «memorizan» información de las etapas previas. Esto los hace eficaces para tareas como el reconocimiento de voz (pueden identificar palabras teniendo en cuenta los sonidos previos), la traducción automática o el análisis de texto (al establecer relaciones entre las palabras ya analizadas).
Redes antagónicas generativas (GAN)
Este modelo de inteligencia artificial utiliza dos redes neuronales en competencia para generar datos realistas.
Redes convolutivas (RCNN)
Son principalmente utilizadas para procesar datos estructurados en una rejilla, como las imágenes, y son muy eficaces para aplicaciones como el reconocimiento facial.
¿Qué aplicaciones concretas?
Las RNA son la base de los inmensos avances recientes de la inteligencia artificial y las encontramos en una gran cantidad de aplicaciones.
Visión por computadora
Los algoritmos DeepFace de reconocimiento facial de Facebook se han mostrado tan eficaces (una precisión de 97,35% en 2014) que Meta decidió suspender su uso tras varias polémicas relacionadas con la privacidad.
Arte y creatividad
Las IA generativas como Midjourney, Leonardo (imágenes), pero también Suno (canciones), Gen 3 de Runway (videos), capaces de realizar obras a partir de descripciones textuales, son uno de los ejemplos más destacados del uso de las RNA.
Procesamiento del lenguaje natural
Los asistentes de voz como Siri, Alexa, Google Assistant o Cortana se apoyan en RNAs.
Juegos y toma de decisiones
En 2016, AlphaGo, una herramienta desarrollada por DeepMind, una filial de Google, venció al campeón mundial de Go, un juego conocido por su complejidad y la amplitud de las combinaciones posibles, con un marcador de 5 a 0. Tal logro parecía imposible diez años antes.
Finanzas
La RNA implementada por Paypal para detectar transacciones fraudulentas redujo la tasa de fraude al 0,28% en 2024.
Automóvil
Un vehículo autónomo como Waymo (también conocido como el Google Car) utiliza RNA (CNN) para el análisis en tiempo real de imágenes del entorno.
Meteorología
GraphCast de Google DeepMind es capaz de predecir el tiempo con una precisión mejorada de 90 a 99,7% en comparación con los modelos tradicionales y puede proporcionar pronósticos con hasta 10 días de anticipación.