JPO : Webinar d'information sur nos formations → RDV mardi à 17h30.

Segment Anything, la segmentación de imágenes por IA

Imagínate una herramienta capaz de recortar cualquier objeto en una imagen con un solo clic. Eso es posible con Segment Anything. Gracias a este sistema de segmentación automatizado, ya no necesitas pasar horas en Photoshop para aislar elementos de tus visuales. Segment Anything Model lo hace por ti en unos segundos. Descubre en detalle esta tecnología de inteligencia artificial.

¿Qué es Segment Anything?

Un sistema de segmentación automatizado

Desarrollado por Meta AI, Segment Anything Model (SAM) es una solución de computer vision avanzada. Como cualquier herramienta de visión por computadora, es capaz de comprender e interpretar el contenido visual del mundo real. Exactamente, como lo haría un humano.

Pero Segment Anything va aún más allá. Puede aislar y extraer cualquier objeto de una imagen digital, con un solo clic. Y esto, sin requerir aprendizaje adicional. Cabe decir que SAM ya está bien entrenado. Para segmentar imágenes con una precisión desconcertante, la herramienta utiliza un conjunto de datos compuesto de 11 millones de imágenes y 1.1 mil millones de máscaras de segmentación.

Paralelamente, Segment Anything utiliza la tecnología de «zero-shot learning». Lo que le permite adaptarse instantáneamente a nuevos contextos visuales, sin formación previa. Y ahí radica todo el interés de esta herramienta. A diferencia de los modelos tradicionales de inteligencia artificial, SAM no necesita un entrenamiento detallado para cada nueva tarea. Puede generalizar sus habilidades a situaciones visuales diversas e inesperadas; tanto para el reconocimiento de objetos, el diseño digital, la investigación científica, etc.

Segmentación vs detección

Si Segment Anything es tan revolucionario, es gracias a su modo de funcionamiento basado en la segmentación. De hecho, la mayoría de los modelos existentes utilizan la detección de objetos. Sin embargo, esta funcionalidad se basa en cuadros de delimitación rectangular. El problema: estos cuadros a menudo engloban áreas circundantes, como partes de fondo. No capturan la geometría precisa del objeto y ofrecen a sus usuarios una detección aproximada y burda.

Por el contrario, las máscaras de segmentación dibujan un contorno que se ajusta perfectamente a los contornos del objeto. El análisis visual es mucho más preciso; tanto en términos de proporciones como de posicionamiento en la imagen.

¿Cómo utilizar Segment Anything?

Los 3 modos de interacción

Además de ser extremadamente preciso, Segment Anything ofrece a sus usuarios tres métodos de interacción innovadores:

  • La segmentación por punto único: simplemente debes indicar un punto en la imagen para que SAM detecte automáticamente el objeto correspondiente. También podrá identificar todos los elementos similares presentes en el visual.
  • La segmentación por área rectangular: debes trazar un cuadro de delimitación en la imagen. A partir de ahí, el modelo analiza el área seleccionada y extrae todos los objetos que se encuentran allí.
  • La segmentación por palabra clave: como la mayoría de las herramientas modernas de inteligencia artificial, Segment Anything también te ofrece una interfaz textual. Puedes ingresar un término descriptivo, y dejar que SAM interprete tu solicitud. Gracias a tu prompt y a las palabras clave utilizadas, es capaz de identificar los objetos objetivo. Y esto, incluso si esos elementos no estaban inicialmente incluidos en su conjunto de datos de entrenamiento.

Bueno saber: SAM también acepta prompts provenientes de otros sistemas (por ejemplo, un casco de realidad virtual). En un futuro cercano, podrías usar tu casco AR/VR y segmentar los elementos que te rodean.

El uso de Segment Anything con Python

Además de segmentar objetos, también puedes generar automáticamente máscaras, crear máscaras de segmentación o incluso convertir conjuntos de datos. Y para eso, necesitarás Python. Aquí te mostramos cómo hacerlo:

  • Configura un entorno Python instalando las bibliotecas necesarias. Así obtendrás una base funcional para ejecutar tu modelo.
  • Importa el modelo SAM a tu proyecto. Es el corazón de la segmentación. Por eso es importante configurarlo correctamente.
  • Crea máscaras automáticamente. Gracias a las capacidades de Segment Anything, no se requiere intervención manual una vez que se haya realizado la configuración.
  • Personaliza las máscaras con cuadros que apunten a áreas específicas. Esto te permitirá refinar los segmentos.
  • Transforma tus conjuntos de datos de detección de objetos en máscaras de segmentación. Así podrás enriquecer tus proyectos con datos ya recolectados.
  • Visualiza el resultado con herramientas como Supervision. Te permiten trazar y mostrar las máscaras generadas directamente en tus imágenes.

Combinando Segment Anything y Python, puedes automatizar y personalizar la segmentación de imágenes para todos tus proyectos de IA.

¿Por qué usar SAM?

Más allá de enriquecer el proceso creativo, Segment Anything abre el camino a otros desarrollos y avances. Aquí tienes algunos ejemplos.

1 - Una integración de la herramienta en el proceso de creatividad

Al simplificar la segmentación de imágenes, ya no necesitas pasar horas recortando y seleccionando elementos. Y eso sirve a todos los artistas. Por ejemplo:

  • un diseñador gráfico podrá aislar instantáneamente un detalle complejo,
  • un director podrá segmentar secuencias para efectos especiales,
  • un diseñador 3D podrá transformar elementos 2D en modelos volumétricos.

Al ganar tiempo en estas tareas tediosas, liberas tu energía creativa para proyectos aún más sorprendentes.

2 - El análisis de datos geoespaciales

Gracias a SAM, también se han desarrollado otras soluciones. Notablemente SAMGEO. Esta herramienta diseñada por Qiusheng Wu explota las capacidades de Segment Anything al servicio del análisis geoespacial. Al crear paquetes Python específicos, el equipo de Qiusheng Wu logró transformar SAM en una herramienta poderosa de inteligencia territorial.

Concretamente, SAMGEO segmenta imágenes satelitales con una precisión quirúrgica. Por ejemplo, puede identificar áreas urbanas, detectar cambios en el uso del suelo o seguir la evolución de infraestructuras.

Para geógrafos, urbanistas y ambientalistas, es una revolución. Ahora disfrutan de una lectura instantánea y multiescala de los territorios.

3 - La salud y la imaginería médica

Segment Anything podría también ser utilizado en el ámbito de la salud. Por ejemplo:

  • El análisis de radiografías y resonancias magnéticas: SAM podría segmentar con precisión órganos, tejidos o anomalías (como tumores o lesiones). De este modo, los radiólogos detectan rápidamente problemas críticos.
  • La cirugía asistida por computadora: en tiempo real, el modelo podría identificar las estructuras a operar o evitar.
  • El seguimiento de patologías: Segment Anything podría comparar los segmentos de una misma región en diferentes períodos, y así, evaluar la progresión de enfermedades crónicas.

Capaz de revolucionar muchas profesiones, Segment Anything es una herramienta a dominar. Especialmente si deseas participar en la creación de nuevos modelos. Para eso, una formación es indispensable. Y por qué no con DataScientest? Descubre nuestro programa.

¿No está disponible?

Déjenos su dirección de correo electrónico para que podamos enviarle los nuevos artículos cuando se publiquen.