Qué es y cómo funciona SAM 2, la nueva IA de Meta para procesar fotos y vídeos

SAM 2 de Meta

Investigadores consideran que SAM 2 es un avance importante en la visión artificial que podría impulsar más investigaciones y aplicaciones.

SAM (Segment Anything Model) es un modelo de Inteligencia Artificial presentado por Meta en 2023 enfocado en identificar y segmentar elementos en imágenes y videos. Ahora la compañía ha anunciado en su blog la llegada de su nueva versión, SAM 2, la cual posee mejoras respecto a su predecesora de cara a transformar la forma en la que interactuamos con las fotos y videos antes de subirlos a Instagram o WhatsApp.

Así es SAM 2, la IA de Meta para procesar fotos y videos

La nueva versión de esta tecnología de Meta posee una licencia de código abierto, lo que permite que los desarrolladores y empresas lo utilicen para crear sus propias aplicaciones. Esta versión puede identificar y seguir objetos en tiempo real mucho más rápido y de forma más simple que antes.

De hecho, en la segmentación de video, Meta asegura una mejor precisión, utilizando 3 veces menos interacciones que los enfoques anteriores. En la segmentación de imágenes, el modelo es más preciso y 6 veces más rápido que Segment Anything Model (SAM). Esto podría ser un avance importante en la visión artificial que podría impulsar más investigaciones y aplicaciones. 

Puede reconocer cualquier objeto en una foto o video con un solo clic y cuando lo identifica lo sigue por todo el video, incluso si este sale de la escena en un determinado momento. Se adapta de forma fácil aún con escenas que no haya visto en sus entrenamientos, además de que el usuario puede realizar indicaciones adicionales para tener un mayor control.

Funciones que tendrá SAM 2

Edición de video: la eliminación de fondos o la edición de efectos especiales a objetos será más simple.

Medicina: ayudará a analizar imágenes médicas o videos de cirugías.

Seguridad: mejora en los sistemas de vigilancia y la detección de amenazas.

Investigación marina: análisis de imágenes de SONAR de arrecifes de coral (ya se utilizaba SAM).

Realidad Mixta: objetivo de potenciar experiencias interactivas como las de Quest 3.

FUENTE: 20MIN