Unity lanza conjuntos de datos sintéticos para reducir el tiempo y los presupuestos de capacitación en IA

Unidad, una plataforma líder para contenido 3D en tiempo real (RT3D), ha anunciado el lanzamiento de Unity Computer Vision Datasets. Estos conjuntos de datos podrían afectar a varias industrias, específicamente la fabricación, el comercio minorista y la seguridad. Su objetivo es reducir el costo de desarrollar aplicaciones de visión por computadora y, al mismo tiempo, proporcionar una forma de entrenar los sistemas de IA más rápido.

Siguiendo estrictas preocupaciones normativas y de privacidad, los proveedores de soluciones de visión artificial ahora pueden comprar conjuntos de datos personalizados para entrenar sistemas de IA.

Importancia de los datos sintéticos

Los datos sintéticos se generan cuando los datos existentes no cumplen con las condiciones o necesidades específicas de un sistema de IA. Algunos casos de ejemplo incluyen cuando los requisitos de privacidad limitan los datos disponibles o cómo se pueden usar.

Los datos sintéticos a menudo se usan para probar un producto prelanzado, ya que generalmente no hay datos existentes o aún no están disponibles. Este tipo de datos también es crucial para los algoritmos de aprendizaje automático y, a menudo, se usa en tecnologías como los vehículos autónomos, ya que obtener datos reales es costoso.

Unity intenta romper esa barrera proporcionando un mayor acceso a conjuntos de datos sintéticos de alta calidad con los conjuntos de datos de Unity Computer Vision.

El Dr. Danny Lange es vicepresidente sénior de inteligencia artificial y aprendizaje automático.

“Al crear una versión sintética de conjuntos de datos que reflejan reglas de privacidad validadas y reflejan con precisión datos del mundo real, permitimos que estos conjuntos de datos innovadores lleguen a manos de más innovadores”, dice Lange.

“Esencialmente, estos conjuntos de datos permiten a las empresas planificar y simular escenarios que aún no han experimentado, con un aumento considerable en los datos de los usuarios que imitan lo que encontrarían con el tiempo en el mundo real. Como resultado, estamos viendo entornos interiores más inteligentes, como supermercados sin cajero, y más a medida que nuestros clientes descubren nuevas aplicaciones”.

Aleatorización de dominio

La técnica utilizada por los conjuntos de datos de visión artificial de Unity se llama «aleatorización de dominio», que ayuda a desarrollar diversos conjuntos de datos que mejoran la calidad y controlan el sesgo. Funciona generando permutaciones de la posición y orientación de los objetos, incluidas variaciones de luz, ángulos de cámara y posibles configuraciones.

Los conjuntos de datos sintéticos de Unity también evitan los problemas relacionados con los sesgos debido al uso de imágenes de personas y lugares reales de Internet, o imágenes capturadas manualmente.

El precio de la anotación generalmente aumenta cuanto más complejo es el tipo de anotación, pero Unity ofrece un precio para cualquier tipo de etiqueta, lo que significa que se pagará el mismo precio por los tipos de etiquetas estándar de la industria simples y complejas. Los conjuntos de datos se basan en un modelo de precios escalonados, y el precio por imagen disminuye en función de la mayor necesidad de imágenes más sintéticas.

“Los datos sintéticos están revolucionando el entrenamiento de modelos de aprendizaje automático, ya que superan muchas de las deficiencias de los datos del mundo real recopilados y etiquetados manualmente”, dijo Lange.

“Explicar lo que es posible y conectar a los creadores con los datos asequibles que necesitan para tomar las decisiones correctas continúa impulsando a Unity, sin importar la industria. Es por eso que nuestro equipo estará disponible para ayudar a los clientes a garantizar que los conjuntos de datos producidos cumplan con los criterios correctos para sus necesidades”.

Deja un comentario