Una inmersión rápida en cómo puede automatizar la coincidencia de datos de productos y la gestión de SKU utilizando solo títulos de productos con NLP.
La coincidencia del título del producto es el proceso de hacer coincidir productos similares o exactos de diferentes fuentes basándose estrictamente en el título y otros atributos del título del producto. A medida que la variación de datos y las fuentes de datos crecen en una organización, puede volverse más difícil mantener la precisión de los datos del producto y administrar nuevos SKU. Surgen problemas cuando se utilizan diferentes proveedores y vendedores y se vuelve más difícil mantener datos de productos de alta calidad. Esto puede causar problemas al evaluar los datos de ventas y comprender sus esfuerzos de marketing y la tasa de éxito.
Si bien esto a menudo se hace manualmente, puede consumir mucho tiempo y escalar mal. Los sistemas de la vieja escuela se enfocaban en usar atributos básicos del producto como SKU y códigos UPC que no funcionan bien con datos modernos no estructurados. Estos sistemas más antiguos requieren procesos auxiliares para extraer atributos, eliminar duplicados y limpiar palabras vacías de los datos de productos no estructurados. Incluso con toda la limpieza de datos y la extracción de palabras clave, estos sistemas aún luchan con cosas como esta:
GIGABYTE – Laptop para juegos de 15.6″ FHD IPS 144Hz – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD
Y
Portátil de 15,6″ – i5-11400H – 16 GB – GeForce RTX 3050 512 GB Negro 6494784
Para comprender las relaciones entre palabras, como «laptop» y «notebook», y las teclas de parte del discurso para que coincidan con GeForce, necesitaremos usar el procesamiento de lenguaje natural.
Lo que la coincidencia de títulos de productos puede brindarle
Coincidencia de datos de productos basado en el título proporciona a los minoristas y marcas de comercio electrónico un montón de beneficios en el mundo de los datos de ventas y la inteligencia de marketing.
- Organice productos y SKU entre múltiples vendedores y proveedores
- Use los datos de la competencia para comprender las tendencias del mercado y los precios competitivos
- Comprender el ciclo de vida del producto
- Asegúrese de que no falten piezas en sus datos de ventas y campañas de marketing
El uso de un sistema de comparación basado en el título del producto le permite asegurarse de tener siempre la información exacta que necesita para realizar la comparación de datos. Otros sistemas que requieren una tonelada de puntos de datos o descripciones detalladas de productos pueden tener problemas a medida que escala a más productos. Descubrimos que el uso de un sistema NLP basado en aprendizaje profundo que se enfoca en el título del producto le permite obtener resultados similares sin el riesgo de escalamiento a largo plazo. Hemos podido utilizar la coincidencia de títulos de productos como referencia y crear otros modelos a su alrededor, como la coincidencia de UPC y la coincidencia de descripción de productos, para simplemente mejorar los resultados, no depender de ellos.
Hemos creado nuestro software de coincidencia de títulos de productos utilizando modelos NLP populares como GPT-3, BERT y SBERT para conocer la relación entre las diferentes características del idioma del título, los atributos del título como el nombre de la marca, el nombre del producto, el tipo, etc. los modelos son muy superiores a la coincidencia aproximada y otros enfoques basados en reglas y se ha demostrado que se escalan fácilmente con la nueva varianza de datos y el ruido.
Coincidencia entre: Garmin nuvi 2699LMTHD – navegador GPS – automotriz 6.1 in nuvi 2699LMTHD Navegador GPS portátil para automóviles
Este resultado del software NLP muestra algunas cosas importantes:
- Las palabras vacías y los caracteres no afectan nuestra capacidad de hacer coincidir dos títulos de productos
- El modelo puede incluir las palabras en el título que importan sin importar el orden o las palabras irrelevantes.
- No se requieren nombres de marca para que podamos encontrar coincidencias o rechazar una coincidencia.
- Los atributos del producto no son obligatorios (tamaño, longitud) en cada producto que estamos comparando y no tienen que ser del mismo tipo.
El modelo de título del producto recoge diferencias pequeñas pero importantes entre los tamaños de los contenedores que se consideran SKU diferentes en la base de datos del producto. En el segundo ejemplo, vemos que hay un montón de partes móviles: diferentes recuentos de botellas y ruido de datos no estructurados, pero aún así una combinación fácil.
Refinación para caso de uso de producción
Este producto de software de coincidencia de título de producto se puede ajustar en una tienda minorista o en los datos reales del producto de la marca de comercio electrónico para impulsar la precisión más allá de otros productos para su caso de uso específico. Este nivel de personalización está disponible debido a la arquitectura del modelo de lenguaje que se usa para construir el comparador de títulos del producto, en lugar de usar comparadores de fuzzer ingeniosos o modelos de extracción de entidades. La capacidad de ajustar la arquitectura para los datos de una empresa específica permite una mejor escalabilidad y se vuelve mucho más fácil ajustarse a los cambios en los datos no estructurados a medida que agrega más productos o fuentes.
Relatividad en la coincidencia de productos
Como habrás notado, la idea de la coincidencia de productos puede ser algo relativa según el caso de uso que estés tratando de cubrir. Si está buscando diferenciar productos según el SKU, querrá resultados diferentes a los que tendría si estuviera tratando de comprender el tamaño del mercado y los productos de la competencia.
Por ejemplo, si tiene estos dos títulos de productos:
Chios Mastiha Pack 60gr (2.11 oz) Goma de masilla 100% natural de Mastic Growers Fresh
Chios Mastiha Pack 25gr (0.88oz) Goma de lágrimas medianas Goma de masilla 100% natural de Mastic Growers Fresh
Podría considerar que no son una coincidencia en función de la idea de que tienen dos SKU diferentes dentro de la misma tienda, pero también podría considerarlos una coincidencia en función de la idea de que ambos son Mastic Gum. Si ahora incluimos este título de producto en la mezcla:
Horbaach Mastic Gum 1500mg 120 Cápsulas | Sin OGM y sin gluten
Tenemos que decidir de antemano para qué estamos emparejando. Este es claramente el producto de un competidor y tiene un código UPC diferente, pero aún es Mastic Gum y si solo estamos buscando productos bajo el mismo «paraguas», entonces esta es una coincidencia. Hay mucho que pensar al diseñar sus sistemas de comparación de datos de productos.
Cuando utiliza una herramienta de comparación de títulos de productos basada en NLP, este nivel de flexibilidad se convierte en una brisa. Simplemente ajustamos nuestra arquitectura para su caso de uso sin importar lo que considere una «coincidencia» y optimizamos para eso. Este nivel de flexibilidad cambia las reglas del juego cuando se busca usar la misma arquitectura para muchos casos de uso diferentes dentro de una organización y aun así alcanzar una alta precisión.
Nuestra canalización basada en SKU considera correctamente que esto no coincide.
Extracción de datos del producto
Una vez que ya hayamos hecho coincidir los títulos de los productos y comprendamos la variación de nuestros datos de ventas internos o los datos de productos de la competencia, podemos usar modelos de categorización de productos o herramientas de extracción de atributos basadas en NLP para llenar cualquier vacío de datos que tengamos, como el tamaño del producto, el nombre del fabricante y los atributos del producto automáticamente. Estas canalizaciones utilizan la misma arquitectura que nuestra combinación de productos para que puedan integrarse fácilmente.
Mejore la taxonomía de su producto
Ejemplo de generación de categorías de productos y etiquetas a partir de nuestro modelo GPT-3.
Con la herramienta de coincidencia de títulos de productos, puede mejorar la claridad de su taxonomía combinando múltiples atributos de productos coincidentes en una sola categoría. Esto limpia y estandariza en gran medida los atributos que componen su sistema de taxonomía.
GIGABYTE – Laptop para juegos de 15.6″ FHD IPS 144Hz – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD
Y
Portátil de 15,6″ – i5-11400H – 16 GB – GeForce RTX 3050 512 GB Negro 6494784
Comprender que ambos son el mismo producto le permite llenar los vacíos, como poner «Notebook» y «Laptop» en la misma categoría, «NVIDIA» como fabricante de ambos productos, etc. Esto le permite encontrar productos mal categorizados y llenar cualquier espacio en blanco.
La comprensión de los datos del producto es clave
¿Cree que la coincidencia del título del producto puede ayudarlo a comprender los datos de su producto y limpiar su inteligencia de ventas? Programemos una demostración hoy en Ancho.ai.