Investigadores del Reino Unido han utilizado redes neuronales para desarrollar un sistema de recomendación completamente basado en imágenes para coincidencias de citas en línea que solo tiene en cuenta si dos usuarios se sienten atraídos por las fotos del otro (en lugar de información de perfil como trabajo, edad, etc.). ), y han descubierto que supera a los sistemas menos ‘superficiales’ en términos de obtener una coincidencia precisa.
El sistema resultante se llama Recomendador recíproco basado en imágenes temporales (TIRR) y utiliza redes neuronales recurrentes (RNN) para interpretar la predilección histórica de un usuario por las caras que encuentra mientras busca posibles coincidencias.
Él papel se titula, quizás de manera desalentadora, Las fotos son todo lo que necesita para la recomendación recíproca en las citas en línea, y proviene de dos investigadores de la Universidad de Bristol, mejorando notablemente un sistema similar (llamado ImRec) lanzado por el mismo equipo en 2020.
En las pruebas, el sistema obtuvo una precisión de última generación en su capacidad para predecir coincidencias recíprocas entre usuarios, mejorando no solo el trabajo de los investigadores de 2020, sino también otros sistemas de recomendación recíproca de citas basados en contenido que tienen en cuenta más información detallada basada en texto en perfiles de citas.
Conjunto de datos de citas del mundo real
TIRR recibió capacitación sobre la información del usuario proporcionada por un servicio de citas en línea ‘popular’ sin nombre con ‘varios millones de usuarios registrados’, que solo permite a los usuarios comunicarse entre sí una vez que a cada uno le ha gustado el perfil del otro. El subconjunto de datos utilizado incluía 200 000 sujetos, divididos equitativamente entre hombres y mujeres, y aproximadamente 800 000 preferencias expresadas por los usuarios en todos los perfiles de citas.
Dado que el servicio de citas anónimo que proporciona los datos solo admite coincidencias heterosexuales, en la investigación solo se cubrieron las coincidencias entre hombres y mujeres.
TIRR mejora los diseños anteriores de sistemas de recomendación recíproca (RRS) en este campo al calcular directamente la probabilidad de una coincidencia entre dos perfiles, basándose únicamente en las imágenes de perfil. En cambio, los sistemas anteriores predijeron dos preferencias unidireccionales y luego las agregaron para obtener una predicción.
Los investigadores excluyeron a los usuarios que habían sido eliminados del servicio de citas (por cualquier motivo, incluido el abandono voluntario) y excluyeron los perfiles que no incluían fotos basadas en rostros.
Los historiales de los usuarios se limitaron a un año atrás, para evitar posibles anomalías que podrían ocurrir a medida que el sitio de citas modificaba sus algoritmos con el tiempo. También se limitaron a un máximo de 15 preferencias de usuario, ya que se demostró que eran suficientes para probar el diseño del modelo, mientras que un uso más extenso de las preferencias degradaba el rendimiento y aumentaba los tiempos de entrenamiento.
Además, algunos de los usuarios más ávidos o de larga data tenían historias con miles de preferencias, lo que podría haber corrido el riesgo de sesgar el peso de las funciones obtenidas y prolongar aún más los tiempos de entrenamiento.
Red siamesa
TIRR se formula usando un red siamesanormalmente utilizado para el aprendizaje de ‘una sola vez’.
Una plantilla de red siamesa, donde las redes neuronales convolucionales (CNN) paralelas comparten pesos pero no datos. También comparten una función de pérdida derivada de las salidas de cada CNN y una etiqueta de verdad del terreno. Fuente: https://arxiv.org/pdf/2108.11714.pdf
La red fue entrenada utilizando entropía cruzada binariauna función de pérdida común en las redes neuronales, y que los investigadores encontraron que da resultados superiores en comparación con pérdida contrastiva. Este último es más efectivo en sistemas que evalúan la paridad entre dos caras, pero dado que este no es el objetivo de TIRR, es un enfoque que funciona mal en este contexto.
Es necesario que el sistema retenga y se base en la información que desarrolla a medida que el entrenamiento itera muchas veces sobre los mismos datos, y la red siamesa en TIRR usa una red LSTM (memoria a largo plazo a corto plazo) para tomar estas decisiones y para asegúrese de que las características que se consideren relevantes no se descarten ad hoc a medida que el marco construye sus conocimientos.
La arquitectura de red siamesa específica para TIRR.
Los investigadores descubrieron que la red se entrenó muy lentamente cuando se ingresaron todos los datos y, posteriormente, dividió el entrenamiento en tres etapas utilizando tres subconjuntos diferentes de datos. Hay una ventaja adicional en esto, ya que los experimentos de los investigadores de 2020 ya habían demostrado que entrenar los conjuntos de datos masculinos y femeninos por separado mejora el rendimiento de un sistema de recomendación recíproco.
El desglose de sesiones de capacitación separadas para la red siamesa de TIRR.
Pruebas
Para evaluar el rendimiento de TIRR, los investigadores mantuvieron una parte de los datos obtenidos a un lado y la pasaron por el sistema totalmente convergente. Sin embargo, dado que el sistema es bastante novedoso, no existen sistemas anteriores directamente análogos con los que pueda compararse.
Por lo tanto, los investigadores primero establecieron una curva característica operativa del receptor (República de China) línea de base para la red siamesa, antes de usar la aproximación de variedad uniforme y la proyección para la reducción de la dimensionalidad (UMAP) para reducir los vectores de 128 dimensiones para una fácil visualización, con el fin de establecer un flujo coherente de gustos y disgustos.
A la izquierda, el ROC de la red siamesa como indicador de referencia del desempeño; a la derecha, la visualización de UMAP muestra «me gusta» en rojo, «no me gusta» en negro.
TIRR se probó contra el filtrado colaborativo y los sistemas basados en contenido con un ámbito similar, incluido el trabajo anterior de los investigadores ImRec (ver arriba), y RECONOCIMIENTOun RRS de 2010, así como los algoritmos de filtrado colaborativo FCR (un RRS de citas de 2015 basado en el contenido de texto de los perfiles de citas) y LFRR (un proyecto similar de 2019).
En todos los casos, TIRR pudo ofrecer una precisión superior, aunque solo marginalmente en comparación con LFRR, lo que posiblemente indique factores de correlación entre el contenido del texto del perfil y el nivel percibido de atractivo de las fotos de perfil de los sujetos.
La casi paridad entre el TIRR basado en imágenes y el LFRR más basado en texto permite al menos dos posibilidades: que la percepción del atractivo visual de los usuarios esté influenciada por el contenido de texto de los perfiles; o que el contenido del texto recibe mayor atención y aprobación de lo que podría haber ocurrido si la imagen asociada no se percibiera como atractiva.
Por razones obvias, el equipo de investigación no puede publicar el conjunto de datos o el código fuente de TIRR, pero alienta a otros equipos a duplicar y confirmar su enfoque.
Nota: las imágenes utilizadas en la ilustración principal son de thispersondoesnotexist.com.