¿Deberían los sistemas de recomendación estar exentos de la era posterior al seguimiento?

A medida que la recopilación de datos propios se convierte en la nueva estrella polar para los vendedores y los corredores de datos, la mayor atención en los sistemas de recopilación de datos ‘cerrados’ corre el riesgo de arrastrar a uno de los sectores de investigación más fervientes del aprendizaje automático a la controversia y una mayor regulación.

Las acciones tomadas por los jugadores de FAANG y los productores de FOSS en los próximos 12 a 18 meses son listo para cerrar la cultura del seguimiento entre dominios que inundó los sistemas de análisis de usuarios durante los últimos veinte años y culminó en los escándalos de Cambridge Analytica y, posteriormente, en la irresistible demanda popular de una mayor privacidad en línea.

Ya sea que la implementación esté a la altura del ideal o no, e independientemente de la medida en que los sistemas de seguimiento más generalizados (como FLOC de Google y SKAdNetwork de Apple) puedan calmar la ira de los consumidores y satisfacer a los anunciantes, esta nueva ola de preocupación por la privacidad del usuario se aplica solo a extracción de datos de dominios cruzados en un contexto ‘público’, y no en entornos de consumidores cerrados o propietarios, y los sistemas de recomendación personalizados que impulsan el compromiso allí.

Datos enriquecidos en jardines amurallados

Plataformas como Netflix, Disney+, HBO Max, Roku y la ecoestructura de Amazon (incluidas Prime Video y recomendaciones de productos), que utilizan sistemas de recomendación de aprendizaje automático personalizados, se encuentran entre los servicios de contenido que ahora proliferan y se reducen a medida que la industria del streaming balcaniza.

A medida que la recopilación de datos de terceros retrocede, la ventaja que conservan estos reproductores de transmisión más grandes en términos de acceso detallado a los datos de uso del cliente parece inspirar envidia e imitación, y un énfasis renovado en los marcos propios como una forma de recuperarse. Orientación hiperpersonalizada de los nuevos sistemas analíticos más generalizados.

Si esto sucede, no es probable que sea tan democrático o meritocrático como los criterios anteriores para ingresar, porque la mayor ventaja recaerá en los proveedores con la red más extensa de plataformas propias; con suficientes recursos de desarrollo para proporcionar sistemas de autenticación locales seguros; y que sean capaces de gestionar, analizar y monetizar datos de gran volumen localmente.

Esto centraría el escrutinio público en los aspectos de privacidad de los sistemas de recomendación ‘cerrados’ de una manera que han podido evitar en gran medida hasta ahora, porque, antes de este punto, han sido casos excepcionales y han disfrutado de privilegios excepcionales, operando en un contexto en el que el usuario final ha optado explícitamente por prácticas agresivas de recopilación de datos que generalmente no están permitidas en redes abiertas.

Un retorno más amplio a los entornos herméticos de primera parte

Parece probable que un mayor énfasis en los datos de origen traiga un retorno a los sistemas de autenticación específicos de dominio que precedieron a la popularidad de los métodos de terceros proporcionados por Google (0Auth 2.0), Facebook y Twitter, así como otros complementos populares. plataformas sociales como Disqus.

Hace diez años, la adopción generalizada de estas plataformas de autenticación de terceros resolvió muchos problemas de seguridad para los dominios con recursos de desarrollo limitados, pero también dificultó la obtención de la misma granularidad de datos procesables del usuario que una autenticación propia y local dedicada y permite el sistema de vigilancia. En ese momento, no importaba mucho, porque el seguimiento entre dominios podía cerrar esa brecha de datos.

El inicio de sesión como solución a una crisis existencial

Ahora, la ventaja radica en asegurarse de que un usuario esté logueado, aunque no existan mecanismos explícitos para monetizarlo. Un ejemplo de esto es el creciente número de medios de comunicación que requieren un inicio de sesión para ver el contenido, incluso cuando no existe un muro de pago. Por ejemplo, The Guardian actualmente está experimentando con los requisitos de inicio de sesión para las vistas de artículos que provienen de las búsquedas de Google:

Captura de pantalla de un 'muro de inicio de sesión' para una vista de artículo de The Guardian que proviene de una búsqueda en Google.  Esto no se puede capturar en instantáneas de archivos web, ya que la restricción se genera mediante encabezados de referencia o sistemas basados ​​en IP que revelan que Google es el autor del clic.

Captura de pantalla de un ‘muro de inicio de sesión’ para una vista de artículo de The Guardian que proviene de una búsqueda en Google. Esto no se puede capturar en instantáneas de archivos web, ya que la restricción se genera mediante encabezados de referencia o sistemas basados ​​en IP que revelan que Google es el autor del clic.

Las restricciones de este tipo pueden ser difíciles de determinar para un espectador individual, ya que pueden variar según las ubicaciones geográficas u otras circunstancias. Por ejemplo, el artículo anterior de Guardian no está restringido de ninguna manera cuando se navega desde el sitio web de Guardian (incluso si el lector no ha iniciado sesión), o cuando se accede directamente. Requerir un inicio de sesión de una referencia de Google es un método económico para generar un aumento de membresía impulsado por la demanda sin alienar a los lectores ‘capturados previamente’.

Aunque siempre ha habido recopilación de datos ventajas en este tipo de participación de primera persona (es decir, un inicio de sesión ‘local’), es probable que la caída del seguimiento entre dominios eleve la práctica de ‘ventajosa’ a una existencial necesidad para evitar los flujos de datos de marketing más escasos de FLOC y SKAdNetwork.

El ímpetu hacia la recopilación de datos de primera mano

La evidencia de una ‘fiebre del oro’ de datos propios es abundante. Según la opinión de un experto de la industria en Forbes, la caída de las cookies de terceros generará nuevas oportunidades para que las empresas seleccionar y vender datos de tercerosdonde tienen suficiente infraestructura propia para convertirse efectivamente en intermediarios de datos por derecho propio.

El análisis en otros lugares también pronostica que los minoristas (que invierten mucho en sistemas de recomendación de aprendizaje automático) convertirse en los nuevos ‘magnates de los medios’.

En una publicación de blog, la plataforma de monetización Setupad ejemplifica la intención de la industria de la publicidad de no acceder a sistemas federados de datos limitados como FLOC, declarando que ‘la segmentación por comportamiento es la respuesta al éxito futuro de los anunciantes’, y que la captación propia es el requisito previo absoluto para ello.

La segmentación por comportamiento es qué causó el cambio tectónico actual en la privacidad del consumidor en primer lugar; y es lo que las industrias de marketing y de influencers profesionales quieren recuperar: por poder, por sigilo o por cualquier otro medio, sin importar que eventualmente pueda arrastrar al sector de investigación del sistema de recomendación al fango con él.

El ‘Club’ de los First Party

Además del requisito de una infraestructura costosa, así como de recursos de seguridad y desarrollo, otro factor indica por qué es probable que prosperen solo las empresas más grandes en la era de los sistemas de recopilación de datos propios: una empresa necesitará una captura de mercado convincente para obligar a los consumidores. volver a los sistemas de inicio de sesión locales que se alegraron de abandonar hace una década.

Este es un movimiento arriesgado, incluso para un jugador importante, y el recuerdo de Digg’s fallecimiento en 2010 todavía atormenta al mundo del SEO y el marketing. Cuanto más convincente sea la captura de mercado de una empresa, menos perjudicial será este movimiento, con empresas más poderosas capaces de capear los valles y adaptarse mejor al ecosistema propio que las empresas más pequeñas.

Efectos en la investigación del sistema de recomendación

A medida que esta situación evolucione, puede amenazar el relativo ‘pase libre’ que la supervisión regulatoria ha otorgado a la investigación del sistema de recomendación de aprendizaje automático de compañías como Google, Amazon y Netflix.

Hasta cierto punto, las nuevas propuestas de la UE para la legislación de IA anticipan un mayor escrutinio de los sistemas de recomendación en cualquier caso. Aunque no está claro si la disposición del borrador contra las ‘técnicas subliminales más allá de la conciencia de una persona para distorsionar materialmente el comportamiento de una persona’ se aplicará a los sistemas de recomendación, es anticipado que los anunciantes y los investigadores del sistema de recomendación cabildearán por un trato excepcional.

Pero puede ser difícil defender la investigación del sistema de recomendación de delimitación en caso de que el enfoque de «jardín amurallado» se convierta en el nuevo estándar de la industria, y los pastos académicos tranquilos que han albergado este sector de la investigación de aprendizaje automático se conviertan en un alto nivel. semillero de volumen para el desarrollo de investigación conductual de primera parte comercializado masivamente.

Una gran inversión en flujos de trabajo de datos propios puede ser la única esperanza para recrear el mismo tipo de anuncios «psíquicos» altamente efectivos y propaganda política que caracterizó la era de Cambridge Analytica; pero para los reguladores, puede parecer que la muerte de la cookie de terceros simplemente movió prácticas ‘de mala reputación’ de las calles a locales cerrados. Si el efecto externo de esas actividades despierta la ira del público nuevamente, eso puede resultar un santuario escaso.

Deja un comentario