El valor escondido en la diversidad de los clientes

Gestión de contenido online con Machine Learning.
Por Luis Muñoz Márquez, el 8 de octubre de 2018

Lunes, 11 am. Nico y yo bajamos al Starbucks frente a nuestra oficina en La Concepción, Providencia, a buscar unos cafés del día, combustible principal de I2B Labs.

“Dos americanos a nombre de Nico y Mario y un café con leche entera para Lucho”.

“Oye, pero a Mario le gusta con leche igual, descremada”. Nos detiene Brenda, la barista, antes de servir nuestros vasos.

Este tipo de experiencias hacen que visitemos y pasemos más tiempo en esta cafetería que otras del sector. Nos preguntamos cómo se podría ofrecer una experiencia similar en una multitienda. Imagina por un momento que tan solo con entrar en ella te encuentras en un piso repleto de productos de tu interés, que el staff sabe qué estás buscando y que la información y publicidad desplegadas te sirven como consumidor. Además imagina que esta experiencia es única para cada persona que entra en la tienda.

Por otro lado, la multitienda tradicional muestra una sola cara a todos sus clientes y está diseñada para atraer al público general o a un segmento en específico. Todos aquellos clientes que no encajen en estas descripciones se llevan una experiencia de consumo mediocre.

Quizás la multitienda ideal que imaginamos sea muy costosa de llevar a cabo en forma física, pero en el espacio del eCommerce existe la tecnología para hacerla realidad.

Con esta idea en mente montamos un experimento rápido en el home del eCommerce de una multitienda líder en Chile. Para hacerlo simple: de un pool de 6 banners publicitarios nos propusimos mostrar los mejores 3 a través de machine learning. Para los usuarios con historial de actividad se adaptaba en torno a sus gustos; para los usuarios anónimos, en tanto evolucionaba la preferencia general. La métrica de éxito fue el click-through rate (CTR), que representa el porcentaje de impresiones que terminaron en un click, para cada banner. Como benchmark a superar, el gerente de marketing propuso los 3 banners que él hubiera mostrado en el home y competimos en un A/B test de un mes.

Ejemplos de banners mostrados.

Resultados

El resultado fue un aumento en CTR de este conjunto de un 15,4% y un 15,9%, para el grupo con historial y para el grupo anónimo respectivamente. Es decir, para el mismo número de impresiones que conseguían 100 clicks en promedio con la configuración del gerente, nuestro algoritmo obtenía 115. Los niveles de significancia estadística de los experimentos respectivos fueron de 97% y >99%, lo que significa, muy probablemente, que esos resultados no fueron mera casualidad.

En ambos experimentos nuestro algoritmo aprendió mediante la interacción de los usuarios con los banners. Para el caso anónimo el algoritmo identificó correctamente las dos mejores combinaciones en términos de CTR general, es decir, las que tendrían mejor desempeño si fueran la única que se le muestra a todos los clientes. Presentamos una visualización de estos resultados donde los puntos azules son los CTRs obtenidos por cada combinación y las barras anaranjadasla cantidad de impresiones que el algoritmo decidió para cada una. Todas las combinaciones fueron mostradas en un comienzo, pero en cuanto el algoritmo identificó las de mejor desempeño, empezó a dedicar más impresiones a estas. Resulta interesante notar que las combinaciones con CTRs similares comparten dos banners, en general.

Para el caso con historial de actividad el análisis es un poco más delicado. Es importante entender que clientes con distintos gustos tienen distintas propensidades a hacer click en distintos diseños de banner. Nuestro algoritmo, además de observar la interacción de los clientes con los banners, contaba con información acerca de las compras históricas de cada uno. Con esta información el objetivo no es simplemente encontrar la combinación que tiene el mejor desempeño general, sino que para cada cliente encontrar la combinación que le genere mayor interés a él en particular.

En la visualización de este experimento podemos ver que el algoritmo no muestra una única combinación a la mayoría de los clientes como en el caso anónimo. Esto se debe a que la información de compras históricas permite al algoritmo aprender, por sí solo, una manera de segmentar a los clientes a través de sus gustos publicitarios. En el caso ideal, esto se traduce en que cada cliente es recibido con la combinación de su mayor interés, aumentando simultáneamente el CTR de cada banner, ya que se minimiza el número de impresiones a clientes no interesados, y además mejora su experiencia de navegación. Ahora el problema se convierte en hacer el mejor match banner-cliente.

Es importante saber que nuestro algoritmo es ciego en cuanto al contenido gráfico de los banners, de hecho estos podrían ser cualquier tipo de contenido web o estructura HTML, no solo publicidad. Esto entrega flexibilidad a la hora de implementar, ya que no requiere una representación matemática de los banners, como sí lo hacen técnicas tradicionales como association rules, collaborative filtering o matrix factorization (por esta razón hace un tiempo estamos desarrollando Rexys.ai, un gestor de contenido para sitios interesados en aumentar la interacción de sus usuarios). A cambio, el descubrimiento de las preferencias del usuario depende exclusivamente de la calidad y cantidad de datos disponibles acerca de su actividad en el sitio. El cliente navega por las categorías del sitio, realiza búsquedas, visita la página de un producto, lo añade al carro y lo compra. Toda esto debería estar registrado y disponible para ser consumido por baristas virtuales que aprendan a entregar una experiencia de consumo excepcional y personalizada.

En el caso de nuestro experimento, solo contábamos con la información de ventas agrupadas en un puñado de categorías por lo que no pudimos obtener un aprendizaje tan profundo como deseábamos acerca de los usuarios (aun así aprendió y aumentó el CTR en un 15,4%, con mejores datos habría sido más). Sin embargo, resultó satisfactorio, pues al analizar las combinaciones que obtuvieron un mejor CTR en el modelo personalizado, su contenido gráfico tiene una correspondencia razonable con el comportamiento de los clientes a quienes se mostró este banner. Es necesario recalcar que el modelo no tuvo un acceso directo al contenido de los banners y aprendió estas relaciones solo a través de la interacción por clicks. La imagen que acompaña este párrafo muestra los CTR del modelo personalizado versus el CTR que se obtendría al mostrar las imágenes de manera general. Se resaltan los mejores resultados, pues son estos donde la personalización resultó más precisa. Prueba de esto son las características de compras de los segmentos descubiertos por el algoritmo:

Para las combinaciones con mejor CTR del modelo personalizado (el aprendizaje más preciso) se muestran las categorías con más compras registradas por los clientes a quienes se les mostró. Nuestro modelo es capaz de asociar campañas de maquillaje y cama con clientes que han adquirido productos de esta categoría, aun sin tener ningún indicio del contenido de la publicidad.

Concluyo este artículo invitando a nuestros lectores a pensar la personalización como un factor central en la experiencia del cliente, que se enfoca en facilitar el contenido interesante y minimizar lo irrelevante. También a diseñar sistemas de recolección y estructuras de datos que permitan entender los gustos de sus usuarios.

Por último, para quienes quieran realizar experimentos de este tipo en sus propios sitios de mánera rápida y automatizada, los invito a visitar Rexys.ai, nuestro gestor de contenido diseñado en base a las ideas de este artículo.

#Entender la diversidad en los clientes como una oportunidad y no un obstáculo, ofrecer una experiencia personalizada es aumentar el valor de la marca como un gran producto.

Luis Muñoz Márquez

BI Data Scientist @ I2B Labs
luis.munoz@i2btech.com