Un sistema de recomendación tiene como propósito estimar o predecir la preferencia de contenidos (juegos, cuentos, vídeos…) de un usuario, ayudándose de datos históricos de uso,con el fin de sugerirle material de su interés.
Un sistema de recomendación suele emplear varias fuentes de datos para conocer dichas preferencias, aprovechando un feedback explícito —resultado de diversas formas de valoración como por ejemplo “añadir a favoritos”— o implícito —derivado del número y duración de interacciones con el contenido.
Dentro del enfoque de feedback implícito, un algoritmo básico —aunque más elaborado que aquél que genera recomendaciones completamente al azar— consiste en reflejar el contenido más popular, agregando la actividad de todos los usuarios y recomendando el contenido más utilizado —en número y duración de “visitas”— que el usuario aún no ha visitado. Otro algoritmo con resultados significativos se basa en la recomendación de contenido recientemente publicado que aún no ha sido utilizado.
Un tercer algoritmo consiste en cuantificar la similitud de las preferencias de los usuarios —basándose en los contenidos visitados que éstos comparten— identificando grupos por “perfil de preferencia”. Una vez que dichos grupos son identificados, el modelo recomienda al usuario contenidos que todavía no ha utilizado pero que resultan atractivos a los miembros de su grupo. Este algoritmo se conoce como filtro colaborativo.
Finalmente, es posible emplear un algoritmo híbrido, es decir, que combine las predicciones de contenido basadas en los algoritmos de popularidad, novedad y filtrado colaborativo. Éste es el método que implementa Smile and Learn, generando listas de contenidos a recomendar según cada uno de los algoritmos para después fusionarlas y reordenar los elementos basándose en las nuevas puntuaciones de predicción de los contenidos.
Como suele ocurrir con los modelos de decisión basados en datos, cuanto más feedback se pueda recopilar sobre un usuario, más robusta será la predicción del modelo, por lo que resulta crucial que el contenido sea altamente interactivo. A medida que accedemos a nuevos datos, se dibuja un escenario prometedor en el que somos capaces de detectar nuevos patrones, desarrollar hipótesis más explicativas y diseñar progresivamente métricas más informativas —y en definitiva, relevantes— de uso y aprendizaje.
Equipo de Data Science de Smile and Learn