Escenarios de aplicación de Machine Learning: Introducción para el negocio

El Aprendizaje Automático o Machine Learning (ML) es un área de la Inteligencia Artificial centrada en construir sistemas capaces de aprender de forma más o menos automatizada, y que además sean capaces de mejorar sus resultados en el tiempo mediante entrenamiento. Su modus operandi general consiste en identificar patrones complejos en grandes volúmenes de datos para predecir comportamientos futuros de esos datos mediante algoritmos diseñados para este fin. La gran potencia de computación que proporciona la nube ha supuesto un impulso decisivo para aterrizar estas técnicas de Inteligencia Artificial en el mundo de la empresa, con una relación coste-beneficio muy favorable.

En este documento se recogen algunos de los algoritmos de Machine Learning más conocidos en los que se mezclan redes neurales pre-entrenadas y algoritmos heurísticos. En todo caso, considérese que según sea el escenario, es posible desarrollar algoritmos diferentes y entrenar redes específicas adicionales a las que se ilustran en este documento.

La gran mayoría de estos algorítmicos son estadísticos, es decir, se basan en la experiencia y el conocimiento que se obtenga a partir de un volumen importante de datos históricos que sirven como base de entrenamiento y aprendizaje.

Clasificadores

Los clasificadores son un tipo de algoritmo de Machine Learning capaces de separar conjuntos de datos en diferentes clases (conjuntos disjuntos), prediciendo uno de los campos a partir de los demás.

Camposs a evaluar y Campo a predecir
Campo ACampo BCampo CCampo DResultado

Ejemplos:

  • Sugerencia de películas: Si alguien ha visto Starwars, Alien y ET, queremos saber si le puede interesar ver Jurassic Park. Con suficientes datos un clasificador pudiera inferir si es probable que este individuo esté en el mismo conjunto de los que se han interesado por Jurassic Park.
  • Sugerencia de compras: Se pueden sugerir determinados productos evaluando los que has comprado a partir de comparar tus compras con las de otros compradores. El clasificador te sugerirá productos que otros han comprado si tú has comprado productos similares a los suyos.

Multi-clasificadores

Son como una extensión de los clasificadores, pero a la inversa, es decir, estos algoritmos deducen varios campos a partir de uno.

Ejemplos:

  • Extracción de semántica: Se puede deducir que un documento sobre las olimpiadas trata de: deportes, atletas, países, eventos, etc.
  • Identificación de tipos de errores: Tras recibir una incidencia, se puede aspirar a deducir sus áreas semánticas principales: por ejemplo: “La caldera de la calefacción ha dejado de funcionar” se deduce: avería, inmueble, servicio, temperatura

Selectivos

Permiten seleccionar un elemento de una lista a partir de evaluar los campos de los elementos que la componen.

Ejemplos:

  • Selección de miembros para participar en un determinado proyecto para un cliente. Se evalúan campos como: experiencia en ese tipo de proyecto, disponibilidad, relación previa con el cliente, etc.

Regresión

A partir de una serie de valores numéricos se predicen posibles valores futuros.

Ejemplos:

  • Predecir variaciones de precios de activos inmobiliarios.
  • Predicción de evolución de temperatura: A partir de la ingesta de valores de temperatura, predecir posible comportamiento futuro de la temperatura en un futuro próximo.

Detección de anomalías

Estos algoritmos primero aprenden patrones de comportamiento de determinados conjuntos de datos y posteriormente son capaces de detectar cambios sutiles o relevantes sobre el patrón: Anomalías.

Ejemplos:

  • Detección anticipada de problemas cardíacos (Salud)
  • Prevención de averías en equipamiento de fabricación o procesamiento (Industria)
  • Detección de irregularidades contables o similares para auditorías (Finanzas)
  • Detección de pautas sospechosas de pagos para prevenir blanqueo de capitales (Banca)

Casos combinados

Aunque no son propiamente algoritmos de ML, sí que son patrones que comúnmente se utilizan estratégicamente para atacar problemas que de primeras son muy complejos o no encajan perfectamente con casos fácilmente tipificados.

Pipes

Un pipe (o tubería) es un enlace en línea de varios algoritmos, donde la salida de un algoritmo es la entrada del siguiente en la cadena:

Ejemplo: Sugerir el departamento que puede ocuparse de una incidencia técnica. Pasos:

  1. Deducir las áreas semánticas a partir del texto de la incidencia (multi clasificador)
  2. Con las áreas semánticas, sugerir un departamento (clasificador)
  3. A partir de la información de los operadores de asistencia técnica, filtrar por el departamento resultante del paso 2 y recomendar uno (algoritmo selectivo) según datos de ubicación, momento, disponibilidad, experiencia, etc.

Selección evolutiva

La selección evolutiva es una estrategia para reducir los tiempos de desarrollo de una solución de ML eficiente y precisa. Puede involucrar lo siguiente:

  • Competición: Entrenamiento en paralelo para reducir tiempos de desarrollo. Se entrenan varias redes y se va evaluando el grado de fiabilidad de cada una (cuán “lista” es resolviendo el problema), La ganadora será la que tenga mejor grado de fiabilidad.
  • Selección generacional: Se definen períodos de entrenamiento donde al final de cada uno se evalúa la fiabilidad de las redes, se desechan las peores y con las mejores se hacen replicas o combinaciones de las mismas para completar una nueva generación, con las cuales se prosigue el entrenamiento en el siguiente período.

Inteligencia de Enjambre

Se entrenan diferentes redes (típicamente pequeñas) para el mismo propósito, y con algoritmos de enjambre se intenta que entre todas encuentren soluciones a problemas.

Ejemplos:

  • Encontrar rutas eficientes entre lugares.
  • Realizar diagnósticos conjuntos entre diferentes redes que pueden estar entrenadas a partir de datos de distinto origen, región, historial médico o grupos étnicos.
  • Pronósticos financieros: Diferentes redes que hacen predicciones a partir de diferentes datos de múltiples áreas semánticas, colaboran para predecir a largo plazo las pérdidas o ganancias que se puedan obtener de aplicar determinada inversión.

Autor: Mario del Valle, Consultor de Inteligencia Artificial (ilitia Technologies)