¿Qué significa machine learning?
La definición de machine learning o aprendizaje automático (ML) es la subcategoría de la inteligencia artificial (IA) que construye modelos algorítmicos para identificar patrones y relaciones en los datos. En este contexto, la palabra máquina es sinónimo de programa informático y la palabra aprendizaje describe cómo los algoritmos de ML se vuelven más precisos a medida que reciben datos adicionales.
El concepto de machine learning no es nuevo, pero su aplicación práctica en los negocios no fue económicamente viable hasta la llegada de Internet y los recientes avances en el análisis de big data y la computación en nube. Esto se debe a que entrenar un algoritmo de ML para encontrar patrones en los datos requiere muchos recursos informáticos y acceso a big data.
Los términos inteligencia artificial y machine learning se utilizan a veces como sinónimos porque, hasta hace poco, la mayoría de las iniciativas de IA eran limitadas y la mayoría de los modelos de ML se creaban para realizar una única tarea, utilizaban el aprendizaje supervisado y requerían grandes conjuntos de datos etiquetados para el entrenamiento. Hoy en día, la automatización de procesos robóticos (RPA) puede utilizarse para automatizar el proceso de preprocesamiento de datos y hacer que el entrenamiento de un algoritmo de machine learning sea mucho más rápido.
Definición de machine learning (ML)
Los modelos de machine learning de alta calidad requieren datos de entrenamiento de alta calidad y acceso a grandes conjuntos de datos para extraer las características más relevantes para los objetivos empresariales especificados y revelar asociaciones significativas.
Modelos de machine learning
Un modelo de machine learning es simplemente el resultado de un algoritmo de ML que se ha ejecutado en los datos. Los pasos necesarios para crear un modelo de machine learning son los siguientes:
- Recopilar datos.
- Preparar los datos para el entrenamiento.
- Decidir qué algoritmo de aprendizaje utilizar.
- Entrenar el algoritmo de aprendizaje.
- Evaluar los resultados del algoritmo de aprendizaje.
- Si es necesario, ajustar las variables (hiperparámetros) que rigen el proceso de entrenamiento para mejorar los resultados.
En un entorno típico de ML, los algoritmos de machine learning supervisado requieren de un conjunto de datos compuesto por ejemplos en el que cada ejemplo consta de una entrada y una salida. En este contexto, un objetivo típico del entrenamiento de un algoritmo de ML es actualizar los parámetros de un modelo predictivo para garantizar que los árboles de decisión del modelo produzcan sistemáticamente los resultados deseados. Aquí es donde entra en juego la entropía.
La entropía es una fórmula matemática utilizada para cuantificar el desorden y la aleatoriedad en un sistema cerrado. En los proyectos de machine learning, un objetivo importante es asegurarse de que la entropía se mantiene lo más baja posible, ya que esta medida determinará cómo los árboles de decisión del modelo elegirán dividir los datos.
Entrenamiento del machine learning
Hay tres tipos principales de algoritmos utilizados para entrenar modelos de machine learning: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo.
- Aprendizaje supervisado: el algoritmo recibe datos etiquetados de entrenamiento (entrada) y se le muestra la respuesta correcta (salida). Este tipo de algoritmo de aprendizaje utiliza resultados de conjuntos de datos históricos para predecir valores de salida para datos nuevos.
- Aprendizaje no supervisado: el algoritmo recibe datos de entrenamiento no etiquetados. En lugar de pedirle que prediga la salida correcta, este tipo de algoritmo de aprendizaje utiliza los datos de entrenamiento para detectar patrones que luego pueden aplicarse a otros grupos de datos que muestran un comportamiento similar. En algunas situaciones, puede ser necesario utilizar una pequeña cantidad de datos etiquetados con una mayor cantidad de datos sin etiquetar durante el entrenamiento. Este tipo de entrenamiento suele denominarse machine learning semisupervisado.
- Aprendizaje por refuerzo: en lugar de recibir datos de entrenamiento, el algoritmo recibe una señal de recompensa y busca patrones en los datos que le proporcionen la recompensa. La entrada de este tipo de algoritmo de aprendizaje suele proceder de la interacción del algoritmo con un entorno físico o digital.
¿Cuáles son las causas de los sesgos en el machine learning?
Existe un deseo creciente por parte del público en general de que la inteligencia artificial -y los algoritmos de machine learning en particular- sean transparentes y explicables, pero la transparencia algorítmica para el machine learning puede ser más complicada que simplemente compartir qué algoritmo se utilizó para hacer una predicción en particular.
Muchas personas que se inician en el machine learning se sorprenden al descubrir que no son los algoritmos matemáticos los que son secretos; de hecho, la mayoría de los algoritmos de machine learning que se utilizan hoy en día son de libre acceso. Son los datos de entrenamiento los que tienen valor patentado, no el algoritmo utilizado.
Lamentablemente, dado que los datos utilizados para entrenar un algoritmo de aprendizaje son seleccionados por un ser humano, pueden introducir inadvertidamente sesgos en el modelo de ML que se está construyendo. La naturaleza iterativa de los algoritmos de aprendizaje también puede dificultar que los ingenieros de ML vuelvan atrás y rastreen la lógica que hay detrás de una predicción concreta.
Cuando es posible que un científico de datos o un ingeniero de ML explique cómo se hizo una predicción específica, un modelo de ML puede denominarse IA explicable. Cuando no es posible revelar cómo se hizo una predicción específica, ya sea porque las matemáticas son demasiado complicadas o porque los datos de entrenamiento son confidenciales, el modelo de ML puede denominarse black box AI.
MLops
Los proyectos de machine learning suelen estar supervisados por científicos de datos e ingenieros de machine learning. El trabajo del científico de datos suele consistir en crear una hipótesis y escribir código que, con suerte, demostrará que la hipótesis es cierta. El trabajo de un ingeniero de ML se centra en operaciones de machine learning (MLOps).
Las operaciones de machine learning son un enfoque para gestionar todo el ciclo de vida de un modelo de machine learning, incluida su formación, ajuste, uso diario en un entorno de producción y eventual retirada. Por este motivo, los ingenieros de ML deben tener conocimientos prácticos de modelado de datos, ingeniería de funciones y programación, además de una sólida formación en matemáticas y estadística.
Lo ideal sería que los científicos de datos y los ingenieros de ML de la misma organización colaboraran a la hora de decidir qué tipo de algoritmo de aprendizaje funcionará mejor para resolver un problema concreto, pero en algunos sectores el trabajo del ingeniero de ML se limita a decidir qué datos deben utilizarse para el entrenamiento y cómo se validarán los resultados del modelo de machine learning.