Últimamente hemos hablado de la Inteligencia Artificial, el Machine Learning y el Deep Learning, una serie de conceptos íntimamente relacionados sobre los que sabemos cada vez más y que son empleados en todos los ámbitos empresariales. Para comprender un poco mejor cómo funcionan, hablaremos un poco más sobre el aprendizaje y sobre qué tipos de aprendizaje encontramos en los algoritmos que se utilizan en Inteligencia Artificial.
ÍNDICE
Para poder comprender mejor estos conceptos, debemos conocer el significado oficial de la palabra. Si tomamos a la RAE como guía, podemos encontrar varias definiciones:
De ambas podemos sacar una conclusión: que es duradero en el tiempo y que se realiza mediante el ejercicio práctico.
Aunque existen muchos tipos, podemos destacar dos tipos de aprendizaje muy utilizados en este campo para entrenar a las máquinas y dispositivos a comprender un conjunto de datos: el aprendizaje supervisado y el aprendizaje no supervisado.
De los dos tipos de aprendizaje que se utilizan en el Machine Learning, el aprendizaje supervisado es el más común. Se le denomina así porque es el desarrollador o programador (es decir, un ser humano) el que actúa como guía para enseñar al algoritmo las conclusiones a las que debe llegar. O sea, la salida del algoritmo ya es conocida previamente. Este aprendizaje incluye tipos de algoritmos como la regresión lineal y logística o máquinas de vectores de soporte, entre otros. Es muy similar a la forma en la que los niños aprenden de sus profesores y requiere que los posibles resultados del algoritmo ya sean conocidos y que los datos utilizados para entrenar y educar al algoritmo ya estén etiquetados con las respuestas correctas.
En conclusión, es un aprendizaje cerrado porque se supervisa que para determinado dato X, el algoritmo aprenda determinado dato Y.
Un ejemplo muy aclarador es la clasificación de nuestros e-mails en las distintas bandejas que tenemos en nuestro correo electrónico.
¿Cómo son capaces los sistemas de clasificar un e-mail como SPAM y cómo pueden mandar otro directamente a la bandeja de entrada? Es muy sencillo, aprenden millones y millones de datos a los que se les asocia determinadas palabras como SPAM. Así, un e-mail de un cliente o un amigo aparecerá en tu bandeja de entrada, y una promoción sospechosa con productos de baja calidad probablemente acabe en SPAM. No siempre sucede así, porque las máquinas también cometen errores y están en constante aprendizaje (como los seres humanos). Puede ocurrir que un correo importante que llevamos esperando varias semanas esté por error en la bandeja SPAM. ¿Os habéis fijado que Google te pregunta si el mensaje sospechoso es SPAM?
Así aprenden los softwares y los dispositivos. Cuando los usamos, nosotros mismos les estamos enseñando qué es SPAM y qué no lo es. Parece que la Inteligencia Artificial es algo que nos es ajeno en el día a día, pero está mucho más presente en nuestras vidas de lo que somos conscientes.
Por otro lado, el aprendizaje no supervisado está más estrechamente alineado con la Inteligencia Artificial ya que da la idea de que una máquina puede aprender a identificar procesos y patrones complejos sin necesidad de que un ser humano le proporcione orientación y supervisión a lo largo del proceso de aprendizaje. Algunos ejemplos de algoritmos de aprendizaje no supervisado incluyen el agrupamiento y las reglas de asociación. En el caso de este tipo de aprendizaje no existe un conjunto de datos de entrenamiento previo, se aborda el problema de manera ciega y sólo con operaciones lógicas para guiarlo. Aunque a primera vista parece imposible, se trata de la capacidad de resolver problemas complejos utilizando sólo datos de entrada y los algoritmos lógicos. Se evita así el uso de datos de referencia.
Un ejemplo que puede resumir estos dos aprendizajes sería el siguiente: en un conjunto de datos encontramos hexágonos y pentágonos de color negro y de color blanco. Con el aprendizaje supervisado, la solución de este problema sería bastante sencillo. Consistiría en enseñar a la máquina varias cosas: primero, que la forma con seis lados es un hexágono, que la forma con cinco lados es un pentágono, y que determinado valor de luz en un píxel concluye que se trata de color negro y de color blanco. De esta manera el algoritmo aprende a distinguir sólo pentágonos blancos, pentágonos negros, hexágonos blancos, y hexágonos negros. Con el aprendizaje no supervisado, el algoritmo es capaz de reconocer determinado número de lados y determinados píxeles de color. Así, cuando se le presenten nuevas formas, sabrá reconocer si algunas se asemejan en lados o en color a estas formas y clasificarlos de manera correcta.
No se puede concluir qué tipos de aprendizaje es mejor o más útil, todo dependerá de las necesidades y objetivos de las empresas y de los sectores que hagan uso de esta tecnología. Pero, sobre todo, la elección de uno u otro para entrenar los algoritmos del Machine Learning dependerá del volumen y la estructura de los datos con los que haya que trabajar. Normalmente se suelen utilizar los dos tipos de aprendizaje mezclados para que estos aborden los problemas y resuelvan los desafíos de una manera más amplia, sobre todo si el problema a resolver es muy complejo y tenga que construir modelos de datos predictivos.