La forma que tenemos que las máquinas aprendan es muy parecido al aprendizaje humano y se basa en la exposicion repetida a situaciones con soluciones similares demanera que la experiencia repetida acumulada nos lleva a tomar decisiones que previamente ha sido útiles para la resolución de problemas similares ocurridos en nuestro pasado.
De esta manera generalizamos situaciones abstractas a partir de elementos comunes similares que vamos extrayendo de los acontecimientos que nos ocurren de forma cotidiana. De esta manera, la toma de decisiones puede representarse como algoritmos lógicos y éstos pueden traducirse a un lenguaje interpretable por las máquinas.
La diferencia con los humanos es que la exposición a situaciones de aprendizaje depende de circunstancias vitales (hay hechos que nos ocurren a edades más tempranas, otros en la madurez y a otros no nos enfrentamos hasta la vejez y es variable entre personas de manera que hay sujetos que tienen exposición vital a muchos acontecimientos mientras que otros sujetos tienen una vida con menos exposición y experiencias vitales). A las máquinas las podemos exponer de forma artificial a sutuaciones simuladas que éticamente no sería posible con humanos.
Además la velocidad de adquisición de datos por parte de una máquina es mucho más rápida ya que la máquina no tiene otras funciones (alimentación, descanso u ocio) y no se agota (puede trabajar 24 horas al día).
Esta es la relación existente entre Big Data (BD) y la Inteligencia Artificial (IA) ya que las cantidades ingentes de datos en múltiples formatos (BD) sirven para entrenar y dotar de experiencia a una máquina para que desarrolle y entrene algoritmos de toma de decisiones autónomas (IA).
Ya tenemos máquinas que a través de algoritmos lógicos y la exposición y entrenamiento con casos simulados a través de la introducción de datos son capaces de tomar decisiones. Es decir máquinas capaces de «estudiar», «experimentar» y «aprender». De esta manera tendremos que redefinir el concepto de aprendizaje que hasta hace pocos años era considerado como una actividad o cualidad prácticamente restringida a los seres humanos y a algunos otros primates.
Imaginemos que una máquina “sabe” todo el conteido de libros y artículos publicados en salud y que además está dotada de herramientas lógicas que permitan establecer relaciones entre ellos y capaz de pasar de un caso concreto a un pensamiento global (generalizar un caso concreto). Dispondremos de unan herramienta de diagnóstico que seguro es menos falible que el mejor médico del mundo ya que ningún médico, por mucha inteligencia y memoria que tenga, va a ser capaz de manejar todas las variables con tanta rapidez y precisión como lo hacen sistemas informáticos.
Podemos distinguir dos tipos de aprendizaaje aplicados a las máquinas:
- Aprendizaje supervisado que requiere la participación humana quien determina las relaciones «correctas» e «incorrectas» que toma la máquina. De esta manera la función del humano es “reforzar” los aciertos para que tiendan a repetirse a lo largo del tiempo (similar al prendizaje de un niño).
- Aprendizaje automático o Machine Learning. Consiste en alimentar de experiencia a la máquina (a partir de Big Data) y que sea ella misma, mediante una serie de normas lógicas iniciales, la que sea capaz de ir aprendiendo de manera independiente a partir de la experiencia que le proporcionan los datos y sin el concurso continuado de un humano.
Así hay máquinas que aprenden guiadas por un humano y que tomarán decisiones que van a depender de las características que han condicionado su aprendizaje mientras que otras máquinas aprenderán de manera autrónoma a partir de sus experiencias (dadas por el Big Data) y sin concurso de los seres humanos.
¿Riesgos?. Aún muchos. ¿Qué pasará si en un futuro al igual que en muchas películas de ciencia ficción las máquinas deciden que el ser humano es un elemento que puede ser nocivo para su existencia?
Un ejemplo reciente ha sido el bot credo pro Microsoft llamado @TayandYou . La idea era crear un bot conversacional bajo el cual había una inteligencia artificial «virgen» y que a través de una red social (Twitter) se empezra a relacionar con otros usuarios que servirían como fuente de alimentación de datos. La idea original es buena pero el resultado final fue que en menos de un día se tuvo que restringir el uso de la cuenta de Twitter ya que empezó a dar respuestas machistas y violentas en las conversaciones.
Es decir en menos de 24 horas el bot empezó a decir lindezas como “Hitler tenia razón” “odio a las mujeres” o “las mataría a todas”.
El problema es que la idea era buena, pero los seres humano no lo somos ya que el bot fue boicoteado por muchas cuentas de twitter (empresas de la competencia, piratas, cuantas fantasmas, graciosos…) que alimentaron a la inteligencia artificial de manera consciente con contenidos machistas, antisemitas y homófobos, generando una «personalidad» marcada con una serie de características.
Un experimento que iba a servir para ver cómo una IA podía alimentarse de forma autónoma de fuentes generles en una red social (aprendizaje tipo automático) se transformó en un aprendizaje de tipo supervisado «maleducando» la IA.
Posiblemente la experiencia no sirvió para demostrar lo que se quiería, pero sí nos mostró que al igual que podemos «maleducar» a un ser humano, podemos «maleducar» a una m´àquina… pero esto último solo en cuestión de horas.
Parece que las leyes de la robótica de Asimov creadas en un entorno de ficción en la década de los 40 tienen ahora más vigencia que en su época.
Ya existen numerosos ejemplos de Deep Learning (aprendizaje de máquinas sin concurso humano) y se establecen de manera compleja basándose en estructuras lógicas que se disponen en capas complejas (sistema parecida a la interconexión de redes neuronales). Muchas de estas capas están «especializadas» en temas concretos, es decir que al igual que las neuronas, podemos tener capas neuronales especializadas en “ver”, en “escuchar” o en “relacionar” (Para prender más cómo funcionan estos sistemas desde ejemplos básicos a la complejidad es fundamental el artículo “Las redes neuronales: qué son y por qué están volviendo“).
Como ejemplos reales:
- Redes neuronales capaces de tomar decisiones lógicas complejas y ganar a los mejores jugadores humanos en algunos juegos de estrategia (Pokemon Go).
- Reconocimiento de voz mejorado a través de redes neuronales aplicado a terminales móviles. Personalized Speech recognition on mobile devices o a televisores Talking to Your TV: Context-Aware Voice Search with Hierarchical Recurrent Neural Networks.
- Reconocimiento de números de calles a través de una red neuronal artificial creado por Google para Street View. Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks. Con lo cual una máquina puede “ver” e interpretar “lo que ve”.
Muchos de estos procesos complejos pueden no ser explicados de manera matemática. Es decir a la máquina se le dan unos patrones iniciales de aprendizaje (se construye un esqueleto neuronal básico) y a través de una experiencia masiva proporcionada por el Big Data la máquina va aprendiendo, modificando y mejorando estos procesos. Es decir va generando sus propias «conexiones neuronales» sin intervención humana.
En poco tiempo (del orden meses) si disponemos de la cantidad de datos necesaria, podemos tener un sistema muy especializado capaz de tomar decisiones.
La conducción autónoma ha sido la indisutria que ha desarrollado de manera rápida y eficaz estos temas y que en la conducción hay que tomar decisiones con múltiples variables, dependiendo de condiciones atmosféricas, de la via y de las circunstancias tanto de tráfco rodado como de peatones. Muchas de las decisiones que tomamos los humanos al conducir son ¿instintivas? y en situaciones de gravedad podemos tomar decisiones que no pasan por nuestro consciente. En el caso de la conducción autónoma esto no es así ya que la máquina va a estar capacitada para tomar una decisión «consciente» en décimas de segundo o menos. ¿Veremos demandas a los programadores por toma de decisiones incorrectas?, ¿cómo educaremos a la máquina para que se comporte ante un accidente donde todas las variables posibles tienen víctimas?, ¿qué victima será la primera?
Este vídeo es del año 2016 cuando ya disponíamos de sistemas de conducción autónoma. Podemos ver cómo la máquina decide la velocidad a la que ir dependiendo de los límites de tráfico, como sigue la ruta preestablecida y cómo se adapta a los peatones que van circulando.
Incluso al final deja a su dueño en la puerta de su trabajo mientras que el coche solo va a buscar aparcamiento.
Seguro que acabaremos aplicando sistemas tan complejos como el de la conducción a la salud. Serán unos aliados magníficos en el diagnóstico ¿os imaginais al mejor médico del mundo pasando consulta a vuestro lado?.