Memorias de una máquina

Memorizar o aprender, he ahí el dilema

por Javier Pisonero Carabias

¿Qué pasaría si los líderes políticos de las últimas elecciones nacionales fueran los protagonistas de una serie de acción? Esta pregunta, por desgracia, parece que nunca va a tener solución. Sin embargo, gracias al deepfake existe una pequeña aproximación que, sin duda, deja con ganas de más.

Realmente el deepfake no es el nombre real de ninguna tecnología o ciencia, sino que es el nombre de una aplicación concreta. El deepfake consiste en cambiar la cara de una persona en un video ya grabado. Para esto se hace uso del Deeplearning. ¿Y qué es el Deeplearning? Más fácil de comprender si se escribe en español. Deeplearning significa aprendizaje profundo. Pero como siempre, aprende la máquina. Concretamente la máquina universal que se nos ha forzado a utilizar en cualquier ámbito, el ordenador.

Si hacemos retrospectiva, el ser humano siempre se ha planteado imposibles, hasta que dejan de serlo. Como puede ser volar, llegar a la luna… Y ahora el ser humano parece empeñado en ser sustituido por máquinas que empiezan a llamarse inteligentes. Hay que tener mucho cuidado con ese término inteligente, por ejemplo, en un electrodoméstico. Una lavadora inteligente va a ahorrar agua y detergente, cosa que no está mal, pero no te va a ayudar en tu trabajo o a recomendarte un libro de literatura universal. En este afán el ser humano quiere dar un paso hacia delante, haciendo que las propias máquinas piensen, puedan tomar decisiones, puedan diferenciar aspectos cotidianos. Por ese motivo se ha creado la llamada Inteligencia Artificial. Menos mal que soy científico (con muchas comillas) y no filósofo.

El Deeplearning es un conjunto de procesos, algoritmos que hacen que se puedan modelar aspectos intangibles. Todos sabríamos diferenciar un perro y un gato. Pero si te preguntase directamente que me explicaras las diferencias, ¿podrías no llegar a ambigüedades? La cosa se complica, pero realmente no es imposible. Aunque parezca una bobada, existen concursos en los que se dan imágenes de perros y gatos y a través de inteligencia artificial se debe decir que es cada cosa. En estos concursos suele ganar el Deeplearning.

Para el Deeplearning se suelen utilizar las conocidas como redes neuronales artificiales. No es más que dar un conjunto de datos con un peso especificado y sumar las probabilidades de que ocurra una cosa u otra. Es algo muy parecido a cuando nos hacían la media ponderada. Si un trabajo contaba un 80% y el examen un 20%, pondremos más esfuerzo en el trabajo que en preparar el examen. Muy aproximado, una red neuronal, al menos matemáticamente, funciona así. Como siempre se puede profundizar mucho más, pero Juan me obliga a no extenderme demasiadas páginas así que echadle la culpa a él.

En definitiva, a cada rasgo de interés se le asigna un peso y a través de operaciones convolucionales, lógicas, se obtiene un modelo final de probabilidades. Realmente, dar estos pesos es un poco prueba/error, quien haga este modelo sabe el resultado final sobre un caso muy concreto. Entonces de manera iterativa se van dando pesos hasta que la red neuronal funcione correctamente. A este proceso es al que se llama entrenamiento. Que realmente es un aprendizaje de la máquina, de ahí el nombre.

Y aquí es donde aparece un momento crítico en cualquier modelización de una red neuronal, y es asegurarse de que una red aprenda, y no memorice. Porque si memoriza, en cuanto se introduzcan datos que no están tan optimizados como los que se usan para el entrenamiento todo se viene abajo.

Esto es algo que me preocupa fuera de este procedimiento. Gracias al Deeplearning se está pudiendo diagnosticar Cáncer en un momento tratable, se está pudiendo llegar a la conducción autónoma, etc. Osea que la cosa es gorda no solo es una gracieta para ver a Lola Flores en un anuncio de cervezas. ¿Si la máquina simplemente memorizase podría llegar a detectar un melanoma a través de una fotografía? Seguramente no, o el resultado sería muy erróneo.

Entonces, si mimamos tanto el procesado de un ordenador, ¿qué pasa con nosotros, los humanos? ¿Por qué tenemos que memorizar y no aprender para obtener títulos? Quizás un doctorado sea el único grado de enseñanza en el que no se memoriza, ya que directamente se desarrolla. Pero en cualquier otro caso, incluso en un curso, la metodología consiste en memorizar y no aprender. Al final cuando a alguien le interesa algo, pone empeño y acaba aprendiendo. Quizás quiere esto decir que quien nos dice que no sabemos inglés porque se enseña mal, ¿tiene razón? Bueno ya tenemos todos una edad y un criterio, no os tengo que decir nada.

Pero es bastante importante que en cualquier grado de enseñanza, lo primordial sea priorizar el aprendizaje a la memorización. Si una máquina entrenada puede detectar cáncer, ¿qué podrían hacer miles de personas que aprenden y no memorizan? Quizás, se me ocurre, no cometer los errores históricos cometidos en el pasado. En fin, el tema es complejo, no quiero decir que todo lo que se hace está mal, pero si priorizamos ciertas cosas en máquinas, quizás hacérselo mirar para las personas. Dejemos la memoria para aquellos momentos especiales, que tarde o temprano volverán a escribirse.

REFERENCIA

Zakharov, E., Shysheya, A., Burkov, E., & Lempitsky, V. (2019). Few-shot adversarial learning  of realistic neural talking head models. In Proceedings of the IEEE/CVF international Conference on Computer Vision (pp. 9459-9468)

EL EQUIPO E

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s