Los 5 «mejores» libros sobre aprendizaje automático e IA de todos los tiempos (diciembre de 2022)

El mundo de la IA puede ser intimidante debido a la terminología y los diferentes algoritmos de aprendizaje automático disponibles. Después de haber leído más de 50 de los libros más recomendados sobre aprendizaje automático, he compilado mi lista personal de libros imprescindibles.

Los libros que se eligieron se basan en los tipos de ideas que se presentan y qué tan bien se presentan diferentes conceptos como el aprendizaje profundo, el aprendizaje por refuerzo y los algoritmos genéticos. Lo que es más importante, la lista se basa en los libros que mejor allanan el camino a los futuristas e investigadores hacia la construcción de una IA demostrablemente responsable y explicable.

#5. Vida 3.0 por Max Tegmark

Vida 3.0” tiene un objetivo ambicioso y es explorar las posibilidades de cómo coexistiremos con la IA en el futuro. La Inteligencia General Artificial (IAG) es la eventual e inevitable consecuencia de la argumento de explosión de inteligencia hecho por el matemático británico Irving Good en 1965. Este argumento estipula que la inteligencia sobrehumana será el resultado de una máquina que puede mejorar continuamente. La famosa cita de la explosión de inteligencia es la siguiente:

“Que una máquina ultrainteligente se defina como una máquina que puede superar con creces todas las actividades intelectuales de cualquier hombre, por inteligente que sea. Dado que el diseño de máquinas es una de estas actividades intelectuales, una máquina ultrainteligente podría diseñar máquinas aún mejores; entonces incuestionablemente habría una ‘explosión de inteligencia’, y la inteligencia del hombre quedaría muy atrás. Por lo tanto, la primera máquina ultrainteligente es el último invento que el hombre necesita hacer”.

Max Tegmark lanza el libro a un futuro teórico de vivir en un mundo controlado por un AGI. A partir de este momento surgen preguntas explosivas como ¿qué es la inteligencia? ¿Qué es la memoria? ¿Qué es el cómputo? y, ¿qué es aprender? ¿Cómo estas preguntas y posibles respuestas conducen eventualmente al paradigma de una máquina que puede usar varios tipos de aprendizaje automático para lograr los avances en la superación personal que se necesitan para lograr la inteligencia a nivel humano y la inevitable superinteligencia resultante?

Estos son el tipo de pensamiento progresista y preguntas importantes que explora Life 3.0. Life 1.0 son formas de vida simples, como las bacterias, que solo pueden cambiar a través de la evolución que modifica su ADN. Life 2.0 son formas de vida que pueden rediseñar su propio software, como aprender un nuevo idioma o habilidad. Life 3.0 es una IA que no solo puede modificar su propio comportamiento y habilidades, sino que también puede modificar su propio hardware, por ejemplo, actualizando su yo robótico.

Solo cuando comprendemos los beneficios y las dificultades de un AGI, podemos comenzar a revisar las opciones para asegurarnos de construir una IA amigable que pueda alinearse con nuestros objetivos. Para hacer esto, es posible que también necesitemos comprender qué es la conciencia. ¿Y en qué se diferenciará la conciencia de la IA de la nuestra?

Hay muchos temas candentes que se exploran en este libro, y debería ser una lectura obligatoria para cualquier persona que realmente desee comprender cómo AGI es una amenaza potencial, además de ser un salvavidas potencial para el futuro de la civilización humana.

¿Qué sucede si logramos construir un agente inteligente, algo que perciba, que actúe y que sea más inteligente que sus creadores? ¿Cómo convenceremos a las máquinas para que consigan nuestros objetivos en lugar de los suyos propios?

Lo anterior es lo que lleva a uno de los conceptos más importantes del libro “Compatible con los humanos: la inteligencia artificial y el problema del control” es que debemos evitar “poner un propósito en la máquina”, como dijo una vez Norbert Wiener. Una máquina inteligente que está demasiado segura de sus objetivos fijos es el último tipo de IA peligrosa. En otras palabras, si la IA no está dispuesta a considerar la posibilidad de que se equivoque al realizar su propósito y función preprogramados, entonces puede ser imposible que el sistema de IA se apague solo.

La dificultad, tal como lo describe Stuart Russell, es instruir a la IA/robot de que no se pretende lograr ningún comando instruido a toda costa. No está bien sacrificar una vida humana para ir a buscar un café o asar al gato para que sirva de almuerzo. Debe entenderse que “llévame al aeropuerto lo más rápido posible”, no implica que se puedan infringir las leyes de exceso de velocidad, aunque esta instrucción no sea explícita. En caso de que la IA se equivoque en lo anterior, entonces la seguridad es un cierto nivel de incertidumbre preprogramado. Con cierta incertidumbre, la IA puede desafiarse a sí misma antes de completar una tarea, quizás para buscar una confirmación verbal.

En un artículo de 1965 titulado “Especulaciones sobre la primera máquina de ultrainteligencia“, IJ Good, un brillante matemático que trabajó junto a Alan Turing, afirmó: “La supervivencia del hombre depende de la construcción temprana de una máquina ultrainteligente”. Es muy posible que para salvarnos del desastre ecológico, biológico y humanitario debamos construir la IA más avanzada que podamos.

Este artículo seminal explica la explosión de inteligencia, siendo esta teoría que una máquina ultrainteligente puede diseñar máquinas aún mejores y superiores con cada iteración, y esto inevitablemente conduce a la creación de un AGI. Si bien el AGI inicialmente puede tener la misma inteligencia que un humano, superaría rápidamente a los humanos en un corto período de tiempo. Debido a esta conclusión inevitable, es importante que los desarrolladores de IA actualicen los principios básicos que se comparten en este libro y aprendan cómo aplicarlos de manera segura para diseñar sistemas de IA que sean capaces no solo de servir a los humanos, sino también de salvarlos de sí mismos. .

Como señaló Stuart Russell, retirarse de la investigación de IA no es una opción, debemos seguir adelante. Este libro es una hoja de ruta para guiarnos hacia el diseño de sistemas de IA seguros, responsables y demostrablemente beneficiosos.

Ray Kurzweil es uno de los principales inventores, pensadores y futuristas del mundo. The Wall Street Journal se ha referido a él como «el genio inquieto» y la revista Forbes se refiere a él como «la máquina de pensar definitiva». También es cofundador de Singularity University, y es mejor conocido por su innovador libro «The Singularity is Near». “Cómo crear una mente” aborda menos los problemas del crecimiento exponencial que son los sellos distintivos de su otro trabajo, en cambio se enfoca en cómo necesitamos entender el cerebro humano para aplicarle ingeniería inversa para crear la máquina de pensar definitiva.

Uno de los principios básicos descritos en este trabajo seminal es cómo funciona el reconocimiento de patrones en el cerebro humano. ¿Cómo reconocen los humanos los patrones en la vida cotidiana? ¿Cómo se forman estas conexiones en el cerebro? El libro comienza con la comprensión del pensamiento jerárquico, esto es comprender una estructura que se compone de diversos elementos que se organizan en un patrón, este arreglo luego representa un símbolo como una letra o carácter, y luego se organiza en un patrón más avanzado. como una palabra, y eventualmente una oración. Eventualmente, estos patrones forman ideas, y estas ideas se transforman en los productos que los humanos son responsables de construir.

Dado que es un libro de Ray Kurzweil, por supuesto, no pasa mucho tiempo antes de que se introduzca el pensamiento exponencial. Él «Ley de rendimientos acelerados‘ es un sello distintivo de este libro seminal. Esta ley muestra cómo las tecnologías y el ritmo de aceleración se aceleran debido a la tendencia de los avances a alimentarse a sí mismos, aumentando aún más la tasa de progreso. Este pensamiento se puede aplicar a qué tan rápido estamos aprendiendo a comprender y aplicar ingeniería inversa al cerebro humano. Esta comprensión acelerada de los sistemas de reconocimiento de patrones en el cerebro humano se puede aplicar para construir un sistema AGI.

Este libro fue tan transformador para el futuro de la IA que Eric Schmidt reclutó a Ray Kurzweil para trabajar en proyectos de IA después de terminar de leer este libro fundamental. Es imposible resumir todas las ideas y conceptos que se analizan en un artículo breve; sin embargo, es un libro instrumental que se debe leer para comprender mejor cómo funcionan las redes neuronales humanas para diseñar una red neuronal artificial avanzada.

El reconocimiento de patrones es el elemento clave para el aprendizaje profundo, y este libro ilustra por qué.

La hipótesis central de El algoritmo maestro es que todo el conocimiento (pasado, presente y futuro) se puede derivar de los datos mediante un único algoritmo de aprendizaje universal que se cuantifica como un algoritmo maestro. El libro detalla algunas de las principales metodologías de aprendizaje automático, brinda explicaciones detalladas de cómo funcionan los diferentes algoritmos, cómo se pueden optimizar y cómo pueden trabajar en colaboración para lograr el objetivo final de crear el algoritmo maestro. Este es un algoritmo que es capaz de resolver cualquier problema que le alimentemos, y esto incluye curar el cáncer.

El lector comenzará aprendiendo sobre Naïve Bayes, un algoritmo simple que se puede explicar en una ecuación simple. A partir de ahí, acelera a toda velocidad hacia técnicas de aprendizaje automático más interesantes. Para comprender las tecnologías que nos están acelerando hacia este algoritmo maestro, aprendemos sobre los fundamentos convergentes. Primero, de la neurociencia aprendemos sobre la plasticidad cerebral, las redes neuronales humanas. En segundo lugar, pasamos a la selección natural en una lección para comprender cómo diseñar un algoritmo genético que simule la evolución y la selección natural. Con un algoritmo genético, una población de hipótesis en cada generación se cruza y muta, a partir de ahí, los algoritmos más aptos producen la siguiente generación. Esta evolución ofrece lo último en superación personal.

Otros argumentos provienen de la física, la estadística y, por supuesto, lo mejor de la informática. Es imposible revisar exhaustivamente todas las diferentes facetas que toca este libro, debido al ambicioso alcance del libro de diseñar el marco para construir el algoritmo maestro. Es este marco el que ha llevado a este libro al segundo lugar, ya que todos los demás libros de aprendizaje automático se basan en esto de alguna forma.

mil cerebros” se basa en los conceptos que se discuten en el libro anterior de Jeff Hawkins titulado “Sobre la inteligencia”. «Sobre la inteligencia» exploró el marco para comprender cómo funciona la inteligencia humana y cómo estos conceptos se pueden aplicar para construir los mejores sistemas de IA y AGI. Básicamente analiza cómo nuestros cerebros predicen lo que experimentaremos antes de que lo experimentemos.

Si bien “A Thousand Brains” es un gran libro independiente, se disfrutará y apreciará mejor si “Sobre la inteligencia” se lee primero.

“A Thousand Brains” se basa en las últimas investigaciones de Jeff Hawkins y la compañía que fundó llamada Numenta. Numenta tiene el objetivo principal de desarrollar una teoría sobre cómo funciona la neocorteza, el objetivo secundario es cómo esta teoría del cerebro se puede aplicar al aprendizaje automático y la inteligencia artificial.

El primer gran descubrimiento de Numenta en 2010 implica cómo las neuronas hacen predicciones, y el segundo descubrimiento en 2016 involucró marcos de referencia similares a mapas en la neocorteza. El libro detalla ante todo qué es la “teoría de los mil cerebros”, qué son los marcos de referencia y cómo funciona la teoría en el mundo real. Uno de los componentes más fundamentales detrás de esta teoría es comprender cómo evolucionó la neocorteza hasta su tamaño actual.

La neocorteza comenzó pequeña, similar a otros mamíferos, pero creció exponencialmente (solo limitada por el tamaño del canal de parto) no creando nada nuevo, sino copiando un circuito básico repetidamente. En esencia, lo que diferencia a los humanos no es el material orgánico del cerebro sino el número de copias de los elementos idénticos que forman la neocorteza.

La teoría evoluciona aún más hacia cómo se forma la neocorteza con aproximadamente 150.000 columnas corticales que no son visibles bajo un microscopio ya que no hay límites visibles entre ellas. La forma en que estas columnas corticales se comunican entre sí es la implementación de un algoritmo fundamental que es responsable de todos los aspectos de la percepción y la inteligencia.

Más importante aún, el libro revela cómo se puede aplicar esta teoría para construir máquinas inteligentes y las posibles implicaciones futuras para la sociedad. Por ejemplo, el cerebro aprende un modelo del mundo al observar cómo cambian las entradas con el tiempo, especialmente cuando se aplica movimiento. Las columnas corticales requieren un marco de referencia que se fija a un objeto, estos marcos de referencia permiten que una columna cortical aprenda las ubicaciones de las características que definen las realidades de un objeto. En esencia, los marcos de referencia pueden organizar cualquier tipo de conocimiento. Esto lleva a la parte más importante de este libro seminal, ¿pueden los marcos de referencia ser potencialmente el eslabón perdido vital para construir una IA más avanzada o incluso un sistema AGI? El mismo Jeff cree en un futuro inevitable cuando un AGI aprenderá modelos del mundo utilizando marcos de referencia similares a mapas similares a la neocorteza, y hace un trabajo notable al ilustrar por qué cree esto.

Deja un comentario