¿Cómo podemos usar Deep Learning con Small Data? – Lideres fuertes

Cuando se trata de mantenerse al día con las tendencias emergentes de ciberseguridad, el proceso de estar al tanto de los desarrollos recientes puede volverse bastante tedioso, ya que hay muchas noticias con las que mantenerse al día. En estos días, sin embargo, la situación ha cambiado drásticamente, ya que los ámbitos de la ciberseguridad parecen girar en torno a dos palabras: aprendizaje profundo.

Aunque inicialmente nos sorprendió la cobertura masiva que estaba recibiendo el aprendizaje profundo, rápidamente se hizo evidente que el entusiasmo generado por el aprendizaje profundo era bien merecido. De manera similar al cerebro humano, el aprendizaje profundo permite que un modelo de IA logre resultados altamente precisos al realizar tareas directamente desde el texto, las imágenes y las señales de audio.

Hasta este punto, se creía ampliamente que el aprendizaje profundo se basa en un gran conjunto de datos, bastante similar a la magnitud de los datos alojados por los gigantes de Silicon Valley, Google y Facebook, para cumplir con el objetivo de resolver los problemas más complicados dentro de una organización. Sin embargo, contrariamente a la creencia popular, las empresas pueden aprovechar el poder del aprendizaje profundo, incluso con acceso a un grupo de datos limitado.

En un intento de ayudar a nuestros lectores con el conocimiento necesario para equipar a su organización con aprendizaje profundo, hemos compilado un artículo que profundiza (sin juego de palabras) en algunas de las formas en que las empresas pueden utilizar los beneficios del aprendizaje profundo a pesar de de tener acceso a datos limitados o ‘pequeños’.

Pero antes de que podamos entrar en el meollo del artículo, nos gustaría hacer una sugerencia pequeña, pero muy esencial: comience de manera simple. Sin embargo, antes de comenzar a formular redes neuronales lo suficientemente complejas como para aparecer en una película de ciencia ficción, comience experimentando con algunos modelos simples y convencionales (por ejemplo, un bosque aleatorio) para familiarizarse con el software.

Con eso fuera del camino, pasemos directamente a algunas de las formas en que las empresas pueden fusionar la tecnología de aprendizaje profundo mientras tienen acceso a datos limitados.

#1- Refinando el modelo de línea de base:

Como ya mencionamos anteriormente, el primer paso que deben dar las empresas después de haber formulado un modelo básico de aprendizaje profundo simple es ajustarlo para el problema particular en cuestión.

Sin embargo, ajustar un modelo de línea de base suena muy difícil en el papel, pero en realidad lo es. La idea fundamental detrás del ajuste fino de un gran conjunto de datos para satisfacer las necesidades específicas de una empresa es simple: se toma un gran volumen de datos, que se parece un poco al dominio en el que funciona, y luego se ajustan los detalles del original. conjunto de datos, con sus datos limitados.

En lo que respecta a la obtención del gran conjunto de datos, los propietarios de empresas pueden confiar en ImageNet, que posteriormente también proporciona una solución fácil para cualquier problema de clasificación de imágenes. El conjunto de datos alojado por ImageNet permite a las organizaciones acceder a millones de imágenes, que se dividen en múltiples clases de imágenes, lo que puede ser útil para las empresas que provienen de una amplia variedad de dominios, que incluyen, entre otros, imágenes de animales, etc.

Si el proceso de ajustar un modelo previamente entrenado para satisfacer las necesidades específicas de su organización todavía le parece demasiado trabajo, le recomendamos obtener ayuda de Internet, ya que una simple búsqueda en Google le proporcionará cientos de tutoriales sobre cómo ajustar un conjunto de datos.

#2- Recopilar más datos:

Aunque el segundo punto de nuestra lista puede parecer redundante para algunos de nuestros lectores más cínicos, el hecho es que, cuando se trata de aprendizaje profundo, cuanto más grande sea su conjunto de datos, más probabilidades tendrá de lograr resultados más precisos.

Aunque la esencia misma de este artículo radica en proporcionar a las empresas un conjunto de datos limitado, a menudo hemos tenido el disgusto de encontrarnos con demasiados «superiores», que consideran que invertir en la recopilación de datos es equivalente a cometer un pecado capital.

Con demasiada frecuencia, las empresas tienden a pasar por alto los beneficios que ofrece el aprendizaje profundo, simplemente porque son reacias a invertir tiempo y esfuerzo en la recopilación de datos. Si su empresa no está segura de la cantidad de datos que se deben recopilar, le sugerimos trazar curvas de aprendizaje, ya que los datos adicionales se integran en el modelo, y observar el cambio en el rendimiento del modelo.

Contrariamente a la creencia popular sostenida por la mayoría de los CSO y CISO, a veces la mejor manera de resolver problemas es a través de la recopilación de datos más relevantes. El papel de CSO y CISO es extremadamente importante en este caso porque siempre existe una amenaza de ciberataques. Se encuentra que en 2019, el total mundial el gasto en ciberseguridad asciende a 103.100 millones de dólares, y el número sigue aumentando. Para poner esto en perspectiva, consideremos un ejemplo simple: imagine que está tratando de clasificar diamantes raros, pero tiene acceso a un conjunto de datos muy limitado. Como dicta la solución más obvia al problema, en lugar de tener un día de campo con el modelo de referencia, ¡simplemente recopile más datos!

#3- Aumento de datos:

Aunque los primeros dos puntos que hemos discutido anteriormente son altamente eficientes para proporcionar una solución fácil a la mayoría de los problemas relacionados con la implementación del aprendizaje profundo en empresas con un pequeño conjunto de datos, dependen en gran medida de un cierto nivel de suerte para hacer el trabajo. .

Si tampoco puede tener éxito con el ajuste fino de un conjunto de datos preexistente, le recomendamos que pruebe el aumento de datos. La forma en que el aumento de datos es simple. A través del proceso de aumento de datos, el conjunto de datos de entrada se modifica o aumenta de tal manera que da una nueva salida, sin cambiar realmente el valor de la etiqueta.

Para poner la idea del aumento de datos en perspectiva para nuestros lectores, consideremos la imagen de un perro. Cuando se gira, el espectador de la imagen aún podrá decir que es la imagen de un perro. Esto es exactamente lo que espera lograr un buen aumento de datos, en comparación con una imagen rotada de una carretera, que cambia el ángulo de elevación y deja mucho espacio para que el algoritmo de aprendizaje profundo llegue a una conclusión incorrecta, y frustra el propósito de implementar aprendizaje profundo en primer lugar.

Cuando se trata de resolver problemas relacionados con la clasificación de imágenes, el aumento de datos sirve como un actor clave en el campo y alberga una variedad de técnicas de aumento de datos que ayudan al modelo de aprendizaje profundo a obtener una comprensión profunda de las diferentes clasificaciones de imágenes.

Además, cuando se trata de aumentar los datos, las posibilidades son prácticamente infinitas. Las empresas pueden implementar el aumento de datos en una variedad de formas, que incluyen NLP y experimentación de GAN, lo que permite que el algoritmo genere nuevos datos.

#4- Implementando un efecto de conjunto:

La tecnología detrás del aprendizaje profundo dicta que la red se construye sobre múltiples capas. Sin embargo, contrariamente a la creencia popular mantenida por muchos, en lugar de ver cada capa como una jerarquía de características «cada vez mayor», la capa final tiene el propósito de ofrecer un mecanismo de conjunto.

La creencia de que las empresas con acceso a un conjunto de datos limitado o más pequeño deberían optar por construir sus redes en profundidad también se compartió en un papel NIP, que reflejaba la creencia que hemos expresado anteriormente. Las empresas con datos pequeños pueden manipular fácilmente el efecto de conjunto en su beneficio, simplemente construyendo sus redes de aprendizaje profundo, a través de ajustes finos o alguna otra alternativa.

#5- Incorporando autocodificadores:

Aunque el quinto punto que hemos tenido en cuenta ha recibido solo un nivel relativo de éxito, todavía estamos de acuerdo con el uso de codificadores automáticos para entrenar previamente una red e inicializarla correctamente.

Una de las razones más importantes, aparte de los ataques cibernéticos, por las que las empresas no logran superar los obstáculos iniciales de la integración del aprendizaje profundo es debido a una mala inicialización, y hay muchas trampas. El entrenamiento previo sin supervisión a menudo conduce a una ejecución deficiente o incorrecta de la tecnología de aprendizaje profundo, que es donde los codificadores automáticos pueden brillar.

La noción fundamental detrás de una red neuronal dicta la creación de una red neuronal que predice la naturaleza del conjunto de datos que se ingresa. Si no está seguro de cómo usar un codificador automático, hay varios tutoriales en línea que brindan instrucciones claras.

Para concluir:

Al final del artículo, nos gustaría reembolsar lo que hemos dicho a lo largo del artículo, con una adición: ¡incorporar conocimientos específicos del dominio en el proceso de aprendizaje! La incorporación de información valiosa no solo acelera el proceso de aprendizaje, sino que también permite que la tecnología de aprendizaje profundo produzca resultados mejores y más precisos.

Deja un comentario