Con el mundo de los negocios adoptando agresivamente la ciencia de datos, se ha convertido en uno de los campos más buscados. Explicamos qué es un algoritmo de K-vecino más cercano y cómo funciona.
¿Qué es el algoritmo KNN?
Algoritmo K-vecinos más cercanos (o KNN) es uno de los algoritmos de aprendizaje más utilizados debido a su sencillez. El algoritmo KNN o K-vecino más cercano es un algoritmo de aprendizaje supervisado que funciona según el principio de que todos los puntos de datos que se acercan entre sí pertenecen a la misma clase. La suposición básica aquí es que las cosas que están cerca unas de otras son parecidas entre sí. Principalmente, el algoritmo KNN se usa debido a su facilidad de interpretación y bajo tiempo de cálculo.
KNN se usa ampliamente para problemas de clasificación y regresión en el aprendizaje automático. Algunos ejemplos de KNN son los algoritmos utilizados por los portales de comercio electrónico para recomendar productos similares.
Revisemos un ejemplo:
En la imagen dada, tenemos dos clases de datos. Clase A que representa cuadrados y Clase B que representa triángulos.
El problema es asignar un nuevo punto de datos de entrada a una de las dos clases con el uso del algoritmo KNN
El primer paso es definir el valor de ‘K’ que representa el número de vecinos más cercanos.
Si el valor de «k» es 6, buscará los 6 vecinos más cercanos a ese punto de datos. Si el valor de «k» es 5, buscará los 5 vecinos más cercanos a ese punto de datos.
Consideremos ‘K’ = 4, lo que significa que el algoritmo considerará los cuatro vecinos más cercanos al punto de datos.
Ahora, en ‘K’ = 4, un triángulo y dos cuadrados pueden verse como los vecinos más cercanos. Entonces, el nuevo punto de datos basado en ‘K’ = 4, se asignaría a la Clase A.
¿Dónde usar KNN?
KNN se utiliza en problemas predictivos de clasificación y regresión. Sin embargo, cuando se aplica con fines industriales, se utiliza principalmente en la clasificación, ya que es imparcial en todos los parámetros evaluados al determinar la usabilidad de una técnica.
¿Cómo se emplea en los problemas cotidianos?
A pesar de su simplicidad, KNN funciona mucho mejor que otros clasificadores poderosos y se usa en lugares como pronósticos económicos y compresión de datos, reconocimiento de video, reconocimiento de imágenes, detección de escritura a mano y reconocimiento de voz.
Algunos usos principales del algoritmo KNN
El algoritmo KNN se utiliza en el sistema bancario para predecir si una persona es apta para la aprobación de un préstamo o no al predecir si tiene rasgos similares a los de un moroso. KNN también ayuda a calcular los puntajes de crédito de las personas comparándolos con personas que tienen características similares.
Empresas que utilizan KNN
La mayoría de las empresas de entretenimiento y comercio electrónico como Amazon o Netflix usan KNN cuando recomiendan productos para comprar o películas/programas para ver.
¿Cómo hacen estas recomendaciones? Bueno, estas empresas recopilan datos sobre el comportamiento del usuario, como productos anteriores que ha comprado o películas que ha visto en su sitio web y aplica KNN.
Las empresas ingresarán los datos disponibles de sus clientes y los compararán con otros clientes que compraron productos similares o vieron películas similares.
Luego, se le recomendarán los productos y las películas, según cómo clasifique el algoritmo ese punto de datos.
Ventajas y desventajas de KNN
Ventajas de KNN
- Cálculo rápido
- Algoritmo simple – para interpretar
- Versátil: útil para clasificación y regresión
- Alta precisión
- Sin suposiciones sobre los datos: no es necesario hacer suposiciones adicionales ni crear un modelo.
Desventajas de KNN
- La precisión depende de la calidad de los datos.
- La predicción se vuelve lenta con datos grandes
- No es relevante para grandes conjuntos de datos.
- Necesita almacenar todos los datos de entrenamiento, por lo que requiere mucha memoria
- Puede ser computacionalmente costoso ya que almacena todo el entrenamiento
En este blog, hemos tratado de explicar el algoritmo K-NN, que se usa ampliamente para la clasificación. Discutimos el enfoque básico detrás de KNN, cómo funciona y sus ventajas y desventajas.
El algoritmo KNN es uno de los algoritmos más simples y puede dar resultados muy agresivos. Los algoritmos KNN se pueden utilizar tanto para problemas de clasificación como de regresión.