Una colaboración de UoC Berkeley, la Universidad de Stanford y Facebook ofrece una imagen más profunda y granular del estado real de la pobreza en y entre las naciones, mediante el uso del aprendizaje automático.
Él investigartitulado Microestimaciones de riqueza para todos los países de bajos y medianos ingresos, va acompañado de una sitio web beta que permite a los usuarios explorar de forma interactiva el estado económico absoluto y relativo de áreas detalladas y focos de pobreza en países de ingresos bajos y medianos.
El marco incorpora datos de imágenes satelitales, mapas topográficos, redes de teléfonos móviles y datos anónimos agregados de Facebook, y se verifica con encuestas cara a cara extensas, con el fin de informar la disparidad relativa de riqueza en una región, en lugar de estimaciones absolutas de ingresos. .
Un mapa de la pobreza global, ponderado hacia las áreas más afectadas. Bajo, ampliaciones de Sudáfrica y Lesotho (b); un área de 12 kilómetros cuadrados alrededor del municipio de Khayelitsa, cerca de Ciudad del Cabo. Fuente: https://arxiv.org/ftp/arxiv/papers/2104/2104.07761.pdf
El sistema ha sido adoptado por el gobierno de Nigeria como base para la administración de los programas de protección social, y funciona junto con el marco existente del Banco Mundial, el Proyecto Nacional de Redes de Seguridad Social (NASSP). En febrero, los primeros beneficiarios del plan recibieron una transferencia en efectivo de 5000 nairas nigerianas, un beneficio pagadero hasta por seis meses, hasta alcanzar el umbral de un millón de nairas.
El diario afirma que pobreza de datos hace una contribución notable a la distribución incorrecta de la ayuda en países con recursos mínimos de recopilación de datos o infraestructura limitada, y esa información errónea motivada políticamente (un problema no limitado a países de bajos ingresos) también es un factor en este sentido.
Registro de los ‘pobres no declarados’
Las simulaciones de los investigadores sobre los datos demostraron que, según las regulaciones existentes para la asignación de recursos de ayuda, la distribución basada en este sistema aumenta el pago a los más necesitados y disminuye el pago a los beneficiarios existentes en los tramos de ingresos más altos. El documento también señala la dificultad que enfrentaron los administradores de programas de protección social para asignar recursos de ayuda al comienzo de la crisis de COVID-19, debido a la falta de datos completos o detallados. En Nigeria, por ejemplo, los datos de la encuesta más reciente cubren los hogares en solo el 13,8 % de todos los distritos nigerianos, en comparación con la cobertura del 100 % que ofrece el nuevo plan.
El trabajo anterior en la estimación de la pobreza asistida por IA se ha concentrado en gran medida en los datos obtenidos por satélite (ver más abajo), pero los investigadores afirman que los datos de la conectividad móvil obtienen una visión más precisa y granular de la disparidad de riqueza entre las regiones, y este flujo de información proporciona la mitad de todos los datos que contribuyen al proyecto.
Desde el punto de vista de la generalización en los datos de aprendizaje automático, los investigadores observan que los modelos entrenados en un país pueden ser una plantilla beneficiosa y precisa para los modelos que cubren países adyacentes. También señalan que el nuevo marco es capaz no solo de distinguir entre localidades urbanas y rurales, sino que también es capaz de proporcionar mapas de disparidad dentro de áreas urbanizadas, lo que excede el alcance de muchas iniciativas de investigación recientes en este sector.
Imágenes satelitales en el análisis de la pobreza
El principio detrás del análisis de la pobreza basado en satélites es la presunción de que las personas pobres tienen poco dinero para hacer funcionar la luz eléctrica en la hora de la oscuridad, o pueden no tener ninguna instalación de luz eléctrica. Cuando la ausencia de luces puntuales se puede correlacionar con la presencia de personas, según lo determinado por otros medios (como los datos de conectividad móvil), se puede generar un índice de privación.
Esta técnica fue propuesta en 2016 en un artículo anterior de Stanford de otro grupo de investigación. El método detallado en ese documento fue pionero en el uso de la cobertura satelital vespertina proporcionada por el Programa de Satélites Meteorológicos de Defensa de la Fuerza Aérea de los Estados Unidos (DMSP) a través de la Administración Nacional Oceánica y Atmosférica (NOAA-NGDC).
Cuatro filtros convolucionales identifican, de izquierda a derecha, entidades relacionadas con zonas urbanas, zonas rurales, agua y carreteras. La fila superior muestra imágenes de origen de Google Maps, la del medio los mapas de activación de filtros del análisis de aprendizaje automático y la fila inferior una superposición de mapas de activación en las imágenes del mapa original. Fuente: https://science.sciencemag.org/content/sci/353/6301/790.full.pdf
El proyecto de Stanford correlacionó la evidencia filtrada de luces nocturnas en la vigilancia satelital con su propia base de datos de encuestas DHS para el año en que ocurrieron las encuestas y los resultados satelitales agregados. era necesario establecer promedios de la suma de los valores de luz nocturna como sustitutos de ciertos indicadores económicos.
Verdad sobre el terreno para las estadísticas de pobreza global
Para el nuevo proyecto de Stanford, los investigadores decidieron derivar el marco de datos de la Encuesta Demográfica y de Salud existente (DHS) Programa, aunque, como reconocen, esto efectivamente replica el esquema DHS en el conjunto de datos. Los investigadores observan: «Elegimos entrenar nuestro modelo exclusivamente con datos de DHS porque es la fuente única más completa de datos de riqueza estandarizados internacionalmente disponibles públicamente que proporciona estimaciones de riqueza a nivel de hogar con geomarcadores subregionales».
Sin embargo, el proyecto opera a una resolución mucho más alta que el DHS, y el uso del marco existente como verdad en el terreno brinda dos beneficios: en primer lugar, los datos del DHS no se basan en informes formales de ingresos, que es un indicador poco confiable en los países más afectados por la pobreza, donde abundan las economías de mercado negro; y en segundo lugar, los datos se recopilan de manera estandarizada y en una plantilla internacional que permite que el marco de los investigadores abarque otros países que están sujetos a este método de medición, en lugar de establecer equivalencias entre marcos competitivos.
La conectividad móvil como índice económico
Para las personas que viven en áreas con problemas económicos, la conectividad móvil se ha convertido en un salvavidas tecnológico en las últimas dos décadas, ya que los teléfonos móviles son la plataforma tecnológica mínima disponible en la que se puede confiar en tales condiciones. Los teléfonos móviles también se han convertido en plataformas de pago de facto para los beneficiarios de ayuda que carecen de una cuenta bancaria u otros medios convencionales para recibir dinero.
Sin embargo, como ha sido observado antes, el uso de indicadores de redes móviles como un índice económico para los sistemas de aprendizaje automático tiene algunos inconvenientes potenciales: hay personas en las regiones afectadas que son tan pobres que ni siquiera poseen un teléfono móvil, las mismas personas a las que el sistema está diseñado para ayudar; el sistema podría ser potencialmente manipulado por usuarios con múltiples teléfonos móviles en circunstancias en las que un teléfono se ha convertido en un proxy para hashes de identificación únicos de ciudadanos; y existen implicaciones de privacidad para la creación de este tipo de sistema de identificación, en los casos en que el gobierno local o nacional mantiene cierta supervisión del proyecto.