El Sistema Nacional de Información y Registro Único de Beneficiarios del Estado (SINIRUBE) integra bases de datos sociales a lo largo de múltiples instituciones, en total 34 instituciones públicas y 42 programas de ayuda social en Costa Rica.
Esta importante plataforma tecnológica es un sistema que identifica de forma rápida y oportuna a las personas beneficiarias de todos los programas sociales con criterios homogéneos, evita las duplicidades y garantizará que los dineros públicos en esta materia, sean destinados a la población que realmente los necesitan, tiene como fin mejorar el ejercicio del sector social y contribuir con la reducción de la pobreza en el país. Sin embargo, la integridad de los datos recolectados se ve comprometida por la inconsistencia de las metodologías para levantar la información y la falta de mecanismos automatizados para la detección de errores en la captura de datos desde la fuente.
Más de 555 mil personas, correspondientes a 313 mil hogares en 10 regiones de todo el país, han sido parte de los programas de protección y promoción social del Instituto Mixto de Ayuda Social (IMAS) en 2021, con una inversión total de ₡188 mil millones. Se estima que entre un 30%-50% de los datos capturados a través del sistema presentarían algún tipo de error, por lo que su utilización en los Lagos de Datos para la toma de decisiones corrompería los esfuerzos.
El combate a la pobreza y la desigualdad depende en gran medida de la implementación de políticas sociales precisas, eficientes, equitativas y transparentes. Para alcanzar este objetivo, las instituciones sociales realizan procesos de diseño, planeación y evaluación que requieren de datos certeros y confiables.
Como consecuencia, queda clara la importancia que tiene la verificación de la calidad de datos relativos al desarrollo social , sobre todo considerando que, en el caso de los registros sociales su consolidación implica la recolección y procesamiento de millones de datos, por parte de miles de personas, por lo que la presencia de errores e imprecisiones es recurrente. Además, los datos de los registros sociales son utilizados en un sinfín de estudios, acciones y decisiones en materia de política pública como la medición de la pobreza, la determinación de montos presupuestales para su combate, la focalización de recursos, por sólo mencionar algunos ejemplos.
Así, garantizar que los datos sociales representen correctamente aquello para lo que fueron diseñados cobra aún más relevancia. De ahí la importancia de contar con un sistema de análisis de calidad de datos que identifique, documente y reporte los equívocos y anomalías en los registros sociales para subsanarlos y evitarlos. De tal manera que desde el mismo punto de partida de las políticas sociales se contribuya a mejorar la calidad de vida de las poblaciones más pobres y vulnerables.
La respuesta al problema varía dependiendo de cada entidad y se podría concluir que el método más común sería la validación manual sobre una muestra representativa del universo de datos.
En el caso ejemplo de Bono Proteger, cabe mencionar el caso práctico de análisis de calidad de datos que el Ministerio de Trabajo y Seguridad Social (MTSS) ha implementado para la identificación, suspensión y recuperación de acreditaciones que no corresponden en materia del Bono Proteger. Cada vez que se generan pagos del Bono, se aplican filtros de revisión a las bases de datos (planillas) para validar el cumplimiento de requisitos establecidos para ser beneficiario del programa. Esta revisión se hace de manera aleatoria y manual con el objetivo de identificar a aquellas personas que no cumplen con los requisitos establecidos o que cambiaron de estatus y ya no requieren seguir recibiendo el bono. Posteriormente se inicia una investigación administrativa que contempla la posibilidad de audiencia para que las personas puedan ejercer su derecho de defensa y aportar las pruebas que consideren oportunas. Si la investigación determina que la persona cumplía con los requisitos puede recibir los siguientes pagos, en caso contrario se inicia el procedimiento de recuperación de acreditaciones.
En este proceso así como en muchos similares, la cantidad de esfuerzo, recursos y tiempo que se requiere para identificar problemas de calidad de datos es superior a la ganancia del mismo.
QualIA es un programa que identifica y analiza datos atípicos o con alta probabilidad de error en registros sociales y cuestionarios, facilitando y optimizando mecanismos para mejorar la calidad de los datos, desarrollada por la empresa ProsperIA. El proyecto incluyó el desarrollo de modelos probabilísticos y predictivos para mejorar la calidad de datos en formularios de solicitud de asistencia social, los cuáles están siendo validados a través de un estudio con muestreo aleatorio de bases de datos anonimizadas de SINIRUBE.
La solución brindará uno o varios algoritmos que permitirán tener tres diferentes funciones y capacidades de análisis. Estas funciones serán desplegadas por medio de una interfaz de programación de aplicaciones ( API , por sus siglas en inglés), que SINIRUBE podrá consumir utilizando sus propios servidores o por medio de la infraestructura web que Prosperia construirá alrededor de la API y que proveerá durante 6 meses.
La Ley #8968 de Protección de la Persona Frente al Tratamiento de sus Datos Personales se encuentra vigente y estipula en la Sección III los estándares y expectativas de seguridad y confidencialidad del tratamiento de los datos, de esta manera SINIRUBE observa lo estipulado por la ley y este piloto opera en un marco de adherencia a la normativa.
Las agencias y/o instituciones que colaboran en el desarrollo del prototipo y piloto de QualIA, han firmado un convenio de cooperación entre ellas que permite el intercambio de datos anonimizados.
Con el apoyo del Tec de Monterrey se realizó un diagnóstico de la situación actual en el proceso de atención a mujeres víctima de violencia en Jalisco, en la Secretaría de la Igualdad Sustantiva entre Mujeres y Hombres de Jalisco, para analizar de qué manera la inteligencia artificial podría apoyar a la institución en sus procesos de atención.
Costa Rica
Inclusión Social
Costa Rica, Costa Rica
SINIRUBE
Desarrollo del modelo
fairlac@iadb.org
En conjunto con la OECD publicamos el manual de ciencia de datos, el cual busca proveer recomendaciones técnicas a los equipos desarrolladores de sistemas de IA.
Cómo mejorar la intermediación laboral en los servicios de empleo
Cada vez más, actores públicos y privados se plantean cómo escalar su impacto a través del uso de la tecnología.