Skip to main content

Una forma novedosa de extraer datos de registros en papel y llevarlos a la era digital.

Problema:
Gran parte del mundo aún depende de formularios y documentos en papel. Extraer información de esos archivos para convertirla en un formato que las computadoras puedan buscar y analizar generalmente requiere ingreso manual de datos, lo que es costoso, lento y propenso a errores.

Solución:
Kuang Chen fundó una empresa llamada Captricity que usa una combinación inteligente de informática y trabajo humano para leer la información de formularios en papel docenas de veces más rápido y de manera más rentable.

Chen desarrolló esta tecnología para capturar datos contenidos en papel en países que aún no habían aprovechado plenamente el poder de la computación. Tras algunos intentos fallidos en Malaui y Uganda, puso a prueba sus ideas en Malí en 2011, cuando procesó cerca de 37.000 páginas de encuestas que detallaban percepciones sobre el gobierno. Ese trabajo le habría tomado a dos empleados unos ocho meses, sin contar el tiempo para verificar los datos. En lugar de eso, Chen subió imágenes de los formularios a Dropbox. Luego, su software dividió esas imágenes en pequeños fragmentos que se enviaron a lectores humanos en la plataforma de crowdsourcing Mechanical Turk de Amazon. Las transcripciones se usaron para entrenar algoritmos de aprendizaje automático que, progresivamente, asumieron la mayor parte del trabajo; al final, los humanos solo se usaron para interpretar las entradas más ambiguas. El proceso tomó una semana.

El mismo enfoque que funciona en aldeas africanas puede ser útil en cualquier organización que aún dependa en gran medida del papel. Captricity financia sus servicios gratuitos o de bajo costo en países pobres en parte con ingresos provenientes de clientes como Dell, la Facultad de Derecho de Harvard y el gobierno de EE. UU.