jueves, 28 de octubre de 2010

El negocio tras los CAPTCHA


Gracias a mi amigo Antonio Rey he descubierto esta interesantísima entrada del blog de José Manuel Alarcón: "reCAPTCHA: mucho más de lo que aprecias a simple vista". Los CAPTCHA (acrónimo de Completely Automatic Public Turing test to tell Computers and Humans Apart) son esas imágenes de palabras deformadas que hay que escribir para poder hacer un comentario en un blog, crear una cuenta de correo, etc.
En lo que nunca me había parado a pensar es en el interés económico que hay detrás de estos servicios. En este artículo José Manuel explica de forma brillante cómo el negocio de un servicio como reCAPTCHA es ni más ni menos que la digitalización de libros y documentos (por cierto, si tenemos en cuenta que reCAPTCHA es ahora propiedad de Google, ya lo entendemos un poco más). reCAPTCHA utiliza dos OCR en sus procesos de digitalización, y cuando no se ponen de acuerdo en la interpretación de una palabra, ésta pasa al repositorio de palabras para reCAPTCHA. Así, nos encargamos nosotros, los usuarios, de resolver lo que no han podido resolver esos OCR. Así, vamos ayudando a resolver nuevas palabras y, al mismo tiempo, ayudamos a perfeccionar los OCR. Como dice José Manuel, "un servicio web ofrecido a otras empresas para ayudarles a reconocer texto en cientos de idiomas diferentes es un buen negocio se vea por donde se vea".

Otra aplicación de los CAPTCHA es en modelos de publicidad, tal y como se puede ver en este vídeo de la empresa Solve Media.

Solve Media from Solve Media on Vimeo.

Por último, es también interesantísima la parte final del artículo, dedicada a las páginas de descargas y su relación con los CAPTCHAS.

No hay comentarios: