reCAPTCHA redigitando livros antigos

Posted by in Marcador

0 Flares 0 Flares ×

Esta é uma daquelas pequenas pedras preciosas que encontramos em um grande palheiro que é esta selva de dados da internet. Vale a pena saber!

Uma das maravilhas da tecnologia é poder ajudar a juntar MUITOS dados em um único lugar. E se você, com uma tarefa boba e que achamos desagradável, ajudar a digitar livros antigos sem saber? Agora você vai saber como faz isto.

Para quem não sabe, uma das chatices da internet são os formulários. Por receberem dados, eles são focos de Spammers. Principalmente quando este formulário se utiliza de email para se comunicar com quem criou o formulário. Exemplo: o dono de um site abre um formulário em seu site para receber contatos e programa para receber este formulário por email. Se deixarmos o formulário sem segurança, os spammers vão ficar tentando usar o serviço de email do formulário para descobrir a senha de email do serviço ou tentar usá-lo, através do formulário, para enviar Spam.

Spammer é uma praga, até 2007, 80% do tráfego da internet era Spam. Então foram surgindo formas de reduzir esta triste realidade.

Para formulários foi criado o serviço reCAPTCHA, que você me diria assim: “Ah, aquelas chatas letras indecifráveis e horríveis que tenho que digitar no final de um formulário”. Sim, aquelas mesmas. Alguns ainda não entendem que somente um ser humano pode entender aquelas letras, então o formulário e seus dados ficam bastante protegidos.

Existem muitas paródias na internet e locais do tipo “Captcha da depressão” que execram este serviço necessário.

Mas o reCAPTCHA, criado pela Universidade Carnegie Mellon, Pittsburgh, inovou MUITO na criação de seu serviço. Além de você pode usar o serviço livremente em seu site, bastando entender de formulários e usá-lo gratuitamente, eles tiveram uma sacada genial!

Veja só o que acontece quando você digita um captcha baseado no reCAPTCHA:

Ajudando o mundo com uma palavra de cada vez
Ao digitar as palavras na caixa, você também ajuda a digitalizar textos que foram escritos antes da era do computador. As palavras que você vê foram tiradas diretamente de textos antigos que estão sendo digitalizados e armazenados em formato digital para ser preservados e ficar mais acessíveis para o mundo. Visto que algumas das palavras nos textos são difíceis para os computadores processarem, estamos usando os resultados de seus esforços para ajudar a decifrá-las.

Existem ações que se explicam por si mesmas, imagine! Quando você digita aquelas letrinhas que um robô não é capaz de fazê-lo está ajudando a redigitar antigos livros!!!! Não é genial?!

recaptcha

Veja que inteligente. Eles retiram a palavra de um escaneamento de um livro antigo, quando você redigita está ajudando a confirmar a digitação.

Estes tempos eu pensei rapidamente quando vi um captcha: “caramba, como eles geram tantas imagens indecifráveis? E que base mostruosa é esta que precisará ser atualizada constantemente.” Mesmo um gerador de imagens seria decifrável por um robô depois de um tempo. Dai vem uma universidade e simplesmente usa uma das maiores dificuldades atuais, que é a tecnologia OCR, que nem sempre resolve na redigitalização de livros, e usa como fonte de imagens indecifráveis, juntando dois problemas e criando uma solução. Problema 1: muitas palavras não são decifráveis no escaneamento de livros. Por que não usar o captcha para isto? Problema 2: de onde gerar tantas imagens para os captchas não se tornarem decifráveis? Quantos livros ainda precisam ser redigitados! Explico os pormenores porque isto é um exemplo de como juntar problemas que se resolvem, uma lição para nossas profissões e para a vida!

Isto já caminha para uma comunidade Big Data, termo muito utilizado para uma grande quantidade de dados que se cruzam para ajudar uma ampla quantidade de pessoas, e não são poucas as iniciativas de Big Data na área comunitária.

Para aqueles como eu que ficaram desconfiados de como funciona, nesta página eles explicam que uma palavra que o computador não foi capaz de decifrar é juntada com outra que ele foi capaz de decifrar, assim, o reCAPTCHA verifica a veracidade pela palavra que ele conhece, a outra palavra você está ajudando a decifrar! Da série: “como resolver grandes problemas com inteligência”. Saiba mais sobre aqui.

Veja em tradução livre do Translator do Google, o poder do serviço:

Cerca de 200 milhões CAPTCHAs são resolvidos por seres humanos ao redor do mundo todos os dias. Em cada caso, cerca de dez segundos do tempo humano estão sendo gastos.Individualmente, isso não é muito tempo, mas em conjunto estes pequenos enigmas consumir mais de 150.000 horas de trabalho todos os dias. Que se nós poderíamos fazer uso positivo deste esforço humano? reCAPTCHA faz exatamente isso, canalizando o esforço despendido resolver CAPTCHAs on-line para “ler” livros.

Então, quando você for redigitar um reCAPTCHA, não ficará mais aborrecido, pois estará ajudando a decifrar livros antigos!

Uma sacada de usabilidade genial!

Em tempo: o Google adquiriu o serviço. Isto explica ainda mais!

0 Flares Twitter 0 Facebook 0 LinkedIn 0 Pin It Share 0 0 Flares ×