De-a Abecedarul cu calculatoarele
May 5th, 2010 Posted in Geek | 1 Comment »
Din seria Abia acum am aflat si eu…
Abia acum am aflat si eu ca oamenii au pus calculatoarele cu burta pe carte. Ce-i drept, momentan numai pe arhiva New York Times.
De ceva vreme surferul de Internet lupta cot la cot cu computerele impotriva robotilor (aka bots). Este vorba despre o lupta tacuta. Puterea principala a intregii confruntari este Google, iar arma folosita este reCAPTCHA.
CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) se refera la modalitatea automata care are ca scop identificarea naturii unui utilizator prin testarea recunoasterii unui text dintr-o imagine distorsionata. Cum numai un om poate trece acest test cu succes, robotii sunt cei asupra carora sunt indreptate armele.
reCAPTCHA este gaselnita lui Luis von Arsch, profesor la Carnegie Mellon University, Pittsburgh, Pennsylvania. Ideea geniala a reCAPTCHA consta in faptul ca input-ul unui utilizator nu se duce in neant, ci se transforma in text. Toate aceste secvente de text sunt de fapt echivalentul fidel al unor texte ce nu pot fi recunoscute digital in mod precis prin intermediul sistemelor OCR (Optical Character Recognition).
De fapt, noi – astia care plutim online din ce in ce mai mult – nu facem decat sa luam OCR-ul de manuta si sa il invatam sa citeasca cat mai corect mii de pagini din carti, ziare, reviste vechi. Si toata treaba asta o facem fara sa stim… sau cel putin in cazul meu asa a fost pana acum.
In septembrie 2009 reCAPTCHA a fost achizitionat de Google. De atunci, manutele noastre – care pipaie non-stop retele sociale, conturi de mail si alte unelte online – au digitalizat 20 de ani de New York Times. Pana la sfarsitul lui 2010, daca suntem harnici ca pana acum, terminam si restul de 110 ani.
Si ca sa fim alintati pana in strafundul conturilor noastre de e-mail, reCAPTCHA a creat Mailhide. Prin intermediul Mailhide oricine poate sa scape de spam-urile care iti ofera 900 000 000 miliarde $ daca accepti sa transporti un plic din Zimbabwe in Machu Pichu. Pe scurt, mailul tau nu o sa mai apara in forma completa pe Internet. Numai un om, nu un robot, va putea sa il vizualizeze. Implementarea este free si foarte simpla.
Daca vreti sa va gasiti cuvintele tastate va invit sa va bagati nasul in arhiva digitala New york Times. Puteti sa cititi si articolul despre scufundarea Titanicului, dar numai varianta nedigitala pentru ca cea OCR-izata e disponibila numai cu user si parola (pe bani).
Sa ne suflecam manecile si sa cascam bine ochii. Zic!
