2009年9月17日 星期四

ReCAPTCHA真是好主意,Google收購得好!

看到Google正式收購,由美國卡內基美隆大學所研發的ReCAPTCHA,這家辨識碼技術服務商的消息,想說去瞭解一下。

網路上一些會員、服務的申請,或是在部落格、網站留言的時候,為了避免機器人或垃圾留言,通常都需要辨識填入一組扭曲的亂數代碼,這就是所謂的CAPTCHA。

CAPTCHA 是「Completely Automated Public Turing test to tell Computers and Humans Apart」(全自動區分計算機和人類的測試)的縮寫,是一種區分用戶是電腦或是人類的方式。文中這個Turing Test是源由Alen Turing於1950年想驗證機器是否能夠「思考」,以進至所謂AI人工智慧,好像因此分辨人腦電腦的測試就叫做Turing Test。

Anyway, 這個ReCAPTCHA與眾不同之處,在於這個由CAPTCHA發明者所推薦的官方CAPTCHA軟體,不但以人工的扭曲的亂數代碼,來做人腦電腦驗證,還同時把典籍數位化過程中,因年代久遠、扭曲、模糊、OCR(電腦)無法辨識,非得人眼辨識的文字片段,放在人為扭曲的CAPTCHA旁一起做辨識。

於是乎,駭客機器人程式(電腦)辨識不出來人為的CAPTCHA,天然的典籍模糊片段自然也辨識不出(辨識得出也很好,若與人眼辨識答案相同那就是很厲害的OCR);人腦辨識得出人為的CAPTCHA,同時也對天然的典籍模糊片段提供辨識答案,等於是每做一個CAPTCHA驗證,就加速典籍數位化的進行一步。當然其正確性可由大量人眼辨識傳回的資料作統計選得,根本就是全世界的人腦電腦(駭客的)都在不知不覺之中幫忙他們!

這個技術由提供大量免費服務的Google來使用,不但驗證碼更準確(Google的CAPTCHA曾在2008年被俄羅斯駭客破解)、辨識量更多,更是Google在數位化實體書的一大助力!相輔相成、相得益彰啊~!


沒有留言:

張貼留言