「ぐにゃぐにゃ文字」を排除しよう!


この記事の所要時間: 430秒 〜 530秒程度(2483文字)


Googleが新しいCAPTCHAを開発した。CAPTCHAとは、利用者がロボットでないことを確認するテストのこと。簡単に言えば、サイトの新規登録などで出てくる「ぐにゃぐにゃ文字」の判読テストがCAPTCHAだ。Googleが、このCAPTCHAを改善しようとしている(参考:Googleの新API「reCAPTCHA」ではイメージをクリックするだけでボットでないことを証明でき文字入力は不要に|GIGAZINE)。
 
最近では、サイトに不正登録するロボットの性能向上により、段々と難しいCAPTCHAが使われるようになってきている。以前、このブログの記事にも書いたが、あの「ぐにゃぐにゃ文字」が読めない人は多いようだ。そして、読めなかったときの何とも言えない敗北感。CAPTCHAがあることで、新規登録者の1割が離脱するという説もある。この忌々しいCAPTCHAを、インターネットの巨人・Googleが改めようというのだから、期待したくなるのは自分だけでないだろう。
 

captcha

credit: agoasi via FindCC

 


似たもの探しで「人間」を証明


Googleが提案する新CAPTCHAは、提示された画像と「同じもの」を選ぶ仕組み。

※画像はGIGAZINEより

※画像はGIGAZINEより

「同じもの」といっても同一画像ではない。それではロボットが簡単にクリアできしまう。ここで「同じもの」とは、「同じ種類のもの」という意味。例えば、お題の画像が「猫」なら、一覧の中から「別の猫」の画像をすべて選ぶようになっている。これなら、「ぐにゃぐにゃ文字」を読み取るより簡単そうだし、画像の種類によっては少し楽しいかも知れない。
 
昔の人工知能の知識で言えば、画像に映っているものを認識して記号化する作業はコンピュータが苦手な領域だ。さまざまなポーズをしたいろんな種類の猫を、どれも「猫」と見わけるのがまず難しい。その上、見わけられたとしても、「三毛猫」、「猫の頭部」、「舌を出した猫」と記号化する可能性がある。上位の分類に注目して、「哺乳類」、「生き物」と認識しないとも限らない。また、背景に映っている別のものを記号化することもあり得る。
 
このような人間ならひと目でわかる「似たもの探し」が、コンピュータには案外できない。技術の細部が急速に進化しても、こういう根っこの部分はなかなか解決しないのだろう。このため、似たもの探しで「人間」であることを証明できる。今回の新CAPTCHAは、この人間とコンピュータの得意/不得意の差をうまく活用したものと考えられる。
 


「王様は裸だ!」とは言い難い!?


今回のニュースで衝撃だったのは、「今日のテクノロジーを使うと、ロボットたちはCAPTCHAを99.8%の精度で解くことができる」という部分(参考:Googleの新しいreCAPTCHAは、あの目障りなCAPTCHAを(ほぼ)排除する|TechCrunch)。これでは、人間よりロボットの方が「ぐにゃぐにゃ文字」の判読率が高い。つまり、従来のCAPTCHAは高性能のロボットには太刀打ちできていなかったのだ。それなのに、人間が必死になってCAPTCHAを読んでいるのだから、こんなおかしな話はないだろう。
 
CAPTCHA使用で欠けていたのは、機能の実効性の見直しとなる。当初は高かった対ロボットの拒否率が、だんだん下がってきたのに、それに気づかなかった。もしくは、気づいても見ない振りをした。これまでの経験で「安全」とされているものを、「危険かも」と指摘するのは勇気がいる。代替案も必要になるだろう。組織の中で働いていると、「王様は裸だ!」とはなかなか言い難い。このせいで、「必ずしも思わしくない状態」が維持されることになる。
 
実効性を知らずに、横並び意識やアリバイづくりでCAPTCHAを使っていたなら、これを機会に活用の見直しをするといいだろう。「ぐにゃぐにゃ文字」の排除は、ユーザーに優しいからだ。効果があるならいざ知らず、実効性がないとわかったなら、残しておく理由はひとつもない。
 


データを使って機能の棚卸し!


セキュリティ面に限らず、多くのホームページは機能が増え過ぎている。あれもこれもと盛り込んだ結果、どれが本当に役立って、どれが無用の長物なのか、にわかに判断できない状態だ。一度提供した機能を無くせばどこかから苦情が来兼ねないので、機能を廃止しにくいという事情もあるのだろう。加速度を付けて、訳のわからないことになっている。
 
ここで大切なのは、機能の棚卸しとなる。サイトにとって必要な機能とそうでない機能、ユーザーに求められている機能と嫌われている機能を見極め、取捨選択する必要があるのだ。今回取り上げたCAPTCHAのような技術の進化、ユーザーの評価などを総合的に考えて、不要な機能を排除することがユーザビリティの向上につながる。機能は、多ければ良いというものではない。
 
そして、この手の取捨選択には議論よりもデータの活用が役に立つ。議論をしても結論が出ないからだ。余程突き詰めて話し合いをしない限り、「まあ、そのままに」という意思決定になってしまう。このため、(1)技術としての実効性、(2)機能のアクセス数、(3)ユーザーによる評価、(4)サイトポリシーとの合致度などを各10点満点で評価し、一定点数以下の機能は廃止する仕組みづくりが必要になる。組織のやることなので機械的に廃止とはし難いが、それでもデータによる基準があるとなしとは大違いだ。データを活用した機能の棚卸しをオススメしたい。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.