Allgemeines 21.720 Themen, 143.293 Beiträge

News: Captchas bald für den Arsch?

Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch

Michael Nickles / 7 Antworten / Baumansicht Nickles

Seit geraumer Zeit werden Internetnutzer mit sogenannten "Captchas" gequält. Damit eine Aktion auf einer Webseite ausgeführt werden kann, wird beispielsweise die Eingabe einer "Zeichenfolge" gefordert.

"Captchas" steht für "Completely Automated Public Turing test to tell Computers and Humans Apart". Also: ein komplett automatisierter Test um Menschen von Maschinen unterscheiden zu können. Durch Captcha-Abfragen will eine Webseite sicherstellen, dass sie es mit einem Menschen zu tun hat und nicht mit einem "Roboter", der ihre Informationen automatisiert absaugen will.

Dass so ein Captcha-Mechanismus in vielen Fällen Sinn macht, wird kaum bestritten. Aber: damit Captchas nicht automatisch per "Zeichenerkennungsroutine" von "Robotern" gelesen werden können, werden sie nicht in "Normalschrift" sondern möglicht verwackelt und verhunzt dargestellt.

Die Idee der "Captcha-Macher" ist die, dass ein Mensch noch in der Lage ist das fast Unlesbare zu erkennen, ein "Programm" aber daran scheitert. Leider gibt es in vielen Fällen Captchas, bei denen Menschen mit Sehschwierigkeiten (und auch Menschen ohne Sehschwierigkeiten) keinerlei Chance haben den "Zeichenbrei" entziffern zu können.

Im Glücksfall kriegt man bei "Falscheingabe" eine weitere Chance mit einem neuen Captcha, im Pechsfall gehen alle Eingaben auf einer Seite (beispielsweise in einem Formular) verloren und man darf von vorne anfangen.

Forscher aus Stanford haben jetzt versucht die gängigen Captcha-Lösungen zu knacken und ihr Ergebnis mitgeteilt (siehe PDF-Dokument. Und demnach sieht es wohl so aus, als ob Captchas auf dem Weg sind, eine sinnlose Sache zu werden.

Die aktuellen Erkennungsalgorithmen der Forscher können die meisten Captcha-Systeme bereits mit hoher Trefferquote überlisten, deren "Zeichenmatsch" entziffern.

Lediglich an einem Captcha-System biss sich die Erkennungs-Software "Decaptcha" der Forscher die Zähne aus: Recaptcha, Googles Recaptcha-Lösung:


Dass Roboter bei Googles Recaptcha das Handtuch schmeißen ist wenig verwunderlich – bei einem Zeichenmatsch wie hier im Bild, haben vermutlich auch die meisten Menschen keine Chance.

Gewiss ist es allerdings nur eine Frage der Zeit, bis auch Googles Recaptcha ausgetrickst wird.

Captcha-Fans wird vielleicht auch eine Studie von Stanforfd aus dem Jahr 2010 interessieren (siehe PDF-Dokument). Da wurde untersucht, wie gut Menschen in der Lage sind, die gängigen Captcha-Systeme erkennen zu können.

Michael Nickles meint: Googles Captchas sind also am ekeligsten. Aber spannend! Es ist recht interessant sich mal durchzulesen, wie Googles Captcha-System funktioniert (siehe Digitizing Books One Word at a Time).

Konkret werden die Recaptcha-Gequälten so ganz nebenbei als menschliche Buchdigitalisierer missbraucht. Denn: die von Google gezeigten Captcha-Wörter stammen von eingescannten Büchern. Und es sind solche Wörter, bei denen die Texterkennungs-Software versagt hat.

Drum gibt es bei Google Recaptcha zwei Worte einzutippen. Ein Wort, das das System bereits kennt und eins, das noch unerkannt ist. Gibt der menschliche "Digitalisierer" das bekannte Wort richtig ein, dann geht die Software davon aus, dass sich der Mensch auch bemüht hat, das noch unbekannte Wort richtig zu entziffern.

Wurde ein unbekanntes Wort ausreichend vielen Menschen präsentiert und es gibt eine erkennbare Häufigkeit gleicher "Antworten", dann kriegt das Wort den Status erkannt. Ganz schön, clever!

bei Antwort benachrichtigen
Borlander Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen
Gewiss ist es allerdings nur eine Frage der Zeit, bis auch Googles Recaptcha ausgetrickst wird.
Genau das vollte bei dem Prinzip von ReCaptcha eigentlich nicht vorkommen. Es werden nämlich solche Wörter präsentiert an denen die Texterkennung (und die hat sogar noch mehr Informationen als das was in den Captures sichtbar) gescheitert ist...
bei Antwort benachrichtigen
marinierter Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen
Konkret werden die Recaptcha-Gequälten so ganz nebenbei als menschliche Buchdigitalisierer missbraucht. Denn: die von Google gezeigten Captcha-Wörter stammen von eingescannten Büchern. Und es sind solche Wörter, bei denen die Texterkennungs-Software versagt hat.

Ah, das ist interessant. Das erklärt die teilweise seltsamen Sonderzeichen, die da oft mit drin sind...
bei Antwort benachrichtigen
Alois23 Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen

mir ist klar, es wird ein ewiger Kampf werden zwischen Maschinen und Menschen den wir verlieren, aber noch ist es nicht soweit. Eine Lösung von vielen:
http://www.openwebboard.org/Tutorials/HTML_CSS/Barrierefreie_CAPTCHAs_1.html

bei Antwort benachrichtigen
gerhard38 Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen

Ich halte das für eine zumindest stark abgekürzte Darstellung, da es sinnlos ist, nach der Bedeutung einer Zeichenkette zu fragen, wenn nicht einmal klar ist, aus welchem Sprachbereich der Suchbegriff stammt.

Aber selbst wenn das bekannt ist, dann ergibt sich die Bedeutung eines Wortes nicht aus den Buchstaben allein, sondern aus seiner Stellung im Satz. Angenommen, eine unleserliche Zeichenfolge wird von der Mehrheit als "Sofa" gelesen. Der Satz, in dem das Wort vorkommt, würde dann lauten: "Dieser Satz hat Sofa sechs Wörter" - und da ist es dann eher unwahrscheinlich, dass das gesuchte Wort "Sofa" heißt - es sei denn, es handelt sich um das Beispiel für einen syntaktisch korrekten, semantisch aber unsinnigen Satz.

Gruß, Gerhard

bei Antwort benachrichtigen
presla Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen

Hallo Michael,
seit längerer Zeit behelfe ich mit der Lösung Captchaserkennung im voraus automatisiert eintragen zu lassen.
http://captchatrader.com/captchas/solve
Es funktioniert bei den meisten Captchaanfragen automatisch;man muss jedoch diese Captchaautomatisierung durch,nun wirds lustig,Captchaeingaben als Captchacredits verdienen.Das mache ich in der Regel durch öffnen eines 2.ten Browserfensters so nebenbei!

Schau's Dir mal an;evtl. Kommentar dazu!?
Grüße Presla

Grüße aus NRW von Presla....... Wenn wir einmal nicht grausam sind, dann glauben wir gleich, wir seien gut. Kurt Tucholsky
bei Antwort benachrichtigen
Pumbo Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen

Da habe ich offensichtlich wohl auch Robotaugen, denn im o.a. Beispiel kann ich mit dem 4. Buchstaben nix anfangen. Soll das ein "g" sein oder der stiliserte Kopf von Popeyes Freunding Olive oder was ist das für eine krakleige Zumutung?
Fuck, wenn man so was zum Raten bei wichtigen Eingabeformularen/Vorgängen bekommt.

bei Antwort benachrichtigen
torsten40 Michael Nickles

„Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch“

Optionen

Eine gelungende Alternative zum Captcha hab ich letztens enddeckt. Für das Forum phpbb, gibt es ein Plugin, wo man Dinge sortieren muss, das ganze geht per Drag&Drop.
http://www.phpbb.com/community/viewtopic.php?t=1795925
Zudem können diese Antworten auch nicht per OCR ausgelesen werden, und wieder eingefügt werden.

Freigeist
bei Antwort benachrichtigen