Mnozí z nás to dobře znají – dostaneme se na webovou stránku, musíme zaškrtnout políčko „Nejsem robot“ a vzápětí nám systém předhodí mřížku obrázků s výzvou k označení všech semaforů. Často si říkáme, proč to musíme dělat, když jsme před chvílí potvrdili, že jsme člověk a systém se tvářil, že nám věří. Tahle zdánlivě banální činnost má ale mnohem hlubší smysl, než se na první pohled zdá, a rozhodně nejde jen o ověření vaší identity.

Od ochrany před roboty k záchraně knih: První kroky reCAPTCHA

Původní myšlenka testů CAPTCHA, což je zkratka pro „Completely Automated Public Turing test to tell Computers and Humans Apart“, vznikla na začátku 21. století jako obrana proti automatizovaným botům. Jejich hlavním cílem bylo chránit webové služby před spamem, hromadnou registrací falešných účtů a dalším zneužíváním, které by mohlo narušit funkčnost a bezpečnost online prostředí. Jak se dočtete například na Wikipedii, zpočátku šlo především o textové testy, které měly být pro lidi snadné, ale pro stroje neřešitelné.

Skutečný zlom však přišel s projektem reCAPTCHA, který v roce 2007 představil Luis von Ahn. Ten si uvědomil, že miliony hodin, které lidé tráví řešením CAPTCHA testů, by se daly využít i k něčemu produktivnějšímu. Namísto generování náhodných znaků začala reCAPTCHA uživatelům předkládat slova nebo úryvky textu, které optické rozpoznávání znaků (OCR) nedokázalo spolehlivě přečíst z digitalizovaných starých knih a novin.

Každé slovo bylo prezentováno dvěma uživatelům; pokud se jejich odpovědi shodovaly, systém je považoval za správné a slovo bylo úspěšně digitalizováno. Tímto geniálním způsobem reCAPTCHA nejen ověřovala lidskou identitu, ale zároveň pomáhala s obrovským úkolem digitalizace a archivace lidského vědění. Když Google v roce 2009 reCAPTCHA získal, tento koncept ještě více rozšířil a využil ho k digitalizaci celého archivu Google Books a také k vylepšování dat pro Google Street View. O tom, jak technologie Street View a reCAPTCHA spolupracují, psal například Google Security Blog.

Close-up of hands holding and reading an antique book indoors, symbolizing knowledge and learning.
Lidská ruka pomáhá s rozpoznáváním textu ze starých knih. (zdroj: Pexels / Lisa from Pexels)

Když se text proměnil v obrázky: Trénink zraku pro AI

S neustálým pokrokem v oblasti umělé inteligence a strojového učení se však situace začala měnit. Textové CAPTCHA testy, které dříve představovaly pro boty nepřekonatelnou překážku, se staly pro sofistikované algoritmy snadno řešitelné. Roboti se naučili rozpoznávat zkreslené znaky s překvapivou přesností, což si vyžádalo novou strategii v ověřování lidské identity, protože vizuální deformace textu už nebyla dostatečná obrana.

Proto jsme svědky masivního přechodu k obrazovým výzvám. Dnešní CAPTCHA testy, které nás žádají identifikovat semafory, přechody pro chodce, autobusy nebo výlohy obchodů, už neslouží primárně k odlišení člověka od robota v tradičním smyslu.

Místo toho se staly masivním globálním projektem pro trénování algoritmů umělé inteligence v rozpoznávání objektů v reálném světě.
Každé vaše kliknutí na obrázek semaforu je tak malým, ale důležitým datovým bodem pro AI.

Představte si to jako miliardy mikrolekcí, které lidstvo denně poskytuje strojům. Tyto testy učí umělou inteligenci, jak vypadají konkrétní objekty z různých úhlů, za různého osvětlení a v různých kontextech. To je klíčové pro systémy, které potřebují „vidět“ a interpretovat svět stejně jako člověk, aby mohly fungovat bezpečně a efektivně.

Zatímco pro nás je rozpoznání semaforu na obrázku intuitivní, pro stroj je to složitý úkol. AI musí být schopna odfiltrovat šum, rozpoznat objekt i v částečném zakrytí, za špatného počasí nebo při nestandardním úhlu pohledu. Každý označený pixel tak pomáhá budovat robustnější a spolehlivější model pro vizuální vnímání strojů, což je základem mnoha budoucích technologií.

Neviditelná ruka, která řídí auta: Jak pomáháme Waymo

Data, která nevědomky generujeme řešením těchto obrazových testů, jsou nesmírně cenná. Jsou využívána k vylepšování mnoha služeb, které denně používáme. Jedním z nejznámějších příkladů je zlepšování přesnosti a detailnosti mapových podkladů pro Google Maps. Když označíte například výlohu obchodu, pomáháte systému lépe pochopit, co se na daném místě nachází, a doplňovat tak chybějící informace.

Ještě důležitější je však role, kterou hrají v rozvoji autonomních vozidel. Dceřiná společnost Google, Waymo, je jedním z lídrů v této oblasti a její samořídící auta potřebují dokonale rozpoznávat své okolí. Každý semafor, dopravní značka, chodec nebo jiné vozidlo, které označíte v CAPTCHA testu, pomáhá trénovat zrak těchto aut, aby mohla bezpečně navigovat v komplexním silničním provozu a správně reagovat na nečekané situace.

Když si uvědomíme rozsah tohoto projektu, je to ohromující. Odhaduje se, že uživatelé denně stráví statisíce hodin „bezplatnou lidskou prací“ trénováním umělé inteligence prostřednictvím CAPTCHA testů. Je to globální, distribuovaný úkol, kde každý z nás přispívá k technologickému pokroku, často aniž by o tom věděl nebo přemýšlel v širších souvislostech. Tato kolektivní snaha posouvá hranice toho, co stroje dokážou.

Za oponou „Nejsem robot“: Co všechno o nás reCAPTCHA ví

Nejnovější iterace reCAPTCHA, verze 3, posunula ověřování ještě dál. Místo abyste museli explicitně řešit vizuální hádanky, reCAPTCHA v3 často funguje zcela na pozadí, aniž byste si její přítomnosti všimli. Analyzuje vaše chování na webové stránce v reálném čase, aby určila, zda jste člověk, nebo robot, a to s minimálním narušením uživatelského zážitku.

Jak to dělá? Sleduje celou řadu faktorů: pohyby myši, způsob psaní, historii prohlížení, čas strávený na stránce, IP adresu a dokonce i nastavení vašeho prohlížeče. Tyto údaje jsou pak analyzovány pomocí komplexních algoritmů strojového učení, které hledají vzorce typické pro lidské chování. Pokud se chováte „lidsky“, projdete bez nutnosti klikat na obrázky, což je pro mnoho uživatelů velká úleva.

Tento neviditelný systém je sice mnohem méně rušivý pro uživatele, ale zároveň znamená, že reCAPTCHA o nás ví mnohem víc, než si většina z nás uvědomuje. Je to složitá rovnováha mezi bezpečností, uživatelským komfortem a etickými otázkami ohledně sběru dat. Ať už ale označujete semafory, nebo reCAPTCHA pracuje na pozadí, jedno je jisté: nevědomky se stáváte součástí obrovského globálního projektu, který pomáhá učit stroje, jak vidět a rozumět světu kolem nás.

To, co začalo jako jednoduchá obrana proti robotům, se vyvinulo v sofistikovaný systém, který s každým naším kliknutím formuje budoucnost umělé inteligence a autonomních technologií.