Captcha OCR
Распознавание капчи
Нейросеть для распознавания текста с простых капч — исследование стойкости защиты.A neural network for reading text from simple captchas — a study of how robust they are.Нейромережа для розпізнавання тексту з простих капч — дослідження стійкості захисту.
О проектеOverviewПро проєкт
Капча должна отличать человека от бота. Но если капча простая — искажённый текст на шумном фоне — современная нейросеть читает её без труда. В этом проекте я обучил OCR-модель именно такому распознаванию.
Сделано несколько версий модели — с дропаутом и без, с разным числом эпох и размером батча — и я сравнивал их точность и скорость. Получилось наглядное исследование того, какая капча уже не защищает.
Тема на стыке компьютерного зрения и безопасности: понимать слабость капчи полезно прежде всего тому, кто их проектирует — чтобы знать, что простой защиты больше недостаточно.
A captcha is meant to tell a human from a bot. But if a captcha is simple — distorted text on a noisy background — a modern neural network reads it with ease. In this project I trained an OCR model for exactly that recognition.
Several model versions were made — with and without dropout, with different epoch counts and batch sizes — and I compared their accuracy and speed. The result is a clear study of which captcha no longer protects.
A topic between computer vision and security: understanding a captcha's weakness is useful first of all to whoever designs them — to know that simple protection is no longer enough.
Капча має відрізняти людину від бота. Але просту капчу сучасна нейромережа читає без труднощів.
Зроблено кілька версій моделі — з дропаутом і без — і я порівнював точність і швидкість.
Тема на стику комп'ютерного зору та безпеки: розуміти слабкість капчі корисно тому, хто їх проєктує.
ОсобенностиFeaturesОсобливості
- OCR-модель для чтения текста с капч
- Несколько версий: с дропаутом и без, разные эпохи
- Сравнение точности и скорости версий
- Исследование стойкости капчи как защиты
- An OCR model for reading captcha text
- Several versions: with/without dropout, different epochs
- Comparison of version accuracy and speed
- A study of captcha robustness as protection
- OCR-модель для читання тексту з капч
- Кілька версій: з дропаутом і без, різні епохи
- Порівняння точності та швидкості версій
- Дослідження стійкості капчі як захисту