Все проектыAll projectsУсі проєкти
Нейросети и машинное обучениеNeural networks & MLНейромережі та ML ЗавершёнCompletedЗавершений 2024

Captcha OCR

Распознавание капчи

Нейросеть для распознавания текста с простых капч — исследование стойкости защиты.A neural network for reading text from simple captchas — a study of how robust they are.Нейромережа для розпізнавання тексту з простих капч — дослідження стійкості захисту.

Исходники не опубликованыSources not publishedВихідники не опубліковані
PythonPyTorch

О проектеOverviewПро проєкт

Капча должна отличать человека от бота. Но если капча простая — искажённый текст на шумном фоне — современная нейросеть читает её без труда. В этом проекте я обучил OCR-модель именно такому распознаванию.

Сделано несколько версий модели — с дропаутом и без, с разным числом эпох и размером батча — и я сравнивал их точность и скорость. Получилось наглядное исследование того, какая капча уже не защищает.

Тема на стыке компьютерного зрения и безопасности: понимать слабость капчи полезно прежде всего тому, кто их проектирует — чтобы знать, что простой защиты больше недостаточно.

A captcha is meant to tell a human from a bot. But if a captcha is simple — distorted text on a noisy background — a modern neural network reads it with ease. In this project I trained an OCR model for exactly that recognition.

Several model versions were made — with and without dropout, with different epoch counts and batch sizes — and I compared their accuracy and speed. The result is a clear study of which captcha no longer protects.

A topic between computer vision and security: understanding a captcha's weakness is useful first of all to whoever designs them — to know that simple protection is no longer enough.

Капча має відрізняти людину від бота. Але просту капчу сучасна нейромережа читає без труднощів.

Зроблено кілька версій моделі — з дропаутом і без — і я порівнював точність і швидкість.

Тема на стику комп'ютерного зору та безпеки: розуміти слабкість капчі корисно тому, хто їх проєктує.

ОсобенностиFeaturesОсобливості

  • OCR-модель для чтения текста с капч
  • Несколько версий: с дропаутом и без, разные эпохи
  • Сравнение точности и скорости версий
  • Исследование стойкости капчи как защиты
  • An OCR model for reading captcha text
  • Several versions: with/without dropout, different epochs
  • Comparison of version accuracy and speed
  • A study of captcha robustness as protection
  • OCR-модель для читання тексту з капч
  • Кілька версій: з дропаутом і без, різні епохи
  • Порівняння точності та швидкості версій
  • Дослідження стійкості капчі як захисту

Похожие проектыRelated projectsСхожі проєкти

Нейросети и машинное обучениеNeural networks & MLНейромережі та ML

MangaColoring

Архитектура нейросети, которая автоматически раскрашивает чёрно-белые страницы манги.A neural-network architecture that automatically colours black-and-white manga pages.Архітектура нейромережі, що автоматично розфарбовує чорно-білі сторінки манги.

Нейросети и машинное обучениеNeural networks & MLНейромережі та ML

MiniGPT

Минимальная реализация языковой модели в стиле GPT, написанная с нуля для понимания трансформеров.A minimal GPT-style language model written from scratch to understand transformers.Мінімальна реалізація мовної моделі в стилі GPT, написана з нуля для розуміння трансформерів.

Нейросети и машинное обучениеNeural networks & MLНейромережі та ML

GAN Learn

Серия учебных экспериментов с генеративно-состязательными сетями на лицах и цифрах MNIST.A series of learning experiments with generative-adversarial networks on faces and MNIST digits.Серія навчальних експериментів із генеративно-змагальними мережами на обличчях і цифрах MNIST.