Все проектыAll projectsУсі проєкти
Боты и автоматизацияBots & automationБоти та автоматизація ЗавершёнCompletedЗавершений 2026

WhisperBot

Речь в текст

Telegram-бот, который расшифровывает голосовые сообщения и видео-кружочки в текст моделью Whisper.A Telegram bot that transcribes voice messages and video notes into text using Whisper.Telegram-бот, що розшифровує голосові повідомлення та відеокружальця в текст моделлю Whisper.

О проектеOverviewПро проєкт

Удобный бот для тех, кому неудобно слушать голосовые — в транспорте, на паре, рядом со спящими. Пересылаешь боту голосовое или видео-кружок, получаешь обратно текст.

Внутри — модель распознавания речи Whisper от OpenAI. Бот рассчитан на нагрузку: есть очередь задач и несколько рабочих потоков, поэтому несколько сообщений обрабатываются параллельно, а пользователь видит свою позицию в очереди.

Поддерживает ускорение на видеокарте через CUDA и умеет при необходимости сохранять исходные аудиофайлы. Серверная пара к моему проекту Whisper STT.

A handy bot for those who can't conveniently listen to voice notes — on transit, in class, near someone sleeping. Forward the bot a voice message or video note and get text back.

Inside is OpenAI's Whisper speech-recognition model. The bot is built for load: there's a task queue and several worker threads, so multiple messages are processed in parallel and the user sees their position in the queue.

It supports GPU acceleration via CUDA and can save the original audio files when needed. A server-side companion to my Whisper STT project.

Зручний бот для тих, кому незручно слухати голосові. Пересилаєш йому голосове чи відеокружальце — отримуєш текст.

Усередині — модель Whisper від OpenAI. Бот розрахований на навантаження: черга задач і кілька робочих потоків.

Підтримує прискорення на GPU через CUDA. Серверна пара до проєкту Whisper STT.

ОсобенностиFeaturesОсобливості

  • Расшифровка голосовых и видео-кружочков в текст
  • Модель распознавания речи Whisper от OpenAI
  • Очередь задач и параллельная обработка
  • Ускорение на GPU через CUDA
  • Информирование пользователя о позиции в очереди
  • Transcribes voice messages and video notes into text
  • OpenAI's Whisper speech-recognition model
  • A task queue and parallel processing
  • GPU acceleration via CUDA
  • Tells the user their position in the queue
  • Розшифрування голосових і відеокружалець у текст
  • Модель Whisper від OpenAI
  • Черга задач і паралельна обробка
  • Прискорення на GPU через CUDA
  • Інформування про позицію в черзі

Похожие проектыRelated projectsСхожі проєкти