📷

Распознать текст с фото

Загрузи скан или фото — получи текст. Работает с русским и английским языком. Прямо в браузере, без загрузки на сервер.

📁 Перетащи фото сюда

или нажми, чтобы выбрать. JPG, PNG, фото с телефона.

Что такое OCR

OCR (Optical Character Recognition — оптическое распознавание символов) — это технология, которая «читает» текст с изображения и превращает его в редактируемый формат. Используется везде: от приложений для сканирования паспортов до Google Translate и ABBYY FineReader.

Наш инструмент использует Tesseract.js — современный движок OCR с открытым исходным кодом, разработанный Google. Точность распознавания качественных сканов — 95-98%, для фотографий с телефона — обычно 80-95%.

Когда нужен OCR

Сфотографировал документ — нужен текст. Договор, справка, бумажный конспект — за секунды получаешь редактируемый текст.
Чтение книг и статей. Сфоткал страницу — распознал — отредактировал/перевёл.
Конспекты лекций. Сфотографировал доску — сразу в текст.
Извлечь номер из фотографии. Например, номер телефона или ИНН на визитке.
Подготовка текстов для учёбы. Старые учебники без электронной версии — переведи в текст.
Цитаты из книг. Не нужно перепечатывать вручную.

Как сделать чтоб распознавалось точнее

Хорошее освещение. Снимай при дневном свете или ярком лампе. Тени и блики снижают точность на 20-30%.
Контраст. Чёрный текст на белом фоне — идеально. Светло-серый текст на сером фоне — почти не читается.
Без перспективы. Держи камеру строго перпендикулярно странице. Перекос → буквы кривые → ошибки.
Без размытия. Фиксируй фокус — лучше всего автофокус по центру.
Достаточное разрешение. Минимум 1500 пикселей по широкой стороне. На современных телефонах это получается автоматически.
Сначала выпрями. Используй приложение «Заметки» (iPhone) или Google Drive «Сканировать» (Android) — они автоматически выровняют документ.

Безопасность

Распознавание происходит на твоём устройстве. Файлы никуда не отправляются — ни на наш сервер, ни в Google. Это значит:

🔒 Можно безопасно распознавать паспорта, договоры, медкарты, выписки
📶 Работает без интернета (после первой загрузки)
🛡 Никто не сможет «прочитать» твои сканы — они есть только у тебя

Первая загрузка инструмента (модели языков) занимает ~30 МБ и работает 30-90 секунд. Дальше — мгновенно.

Языки и точность

Русский — 92-97% для качественных сканов, 75-90% для фото
Английский — 95-99% / 85-95%
Рукописный текст — не поддерживается (нужна нейронка)
Печатные шрифты любые — Times, Arial, Verdana и другие
Сильно стилизованные шрифты (рукописные имитации, готика) — низкая точность

Альтернативы и сравнение

FineReader Online — платный, очень точный, для серьёзной работы
Google Lens — бесплатный, точный, но всё уходит в Google
Adobe Acrobat OCR — платный, для PDF
Наш OCR — бесплатный, приватный, прямо в браузере, подходит для бытовых задач

Частые вопросы

Может ли распознать рукописный текст?

Tesseract на рукописный текст не рассчитан. Точность будет 30-50%, что обычно бесполезно. Для рукописного нужны нейросети — Google Lens или ABBYY ScanWriter.

Какой максимальный размер фото?

Технически — сколько хватит памяти браузера. На практике до 10 МБ. Очень большие фото лучше сначала сжать.

Как из PDF получить текст?

Открой PDF в браузере, сделай скриншот страницы и загрузи сюда. Или конвертируй PDF в JPG через любой бесплатный сервис.

Почему первый раз долго работает?

Скачивается модель распознавания языков — ~30 МБ. После — всё мгновенно.