Нейросети для распознавания рукописных паспортов
В России создали новое поколение нейросетей для распознавания российского паспорта. Теперь искусственный интеллект (ИИ) может считать любую страницу документа. Благодаря этой разработке удалось реализовать уникальную и не имеющую аналогов особенность – автоматическое распознавание рукописного адреса в штампе о месте регистрации.
Для этого на датасете, содержащем 1,3 млн синтетически сгенерированных изображений рукописных строк, были обучены рекуррентные сверточные нейросети. Они способны распознавать символы с учетом контекста. Разработанная система за 0,4 секунды обнаруживает штамп с пропиской на изображении, отделяет рукописный текст от печатного и распознает его.
Представитель компании Smart Engines рассказал, что первая версия системы для распознавания паспорта России, которая могла извлекать данные только из печатного паспорта, была создана и представлена нами еще в 2015 г. В 2019 г. они представили ИИ, способный распознавать как печатный, так и рукописный текст в российском паспорте. На тот момент программное решение могло считывать данные только основного разворота паспорта, заполненного от руки.
И сейчас система может распознавать всю рукопись в российском паспорте и справляется с задачей значительно лучше, чем предыдущее наше решение. Это стало возможным благодаря улучшению всего алгоритмического стека нейросетевых технологий распознавания рукописного текста.
Генеральный директор Smart Engines Владимир Арлазаров сказал: «Качество ввода паспортных данных человеком и так называемые 99% точности распознавания были достигнуты нами давно». Он добавил, что сейчас усилия компании сосредоточены на этом 1% сложных для алгоритмов ИИ и человека случаях, чтобы с выходом каждой новой версии количество «нераспознаваний» стремилось к нулю.
Отсутствие аналогов на рынке
«Мы не знаем про существование таких промышленных технологий на рынке», - заявил собеседник из Smart Engines. По его словам, есть сервисы распознавания, в которых для ввода данных используется труд внешних операторов, а их продукт предлагает полностью автоматическое решение по распознаванию паспортов и других документов, которое не передает данные третьим лицам.
Программное обеспечение компании применяют 10 из 13 системно значимых кредитных организаций России – Альфа-Банк, ВТБ, Газпромбанк, Московский кредитный банк, банк «Открытие», Промсвязьбанк, Райффайзенбанк, Росбанк, Совкомбанк и Тинькофф. Также решения Smart Engines используются при продаже билетов в кассах Российских железных дорог (РЖД), на автоматическом паспортном контроле в Шереметьево и при регистрации самозанятых в приложении Федеральной налоговой службы России (ФНС) «Мой налог».
Представитель Smart Engines дополнил, что их ИИ уже распознает кроме российского паспорта более 2500 национальных и международных паспортов, идентификационных карт (ID), водительских прав и других удостоверений для более чем 220 юрисдикций всего мира на более чем 100 языках.
Выручка и деятельность Smart Engines
Компания Smart Engines основана в 2016 г. Она специализируется на создании программных продуктов по распознаванию документов, удостоверяющих личность, банковских карт, а также корпоративных документов и форм.
По данным компании, выручка от продажи решений и услуг в 2022 г. составила 382,9 млн. руб., а в 2021 г. – 280 млн руб. Прибыль от продажи решений и услуг компании составила в 2022 г. 172 млн руб., в 2021 г. – 107 млн руб. За 2022 г. выручка Smart Engines увеличилась на 37%, а рост прибыли составил 60%.
По данным базы «Контур Фокус», баланс компании на конец 2022 г. составляет 331,3 млн руб. Генеральным директором Smart Engines является Владимир Арлазаров. Уставный капитал организации – 10 000 руб.