Предложен метод распознавания трудночитаемых слов
Группа программистов из Университета Карнеги Мэлон разработала способ, как направить энергию миллионов пользователей интернета для решения задачи оцифровки книг.
Они модифицировали известную...
Группа программистов из Университета Карнеги Мэлон разработала способ, как направить энергию миллионов пользователей интернета для решения задачи оцифровки книг.
Они модифицировали известную технологию Captcha, заключающуюся в идентификации человека путем распознавании трудночитаемых знаков. Программы-роботы, запускаемые в Сеть спамерами и флудерами, не могут пройти эти тесты, а человек может. Поэтому с помощью Captcha владелец сайта может хотя бы частично защитить свой форум от рекламы и флуда.
Программисты из Карнеги-Мэлон разработали программу ReCaptcha, которая помимо доказательства, что пользователь – человек, помогает в оцифровке книг, распознавая слова, нечитаемые системами оптического распознавания (OCR). Программа просит распознать два слова, значение одного из которых ей известно. Если пользователь правильно решает задачу с известным ответом, но программа считает, что он правильно распознал и неизвестное слово.
Разработчики ReCaptcha подсчитали, что всего в мире каждый день читается 60 млн. сaptcha. Поэтому вклад программы в оцифровку трудно читаемых книг может быть довольно значительным.