Капча
Капча, CAPTCHA от англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которую с лёгкостью может решить человек, но которую несоизмеримо сложнее решить компьютеру. CAPTCHA — это товарный знак университета Карнеги — Меллона, разработавшего тест. По состоянию на 2013 г. примерно 320 миллионов капчи вводится каждый день пользователями во всём мире[1].
Содержание |
Варианты реализации [править]
В наиболее распространённом варианте капчи пользователь вводит символы, изображённые на рисунке (зачастую с добавлением помех или полупрозрачности). По общепринятым нормам доступности интернета для людей со слабым зрением, такая капча должна дополняться вариантом, основанным на распознавании речи (аудио-капча).
Могут также применяться другие плохо алгоритмизуемые задачи: например, узнать, что находится на картинке, отметить все картинки с кошками или ответить на вопрос, связанный со знаниями или менталитетом людей (например, «висит груша, нельзя скушать»). Тем не менее, стандартом стало именно распознавание символов: оно не привязано ни к какой культуре (основная помеха — слабое зрение), работает даже на мобильных браузерах, и пользователь со стажем быстро опознаёт картинку как капчу.
Способы прохождения капчи роботом [править]
Использование уязвимостей [править]
Предположим, картинка с цифрами 1234 вызывается кодом.
<img src="/captcha.php?code=1234" />
Вместо того, чтобы проходить капчу, компьютер считывает URL и вводит ответ 1234.
При недостаточной квалификации веб-программиста робот может выдать ответ, не проходя тест. Например, по какой-либо информации, содержащейся на странице, компьютер сам, без вмешательства человека, способен правильно ответить на вопрос, на который предположительно мог ответить только человек. Либо человек проходит тест один раз, а компьютер фабрикует множество запросов с тем же ответом.
Угадывание [править]
Применяется в первую очередь для «нетрадиционных» капчей с небольшим количеством вариантов ответа (1000 и меньше). Робот посылает случайные ответы; некоторые из них оказываются верными.
Использование баз данных [править]
Эффективно, когда вопросы подготавливаются администратором, а не генерируются автоматикой. Этим способом проходятся многие нетрадиционные варианты капчи: например, отметить все картинки с кошками.
Автоматическое распознавание [править]
- Лёгкое отделение символов от фона с помощью цветового ключа.
- Лёгкое отделение символов друг от друга.
- Фиксированный и неискажённый шрифт.
После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут опознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен.
В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная капча с использованием библиотеки GD.
Существуют программы (к примеру, PWNtcha), распознающие конкретные реализации капчи. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например, FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок капчи.
По отношению к автоматизированному распознаванию существуют понятия «слабая капча» и «сильная капча». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что сильная капча оказывается труднораспознаваемой и для человека. Изредка встречается капча, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой).
Если сгенерированная картинка оказалась нечитаемой, пользователь, как правило, имеет возможность получить новую. Прочная капча должна выдавать картинку с другим ответом[2].
Многие нетрадиционные варианты капчи также на поверку оказались слабыми.[3][4]
Распознавание чужими руками [править]
Есть способ «распознавания», в соответствии с поговоркой «чужими руками жар загребать», использующий человеческий ресурс с высокопосещаемых сайтов, например, сайтов порно-тематики. Робот скачивает капчу с нужного интернет-сервиса и предъявляет его посетителю порносайта. Взамен посетитель порносайта получает доступ к порно-ресурсу, а робот узнаёт код, изображённый на картинке, и вводит его на «штурмуемом» сайте. Посетитель порносайта может и не подозревать, что каждый просмотренный порноролик оборачивается регистрацией нового почтового ящика для рассылки спама.
Для защиты (не полной) от такого способа обхождения капчи сайт автоматически меняет капчу-картинку, если ответ на неё не ввели сразу (в течение небольшого промежутка времени), — регулярно каждый раз через определённый период времени, или при попытке начать запоздалый ввод ответа.
Есть также специализированные сайты для обмена или продажи капч.
Полезность капчи против спама [править]
Капча сама по себе не может остановить спамеров (1000 распознаваний людьми стоят около 1 $). С другой стороны, этот метод защиты может создавать большие неудобства людям.
К тому же капчей злоупотребляют, например, файловые хостинги, что несёт в массы сервисы по распознаванию капчи и делает их ещё более неэффективными.[5]
Известные CAPTCHA-службы [править]
reCAPTCHA — проект, использующий в роли рабочего элемента для ответов пользователей на капча-запрос неразборчивое для OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки текста книг. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.
Примечания [править]
- ↑ Луис фон Ан: Массовое онлайн-сотрудничество // конференция TED, 2011
- ↑ Алгоритм проверки . CAPTCHA.ru. Архивировано из первоисточника 3 июня 2012.
- ↑ Решение MintEye CAPTCHA в 23 строки кода / Хабрахабр. Архивировано из первоисточника 2 февраля 2013. Проверено 21 января 2013.
- ↑ Алгоритм распознавания KeyCaptcha. Архивировано из первоисточника 18 октября 2012.
- ↑ Captcha FAQ — JD Community
Ссылки [править]
- Капча в каталоге ссылок Open Directory Project (dmoz).
- Inaccessibility of CAPTCHA / W3C (англ.). Архивировано из первоисточника 15 мая 2012.
Для улучшения этой статьи желательно?:
|
