Как термин используется с 2000 года. В Рунете часто употребляется транскрипция «капча» – универсальный, отфильтровывающий заполнение ботом полей формы ввода тест. Его цель – предложить простую для пользователя, но сложную для решения компьютером задачу. При раскрутке сайта CAPTCHA используется для защиты ресурса от спама в комментариях, автоматической регистрации и т.д.
Реализация
Встречаются следующие варианты капчи:
- графические. Пользователь должен ввести число, текст или другие символы, изображенные на картинке в искаженной форме, с добавлением полупрозрачности или шума;
- звуковые. Основываются на распознавании речи. Нередко используются для пользователей с нарушением зрения;
- Например, из терминов «ключевое слово», «табуретка», «мета-тег» и «HTTP» необходимо выбрать слово, не имеющее отношения к поисковой оптимизации сайта;
- образные. Пользователь должен распознать образ объекта;
- видео капчи. Символы и фон изображения находятся в движении.
Защита от автораспознавания капчи
Для эффективного продвижения сайта оптимизатор принимает превентивные меры для предотвращения распознавания капчи ботом.
- Уязвимости. Если CAPTCHA вызывается скриптом вида `img scr="/captcha.php?code=5555"`, бот считает URL и введет ответ 5555.
- Угадывание. В случае небольшого числа вариантов ответа бот попытается угадать правильный. К примеру, если задача поставлена – из 10 изображений отметить птиц, то существует всего 210 = 1024 ответа. Это означает, что один автоматический запрос из 1024 пройдет капчу.
- Автоматическое распознавание. Разработаны программы, например, PWNtcha, которые распознают конкретные реализации капчи. Многие из них с вероятностью в 99% могут обойти «слабую» CAPTCHA, если в изображении используется фиксированное положение элементов, шрифт, размытия по Гауссу, символы легко отделены друг от друга или от фона (посредством цветового ключа), отсутствуют искажения и т.д.
Существуют и другие способы пройти капчу, не распознавая изображение:
- бот повторно использует идентификаторы сессии;
- восстанавливает изображенные символы по информации, которая содержится на странице;
- собирает базу данных под различные символы капчи, выдаваемые генератором псевдослучайных чисел.