Капча научилась отличать людей от ботов сгенерированными картинками

Сервис hCaptcha начал генерировать изображения нейросетями, чтобы отделять людей от ботов в интернете, на это обратили внимание пользователи реддита. Кроме того, теперь в капче используются более сложные вопросы: нужно распознать не только объект, но и его характеристики, например, кошек с короткой шерстью.

По некоторым оценкам боты уже почти сравнялись по активности в интернете с людьми. Чтобы отделять их от людей, сайты используют разные подходы. Например, можно следить за быстрыми действиями и другой не похожей на человека активностью. Другой популярный способ выявления ботов — капча, то есть простое для человека, но трудное для алгоритмов задание. Чаще всего капчи показывают несколько изображений и просят выбрать на них объекты, например, автомобили или пожарные гидранты. Чтобы усложнить задачу, на изображения обычно добавляют шум и другие искажения. Но поскольку алгоритмы компьютерного зрения развиваются очень быстро, этого часто уже недостаточно.

Пользователи сабреддита r/artificial заметили, что в одном из популярных сервисов капч hCaptcha теперь для отделения людей от алгоритмов используются изображения, сгенерированные алгоритмами. Они предположили, что сервис использует ответы людей как разметку данных, чтобы дообучать алгоритмы и улучшать качество генерации.

Несмотря на то, что изображения выглядят достаточно качественно, на них можно заметить артефакты, типичные для нейросетевых алгоритмов генерации. Например, на изображении с тарелкой может быть смазанный край, слившийся с предметом, напоминающим вилку, а вместо фотографии птицы сервис часто показывает нечто, напоминающее ее по форме, но сильно отличающееся от настоящего животного.

На то, что hCaptcha начала применять современные генеративные алгоритмы, косвенно указывает одна из задач, в которой пользователю показывают детализированные печенья в форме животных. Качественное совмещение в одном предмете подобных понятий (в этом случае — печенье и животное) до недавнего времени было слабой стороной генеративных алгоритмов, и зачастую именно это выделяют разработчики недавних нейросетевых моделей, основанных на CLIP или аналогичных подходах. Например, разработчики DALL-E демонстрировали в анонсе, как их алгоритм генерирует стул в форме авокадо.

Еще одно усложнение капчи заключается в том, что теперь пользователю нужно выбрать не просто указанный предмет, но и обращать внимание на его характеристики. Например, в одном из заданий нужно отделить растения в горшках, стоящие на столе от тех, что свисают с потолка.

Все капчи отделяют людей от ботов, но не всегда эта проверка заканчивается в пользу человека. В 2018 году мы рассказывали о капче, которая пускает на сайт только ботов.

Григорий Копиев

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.