Сбер предложил следить за утечками с помощью цифровых «желтых точек»

Сбер запатентовал метод защиты документов от утечек с помощью цифровых меток. Авторы патента, опубликованного на сайте ФИПС, предлагают добавлять в изображение документа на мониторе практически незаметные комбинации из небольших кругов, кодирующие имя пользователя, дату или другие данные.

В середине 2000-х годов исследователи выяснили, что многие производители встраивают в принтеры алгоритм, печатающий на всех документах незаметные невооруженным взглядом желтые точки. Они расположены, казалось бы, хаотичным образом, но расследование показало, что расположение точек кодирует дату и время печати, а также серийный номер принтера. Потенциально это позволяет отследить источник документа, в том числе при утечках, и, вероятно, именно таким образом был выявлен источник утечки документов АНБ в 2017 году.

Поскольку бумажный документооборот постепенно уходит в прошлое и переходит в цифровой формат, разработчики и исследователи создают способы создания устойчивых цифровых меток. Зачастую для этого используются те или иные идентификаторы в коде документа, но они не защищают от утечки через фотографирование или другие непрямые способы передачи данных. Есть также разработки, основанные на стеганографии, внедряющие водяные знаки в виде псевдослучайных паттернов непосредственно в изображение, выводимое на монитор. Например, таким образом киностудии и стриминги борются с пиратством, отслеживая источник выложенной в интернет копии.

Сбер 24 марта получил патент на метод внедрения незаметных меток, похожий на метод желтых точек, но в цифровом исполнении. Авторы предлагают при формировании изображения на экране, например, при просмотре документа, выводить его на подложку с почти незаметными графическими метками. Каждая метка состоит из массива кругов (хотя может использоваться и другая фигура), в котором их расположение и размер кодирует нужную информацию, такую как дата, время и идентификатор пользователя или устройства. При этом круги выводятся на экран почти незаметным для глаза цветом с высокой степенью прозрачности. Массивы могут быть одинаковыми или разными, также в них может применяться код коррекции ошибок, позволяющих восстановить данные, даже если часть массивов была не прочитана или прочитана с ошибками.

Даже если документ был «слит» в виде фотографии, а не исходного файла или скриншота, программа сможет обнаружить в нем метки. Для этого авторы предлагают вычитать из изображения цвет меток и затем анализировать его на предмет искомого паттерна. В качестве варианта применения метода Сбер описывает клиент-серверную архитектуру, в которой центральный сервер раздает документы на другие компьютеры, встраивая в них уникальные для каждой машины или пользователя метки, чтобы «вести единый учет вычислительных устройств и своевременно определять место утечки данных».

Иногда для выявления недобросовестной работы с документами достаточно просто шрифта. В 2019 году мы рассказывали, как шрифты Calibri и Cambria позволили понять, что документы были подделаны: они датировались 1990-ми годами, но эти шрифты появились лишь в середине 2000-х.

Григорий Копиев

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Есть задача

Как обучить нейросеть и оценить результаты ее работы

Алгоритмы машинного обучения прошли долгий путь от понятного инструмента к «чёрному ящику» — порой их создателям сложно объяснить, почему модель выдает тот или иной результат. Однако это важно понимать, чтобы более эффективно обучать нейросети и взаимодействовать с ними. В подкасте «Есть задача», который N + 1 делает вместе с Yandex Research, мы рассказываем, зачем исследовать работу ML-моделей и сравнивать их друг с другом.