Сицилианская защита. How to protect text.

11.09.2012

"Лучшая защита это нападение!" 
Мы здесь коротко обсудили вопросы защиты авторского текста, применительно к проекту "Как продать авторский контент". Спасибо поучавствовашим в обсуждении: CoolKat, Lurk, Чердак_Сознания. Я позволю себе суммировать результаты.
    В защищённом файле с авторском текстом, собственно текста не будет, т.е. формат будет графическим (вариант с криптозащитой текста мы тоже рассмотрим, позже, для полноты конспекта).  Базовым графическим форматом мы выбираем DJVU. Почитать про него, можно найти в сети, а редкие и полезные сведения можно найти, перейдя по ссылке. Попробую коротко прописать почему, именно, дежавю (так читается DJVU) .

  1. Только этот формат, специально созданный для текстов, обеспечивает подходящую степень сжатия: 5-30Kb страница. При этом вся книга входит в разумные 2-5Mb.
  2. При упаковке, изображение разбивается на "передний план" (текст) и "фон"(бумагу), алгоритмы сжатия совершенно разные. Выделенный фон - дополнительное удобство (для защиты),  мы разместим на нём уникальный номер экземпляра книги, в виде "водяного знака" на текстуре бумаги.
  3. DJVU - быстрый в отрисовке, многостраничный с "параллельной" адресацией к страницам.
  4. "Текст" в DJVU  - векторный, поэтому ему легко настраиваться на любое разрешение экрана без потери качества. Другое дело линейный размер видимой области. Похоже, придется иметь 3 варианта разбивки страниц (возможно упакованные в общий файл) - для устройств с различными размерами экрана:
  • телефоны и плееры (iPod) экран - 1.8" - 2.2" разрешение  220х176-:-320x240
  • смартфоны и КПК (PDA)      экран - 2.4" - 5"    разрешение 320-240 -:- 800-600
  • настольный PC или ноут     экран -  по вкусу, разрешение, скажем, 1024х768

    Есть ещё много полезностей в формате DJVU, но нам они пока без надобности.  Уточню,  мы рассматриваем DJVU  как основу, которую слегка модифицируем, добавив криптозащиту.
    Теперь, когда формат выбран, попробуем понять от каких угроз нужно защищаться. Допустим мы хотим защищённый текст для широкой раздачи. Что может быть сделано.

  1. Естественней всего - отсканировать страницы (любым способом), превратить в обычный текст (OCR)  и раздать желающим.  Или даже проще, без OCRа: упаковать в PDF (или тот же DJVU). Для бумажного или обычно-электронного способа распространения, бороться с этим злом (?) практически никак. В нашем подходе есть, однако, полезный ню_анс. Текстура "бумаги" (дежавю!) будет содержать уникальный код экземпляра книги (GUID). В какой форме, буковками или точечками - пока не важно. Важно, что избавиться от "водяных знаков" (отредактировать изображения страниц) будет хлопотно, а если не избавляться - всегда можно конкретно предъявить.. Конечно же можно перенабрать текст руками или надиктовать, но массовым этот ход не станет и это ясно почему.
  2. Другой путь - распространять текст вместе с программой - вьюером. Не очень интересно, поскольку ключи шифрования будут уникальными, и много книг так не унесешь. Да и найти чью слямзили и заблокировать экаунт проблем не представляет. Это не вариант. 
  3. Третий,  для настоящих "перцев": декомпилировать вьюер (а он, похоже, будет на Java, т.е. вопрос решаемый), сделать патч, чтоб выбрасывл генерацию "водяных знаков" и сохранял в обычный JPEG. С последующим переходом на вариант 1. Да, такая угроза есть, но исходить она может скорей от конкурентов (дело не простое), да и купить надо по одному экземпляру всего. Есть много приёмчиков и на этот случай, но в эти дебри мы сейчас не пойдём.