Проблема компрессии многомерных цифровых сигналов (изображений), хранящихся в виде массивов данных в памяти ЭВМ или передаваемых по цифровым каналам, была сформулирована более 40 лет назад. С тех пор этот вид обработки постоянно находился в поле зрения исследователей (см. обзорные материалы в журналах ТИИЭР (Proceedings of IEEE) 3.1967, 7.1972, 3.1980, 3.1981, 4.1985, сборник "Методы передачи изображений. Сокращение избыточности. - М.: Радио и связь, 1983; монографии У.Прэтта "Цифровая обработка изображений". - М. :Мир, 1983; Методы сжатия данных / Д.Ватолин, А.Ратушняк, М.Смирнов, В.Юкин – М.: Диалог-МИФИ, 2002 и др.). На сегодня известно несколько основных классов методов компрессии, применяемых при решении различных задач передачи и хранения изображений: методы дифференциального кодирования, методы кодирования с преобразованием (включая методы, основанные на вейвлет-преобразованиях), интерполяционные методы (включая иерархические), методы, основанные на структурной декомпозиции (сегментации) изображения, методы, основанные на векторном квантовании, фрактальные методы. Каждый из известных подходов к компрессии изображений имеет свои достоинства, но ни один из них не свободен от недостатков. На практике для компрессии двумерных изображений наиболее широко применяется метод и стандарт (формат данных) JPEG, основанный на косинусном преобразовании, а также JPEG2000, использующий иерархическое вейвлет-разложение двумерного сигнала. Для трехмерных цифровых видеосигналов в настоящее время наиболее известны методы (стандарты) MPEG-2 и MPEG-4, которые сочетают в себе операции адаптивной межкадровой интерполяции с компрессией двумерных (опорных и разностных) изображений методами, близкими к JPEG и JPEG-2000, соответственно. Все перечисленные методы (за исключением некоторых вариантов дифференциальных кодеров) изначально разрабатывались для «бытовых» или технических применений и поэтому по характеристикам не вполне подходят для использования в космических системах ДЗЗ. Тем не менее, многие из них реализованы в составе бортового оборудования современных российских и зарубежных спутниках дистанционного зондирования. Так, метод дифференциального кодирования изображений используется на спутниках SPOT-1,2,3,4 (Франция, годы запуска - 1986-1998), IKONOS (США, 1999), QuickBird (США, 2001), Ресурс-ДК (Россия, 2006), WorldView-1 (США, 2007). Метод JPEG реализован на борту спутников SPOT-5 (Франция, 2002), IRS-P5 (Индия, 2005), Beijing-1 (Китай, 2005), Cartosat-1,2 (Индия, 2005, 2007), а метод JPEG-2000 – на спутниках IMS-1 (Индия, 2008), X-SAT (Сингапур, 2009), PLEIADES-HR (Франция, 2010). На спутниках радиолокационного наблюдения Radarsat-2 (Канада, 2007) и TerraSAR (Германия, 2007) используются методы векторного квантования. Съемочная аппаратура указанных спутников обеспечивает получение полутоновых (панхроматических) или многозональных (в 3-8 спектральных диапазонах) изображений земной поверхности, поэтому использование в них методов компрессии двумерных изображений, после некоторых доработок, кажется вполне естественным. Однако появление новых спутников с системами гиперспектрального ДЗЗ ставит перед исследователями принципиально новые задачи разработки специфических методов компрессии трехмерных цифровых сигналов.
Широкое распространение и применение цифровых изображений как носителей данных дистанционного зондирования Земли (ДЗЗ), на основании которой принимаются решения на муниципальном, региональном и государственном уровнях, делает актуальной задачу выявления возможных фальсификаций таких данных как способа снижения рисков в принятии указанных решений. Защита цифровых изображений от несанкционированного копирования, модификации и распространения, является важным направлением обеспечения информационной безопасности информационных систем, связанных с обработкой и анализом визуально представимой информации. В настоящее время выделяют (M. Sridevi, C. Mala) два основных способа обнаружения искусственных искажений цифровых изображений вообще и данных ДЗЗ, в частности: активный и пассивный. Основным элементом активного подхода к обнаружению искусственных искажений изображений являются ЦВЗ. Спецификой этого подхода является то, что ЦВЗ должен быть встроен в изображение во время записи. В отличие от активного, пассивный подход не использует ЦВЗ и основан на предположении, что следы изменений можно обнаружить путём компьютерного анализа самого изображения. В рамках активного подхода к защите изображений традиционно [Cox, 1999], [Kutter, 1999] исследуются следующие два способа защиты.
1) Защита цифрового изображения от несанкционированного копирования. Основными недостатками существующих методов, согласно [Pereira, 2000] и [Cox, 2004], является их вычислительная сложность при работе с крупноформатными изображениями. Кроме того, надежность данных алгоритмов с криптографической и стеганографической точек зрения [Furht,2005] недостаточно исследована.
2) Защита цифрового изображения от модификации. Основным недостатком существующих решений являются: отсутствие исследований по их устойчивости к криптографическим атакам; не разработаны адаптированные методы криптоанализа и стегоанализа, позволяющих достоверно оценивать стойкость подобных алгоритмов встраивания ЦВЗ к распространенным видам атак.
Большинство известных работ (S. Prasad, B. Mahdian, A.C. Popescu и др.), относящихся к пассивному подходу обеспечения безопасности изображений, направлены на решение задач обнаружения совершенно конкретных искажений в изображениях – атак. Для каждой атаки разрабатывается алгоритм, направленный на её обнаружение. Не ставя под сомнение важность данного направления исследований, следует отметить его недостатки:
- поскольку алгоритмы разрабатываются для произвольных изображений, они не учитывают специфику их получения. В частности, для данных ДЗЗ вместе с изображением присутствует дополнительная информация о территории и времени съёмки, типе космического аппарата или устройстве регистрации, ориентации камеры и т.п.
- большое число различных алгоритмов обнаружения искусственных искажений не даёт ответа на вопрос, какой же алгоритм и/или алгоритмы и как/когда следует использовать для обнаружения искусственных искажений конкретных данных ДЗЗ (или обнаружения атаки).
В рамках данного проекта сотрудниками сектора геоинформационных технологий разрабатываются и исследуются методы, алгоритмы и информационные технологии безошибочной (lossless) и малоискажающей (near-lossless) компрессии изображений двух классов:
1) Авторский метод иерархической сеточной интерполяции, модифицированный и оптимизированный для обработки данных ДЗЗ, с адаптивными (обучаемыми) процедурами нелинейной интерполяции в петле обратной связи между иерархическими уровнями. Как ожидается, метод будет иметь низкую вычислительную сложность как компрессии, так и декомпрессии, т.е. годиться для реализации как на борту, так и в наземном комплексе обработки и архивации данных. В бортовом варианте метод может быть органично дополнен алгоритмическими средствами безбуферной стабилизации скорости формирования выходного информационного потока, а также малоизбыточной защиты компрессированных данных от случайных помех в цифровом канале.
2) Метод компрессии, основанный на авторских быстрых алгоритмах трехмерных дискретных ортогональных преобразований (ДОП), адаптивном отборе и квантовании трансформант, а также управляемом «дожатии» поля ошибок компрессии для обеспечения режима losslessили near-lossless. Ожидается, что при надлежащем выборе базиса ДОП метод позволит получить рекордные характеристики эффективности в координатах «степень компрессии – погрешность восстановления) и обеспечить ускоренное (по сравнению с полной декомпрессией) извлечение произвольных сечений компрессируемого трехмерного куба данных.
Обращаясь к задаче защиты данных, можно заметить, что сами процедуры компрессии, порождающие сложно структурированные наборы данных, могут рассматриваться как средства криптографической защиты данных ДЗЗ. Однако такая защита снимается после декомпрессии, т.е. является недостаточной для многих угроз, связанных с несанкционированным копированием, распространением или изменением данных. Поэтому в проекте рассмотриваются и специальные стеганографические методы защиты данных, основанные на встраивании в изображения идентифицирующей информации – цифровых водяных знаков (ЦВЗ). К ЦВЗ, защищающим изображения, предъявляются следующие основные требования:
- визуальная неразличимость и/или отсутствие влияния на результаты автоматического анализа (в том числе, распознавания) изображения;
- криптографическая стойкость, невозможность случайного или злонамеренного удаления, т.е. устойчивость к атакам, на отражение которых они нацелены;
- распределенность по трехмерному объему данных и вместе с тем - сохранение защиты для фрагментов и произвольных двумерных сечений изображения.
В проекте развиваются уникальные авторские подходы и новые методы встраивания и извлечения ЦВЗ на основе спектральной, рекурсивной и поблочной обработки изображений с возможным распараллеливанием вычислительного процесса. Для защиты данных от несанкционированного копирования разрабатываются «стойкие» ЦВЗ, основанные на встраивания защитной информации в трехмерный спектр изображения и обеспечивающие ее сохранность при типовых операциях преобразования данных: компрессии, фильтрации, радиометрической и геометрической коррекции, выделения фрагментов и двумерных сечений. Также разрабатываются «хрупкие» ЦВЗ, позволяющие выявить факты локального изменения защищенных данных, свидетельствующие о возможных фальсификациях изображений, т.е. применении к исходным данным искажающих процедур фильтрации, радиометрической или геометрической трансформации, ретуширования и вставок, повторной компрессии и т.д.
Общий план работ сектора геоинформационных технологий на весь срок выполнения проекта:
- 2014 год - Разработка новых информационных технологий компрессии данных ДЗЗ, их экспериментальная программная реализация и исследование эффективности.
- 2015 год – Разработка новых информационных технологий защиты данных ДЗЗ изображений, их экспериментальная программная реализация и исследование эффективности.
- 2016 год – Адаптация, доработка и экспериментальное исследование эффективности методов, алгоритмов и информационных технологий компрессии и защиты данных ДЗЗ применительно к различным вариантам их использования в аэрокосмических системах дистанционного зондирования Земли и в прикладных задачах, решаемых на основе использования гиперспектральных данных.