Применение спектрозональных космических снимков для получения тематической информации.
Космические сканерные снимки, полученные со спутника МСУ и SPOT можно использовать для определения участков территории, обладающих определенными характеристиками.
Например:
q Застроенные территории
q Нарушенные земли (пустыри, торфяники, дороги, строительные площадки)
q Леса: березовые, сосновые, смешанные и т.д. Для смешанных лесов можно примерно определить состав пород.
q Объекты гидрографии (можно определить "заросла" поверхность водоема или нет)
q Земли находящиеся в использовании (можно определить тип использования: вспаханная, невспаханная и т.п. )
q Гари, ветровалы и.т.п
Рис 14. При визуальном просмотре снимка можно хорошо рассмотреть различные типы территорий.
Сам по себе космический снимок служит хорошей основой для "ориентировки на местности", при условии его совмещения с картой. Например, может быть получен снимок на территорию заповедника и по нему определено - ведется ли на его территории какая либо хозяйственная деятельность и в каких масштабах. Такой , "визуальный" подход, естественно весьма ограничен по своим возможностям.
Если мы хотим создать карту, на которой содержались бы, например, находящиеся в использовании земли и был указан характер их использования, то мы может действовать двумя способами:
1. Оцифровать их вручную. При этом оператор должен обладать достаточной квалификацией, чтобы правильно интерпретировать изображение.
2. "Классифицировать" изображение на основе теории распознавания образов.
И в том и в другом случае необходимо иметь некоторую "базовую" информацию, например в виде тематической карты на ту же территорию (такой тем. картой могут являться и данные лесной таксации).
Порядок выполнения автоматической классификации (пример).
Рассмотрим более подробно, на основе примера, действия по автоматической классификации космического изображения.
Мы различаем объекты на космическом снимке по двум основным причинам:
1. Они имеют различные спектральные характеристики отраженного света.
2. Они имеют различную фактуру.
Суть автоматической классификации состоит в том, чтобы "научить" компьютер узнавать участки по их визуальным характеристикам. Мы можем иметь а) опытные спектральные характеристики, полученные в лаборатории б) измеренные непосредственно на снимке для определенных классов объектов. Способ "б" наиболее интересен. Автоматическая классификация становится возможной только в случае использования спектрозональных снимков. При этом, в общем случае, чем больше он имеет диапазонов, тем более точной может быть классификация (т.к. более точно представляется спектральная кривая отраженного света). Использованный для выполнения данной работы алгоритм классификации учитывает только спектральные характеристики и не учитывает текстуру изображения. Все ниже приведенные результаты носят только демонстрационный характер (в противном случае все надо было бы делать более тщательно).
В качестве исходных данных для проведения работ были использованы:
q Космический снимок МСУ-Э на территорию г. Ухта и окрестности.
q Материалы инвентаризации лесов первой категории Ухтинского лесхоза в виде цифровых карт в формате GeoDraw.
Вся работа была проведена с использованием ГИС Idrisi 2.0.
Шаг 1.
Выясняем какие объекты мы хотели бы распознать и составляем для них "эталонные участки".
Для примера, определим 8 классов:
1. Гидрография
2. Глубокий участок в гидрографии
3. Застроенная территория
4. Березовый лес
5. Сосновый лес
6. Еловый лес
7. Вспаханные земли
8. Смешанный лес
Для определения преобладающей породы деревьев были использованы данные инвентаризации лесов Ухтинского лесхоза.
Рис 15. Пример "эталонного участка" для соснового леса.
Шаг 2.
Производим "обучение" программы. Формируем классы объектов как "области" в пространстве признаков. В данном случае роль пространства признаков выполняют спектральные каналы изображения (красный, синий, видимый), таким образом мы имеем три "переменных" и наше пространство - трехмерное. При этом мы можем сразу проверить сформированные нами классы на "легкость отличения друг от друга" (см. рис. 16).
На рис. 16 приведены три спектральные зоны - Синий, Видимый и Красный. Линией показана спектральная характеристика каждого класса с "точки зрения" многозонального снимка. А цветными квадратами "области".
Можно видеть, что синий и зеленый каналы практически идентичны (т.е. один из них не вносит какой-либо полезной информации). Причин для этого может быть несколько.
1. Используемый снимок представляем собой синтезированное изображение в "искусственных цветах". Для того, чтобы извлечь из него отдельно каждый спектральный канал (всего их три) необходимо было принудительно разделить его на RGB компоненты. Если бы он был полноценным True Color, то разделение произошло бы корректно. Но палитра снимка составляла только 65535 цветов, поэтому яркость каждого канала как бы уменьшилась вдвое и - соответственно контраст тоже. Это можно видеть по шкале слева - ни один эталон не содержит значений яркости большее 196. А поскольку синий и зеленый каналы и так не сильно отличаются друг от друга, то и произошло их "уравнивание".
2. При составлении синтезированного изображения в качестве составляющих синего и видимого каналов был использован по ошибке один и тот же снимок.
Рис 16. Разделение на классы. Спектральные характеристики объектов "с точки зрения" спектрозонального снимка.
Шаг 3.
На этом этапе выполняется автоматическая классификация, не требующая вмешательства оператора. В нашем случае осуществлена полная классификация всего изображения, т.е. каждый пиксель принадлежит к какому либо из восьми классов, т.к. этого требует использованное программное обеспечение.
Рис 17. Результат автоматической классификации космического изображения. Использованы восемь классов.
Из сравнения полученной классификации с исходным космическим изображением можно констатировать, что вполне удовлетворительно распознались:
1. нарушенные земли, застроенные территории и дороги (красный цвет),
2. смешанные леса (голубой цвет),
3. еловые леса (салатный цвет).
Смешались при распознавании:
1. нарушенные земли (коричневый цвет)
2. сосновые леса и березовые леса
3. реки и еловые леса
Причин для неудовлетворительного результата классификации может быть несколько:
1. распознавание велось фактически всего по двум каналам
2. недостаточное качество и количество эталонов (их было 30 штук т.е. в среднем по 3-4 на класс):
Таким образом, исходя из анализа классификации мы можем сделать следующие выводы:
q в качестве эталонов необходимо выбирать наиболее характерных представителей данного класса объектов (или типов территорий)
q необходимо набирать как можно больше эталонов для каждого класса
q чем меньше классов используется при классификации, тем лучше. Удобнее всего выбирать 3-4 основных класса, а все остальные объекты вносить в специальный класс "прочие" (с соответствующим "обучением" ). Некоторые программы позволяют не проводить полную классификацию изображения (т.е. всей его поверхности), а только тех классов, которые определены.
q ГИС Idrisi не может быть использована (или использована с существенными ограничениями) для полноценной работы по автоматической классификации ввиду : сложности интерфейса, нестабильности работы, ограничения на объем результатов классификации (матрица небольшой размерности), хотя может быть рекомендована для проведения исследовательских работ и обучения, т.к. имеет достаточные для этого функциональные возможности.
Векторизация результатов классификации.
Дальнейшие работы заключаются в проведении ручной оцифровки системы полигонов, описывающих результаты классификации. Это необходимо для того, чтобы привести систему координат в которой производилась классификация (это система исходного растрового изображения), к системе координат Гаусса-Крюгера. Делается это сходно с процессом привязки растра в случае с простым обновлением карт. Для правильного выполнения привязки, необходимо, чтобы программное обеспечение, генерирующее классифицированное изображение, создавало его полностью геометрически подобным исходному растру (т.е. не вносило дополнительных искажений или не преобразовывало его размерность).
При выполнении привязки может возникнуть ситуация, что мы не сможем получить достаточное количество реперных точек непосредственно с классифицированного изображения. В таком случае, мы не сможем осуществить привязку к нему формируемой карты векторных полигонов. Ниже приведена схема выполнения процесса цифрования, которая учитывает эту особенность. Основная идея привязки в данном случае заключается в том, чтобы использовать исходную карту и исходный растр (снимок) которые служат своего рода "заместителями", векторной карты полигонов и классифицированного растра. Преобразования мы определяем посредством выбора реперных точек с исходной карты и растра, а потом применяем их одновременно к исходной карте и к векторной карте полигонов (т.е. карта полигонов временно будет являеться слоем исходной карты).
Рис 18. Схема процесса тематического картографирования с использованием данных ДЗЗ. При условии соблюдения данной схемы, можно получить координированную векторную карту распределения классифицированных участков с точностью исходной цифровой карты масштаба 1:200000.
Способы оценки точности обновления.
Точность обновления является важным параметром, который должен быть отражен в документации к обновленной цифровой карте. Получение численных оценок точности обновления цифровых карт производится на основе элементарной теории погрешностей измерений. Основными мерами служат: систематическая ошибка, среднее квадратичное отклонение, максимальное отклонение.
Для вычисления этих величин необходимо после совмещения цифровой карты и растрового изображения определить координаты некоторых контрольных точек на карте и на снимке. Лучше всего это сделать на этапе проверки корректности трансформирования по совмещению контуров объектов. Правила выбора контрольных точек такие же как и правила выбора реперных точек для трансформирования.
Процесс вычисления систематической ошибки, среднего квадратичного отклонения, выглядит стандартным образом. Для того, чтобы получаемые результаты были значимы, необходимо выбрать определенное количество контрольных точек.
Все
расчеты ведутся относительно ошибки положения контуров объектов:
Окончательный результат представляется в обычном виде (систематическая ошибка должна быть исключена):
где :
Ряд руководств по определению ошибок дают специальные таблицы, которые со
держат значения для определенного количества измерений.
При "поточной" работе использование такого способа сопряжено со значительными затратами времени на определение контрольных точек, измерение и запись их координат, по этой причине можно пользоваться максимальным отклонением, величиной определяемой как:
.
Эта величина удобна тем, что для ее измерения можно использовать инструмент типа "линейка", имеющийся в большинстве редакторов и процесс оценки точности не требует производства каких-либо вычислений или создания промежуточных записей.