Геоинформатика Раздел 3. Работа с пространственными данными.
Пространственные данные как основа создания специализированных информационных систем Пространственный объект (геообъект, геоинформационный объект, географический объект) – цифровая модель материального или абстрактного объекта реального или виртуального мира с указанием его идентификатора, координатных и атрибутивных данных. Объектом может быть неподвижный или движущийся простой или сложный объект, явление, событие, процесс и ситуация. Пространственные данные (географические данные, геоданные) – данные о пространственных объектах, включающие сведения об их местоположении и свойствах, пространственных и непространственных атрибутах. Пространственные данные обычно состоят их двух взаимосвязанных частей: координатных и атрибутивных данных. Координатные данные определяют позиционные характеристики пространственного объекта. Они описывают его местоположение в установленной системе координат в виде последовательности координат точек.
Пространственные данные как основа создания специализированных информационных систем Атрибутивные данные представляют собой совокупность непозиционных характеристик (атрибутов) пространственного объекта, определяют смысловое содержание (семантику) объекта и могут содержать качественные или количественные значения. Таким образом, любой предмет или явление может быть описано в пространстве согласно следующей модели: парой координат (географическое множество), геометрией (схематическое множество) и некоторым набором характеристик (атрибутов). Атрибутивная структура данных может быть представлена в виде таблиц и текстов. При этом атрибутивные данные могут иметь пространственную привязку, либо не иметь ее. Любые атрибутивные данные могут быть «привязаны» к конкретному объекту, дополняя тем самым его пространственные характеристики.
Пространственные данные как основа создания специализированных информационных систем Географическое (картографическое) множество содержит все образы объектов (точечных, линейных, площадных) с реальными географическими координатами; его выражением является цифровая модель местности (карта, изображение снимка). Схематическое (графическое) множество – это схематическое описание образов объектов, например, в виде картосхем с условными координатами объектов, сетевых графиков планирования, схем телефонной сети, коммуникаций и т.п. Между схематическим и географическим множествами существует тесная взаимосвязь, т.к. для решения задач анализа часто требуется совмещение схем и реальных карт, поэтому условные координаты переводятся в реальные, и наоборот.
Модели данных Атрибутивная модель. Картографическая модель: 0-мерные модели – точечные; 1-мерные модели – линейные (дуги, отрезки, ломаные); 2-мерные модели – площадные (полигоны, окружности, многоугольники) и модели геополей (представлены в основном изолиниями); 2,5D-модели – двухмерные модели, отображенные в трехмерном пространстве (например, для отображения модели рельефа); 3D-модели – трехмерные модели. На основе этих моделей строятся модели поверхности, среди которых выделяются два основных вида: модель в виде регулярной сети данных – «решеточная» (lattice) и «ячеистая» (grid) модель; модель, построенная по нерегулярным наборам данных – триангуляционная (TIN – Triangulated Irregular Network). Графическая модель: Модель, используемая в системах автоматизированного проектирования общего назначения (САПР) Модель инженерных сетей.
Модели пространственных данных для создания хранилища данных заданной тематики Системы с пространственной локализацией данных включают различные базы: 1.базы данных, 2.базы моделей объектов 3.базы программ 4.алгоритмов обработки. В общем случае эти разнообразные базы можно рассматривать как базы данных различного содержания. Большинство современных БД, построенных на основе так называемых реляционных моделей, имеют табличную форму и иногда называются табличными.
Структуры БД ГИС Главным принципом организации таких БД является создание одной или совокупности взаимосвязанных между собой таблиц. Первым этапом создания БД является определение включаемых в нее характеристик и построение логической записи, включающей все описательные характеристики. Вторым этапом является создание на основе полученной логической записи нескольких таблиц с помощью процедур нормализации. Основными понятиями реляционных баз данных являются тип данных домен атрибут кортеж первичный ключ отношение
Структуры БД ГИС Главным принципом организации таких БД является создание одной или совокупности взаимосвязанных между собой таблиц. Первым этапом создания БД является определение включаемых в нее характеристик и построение логической записи, включающей все описательные характеристики. Вторым этапом является создание на основе полученной логической записи нескольких таблиц с помощью процедур нормализации. Основными понятиями реляционных баз данных являются тип данных домен атрибут кортеж первичный ключ отношение
Модель описания объектов хранилища пространственных данных класса «карта» ПараметрЗначение Представлениевекторная растровая Формат храненияshp img jpg Система координатДолгота/широта ПроекцияСфероид Красовского ДатумПулково 1942 Масштаб1: ТематикаГорно-геологическая Гидрография Физико-химические свойства углей Геометрия объектовТочка Полилиния Полигон
Модель описания объектов хранилища пространственных данных ПараметрЗначение НазваниеНазвания объектов (название шахт, марок углей и т.п.) Тип данныхInteger, Char, Long Класс «аналитические данные» Класс «космоснимки» ПараметрЗначение НомерГрадация внутри геолого-экономических районов НазваниеИмя снимка Формат храненияImg Система координатДолгота/широта ПроекцияСфероид Красовского ДатумПулково 1942
Хранилище пространственных данных Создание хранилища пространственных данных Две основные идеи: Интеграция разъединенных детализированных данных в едином хранилище. Под детализированными данными понимаются некоторые конкретные факты, свойства, события и т.п. В процессе интеграции должно выполняться согласование рассогласованных детализированных данных и, возможно, их агрегация. Данные могут поступать из различных источников: исторических архивов корпорации, оперативных БД, внешних источников. Разделение наборов данных, используемых для оперативной обработки, и наборов данных, применяемых для решения задач анализа. Информационное хранилище представляет собой ядро всей системы – один или несколько серверов БД. Метаданные (репозиторий) играют роль справочника, содержащего сведения об источниках первичных данных, алгоритмах обработки, которым исходные данные были подвергнуты и т.д.
Общая архитектура корпоративной информационной системы на основе хранилища данных
Разработанный банк данных ГИС
Хранилище пространственных данных Проблемы реализации хранилища данных: неоднородность программной среды; распределенный характер организации; повышенные требования к безопасности данных; необходимость наличия многоуровневых справочников метаданных; потребность в эффективном хранении и обработке очень больших объемов информации.
Схема организации хранилища пространственных данных
Существующие подходы и решения создания хранилищ данных Компания IBM. Программный продукт - A Data Warehouse Plus. Oracle. Warehouse Technology Initiative. наличие реляционной СУБД Oracle, которая постоянно совершенствуется для лучшего удовлетворения потребностей складов данных; существование набора готовых приложений, обеспечивающих возможности разработки склада данных; высокий технологический потенциал компании в области анализа данных; доступность ряда продуктов, производимых другими компаниями Hewlett Packard Sybase Informix Software AT&T GIS SAS Institute Software AG
Сравнительный анализ программных продуктов, реализующих технологию хранилища данных Производитель Название БД Интеграция ПО Хранение данных Средства обработки данных компании др. компаний 1. IBMA data Warehouse Plus СУБД DB2+Централизованное, несколько распределенных рынков данных Средства аналитической обработки, статистического анализа 2. OracleКомплект программных продуктов Warehouse Technology Initiative Реляционна я СУБД Oracle ++Централизованное, несколько распределенных рынков данных Одномерный анализ, многомерный анализ (OLAP, DataMining ) 3. Hewlett Packard Intelligent Warehouseплатф орма Unix Реляционна я СУБД +Централизованное 4. SybaseWarehouse WORKS Реляционна я СУБД Sybase System 11 +Централизованное, несколько распределенных рынков данных Средства аналитической обработки, статистического анализа
Сравнительный анализ программных продуктов, реализующих технологию хранилища данных Производитель Название БД Интеграция ПО Хранение данных Средства обработки данных компании др. компаний 5. Informix Software On-Line Dinamic Parallel Server Реляционна я СУБД +Централизованное 6. AT&T GIS Enterprise Information Factory СУБД Teradata +Централизованное, несколько распределенных рынков данных 7. SAS Institute Реляционн ые, нереляцион ные БД +4GL Средства аналитической обработки, статистического анализа 8. Software AG Open Data Warehouse Initiative +ADABA S, Natural 4GL