Техническая реализация метода тепловых потенциалов для анализа территорий +4




В первой публикации (Использование тепловых потенциалов для анализа территорий) мы рассказали, как можно использовать тепловые потенциалы для анализа территорий, в целом. В следующих публикациях планировалось описать, как информация о пространственных объектах хранится в базах данных, как строятся модели от главных компонент и вообще какие задачи анализа территорий могут быть. Но обо всем по порядку.

Использование метода тепловых потенциалов в первую очередь дает возможность составить общее представление об интересующей нас территории. К примеру, взяв исходную информацию из OSM по г. Барселона (Каталония), и, проведя интегральный анализ без отбора параметров, можем получить «тепловые» изображения первых главных компонент. О «тепловых» картах мы также говорили в первой статье, но не лишним будет напомнить, что термин «тепловая» карта возник благодаря физическому смыслу потенциалов, используемых для интегрального анализа. Т.е. в задачах физики потенциал является температурой, а в задачах анализа территорий потенциал представляет собой суммарное воздействие всех факторов влияния на конкретную точку территории.

Ниже приведен пример «тепловой» карты г. Барселона, полученной в результате интегрального анализа.


«Тепловая» карта первой главной компоненты, без отбора параметров, г.Барселона

А, задав какой-либо определенный параметр (в данном случае мы выбрали промышленность), можно получить «тепловую» карту непосредственно по нему.


«Тепловая» карта первой главной компоненты, промышленность, г.Барселона

Разумеется задачи анализа гораздо шире и разнообразнее, чем получение общей оценки выбранной территории, поэтому в качестве примера в данной статье рассмотрим задачу поиска наилучшего места при размещении нового объекта и техническую реализацию метода тепловых потенциалов для ее решения, а в следующих публикациях посмотрим и другие.

Решение задачи поиска наилучшего места при размещении нового объекта поможет определить насколько территория «готова принять» этот новый объект, как он будет коррелировать с другими, уже имеющимися на территории объектами, насколько этот новый объект будет ценен для территории и какую ценность он добавит.

Этапы технической реализации


Техническую реализацию можно представить последовательностью выполнения процедур, перечисленных ниже:

  1. Подготовка информационной среды.
  2. Поиск, сбор и обработка исходной информации.
  3. Построение сетки узлов на анализируемой территории.
  4. Разбиение факторов территории на фрагменты.
  5. Расчет потенциалов от факторов.
  6. Отбор факторов для создания тематических интегральных характеристик территории.
  7. Применение метода главных компонент для получения интегральных показателей территории.
  8. Создание моделей для выбора места под строительства нового объекта.

1 Этап. Подготовка информационной среды


На данном этапе необходимо выбрать систему управления базами данных (СУБД), определить источники информации, способы сбора информации, объем собираемой информации.
Для работы мы использовали базу данных (БД) PostgeSql, однако стоит отметить, что подойдет любая другая база данных, работающая с SQL-запросами.

В БД будет храниться исходная информация – пространственные данные об объектах: типы данных (точки, линии, полигоны), их координаты и другие характеристики (длина, площадь, количество), а также все расчётные величины, полученные в результате проведенных работ и сами результаты работ.

Статистическая информация также представляется как пространственные данные (например районы области с приписанными к этим районам данными статистики).

В результате преобразования и обработки собранной исходной информации формируются таблицы, содержащие информацию о линейных, точечных и площадных факторах, их идентификаторы и координаты.

2 Этап. Поиск, сбор и обработка исходной информации


В качестве исходной информации для решения данной задачи используем информацию из открытых картографических источников, содержащую сведения о территории. Лидером, по нашему мнению, является информация OSM, обновляемая ежедневно по всему миру. Однако, если получится собрать информацию из других источников – хуже не будет.
Обработка информации заключается в приведении ее к единообразию, исключению недостоверных сведений и подготовка к загрузке в базу данных.

3 Этап. Построение сетки узлов на анализируемой территории


Чтобы обеспечить непрерывность анализируемой территории необходимо построить на нее сетку, узлы которой имеют координаты в заданной системе координат. В каждом узле сетки в последствии будет определяться значение потенциала. Это позволит визуализировать однородные области, кластеры и конечные результаты анализа.

В зависимости от решаемых задач возможны два варианта построения сетки:
— Сетка с регулярным шагом (S1) – является обзорной по всей территории. По ней производится расчет потенциалов от факторов, определяются интегральные характеристики территории (главные компоненты и кластеры) и выводятся результаты моделирования.

При выборе этой сетки необходимо задать:

  • шаг сетки – интервал, через который будут располагаться узлы сетки;
  • границу анализируемой территории, которая может соответствовать административно-территориальному делению, или это может быть область на карте, ограничивающая территорию расчета в виде многоугольника.

— Сетка с нерегулярным шагом (S2) описывает отдельные точки территории (например центроиды). По ней также производится расчет потенциалов от факторов, определяются интегральные характеристики территории (главные компоненты и кластеры). Моделирование с рассчитанными главными компонентами производится именно на сетке с нерегулярным шагом, а для визуализации результатов моделирования номера кластеров из узлов сетки с нерегулярным шагом переносятся в узлы сетки с регулярным шагом по принципу близости координат.
В базе данных информация о координатах узлов сетки хранится в виде таблицы, содержащей для каждого узла следующую информацию:

  • идентификатор узла;
  • координаты узла (х, у).

Примеры сеток с регулярным шагом на разные территории с разным шагом приведены на рисунках ниже.




Сетка покрытия г. Н.Новгорода (красные точки). Сетка покрытия Нижегородской области (синие точки).

4 Этап. Разбиение факторов территории на фрагменты


Для дальнейшего анализа протяженные факторы территории необходимо преобразовать в массив дискретных факторов, для того чтобы каждый узел сетки содержал информацию о каждом присутствующим в нем факторе. Линейные факторы разбиваются на отрезки, площадные – на фрагменты.

Шаг разбиения выбирается исходя из площади территории и специфики фактора, для больших площадей (область) шаг разбиения может составлять 100-150 м, для меньших территорий (города) шаг разбиения может составлять 25-50 м.

В базе данных информация о результатах разбиения хранится в виде таблицы, содержащей для каждого фрагмента следующую информацию:

  • идентификатор фактора;
  • координаты центроидов полученных фрагментов разбиения (х, у);
  • длина/площадь фрагментов разбиения.

5 Этап. Расчет потенциалов от факторов


Один из возможных и понятных подходов к анализу исходной информации – это рассмотрение факторов, как потенциалов от объектов влияния.

Воспользуемся фундаментальным решением уравнения Лапласа для двумерного случая — логарифмом расстояния от точки.

С учетом требования конечного значения потенциала в нуле и ограничением значения потенциала на больших расстояния, потенциал определяется следующим образом:

$F(r)= Ln(r1/r2)$ при r<r1 (1)

$F(r)= Ln(r/r2)$ при r2>r>=r1

$F(r)= 0$ при r>=r2


Вид потенциала влияния от точечного объекта

Логарифмическая функция должна быть ограничена в нуле и разумно ограничена на некотором расстоянии от факторов. Если не делать ограничений потенциала на больших расстояниях от фактора, то пришлось бы учитывать огромное количество информации вдали от анализируемой точки, практически не влияющей на анализ. Поэтому вводим величину радиуса действия фактора, дальше которого вклад в потенциал от фактора равен нулю.

Для города величина радиуса действия фактора принимается равной получасовой пешеходной доступности — 2 000 метров. Для области следует говорить о получасовой транспортной доступности — 20 000 метров.

Таким образом, в результате расчета значений потенциалов мы имеем суммарный потенциал от каждого фактора в каждом узле регулярной сетки.

6 Этап. Отбор факторов для создания тематических интегральных характеристик территории


На данном этапе отбираются наиболее значимые и информативные факторы для создания тематических интегральных характеристик территории.

Отбор факторов можно проводить автоматически, задав определенные границы параметрам (корреляция, процент влияния и пр.), а можно экспертным путем, зная тематику задачи и имея некоторое представление о территории.

После того, как наиболее значимые и информативные факторы отобраны, можно переходить в следующим этапам — интерпретация главных компонент.

7 Этап. Применение метода главных компонент для получения интегральных показателей территории. Кластеризация


Исходная информация о факторах территории, преобразованная на предыдущем этапе в потенциалы, рассчитанные для каждого узла сетки, объединяется в новые интегральные показатели — главные компоненты.

Метод главных компонент анализирует изменяемость факторов на исследуемой территории и находит по результатам этого анализа наиболее изменяемую их линейную комбинацию, позволяющую рассчитывать меру их изменения – дисперсию по территории.

Возьмем общую задачу для составления модели приближения функции линейной модели к заданным значениям
$?_i=1,n(A_i *PCA_i,j+B)=POT_j$ (2)
Где i – номер компоненты,
n – количество компонент, участвующих в расчете
j – индекс узла точки территории, j=1..k
k – количество всех узлов сетки территории, по которым шел расчет главных компонент
$A_i$ — коэффициент при i-ой главной компоненте модели
$PCA_i,j$ – значение i-ой главной компоненты в j-ой точке
B – свободный член модели
$POT_j$ — потенциал в j-ой точки фактора, для которого мы строим модель

Определим неизвестные в уравнении (2) методом наименьших квадратов, пользуясь свойствами главных компонент:
$?_j=1,k(PCA_i,j*PCA_i2,j)=0$ (3)
Где i и i2 – номера компонент, i<>i2
j — индекс узла территории
k — количество всех узлов территории
$?_j=1,k(PCA_i,j)=0 $ (4)

(3) означает отсутствие корреляции между компонентами
(4) – суммарное значение любой компоненты равно нулю.

Получаем:
$A_i =?_ j=1,k(PCA_i,j*POT_j)/?_j=1,k(PCA_i,j**2)$
$B = avg(POT_j)$ (5)
Здесь обозначения, что и в уравнении (2), $avg(POT_j)$ означает среднее значение потенциала

Этот результат можно интерпретировать следующим образом:
Модель представляет собой простое выражение, состоящее из среднего значения моделируемой величины, и простых поправок к нему каждой из компонент. Минимально, результат должен включать свободный член B и первую главную компоненту. Ниже приведены примеры тепловых карт первых главных компонент по Нижегородской области.





По рассчитанным главным компонентам можно строить однородные области. это можно делать как по всем параметрам, так и, например, только по ценообразующим – т.е. провести кластеризацию. Для этого, можно использовать метод K-means. Для каждой однородной области подсчитывается среднее значение 1-й главной компоненты, характеризующей уровень развития территории.
Пример кластеризации по ценообразующим параметрам по Нижегородской области приведен ниже.



Также, используя полученные главные компоненты в качестве параметров модели стоимости, мы можем получить ценовую поверхность территории.


Ценовая поверхность г. Н. Новгорода

8 Этап. Создание моделей для выбора места под строительство нового объекта


Для выбора места, наиболее привлекательного для расположения нового объекта (далее «объект»), надо сопоставить расположение «объекта» с окружающей его инфраструктурой. Для функционирования «объекта» должно быть достаточно ресурсов для обеспечение его функционирования, должно быть учтено большое количество факторов как положительного, так и отрицательного воздействия на «объект». Всю совокупность этих факторов можно определить, как «питательную» среду для функционирования «объекта». Соответствие количества объектов количеству ресурсов территории является основой для стабильного функционирования «объекта».

Результатом этого сопоставления является потенциал, рассчитанный для каждой точки территории и позволяющий визуально и аналитически произвести анализ выбора места для размещения нового «объекта».

Для торговли, например, среди прочего, важен постоянный поток покупателей, значит в перечень факторов, которые надо учитывать для объектов торговли, должны входить и такие, которые обеспечивают этот поток (например объекты социальной инфраструктуры, места работы, места жительства, транспортные магистрали и пр).

С другой стороны, при выполнении всех условий для обеспечения функционирования объектов торговли, надо учитывать плотность объектов торговли, так как “потребление” среды окружения ведет к уменьшению возможности покупок. Поток людей не безграничен, то же относится к их финансовым ресурсам и физическим возможностям.

Алгоритм решения задачи выбора наилучшего места размещения объекта сводится к тому, что потенциал, получаемый, как функция главных компонент максимально приближается к потенциалу совокупности объектов типа «объект»; затем вычисляется разность потенциала модели и потенциала объектов типа «объект»; из полученной разницы вычитается величина потенциала вклада одного «объекта»; полученные при этом отрицательные значения заменяются на ноль, т.е отсеиваются те места, в которых недостаточно ресурсов для функционирования нового «объекта».

В результате проведенных действий получаем точки территории с положительным значением потенциала, т.е места благоприятного расположения нашего «объекта».

Другими словами, мы имеем рассчитанные потенциалы всех имеющихся в нашем распоряжении факторов и тот фактор, по которому мы хотим построить модель и сделать анализ выбранной тематической области (торговля, промышленность, культура, социальная сфера и т.д.)

Для этого требуется отобрать факторы для построения переменных среды – главных компонент – и в дальнейшем рассчитывать по ним модели.
Факторы предлагаем отбирать с помощью анализа корреляций всех факторов с эталонным фактором тематической области. Например, для культуры это могут быть театры, для системы образования школы и т. д.

Рассчитываем корреляцию потенциала эталона с потенциалами всех факторов. Отбираем те факторы, коэффициенты корреляции которых по модулю больше некоторой величины (часто берется значение минимального коэффициента корреляции = 0. 3).
$|Kkorr_i| >0.3$ (6)
где $|Kkorr_i|$ — абсолютная величина коэффициента корреляции i – го фактора с эталоном.

Корреляция считается по всем узлам сетки, покрывающей территорию.

Разность потенциала модели и потенциала объектов такого же типа, как новый объект в уравнении (2) показывает потенциал территории, который может быть использован для расположения новых объектов.

В результате получаем значение потенциала, которое характеризует степень выгоды расположения «объекта» на исследуемой территории.

Пример, как можно графически отобразить рекомендуемые области расположения нового «объекта», приведен ниже.



Таким образом, результат решения задачи выбора наилучшего места размещения нового объекта можно представить, как оценку территории в баллах в каждой точке, дающую представление о потенциале размещения инвестиционного объекта, т.е чем выше балл — тем выгоднее располагать объект.

В заключении стоит сказать о том, что в данной статье мы рассмотрели всего одну задачу, которую можно решить с помощью анализа территорий, имея на руках данные из открытых источников. На самом деле, задач, решаемых с его помощью очень много, их количество ограничивается только вашей фантазией.




К сожалению, не доступен сервер mySQL