ООО
«ОМ-Структуры»
М.К.Овсов
СТРУКТУРНЫЙ АНАЛИЗ ГЕОДАННЫХ
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ПРИМЕНЕНИЮ
Санкт-Петербург
2003
3.
Методика структурного анализа геоданных
Метод структурного анализа для метрических данных реализован в виде одной задачи, которая позволяет строить иерархическую многоуровневую структуру данных. Алгоритм включает в себя методы статистического описания данных, многомерного анализа - корреляционного, факторного и кластерного методов, дисперсионного анализа, решения теории графов и машинной графики. Для конечного пользователя - геолога и геофизика, который решает геологические задачи с применением математического моделирования - эффективность применения инструмента связана не столько с информированностью относительно “кухни” метода моделирования, сколько со знанием места метода в общем комплексе исследования (1), вопросов управления анализом данных и интерпретацией его результатов (2). Первый вопрос рассмотрен в первой части рекомендаций, в этой части рассмотрены вопросы методики применения структурного анализа и интерпретация его результатов.
3.1. Постановка задачи
Постановка задачи формулируется в обращении к объектно-предметной модели, которая всегда в явном, или неявном виде предшествует появлению исследовательского метода. Для структурного анализа данных исходная модель определена изначально - это теоретическая модель строения и свойств недр, а именно - иерархическая системно-структурная модель. А.Б.Каждан определяет структурный метод анализа геологической информации как выявление природных неоднородностей на первом этапе исследования и выяснение структурных позиций и отношений - на втором. На первом этапе и применяется разработанный метод структурного анализа метрических данных, "воплощенный" в виде компьютерной программы. Второй этап реализуется через специалиста, его знания, опыт и интуицию. Часто предлагаемый метод в обсуждении результатов ограничивается подобной фразой общего содержания. С таким отношением нельзя согласиться, поскольку не происходит соотнесения результата геологической задаче. Представляется необходимым в методику применения определенного метода моделирования включить интерпретацию как необходимый этап этого исследования.
Постановка задачи, которая решается с применением формального метода структурного анализа, формулируется следующим образом: изучение структуры поля комплекса геоданных методом классификации без использования априорной информации. Полученная структура является естественной, поскольку она основана на содержащейся в данных взаимообусловленности свойств и объемов выделяемых частей. В прикладной геологии подобный результат называют прогнозом геологического строения. В такой постановке структурный анализ применялся в решении следующих геологических задач:
- обработка комплекса аэрогамма-спектрометрических данных в региональном и поисковом масштабах с целью геологического картирования;
- обработка комплекса аэрогеофизических данных - магнитная съемка и трехчастотная электроразведка - с целью прослеживания рудоносных структур;
- интерпретация данных гидролитохимической съемки мелкого масштаба с целью выделения рудных районов;
- интерпретация данных литохимической съемки с целью поисков рудных месторождений и данных шлихогеохимии с целью оценки перспективности локальных участков;
- геохимическое изучение природных почвенных комплексов на территории заповедника;
- прогнозные геологические исследования среднего масштаба с целью выделения алмазорудных и перспективных районов с использованием комплекса геофизических и морфометрических данных.
Приведенные формулировки довольно типичные и общие для постановки задачи моделирования. Очевидно также, что все формулировки включают в себя интерпретацию результатов применения формального метода как этап отображения этих результатов на языке научно-прикладной области - геологии. В этих примерах нетрудно заметить две степени общности постановки задач:
1) интерпретация определенного (заданного) комплекса наблюдений, задачи такого рода всегда имеют место как частные общей - геологического изучения территорий, поэтому к результату применения метода больше подходит название "структура данных"; если в комплексе наблюдений содержатся переменные, прямо связанные с прикладным интересом, то результатом, очевидно, будет также решение прямой поисковой задачи - локализация, выделение образований с интересующими свойствами;
2) в задачах геопрогноза применение структурного анализа является самостоятельным исследованием, результатом которого будет классификация, или классификационная структура объекта изучения, поэтому определение с комплексом исходных данных является методическим вопросом, который решается специалистом в начале исследования.
Структурный анализ опробован в схожей постановке задач для экологических исследований с радиационными и гидрохимическими наблюдениями, а также для исследования статистических совокупностей и получил положительные результаты.
Имеется также небольшой опыт применения метода для изучения структуры поля одного параметра с использованием комплекса трансформаций от наблюдаемой переменной. Подобные построения широко практикуются в морфоструктурном методе, когда одновременно рассматривается несколько производных морфометрических показателей рельефа земной поверхности. Можно предложить в качестве трансформант, исходных к структурному анализу, использовать полный спектр составляющих компонент, полученных, например, разложением на ортогональные линейные или гармонические многочлены. Это направление очень перспективно, и можно надеяться на повышение уровня результата - от структуры поля к классификационной структуре объекта изучения.
3.2.
Подготовка данных
Исходный к обработке материал должен соответствовать определенным требованиям, часть которых решается до применения метода моделирования, а часть - в пробном подходе к решению. Имеются в виду требования методического характера. Вопросы кодирования информации, организации их в базу данных, пригодную для автоматизированной обработки, сходны для развитых систем обработки геоданных, носят достаточно общий характер и не рассматриваются.
3.2.1.
Определение границ исследования
Прежде всего следует пояснить, что комплексные наблюдения обладает объемными и признаковыми границами. Рассмотрим их по порядку.
Формальные критерии играют роль в процессе построения структуры. В определении исходных объемных границ главную роль играют неформальные критерии, которые можно определить следующим образом: изучаемое явление в очерченных границах должно соответствовать одной системе, то есть быть однородным по характеру изучаемых процессов и образований. Это не означает, что границы площади изучения должны прихотливо следовать границам геологических структур высокого ранга. Структурный анализ нечувствителен к помехам, достаточно обеспечить в очерченных границах преобладание объема данных, характеризующих изучаемое явление. Поясним на примере. В площади построений для целей геопрогноза в пределах листов номенклатуры O, P-36 около 30-40 процентов площади занимает Балтийский щит и около 60-70 процентов - Русская плита. Полученная в итоге карта на площади Русской плиты характеризуется отчетливыми структурами с выраженными границами между классами. Для территории Балтийского щита картографическая структура данных не столь отчетлива, что обусловлено более высоким уровнем помех. Это и понятно: для территории Балтийского щита уровень природной случайной изменчивости выше, количественные выражения общих зависимостей между признаками и собственно характер зависимостей могут отличаться от таковых на территории Русской плиты. Можно улучшить качество построений, если ограничить влияние других геологических образований высокого ранга приграничной полосой.
Границы исходного признакового пространства определяются перечнем наблюдаемых переменных и их трансформант, которые составляют вектор описания точки наблюдения. Для представительности наблюдений объекту исследования с применением многомерных методов рекомендуется число переменных, трехкратно превышающее число предполагаемых природных факторов. Для практического использования это мало дает - число факторов и их структура наперед неизвестны. Практически можно рекомендовать следующее: желательно иметь не менее 10 переменных, характеризующих в основной части своей изменчивости изучаемое явление. Этого числа, можно рассчитывать, будет достаточно для устойчивого выявления главных факторов и их интерпретации. Недостаток переменных - данных полевых наблюдений - можно дополнить трансформантами данных, которые в проявленности (сплошность, спектральные свойства) могут быть характеризованы, как и данные. Имеется положительный опыт использования наряду с данными наблюдений потенциальных полей расчетных значений модуля горизонтального градиента и стандартного отклонения в локальной окрестности точки наблюдения. Случается, что и тогда желаемого числа переменных не наберется; это не следует расценивать как невозможность применения структурного анализа данных. Имеется достаточно большой опыт построений с целью геопрогноза, когда число переменных было совсем небольшим - 3 - 6. В этом случае геологическая интерпретация главных факторов затруднительна, основной результат к интерпретации извлекается из карты классов и их свойств в наблюдаемых переменных.
В отличие от стандартных процедур факторного анализа, основанных на исчерпывании дисперсий или корреляций, структурный анализ не столь критичен к неравному представлению факторов переменными. Гораздо важнее, чтобы содержательно изучаемое явление, как и в определении с объемными границами, было представлено по возможности однородно и полно. Например: данные экологической аэрогамма-спектрометрии не являются однородными, поскольку естественные радионуклиды характеризуют природное явление, а запас радиоактивного цезия - техногенное загрязнение.
В решении задач по геохимическим данным этот вопрос наиболее сложный в силу большой размерности вектора наблюдений. Величина концентрации химического элемента в точке наблюдения формируется под влиянием многих систем разной природы. Построенная структура геохимических данных соответствует явлению, с которым связана большая часть суммарной изменчивости переменных. Поэтому можно утверждать, что достаточным будет задание такого множества переменных, в котором отчетливое большинство составляют однородную систему. Для этого специалисту достаточно общих концептуальных и генетических представлений.
Очевидно, что в постановке задачи изучения структуры определенных данных вопрос о границах - объемных и признаковых - практически предопределен всегда - все данные, какие имеются, принимаются в обработку.
И последнее замечание - о соотношении числа переменных и числа объектов. Наименьшее число объектов (точек) для построения простой структуры должно примерно на порядок превосходить число переменных. Для построения развитой трехуровневой структуры число объектов должно не менее, чем на два порядка, превосходить число переменных. Этими рекомендациями можно пользоваться в и исследовании структуры статистических совокупностей.
3.2.2.
Детальность исследований и масштаб наблюдений
Соотношение масштабов результирующих построений и исходных данных можно установить, рассмотрев карту классов - один из главных результатов применения метода.
Масштаб кондиционной
карты определяется картографическим цензом - минимальным размером объекта,
изображаемого масштабно в нагрузке основного картографического слоя [52]. Ценз
составляет 4 кв.мм для площадных объектов и
Сложившаяся практика
геопрогнозных построений не соответствует требованиям масштабной
кондиционности. Как правило, требованиям ценза соответствуют второстепенные
картографические слои, представленные топоосновой, гидрографией и т.п. Основной
же картографический слой представлен объектами, которые без потери информации
могут быть перенесены на основу более мелкого масштаба, иногда на несколько
порядков. Применение структурного анализа с использованием сводных данных
наблюдений более крупного масштаба позволяет получить картографический
кондиционный результат на обширные территории исследований. Так, оценивая по
порядку величины, возможно построение карты площадью 1 кв.м с разрешением
изображения
В заключение - замечание о формировании базы данных комплексных наблюдений. Обсуждение масштаба наблюдений предполагает, что исходная база данных уже имеется в распоряжении специалиста. Однако может оказаться, что интересующие наблюдения выполнены в разных (близких) масштабах, или в одном масштабе, но сети наблюдений не совпадают. В этом случае их следует предварительно объединить в общую базу данных через интерполяцию в узлы регулярной сети масштаба, в котором представлена наиболее интересная специалисту часть переменных, либо большая их часть.
3.2.3.
Учет погрешности наблюдений
Взвешенные методы статистики показали преимущества профессионального подхода к анализу эмпирических данных [26-28]. Не воспользоваться этими преимуществами было бы большим упущением.
Однако практика наблюдений геоданных не дает исходных параметров, с помощью которых погрешность можно оценить в точке наблюдения. Средняя оценка точности полевых наблюдений включает в себя все компоненты изменчивости методического и технического характера: инструментальную погрешность прибора или анализатора, временные вариации, локальные вариации, погрешность определения местоположения и др. Нормативная методика оценки погрешности воспроизводимости полевых наблюдений (точности съемки) одним показателем - средним квадратическим отклонением - не позволяет оценить аддитивную и мультипликативную составляющие погрешности. Использование единой погрешности съемки в структурном анализе показывает, что этот способ приемлем для переменных с распределением, близким к нормальному закону случайной величины (например, для гравиметрии). Для переменных с асимметричным распределением, как данные магнитной съемки, гамма-спектрометрии, геохимических наблюдений, использование постоянной погрешности не дает удовлетворительных результатов. В низких слабо изменчивых полях данные оказываются загрубленными; в интенсивных высоко градиентных полях - обратная картина: данные по точности явно переоценены.
Этот недостаток просто восполнить в процессе первичной обработки данных: достаточно построить линейное уравнение аппроксимирующей связи между величиной погрешности и значением переменной. В этом случае отдельные компоненты погрешности также остаются неизвестными, но известной становится зависимость, которая позволяет оценить погрешность в точке наблюдения. Следует иметь в виду, что методика контрольных наблюдений имеет недостаток - измерения не накрывают весь интервал переменной, а выбираются в полях средней интенсивности с невысокими градиентами. Однако этот прием не всегда возможно применить из-за отсутствия первичных данных по контрольным маршрутам.
Опыт применения структурного анализа позволил выработать подход к учету погрешностей, исходя из инструментальных характеристик. Этот прием можно применить в обработке данных гамма-спектрометрии, геохимии, полевых ядерно-геохимических методов. Аналитические методы определения состава вещества характеризуются аддитивной и мультипликативной составляющей погрешности. Аддитивная составляющая имеет размерность переменной, т.е. абсолютная, она связана с пределом обнаружения (порогом чувствительности): предел обнаружения примерно равняется утроенной аддитивной погрешности. Мультипликативная составляющая погрешности характеризуется относительной величиной (в долях единицы или процентах) от измеряемой величины. Оба параметра являются аттестационными характеристиками аналитического метода. Если они неизвестны, то можно сориентироваться на нормативные показатели по инструктивным и методическим материалам: для анализа 1-й категории точности до 3, 2-й категории - до 10, 3-й категории - до 20 процентов; для аэрогамма-спектрометрии - как для метода 2-й категории точности. Аддитивную составляющую можно оценить соразмерно мультипликативной от величины наименьшего значения переменной, зафиксированного в данных. Оцененная таким образом инструментальная погрешность может быть задана в качестве погрешности наблюдений на первом шаге. Для данных с высоким уровнем инструментальной погрешности в общей такого приближения часто бывает уже достаточно, чтобы получить удовлетворительные результаты. Если инструментальные погрешности значительно меньше погрешностей других источников, то заданная погрешность занижена, т.е. данные наблюдений переоценены по точности. В случае переоценки точности наблюдается выделение аномальных классов с незначительным объемом, высокий уровень помех в изображении классов, разрушение их картографической структуры, при этом формальные критерии указывают на высокий запас точности. Эти проявления можно считать индикаторами завышенной точности наблюдений. Прием состоит в повторной пробной обработке с увеличением погрешностей с небольшим коэффициентом (2- 3 для дисперсии). Коэффициент можно считать удовлетворительно подобранным, если результаты решения не содержат явных указаний на переоценку точности или загрубление данных. В случае загрубления данных оценка исчерпания изменчивости геологической переменной может превысить 100 процентов; продолжение анализа закрывается по формальному критерию, хотя картографические результаты показывают, что его можно бы и продолжить.
Эти рекомендации не выглядят достаточно строгими. Однако, следуя им, можно получить решение, которое характеризуется как приемлемое в условиях неопределенности.
Для оценки погрешностей морфометрических и морфоструктурных переменных можно рекомендовать испытанный прием - подготовка данных "во вторую руку" на контрольной партии данных. Наконец, когда нет никаких исходных посылок к оценкам погрешностей, их можно задать экспертно и путем пробных решений подобрать правдоподобные величины.
Полученные оценки параметров погрешностей принимаются как базовые. С накоплением опыта структурного анализа появятся и опытные оценки погрешностей для разных методов наблюдений, масштабов, способов топопривязки и пр.
Следует подчеркнуть: удовлетворительное решение с учетом погрешностей, пусть неточным, уверенно характеризуется как лучшее к решению без учета погрешностей, или с постоянной величиной погрешности наблюдений.
3.2.4.
Профессиональная предобработка данных
Предполагается, что к началу структурного анализа данные обработаны качественно. Однако в практике работ случается всякое. Например, первичная обработка может считаться вполне приемлемой и результаты ее приняты к отчету, но первые шаги в структурном анализе обнаруживают, что обработка была выполнена недостаточно тщательно. Это проявляется в результатах статописания корневого класса. Прежде всего имеются в виду взвешенные статистики, которые прямо указывают на соотношение погрешности воспроизводимости и общей дисперсии. Следует напомнить, что переменные, погрешность которых составляет более половины дисперсии (взвешенная дисперсия менее 2), не включаются в обработку. Может оказаться, что дисперсии всех переменных не менее предельного значения, но сильно отличаются по величине для разных переменных. Анализ модельных данных показывает, что качество данных к многомерному анализу определяется не лучшими наблюдениями, не средним показателем, а худшими, или наименее точными наблюдениями переменных.
Можно повысить качество исходных данных, проведя предварительную к структурному анализу математическую обработку (предобработку). Целью такой обработки является повышение отношения сигнал/шум и заодно - выравнивание этого соотношения для переменных. Это означает, что режимы фильтрации помех для разных переменных будут различными: переменные, измеренные с достаточной точностью, можно оставить без предобработки, переменные с высоким уровнем погрешности подвергаются наиболее "жесткой" фильтрации. Следует отметить, что предельное значение взвешенной дисперсии - две погрешности - является довольно слабым ограничением, особенно для корреляций, которые являются исходными к структурному анализу переменных. С другой стороны, увлекаться чрезмерным повышением взвешенной дисперсии также не следует, поскольку фильтрация случайной составляющей приводят к уменьшению амплитуды сигнала и расширению ее в локальной окрестности. Происходит частичная потеря информации о локальных особенностях, которые могут оказаться существенными для целей исследования. Можно рекомендовать для взвешенной дисперсии обработанных данных величину около десяти. Анализ информации такого содержания необходим для управления обработкой и требует принятия решения о ее продолжении, либо изменении последовательного хода.
Соответственно трансформации данных преобразуются и параметры погрешностей. Вместе с уменьшением погрешности, как правило, понижается уровень природной случайной составляющей изменчивости признаков. Это обстоятельство можно использовать в процессе построения структуры.
3.3.
Построение структуры данных
Структурный анализ переменных и объектов родового класса выполняется в циклической процедуре автоматически и основан на формальных критериях. Класс открыт для деления, если выполняются два условия:
- число переменных с допустимой по отношению к погрешности дисперсией не менее двух; строго говоря, исследование структуры переменных имеет смысл, когда их число превышает два, однако формального запрета на исследование класса с двумя переменными нет;
- число объектов в классе должно быть не менее десятикратного числа переменных.
В процессе структурного анализа специалист решает единственный вопрос - выбор очередного к делению родового класса, а с ним - и построение структуры в целом. На рис. 3.1 приведена схема алгоритма структурного исследования геоданных. На ней помечены активные точки - этапы алгоритма, в которых по итогам анализа результатов решения осуществляется выбор очередного класса.
3.3.1.
Выбор родового класса
С делением исходного корневого класса появляются видовые классы, которые на следующем шаге могут быть включены в анализ как родовые младшего структурного уровня. Построение структуры, или управление ходом структурного анализа осуществляется с выбором класса, который следующим будет включен в автоматическую обработку. К этому выбору у специалиста могут быть общие соображения. Например, с построением первых двух уровней структуры данных, в которых объем и точность представления переменных характеризуются достаточным запасом, последовательно и равномерно детализируются все ветви структуры. Этот выбор осуществляется в обращении к дереву решений (активная точка 1 на схеме). Другой подход к построению структуры состоит в равномерной детализации исследуемой территории, чему соответствуют близкие объемы классов, или локальных областей, занимаемых классами на карте (точка 2). При этом ветви структуры данных могут отличаться по сложности построений: для объемных классов строится детальная многоуровневая структура, небольшие по объему классы вскрываются одним-двумя уровнями.
Высокая нагрузка изменчивости переменных в классе, или внутригрупповая сумма квадратов (ВСК) может рассматриваться как приоритет класса. С делением формально приоритетных классов можно рассчитывать на наибольшее приращение межгрупповой суммы квадратов как показателя соответствия структурной модели исходным данным (точка 3).
Рис. 3.1. Алгоритм структурного исследования данных (схема)
В кружках помечены точки активного включения специалиста (пояснения в р.3.3)
Выделение и детализация классов с определенно интересующими свойствами - содержательный критерий - отмечен на схеме точкой 4.
Возможны ситуации, в которых интересный к делению по всем критериям класс формально может быть включен в структурный анализ, однако содержательно продолжение анализа не имеет смысла. Такое случается, когда значительная часть переменных исчерпала свою изменчивость в процессе построения структуры. В данном случае имеются в виду переменные, которые в совокупности определяют содержание изучаемого класса. Такую ситуацию можно назвать исчерпанием содержания данных. При этом следует иметь в виду, что исчерпание относится к уровню погрешности. В этом случае возможным выходом является построение нового решения с улучшенным отношением природной изменчивости к погрешности через этап предобработки (см.п. 3.2.4), этот выбор отмечен точкой 5.
В следовании геологической цели специалист включает в анализ: формальные приоритеты классов, их положение в логической структуре и карту классов. Обычно к началу построений имеются сведения из предшествующих исследований интересующих объектов - представления о возможном географическом положении интересующих структур, их размерах, форме и взаимоотношении с картографическим фоном. Этот выбор детализируемого класса осуществляется в ходе анализа карты классов - точка 6.
С анализом картографических результатов связана еще одна ситуация, с оценкой которой может быть прерван рекуррентный ход структурного анализа. Возможно, что интересующая специалиста область пространства не может быть детализирована по причине неотчетливого изображения класса, хотя запас точности переменных уверенно оценивается достаточным. Неотчетливость изображения в интересующей области проявляется в помехах высокого уровня - включение в контур класса пикселов других видов, зазубренность границ. Объяснением такого характера изображения может быть высокий уровень природной случайной изменчивости данных. Если с отказом от деления класса цель не будет достигнута, необходимо вернуться на этап предобработки (точка 6). С уменьшением случайной природной изменчивости, как правило, уменьшаются и погрешности наблюдений. Оба результата способствуют получению более отчетливой картографической структуры.
Разобранные ситуации довольно типичны, к ним сводятся практически все случаи выбора специалиста в применении структурного анализа. Как следует из рекомендаций, последовательно рекуррентный ход построения структуры данных может прерываться с отправлением на этап подготовки данных.
3.3.2.
Детализация структуры
В практике решения геологических задач сложился еще один прием, названный детализацией. Выделенный сугубо статистическими методами класс может занимать на карте одну локальную область - локус, или несколько локусов. В первом случае результат выделения соответствует одному геологическому объекту, который на данном уровне изучения считается условно однородным. Во втором случае класс соответствует нескольким объектам, реальная однородность которых может быть различной. Выделенные локусы одного класса могут соответствовать сходным геологическим объектам, а могут - и разной природы, сходно проявленным в ограниченном наборе исходных переменных. Для формального прохождения задачи по алгоритму это не играет роли. Важно отметить: класс из нескольких локусов будет делиться на видовые классы целиком как одна совокупность данных. Однако свойства переменных в отдельных локусах не могут быть идентичными свойствам класса в целом. То есть свойства геологических объектов одного класса сходны в общих чертах, но различны в частностях, особенностях. Эти различия в делении класса на следующем шаге являются причиной, источником ошибок 1-го и 2-го рода. С каждым шагом структурного анализа суммарная ошибка накапливается и усиливается. В итоге построение многоуровневой структуры ограничено по детальности. Как позволяет судить опыт, детальность структуры может быть ограничена, начиная с 4-го уровня; в других построениях она не ощущается и на 5-м уровне, хотя родовой класс образует два локуса уже на 1-м уровне структуры.
Цель геопрогноза, вообще говоря, может быть достигнута с построением четырех (а может быть, и большего числа) структурных уровней: 1) планы территории изучения, 2) классы сходных объектов, 3) геологические объекты, 4) внутренняя структура объектов. Разрешением этого противоречия и является детализация, которая представляет собой простой прием. По результатам построений трехуровневой структуры данных выделяется интересующая область изучения. На область строится локальный участок, который включает в себя объект интереса. Далее проводится структурный анализ данных по локальному участку. Новое решение с построением структуры до третьего-четвертого уровня позволяет изучить детали интересующего объекта. Важно отметить, что масштаб наблюдений в локальном участке может быть тот же, что и на всей территории изучения, если исходная плотность сети достаточна. Детализация достигается в результате того, что на локальном участке изображается примерно такое же число классов, как и на общей площади. В теоретическом исследовании влияния плотности разведочной сети (размера) на результаты разведки Л.И.Четвериков [ 14 ] показывает сущность детализации во вскрытии более глубоких уровней строения объекта, выделении меньших по объему элементов структуры, слагающих элементы старшего уровня строения объекта. В приложении структурного анализа к прогнозным построениям по исходно плотной сети наблюдений эффект детализации достигается построением структуры данных на локальном участке.
Так, например, на территории в пределах севера Русской плиты и зоны сочленения ее с Балтийским щитом на площадь 320 тыс.кв.км построена структура комплексных геофизических данных по сети наблюдений 4´4 км. Кроме того построена структурная модель по трем детальным участкам общей площадью 110 тыс.кв.км по сети 2´2 км. Сравнение результатов построений на общей площади и детальных участках, а также на участках детализации в области перекрытия позволяет прийти к следующему заключению: границы классов прослеживаются непрерывно с одного детального участка на другой, или с общей площади транзитом через локальную. На локальной площади контуры классов гораздо отчетливее и внутренняя структура их более детальна. Сравнение средних значений по 6 парам сопоставимых классов дает следующие оценки коэффициента линейной корреляции: высота рельефа - 0.978, гравиметрия - 0.947, магнитометрия - 0.999. Границы локусов в пределах каждого из участков незамкнуты, однако незначительность отличия оценок от 1 показывает, что сопоставимые локусы попарно представляют собой фрагменты одного геологического объекта, или образования. Интересно также, что "родословные" сравниваемых пар значительно различны, что можно объяснить малой степенью перекрытия родовых классов. Из этого следует важный вывод: собственно структура обладает высокой устойчивостью, изменение площади исследования влечет за собой изменения свойств в классах и соответственное выражение в свойствах границ между классами, но не сами границы классов. Это является основанием к применению картографического метода в интерпретации результатов структурного анализа. И частное следствие - существует возможность "сшивки" двух решений по структурному результату, не только отличных по объему данных, но и по исходным переменным в пределах одного объекта изучения. Этот вывод не мог быть сделан из теории метода исследования.
Можно предложить оптимальную методику применения структурного анализа в общей, классификационной постановке задачи. В решении задачи выделяется два этапа исследования. На первом этапе на площадь всей исследуемой территории строится структура до 3-го - 4-го уровня. По итогам анализа результатов первого этапа и их предварительной интерпретации, если специалист посчитает необходимым, на интересующие геологические объекты выделяются локальные участки, в пределах которых строятся детализирующие структуры и карты-врезки, позволяющие изучение более глубоких уровней строения объектов. Такая методика обусловлена исключительно статистическим характером выделяемых классов. С развитием структурного метода к картографическому исследованию все построения с необходимой степенью детальности могут быть выполнены в одном решении задачи.
3.4. Интерпретация логической структуры
Один из двух главных результатов структурного анализа - логическая структура данных, которую представляют древовидная иерархическая структура и результаты математических вычислений.
Профессиональной интерпретации результатов математических методов обработки традиционно уделялось большое внимание. Движение в этом направлении было встречным - от математики к прикладным областям (см., например, [30, 31, 33, 36]) знаний и от прикладных - к математике ( [13, 29, 32, 35]). Однако рассмотреть в традиционном подходе все результаты в структурном анализе физически невозможно. Так, например: в решении тестового примера из 16 геохимических проб на 8 переменных только на первом структурном делении объем оценок превышает 2000; сокращенные протоколы решений с построением трехуровневой структуры с общим числом узлов ветвления 15 и числом классов 40 составляют более 100 страниц. Очевидно, что традиционный отчет о результатах математического моделирования непригоден для выполнения основной функции - коммуникативной. Поэтому желательно сократить объем содержательных оценок к интерпретации, не упустив при этом важные результаты. Важно также найти подходящую форму для результатов, которая представляет информацию в доступном виде и способствует специалисту в интерпретации. Поэтому разработка формы отчета о результатах структурного анализа, ориентированного на конечного пользователя - геолога, геофизика - является вопросом методического обеспечения работ.
В этом разделе рассмотрены представление результатов, относящихся к логической структуре, и их интерпретация.
3.4.1. Представление результатов
структурного анализа
Форма представления должна удовлетворять требованиям, отчасти противоречивым:
- содержать ответы на вопросы относительно выделенных классов - их свойствах, отличии от родственных, эволюции;
- дать подсказку к возможному продолжению анализа с ожидаемой оценкой результата;
- быть компактной настолько, чтобы беглый просмотр не потребовал чрезмерных затрат времени и позволил прийти к заключению о достижении поставленной цели.
В процессе опытного применения структурного анализа и подготовки отчетных материалов было найдено приближение к отчетной форме, которая может быть принята за основу. Макет отчета включает в себя следующие разделы (рубрикация разделов и характеристика их содержания даны в сокращении):
1) Цель исследования.
2) Характеристика территории: размер площади; координаты планшета; географическая, геологическая, административная привязка.
3) Исходные материалы: методы и сеть наблюдений; технология подготовки цифровых моделей признаков; трансформации признаков, вычисление производных; точностные характеристики признаков и методы их оценки.
4) Профессиональная предобработка данных: фильтрация погрешностей, восстановление пропусков в данных и др.
5) Результаты структурного анализа: краткое описание структуры данных; дерево решения - рисунок-схема иерархической структуры данных; соответствие структурной модели исходным данным - таблица; статистическое описание классов - таблица средних и стандартов; характеристики графических документов: перечень карт, способ построения, масштаб построения, обработка изображений; анализ результатов решения - примеры анализа с инициативным началом от дерева решения,таблицы статистик и карты классов - для пользователя, впервые применяющего этот метод; анализ ВСК конечных классов ведется с целью оценки возможного продолжения работ - таблица.
6) Описание дополнительных графических материалов: карты классов в градациях значений признаков-переменных, гистограммы эмпирических частот к выбору градаций, параметрические профили.
7) Геологическая интерпретация результатов структурного анализа. Этот раздел отчета, как и следующий - последний, могут быть оформлены отдельным отчетом о геологических результатах математического моделирования.
Заключение: основные практические выводы; методические выводы.
Методическая разработка этого вопроса приведена в отчете о тематических работах по заданию 5-5 (1995). В соответствии с этим макетом подготовлен, в частности, отчет по Мстинско-Демянской площади. По форме и содержанию отчета можно судить по примеру в последнем разделе главы, который воспроизводит отчет с некоторыми сокращениями.
Разработка формы отчета преследует еще одну, важную для применения метода, цель: возможность автоматизировать подготовку отчета с помощью специальной программы - "Генератор отчетов"; разработанный макет представляет не только структуру отчета с текстовым фоном и табличными формами, как это сделано в геоинформационной системе WinGis, но и позволяет заполнить таблицы содержанием полностью или частично.
[продолжение]