ООО
«ОМ-Структуры»
М.К.Овсов
СТРУКТУРНЫЙ АНАЛИЗ ГЕОДАННЫХ
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ПРИМЕНЕНИЮ
Санкт-Петербург
2003
4.6. Изучение радиационного состояния городской воздушной среды
1. Исходные данные
В качестве исходных к обработке приняты данные о замерах радиационной обстановки, выполненные в г. Cыктывкаре в 1992 году и приведенные в отчете [Кузнецов А.Г., Терминасов С.Ю., Угаров В.А. Отчет о результатах оценки радиационного состояния воздушной среды жилых и производственных помещений г.Сыктывкара. ТОО "ГЕОЭКО". С.-Пб. 1992]. В таблицу исходных данных включены измерения воздушной среды в 237 пунктах наблюдения в трех категориях помещений: производственные и научные организации (N=119), социально-бытовые и культурные учреждения (N=77) и медицинские учреждения (N=41).
Каждый из пунктов наблюдения охарактеризован измерениями следующих линейно независимых переменных:
1) об'емная активность радона (RN),
2) - 4) концентрация дочерних продуктов - RaA, RaB, RaC (RA,RB,RC),
5) коэффициент радиоактивного равновесия (KP),
6) кратность воздухообмена (LV),
7) поступление радона (A).
(В скобках за названиями переменных проставлены обозначения, которые используются далее.)
Кроме того были заданы теоретические оценки погрешностей измерения наблюдаемых переменных.
2. Результаты обработки
В итоге компьютерной обработки получена структура данных, которая на трех неполных структурных уровнях содержит 11 конечных классов. Схематическое изображение структуры приведено на рис. 4.18.
Пояснения к рисунку:
1) в блоках, обозначающих классы, проставлены номер класса - его имя в процессе структурного анализа - и число пунктов наблюдения;
2) конечные видовые классы подчеркнуты;
3) по линии деления родового класса на видовые проставлены оценки доли изменчивости переменных, "объясненные" данным структурным делением, они выражены в процентах изменчивости непосредственного рода (а не исходного); эта оценка может интерпретироваться как вклад переменной в образование видовых классов, или информативность переменной; переменные с величиной оценки менее 20 процентов не показаны.
Анализ изменчивости переменных в конечных классах показывает следующее:
- семь классов - с номерами 5, 7, 12, 13, 15, 17, 18 - содержат в измерениях более одной переменной с достаточным запасом точности, но их деление, или дальнейшая детализация структуры, нецелесообразна по причине непредставительности объема;
- четыре класса - 10, 11, 14, 16 - полностью исчерпали информативность.
Оценка уровня исчерпания природной изменчивости переменных по структурным уровням приведена в табл. 4.9. В ней, в отличие от оценок на рис. 1, значения статистик приведены относительно родового исходного класса для уровня в целом.
Таблица 4.9
Структурный
уровень |
Число
классов |
Исчерпание изменчивости переменных, процентов |
|||||||
|
|
RN |
RA |
RB |
RC |
KP |
|
A |
среднее |
1 |
2 |
29 |
20 |
0 |
1 |
14 |
57 |
43 |
23.3 |
2 |
5 |
75 |
73 |
37 |
36 |
23 |
73 |
64 |
58.7 |
3 |
11 |
80 |
80 |
64 |
61 |
79 |
94 |
78 |
76.4 |
теоретически достижимый уровень |
- |
82 |
87 |
95 |
85 |
73 |
89 |
85 |
85.1 |
Рис. 4. 18. Структура данных пунктов наблюдения за радиационным состоянием воздушной среды
Значения статистик табл.4.9 получены по схеме дисперсионного анализа и имеют смысл внешней по отношению к структурному анализу оценки качества его результатов.
Приведенные данные показывают, что построенная структура данных опробования воздушной среды близка к максимально детальной и хорошо согласуется с данными измерений.
Выделенные классы характеризуют контрастные свойства переменных: средние, дисперсии, корреляции и главные факторы. Соотношение средних значений наблюдаемых переменных в 11 конечных классах и исходной совокупности представлено на рисунке 4.19. На диаграммах средние значения выражены в безразмерных величинах - единицах наименьшего значения данной переменной. Такой прием позволяет сравнить в одном классе значения переменных с разной физической размерностью, а также разные реализации однотипного набора переменных в классах между собой.
3. Интерпретация результатов
Построенная структура данных принимается в качестве модели изучаемого явления. Интерпретация модели заключается в объяснении состояния, отношения частей с позиций причинности и происхождения. Для интерпретации используют имеющуюся априорную информацию и (или) формируют новую гипотезу.
Изучение связи выделенных классов с априорными признаками осуществляется с помощью частот признаков. Напомним: частота равняется числу фиксированных актов признака; при этом наблюдаемую частоту фиксации априорного признака в классе можно сравнить с ожидаемой частотой. Из полученных частот можно рассчитать всевозможные коэффициенты сопряженности.
В качестве априорных качественных признаков использовалась информация о категории учреждений и этаж расположения пункта наблюдения.
3.1. Сопряженность классов с категорией учреждений
Данные об оценке эмпирических и ожидаемых частот для первого и второго структурных уровней модели приведены в табл.4.10.
Таблица 4.10
Номера классов |
Число ПН |
1-й структурный уровень |
2-й структурный уровень |
|||||
|
|
|
ПНО |
М |
СБК |
ПНО |
М |
СБК |
|
5 |
15 |
|
|
|
13/8 |
-/3 |
2/5 |
3 |
6 |
53 |
52/44 |
16/15 |
19/28 |
30/27 |
14/9 |
9/17 |
|
7 |
19 |
|
|
|
9/9 |
2/3 |
8/6 |
|
|
|
|
|
|
|
|
|
|
8 |
91 |
|
|
|
42/46 |
15/16 |
34/30 |
4 |
|
|
67/75 |
25/26 |
58/49 |
|
|
|
|
9 |
59 |
|
|
|
25/29 |
10/10 |
24/19 |
Итог |
|
237 |
119/119 |
41/41 |
77/77 |
119/119 |
41/41 |
77/77 |
Рис. 4.19. Средние значения переменных в исходной совокупности и в конечных классах пунктов наблюдений (пояснения в тексте)
Примечание: В обозначениях граф сокращения обозначают следующее: ПН - пункты наблюдения, ПНО - производственные и научные организации, М - медицинские учреждения, СБК - социально-бытовые и культурные учреждения; дробью вынесены частоты - наблюдаемая/ ожидаемая.
На 1-м структурном уровне обращает на себя внимание превышение наблюдаемых частот (примерно на 20 %) в классе 3 признака ПНО и в классе 4 - СБК, признак М отмечается в этих классах в соответствии со случайным равномерным распределением. Это дает основание для следующего предположения: 1) класс 3 выделяется свойствами, характерными для помещений производственных и научных организаций; 2) класс 4, соответственно, для социально-бытовых и культурных учреждений.
На 2-м структурном уровне сделанное предположение получает усиленную аргументацию - превышение наблюдаемых частот над ожиданием доходит до 1.5, причем это превышение локализуется в классе 5 и 9. Интересно, что "безразличность" классов к признаку "медицинские учреждения" на этом уровне нарушается: класс 6 имеет с ним превышение наблюдаемых частот более, чем в 1.5 раза.
На 3-м структурном уровне эти предположения находят более сильное и конкретное подтверждение.
3.2. Сопряженность классов с "этажностью" пунктов наблюдения
Аналогичное исследование проведено с признаком "этажности" (так для краткости назван этаж расположения пункта наблюдения). Распределение частот по трем интервалам "этажности" приведено в табл. 4.11.
Таблица 4.11
Номера классов |
Число ПН |
1-й структурный уровень |
2-й структурный уровень |
|||||
|
|
|
0 |
1 |
2-6 |
0 |
1 |
2-6 |
|
5 |
15 |
|
|
|
11/3 |
4/5 |
-/7 |
3 |
6 |
53 |
26/18 |
26/29 |
35/40 |
12/11 |
16/18 |
25/24 |
|
7 |
19 |
|
|
|
3/4 |
6/6 |
10/9 |
|
|
|
|
|
|
|
|
|
|
8 |
91 |
|
|
|
14/19 |
31/30 |
46/42 |
4 |
|
|
23/31 |
52/49 |
75/70 |
|
|
|
|
9 |
59 |
|
|
|
9/12 |
21/19 |
29/28 |
Итог |
|
237 |
49/49 |
78/78 |
110/110 |
49/49 |
78/78 |
110/110 |
Примечание: значение признака "этажности" 0 означает подвальные помещения, остальные группы номером соответствуют этажу ПН.
Рассмотрение этих данных позволяет дополнить характеристики ранее выделенных классов: класс 5 в определяющей части соответствует подвальным производственным помещениям.
Приведенные в этом разделе материалы и их анализ следует рассматривать как пример интерпретации результатов структурного анализа, а не собственно результаты.
Заключение
Структурный анализ совокупности многомерных данных позволил выделить компактные классы по комплексу признаков. Приведенный в 3-м разделе пример подхода к анализу результатов и их интерпретации не ставил целью вычисление по радиационным замерам категории учреждений и этажа расположения пунктов наблюдений. Из полученных результатов следуют два важных вывода:
1) метод структурного анализа позволяет построить относительно простую модель изучаемого явления, которая хорошо согласуется с наблюдениями - в данном примере 11 классов описывают около 90 % изменчивости данных, представленных измерениями 7 параметров в 237 пунктах;
2) выделенные классы частично нашли отчетливую интерпретацию в пределах располагаемой априорной информации, это обстоятельство позволяет рассматривать метод структурного анализа как инструмент изучения сложных систем, выявления скрытых закономерностей и формирования на их основе новых причинных и генетических гипотез.
Заключение
Методика структурного анализа геоданных дополняет методику общенаучного метода, следующую из его логической и математической теории, и позволяет осуществить разнообразные геологические исследования средствами геолого-математического моделирования. Специфика исследования геоданных отражается в разработке следующих методических положений.
1) Решение геологической задачи делится на 5 последовательных этапов: постановки задачи, подготовки данных, их профессиональной предобработки, построения структуры данных и интерпретации результатов. Общий алгоритм анализа геоданных может нарушать последовательность этапов и имеет петлеобразный характер с возвратом от построения и интерпретации структуры к этапам подготовки и предобработки данных. Решение об изменении последовательности специалист принимает в результате анализа промежуточных результатов (по формальным критериям) и соотнесения их целью исследования (по неформальным).
2) Информация, образующаяся в процессе анализа геоданных, делится на управляющую и содержательную к геологической интерпретации. Селективный анализ специалистом исключительно необходимых и актуальных в данный момент промежуточных результатов способствует достижению поставленной цели.
3) Разработана форма представления результатов структурного анализа геоданных - достаточно компактная и способная выполнить коммуникативно-информационную функцию между специалистом по геолого-математическому моделированию и специалистом основного профиля - геологом, геофизиком. Форма представления отчетливо структурирована, что позволяет автоматизировать формирование отчета о результатах геолого-математического моделирования.
4) Процесс анализа геоданных в значительном приближении разрешает проблему соотношения наблюдаемой и природной изменчивости геопараметров. Специалист имеет возможность контролировать это соотношение в процессе анализа геоданных и изменением последовательности этапов добиться улучшения соотношения. Это достигается благодаря введению специальных статистических методов, которые учитывают погрешность единичного наблюдения. В этом отношении метод структурного анализа является единственным среди развитых компьютерных методов обработки реальных данных.
5) Интерпретация логической структуры данных состоит в рассмотрении узла ветвления и древовидной структуры в целом. Интерпретация узла проводится по типовой схеме преимущественно в терминах главных факторов; интерпретация структуры в целом ведется в терминах наблюдаемых переменных. Опыт обработки действительно многомерных – геохимических – данных показывает, что результат интерпретации можно представить на качественном уровне. Этого оказывается вполне достаточно для понимания сложных явлений, что как раз является характерным для языка описательных наук как, в частности, геология.
6) Интерпретация образной структуры данных - карты классов - состоит из двух этапов: картографического и геологического. На первом этапе с применением картографических приемов и методов создается схема иерархических картографических образов, которую можно рассматривать как фактическую основу для геологической интерпретации. На втором этапе выделенные картографические образы фиксируются в содержательном и знаковом отношении как геологические понятия - структурно-вещественные комплексы. Второй этап интерпретации является исключительно авторским и допускает вариантную профессиональную реализацию. Это обстоятельство позволяет использовать результаты геолого-математического моделирования (до этапа картографической интерпретации включительно) в целях, отличных от первоначальной постановки задачи. Неоднозначность восприятия и интерпретации результатов формальных построений находятся в соответствии с природной сложностью предмета изучения.
7) Определено отношение структурного анализа геоданных к другим методам геолого-математического моделирования. Показано, что структурный анализ как метод, основанный на иерархической системно-структурной модели недр и реализующий методологию анализа неоднородностей, является универсальным инструментом решения геологических задач. Часть других методов моделирования может найти применение в комплексе со структурным анализом на этапах подготовки и предобработки геоданных. Другая часть методов - узко-целенаправленной обработки данных - получает разрешение собственных задач в процессе структурного анализа. Особо выделена группа методов выделения локальных особенностей сигнала - аномалий на фоне помех, которые со структурным анализом образуют взаимное дополнение, необходимое для эффективного решения прогнозных и поисковых геологических задач.
Структурный анализ данных применялся для обработки разнообразных геоданных, однако приведенные примеры решения практических задач не ограничивают область применения метода. Возможно применение метода в интерпретации данных комплексного каротажа скважин, в решении разнообразных разведочных задач для выявления скрытых закономерностей в распределении и отношении геопараметров.
Необходимо отметить, что разработанная методика структурного анализа геоданных может быть принята как основа методики обработки статистических и картографических данных в других естественных научно-прикладных областях.
Метод структурного анализа имеет хорошие перспективы к совершенствованию и развитию во всех главных частях: в логических основаниях – с конкретизацией теории классификации и типологии; в математике – с включение методов Q-факторного анализа, обработки изображений; в применении - с решением иных геологоразведочных задач и в других геологических научно-прикладных отраслях. Вместе с развитием метода структурного анализа очевидно необходимо развивать компьютерные технологии как инструментальные средства и совершенствовать методику практического применения.
С п и с о к р е к о м е н д о в а н н о й л и т е р а т у р ы
Естественные самоорганизующиеся
системы
1. Абдеев Р.Ф. Философия информационной цивилизации. -М.: ВЛАДОС, 1994. - 336 c.
2. Моисеев Н.Н. Алгоритмы развития. - М.: Наука, 1987. - 285 c.
3. Жирмунский А.В., Кузьмин В.И. Критические уровни в развитии природных систем. - Л.: Наука, 1990. - 223 c.
4. Шолпо В.Н. Структура Земли: упорядоченность или беспорядок?- М.:Наука, 1986.- 160 c.
5. Николас Г., Пригожин И. Познание сложного. Введение/ Пер. с англ..-М.: Мир, 1990. -344 c.
6. Шустер Г. Детерминированный хаос. Введение/ Пер. с англ. М.: Мир, 1988. - 240 с.
Методология исследований
7. Кондаков Н.И. Логический словарь-справочник. -М.:Наука, 1975. - 720 c.
8. Розова С.С. Классификационная проблема в современной науке. Новосибирск: Наука, 1986, - 223 c.
9. Мейен С.В. Таксономия и мерономия. - В кн. Вопросы методологии в геологических науках. -Киев.: Наукова думка, 1977. - C. 25 - 33.
10. Мейен С.В. Основные вопросы типологии организмов. - Ж.Общей биологии, 1978, т. 39, N 4, - C. 495 - 508.
11. Александров В.В., Горский Н.Д. ЭВМ видит мир./ науч.-попул. изд. - Л.: Машиностроение, 1990. - 140 c
12. Овсов М.К. Логические основания классификации и типологии. - Тезисы докладов Первого российского философского конгресса "Человек-философия-гуманизм", Т.3, С.-Пб, 1997. - C. 228 - 231.
Иерархические системно-структурные
модели в геологии
13. Каждан А.Б. Методологические основы разведки полезных ископаемых. - М.: Недра, 1974. - 272 c.
14. Четвериков Л.И. Теоретические основы разведки недр. -М.: Недра, 1984.-156 c.
15. Бойцов В.Е., Вальков В.О., Фролов А.А. Факторы локализации и прогноз оруденения. - М.: Недра, 1991. - 234 с.
16. Булкин Г.А., Нежинский И.А. Модели для количественного прогнозирования минерального сырья. - Л.: Недра, 1991. - 288 c.
17. Верховская Л.А., Конюхова Т.И. Выявление фоновых и аномальных содержаний элементов с помощью аппроксимации распределения неоднородной совокупности данных. - В кн.: Применение современных математических методов и ЭВМ в области геологии в странах - членах СЭВ. - М.: ВИЭМС, 1971. c. 16 - 17.
18 . Ветров А.Г. Обработка результатов пешеходных радиометрических съемок методом осреднения. - Вопросы рудной геофизики. Вып. 7, Радиометрия, 1966. c. 106 - 113.
19. Каждан А.Б., Пахомов В.И. Методологические основы системного анализа разноуровенной геологической информации в прогнозно-поисковых целях. - ж. Сов. Геология. 1991, № 6. с. 72 - 79.
20. Каждан А.Б., Пахомов В.И., Фахрутдинов Ш.И. Методология локального прогноза рудоносности. - ж. Отеч. геология. - 1995, № 1. с. 3 - 8.
21. Питулько В.М., Крицук И.Н. Основы интерпретации данных поисковой геохимии. - Л.: Недра, 1990. - 336 c.
22. Плющев Е.В., Шатов В.В. Геохимия и рудоносность гидротермально-метасоматических образований. - Л.: Недра, 1985. - 247 c.
23. Щеглов А.Д., Говоров И.Н. Нелинейная металлогения и глубины Земли. -М.: Наука, 1985. - 324 c.
24. Иванов А.И., Овсов М.К. Структурный метод обработки геоданных. - Рос. геофиз. ж. 1998, № 11-12. с. 78 - 85.
Статистические методы обработки
данных
25. Крамер Г. Математические методы статистики./ Пер. с англ.. - М.: Мир, 1975. - 625 c
26. Линник Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений./ Изд. 2-е, - Л.: Физматгиз, 1962. - 352 c.
27. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. - М.: Наука, 1969. - 511 c.
28. Овсов М.К. Применение взвешенных оценок для обработки неравноточных наблюдений. - В сб. Современные методы анализа в экологии. Под ред. А.Н.Жуковского (ч. 1), Изд. ЛГУ. - Л, 1990. - C. 15 - 24.
Многомерные математические методы
анализа
29. Белонин М.Д., Голубева В.А., Скублов Г.Т. Факторный анализ в геологии. - М.: Недра, 1982. - 269 c
30. Дюран Б., Оделл П. Кластерный анализ./ Пер. с англ. - М.: Статистика, 1977. - 128 c
31. Жамбю М. Иерархический кластер-анализ и соответствия./ Пер. с фр. Серия: Математико-статистические методы за рубежом. - М.: Фин. и стат., 1988. - 342 c
32. Йореског К.Г., Клован Д.И., Реймент Р.А. Геологический факторный анализ./ Пер. c англ. - Л.: Недра, 1980. - 223 c
33. Лоули Д., Максвелл А. Факторный анализ как статистический метод./ Пер. с англ. - М.: Мир, 1967. - 144 c
34. Кеттел Р.Б., Дев Хака. Принципы и процедуры однозначного поворота в факторном анализе. - В сб. Статистические методы для ЭВМ. Под ред. К.Энслейна, Э.Рэлстона, Г.С.Уилфа./ Пер. с англ. - М.: Наука, 1986. - C. 184 - 218.
35. Мандель И.Д. Кластерный анализ. - М.: Фин.и стат., 1988. - 176 c
36. Соломон Г. Зависящие от данных методы кластер-анализа. В сб. Классификация и кластер./ Под ред. Дж.Ван Рейзин, пер. с англ. М.: Мир, 1980. - 389 c
Структурные методы
37. Александров В.В., Горский Н.Д. Алгоритмы и программы структурного метода обработки данных. - Л.: Наука. - 1983. - 208 c
38. В.В. Александров, Н.Д.Горский. Представление и обработка изображений: рекурсивный подход. - Л.: Наука, 1985. - 164 c.
39. Прикладная статистика: Классификация и снижение размерности. Справ. изд./ Под ред. Айвазяна С.А. - М.: Фин. и стат., 1989. - 607 c
40. Верхаген К., Дейн Р., Грун Ф. и др. Распознавание образов: состояние и перспективы./ Пер. с англ. - М.: Радио и связь, 1985. - 104 c.
41. Овсов М.К. Комбинированный метод кластерного и факторного анализов переменных в прикладной геохимии. - Изв. вузов, Геология и разведка, 1990. - с. 60 - 66.
Методы анализа геоданных
42. Боровко Н.Н. Статистический анализ пространственных геологических закономерностей. -Л.: Недра, 1971. - c.
43. Вахромеев Г.С., Давыденко А.Ю. Моделирование в разведочной геофизике. - М.: Недра, 1987. - 192 c
44. Дэвис Дж.С. Статистический анализ данных в геологии: Пер. с англ. В 2кн. /Пер. c англ. - М.: Недра, 1990. - 319 c., 427 c.
45. Каждан А.Б., Гуськов О.И. Математические методы в геологии: Учебник для вузов. -М.: Недра, 1990. - 251 c.
46. Никитин А.А. Теоретические основы обработки геофизической информации: Учебник для вузов. -М.: Недра, 1986. - 342 c.
47. Родионов Д.А. Статистический решения в геологии. - М.: Недра, 1981. - 231 c.
48. Компьютерный прогноз месторождений полезных ископаемых/ В.В.Марченко, Н.В.Межеловский, Э.А.Немировский и др. - М.: Недра, 1990. - 285 c.
49. Анализ изображений в поисковой геофизике / Э.Я.Островский и др. Отв. ред. Г.В.Остроумов. - М.: ИФЗ им. О.Ю.Шмидта АН СССР, 1986. - 184 c.
Картографические методы исследования
50. Берлянт А.М. Образ пространства: карта и информация. - М.: Мысль, 1986. - 240 c.
51. Бурдэ А.И. Картографический метод исследования при региональных геологических работах.- Л.: Недра, 1990. - 251 c.
[Овсов Михаил Константинович]