Ленинградский геофизик

Овсов М.К. Число, Мера, Информация, Знания
М.К.Овсов (ГП «Невскгеология»)

В конце двадцатого века геофизики становятся свидетелями достижений высоких технологий – автоматизированной аккумуляции данных разнообразных наблюдений в компьютерных банках данных. Геофизические банки становятся источником информации для объемного изучения недр в широковолновом диапазоне параметров, зафиксированных с высоким разрешением. Однако, схемы эволюции информации, ее интеллектуального развития от наблюдений к знаниям об объекте и о законах его развития просматриваются неотчетливо. Такое положение обусловлено рядом нерешенных проблем, которые имеют долгую историю, относятся к разным этапам естественнонаучного исследования и состоят в разной степени зрелости научного осмысления. Часть таких вопросов предлагается к обсуждению.

Число. В практической обработке данных геофизики не замечают различий между наблюдениями параметра и математической переменной. Классические методы анализа предполагают равную представительность наблюдений (вариаций, моментов), которая для анализа геоданных может быть условно принята в редких ситуациях. При соблюдении метрологической правильности представительность наблюдений истинному значению геофизического параметра определяется погрешностью воспроизводимости (просто – погрешность), которая складывается из погрешностей природного, методического и технического характера. Погрешность определяется по основным и контрольным наблюдениям и является отчетной технической характеристикой съемки, используется при выборе вертикального масштаба графиков и сечения изолиний, округлении значений, а также для отбраковки «промахов». Однако погрешность реальных данных прямо зависит от измеряемой величины. В лабораторно-аналитической практике применяют линейную модель погрешности, которая включает аддитивную и мультипликативную составляющие. Переменная погрешность вместе с данными наблюдений образует пару числовых характеристик наблюдения.

Взвешенные методы [Линник Ю.В. Метод наименьших квадратов…, 1962] позволяют учесть погрешность в точке наблюдения и, благодаря этому, получить устойчивые оценки статистического исследования в задачах: шкалирования, восстановления плотности вероятности, оценивания параметров распределения и уравнения линейной связи, дисперсионного и кластерного анализа. Погрешность должна учитываться в алгоритмах фильтрации, интерполяции и регуляризации, без которых не обходятся методы аналитической аппроксимации и распознавания. Наконец, если сравнить данные и результат интерпретации с деньгами и товаром, то учет погрешности позволит определить «покупательную способность» данных, связать детальность построений с качеством съемки в конкретном исследовании.

Интеллектуальная обработка реализуется в сложных алгоритмах с многократным обращением к данным, поэтому ошибка первого и второго рода, пренебрежимая в обычных условиях, на выходе алгоритма может возрасти до единицы.

Совершенно очевидна необходимость дополнения банков данных наблюдений их погрешностями и разработки специальных методов и приемов анализа данных. Профессиональная обработка дает основание считать совокупность наблюдений представлением физических параметров в геологическом пространстве.

Мера. Измеренные геофизические, петрофизические признаки отражают свойства объектов. Функция свойств состоит в указании на сходство-отличие объектов, предметов, точек наблюдения. При этом сходство рассматривается в двух возможных отношениях – интенсивности и подобия. (Применение терминов подразумевает приоритет значений формальной логики.) В общем – многомерном - случае разноименные и разномасштабные признаки не пригодны для выполнения функции свойств. Интенсивность признаков можно сравнить после их стандартизации; сходство выражается через R-факторы; итогом интеллектуального исследования получается классификация [Кондаков Н.И. Логический словарь-справочник, 1975]. Подобие объектов можно оценить после их стандартизации; действуют Q-факторы; в итоге получается типология – структура форм. Классификация и типология – древовидные структуры, которые являются дедуктивной моделью данных с родовидовыми отношениями выделяемых частей. (Дерево–одна из основных универсальных форм структуры; широко используется в глобальной геологии, в прикладной – только в обобщении и систематике эмпирических данных; в прикладном изучения недр – практически не применяется.) Структурный анализ как метод распознавания позволяет [Овсов М.К. Тезисы докл. 1-го российского философского конгресса, Т.3, 1997] построить классификационную модель комплексных данных. Аналитические алгоритмы [Страхов В.Н. ж. Геофизика, 1999, №1], как и методы распознавания, могут быть построены по схеме структурного анализа. Рекурсивная интерпретация старших по рангу аномалий с фильтрацией детальных составляющих поля обладает адаптивностью и повышенной устойчивостью решения.

Две стороны сходства, известные в лингвистике, технике, биологии, в бытовом употреблении, наконец, практически «неизвестны» геофизикам.

Стандартизация – непременное условие сравнимости, условие перехода от совокупности отдельных признаков в отдельных точках к свойствам объекта.

Информация – это понятие используется, в основном, как литературный прием, а интерпретацию часто называют искусством. Результат названного здесь структурного анализа обладает качественной определенностью, роль которой выполняет видовая принадлежность. Виды общего рода имеют количественные различия и являются сравнимыми понятиями. Другого сравнения методологии неизвестно.

Каноническая теория информации дает возможность оценить важные общие показатели – количество информации и сложность системы (в смысле определения Колмогорова). Метрическую оценку структуры в целом, ее крупных фрагментов можно получить информационными методами. Дисперсионный анализ дает количественную оценку любого деления, и структурного тоже. Оценка отношения межгрупповой суммы квадратов к общегрупповой согласуется с взглядом У.Эшби на информацию как меру разнообразия и может быть интерпретирована как: 1) информационная сложность; 2) извлеченная полезная информация; 3) соответствие модели исходным данным. Видимо, этот смысл несет формула «структура – это связанная информация» (в истоке – от Л.Бриллюэна), которую можно встретить в обсуждении методологических вопросов философами, биологами, лингвистами, кибернетиками Учет погрешностей в структурном анализе позволяет установить предел детальности построений и оценить производные характеристики: 1) исчерпание природной изменчивости признаков как отношение к общегрупповой изменчивости, очищенной от погрешностей; 2) исчерпание природной изменчивости к теоретически доступному в анализе уровню

Теория информации – локальная математическая конкретизация первых этапов процесса отражения – фундаментального свойства материи. Теория рассматривает информацию как имманентное свойство данных. Второй полюс – субъект, а с ним и содержательная (смысловая) и ценностная стороны информации не рассматриваются. В естественнонаучной методологии построение теории содержательных и ценностных свойств информации считается актуальной задачей [Кондаков Н.И.; Бирюков Б.В. Сб. Кибернетика живого: Биология и информация, 1984].

Содержательный анализ информации подразумевает выполнение логических операций сравнения количества и качественной определенности. В структурном анализе эти характеристики определяются для вида в целом. Но это – только первый шаг. Идентификация оперирует «препаратами» вида – отдельными признаками в отдельных частях или наоборот. Таким образом плоский граф-дерево структуры объекта развивается в структуру, каждый узел которой – дерево частей и признаков.

Ценность информации возможно, кажется, определить с помощью контекста информации и цели исследования, целеполагания. Результаты обработки должны войти в объем имеющейся информации и в совокупности с ней образовать модель объекта. Информационная оценка новой модели позволит определить направленность процесса моделирования – уточняющее дополнение (улучшение оценки), либо смешение разных предметных сторон (ухудшение оценки). Структурная связанная информация - еще не вся полезная информация, которую можно извлечь. Вторую часть из потенциально извлекаемой информации несет функция, процесс. Полное извлечение полезной информации возможно в интегрированных системах, которые по принципу дополнительности совмещают методы аналитические и распознавания для извлечения структурной и функциональной информации. В этом, возможно, заключается исключительная объединяющая роль информационных методов.

Целеполагание - не предмет для формального математического представления. Система ценностей исследователя субъективна и может быть несогласной с мнением некоторых коллег или большой их части. Однако согласие не равнозначно правоте. Информационная оценка модели может играть роль «фильтра компетентности». Плюрализм «компетентных» моделей – необходимое условие пополнения источника знаний. Формальный алгоритм должен позволить специалисту реализовать собственные идеи, получить авторские результаты и дать им информационную оценку.

Знания можно представить в виде связанной триады: 1) эмпирические модели, 2) теоретические модели, 3) методы исследования. Системы такого рода сочетают в себе структуру и функции, описываются в терминах теории информации и изучаются кибернетикой. Общую схему для эволюционирующих природных систем, процессов управления и познания приводит Р.Ф.Абдеев [Философия информационной цивилизации, 1994].

Эмпирические модели определенных геологических объектов получаются в результате “наложения” методов исследования на данные наблюдений. Обобщенные модели получаются в результате классификации моделей определенных объектов. Эмпирические модели являются источником новых знаний: 1) как явления нового вида – модели определенных объектов, 2) либо через уточнение и дрейф параметров и выделение новых видов в классификации моделей.

Отношение эмпирических моделей к другим элементам триады: уточнение, дополнение и исправление теоретических моделей (практический критерий истинности); мотивация к развитию методов исследования.

Теоретические модели, к сожалению, разрабатываются довольно вяло. Детерминированные модели с идеальными границами в виде поверхностей разрыва себя исчерпали. Успехи сейсмики высокого разрешения и данные сверхглубокого бурения показали: модель среды с простыми контактами пород разного состава – частный случай общей ситуации – сложной структуры неоднородных образований. Известная «иерархическая системно-структурная модель недр» в строгом смысле не является теоретической и может быть отнесена к разряду феноменологических и эвристических. Однако фундаментальный характер ее не подлежит сомнению для явного большинства специалистов. Строгую теоретическую модель (в духе требований В.И.Арнольда [Теория катастроф, 1990]) для сложных природных систем в близком будущем вряд ли удастся построить. Это не является препятствием для разработки частных моделей определенных сторон проявлений локализованных объектов.

Системная модель геологической среды для комплексной интерпретации включает в себя четыре компоненты [Никитин А.А. ж. Геофизика, 1997, №4]: вещественный состав, структуру, динамику взаимодействия и эволюцию системы. Важные для практики следствия можно ожидать в результате решения задач моделирования: 1) условия, пределы и механизмы гомеостазиса, 2) механизмы негэнтропийного развития – надстройки нового иерархического уровня. С усложнением системы часть энергии внешнего потока консервируется в структуре. Оставшаяся часть распределяется между функциональной компонентой – источником построения следующего уровня – и энтропийной компонентой – потенциальным источником для последующих уровней. Возможно, прогрессивное развитие открытых систем осуществимо при соотношении энергий разных частей и компонент в определенных пределах, и можно подойти к оценке энергетических отношений через информационные меры? Решение этого вопроса позволит сделать заключения геологических прогнозов о перспективности более определенными. Оценка близости к точке бифуркации – пограничные условия первой и второй задач - может иметь для системы жизненно важное (буквально) значение, послужить сигналом к корректировке хозяйственных планов – при негативном исходе, направлять и стимулировать усилия - при благоприятном.

Теоретические модели дают конструктивные следствия для разработки методов исследования, выполняют активную организующую роль для эмпирических моделей.

Методы исследования должны быть структурно-функциональными методами изучения природных явлений и процессов, сочетать методы аналитической аппроксимации, распознавания и теории информации [Страхов В.Н. ж. Геофизика, 1995, № 3, 4.]. Отношение методов аналитических и распознавания формально неопределенно. Аномальные объекты могут подчиняться общей структурной-иерархической схеме, но поле, создаваемое ими, по характеру проявлений может быть внешним к структуре. Методика совместного применения методов двух направлений и критерии приоритетности должны быть разработаны. В результате решения проблемы появится возможность построения структурно-функциональной модели определенного объекта, в которую войдет наибольшая часть полезной информации наблюдений.

Определенные свойства геоданных являются условиями для адаптации алгоритма в построении модели определенного объекта (1). Общие свойства геоданных и оценка модели являются условиями для корректировки адаптационной способности алгоритмов (2). Уместна биологическая аналогия с передачей наследственной информации от фенотипа к генотипу (1) и от генотипа к фенотипу (2). Это управляющий контур обратной связи, и развитые системы обработки должны строиться по правилам кибернетики. Имеется особенность: части триады знаний не могут быть отдельно спроектированы, изготовлены и затем собраны в систему. Система с основными частями и функциями строится сразу в целом, пусть примитивная, как зародыш, и развивается в процессе практического применения, т.е. эволюционирует. Возможно, в грядущем веке получит разрешение гипотеза [Бирюков Б.В., косв.]: большие и сложные, тонкие по функционированию системы, благодаря взаимодействию входящих в них подсистем, могут обладать имманентно присущим им сознанием или его аналогом как неотъемлемым функциональным свойством отражения реальности и антиэнтропийного влияния на внешний мир и самих себя. Подтверждение гипотезы означало бы выдающееся достижение в познании - построение следующего после возникновения письма иерархического уровня в развитии ноосферы.

Аналогия познания и биололгической эволюции подает идею достижения устойчивости, которая не связана со свойствами приемов анализа и алгоритмов. В приложении определенных методов к конкретному набору геоданных следует получить множество решений, из которых в качестве модели принимается среднее в ряду сходных решений, являющих устойчивую реализуемость. Это достигается включением в алгоритм блока процедур вспомогательной обработки, которые позволяют увидеть объект «в ином ракурсе». В этой области имеются теоретически обоснованные разработки [Никитин А.А., Теоретические основы…,1986] и большой опыт применения эвристических приемов.

Совершенно особняком и одновременно тесно связанной с исследованием пространственных данных расположена еще одна область – картографических методов исследования [Бурдэ А.И. Картографический метод…, 1990]. Для формально-логической обработки образно-зрительной информации имеются определенные предпосылки: общая – древовидная – структура образов и главное – относительная простота, устойчивость и повторяемость основных образов рудоносных структур. (Можно подумать, что авторы трудов о рудных структурах срисовывают их с одного оригинала – сочетания дизъюнктивных и кольцевых обликов воспроизводят сходные изображения для структур разного ранга для разных полезных ископаемых, расположенных в различных районах.) Это вселяет надежду, что компьютерный анализ (синтез) картографических образов может быть осуществлен.

Отношение к другим элементам триады: это – «очки», транслятор объекта, заданного наблюдениями, в модель; стимул для развития теоретических моделей путем научного осознания эвристических методов.

Геофизика и математика. Немного конкретного о структурном анализе. Собственно метод и компьютерная программа предназначены для построения классификационной структуры метрических данных любой природы. Метод широко применяется в геологических организациях г.С.-Петербурга для интерпретации комплексных данных при подготовке геофизической основы геолкарты третьего поколения, прогнозе и поисках месторождений. Подмечено, что удачный выбор в достижении цели попутно приносит решение других вопросов. Так: оценивание параметров с учетом погрешности мягко и эффективно ограничивает влияние «ураганов», дает защиту качественным признакам против некачественных, устанавливает предел детальности построений; структурный критерий классифицирующих признаков и видовых классов имеет следствием адаптивность алгоритма и решение проблемы обработки больших матриц; формально строгую классификацию можно посчитать за хитроумный способ обработки данных разноуровневых съемок – в классификации признаки младшего рода и старшего вида формально не связаны. Это является дополнительными аргументами в пользу структурного метода распознавания.

Получается, что в обсуждении крупных – проблемных - задач математических методов в геофизике собственно геофизические задачи не видны. Так, наверное, и должно быть – специфика предмета опускается на детальный уровень ниже, а методная специфика – еще на более детальный уровень. Чрезмерная специализация геофизиков как отрицательная тенденция является одной из причин упадка периода «раннего компьютерного счета». Любую попытку создать свой метод, свой «научный храм» неизбежно ожидает судьба Вавилонской башни. Путь к успеху лежит в соединении усилий всех заинетересованных ученых - естественников, гуманитариев и социологов для создания общего эволюционного метода познания. В общем деле у геофизиков есть реальная возможность внести посильный и достойный вклад. Перефразируя известную притчу о строителях собора в Реймсе, можно высказать мнение: не важно, что говорят о себе геофизики – «таскаю камни, зарабатываю на хлеб, или строю собор». Важно, чтобы замысел собора был, и камни ложились в стены собора.

Литература

1. Линник Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений./ Изд. 2-е, - Л.: Физматгиз, 1962.
2. Кондаков Н.И. Логический словарь-справочник. -М.:Наука, 1975.
3. Сб. Тезисы докладов Первого российского философского конгресса "Человек-философия-гуманизм", Т.3, С.-Пб, 1997.
4. Абдеев Р.Ф. Философия информационной цивилизации. -М.: ВЛАДОС, 1994.
5. Кибернетика живого: Биология и информация/ Сб.статей. – М.:Наука, 1984.
6. Горбань А.Н., Хлебопрос Р.Г. Демон Дарвина: идея оптимальности и естественный отбор. - М.: Наука, 1988. 7. Арнольд В.И. Теория катастроф. – 3-е изд., доп. – М.: Наука, 1990. 8. Страхов В.Н. Основные направления развития теории и методологии интерпретации геофизических данных на рубеже XXI века. – Ж. ЕАГО Геофизика, 1995, № 3, 4.
9. Страхов В.Н. Что делать? О развитии гравиметрии и магнитометрии в России в начале XXI века. – Ж. ЕАГО Геофизика, 1999, № 1.
10. Никитин А.А. Комплексная интерпретация геофизических полей при изучении глубинного строения Земли. – Ж. ЕАГО Геофизика, 1997, № 4.
11. Шарапанов Н.Н., Чубаров В.Н., Горяинов Н.Н. Концептуальная, теоретическая и методическая основы системы экогеологии. – Ж. ЕАГО Геофизика, 1995, № 1.
12. Бурдэ А.И. Картографический метод исследования при региональных геологических работах.- Л.: Недра, 1990.