5. Альтернативный подход: Вероятностные результаты наблюдений

Итак, мы договорились, что будем указывать зависимость от априорного знания в явном виде в форме значка a после черты в формулах условных вероятностей. Теперь давайте попытаемся с учетом этого требования заново вывести формулу Байеса. Для начала, запишем некую формулу, прямо следующую из формулы условной вероятности:

p(x|a,y)*p(y|a)=p(y|a,x)*p(x|a)

Здесь x - неизвестное истинное значение некой величины, y - результат измерения, а параметр a характеризует определенное априорное знание субъекта о значении величины x. Сразу заметим, что в записи p(y|a,x) параметр a явно лишний, поскольку в данном случае имеется точное знание значения x, с позиций которого рассматривается ситуация, и никакие априорные предположения субъекта не внесут ничего нового. Так что смело переписываем формулу:

p(x|a,y)=p(y|x)*p(x|a)/p(y|a)

Выражение в знаменателе в правой части равенства, не зависящее от x, представляет собой всего лишь нормирующий множитель. Поэтому можно не углубляться в рассмотрение его физического смысла, а просто временно забыть о нем, не забыв в конце концов пронормировать распределение по x. Таким образом, p(x|a,y) с точностью до нормировки равно произведению p(y|x) на p(x|a). Первый сомножитель - это инструментальное распределение измеряемых значений, второй - априорное распределение величины x, а результат - апостериорное распределение этой величины.

Определим теперь новый вид распределения, p(x|y) (не путать с апостериорным!), как результат нормировки по x инструментального распределения p(y|x). Очевидно, что лишняя нормировка ничего не изменит. Поэтому можно утверждать, что p(x|a,y) с точностью до нормировки равен произведению p(x|y) на p(x|a). Это и есть «обновленный» вариант формулы Байеса.

Вопрос состоит в том, что такое p(x|y)? Согласно определению, это всего лишь перенормированное инструментальное распределение. Согласно же полученной формуле - это недостающий сомножитель для вычисления апостериорного распределения (помимо априорного распределения). А поскольку этот сомножитель имеет вид распределения по x, которое зависит только от конкретного значения y, его можно интерпретировать как непосредственный ВЕРОЯТНОСТНЫЙ РЕЗУЛЬТАТ измерения (в отличие от апостериорной вероятности, которая содержит зависимость от априорного знания - от a).

Легко показать, что независимость отдельных измерений в серии позволяет вычислять вероятностный результат всей серии измерений как произведение вероятностных результатов отдельных измерений (с точностью до нормировки).

Отвлечемся теперь от того, что в эксперименте измеряется числовое или векторное значение. Пусть y - это просто некий новый элемент знания субъекта о рассматриваемой ситуации, не обязательно выражаемый в численной форме. Если этот элемент знания можно так или иначе ассоциировать с распределением вероятности, заданном на рассматриваемом пространстве событий, то это распределение и есть вероятностный результат приобретения субъектом нового знания.

Например, если знание состоит в том, что произошло событие A, то, в соответствии с определением, вероятностный результат приобретенного знания в отношении некоторого события B следует записать так:

p(B|A)=p(A|B)/{p(A|B)+p(A|~B)}

Здесь в правой части приведены условные вероятности события A, которые полагаются известными. Знак a, указывающий на зависимость от априорных знаний субъекта, явно не приведен, поскольку здесь мы рассматриваем априорное знание субъекта только о событии B, которое на данные условные вероятности влияния не оказывает. В левой же части равенства приведена вовсе не апостериорная вероятность, а вероятностный результат знания о том, что событие А произошло. Отсутствие значка a в данном случае существенно.

Можно ли вычислить отсюда условную вероятность p(B|a,A)? Используем для этого тот же подход, что для случайных величин, а именно: умножение на априорную вероятность p(B|a) с последующей нормировкой. Нормировочный коэффициент записывается в виде суммы:

p(B|A)*p(B|a)+p(~B|A)*p(~B|a)

Легко убедиться, что при делении p(B|A)*p(B|a) на нормировочный коэффициент выражение, записанное выше в фигурных скобках, сокращается, и остается выражение, которое сводится к p(AB|a)/p(A|a) в полном соответствии с определением условной вероятности.

А теперь давайте подведем некоторые предварительные итоги. Стандартный подход теории вероятностей состоит в том, чтобы определить некое «полное» пространство событий (математически оно определяется как «алгебра» или «сигма-алгебра»). Для каждого «элементарного» события (т.е. для такого, которое не является объединением других событий) из этого пространства определяется вероятность, что определяет и полную вероятностную картину для всего пространства. Все остальные вероятностные соотношения выводятся как следствия из этой картины. Такой подход позволяет ввести понятие контекста рассматриваемой ситуации и определить понятие контекстно зависимого распределения вероятностей - условного распределения. В стандартной модели контекст всегда описывается как подпространство изначального пространства событий.

В реальной же исследовательской практике никакого изначального пространства событий с заданным на нем распределением вероятностей нет и быть не может. Исследователь имеет дело только с некоторым конкретным контекстом, в рамках которого описывает наблюдаемые события, причем контекст может меняться в зависимости от результатов его изысканий. Понятие вероятности изначально было введено в науку как средство описания неполных знаний субъекта (исследователя) о рассматриваемой ситуации. Поскольку знания субъекта являются контекстно зависимыми, вероятность тоже должна быть контекстно зависимой. Получается, что с точки зрения исследователя имеют смысл только распределения вероятностей, заданные на конкретном рассматриваемом пространстве событий, соответствующем контексту решаемой задачи, понятие же изначального пространства событий с заданным на нем распределением вероятностей является математическим излишеством.

В связи с этим, выше было продемонстрировано, что формула условной вероятности может быть выведена и без использования предположения о существовании исходного пространства событий. Далее было продемонстрировано, что введение нового понятия (вероятностного результата наблюдения) позволяет преобразовать формализм условных вероятностей к такому виду, в котором априорное распределение полностью равноправно вероятностному результату наблюдения. Это позволяет интерпретировать априорное распределение как обычный элемент знания субъекта о рассматриваемой ситуации и не привлекать для его обоснования представления об изначальном пространстве событий.

Сами наблюдения, которые изменяют представления исследователя о рассматриваемой ситуации, тоже являются событиями, но они не обязательно должны принадлежать к конкретному пространству, рассматриваемому исследователем. Их независимость (или зависимость) в вероятностных формализмах описывается соответствующими априорными распределениями. А это значит, что, если мы не хотим вернуться к представлениям о существовании изначального пространства событий, мы должны рассматривать независимость наблюдений (или конкретный характер их зависимости) как элемент знаний (предположений) исследователя о рассматриваемой ситуации.

Итак, мы пришли к выводу, что теория вероятностей способна предложить нам эффективный формализм для описания процесса изменения знания о предметной области, если только мы не будем зацикливаться на представлениях об «объективном» существовании «полного» пространства событий, в котором все вероятности определены раз и навсегда.

Правда, следует заметить, что рассмотренный выше подход предлагает решения далеко не всех проблем. Обсуждение этого вопроса смотрите далее.


ДАЛЕЕ
Используются технологии uCoz