Итак, мы договорились, что будем указывать зависимость от априорного знания в явном виде в форме значка a после черты в формулах условных вероятностей. Теперь давайте попытаемся с учетом этого требования заново вывести формулу Байеса. Для начала, запишем некую формулу, прямо следующую из формулы условной вероятности:
p(x|a,y)*p(y|a)=p(y|a,x)*p(x|a)
Здесь x - неизвестное истинное значение некой величины, y - результат измерения, а параметр a характеризует определенное априорное знание субъекта о значении величины x. Сразу заметим, что в записи
p(x|a,y)=p(y|x)*p(x|a)/p(y|a)
Выражение в знаменателе в правой части равенства, не зависящее от x, представляет собой всего лишь нормирующий множитель. Поэтому можно не углубляться в рассмотрение его физического смысла, а просто временно забыть о нем, не забыв в конце концов пронормировать распределение по x. Таким образом,
Определим теперь новый вид распределения,
Вопрос состоит в том, что такое
Легко показать, что независимость отдельных измерений в серии позволяет вычислять вероятностный результат всей серии измерений как произведение вероятностных результатов отдельных измерений (с точностью до нормировки).
Отвлечемся теперь от того, что в эксперименте измеряется числовое или векторное значение. Пусть y - это просто некий новый элемент знания субъекта о рассматриваемой ситуации, не обязательно выражаемый в численной форме. Если этот элемент знания можно так или иначе ассоциировать с распределением вероятности, заданном на рассматриваемом пространстве событий, то это распределение и есть вероятностный результат приобретения субъектом нового знания.
Например, если знание состоит в том, что произошло событие A, то, в соответствии с определением, вероятностный результат приобретенного знания в отношении некоторого события B следует записать так:
p(B|A)=p(A|B)/{p(A|B)+p(A|~B)}
Здесь в правой части приведены условные вероятности события A, которые полагаются известными. Знак a, указывающий на зависимость от априорных знаний субъекта, явно не приведен, поскольку здесь мы рассматриваем априорное знание субъекта только о событии B, которое на данные условные вероятности влияния не оказывает. В левой же части равенства приведена вовсе не апостериорная вероятность, а вероятностный результат знания о том, что событие А произошло. Отсутствие значка a в данном случае существенно.
Можно ли вычислить отсюда условную вероятность
p(B|A)*p(B|a)+p(~B|A)*p(~B|a)
Легко убедиться, что при делении
А теперь давайте подведем некоторые предварительные итоги. Стандартный подход теории вероятностей состоит в том, чтобы определить некое «полное» пространство событий (математически оно определяется как «алгебра» или «сигма-алгебра»). Для каждого «элементарного» события (т.е. для такого, которое не является объединением других событий) из этого пространства определяется вероятность, что определяет и полную вероятностную картину для всего пространства. Все остальные вероятностные соотношения выводятся как следствия из этой картины. Такой подход позволяет ввести понятие контекста рассматриваемой ситуации и определить понятие контекстно зависимого распределения вероятностей - условного распределения. В стандартной модели контекст всегда описывается как подпространство изначального пространства событий.
В реальной же исследовательской практике никакого изначального пространства событий с заданным на нем распределением вероятностей нет и быть не может. Исследователь имеет дело только с некоторым конкретным контекстом, в рамках которого описывает наблюдаемые события, причем контекст может меняться в зависимости от результатов его изысканий. Понятие вероятности изначально было введено в науку как средство описания неполных знаний субъекта (исследователя) о рассматриваемой ситуации. Поскольку знания субъекта являются контекстно зависимыми, вероятность тоже должна быть контекстно зависимой. Получается, что с точки зрения исследователя имеют смысл только распределения вероятностей, заданные на конкретном рассматриваемом пространстве событий, соответствующем контексту решаемой задачи, понятие же изначального пространства событий с заданным на нем распределением вероятностей является математическим излишеством.
В связи с этим, выше было продемонстрировано, что формула условной вероятности может быть выведена и без использования предположения о существовании исходного пространства событий. Далее было продемонстрировано, что введение нового понятия (вероятностного результата наблюдения) позволяет преобразовать формализм условных вероятностей к такому виду, в котором априорное распределение полностью равноправно вероятностному результату наблюдения. Это позволяет интерпретировать априорное распределение как обычный элемент знания субъекта о рассматриваемой ситуации и не привлекать для его обоснования представления об изначальном пространстве событий.
Сами наблюдения, которые изменяют представления исследователя о рассматриваемой ситуации, тоже являются событиями, но они не обязательно должны принадлежать к конкретному пространству, рассматриваемому исследователем. Их независимость (или зависимость) в вероятностных формализмах описывается соответствующими априорными распределениями. А это значит, что, если мы не хотим вернуться к представлениям о существовании изначального пространства событий, мы должны рассматривать независимость наблюдений (или конкретный характер их зависимости) как элемент знаний (предположений) исследователя о рассматриваемой ситуации.
Итак, мы пришли к выводу, что теория вероятностей способна предложить нам эффективный формализм для описания процесса изменения знания о предметной области, если только мы не будем зацикливаться на представлениях об «объективном» существовании «полного» пространства событий, в котором все вероятности определены раз и навсегда.
Правда, следует заметить, что рассмотренный выше подход предлагает решения далеко не всех проблем. Обсуждение этого вопроса смотрите далее.