Вероятностная логика и ортогональный базис силлогистики Сметанин Ю.М. ГБОУ ВПО «Удмуртский государственный университет» В работе рассматривается алгебра случайных событий и её интерпретация в невырожденной булевой алгебре на основе множеств. Показано, что классическое использование понятий логика и вероятность вполне совместимо с инженерными логико-вероятностными исчислениями и вероятностной логикой, начало которой восходит к классическим работам в области искусственного интеллекта, связанными с принятием решений. Показано, что некоторые весьма трудные задачи могут быть решены с помощью предлагаемого логического описания и точной интерпретации.. Исторически сложилось три точки зрения на совместное использование понятий логика и вероятность: классическая [Колмогоров1986] инженерная (логико - вероятностное исчисление - ЛВИ) [Рябинин 2003] исследователей искусственного интеллекта (вероятностная логика) [Nilson 1986]. Под термином вероятностная логика в данной работе понимается по сути классическая алгебра случайных событий с исключенным двусмысленным отношением между случайными событиями X и Y. В работе показано, что различие во взглядах и «трудности» совмещения понятия логика и вероятность происходят от того, что Колмогоровский подход к исчислению вероятностей случайных событий использует невырожденную булеву алгебру на основе множеств [Владимиров 1969], а инженерный подход и подход искусственного интеллекта, использует вырожденную булеву алгебру на основе индикаторов случайных событий, по сути своей - неадекватную модель объективной реальности.
Основные обозначения и понятия. –1. Конституенты и характеристические функции множеств (индикаторы) При исследовании вопроса о том, какие множества можно построить посредством операций (объединения «+», пересечения «·», дополнения до универсума «» - X=U\X из порождающих n произвольных множеств X1, X2,…, Xn, вводится важное понятие конституенты. Обозначим Множество вида, где или назовем конституентой. Общее число не пустых конституент не превосходит.Каждой конституенте можно сопоставить двоичный набор длины n, где есть характеристическая функция множества,. Характеристическая функция (индикатор) множества X ставит в соответствие любому элементу универсума е двоичную переменную x, которая равна 1, если е принадлежит множеству Х либо равна 0, если е не принадлежит Х. Набор из индикаторов множеств конституенты будем называть характеристической функцией конституенты.
Основные обозначения и понятия. 1 Существует важная связь множества пустых (непустых) конституент с бинарными отношениями между множествами X1, X2,…, Xn.. Эта связь заключается в том, что множество пустых (непустых) конституент полностью определяет многоместное (n - мерное отношение) между порождающими множествами и их дополнениями
Основные обозначения и понятия. 2 Вместо классических жергонновых отношений Нами используются расширенные жергонновы отношения XYXY G 9 G 13 G 15 G 11 G 14 G 7 G [0,3] [0,1,3] _ [0,1,2,3] [0,2,3] [0,1,2] [1,2,3] [1,2]
Основные обозначения и понятия. 2 Они называются (их естественно назвать) G 9 - равносильность G 13,G 11 - влечет (левостороннее и правостороннее включение) G 14 - несовместность (контрарность, противоположность, неполное противоречие, подчинение не только универсуму) G 6 - полная несовместность, (контрадикторность, противоречие противоречие, подчинение только универсуму) G 7 - зависимое пересечение (не используется в ТВ) G 15 - независимость (независимое пересечение) XYXY G 9 G 13 G 15 G 11 G 14 G 7 G 6 [0,3] [0,1,3] _ [0,1,2,3] [0,2,3] [0,1,2] [1,2,3] [1,2]
Теоретическая база исследований. 1. Ортогональный базис силлогистики, предложенный Сметаниным Ю.М. Причиной введения ортогонального базиса силлогистики является многосмысловость базиса Аристотеля, что не позволяет встроить силлогистику в символическую ( мате- матическую) логику, которая построена на базе вырожденной булевой алгебры и поэтому содержит парадоксы материальной импликации. В ортогональном базисе силлогистики, который основывается на невырожденной булевой алгебре множеств парадоксов материальной импликации нет. Многосмысловость базиса Аристотеля показана на рис. AXY- все X суть Y, EXY-все X не суть Y, IXY- некоторые X суть Y, OXY- некоторые X не суть Y.
Роковые для логики свойства аристотелева базиса силлогистики Контрадикторность – противоречие (полная несовместимость) Контрарность Логическое отношение между двумя простыми сравнимыми суждениями, которые не могут быть одновременно истинными, но могут быть одновременно ложными, потому что между ними всегда есть третий, промежуточный вариант. неполная несовместимостьсуждениями
Роковые для логики свойства аристотелева базиса силлогистики Все семь простых суждений, соответствующих расширенным жергонновым отношениям находятся в отношении контрарности (несовместности) друг с другом, так как истинность одного влечет ложность всех остальных и ложность одного влечет истинность только одного из остальных. Между суждениями с одинаковыми именами Gi(X,Y) = Gj(Z,T); i=j может существовать отношение подчинения. Подчинение - Логическое отношение между двумя простыми сравнимыми суждениями, у которых предикаты и связки совпадают, а термины субъектов находятся в отношении подчинения A(S1,S2) либо A(S2,S1). Логических отношений между понятиями (терминами суждений три, они выражаются тремя функторами ортогонального базиса Eq(X,Y), A(X,Y), IO(X,Y ).
Теоретическая база исследований. В своей статье "О частных суждениях, о треугольнике противоположностей, о законе исключенного четвертого" Н.А.Васильев предлагает положить в основу силлогистики не четыре (как у Аристотеля) стандартных типа категорических высказываний, а три: общеутвердительные, общеотрицательные и определенно-частные ("акцидентальные") - высказывания вида "Только некоторые S есть P". В этой теории имеют место особые модусы категорического силлогизма, а вместо законов логического квадрата действуют т.н. законы треугольника противоположностей АXY I B XY EXY К сожалению базис Васильева также является многосмысловым
Теоретическая база исследований. 4 ОртогональныйОртогональный базис (ОБ) устраняет недостатки классического базиса Аристотеля за счет устранения многосмысловости. Ортогональный базис силлогистики: 1. Eq(X,Y)- множества X и Y совпадают, 2. A(X,Y) - все X суть Y, в смысле строгого включения 3. IO(X,Y) – (только некоторые X есть Y) и (только некоторые Y есть X) и (пересечение не X и не Y не пустое множество) Eq(X,Y) A(X,Y) IO(X,Y)
Теоретическая база исследований. 4 Новый базис представляет каждое из расширенных Жергонновых отношений смотри рис. 2 G9=EQ(X,Y), G13=A(X,Y), G15=IO(X,Y), G11=A(X,Y), G14=A(X,Y), G7=A(X,Y), G6=EQ(X,Y). При этом вырожденные Жергонновы отношения рис. 4 выражаются через ортогональный базис с допол- нительными ограничениями на множества X и Y.
Почему общеутвердительное суждение Аристотеля нельзя соотнести с материальной импликацией Установлен гомоморфизм расширенных Жергонновых отношений и отношений их индикаторов, например, Простому суждению Аристотеля нельзя сопоставить импликацию. Посредством индикаторов оно выражается в таблице 1 трехзначной логики, i – обозначает третью логическую константу может быть. Отношению ОБ соответствует соседняя таблица 2, которую общепринято называть таблицей истинности импликации xyxy xy i
Однооднозначное соответствие отношений между случайными событиями и функторами ортогонального базиса Это соответствие обеспечено тем, что ортогональный базис и алгебра случайных событий для конечного вероятностного пространства построены на одной и той же алгебраической системе,где - универсум, - два отношения, - операции объединения, пересечения и дополнения до универсума определенные на непустых подмножеств универсума. Теорема. Если - конечная система множеств со свойствами кольца или полукольца, то существует и может быть построена конечная система множеств со следующими свойствами 1.Множества системы не пересекаются. 2. Любое множество системы получаемое из ее образующих с помощью операций из может быть представлено как объединение некоторого числа множеств из. Множества называются конституентами системы при этом
Основные понятия и определения Определение. Базисом заданной алгебраической системы (системы с фиксированным порядком номеров порождающих множеств) будем называть множество непустых конституент данной системы. Определение. Базовым множеством номеров (БМН или BSN) заданной алгебраической системы назовем множество номеров непустых конституент, представленное в десятичном, либо в двоичном виде[1].[1] [1] Смотри пояснение к рисунку. [1]
Примеры решения задач 1. Сначала рассмотрим задачу, с которой начиналась вероятностная логика. [16]. Здесь данная задача приводится в нашей транскрипции. Задача 1. (Вероятностная логика в ИИ). Дана совокупность случайных событий X и Y, заданы - вероятность P(X)=p1 и вероятность =p2. Найти (оценить) вероятность P(Y)=p. Сразу отметим, что опыт в котором воспроизводятся X и Y определяет одно из невырожденных отношений из рисунков 1 и 2, поэтому значения вероятностей р1 и p2.в обязательном порядке зависят от реализуемого отношения, что понимал Нельсон, вводя понятия возможных миров. Для расчета искомой вероятности достаточно рассмотреть все невырожденные отношения и рассчитать вероятность р по ним. Для G15 р2 должно быть равно 1-P(XY)=p2 в силу независимости X и Y имеем 1-p1(1-P(Y))=p2 или 1-р1+p1P(Y)=p2. Отсюда P(Y)=(p1+p2-1)/p1. Последняя формула соответствует ответу для данной задачи, полученному в работе [Кулик 2010] другие случаи там не рассматриваются. Для G14 мы с необходимостью имеем р2=0 и P(Y)
Примеры решения задач. 2 Задача 2. Рассмотрим один из примеров оценки риска и эффективности при борьбе двух компаний за заказ при противодействии третьей компании. Дружественные компании A и B хотят получить выгодный заказ. Компания C может помешать им. Компания C (событие X3 с вероятностью p3) вступит в борьбу за получение заказа и будет противодействовать компаниям А и В. Противодействие компании C могут заставить компанию A (событие X5 с условной вероятностью p5=P(X5/X3) при P(X5/X3')=0) и компанию B (событие X4 с условной вероятностью p4=P(X4/X3) при P(X4/X3)=0) отказаться от намерений. Если же компания B (событие X1 с вероятностью p1=P(X1/X5) при P(X1/X5)=0)) и компания A (событие X2 с условной вероятностью p2=P(X2/X4) при P(X2/X4)=0) смогут получить заказ, то прибыль компании А составит E=6 млрд. и прибыль компании B составит E=2 млрд. В примере вероятности p1, p2, p3, p4, p5 назначены методом экспертной оценки с учетом внешних факторов и капитала фирм A, B и C. Определить вероятность получения заказа компанией А или В и ожидаемый выигрыш двух компаний А и В.
Примеры решения задач. 3 Решим задачу традиционным способом. Определим вероятности P(X1), P(X2) в силу попарной независимости (X1 и X2), (X4 и X3), (X2 и X3) и несовместимости (X1 и X5), (X2 и X4), X1 = (X1X5') + (X1X5) = X1X5' с учетом того, что X1, X5 несовместимы, X1X5 =Ǿ; X2 = (X2X4') + (X2X4) = X2X4' с учетом того, что X2, X4 несовместимы, X2X4 = Ǿ; X4 = X4X3+X4X3'= X3X4 с учетом того, что X3'X4= Ǿ X5 = X5X3+X5X3'= X3X5 с учитывая, что X3'X5= Ǿ P(X4) = P(X3)*P(X4/X3) +P(X3')*P(X4/X3') = p3*p4 = r4; P(X5) = P(X3)*P(X5/X3) +P(X3')*P(X5/X3') = p3*p5 = r5; P(X1) = P(X5')*P(X1/X5) =(1-r5)*p1 = (1-p3*p5)* p1 = r1; P(X2) = P(X4')*P(X2/X4') =(1-r4)*p2 = (1-p3*p4)*p2 = r2 Примем вероятности событий. p1=0.85; p2=0.95; p3=0.7; p4=0.4; p5=0.5 Целевое событие Z=X1+X2. Вероятностный полином (функция) достижения цели P(Z)=r1+ r2 - r1*r2 = (1-p3*p5)*p1+ 1-p3*p4)*p2 - (1-p3*p5)*p1*( 1-p3*p4)*p2=0,85859
Примеры решения задач. 4 Введем в условия примера показатели эффективности достижения трех разных целей: E1 = 6, если свою цель достигнет только компания A P1=P(X1X2') = 0,17459; E2 = 2, если свою цель достигнет только компания B P2=P(X1'X2) = 0,30609; E3 = 8 если свои цели достигнуть обе компании, P3=P(X1X2)=0,37791; Используя вычисленные вероятности определяем суммарную эффективность достижения трех (математическое ожидание) целей равна T = E1*P1 + E2*P2 + E3*P3 = 6*0, *0, *0,37791= 4,683 Решим задачу способом, ориентированным на применение компьютера, используя описание взаимосвязей между случайными событиями посредством функторов ортогонального базиса. Построим систему случайных событий (алгебру) отражающую логическую структуру задачи, которая аналитически выглядит так:Причинно следственные связи явлений (событий) процесса борьбы за заказ можно описать в виде четырех утверждений: событие X1 влечет событие противоположное X5; событие X2 влечет событие противоположное X4; событие противоположное X3 влечет не наступление X5; cобытие противоположное X3 влечет не наступление X4;
Примеры решения задач. 5 Тот же результат получается если, описать логику задачи в виде равенств равносильных отношению включения: X1=X1X5'; X5=X5X3; X2=X2X4'; X4=X4X3; Для системы с заданными соотношениями включения и в виде равенств получены, с помощью программы одинаковые базовые множества номеров Ur и построена диаграмма
Примеры решения задач. 6 Номера входящие в множество Ur это номера непустых конституент упорядоченной (перенумерованной системы множеств X1, X2, X3, X4, X5. Сопоставление конституент номерам и наоборот осуществляется очень просто. Например, номер 28 переводится в двоичную систему счисления как и ему ставится в соответствие конституента X1X2X3X4'X5' где единица на i -ом месте сопоставляется множеству Xi, а ноль на j-ом месте дополнению множества Xj, то есть множеству U\ Xj=Xj'. На диаграмме случайным событиям, которые могут произойти соответствуют подмножества номеров универсума Ur. Например, событию X1=(X1X5') c вероятностью r1 соответствует множество номеров X1=X1X5'=[16, 20, 22, 24, 28], при этом вероятность P(X1X5')=P(X5')*P(X1/X5') =1-r3)*p1=(1- p3*p5)*p1=r1. Последовательно, с учетом логических связей вычислим вероятность всех конституент, составляющих базовое множество номеров Ur=[4,5,6,7,8, 12,13,16,20,22,24,28]. Используя логическое описание задачи, получим:
Примеры решения задач. 7 [28]=X1X2X3X4'X5' = X1X2X3 в силу 1 и 2. В силу независимости X1,X2,X3 P[28]=r1*r2*r3; [24]= X1X2X3'X4'X5' = X1X2X3' в силу 1 и 2, P[24]= r1*r2*(1-r3); [2]= X1X2'X3X4X5'= X1X2'X4 в силу 1 и 3, P[22]= r1*(1-r2)*r4; [20]= X1X2'X3X4'X5'= X1X2'X3X4' в силу 1 и 3 P[20]= r1*(1-r2)*(r3-r4); [16]= X1X2'X3'X4'X5' = X1X2X3' в силу 3 и 4, P[16]= r1*(1-r2)*(1-r3); [13] =X1'X2X3X4'X5= X1'X2X5 в силу 2 и 4, P[13]= (1-r1)*(r2)*(r5); [12] =X1'X2X3X4'X5'= X1'X2X3X5' в силу 2 и 4 P[12]= (1-r1)*(r2)*(r3-r5); [8]= X1'X2X3'X4'X5' = X1'X2X3'X5' в силу 2 и 4 P[8]= (1-r1)*(r2)*(1-r3); [7]= X1'X2'X3X4X5= X1'X2'X4X5 в силу 3 и 4, P[7]= (1-r1)*(1-r2)*r4*r5; [6]= X1'X2'X3X4X5' = X1'X2X4X5' в силу 3, P[6]= (1-r1)*(1-r2)*r4*(1-r5); [5]=X1'X2'X4'X5 в силу 1, P[5]=(1-r1)*(1-r2)*(1-r4)*r5; [4]=X1'X2'X3X4'X5' в силу 3 и 4 и независимости X4 и X5, P[4]= (1-r1)*(1-r2)*(r3- r4-r5+r4*r5); [0]=X1'X2'X3'X4'X5'=X1'X2'X3' в силу 3 и 4 P[0]= (1-r1)*(1-r2)*(1-r3); Легко проверить, что P[16..28]=P[16]+P[20]+P[22]+P[24]+P[28]=P(X1)=r1*(1-r2)*(1-r3)+ r1*(1-r2)*(r3-r4)+ r1*(1-r2)*r4+ r1*r2*r3=r1; P[8..13]+p[24,28]=P(X2)=(1-r1)*(r2)*(r5)+(1-r1)*(r2)*(r3-r5) +(1-r1)*(r2)*(1-r3)+r1*(1- r2)*r4+ r1*r2*r3 = r2;
Примеры решения задач. 8 P[4..7]+P[12,13]+P[20,22]+P[28]=P(X3)=(1-r1)*(1-r2)*(r3-r4-r5+r4*r5)+(1- r1)*(1-r2)*(1-r4)*r5+ (1-r1)*(1-r2)*r4*r5+(1-r1)*(1-r2)*r4*(1-r5)+ (1- r1)*(r2)*(r3-r5)+(1-r1)*(r2)*(r5)+r1*(1-r2)*(r3-r4)+r1*(1-r2)*r4 + r1*r2*r3 =r3; P[6,7]+P[22]=P(X4)= (1-r1)*(1-r2)*r4*r5+(1-r1)*(1-r2)*r4*(1-r5)+ r1*(1- r2)*r4=(1-r1)*(1-r2)*[ r4*r5 +r4 - r4*r5]+ r1*(1-r2)*r4 =(1-r1)*(1-r2)*r4+ r1*(1- r2)*r4 =r4*(1-r2); P[5,7,13]= (1-r1)*(1-r2)*(1-r4)*r5+(1-r1)*(1-r2)*r4*r5+(1-r1)*(r2)*(r5)=(1- r1)*r5; P[8..28]= P(X1+X2)=r1+r2-r1*r2; Этот и предыдущий результат указывают на детерминированную связь случайных событий X1 и X5', X2 и X4' одно не может произойти без другого. Кроме того, имеют место еще 2 равенства. P[0..7]=P(X1'X2')=(1-r1)*(1-r2)= 1-P(X1+X2)=(1-r1-r2+r1*r2); P[0, 4, 5, 6, 7, 8,12,13,16,20,22,24, 28] =1 Произведем декомпозицию исходной логико - алгебраической модели задачи (рис. 4). В системе событий можно выделить два кластера на основе силы логических связей между ними это системы {X1, X3, X5} и {X2, X3, X4}. Их линейные диаграммы показаны на рис. 4.
Примеры решения задач. 9 То есть исходную задачу можно решать, разбив ее на две подзадачи. Решение приведено ниже. Разбиение можно осуществить на исходной диаграмме удалив из нее сначала множества X2 и X4, затем X1 и X5 при этом перевычисляется множество базовых номеров, либо заново строится линейная диаграмма смотри след. рис.
Примеры решения задач. 10