ДСМ-метод
| Эту статью следует викифицировать.
Пожалуйста, оформите её согласно правилам оформления статей.
|
ДСМ-метод – это метод автоматического порождения гипотез. Формализует схему правдоподобного и достоверного вывода, называемую ДСМ-рассуждением.
ДСМ-рассуждение является синтезом познавательных процедур: индукции, аналогии и абдукции. ДСМ-метод был создан как средство автоматизированного построения формализации знаний о предметной области средствами так называемых квазиаксиоматических теорий (КАТ).
Содержание |
[править] История
ДСМ-метод автоматического порождения гипотез был предложен В. К. Финном в конце семидесятых годов. Название метода составляют инициалы известного английского философа, логика и экономиста Джона Стюарта Милля, чьи “методы здравомыслящего естествоиспытателя” частично формализованы в ДСМ-методе.
Исторически, первым примером задач, для решения которых применялись ДСМ-системы, является выявление причинно-следственных закономерностей вида структура-активность в фармакологии. В 1997-1998 годах был проведен ряд компьютерных экспериментов, целью которых являлась оценка возможности создания интеллектуальной системы, которая позволяла бы определить степень риска возникновения у больного рецидива аденомы гипофиза после её удаления. На основе количественного ДСМ-метода была разработана экспериментальная система прогнозирования рецидива аденомы гипофиза, которая носит рабочее название HTRD (Hypophisis tumor relapse diagnostics). Кроме этого, ДСМ-системы успешно применялись в задачах технической диагностики и в исследовании детерминант социологического поведения.
В настоящее время разработками ДСМ-систем занимаются в ВИНИТИ РАН и на кафедре математики, логики и интеллектуальных систем РГГУ под руководством В. К. Финна.
[править] Описание метода
ДСМ-метод оперирует сущностями трёх сортов: объекты предметной области, свойства этих объектов, возможные причины свойств.
Предполагается, что объекты имеют структуру и причинами свойств объектов являются фрагменты этой структуры.
Пример:
- Объект – лист растения.
- Свойство объекта – зелёный цвет.
- Причина свойства – хлорофилл.
На вход ДСМ-метод получает некоторое множество изучаемых объектов и сведения об их структуре, о наличии или отсутствии у них определенных свойств, а также, в некоторых случаях, о связи между структурой объектов и их свойств. Кроме того имеется ряд целевых признаков, каждый из которых разбивает исходное множество объектов на четыре непересекающихся подмножества:
-
- объекты, про которые известно, что они обладают данным признаком,
-
- объекты, про которые известно, что они не обладают данным признаком,
-
- объекты, для которых существуют аргументы как за, так и против того, что они обладают данным признаком,
-
- объекты, о которых неизвестно, обладают они этим признаком или нет.
Результатом применения ДСМ-метода являются гипотезы двух типов:
-
- гипотезы о связи определенных структурных фрагментов изучаемых объектов со свойствами, которыми они обладают,
- гипотезы о наличии или отсутствии целевых признаков у объектов, для которых изначально это было неизвестно, формируемые на основании установленной взаимосвязи между свойствами объектов и их структурными компонентами.
[править] Шаг ДСМ-метода
Рассмотрим один шаг ДСМ-метода в его самом простом варианте.
-
- O — множество объектов,
- P — множество свойств объектов (целевых признаков),
- C — множество возможных причин свойств объектов (элементы структуры объектов),
- V — множество оценок. V = {+1, –1, 0,
}.
Имеется функция P: O→
, которая сопоставляет каждому объекту о подмножество фрагментов (элементов структуры), встречающихся в объекте о.
Введём функцию F: O×P→V, представляющую начальную ситуацию.
-
- F(o, p) = +1 — известно, что объект o обладает свойством p;
- F(o, p) = –1 — известно, что объект o не обладает свойством p;
- F(o, p) = 0 — есть аргументы как за, так и против того, что объект o обладает свойством p;
- F(o, p)=
— неизвестно, обладает ли объект o свойством p.
Функция F может быть представлена в виде матрицы:

Если fij =
, то говорят, что для пары (oi, pj) функция F(oi, pj) недоопределена. Задача ДСМ-метода состоит в том, чтобы с помощью формирования гипотез доопределить исходную матрицу.
[править] Правила первого рода
Сформируем гипотезы о возможных причинах свойств. В результате получим функцию H: C×P→V.
-
- H(c, p) = +1 — c является возможной причиной наличия свойства p или (+)-гипотезой;
-
- H(c, p) = –1 — c является возможной причиной отсутствия свойства p или (-)-гипотезой;
-
- H(c, p) = 0 — есть аргументы как за то, что c является причиной наличия свойства p, так и за то, что c есть причина отсутствия этого свойства или (+)-гипотезой (противоречивой гипотезой);
-
- H(c, p) =
— неизвестно, является ли c причиной наличия p или причиной отсутствия этого свойства.
- H(c, p) =
Значения функции H для каждой пары (c, p) находятся с помощью правил правдоподобного вывода. Эти правила называются правилами первого рода. Сокращенное обозначение — PIR1 (от Plausible Inference Rules). Правила первого рода можно рассматривать как функцию, использующую матрицу F для получения матрицы H, т.е.
H = PIR1(F).
Пусть p — некоторое свойство.
Объект o является:
-
- положительным примером или (+)-примером для p относительно исходной матрицы F, если F(o, p) = +1,
- отрицательным примером или (-)-примером для p относительно исходной матрицы F, если F(o, p) = -1,
- противоречивым примером или (0)-примером для p относительно исходной матрицы F, если F(o, p) = 0.
Через F +[p], F -[p], F 0[p] будем обозначать множество всех положительных, отрицательных и противоречивых примеров для p относительно F, соответственно.
В качестве возможных причин наличия/отсутствия свойств объектов рассматриваются подмножества набора фрагментов С[1]. Множество С' ⊆ C удовлетворяет (+)-условию для p относительно F, если существует Ω ⊆ F+[p] такое, что:
-
, т.е. каждый объект из Ω содержит все фрагменты из множества C', и не существует дополнительных фрагментов, принадлежащих
для всех
;- Ω содержит по крайней мере два элемента.
(–)- и (0)-условия - аналогично.
Через M+(F, c, p) будем обозначать тот факт, что c удовлетворяет (+)-условию для p относительно F .
Через M-(F, c, p) - тот факт, что c удовлетворяет (-)-условию для p относительно F .
Через M0(F, c, p) - тот факт, что c удовлетворяет (0)-условию для p относительно F .
Теперь определим функцию H[2]. Положим:

Иначе говоря, множество фрагментов Ci⊆C, доопределяется как
- возможная причина наличия свойства p, если оно вкладывается в два и более (+)-примера, не более чем в один (-)-пример) и неболее чем в один (0)-пример;
- возможная причина отсутствия свойства p, если оно вкладывается в два и более (-)-примера, не более чем в один (+)-пример и не более чем в один (0)-пример.
[править] Правила второго рода
Используя матрицу гипотез о возможных причинах, можно сформировать гипотезы о наличии или отсутствии свойства p у тех объектов из O, для которых изначально не было известно, обладают они этим свойством или нет, т.е. для тех o
O, для которых F(o, p) =
.
В результате мы получим функцию F’: O×P→V. F’(o, p) = F(o, p), если F(o, p) ≠
. Если же F(o, p) =
, то F’(o, p) может принимать любое значение из V:
-
- F’(o, p) = +1 - o возможно обладает свойством p,
- F’(o, p) = -1 - o возможно не обладает свойством p,
- F’(o, p) = 0 - есть аргументы как за, так и против того, что объект o обладает свойством p,
- F’(o, p) =
- доопределить ячейку исходной матрицы F не удалось.
Значения функции F' находятся с помощью правил правдоподобного вывода. Эти правила называются правилами второго рода. Сокращенное обозначение — PIR2. Правила второго рода можно рассматривать как функцию, использующую матрицы F и Н для получения матрицы F', т.е. F' = PIR2(F, H).
Пусть o — объект, p — свойство. Будем говорить, что объект o удовлетворяет
-
- (+)-условию для p относительно H (т.е. возможно обладает свойством p), если существует такое c
C, что c⊆o и H(c, p) = +1. - (-)-условию для p относительно H (т.е. возможно не обладает свойством p), если существует такое c
C, что c⊆o и H(c, p) = -1. - (0)-условию для p относительно H (т.е. есть аргументы как за, так и против того, что о обладает свойством p), если существует такое c
C, что c⊆o и H(c, p) = 0.
- (+)-условию для p относительно H (т.е. возможно обладает свойством p), если существует такое c
Через
+(H, o, p),
-(H, o, p),
0(H, o, p) будем обозначать тот факт, что объект o для свойства p относительно H удовлетворяет (+)-условию, (–)-условию и 0-условию, соответственно. Положим: F'(o, p) = F(o, p), если F(o, p) ≠
; в противном случае

Правила первого рода (процедура индукции) и правила второго рода (процедура аналогии) последовательно применяются до тех пор, пока в результате их работы порождается хотя бы одна новая гипотеза, т.е. применение правил первого рода приводит к изменению матрицы гипотез о возможных причинах свойств объектов, а применение правил второго рода – к изменению матрицы гипотез о возможном наличии или отсутствии свойства p у объектов. При этом номер шага является показателем правдоподобия рассуждений.
[править] Проверка условия каузальной полноты
Следующим шагом работы ДСМ-метода является проверка условия каузальной полноты. Проверка этого условия интерпретируется, как рассуждение по абдукции – условие выполняется, если полученные гипотезы объясняют исходные данные, т.е. если гипотезы о возможных причинах свойств объектов, полученные в результате применения правил первого рода, могут объяснить наличие или отсутствие свойства p у объектов для которых было изначально (до применения процедур индукции и аналогии) известно, что они обладают или не обладают свойством p.
Цель проверки условия состоит в том, чтобы определить, можно ли принимать полученные в результате работы метода гипотезы. Если условие каузальной полноты не выполняется, необходимо изменить применяемую когнитивную технику (например, выбрать другой способ кодирования структуры объектов) или входной набор объектов (как правило, набор расширяется).
[править] Пример
Попытаемся, используя ДСМ-метод, дать ответ на следующий вопрос: какими свойствами должен обладать выпуклый четырехугольник с нетривиальной симметрией, чтобы вокруг него можно было описать окружность, или напротив, нельзя было описать окружность.
Рассмотрим следующий набор объектов предметной области:
- o1 - квадрат,
- o2 - прямоугольник,
- o3 - ромб,
- o4 - параллелограмм,
- o5 - равнобокая трапеция,
- o6 - дельтоид,
- o7 - прямоугольный дельтоид.
Для этих объектов выберем следующий набор структурных фрагментов C:
- c1 - есть центр симметрии,
- c2 - есть ось симметрии,
- c3 - есть ось симметрии, которая является диагональю,
- c4 -есть ось симметрии, не являющаяся диагональю,
- c5 - ровно один поворот на 180⁰ переводит фигуру в себя,
- c6 -порядок группы симметрий равен двум,
- c7 -есть пара противолежащих прямых углов,
- c8 - нет прямого угла,
- c9 - нет оси симметрии или любая ось симметрии является диагональю.
множество целевых признаков в данном случае состоит всего из одного признака:
- p - можно описать окружность.
Представим исходные данные в виде таблицы:
| p | c1 | c2 | c3 | c4 | c5 | c6 | c7 | c8 | c9 | |
|---|---|---|---|---|---|---|---|---|---|---|
| o1 (квадрат) |
|
|
|
|
|
|
|
|
|
|
| o2 (прямоугольник) |
![]() |
|
|
|
|
|
|
|
|
|
| o3 (ромб) |
|
|
|
|
|
|
|
|
|
|
| o4 (параллелограмм) |
|
|
|
|
|
|
|
|
|
|
| o5 (равнобокая трапеция) |
|
|
|
|
|
|
|
|
|
|
| o6 (дельтоид) |
|
|
|
|
|
|
|
|
|
|
| o7 (прямоугольный дельтоид) |
|
|
|
|
|
|
|
|
|
|
Представим каждый из объектов набором структурных компонентов, которыми этот объект обладает:
- о1 (квадрат) {с1, с2, с3, с4, с7};
- o2 (прямоугольник) {с1, с2, с4, с5, с7};
- o3 (ромб) {с1, с2, с3, с5, с8, с9};
- o4 (параллелограмм) {с1, с5, с6, с8, с9};
- o5 (равнобокая трапеция) {с2, с4, с6, с8};
- о6 (дельтоид) {с2, с3, с6, с8, с9};
- о7 (прямоугольный дельтоид) {с2, с3, с6, с7, с9}.
В нашем случае положительными примерами для целевого свойства p являются объекты о1, о5 и о7, отрицательными - о3, о4 и о6. Также имеется один (
)-пример - o2.
Наша задача состоит в том, чтобы, используя правдоподобные рассуждения, выяснить, обладают (
)-примеры целевым свойством p или нет.
[править] Применение правил первого рода
Здесь в качестве возможных причин наличия/отсутствия свойства p у объектов будем рассматривать некоторые непустые подмножества множества структурных фрагментов C. (+)-условию удовлетворяют множества:
- C1 = {с2, с4}: Ω = {o1, o5};
- C2 = {с2, с3, с7}: Ω = {o1, o7};
- C3 = {с2}: Ω = {o1, o5, o7};
- C4 = {с2, с6}: Ω = {o5, o7}.
(-)-условию удовлетворяют множества:
- C5 = {с1, с5, с8, с9}: Ω = {o3, o4};
- C6 = {с2, с3, с8, с9}: Ω = {o3, o6};
- C7 = {с8, с9}: Ω = {o3, o4, o6};
- C8 = {с6, с8, с9}: Ω = {o4, o6};
Теперь необходимо выяснить, являются ли найденные множества возможными причинами наличия или отсутствия целевого свойства p у объектов, то есть определить функцию H для данного шага. Как говорилось ранее, правила определения данной функции могут иметь различный вид в зависимости от выбранной стратегии - с запретом (или без запрета) на контр-примеры.
Множество Ci
C будем доопределять как
- возможную причину наличия свойства p, если Ci удовлетворяет (+)-условию для p, то есть вкладывается как подмножество в два и более (+)-примера и при этом не вкладывается ни в один (вкладывается не более чем в один) (-)-пример;
- возможную причину отсутствия свойства p, Ci удовлетворяет (-)-условию для p, то есть вкладывается как подмножество в два и более (-)-примера и при этом не вкладывается ни в один (вкладывается не более чем в один) (+)-пример;
- противоречивую гипотезу, если существуют как (+)-пример, так и (-)-пример, в который вкладывается Ci.
Анализируя наши данные, мы получаем две возможные причины наличия свойства p:
- C1 = {с2, с4} и
- C2 = {с2, с3, с7}.
Множество фрагментов C4 = {с2, с6} становится (+)-гипотезой или противоречивой гипотезой в зависимости от стратегии.
Все множества, удовлетворяющие (-)-условию для p, доопределяются как возможные причины отсутствия свойства p.
То есть,
- H (C1, p) = +1,
- H (C2, p) = +1,
- H (C5, p) = -1,
- H (C6, p) = -1,
- H (C7, p) = -1,
- H (C8, p) = -1,
- H (C4, p) = +1' или H (C4, p) = 0 в зависимости от выбранной стратегии.
[править] Применение правил второго рода
Используем полученные на предыдущем шаге (+)- и (-)-гипотезы для определения
-примеров. В нашем случае такой пример всего один: o2 {с1, с2, с4, с5, с7}.
В него вкладывается одна возможная причина наличия свойства p (C1 = {с2, с4}) и не вкладывается ни одной возможной причины отсутствия свойства p, поэтому в стратегии с запретом на контр-примеры мы доопределяем o1 как (+)-пример[3].
К полученному на n-м шаге набору примеров опять применяются правила первого, а затем второго рода. Этот процесс продолжается до тех пор, пока не будут доопределены все
-примеры.
[править] Проверка каузальной полноты
Проверка каузальной полноты осуществляется, как говорилось ранее, при помощи абдуктивных рассуждений. Условие каузальной полноты выполняется, если в каждый исходный (+)-пример вкладывается хотя бы одна возможная причина наличия целевого свойства p, а в каждый (-)-пример - хотя бы одна возможная причина его отсутствия.
В нашем случае каждый исходный положительный и отрицательный пример является объясненным.
[править] Итог
Таким образом, мы получили следующие правдоподобные (а фактически - действительные) достаточные условия для того, чтобы вокруг выпуклого четырехугольника, обладающего нетривиальной симметрией, можно было описать окружность:
- имеется ось симметрии, которая не является диагональю,
- имеется ось симметрии диагональ, и при этом имеется пара противолежащих прямых углов.
[править] Примечания
- ↑ В этом случае, для того, чтобы определить множества, удовлетворяющие (+)-, (-) и (0)-условиям, требуется найти всевозможные непустые пересечения фрагментов для набора (+)-, (-)- и (0)-примеров. Поиск всех пересечений (сходств) заданного наборя является отдельной комбинаторной задачей, для решения которой известен ряд алгоритмов, наиболее эффективным из которых является алгоритм Норриса.
- ↑ Функция H может быть определена по другому в зависимости от стратегии (с запретом или без запрета на контр-примеры).
- ↑ В более осторожной стратегии без запрета на контр-примеры мы отмечаем, что помимо этого, в него вкладывается одна противоречивая гипотеза, и поэтому доопределяем o1 как (0)-пример.
[править] Литература
- Автоматическое порождение гипотез в интеллектуальных системах. Сост. Е.С.Панкратова, В.К.Финн. - М.: ЛИБРОКОМ, 2009. - 528 с.
- ДСМ-метод автоматического порождения гипотез: логические и эпистемологические основания. Сост. О.М.Аншаков, Е.Ф.Фабрикантова. - М.: ЛИБРОКОМ, 2009. - 432 с.
- Финн В. К. О возможности формализации правдоподобных рассуждений средствами многозначных логик // Всесоюзн. симп. по логике и методологии науки. – Киев: Наукова думка, 1976. – С. 82-83.
- Финн В. К. О машинно-ориентированной формализации правдоподобных рассуждений в стиле Ф. Бэкона – Д. С. Милля // Семиотика и информатика. – 1983. – Вып. 20. – С. 35-101.
- Anshakov O.M., Finn V.K., Skvortsov D.P. On axiomatization of many-valued logics associated with formalization of plausible reasoning // Studia Logica. 1989. Vol. 48. N 4. P. 423—447.
- Аншаков О.М., Скворцов Д.П., Финн В.К. О дедуктивной имитации некоторых вариантов ДСМ-метода автоматического порождения гипотез // Семиотика и ин-форматика.— 1993.— Вып. 33.— С. 164–233.
- Финн В. К. Об особенностях ДСМ-метода как средства интеллекту-ального анализа данных // НТИ. Сер. 2. – 2001. – №5. – С. 1-4.
- Виноградов Д. В. Несимметричный ДСМ-метод с учетом контекста // Пятая национальная конференция с международным участием .Искусственный интеллект-96. – Казань: 1996. – КИИ-96: Сб. науч. тр.: В 3 т. – Казань : Ассоц. искусств. интеллекта, 1996.
- Аншаков О.М., Скворцов Д.П., Финн В.К. О логической конструкции ДСМ-метода автоматического порождения гипотез // Докл. АН СССР, Том 320, № 6.— 1991.— С. 1331–1334.
[править] См. также
- Интеллектуальная информационная система
- Экспертная система
- Автоматизированная информационная система
- Гибридная интеллектуальная система
- Интеллектуальные системы в гуманитарной сфере (институт лингвистики РГГУ) - кафедра, занимающаяся разработкой ДСМ-метода
[править] Ссылки
Добрынин Д.А. Динамический ДСМ-метод в задаче управления интеллектуальным роботом
Добрынин Д.А. Применение ДСМ-метода в задачах адаптивного поведения роботов
Михеенкова М.А., Финн В.К. Интеллектуальные системы для анализа социологических данных: задачи, логика, архитектура
Кожунова О.С. Применение правдоподобных рассуждений ДСМ-метода для пополнения семантического словаря
Труды XI Национальной конференции по искусственному интеллекту с международным участием
Открытый ДСМ-решатель на C++

, т.е. каждый объект из Ω содержит все фрагменты из множества C', и не существует дополнительных фрагментов, принадлежащих
для всех
;