Самуэль, Артур

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Артур Самуэль (1901 – 29 июля 1990) был пионером в области компьютерных игр и искусственного интеллекта. Его программа Checkers-playing - одна из первых самообучающаяся программ в мире, и является одной из первых демонстраций искусственного интеллекта.

Научная работа[править | править вики-текст]

Артур Самуэль больше всего известен своей инновационной работой по компьютерных шашкам. Он думал, что обучаемые компьютеры при игре в игры очень плодотворны для того, чтобы развить тактику, соответствующую общим проблемам искусственного интеллекта. Для этого он выбрал шашки, потому что правила относительно просты, но имеют глубокую стратегию. Основа обучения машины была дерево поиска положений, достижимых от текущего состояния. Так как у него было только очень ограниченное количество памяти, Самуэль осуществил то, что теперь называют альфа бета отсечением. Вместо того, чтобы искать каждый путь на все протяжение игры, Самуэль развивал сложную полиноминальную оценочную функцию, основанную на положении в любой момент времени. Эта функция пыталась измерить шанс победы для каждой стороны в данной позиции. Оценочная функция учитывала такие вещи как число шашек на каждой стороне, число дамок, проходные шашки, наличие "рогаток" и т.д. Программа выбирала ход, основанный на минимаксной стратегии, то есть она делала ход, который максимизировал ценность позиции, предполагая, что противник пытается максимизировать ценность той же самой позиции со своей стороны. Веса оценочной функции подстраивались при игре со стороной, которая просчитывала позицию на большее число ходов и следовательно играла заведомо сильней. Кроме того веса функции подстраивались на основе партий сыгранных профессиональными шашистами, то есть при вводе позиции из справочника коэффициенты оценочной функции менялись так, чтобы программа выбирала ход сыгранный человеком в этой же позиции.

Самуэль также проектировал различные механизмы, чтобы его программа могла стать лучше. Например, то что он назвал зубрежкой (rote learning), программа помнила каждую позицию, которую уже играла, наряду с конечным результатом игры. Эта техника эффективно расширяла глубину поиска в каждом из этих положений. Более поздние программы Самуэля переоценивали веса оценочной функции, на основе вводимых играх профессионалов. Он также сделал, чтобы программа играла против себя как другой способ учиться. Со всей этой работой программа Самуэля достигла представительного любительского статуса, и была первой, чтобы играть в любую настольную игру на этом высоком уровне. Он продолжал разрабатывать программу игры в шашки до середины 1970-х. Его метод изучения через игры продолжался при длительной работе над шашками (который был полностью решен в 2007 компьютером, который исследовал все соответствующие положения), и в других играх, таких как шахматы.

Ссылки[править | править вики-текст]

  • Arthur, Samuel (1959-03-03). "Некоторые исследования в Машинном Обучении используя игру шашек". IBM Journal 3 (3): 210–229 [1]

См. также[править | править вики-текст]