Автоматизация выбора.
Норберт Винер "Творец и робот"
Таким образом, оценочная функция подвергается непрерывной переоценке, при которой более высокое значение этой функции присваивается позициям, характерным для выигранных партий, и меньшее значение — позициям, свойственным большей частью проигранным партиям. Игра должна продолжаться уже с новым значением оценочной функции, которая может быть определена различными способами, отличающимися лишь… Читать ещё >
Автоматизация выбора. Норберт Винер "Творец и робот" (реферат, курсовая, диплом, контрольная)
Опыт игры, накопленный человеком, представляет нам разнообразные способы выбора такого критерия. В шахматах (или шашках) обычно невыгодно терять свои фигуры (шашки) и, напротив, обычно выгодно брать фигуры (шашки) противника. Игрок, который сохраняет подвижность своих фигур, и право выбора ходов и в то же время держит под боем большое число полей на доске, обычно играет лучше своего противника, не придающего значения этим элементам игры.
Эти критерии хорошей игры сохраняют свою силу на протяжении всей партии, но есть и другие критерии, которые относятся к отдельным ее стадиям. В эндшпиле, когда на доске остается мало фигур, сближение с противником и взятие его фигур все более затрудняется. В дебютной стадии игры — и это более важный фактор в шахматах, чем в шашках, — фигуры расставлены так, что они лишены своей полной подвижности и силы. Вследствие этого требуется развитие фигур, позволяющее расширить их поле действия, необходимое как для нападения, так и для защиты. Далее, в шахматах, с их большим разнообразием фигур по сравнению с шашками, есть множество специальных критериев хорошей игры, важность которых доказана многовековым опытом.
Сочетая такие критерии (аддитивно или более сложным способом), можно для оценки очередного хода игрового автомата получить некоторый числовой показатель эффективности. Это может быть сделано до известной степени произвольно. Тогда машина, сравнив между собой показатели эффективности возможных очередных ходов, выберет ход, соответствующий наибольшему показателю. Это один из методов автоматизации выбора очередного хода.
Такая автоматизация выбора очередного хода в большинстве случаев не обязательно обеспечивает оптимальный выбор, но все же это какой-то выбор, и на его основе машина может продолжать игру. Для оценки такого способа механизации игры следует отрешиться от всех представлений о механизируемом объекте, используемом в известных нам технических устройствах, или от физического образа человека, соответствующего обычному игроку. К счастью, выполнить это нетрудно, так как именно это и делают шахматисты, играющие друг с другом по переписке.
При игре по переписке партнеры посылают свои ходы друг другу по почте, так что единственной связью между игроками служит письменный документ. Даже при таком способе игры опытный игрок вскоре вырабатывает определенные представления о личности своего противника, вернее, о его шахматной индивидуальности. Он узнает, тороплив или осторожен его противник, легко ли его провести, проницателен ли он и способен ли усвоить трюки своего противника или может быть снова и снова «пойман» при помощи той же самой элементарной стратегии. Все это узнается, я повторяю, не из какой-либо дополнительной информации, а в ходе самой игры.
С этой точки зрения любой игрок — будь то человек или машина, — пользующийся простым набором качественных признаков, избранных раз и навсегда, создает впечатление «жесткой» шахматной индивидуальности. Если вам удалось найти у такого игрока слабое место, то вы нашли это слабое место навсегда. Если вы разработали против него стратегию, она всегда окажется эффективной. Для выявления его техники достаточно сыграть с ним очень небольшое количество партий.
Все это относится к механическому игроку, который не обучается в ходе игры. Однако ничто не мешает ему научиться играть более разумно. С этой целью он должен сохранять в своей памяти записи прошлых игр. Затем в конце каждой игры или каждой серии игр определенного типа его механизм должен перестраиваться на совершенно иной образ действий.
При формировании показателя эффективности [оценочной функции] в него вводятся некоторые константы, которые можно выбирать различным образом. Так, например, соотношение констант, соответствующих относительной силе фигур, их подвижности и эквивалентному числу, может составлять 10:3:2 вместо 9:4:4. Новый способ применения регулируемой машины состоит в изучении проведенных игр, с тем чтобы, учитывая их исход, найти соответствующие им показатели эффективности [оценочные функции], отражающие динамику этих игр.
Таким образом, оценочная функция подвергается непрерывной переоценке, при которой более высокое значение этой функции присваивается позициям, характерным для выигранных партий, и меньшее значение — позициям, свойственным большей частью проигранным партиям. Игра должна продолжаться уже с новым значением оценочной функции, которая может быть определена различными способами, отличающимися лишь в деталях. В результате этого игровой автомат будет непрерывно преобразовываться в некую отличную от исходной машину в соответствии с историей развертывающейся игры. В этом случае, как для машины, так и для ее противника — человека будут иметь значение их прошлые опыт и успех.