Начальные шаги моделирования
Где FL, t, FL, t-1 — факторы потребности, ведущей в такты времени t и t-1, Wt и Wt-1 — веса правил, примененных в такты t и t-1, б — параметр скорости обучения, г — дисконтный фактор. После выполнения цепочки действий «подготовка к размножению», «размножение» агент рождал потомка. Выполняя действие «оборона», агент защищался от активного хищника. Рис. 1. Зависимость факторов FF, FS и FR… Читать ещё >
Начальные шаги моделирования (реферат, курсовая, диплом, контрольная)
Модель автономных агентов с естественными потребностями. В [12] построена и исследована компьютерная модель автономных агентов, обладающих естественными для живых организмов потребностями: питание, безопасность и размножение. Потребностям агента соответствовали три фактора: питания (FF), безопасности (FS) и размножения (FR). Для каждого фактора имелся порог (TF, TS, TR), при превышении фактором которого удовлетворялась соответствующая потребность.
Между потребностями вводилась следующая иерархия: 1) пищевая потребность (наиболее приоритетна), 2) потребность безопасности, 3) потребность размножения (наименее приоритетна). Потребность считалась ведущей, если она была наиболее приоритетной из всех потребностей, для которых фактор потребности меньше соответствующего ему порога.
Рядом с агентом имелся хищник, активность которого периодически менялась; защищаясь от хищника, агент мог обеспечивать свою безопасность.
Система управления агента была основана на наборе правил вида: Sk > Ak (в ситуации Sk нужно выполнить действие Ak). Веса правил Wk настраивались методом обучения с подкреплением [13]. Ситуация Sk определялась активностью хищника рядом с агентом, предыдущим действием агента и ведущей потребностью. Каждый такт времени агент мог выполнять одно из следующих действий Ak: 1) поиск пищи, 2) питание, 3) подготовка к размножению, 4) размножение, 5) оборона, 6) покой. Агент имел ресурс R, который уменьшался при выполнении действий и увеличивался при питании. Активный хищник также мог отнимать у агента значительный ресурс.
После выполнения цепочки действий «подготовка к размножению», «размножение» агент рождал потомка. Выполняя действие «оборона», агент защищался от активного хищника.
Преимущественно выполнялись действия, соответствующие максимальным весам правил Wk. Факторы FF, FS, FR увеличивались при выполнении действий, направленных на удовлетворение ведущих потребностей. Веса правил Sk > Ak менялись следующим образом:
ДWt-1 = б (FL, t — FL, t-1 + гWt — Wt-1) ,.
где FL, t, FL, t-1 — факторы потребности, ведущей в такты времени t и t-1, Wt и Wt-1 — веса правил, примененных в такты t и t-1, б — параметр скорости обучения, г — дисконтный фактор.
Результаты компьютерного моделирования иллюстрируются рис. 1, на котором показана типичная динамика факторов FF, FS и FR. Видно, что при достаточно большом времени все три фактора достигают порога, т. е. все потребности удовлетворяются. Формируется цикличность поведения агента, характерный цикл показан участком «а». В цикле агент сначала накапливает внутренний ресурс, затем его действия направлены на максимизацию безопасности, а когда обе потребности (пищевая и потребность безопасности) удовлетворены, агент размножается.
Рис. 1. Зависимость факторов FF, FS и FR, соответствующих потребностям агента, от времени t. Горизонтальная линия показывает порог, соответствующий всем трем факторам.
Таким образом, исследована модель автономных агентов, обладающих несколькими потребностями (пункт, А контуров программы). Показано, что происходит формирование циклов поведения, в которых последовательно удовлетворяются потребности питания, безопасности и размножения.
Модель формирования обобщенных эвристик и простых обобщенных образов. Формирование обобщенных эвристик и простых обобщенных образов (пункт Б) в процессе обучения агентов при поиске агентами пищи в двумерной клеточной среде было продемонстрировано в модели [14], хотя пока эту модель целесообразно рассматривать как определенный начальный этап более полноценных исследований.