Software Journal:
Theory and Applications

Подать статью

Вход Регистрация

Модели поведения разнотипных агентов в условиях конфликта

(Работа выполнена при поддержке РФФИ, грант № 15-01-05545-а)

В работе [1] авторами уже поднималась проблема взаимодействия агентов в многоагентной системе (МАС), рассматривались модели целеустремленного поведения агентов и анализировалось влияние этих моделей на устойчивость системы. От того, какую модель поведения выберет агент, зависит величина его выигрыша. Особое внимание при этом уделяется модели взаимодействия агентов в условиях конфликта. Межагентный конфликт интерпретируется как соревнование, в котором агенты стремятся достичь несовместимых состояний: каждый из них желает то, что может получить только один [1]. Основные причины конфликтов: ограниченность общих ресурсов, которые агенты вынуждены делить между собой; различия агентов в интересах, целях и представлениях, в манере поведения, обусловленной поведенческим типом; различия в количестве и сложности задач, поставленных перед агентами. При этом каждый из агентов обладает определенным поведенческим типом r, rÎR, отражающим предпочтения агента. Поведенческий тип является оценкой состояний, в которых пребывает агент при выполнении конкретной задачи; R – множество возможных предпочтений агента. В работе [2] были введены следующие семантические правила: агент является уклоняющимся, если rÎ(0; 0,5); агент называется компромиссным (сотрудничающим), если rÎ[0,5; 0,8], и агент будет принуждающим в случае rÎ(0,8; 1). Согласно результатам проведенного исследования, агенты компромиссного типа готовы идти на уступки при дележе ресурсов и склонны избегать конфликтных ситуаций. Агенты принуждающего типа обычно стремятся захватить как можно больше ресурсов у других агентов. Для уклоняющегося типа агента характерно то, что он полагается лишь на самого себя и предпочитает избегать любых взаимодействий с другими агентами. Тем не менее, конфликтные ситуации неизбежны, когда над решением задачи работают два агента и более. Как правило, инициаторами конфликтов являются агенты принуждающего типа, но в отдельных случаях спровоцировать конфликт могут и агенты других поведенческих типов. Конфликтная ситуация может возникнуть даже в случае работы одного агента, когда его начинают одолевать сомнения относительно правильности действий и поведения в различных условиях функционирования. Тогда объектом исследования становится внутриличностный конфликт. Утопией является сама мысль о возможности достижения абсолютно бесконфликтного состояния в МАС, когда агенты взаимодействуют в полной гармонии как друг с другом, так и с самими собой. Усилия по полному устранению конфликтов, как правило, не приводят к положительному результату. К тому же следует учитывать, что, кроме деструктивной функции, конфликты способны оказывать положительное влияние: определяются различные точки зрения, появляется дополнительная информация и т.п. Поэтому внимание следует сосредоточить на контроле и управлении конфликтами в МАС.

Постановка задачи

При построении модели поведения двух агентов в условиях конфликта авторы руководствовались следующими соображениями:

- каждый из агентов в МАС стремится наращивать свой ресурсный потенциал в пределах своих возможностей, даже если не является соперником для других агентов; такое стремление продиктовано логикой: нет ресурсов – нет жизни;

- конфликт может происходить как между агентами одного и того же поведенческого типа, так и между агентами разных типов;

- в конфликте каждый из агентов будет стремиться к увеличению своих ресурсов в зависимости от объема ресурсов, находящегося в распоряжении другого агента;

- темпы наращивания ресурсов сдерживают ограниченность их общего количества, затраты имеющихся ресурсов на приобретение новых ресурсов (затраты на обеспечение деятельности агента) и «усталость» агентов от борьбы за ресурсы;

- на изменение ресурсного потенциала агента независимо от поведенческого типа последнего может влиять окружающая среда, например, одни агенты могут поделиться с данным агентом своими ресурсами, а другие, наоборот, предпринять захватнические действия.

Модель поведения агентов в условиях конфликта – динамическая модель с дискретным временем t, , где T – момент завершения дележа ресурсов.

При моделировании введены следующие обозначения:

Rit, Rjt – уровни ресурсной обеспеченности агентов i и j, соответственно, в момент времени t, ;

hit, hjt – коэффициенты реакции агентов i и j на завладение частью ресурсов соперником соответственно, , ;

,  – коэффициенты, выражающие «усталость» соответствующих агентов от борьбы за ресурсы в условиях конфликта, , ;

,  – коэффициенты, выражающие понимание агентами необходимости в ресурсной обеспеченности, уровень «развитости инстинкта» в наращивании ресурсного потенциала, ;

,  – случайные компоненты, обусловленные влиянием окружающей среды на деятельность агентов, ; чем ближе их значения к -1, тем среда враждебнее; положительные значения свидетельствуют о благожелательности среды; значение, равное нулю, указывает на нейтральное отношение среды;

 – общий объем ресурсов в системе в момент времени t, определяемый по формуле

                             (1)

тогда сама модель поведения двух агентов при конфликте представима в следующем виде:

  .        (2)

Величины , , , , ,  зависят от поведенческого типа агентов и являются расчетными:

                        (3)

где k1(ri), k1(rj) – константы, определяемые психо-поведенческим типом соответствующего агента и показывающие желание агента вступать в борьбу за право обладания ресурсами;

                                        (4)

где k2(ri), k2(rj) – константы, также зависящие от типа агента; эмпирически установлено, что агенты, склонные к уклонению и соперничеству (агрессии), затрачивают больше энергии, нежели агенты компромиссного типа, поскольку последние получают дополнительную энергию от положительных эмоций, возникающих от урегулирования конфликтной ситуации путем компромисса; такой агент всегда получит хотя бы часть от запланированного выигрыша, а это лучше, чем ничего;

       (5)

где k3(ri), k3(rj) – константы, рассчитываемые, как средний тип (или среднее состояние) агента, то есть: , .

Процесс распределения ресурсов заканчивается, когда возникает ситуация

.                                                (6)

Задача состоит в анализе шести парных моделей взаимодействия агентов в условиях конфликта, что необходимо для получения ответов на следующие вопросы:

- насколько распределение ресурсов зависит от психо-поведенческого типа агента и при какой модели распределение происходит быстрее;

- каким образом меняется распределение ресурсов в зависимости от их объема на начальном этапе;

- каковы темпы распределения ресурсов при уменьшении общего объема ресурсов ;

- какая модель взаимодействия при заданных начальных условиях наиболее оптимальна, а именно – позволяет распределить ресурс  в полном объеме за приемлемое время.

Алгоритм моделирования

Построение моделей поведения разнотипных агентов в условиях конфликта проводится в несколько этапов:

  1. анализ психо-поведенческих типов взаимодействующих агентов и установление значений коэффициентов k1(ri), k1(rj), k2(ri), k2(rj), k3(ri), k3(rj) – (см. табл. 1);
  2. установление значений , , ,  и ;
  3. расчет величин , , , , ,  при  по формулам (3)–(5);
  4. расчет значений ,  по формулам (2) и определение остатка ресурсов  по формуле (1);
  5. проверка условия (6); если оно выполняется, то процесс останавливается;
  6. расчет кумулятивных итогов распределения по формулам ,
           (7)
  7. формирование итоговых таблиц (см. табл. 2 и 3);
  8. выводы и предложения по результатам моделирования;
  9. проведение численных экспериментов с изменением исходных данных;
  10. анализ результатов экспериментов и общие выводы.

Моделирование осуществимо в любой программной среде, поддерживающей составление таблиц и графиков и позволяющей осуществлять математические расчеты. Для простоты и наглядности авторами был выбран табличный процессор MS Excel 2012.

Демонстрационный пример

Согласно приведенному выше алгоритму, для указанных психо-поведенческих типов агентов были установлены значения коэффициентов k1(ri), k1(rj), k2(ri), k2(rj), k3(ri), k3(rj) (табл. 1).

Пусть T = 5, , , ,  и , то есть:

- на нулевом этапе имеется 100 % ресурса, который следует распределить за пять итераций;

- каждому из агентов на нулевом этапе назначается по 1 % ресурса;

- влияние внешних факторов отсутствует, то есть никто не помогает агентам, но никто и не препятствует им.

Кроме того, рассматривается вариант, когда ресурс не восполняется. Считается, что данного количества ресурса должно хватить для решения поставленной задачи. В условиях невосполнимости ресурса, как правило, конфликт усиливается. Поэтому одним из мероприятий, позволяющих свести межагентный конфликт к минимуму, является пополнение запаса ресурсов. Однако с экономической точки зрения такое мероприятие не всегда возможно.

Этапы 3, 4 и 6 алгоритма предполагают формирование расчетных таблиц и построение графиков по кумулятивным итогам (рис. 1, 2). На каждом из графиков наивысшая точка указывает на полное распределение ресурсов с созданием определенного дефицита в силу условий конфликта. Поэтому за момент окончания распределения можно принять предыдущий шаг.

На рисунке 1а показано взаимодействие агентов уклоняющегося типа, на рисунке 1b – взаимодействие агентов компромиссного типа и на рисунке 1с – поведение при разделении ресурса между агентами принуждающего типа.

Как видно из рисунка 1, наиболее близко к выполнению условия распределения ресурса поведение агентов компромиссного типа. На четвертой итерации у них остается 37 % нераспределенного ресурса, а при сохранении конфликта на пятой итерации возникает дефицит ресурсов в размере 26 %. Поэтому даже агенты компромиссного типа в условиях конфликта не могут действовать эффективно.

На рисунке 2d отражено поведение агентов уклоняющегося (уровень ресурсов агента i) и компромиссного (уровень ресурсов агента j) типов, на рисунке 2e – взаимодействие агентов уклоняющегося (уровень ресурсов агента i) и принуждающего (уровень ресурсов агента j) типов, на рисунке 2f – взаимодействие агентов компромиссного (уровень ресурсов агента i) и принуждающего (уровень ресурсов агента j) типов.

Из представленных на рисунке 2 моделей поведения наилучшей моделью является 2f.

В таблице 2 представлена информация о том, на каком шаге заканчивается распределение ресурсов между агентами, получаемое при выполнении условия (6).

Как видно из таблицы 2, время распределения ресурсов, наиболее соответствующее заданному условию T = 5, равно четырем итерациям. Это характерно для моделей взаимодействия «уклоняющийся « компромиссный» (2d)) и «компромиссный « принуждающий» (2f)). Таким образом, подтверждается гипотеза о некоторой конструктивной стороне конфликта: переговоры между агентами разных типов, одним из которых является компромиссный, расширяют поле деятельности агентов; дают им возможность договориться и приблизиться к выполнению поставленных условий. Все остальные модели взаимодействия признаются неэффективными. В моделях 1b, 2e и 1c распределение ресурса происходит слишком быстро, и агенты не вникают в суть поставленной задачи из-за противоборства; в модели 1a ресурс распределяется слишком медленно, поэтому выполнение задачи такими агентами затягивается.

В таблице 3 показано, какое количество ресурса осталось нераспределенным в момент T.

Наилучший результат распределения получен в модели 2f, поскольку в ней осталось лишь 7 % нераспределенного ресурса на пятой итерации распределения. Остальные значения показывают, что агентам следует изменить свои стратегии поведения, так как в противном случае они будут испытывать существенный дефицит ресурса, что не позволит им выполнить поставленную задачу за отведенное время. Модель 2f, хотя и является оптимальной из всех представленных моделей, но тоже не совершенна.

На изменение стратегии поведения агентов и на сведение конфликта к минимуму могут оказать влияние следующие мероприятия:

- если возможно, обеспечение пополнения ресурсного запаса;

- оказание помощи агентам извне, например, предоставление возможности другим агентам делиться с рассматриваемыми агентами своими ресурсами;

- организация подбора таких агентов, которые смогут достаточно эффективно проявить себя, работая в паре, несмотря на возможность возникновения между ними конфликтных ситуаций.

Так, например, при тех же условиях оказание помощи i-му агенту только на первой итерации в размере 1 0, 01 i e= (рис. 3а) дает возможность обеспечить полное распределение ресурса (100 %), но уже за восемь итераций.

Теперь лучшей моделью признается модель 3d, когда помощь оказывается агенту уклоняющегося типа. Помощь, оказываемая агенту компромиссного типа в модели 3f, вызывает негативные эмоции у агента принуждающего типа, что только усугубляет конфликт.

Дальнейшее проведение численных экспериментов показало, что следует очень внимательно относиться к первоначальному распределению ресурсов между агентами и прежде, чем оказывать помощь кому-либо из них, проанализировать необходимость этого. Вполне возможно, что результатом станет ситуация: «Хотели как лучше, а получилось как всегда!»

Дополнительно проводится анализ зависимости «усталости» агентов от их психо-поведенческого типа, то есть проверяется выполнение условия (8):

,   (8)

где   – оценка усталости агентов от конфликта;

 – оценка реакции агентов на действия друг друга.

Период, на протяжении которого выполняется неравенство (8), свидетельствует об активной фазе конфликта. На рисунке 4 изображены активные фазы конфликта между агентами во всех рассматриваемых моделях.

Графики на рисунке 4 соответствуют моделям поведения агентов при дележе ресурсов, представленным на рисунке 1 и 2. Очевидно, что наибольшую «усталость» испытывают агенты принуждающего типа (рис. 4с), наименьшую – агенты уклоняющегося типа (рис. 4а). Для остальных моделей поведения характерно проведение переговоров, поэтому пиковая точка «усталости» находится примерно на одном уровне.

В моделях, представленных на рисунке 3, графики данной зависимости немного изменились (рис. 5).

Теперь наименьшая усталость наблюдается в моделях а) и d). Исходя из результатов моделирования, приведенных выше, при оказании помощи агенту уклоняющегося типа в размере 1 % на первой итерации модель d) признается наилучшей.

В заключение отметим следующее. Поскольку в данном исследовании агент воспринимается как интеллектуальная антропоморфная сущность, для которой характерно наличие ментальных свойств, описание парных моделей поведения агентов в условиях конфликта основано на гипотезе о реализации агентами стилей поведения, предложенных американскими учеными К. Томасом и Р. Килменном [3, 4]. Они выделили пять основных стилей поведения в конфликтной ситуации: приспособление (уступчивость), уклонение, конкуренция (противоборство), сотрудничество и компромисс. При этом классификационными признаками являются степень реализации агентом собственных интересов и достижения своих целей, а также степень, в которой учитываются и реализуются интересы соперника. Стратегии уклонения и уступчивости характерны для уклоняющегося типа агентов, агенты компромиссного типа могут придерживаться как стратегии приспособления, так и стратегии компромисса. Для агентов принуждающего типа наиболее типична стратегия противоборства. Из результатов моделирования следует, что выигрыш обоим агентам может принести только одна стратегия – сотрудничество.

Литература

  1. Мутовкина Н.Ю., В.Н. Кузнецов, А.Ю. Клюшин. Влияние целеустремленного поведения агентов на устойчивость многоагентной системы // Системы управления и информационные технологии. 2014. № 2 (56). С. 43–48.
  2. Мутовкина Н.Ю., А.Ю. Клюшин, В.Н. Кузнецов. Семантическое определение типа агента в многоагентной системе. Проблема межагентного взаимодействия // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2013): матер. III Междунар. науч.-технич. конф. (21-23 февраля 2013 г.): сб. тр. Минск: Изд-во БГУИР, 2013. С. 309–316
  3. Kilmann R.H. Thomas K.W. Interpersonal conflict-handling behavior as reflections of jungian personality dimensions. Psychological Reports, 1975, vol. 37, no. 3, pp. 971–980. URL: www.kilmanndiagnostics.com (дата обращения: 19.08.2015).
  4. Kilmann R.H., Thomas K.W. Developing a forced-choice measure of conflict-handling behavior: the “mode” instrument. Educational and Psychological Measurement, July 1977, vol. 37, no. 2, pp. 309–325. URL: www.kilmanndiagnostics.com (дата обращения: 19.08.2015).

Комментарии

Комментарии отсутствуют