prepod

Путь к Файлу: /ВЕА для заочників / Лекції ВЕА / Лекція 3.3 прав.doc

Ознакомиться или скачать весь учебный материал данного пользователя
Скачиваний:   0
Пользователь:   prepod
Добавлен:   29.12.2015
Размер:   288.5 КБ
СКАЧАТЬ

Лекція 3.3. Методи обгрунтування  воєнно-економічних рішень в умовах невизначенності

Введення

1. Основні поняття та визначення теорії гри.

2. Постановка та рішення задачи обгрунтування рішень в умовах невизначенності.

Закінчення

 

Введення

При решении практических задач в области экономики и военного дела приходится сталкиваться  с проблемой принятия решений в условиях неопределенности. Неопределенными могут быть как сознательные действия участников конфликтных ситуаций, так и условия проведения мероприятий. Примерами неопределенности первого рода является замысел противника в предстоящем бою или операции, действия конкурента на рынке товаров и услуг и др. Примерами неопределенности второго рода являются предположительное состояние экономики, погодные условия и др.

Для определения путей достижения наилучшего результата каждым из участников конфликтной ситуации или получения рекомендаций для принятия решений в условиях неопределенности используется аппарат теории игр.

Каждая непосредственно взятая из практики конфликтная ситуация очень сложна, и ее анализ затруднен наличием многих, часто несущественных факторов. Чтобы сделать возможным анализ ситуации, прибегают к построению упрощенной модели.

 Игра — это модель конфликтной ситуации. Стороны, участвующие в конфликте, именуются игроками, исход конфликта — выигрышем одной стороны или проигрышем другой.

 

1.Основні поняття та визначення теорії гри

Анализ конфликтной ситуации невозможен без четко сформулированных правил игры, т. е. системы условий, которые определяют возможные варианты действий игроков, объем информации каждой стороны о поведении другой, результат (исход) игры и количество сторон, участвующих в конфликтной ситуации.

Под вариантами действий игроков понимаются различные способы достижения цели. Например, при планировании боевых действий рассматриваются различные направления главного удара, способы сосредоточения сил и средств; при разработке планов финансирования воинских частей могут быть рассмотрены различные варианты распределения денежных средств.

Результат (исход) игры в каждом конкретном случае имеет свое смысловое содержание. При-анаяизе боевых действий результатами могут быть вероятность поражения целей противника, потери обеих сторон в живой силе и технике и др. При анализе экономических процессов результатом может быть, например, доход или убыток предприятия.

Различают игры с нулевой суммой (если один игрок выигрывает ровно столько, сколько проигрывает другой) и игры с ненулевой суммой (например, лотерея, в которой за право участия вносится определенный взнос, при этом организаторы лотереи всегда имеют выигрыш, а участники, имея шанс получить большой выигрыш, в сумме получают выигрыш меньший, чем размер их предварительного взноса).

В зависимости от количества сторон, участвующих в конфликте, различают игры парные и коалиционные. Наибольшее распространение получили парные игры, рассматриваемые в данной главе.

Одним из основных понятий теории игр является «стратегия», которая означает любой законченный план действий. Если игрок, вступая в конфликтную ситуацию, имеет исчерпывающий план своих действий в любой возможной ситуации, то это означает, что он выбрал стратегию. Таким образом, стратегия игрока — это однозначное определение его выбора в каждой возможной ситуации, в которой ему необходимо сделать ход.

Рассмотрим парную игру с нулевой суммой. Обозначим участников конфликта А и В, их выигрыш и проигрыш соответственно а и в. Так как в игре с нулевой суммой а + в = О, то при анализе такой игры достаточно рассматривать только выигрыш одной стороны. Стратегии игроков обозначим Аi (i = 1,т) и Bj (j =1,n).

Каждая игра характеризуется числом стратегий игроков. Если один игрок имеет т, а другой п стратегий, то такую игру принято называть т на п и обозначать т х п.

Стратегия, которая при многократном повторении игры обеспечивает игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш), называется оптимальной. При выборе оптимальной стратегии всегда следует исходить из того, что противник по меньшей мере так же разумен, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

Рассмотрим игру m x n со стратегиями Аь А2, ..., Аi, ..., Аm стороны А и стратегиями В1; В2, ..., Вj,..., Вn стороны В. Если каждая сторона выбрала определенную стратегию (сторона А выбрала А„ сторона В — В), тогда однозначно определяется исход игры — выигрыш стороны А, который обозначим аij. Элемент аij имеет специальное название — платеж. Платеж аij может иметь как положительный, так и отрицательный знак; (прибыль со знаком «плюс», убыток со знаком «минус»). Платеж — это мера эффекта для игрока. В военных играх платежи определяются в виде вероятностей поражения цели, стоимости выполнения огневой задачи и т.п. В играх, отображающих экономические ситуации, платеж почта всегда измеряется в стоимостном выражении (прибыль, себестоимость, штраф и т.д.)- В некоторых случаях выигрыш выражается в баллах или очках.

Если известны значения аij для каждой пары стратегий сторон, то можно записать их в виде таблицы (матрицы), строки которой соответствуют стратегиям игрока А, а столбцы — стратегиям игрока В. Такая таблица называется платежной матрицей или матрицей игры.

Переход от реальных конфликтных ситуаций к записи в виде матрицы игры является одним из самых сложных этапов решения задачи. Рассмотрим простейшие примеры формализации конфликтных ситуаций.

Пример 1. Наши войска (сторона А) имеют два типа противотанковых средств: а1 и А2, противник (сторона В) может использовать в наступлении два типа танков: B1 и В2. Задача стороны А—поразить танки противника, задача противника—сохранить их. Противотанковым средством А1 танки В1 и В2 поражаются с вероятностями 0,4 и 0,6; противотанковым средством А2 — с вероятностями 0,8 и 0,5. Требуется построить матрицу игры.

Решение. Используя условия примера, построим матрицу игры (табл..1)

                                                                                                  Таблица 1

 

Аi

Вj

В1

В2

А1

0,4

0,6

А2

0,8

0,5

Здесь в качестве платежей выступают вероятности поражения различных танков различными противотанковыми средствами.

 

2. Постановка та рішення задачи обгрунтування рішень в умовах невизначенності

 

2.1.Постановка задачи обгрунтування рішень в умовах невизначенності

Игры с разумным противником широко распространены в военном деле. Методы их решения наиболее глубоко разработаны и лежат в основе многих других игровых постановок задач. Игра с разумным противником полностью определяется платежной матрицей, и, следовательно, чтобы задать игру, достаточно построить ее платежную матрицу. Дальнейшей задачей является анализ платежей сторон А и В по каждой стратегии и выбор наилучшей из них.

Рассмотрим сущность простейшего анализа платежной матрицы. Игрок А для определения наилучшей среди своих стратегий А12,...,Аi,...,Аm последовательно рассматривает каждую из них. Выбирая стратегию Аi игрок должен рассчитывать, что противник В ответит на нее той из своих стратегий Вj, для которой выигрыш игрока А минимален. Принимая осторожную стратегию, найдем минимальный из платежей аij в каждой i-й строке по всем  j-м столбцам и обозначим его    аij = min аij   . где min — минимальное значение платежа аij при всех возможных  j-х стратегиях стороны В. Для окончательного выбора своей стратегии игрок А при осторожном поведении должен из возможных минимальных выигрышей выбрать максимальный. Обозначим этот выигрыш через

аi = maxj min аij.                                                             (1)

Данное выражение читается так: максимальное по всем строкам (своим вариантам действий) из минимальных по всем столбцам (способам действий противника) значение аij .

Величина а называется нижней ценой игры, иначе — максимином. Это гарантированный (нижний предел) выигрыш игрока А независимо от того, какую стратегию выберет игрок В.

Рассуждая за игрока В, следует рассчитывать на худшие условия и поэтому выбирать максимальное значение проигрыша по каждому столбцу. Обозначим его через bj . Выпишем его значения в дополнительной строке. Из всех этих значений выберем минимальное

b = min max аij.                                                             (2)

             j         i    

Величина b называется верхней ценой игры или минимаксом. Читается это выражение так: минимальное по всем столбцам (способам действий стороны В) из максимальных по всем строкам (способам действий стороны А) значение аij .   Придерживаясь своей максиминной стратегии, игрок А гарантирует себе выигрыш не меньший, чем нижняя цена игры при любых действиях противника. В свою очередь, игрок В, применяя свою минимаксную стратегию, гарантирует себе проигрыш не больший, чем верхняя цена игры при любых действиях стороны А.

Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной или минимаксной), является в теории игр основным и называется принципом мшимакса. Он вытекает из предположения о разумности каждого игрока, стремящегося к достижению цели, противоположной цели противника.

Пример 2. По условиям примера 1 необходимо дать рекомендации по рациональному способу действий сторонам А и В.

Решение. Выберем в каждой строке минимальную вероятность и выпишем ее в столбец аi, (табл.2): min (0,4; 0,6) = 0,4; min (0,8; 0,5) = 0,5.

Таблица 2

 

Аi

Вj

аi

В1

В2

А1

0,4

0,6

0,4

А2

0,8

0,5

0,5

bj

0,8

0,6

 

Анализируя поочередно все стратегии Вj, найдем максимальные проигрыши в каждом столбце и выпишем их в строку для Вj. Теперь можно найти нижнюю и верхнюю цены игры:

а = max min аij= max(0,4,0,5) = 0,5,                                                            

                                                                                     i        j

b = min max аij = min (0,8;0,6) = 0,6.

                                                                                                   j         i  

Поскольку а = b = 0,6, то игра имеет седловую точку, а игроки имеют свои гарантированные стратегии: сторона А — стратегию А2, сторона В — стратегию В2.

Действительно, стороне А невыгодно отходить от стратегии А2, иначе она может выиграть меньше, если противнику удастся разгадать замысел стороны А. При использовании стороной А стратегии а! противник может использовать танки типа Bj или В2 и вероятность их поражения уменьшится до 0,4 или 0,5. Аналогичная картина произойдет при переходе к стратегии А3.

При первоначальном анализе платежной матрицы следует прежде всего установить, нельзя ли уменьшить количество стратегий за счет исключения заведомо невыгодных или дублирующих. После исключения таковых следует проверить наличие седловой точки. Если седловая точка имеется, то решение найдено.

Упрощение игровых матриц за счет исключения дублирующих и заведомо невыгодных стратегий производится в такой последовательности. Каждая строка матрицы сравнивается с другими по размеру платежей во всех столбцах. Если обнаруживаются две стратегии и более, где платежи одинаковы во всех столбцах, то оставляется только одна из них (любая). Если обнаруживаются стратегии, в которых платежи хуже, чем в других, то заведомо невыгодные также исключаются. Такая процедура проделывается как для стороны А, так и для стороны В.

Пример 4. Упростить матрицу (табл.4), исключив дублирующие и заведомо невыгодные стратегии. Платежами являются вероятности успешного выполнения задачи.

Таблица 4

 

Аi

Вj

В1

В2

В3

В4

А1

0,2

0,3

0.5

0,3

А2

0,1

0,3

0.4

0,2

А3

0,2

0,3

0.5

0.3

А4

0.5

0.3

0.4

0.1

Из матрицы видно, что стратегия А3 в точности повторяет (дублирует) стратегию А1, поэтому одну из них, например А3, можно вычеркнуть. Сравнивая стратегии А1 и А2, можно установить, что стратегия А2 заведомо невыгодна, так как она хуже, чем А1 при стратегиях противника B1 (0,2>0,1), В3 (0,5>0,4) и В4(0,3>0,2) и не лучше ее при В2 (0,3 = 0,3).

Сравнение стратегий A1 и A4 не позволяет отдать предпочтение ни одной из них, так как выигрыш стороны А при использовании стратегии A4 выше, если противник использует В1 (0,5>0,2), но ниже, если сторона В применит стратегии В3 и В4 (0,4<0,5; 0,1<0,3). Поэтому А1 и A4 следует оставить для дальнейшего анализа. Вычеркивая стратегии А2 и А3, приведем матрицу к более простому виду (табл. 5).

Таблица 5

 

Аi

Вj

В1

В2

В3

В4

А1

0,2

0,3

0.5

0,3

А4

0.5

0.3

0.4

0.1

Теперь рассмотрим стратегии стороны В, сравнивая их попарно. При этом следует иметь в виду, что в данной задаче стороне А выгодно максимизировать свой результат и мы отбрасывали стратегии с меньшими платежами. Анализируя стратегии стороны В, следует исходить из ее желания уменьшить потери, а значит, исключить те стратегии, которые имеют большие платежи.

Сравнение стратегии В4 со стратегиями В2 и В3 показывает, что для стороны В они обе хуже и могут быть исключены. Тогда матрица примет вид табл.6.

                                                                                                                         Таблица 6

 

Аi

Вj

В1

В4

А1

0,2

0,3

А4

0.5

0.1

Если в результате упрощения матрицы хотя бы у одной из сторон останется только одна стратегия, то решение этой задачи очевидно - сторона, имеющая одну стратегию, не имеет выбора.

После упрощения матрицы следует проверить наличие седловой точки. В полученной матрице (табл.6) седловой точки нет, так как для нее а = 0,2,   b = 0,3.

На практике игры с седловой точкой встречаются редко. Более типичными являются игры, в которых нижняя и верхняя цены игры различны, т.е. а Лекція 3.3 прав b. Это означает, что нельзя надеяться на выигрыш, больший, чем верхняя цена игры b, но можно быть уверенным в получении выигрыша не меньше нижней цены игры а.

Поиск наилучшего решения состоит в случайном чередовании чистых стратегий при многократном повторении игры, т.е. нужно искать решение игры в так называемых смешанных стратегиях. Смешанной стратегией игрока называется полный набор вероятностей применения его чистых стратегий. Каждая игра в этом случае имеет цену Ц, которая лежит между верхней и нижней ценой игры: аЛекція 3.3 правЦЛекція 3.3 правb.

Вероятности применения в смешанных стратегиях чистых стратегий игрока А обозначим через рі а для игрока В — через qj. Чистые стратегии, для которых piЛекція 3.3 прав 0; qjЛекція 3.3 прав 0, называются активными. Всякая чистая стратегия есть частный случай смешанной стратегии. Действительно, если в смешанной стратегии какая-либо i-я стратегия применяется с вероятностью, равной единице (рi =1), то все остальные стратегии не применяются. Смешанную стратегию игрока А будем обозначать SA1, р2,..., рт), где р1, p2, ...,рт — вероятности или частоты, с которыми применяются стратегии А1; А2, ..., Ат. Причем pl+p2+...+pm=1. Аналогично для игрока В SB(q1, q2,...,qт)  при ql+q2+...+qm=1.

Решением игры в смешанных стратегиях называется пара оптимальных стратегий S*A, S*В, обладающих следующими свойствами: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. В теории игр доказано, что каждая конечная игра имеет по крайней мере одно решение, возможно, в области смешанных стратегий.

2.2  Методи  рішення задач в умовах невизначенності

 Решение всякой игры следует начинать с упрощения матрицы в целях уменьшения ее размерности m x n. Затем необходимо проверить наличие седловой точки. В тех случаях, когда седловой точки нет, но размерность игровой матрицы удалось свести до 2x2, найти решение такой матрицы в смешанных стратегиях достаточно просто.

Выше  вероятности применения стратегий стороной А обозначены через р1 и р2, стороной В — через q1 и q2, сумма этих вероятностей равна единице, а цена игры находится в интервале а<Ц <b. Эти условия можно записать в виде следующих соотношений:

Лекція 3.3 прав

Лекція 3.3 прав

В более подробном курсе теории игр доказано, что если игра 2x2 не имеет седловой точки и решения в чистых стратегиях, то эти неравенства должны превращаться в равенства соответственно:

Лекція 3.3 прав(3)

Лекція 3.3 прав(4)

Сущность решения задачи состоит в том, что при данных платежах необходимо подобрать такие значения p1 и р2 , которые удовлетворяют условиям равенств (3) и (4), а р1 + р2 = 1.

Найдем аналитическое выражение для р1 , р2 и Ц. В соотношениях равенств (3) и (4) правые части одинаковы, следовательно,

Лекція 3.3 прав

Учитывая, что p1+p2 = 1, найдем p* 1 и р* 2 — оптимальные частости стратегий стороны  А:

                                                                                     (5)

Лекція 3.3 прав

                                                                                                                            (6)

Аналогично можно найти формулы для q*1 и q*2:

                                                                                                                         (7)

Лекція 3.3 прав

                                                                                                                              (8)

Зная р1 и р2  легко определить Ц из равенств (4):

Лекція 3.3 прав

                                                                                                                              (9)

Пример 5. Найти решение игровой матрицы (табл.6).

Решение. Воспользовавшись формулами (5), (6) и (9), находим SA(p1* ,p2*), SB(q1*, q2*) и Ц:

Лекція 3.3 прав

Таким образом, если сторона А будет использовать свои противотанковые средства a1 и А2 в соотношении 4:1, то средняя вероятность уничтожения танка противника будет равна 0,26. Значит, решение для стороны А можно записать: SA* (0,8; 0,2).

Для стороны В оптимальное решение находим по формулам (7) и (8):

Лекція 3.3 прав

Значит, сторона В должна использовать танки типа b1 и В2 в соотношении 2 : 3. Решение для стороны В: SB*(0,4;0,6).

 

2.3. Общий случай решения военно-экономических задач в условиях неопределенности

Реальные задачи не всегда удается свести к игровой матрице размером 2x2. Например, фактический типаж образцов (танки, орудия, самолеты) в системе оружия почти всегда больше двух. В этом случае необходимо найти решение для матрицы размером m х п, т.е. найти две оптимальные стратегии игроков А и В:

Лекція 3.3 прав

Эта стратегия должна обеспечить игроку А выигрыш не меньший, чем цена игры Ц.

Используя матрицу игры, можно записать:

Лекція 3.3 прав

Разделив обе части неравенства на Ц и введя обозначения

Лекція 3.3 прав

можно записать:

 

Лекція 3.3 прав                          (10)

     Лекція 3.3 прав                 (11)

Если сторона А стремится сделать свой гарантированный выигрыш максимальным, то для этого правая часть выражения (11) должна быть минимальной. Таким образом, решение игры свелось к следующей математической задаче: определить неотрицательные значения х1 + х2 + ... + хт так, чтобы они удовлетворяли линейным ограничениям (10) и при этом их линейная функция L = x1 + х2 +...+ хт обращалась в минимум. Это типичная задача линейного программирования, которая может быть легко решена симплекс-методом.

В тех случаях, когда сторона А стремится минимизировать свой выигрыш (если аi j например, выражает стоимость выполнения задачи или себестоимость производимой продукции), правая часть выражения (11) должна быть максимизирована

Лекція 3.3 прав            (12)

а система (10) примет вид

Лекція 3.3 прав           (13)

Для стороны В в случае необходимости минимизации ущерба решение будет аналогичным, но условия ограничения будут иметь вид

Лекція 3.3 прав

а целевая функция максимизируется, если L' = y1 + у2 +...+уп,, или минимизируется, если

L" = -у12 -...-уn.

Пример 6. Сторона А располагает тремя образцами вооружения А1, А2, А3 для поражения трех объектов стороны В: В12 и В3. Стоимость выполнения задачи по поражению каждого объекта каждым образцом вооружения в условных единицах представлена в табл. 7 Наши соотношение образцов по количеству и опреде лить стоимость выполнения задачи.

Решение. Предварительный анализ табл. 7 показывает, что в матрице игры нет доминирующих и дублирующих стратегий, а также нет седловой точки.

                                 Таблица 7

 

Аi

Вj

 

в,

1           i           1

 

 

B1

В2

В3

ai

А2    аз

10,45       8,60      8,34

8,21      9,44      8,32

8,34     9,28    10,28

Для решения задачи используем систему (13), так как по смыслу задачи требуется найти минимальное значение цены игры для стороны А. Обозначим доли средств А1 2, А3 соответственно через р12 и р3.

Тогда систему (13) можно записать так:

Лекція 3.3 прав

 

Заменив Лекція 3.3 прав на х1  , Лекція 3.3 прав на х2, Лекція 3.3 прав на х3, перепишем ограничения в виде

Лекція 3.3 прав

Преобразуем ограничения, введя дополнительные переменные для решения задачи симплекс-методом:

Лекція 3.3 прав

Так как цену игры в данной задаче необходимо минимизировать, то целевая функция L должна стремиться к максимуму:

Лекція 3.3 прав

Лекція 3.3 прав

Поскольку при решении задач симплекс-методом целевая функция должна минимизироваться, заменим L на L' :

В стандартной форме записи целевая функция будет иметь вид:

L' =0 - (х, + х2 + x3).

Исходная симплекс-таблица представлена в табл..8, а оптимальное решение задачи в табл..9.

                                     Таблица 8

БП

СЧ

x1

х2

х3

У1      У2       У3

L

1                1                 1               0

10,45           8,21           8,39           1

8.60          9,44          9,28           1

8,34       8,32     10,28       1

Таблица.9

БП

СЧ        СЧ

У1

у2

   Уз

X1        X2       Xз       L

0,039       0,029       0,042       0,11

 

 

 

-0,0746

 

 

 

-,0775

 

 

 

-0,0036

 

Таким образом, 

Лекція 3.3 прав.

Лекція 3.3 прав

Следовательно, соотношение образцов А1 , А2 и А3 должно быть следующим: 35%; 21% и 38%. При этом стоимость выполнения задачи будет минимальной, равной цене игры Ц, и составит 9,09 условных единиц (у е ).

В условиях неопределенности сторона А вынуждена рассматривать варианты поражения трех объектов противника тремя своими средствами. Это обусловлено недостатком информации об объектах противника.

Задача может быть сформулирована так: какое средство лучше использовать, если разведкой установлено, что для достижения поставленной цели достаточно поразить объект В2. Очевидно, что сторона А выберет средство А1, так как стоимость выполнения задачи этим средством является минимальной и составляй 8,21 у.е. Разница в стоимости выполнения задачи по поражению объекта противника в условиях неопределенности и в условиях полной информации может быть интерпретирована как экономический эффект от проведения разведки. В данном примере эффект составил 9,09 - 8,21 = 0,88 у.е.

2.4. Рішення економічних задач в термінах гри з „природою”

В предыдущих задачах данной главы предполагалось, что стороне А противостоит разумный противник В, который всякий раз пытается выбрать решения, наименее выгодные для стороны А.

Но очень часто неопределенность связана с недостаточной осведомленностью об условиях, в которых будет проводиться мероприятие (погода в некотором районе, покупательский спрос на определенного вида продукцию, загруженность транспорта, радиационная обстановка и т. д.). Такие условия зависят не от сознательно противостоящего нам противника, а от объективной действительности, называемой «природой».

«Природа» рассматривается как сторона, поведение которой неизвестно и не содержит признаков сознательного противодействия нашим планам.

Принятие решения в этом случае начинается с формирования возможных способов действий, т. е. стратегий игрока, и возможных состояний обстановки (состояний «природы»). Затем необходимо оценить эффект каждого действия игрока при всех состояниях «природы» и составить платежную матрицу. После построения матрицы решение игры сводится к нахождению лучшей стратегии игрока А по выбранному критерию.

Рассмотрим решение экономической задачи в общем виде. Сторона А имеет т возможных стратегий: А1, А2, ..., Аm. Все возможные условия обстановки могут быть описаны п состояниями: П1 , П2, ..., Пn. Выигрыши ai j при каждом сочетании стратегий Аi и состояний «природы» Пj заданы матрицей (табл. 10).

Таблица 10

Ai

П1

П2

Пj

...

Пn

ai       А2

Am

а11               а21

am1

а12             a22

am2

...              

...

а1j             

а2 j 

amj

…                ...

...

aln

        а2n

amn

Требуется выбрать наилучшую (в смысле выбранного критерия) стратегию стороны А. Решение такого рода задач отыскивается, как правило, в чистых стратегиях.

На первый взгляд кажется, что эта задача проще, чем задача противоборства с разумным противником. Однако здесь игроку А труднее принять решение, так как противоположность интересов в борьбе с разумным противником и предположение, что он всякий раз принимает наивыгоднейшее для себя решение, как бы снимают часть неопределенности.

Самым простым случаем принятия решения в игре с «природой» является такой, когда имеются дублирующие и доминирующие стратегии. Если даже в результате упрощения матрицы не удается прийти к единственному решению, т. е. оставить лишь одну стратегию, то исключение заведомо невыгодных стратегий значительно упрощает принятие решения.

Одна из важных особенностей игры с «природой» состоит в том, что при анализе матрицы нельзя исключить ни одного из состояний «природы». Другая особенность таких задач состоит в переходе в ряде случаев от матрицы платежей к матрице рисков. Риском игрока А при пользовании стратегией А, в условиях Пj называется разность между выигрышем, который он получил бы, если бы знал Пj , и выигрышем, который он получит в условиях применения стратегии Аi.

Пусть риск игрока при использовании им стратегии Аi в условиях Пj составит rij. Исходя из определения риска, выразим его через платежи

Лекція 3.3 прав

По существу, риск rij характеризует степень приближения данного выигрыша к максимальному, получаемому при заранее известном состоянии «природы». Он учитывает благоприятность или не благоприятность для игрока А данного состояния «природы». Величина rij является мерилом благоприятности для стороны А данного состояния «природы».

Пример 7. Имеются типовые проекты гарнизонной гостиницы на 80, 90 и 100 мест. По опыту эксплуатации гостиниц в аналогичных гарнизонах известно, что в течение половины дней в году бывает занято 80 мест, в течение 30% дней занято 70 мест, а в остальные дни требуется 100 мест. Расчетная прибыль от эксплуатации гостиницы в зависимости от проекта и заполняемости  гостиницы задана таблицей (табл. 11).

                                    Таблица 11

Типовой проект

Заполнено

Заполнено 1 — —

1

70 мест

80 мест

100 мест

80 мест          90 мест          100 мест

5

4       

 3

7

6                5

7 8 9

Требуется выбрать лучший типовой проект гостиницы.

Решение. Построим матрицу игры. Для этого обозначим типовые проекты гостиницы Аi варианты заполняемости гостиницы (состояния «природы») Пj и вероятности этих состояний Qj. Матрица игры представлена в табл. 12.

                                              Таблица 12

Типовой       проект (Ai)

П1 (70 мест)          Q 1=0,3

П2 (80 мест)           Q2 = 0,5

П3 (100  мест)        Q3 = 0,2

ai

А2

Аз

5                        4

3

7                       6                       5

7              8             9

Анализ матрицы игры показывает, что в ней нет доминирующих и дублирующих стратегий.

Существует несколько критериев, используемых для решения задач в терминах игры с «природой».

Критерии, основанные на известных вероятностях состояний «природы», используются в тех случаях, когда известны состояния «природы» и вероятности их наступления:

Лекція 3.3 прав

Поскольку Q1+Q2 +... + Qn = 1, в качестве критерия было бы естественно принять среднее значение аi, (математическое ожидание) выигрыша:

Лекція 3.3 прав

Получив по каждой строке платежной матрицы свой средний выигрыш аi, можно выбрать ту стратегию, где эта величина максимальна. Принимаемая стратегия в среднем будет оптимальна.

Найдем средние суммы прибыли по каждому типовому проекту (табл. 13). Например,

Лекція 3.3 прав  5 • 0,3 + 7 • 0,5 + 7 • 0,2 = 6,4.                                                  Таблица 13

A,

П1

П2

П3

Лекція 3.3 прав

ai

А2      А3

5                4               3

7                 6                5

7      

  8               9

6,4    

  5,8        5,2

Поскольку средний выигрыш при стратегии a1 наибольший, то эта стратегия является предпочтительной.

Для определения вероятностей состояния «природы» можно и нужно использовать статистические данные из прошлого опыта.

Однако в некоторых случаях статистические данные отсутствуют.

Тогда вероятности состояний «природы» могут быть определены экспертным путем. Если и такой способ невозможен, то для предварительных расчетов можно принимать вероятности всех состояний равными друг другу:

Лекція 3.3 прав.

Иногда известны лишь предпочтительности отдельных состояний «природы». В этом случае можно назначить вероятности состояний пропорциональными членам убывающей арифметической прогрессии

Лекція 3.3 прав                                   (15)

Поскольку для полной группы событий сумма их вероятностей равна единице: Qj + Q2 + ... +Qn= 1, то частные вероятности Qj рассчитываются по формуле

Лекція 3.3 прав                                 (16)

Например, если три состояния «природы» П1 , П2 и П3 расположены в порядке убывания вероятностей их наступления, то можно найти их вероятности:

Лекція 3.3 прав

Максиминный критерий Валъда предполагает в качестве оптимальной выбирать ту стратегию, при которой минимальный выигрыш максимален, т. е. стратегию, гарантирующую при любых условиях выигрыш не меньший, чем максимин:

Лекція 3.3 прав

Такой подход может быть продиктован крайней осторожностью, расчетом на худшие условия.

Решение задачи в примере 7 с использованием критерия Вальда представлено в табл. 14.

                                                      Таблица  14

А,

П1

П2

Пз

аi

ai

А2

Аз

5

4

3

7

 6

5

7

8

9

5 4 3

Из табл. 14 видно, что максимальный выигрыш из минимальных равен 5 и соответствует стратегии А1 , следовательно, по принципу обеспечения максимальной гарантии получения выигрыша не меньшего, чем максимин, следует ее выбрать в качестве предпочтительной.

Критерий пессимизма-оптимизма Гурвица рекомендует в условиях неопределенности при выборе решений не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее!), ни крайне легкомысленным оптимизмом (все обойдется наилучшим образом!). Критерий Гурвица имеет вид

Лекція 3.3 прав                           (18)

где Лекція 3.3 прав — коэффициент, выбираемый лицом, принимающим решение (О <Лекція 3.3 прав<1).

Чем опаснее ситуация и серьезнее ее последствия, тем ближе к единице выбирается Лекція 3.3 прав. При Лекція 3.3 прав = 1 критерий Н превращается в максиминный критерий Вальда, а при Лекція 3.3 прав = 0 критерий Н становится критерием крайнего оптимизма.

Воспользуемся критерием Гурвица для решения задачи в примере 7 при Лекція 3.3 прав =0,6. Для получения численного значения критерия Гурвица исходные данные по составляющим формулы (16) сведем в табл. 15.

                                                             Таблица 15

Аi

П1

П2

Пз

min аij

        j

max аij.

         j

Лекція 3.3 прав

ai

А2

Аз

5

4

3

7

6

5

7

8

9

5

4

3

7

8

9

5,8

5,6

 5,4

Лекція 3.3 прав

Результаты расчетов приведены в последнем столбце табл.15.

Следовательно, при данном Лекція 3.3 прав =0,6 критерий Гурвица рекомендует стратегию a1.

Среди критериев, основанных на матрице рисков, наиболее известным является критерий минимаксного риска Сэвиджа.

Построим матрицу рисков по данным примера 7. Для этого каждый элемент матрицы вычтем из максимального в данном столбце значения. Например, в первом столбце максимальный элемент Лекція 3.3 прав =5, значит, r11 = Лекція 3.3 прав - ап = 5 -5 = 0; r21 = Лекція 3.3 прав - a21 =5-4 = 1; r31Лекція 3.3 прав- a31 =5-3 = 2. Аналогичные вычисления делаются для всех столбцов. В результате получается матрица рисков (табл.16).

                                                           Таблица 16

Аi

П1

П2

П3

max rij

А;

А2

аз

0  

 1   

2

0     

 1     

2

2     

 1   

0

2           1          2

Сравним элементы (1.1) и (3.2) в табл. 14 и 16. Платежи, приведенные в табл. 14, составили

а11 = a32 = 5. Но эти выигрыши неравноценны в смысле выбранной стратегии. При состоянии П1 можно получить максимальную прибыль, равную 5 у.е., а при состоянии П2 можно получить 7 у.е. Это различие в подходах к стратегиям А 1  отражено в матрице рисков.

Критерий минимаксного риска Сэвиджа рекомендует выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации, т. е.

Лекція 3.3 прав                                             (19)

Использование критерия минимаксного риска позволяет избежать большого риска при принятии решений. Этот критерий, как и критерий Вальда, пессимистичен, но пессимизм здесь понимается следующим образом: худшим является не минимальный выигрыш, а максимальная потеря возможного выигрыша по сравнению с тем, чего можно было достичь в данных условиях.

Используя матрицу рисков, представленную в табл.16, находим следующее решение — лучшей является стратегия А2. Она обеспечивает минимальный риск.

Основываясь на матрице рисков, можно сформулировать и другие критерии, аналогичные критериям, основанным на матрице платежей.

Решение задачи с помощью нескольких критериев может привести к неоднозначным рекомендациям.

Тем не менее анализ матрицы игры с «природой» под углом зрения различных критериев часто дает лучшее представление о ситуации и достоинствах каждого варианта. Классическая рекомендация состоит в следующем, если решения по различным критериям не совпадают, то следует вернуться к выбору лучшего критерия.

Закінчення

Для военных специалистов знакомство с теорией принятия решений в условиях неопределенности прежде всего должно помочь прийти к весьма важному выводу о том, что недостаток информации всегда опасен и за него приходится платить, причем иногда в прямом смысле. При решении вопросов о величине затрат на мероприятия, позволяющие уменьшить неопределенность (разведка, изыскания, эксперимент, обследование, накопление статистических данных и т.д.), следует учитывать, что неразумная экономия средств на проведение этих мероприятий может вызвать излишние затраты в значительных размерах при проведении учений и решении других задач боевой подготовки.

Большое значение для сокращения неопределенности при принятии решений, связанных с затратами материальных и денежных средств, имеет правильная организация сбора, накопления и обработки статистических данных о проводимых мероприятиях.

 

 

Наверх страницы

Внимание! Не забудьте ознакомиться с остальными документами данного пользователя!

Соседние файлы в текущем каталоге:

На сайте уже 21970 файлов общим размером 9.9 ГБ.

Наш сайт представляет собой Сервис, где студенты самых различных специальностей могут делиться своей учебой. Для удобства организован онлайн просмотр содержимого самых разных форматов файлов с возможностью их скачивания. У нас можно найти курсовые и лабораторные работы, дипломные работы и диссертации, лекции и шпаргалки, учебники, чертежи, инструкции, пособия и методички - можно найти любые учебные материалы. Наш полезный сервис предназначен прежде всего для помощи студентам в учёбе, ведь разобраться с любым предметом всегда быстрее когда можно посмотреть примеры, ознакомится более углубленно по той или иной теме. Все материалы на сайте представлены для ознакомления и загружены самими пользователями. Учитесь с нами, учитесь на пятерки и становитесь самыми грамотными специалистами своей профессии.

Не нашли нужный документ? Воспользуйтесь поиском по содержимому всех файлов сайта:



Каждый день, проснувшись по утру, заходи на obmendoc.ru

Товарищ, не ленись - делись файлами и новому учись!

Яндекс.Метрика