При каких значениях лямбда критерий гурвица обращается в критерий вальда

Обновлено: 05.07.2024

Рассмотрим частный случай модели задачи в условиях неопределенности. Предположим, что каждому возможному состоянию среды соответствует один возможный исход:

….
x1 L11 L1k
x2
….
xn Ln1 Lnk

Таким образом, в данном случае математическая модель задачи принятия решения определяется множеством стратегий , множеством состояний среды , а также матрицей полезностей

Где . Множество предполагается неизвестным.

В этом случае рассмотренные выше критерии для выбора оптимальной стратегии принимают следующий вид.

Критерий Вальда:

Критерий Гурвица:

Критерий Лапласа:

Критерий Сэвиджа: , где

Принятие решений в условиях конфликтных ситуаций или противодействия.

В отличие от задач принятия решений в условиях определенности, риска и неопределенности, в которых внешняя среда (природа) предполагалась пассивной, конфликтные ситуации предполагают наличие по крайней мере двух противодействующих сторон, интересы которых противоположны.

Упрощенная математическая модель конфликтных ситуаций представляет собой игру.

Игра может быть определена следующим образом:

· Имеются n конфликтных сторон (лиц), принимающих решения, интересы которых не совпадают.

· Заданы правила, определяющие выбор допустимых стратегий и известные игрокам.

· Существует точно определенный набор конечных состояний, которыми заканчивается игра (например, выигрыш, ничья, проигрыш).

· Заранее определены и известны всем игрокам платежи, соответствующие каждому возможному конечному состоянию. Обычно они заданы в виде некоторой матрицы .

Практические задачи, в которых встречаются игровые аспекты, чрезвычайно разнообразны.

Характерным примером является довольно распространенная ситуация, когда несколько фирм добиваются права у заказчика на получение выгодного заказа или конфликтуют из-за обладания новыми рынками сбыта.

Развернутая форма игры

Теория игр есть теория моделей принятия решений, она не занимается этими решениями как психологическими, волевыми актами. Не занимается она и вопросами их практической реализации. В рамках теории игр принимаемые решения выступают как достаточно упрощенные и идеализированные схемы реальных явлений.

Наши представления об играх связаны с карточными или “салонными ” играми, шахматами, шашками.

Такие игры начинаются из некоторого данного положения и состоит из последовательности личных ходов, при каждом из которых один из игроков совершает выбор среди нескольких возможностей. Некоторые ходы могут, кроме того, быть случайными. В шахматах, например, характер ходов определяется, в основном, искусством, а в рулетке – случайностью.

В шахматной игре каждый игрок знает любой ход, который был сделан до этого момента, а в бридже – это знание у игрока обычно весьма неполно. На практике это означает, что в момент хода игрок не знает точной позиции и должен делать ход с учетом, что имеется несколько возможных позиций.

В конце игры игроки получают какой-либо выигрыш, который зависит от протекания игры и окончательной позиции. Это примеры позиционных игр.

Т.о. наше представление об игре определяется наличием 3-х элементов:

1. Чередованием ходов, которые могут быть как личными, так и случайными.

2. Возможной недостаточностью информации.

3. Наличием функция выигрыша.

С позиционной игрой связывают понятие топологического дерева или дерева игры, представляющего собой конечную совокупность узлов, называемых вершинами, соединенных ребрами, притом так, что получается связанная фигура, не содержащая простых замкнутых фигур.


Где А - начальная вершина (позиция), В, С - промежуточные вершины (позиции), Х - окончательная.

Определение. Под позиционной игрой n лиц понимают следующее:

1. Топологическое дерево Г с выделенной вершиной А, называемой начальной позицией игры.

2. Функция выигрыша, которая ставит в соответствие каждый окончательной позиции дерева некоторый n-мерный вектор (для n игроков)

3. Разбиение множества всех неокончательных позиций (т.е. неокончательных вершин) дерева Г на n+1 множество , , …, , которые называют множествами очередности. Множество соответствует началу (может быть связано со случайностью), – множество очередности для 1-го игрока (1-ый уровень от А - см. рис. *), и т.д.

4. Вероятное распределение для каждой позиции из на множестве непосредственно следующих за ней позиций (т.е. из каждой позиции следуют варианты позиций с некоторой вероятностью).

5. Подразбиение множества для каждого на подмножества , называемые информационными множествами; при этом позиции из одного и того же информационного множества имеют одинаковое число непосредственно следующих за ними позиций, т.е., альтернатив, и никакая позиция не может следовать за другой позицией из того же самого информационного множества.

6. Для каждого информационного множества множество индексов вместе с взаимно однозначными отображениями множества на множества альтернатив каждой позиции из .

В этом определении перечислены все элементы игры: условие (1) устанавливает, что имеется начальная позиция; (2) задает функцию выигрыша; (3) разделяет множество неокончательных позиций на позиции с ходом случая ( ) и личные позиции, соответствующие каждому из игроков: ( , …, ) (из позиции очередь хода принадлежит игроку ); (4) задает схему рандомизации в каждой позиции случая; (5) разбивает позиции каждого игрока на информационные множества: игрок знает лишь, в каком информационном множестве он находится, но не знает, в какой именно позиции этого множества.

Такая форма задания игры называется развернутой формой.

Нормальная форма игры

В интуитивном понимании стратегия есть некоторый план развертывания игры.

Определение. Стратегия i-го игрока есть некоторая функция, которая ставит в соответствие каждому информационному множеству этого игрока некоторый индекс из .

Будем обозначать множество всех стратегий i-го игрока через . Вообще говоря, игрок принимает решение о своем ходе в игре обычно в тот момент, когда надо делать этот ход. Однако с чисто теоретической точки зрения можно абстрагироваться от такого практического ограничения и предполагать, что уже до начала игры каждый игрок решил, что он будет делать в каждом случае. Т.е. предполагаем, что каждый игрок выбрал некоторую стратегию уже до начала игры.

Поскольку это так, то остается лишь произвести случайные ходы. Более того, все случайные ходы можно объединить в один ход, результат которого вместе с выбранными стратегиями определяет исход игры.

Нас, как и игроков, интересует, какие из стратегий являются наилучшими с точки зрения максимизации доли каждого игрока в выигрыше: i-ый игрок стремится максимизировать i-ю компоненту функции выигрыша.

Т.к., однако, результаты случайных ходов известны только в вероятностном смысле, то естественно рассматривать математическое ожидание функции выигрыша, определенное в случае, когда игроки используют данный n-набор стратегий, т.е данную ситуацию. Поэтому для описания математического ожидания функции выигрыша при условии, что i-ый игрок применяет стратегию , можно использовать следующее обозначение:

Функцию на множестве всех взаимных значений , …, можно выразить либо в форме соотношения, либо в виде n- мерной таблицы n-мерных векторов. В случае n=2 эта запись сводится к матрице, элементами которой являются пары вещественных чисел. Такая n-мерная таблица называется нормальной формой игры.

Пример 0 . Для игры в “Орлянку” нормальной формой игры является матрица

“Р” “О”
Р” (−1, 1) (1, −1)
О” (1, −1) (−1, 1)

Здесь каждая строка представляет стратегию игрока 1, а столбец − стратегию игрока 2.

Пример 0 . Рассмотрим следующую игру. Случайно выбирается целое число z с возможными значениями 1, 2, 3, 4, каждое с вероятностью . Игрок I не зная результата этого хода, выбирает целое число x. Игрок II, не зная ни z, ни х, выбирает целое число у.

Выигрыш определяется следующим образом: , т.е. целью является выбор числа, по возможности близкого к z.

В этой игре каждый игрок имеет 4 стратегии: 1, 2, 3, 4, так как от других чисел мало проку. Если игрок I выбирает 1, а, игрок II − 3, то выигрыш будет равен (2, -2) с вероятностью , (0,0) - с вероятностью и (-2, 2) с вероятностью . Ожидаемый выигрыш тогда равен:

Подсчитав все значения, получим таблицу:

(0, 0) (−1/2, 1/2) (−1/2, 1/2) (0, 0)
(1/2, −1/2) (0, 0) (0, 0) (1/2, −1/2)
(1/2, −1/2) (0, 0) (0, 0) (1/2, −1/2)
(0, 0) (−1/2, 1/2) (−1/2, 1/2) (0, 0)

Определение. Игра называется конечной, если число стратегий всех игроков является конечным. Или. Игра называется конечной, если ее дерево содержит только конечное число вершин.

Ситуации равновесия

Определение. Пусть дана игра Г. Говорят, что ситуация (т.е. какой-нибудь n-набор стратегий) равновесна, или, что она является ситуацией равновесия, если для любого и для любого имеет место неравенство

Другими словами – ситуация равновесна, если не один игрок не имеет никаких разумных оснований для изменения своей стратегии при условии, что все остальные игроки собираются придерживаться своих стратегий. В этом случае, если каждый игрок знает, как будут играть остальные, он имеет основания придерживаться той стратегии, которая соответствует этой ситуации равновесия; тем самым игра становится весьма устойчивой.

Пример 0 . Для игры в нормальной форме

как , так и являются ситуациями равновесия.

К сожалению, не каждая игра обладает ситуациями равновесия. Например, игра в “Орлянку” такой ситуации не имеет.

“Р” “О”
“Р” (−1, 1) (1, −1)
“О” (1, −1) (−1, 1)

Вообще, если игра не имеет ситуаций равновесия, то обычно некоторые игроки пытаются отгадать стратегии остальных игроков, сохраняя собственные стратегии в тайне. Это наводит на мысль, что в играх с полной информацией ситуации равновесия существуют (в конечных играх).

Действительно, справедлива следующая теорема:

Теорема: Любая конечная игра n лиц с полной информацией имеет ситуацию равновесия.

Предположим, что в нашем распоряжении имеются статистические данные, позволяющие оценить вероятность того или иного спроса, и этот опыт может быть использован для оценки будущего. При известных вероятностях Pj для спроса Sj можно найти математическое ожидание W(X,S,P) и определить вектор X*, дающий


Если для вышеприведенного примера задать вектор P = (0.01, 0.09, 0.2, 0.3, 0.3, 0.1), то математические ожидания прибыли при разных выборах:

W1 =-121*0.01 + 62*0.09 + 245*0.2 + 245*0.3 + 245*0.3 + 245*0.1 = 224.87,

W2 = 305.22, W3 = 330.675, W4 = 301.12

и выбор максимального значения обнаруживает оптимальность варианта 40 станков с ожидаемой прибылью 330.675 тыс.руб.

Критерий Лапласа

В основе этого критерия лежит "принцип недостаточного основания".

Если нет достаточных оснований считать, что вероятности того или иного спроса имеют неравномерное распределение, то они принимаются одинаковыми и задача сводится к поиску варианта, дающего


Для нашего примера

W1 = (-121 + 62 + 245 + 245 + 245 + 245)/6 = 153.5,

W2 = 197.25, W3 =210.5, W4 = 193.5

и выбор максимального значения обнаруживает оптимальность выбора варианта 40 станков с ожидаемой прибылью 210.5 тыс.руб.

Критерий Вальда

Критерий Вальда обеспечивает выбор осторожной, пессимистической стратегии в той или иной деятельности и его суждения близки к тем суждениям, которые мы использовали в теории игр для поиска седловой точки в пространстве чистых стратегий: для каждого решения Xi выбирается самая худшая ситуация (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект

В нашем примере W = max(-121, -168.75, -216.5, -264.25) = -121, т.е. по этому критерию следует закупить 20 станков и максимальный возможный убыток не превысит 121 тыс.руб. (если бы мы включили и вариант отказа от покупки станков вообще, то этот критерий рекомендовал бы нам воздержаться от какой-либо деятельности, но "кто не рискует, тот не пьет шампанского").

Можно принять и критерий выбора оптимистической стратегии

где оценивается гарантированный выигрыш при самых благоприятных условиях. Для нашего примера W = min (245, 380.25, 515.5, 650.75)= 245.

Критерий Гурвица

Ориентация на самый худший исход является своеобразной перестраховкой. Однако опрометчиво выбирать политику, которая излишне оптимистична. Критерий Гурвица предлагает некоторый компромисс:

где параметр a принимает значение от 0 до 1 и выступает как коэффициент оптимизма. Так в нашем примере при различных a значения W определяются таблицей:


При a=0.5 (равновероятных шансах на успех и неудачу) следует закупить 50 станков и ожидать прибыль порядка 193.25 тыс. руб.

При вероятности успеха 0.2 не следует закупать более 20 станков с надеждой, что убытки не превысят 47 тыс.руб.

Критерий Сэвиджа

Суть этого критерия заключается в нахождении минимального риска. При выборе решения по этому критерию сначала матрице функции полезности (эффективности) сопоставляется матрица сожалений


элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i-го решения в j-м состоянии. Затем по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления.

Для нашего примера отыскиваем матрицу D, вычитая (-121) из первого столбца матрицы полезности, 62 из второго и т.д.


Наибольшее значение среди минимальных элементов строк здесь равно max[-405.75, -270.5, -135.25, -143.25]=-135.25 и, покупая 40 станков, мы уверены, что в худшем случае убытки не превысят 135.25 тыс.руб.

Таким образом, различные критерии приводят к различным выводам:

1) по критерию Лапласа приобретать 40 станков,

2) по критерию Вальда - 20 станков,

3) по критерию Гурвица - 20 при пессимистическом настроении и 50 в состоянии полного оптимизма,

4) по критерию Сэвиджа - 40 станков.

Возможность выбора критерия дает свободу лицам, принимающим экономические решения, при условии, что они располагают достаточными средствами для постановки подобной задачи. Всякий критерий должен согласовываться с намерениями решающего задачу и соответствовать его характеру, знаниям и убеждениям.


Ключевые слова:принятие решения, игры с природой, взаимодействие предприятий

Мировой опыт показывает, что существует достаточное количество форм взаимодействия предприятий, включая как жесткие типы управления — концерны, так и мягкие (картели, ассоциации и проч.).

В данной работе будут рассмотрены такие формы как: межфирменные сети, консорциум и альянс, потому как все три формы имеют межотраслевой вид взаимодействия и коммерческий характер хозяйственных отношений.

Важно отметить, что с одной стороны выбор оптимальной стратегии для игрока облегчен, но с другой — выбор осложнен отсутствием конкретных данных о состоянии природы.

Задачи в играх с природой имеют 2 вида: задачи о принятии решений в условиях неопределенности (отсутствие конкретных данных о возможных состояниях природы) и задачи о принятии решений в условиях риска (наличие сведений о вероятности наступления тех или иных обстоятельств).

При исследовании всевозможных вариантов принятия решений используют определенные критерии, которые выступают помощниками при формировании логического подхода к выбору той или иной стратегии поведения.

Основные критерии принятия оптимального решения при выборе стратегии поведения:

В качестве стратегии автором рассматриваются следующие формы взаимодействия:

  1. Альянс (А1), планируемая прибыль от реализации проекта — 310 млн. руб.
  2. Консорциум (А2), планируемая прибыль от реализации проекта — 200 млн. руб.
  3. Межфирменные сети (А3), планируемая прибыль от реализации проекта — 403 млн. руб.

По прогнозам предприятия спрос потребителей на услуги может быть выражен в четырёх видах (П): 25, 30, 35 или 40 млн. руб., таким образом, каждый вид спроса имеет максимальную сумму затрат на развитие предприятия.

Необходимо выбрать оптимальную стратегию, используя критерии Вальда, Гурвица и Лапласа.

Данный критерий (пессимистичный) предназначен для ситуаций, в которых игрок (А) предполагает наихудший вариант исхода событий и выбирает максимальный вариант из всех наихудших.

Поэтому вначале необходимо найти вариант максимальных затрат из всех представленных, а далее — вычленить минимальные затраты (таб. 1):

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации можно придерживаться промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно такому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей, т.е. занять уравновешенную позицию, Гурвиц предложил критерий (HW), оценочная функция которого находится где-то между точками крайнего оптимизма и крайнего пессимизма. Оценочная функция имеет две формы записи:


Критерий Вальда (максиминный критерий [1] ) — один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма.

История

Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на случай выборок разных объемов. [2] [уточнить]

Примечания

См. также

  • Дополнить статью (статья слишком короткая либо содержит лишь словарное определение).

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Критерий Вальда" в других словарях:

Критерий Сэвиджа — Критерий Сэвиджа один из критериев принятия решений в условиях неопределённости. Условиями неопределённости считается ситуация, когда последствия принимаемых решений неизвестны, и можно лишь приблизительно их оценить. Для принятия решения… … Википедия

Критерий согласия Колмогорова — или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

Вальда критерий — [Wald criterion], другое написание критерий Уолда см. Максимин … Экономико-математический словарь

Критерий согласия Пирсона — Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия

Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия

Критерий Кохрена — Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма . Расхождение между дисперсиями считается случайным при выбранном уровне значимости , если: где квантиль случайной величины при числе суммируемых… … Википедия

Критерий Лиллиефорса — статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия

Критерий Уилкоксона — Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Добавить иллюстрации. Т Крит … Википедия

Последовательный статистический критерий — Последовательный статистический критерий последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе. Пусть наблюдению в статистическом эксперименте доступна случайная величина с… … Википедия

Тест Вальда — (англ. Wald test) статистический тест, используемый для проверки ограничений на параметры статистических моделей , оцененных на основе выборочных данных. Является одним из трех базовых тестов проверки ограничений наряду с тестом… … Википедия

Читайте также: