интересно
Предыдущая | Содержание | Следующая

Функция затрат агента

Альтернативным функции полезности описанием предпочтений агента является принятое в теоретико-игровых моделях (исследуемых в теории управления организационными системами) описание в терминах целевой функции. При этом целевая функция управляемого субъекта (агента) отражает его предпочтения на множестве его действий (которые в частности могут интерпретироваться и как продолжительности рабочего времени) и зависит от выбранного управляющим органом (центром) управления - системы стимулирования. Назначая те или иные системы стимулирования, центр может побуждать агента выбирать различные действия. Задача синтеза оптимальной системы стимулирования будет заключаться в назначении центром системы (функции) стимулирования, которая с наименьшими затратами побуждает агента выбирать действие, наиболее выгодное (с учетом затрат на стимулирование агента) для центра.

Рассмотрим организационную систему (ОС), состоящую из одного управляющего органа - центра - на верхнем уровне иерархии и одного управляемого субъекта - агента на нижнем уровне. В рамках рассматриваемой ниже теоретико-игровой модели участники ОС, то есть центр и агент, обладают свойством активности - способностью самостоятельного выбора действий (стратегий). Приведем ряд известных результатов исследования теоретико-игровых моделей стимулирования [2, 4, 5, 19-24] с тем, чтобы потом перейти к обсуждению взаимосвязи этого класса моделей с представлениями экономики труда (см. подробное рассмотрение этого вопроса в [15, 16]).

Стратегией агента является выбор действия у е А , принадлежащего множеству допустимых действий А. Содержательно, действием агента может быть количество отрабатываемых часов, объем произведенной продукции и т.д.

Выбор действия у £ А требует от агента затрат с( у) и приносит центру доход Н(у). Интересы участников организационной системы (центра и агента) отражены их целевыми функциями, которые мы обозначим, соответственно: Ф( у) иДу ) (функциями выигрыша, полезности и т.д., в записи которых зависимость от стратегии центра будет опускаться), представляющими собой: для агента - разность между стимулированием и затратами:

а для центра - разность между доходом и затратами центра на стимулирование - вознаграждением, выплачиваемым агенту (задача стимулирования второго рода или детерминированная задача теории контрактов [21, 22, 49]):

Рациональное поведение участника ОС заключается в максимизации выбором собственной стратегии его целевой функции с учетом всей имеющейся информации.

Определим информированность игроков и порядок функционирования. Будем считать, что на момент принятия решения (выбора стратегии) участникам ОС известны все целевые функции и все допустимые множества. Специфика теоретико-игровой задачи стимулирования заключается в том, что в ней фиксирован порядок ходов (игра Г 2 в терминологии теории иерархических игр [6, 9]). Центр - метаигрок - обладает правом первого хода, сообщая агенту выбранную им функцию стимулирования, после чего при известной стратегии центра агент выбирает свое действие, максимизирующее его целевую функцию.

Множество действий агента, доставляющих максимум его целевой функции (и, естественно, зависящее от функции стимулирования), называется множеством решений игры или множеством действий, реализуемых данной системой стимулирования:

Зная, что агент выбирает действия из множества (3), центр должен найти систему стимулирования, которая максимизировала бы его собственную целевую функцию. Так как множество Р{ о) может содержать более одной точки, необходимо доопределить (с точки зрения предположений центра о поведении агента) выбор агента. Если выполнена гипотеза благожелательности (ГБ), которую мы будем считать имеющей место, если не оговорено особо, в ходе дальнейшего изложения, то агент выбирает из множества (3) наиболее благоприятное для центра действие (альтернативой для центра является расчет на наихудший для него выбор агента из множества решений игры [2, 9, 21-24]). Тогда эффективность системы стимулирования о равна

Прямая задача синтеза оптимальной системы стимулирования заключается в выборе допустимой системы стимулирования, имеющей максимальную эффективность:

и рассмот -

рим следующую систему стимулирования, называемую компенсаторной (К-типа):

В [15, 22] доказано, что система стимулирования К-типа является оптимальным решением задачи стимулирования

в общем случае не оптимальна [19, 21].

Итак, при рассмотрении теоретико-игровых моделей систем стимулирования в детерминированных одноэлементных организационных системах предполагается, что при выборе своей стратегии - действия - при известной ему функции стимулирования агент руководствуется единственной целью - максимизировать свою целевую функцию, представляющую собой разность между стимулированием и затратами.

Другими словами, модель стимулирования задается перечислением допустимых множеств (множества допустимых функций стимулирования и множества допустимых действий агента) и двух функций - функции дохода центра и функции затрат агента. При моделировании реальных систем проблем с идентификацией допустимых множеств, как правило, не возникает (см. теоретическое исследование чувствительности модели по ошибкам задания допустимых множеств в [20, 23, 52]). Так как центром в большинстве случаев является экономический субъект, то его функция дохода может быть описана на основании результатов анализа финансово-хозяйственной деятельности (см. подробности в [15]). Если агентом является организация (как это имеет место, например, в договорных отношениях между заказчиком и подрядчиком), то его затраты также могут быть определены из результатов анализа финансово-хозяйственной деятельности. Сложнее дело обстоит в случае, когда агентом является индивидуум, непосредственное измерение затрат которого в денежных единицах затруднительно или невозможно.

Следовательно, возникает вопрос - как параметры теоретико-игровой модели стимулирования связаны с параметрами экономического описания индивидуальных предпочтений, и нельзя ли. идентифицировав экономическую модель (измерив для некоторой реальной системы соответствующие параметры -п олезность или производные от нее величины), воспользоваться ее результатами для теоретико-игрового моделирования, и наоборот?

Предположим, что предпочтения агента заданы следующим образом - он имеет возможность выбирать (ему предоставлено право работать любое число часов в день при постоянной ставке почасовой оплаты) продолжительность рабочего дня, и известна зависимость желательной продолжительности т от ставки оплаты ос. Возможный (гипотетический) вид зависимости т( а) представлен на рисунке 3 (см. также [22]). Разрывы функции т( а) могут интерпретироваться как скачкообразные изменения системы предпочтений, используемых технологий, внешних условий, прогнозируемых возможностей вложения заработанных средств и т.д. Приведем содержательные интерпретации.

Участок 0-oti соответствует тому, что при малой ставке оплаты агент, скорее всего, предпочтет не работать вообще (для этого, очевидно, необходимо существование положительного нетрудового дохода). На отрезке oti-a2 функция т( а) вогнута, то есть привлекательность дополнительного заработка снижается. На линейном участке ОС2-ОС3 эта привлекательность постоянна. Далее привлекательность приращения дохода постепенно убывает и кривая достигает максимума (быть может, локального) в окрестности точки оц . Линейный участок OCs-ОСб , например, соответствует увеличению свободного времени при неуменьшении суммарного дохода. Далее, начиная с а 6 , число отрабатываемых часов начинает расти, например, при изменении системы предпочтений и наличии возможности качественных изменений уровня жизни в не столь далекой перспективе.

возрастания функции т( а) соответст -

в литературе почти не упоминается. Содержа-

тельно его наличие объясняется зависимостью предпочтений агента на множестве будущих доходов от его текущих доходов (точнее, наверное, от среднедушевого дохода в семье). При высоких ставках оплаты (достаточных для того, чтобы существенно изменить уровень жизни - например, произвести крупные инвестиции в покупку предметов длительного пользования и т.д.) эффект замещения опять начинает доминировать - ценность часа досуга снижается, так как с субъективной точки зрения качественно возрастает его альтернативная стоимость - ставка заработной платы. Затем (с ростом ставки оплаты) ценность часа досуга может опять возрастать и т.д.

В дальнейшем для простоты будем считать, что функция т( а), а следовательно, и q (d ), непрерывна и равна нулю при нулевой ставке оплаты. Эскиз упрощенной кривой т( а) приведен на рисунке 4. Величина ос соответствует ставке заработной платы, при которой желательная продолжительность рабочего времени достигает своего первого максимума. Величина ос соответствует ставке заработной платы, при которой желательная продолжительность рабочего времени достигает своего локального минимума, ос <ос .

Рассмотрим следующий иллюстративный пример.

Зависимость дохода q от ставки заработной платы, при условии, что агенту предлагается выбирать количество отрабатываемых часов (отражаемое функцией т( а)), определяется следующим образом: q (cc ) = а т(сс ).

Отметим, что ставка оплаты а, максимизирующая доход агента, не совпадает в настоящем примере со ставкой оплаты а+ , которая максимизирует желательную продолжительность рабочего времени.

Рассмотренный пример свидетельствует, что ставка оплаты, побуждающая агента отрабатывать максимальное количество часов, в общем случае не совпадает со ставкой оплаты, соответствующей максимальному доходу агента.

).

Происхождение этого парадокса обусловлено выбранным видом зависимости желательной продолжительности рабочего времени от ставки оплаты. Точнее говоря, убывание дохода агента происходит при достаточно быстром убывании функции т( а) на участке доминирования эффекта дохода.

не убывала ни при

достаточно, чтобы функция т(а) убывала в каждой

точке не быстрее, чем линейно, то есть не быстрее, чем прямая с единичным отрицательным наклоном.

Более корректно это достаточное условие, которое мы условно назовем условием монотонности дохода (УМД), можно записать в виде:

Если выполнено УМД, то график функции q ((X) имеет вид, приведенный на рисунке 7. Сравнительно маленькая (или нулевая) скорость возрастания дохода на участке [а+ ; а_] обусловлена убыванием на этом участке функции т( а).

Пример 2. Пусть т(а) = т0 о? т0(а_ + а + ) а2 + Зт0 а_ а+ а,

- нормирующая положительная константа.

, изображен на рисунке 8.

На участке АВ ставка оплаты возрастает с ростом числа часов, которые отрабатывает агент. На участке BD агент начинает больше ценить рабочее время, а на участке DG привлекательность зарплаты опять превышает привлекательность досуга.

Например, для того, чтобы побудить агента отработать Т ; часов, необходимо установить ставку оплаты, равную, как минимум, сса .

Выделим следующие "ветви" зависимости а( т) (и, соответственно получающейся на ее основе зависимости q {T)) первая ветвь соответствует начальному участку АВ возрастания дохода с ростом продолжительности рабочего времени (увеличения продолжительности рабочего времени с ростом ставки оплаты), вторая ветвь - первому участку BD убывания дохода с ростом ставки оплаты (так называемая обратная ветвь на кривой обратного изгиба), третья ветвь соответствует второму участку DG возрастания дохода с ростом продолжительности рабочего времени (увеличения продолжительности рабочего времени с ростом ставки оплаты) и т.д.

Наличие "парадоксального" участка BCDEF обусловлено немонотонностью функции т( а) (см. участок а4-а6 на рисунке 3). Минимальным затратам на стимулирование, используемым при формальном анализе теоретико-игровых моделей стимулирования [15, 21, 22], соответствует минимальная ветвь:

функции о с{ т), выделенная жирной линией на рисунке 8.

может интерпретироваться следующим образом. В рамках рассматриваемой модели предпочтений агента существуют, как минимум, два пороговых значения. Первое: для того, чтобы побудить агента отработать небольшое количество часов (в пределе -с коль угодно малое) необходимо установить конечную ставку оплаты. Двойственным приведенному является утверждение, что за очень малую (но ненулевую) ставку оплаты ни один агент не согласится работать. При этом необходимо принимать во внимание, что величина этого порога (то есть минимальная субъективная оценка стоимости своего труда и затрачиваемого времени) зависит от конкретного агента (см. экспериментальные данные ниже).

Второе пороговое значение обусловлено тем, что при превышении продолжительностью рабочего дня некоторого значения (когда начинает доминировать эффект дохода) агенту должны быть предложены стимулы, достаточные для того, чтобы он почувствовал, что дополнительное рабочее время позволяет ему достичь качественно нового более высокого уровня полезности. Действительно, с экономической точки зрения использование ставок оплаты из отрезка [а+ ; а.] невыгодно, так как на увеличение ставки оплаты и, следовательно, совокупного дохода (равного затратам центра на стимулирование) агент реагирует снижением желательной продолжительности отрабатываемого времени. Иными словами, в этом диапазоне увеличение затрат на стимулирование приводит к уменьшению количества рабочего времени, что при условии монотонности функции дохода центра по числу часов, отрабатываемых агентом, приводит к убыванию целевой функции центра.

Итак, немонотонность функции т( а) (существование участка [а+ , а.] убывания этой функции) приводит к тому, что обратное соответствие ос{т) не является однозначным. Возможным выходом здесь является использование минимальной ветви (см. рисунок 8).

Аналогичные проблемы возникают при попытке определения функции т( а) по известной зависимости а(т). Приведем пример. Если график зависимости минимальной ставки оплаты от продолжительности желательного при этой ставке рабочего времени имеет вид, приведенный на рисунке 9, то график обратного соответствия т( а) имеет вид, приведенный на рисунке 10. Содержательно, при малой продолжительности рабочего дня для обеспечения, например, постоянного значения суммарного дохода значение ставки оплаты должно быть велико. С ростом продолжительности рабочего дня величина ставки оплаты сначала уменьшается, а затем начинает возрастать, что может объясняться быстрым ростом затрат (физических, интеллектуальных и др.) агента при т>> %min . Обратная функция - зависимость продолжительности рабочего времени от ставки оплаты ведет себя неоднозначно. Желательная продолжительность рабочего времени может уменьшаться с ростом ставки оплаты (доминирует эффект дохода - см. жирную ветвь на рисунке 10), а может и возрастать (доминирует эффект замещения).

Следовательно, немонотонность функции а( т) приводит к тому, что обратное соответствие т(а) не является однозначным, и наоборот. Возможным выходом здесь, как и ранее, является использование минимальной ветви (см. рисунок 8), то есть доопределение обратного соответствия следующим образом:

Содержательно, такое определение желательной продолжительности рабочего времени соответствует введению предположения, что, если при некоторой ставке оплаты агент безразличен между работой в течение различного числа часов, то он при прочих равных предпочтет работать меньше, то есть - увеличит время досуга.

Возникает закономерный вопрос - насколько полученные в рамках рассматриваемой модели выводы о существовании порогов и нескольких максимумов у функции а( т) соответствуют реальности. Даже гипотетических (не апеллирующих к экспериментальным данным) рассуждений может быть несколько.

Первое заключается в том, что человек вряд ли мыслит в непрерывных категориях и у него, наверное, существуют субъективные пороги различения ставок оплаты. Например, большинство агентов не заметит изменения ставки почасовой оплаты в несколько долей процента. Поэтому функция а( т) для конкретного агента является дискретной и о ее разрывах можно говорить лишь качественно.

Во-вторых, зависимость ставки оплаты от числа отрабатываемых часов получена косвенным образом - мы считали известной зависимость желательной продолжительности рабочего дня от ставки оплаты и, используя ее, получили обратную зависимость - минимальной ставки оплаты, побуждающей отработать заданное число часов (см. более подробно ниже).

Имея в своем распоряжении зависимости а( т) и q ((X), мы можем решать задачу стимулирования. Из предшествующего изложения следует, что для решения задачи стимулирования необходимо, помимо множеств допустимых стратегий агента и центра, знать функцию дохода центра и функцию затрат агента, или для последнего - минимальные затраты на стимулирование. Так как исследователь операций, как правило, находится на позициях оперирующей стороны - центра, то можно считать, что функция дохода центра известна (см. обсуждение происхождения целевой функции центра в [15, 19]). В рамках рассматриваемой модели минимальными затратами на стимулирование агента по отработке заданного количества часов является доход агента, который он получает при условии, что ему назначается ставка оплаты, побуждающая его отработать именно это число часов (см. также раздел 1.4).

Таким образом, в рамках рассматриваемой модели идея решения задачи стимулирования заключается в следующем.

зависят только от

то минимальные затраты на стимулирование по реализации действия у равны:

Оптимальным реализуемым действием у будет действие, доставляющее максимум целевой функции центра, то есть действие, максимизирующее разность между функцией дохода центра Н( у) и минимальными затратами на стимулирование:

Итак, мы рассмотрели две модели предложения рабочей силы, основывающиеся на дилемме труд/досуг в предположении использования центром пропорциональной системы стимулирования. Напомним, что в первой модели предполагалось существование функции индивидуальной полезности u (q , t ), определенной на множестве пар возможных доходов и продолжительностей свободного времени. Во второй модели подразумевалась известной зависимость т( а) желательной продолжительности рабочего времени от ставки оплаты. Интуитивно понятно, что эти модели должны быть достаточно тесно взаимосвязаны, являясь скорее всего частными случаями некоей более общей модели индивидуального поведения на рынке труда (см. раздел 1.4).