Тепер статті може редагувати кожен. Приєднуйтесь до нашої вікі-спільноти!

Багатокрокова задача рішення

Матеріал з USIC Wiki
Перейти до: навігація, пошук
Напильник

Ця стаття не відповідає вимогам оформлення або повноти інформації. Будь ласка виправте її.

Зверніть увагу Увага: сюди треба додати категорії, шаблони, перехресні посилання, LaTeX формули
багатокрокова задача рішення - задача, в яких ТПР в одній і тій самій ситуації приймає кожен раз рішення.(не однокрокова задача рішення, де ситуація кожен раз різна).


Основні характеристики БЗР:

  • відсутність пам"яті (ситуація не залежить від часового параметру, тобто одиницею часу є рішення)
  • вплив попередньої дії (та стану, в якому перебувала природа) на стан природи на наступному кроці
  • M=(Θ, U, L(\cdot , \cdot), P(θ))


Many steps decision task.gif

Py1, y2, ... yN-1(Θ)
Θ - константа
  • U - дія
  • Х - втрати
  • N - кроки
  • Si(xj) -
  • φ(xk, Uk-1)= xk+1 - втрати на наступному кроці (xk+1) залежать від попередньої дії (Uk-1)(рішення)
  • g(xk, Uk) -



---


Багатокрокова задача прийняття рішення це задача у котрій на кожному кроці приймається рішення. Взагалі майже у всіх таких задачах ставиться за мету знайти краще кінцеве рішення, яке можна представити як вектор усіх проміжних рішень. У термінах динамічного програмування рішення - це керування. Приймаючи поточне рішення ми можемо спиратись на результат минулого рішення для того щоб зробити кращій вибір. Для стохастичного ДП ми можемо разглядати ризик як цільову функцію. Тобто на кожному кроці треба мінімізувати ризик. Крок у таких задачах це перехід від одного стану в інший(наступний) : S(t) -> S(t+1). Рішення - це вибір у котрий стан перейти. Стан (стан середовища) - визначається постановкою задачі. Динаміка полягає в тому що приймаючи поточне рішення ми спираємось тільки на результат минулого(або скінченної кількості минулих) і згідно з цього рез-та вибираємо краще рішення на поточному кроці. Поточний вибір не впливає на попередні а також на наступні. Ми робимо локальне рішення.

Особисті інструменти
Простори назв
Варіанти
Дії
Навігація
Інструменти