|
Тепер статті може редагувати кожен. Приєднуйтесь до нашої вікі-спільноти! |
Багатокрокова задача рішення
- багатокрокова задача рішення - задача, в яких ТПР в одній і тій самій ситуації приймає кожен раз рішення.(не однокрокова задача рішення, де ситуація кожен раз різна).
Основні характеристики БЗР:
- відсутність пам"яті (ситуація не залежить від часового параметру, тобто одиницею часу є рішення)
- вплив попередньої дії (та стану, в якому перебувала природа) на стан природи на наступному кроці
- M=(Θ, U, L(
), P(θ))
- Py1, y2, ... yN-1(Θ)
- Θ - константа
- U - дія
- Х - втрати
- N - кроки
- Si(xj) -
- φ(xk, Uk-1)= xk+1 - втрати на наступному кроці (xk+1) залежать від попередньої дії (Uk-1)(рішення)
- g(xk, Uk) -
---
Багатокрокова задача прийняття рішення це задача у котрій на кожному кроці приймається рішення. Взагалі майже у всіх таких задачах ставиться за мету знайти краще кінцеве рішення, яке можна представити як вектор усіх проміжних рішень. У термінах динамічного програмування рішення - це керування. Приймаючи поточне рішення ми можемо спиратись на результат минулого рішення для того щоб зробити кращій вибір. Для стохастичного ДП ми можемо разглядати ризик як цільову функцію. Тобто на кожному кроці треба мінімізувати ризик. Крок у таких задачах це перехід від одного стану в інший(наступний) : S(t) -> S(t+1). Рішення - це вибір у котрий стан перейти. Стан (стан середовища) - визначається постановкою задачі. Динаміка полягає в тому що приймаючи поточне рішення ми спираємось тільки на результат минулого(або скінченної кількості минулих) і згідно з цього рез-та вибираємо краще рішення на поточному кроці. Поточний вибір не впливає на попередні а також на наступні. Ми робимо локальне рішення.

