Тепер статті може редагувати кожен. Приєднуйтесь до нашої вікі-спільноти!

ТПРК1:Лекція12

Матеріал з USIC Wiki
Перейти до: навігація, пошук
Для ФІН

Ця стаття відноситься до групи довідкових статей для студентів ФІН.

[ред.] Багатокрокові задачі і масові рішення

Динаміка в багатокрокових задачах - у залежності апріорного і апостеріорного розподілів; апостеріорний розподіл може бути виражений через рекурентну формулу від апріорного розподілу і спостереження: p1(θ) = φ(p0(θ),y). Цю формулу можна також розглядати як покроковий перехід стану наших знань (накопичення досвіду). Цей перехід може бути керованим, що залежить від типу експерименту.

повторення алгоритму у загальному вигляді

  • опис переходів xk + 1 = φ(xk,uk + 1);x0
  • оцінка руху системи M = \min_{(u_1, \cdots u_N)} \sum_{k=1}^N L(x_k, u_k)
  • мінімізуючи функцію ψ(uk,xk − 1) (для кожного x своє u - з мінімальним значенням функції), отримуємо набір вирішуючих функцій (\delta_1, \cdots \delta_n) \in \Delta вигляду uk = δk(xk − 1)

Ці вирішуючі функції - вже від однієї змінної. Щоб зменшити потреби у пам'яті для їх збереження, можна задати послідовність керувань для початкової умови x0, тоді треба пам'ятати: послідовність оптимальних рішень і послідовність xi. Але таке спрощення є можливим тільки для детермінованої системи: при фіксованому попередньому стані немає невизначеності між дією uk+1 та наслідком xk+1. Іншими словами: немає потреби спостерігати і враховувати вплив невідомого параметру θ.

[ред.] Багатокрокові задачі і невизначеність

12-multistep-uncertainty.flv

[ред.] Застосування алгоритму динамічного програмування

12-multistep-algorithm.flv

Особисті інструменти
Простори назв
Варіанти
Дії
Навігація
Інструменти