全球专业中文经管百科,由121,994位网友共同编写而成,共计436,017个条目

序貫決策

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

序貫決策(Sequential Decision)

目錄

什麼是序貫決策

  序貫決策是用於隨機性或不確定性動態系統最優化的決策方法。

序貫決策的特點

  序貫決策的特點是:

  ①所研究的系統是動態的,即系統所處的狀態與時間有關,可周期(或連續)地對它觀察;

  ②決策是序貫地進行的,即每個時刻根據所觀察到的狀態和以前狀態的記錄,從一組可行方案中選用一個最優方案(即作最優決策),使取決於狀態的某個目標函數取最優值(極大或極小值);

  ③系統下一步(或未來)可能出現的狀態是隨機的或不確定的。

序貫決策的過程

  序貫決策的過程是:從初始狀態開始,每個時刻作出最優決策後,接著觀察下一步實際出現的狀態,即收集新的信息,然後再作出新的最優決策,反覆進行直至最後。

  系統在每次作出決策後下一步可能出現的狀態是不能確切預知的,存在兩種情況:

  ①系統下一步可能出現的狀態的概率分佈是已知的,可用客觀概率的條件分佈來描述。對於這類系統的序貫決策研究得較完滿的是狀態轉移律具有無後效性的系統,相應的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態規劃相結合的產物。

  ②系統下一步可能出現的狀態的概率分佈不知道,只能用主觀概率的條件分佈來描述。用於這類系統的序貫決策屬於決策分析的內容。

本條目對我有幫助21
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

山林,001,Zfj3000,Vulture,Dan,Cabbage,Yixi.

評論(共1條)

提示:評論內容為網友針對條目"序貫決策"展開的討論,與本站觀點立場無關。
M id e91bfd9e2053d4e1ddf03a6b63ceb062 (討論 | 貢獻) 在 2020年12月5日 21:09 發表

定義略簡

回複評論

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号