博弈學習理論(簡體書)
商品資訊
系列名:當代世界學術名著(經濟學系列)
ISBN13:9787300057477
出版社:中國人民大學出版社
作者:(美)弗登伯格
出版日:2009/01/01
裝訂/頁數:平裝/329頁
規格:23.5cm*16.8cm (高/寬)
版次:1
商品簡介
作者簡介
目次
相關商品
商品簡介
在經濟學中,絕大多數的非合作博弈理論集中研究博弈中的均衡問題,尤其是納什均衡及其精煉。對均衡什么時候出現以及為什么均衡會出現,傳統解釋是,均衡是在博弈的規則、參與人的理性以及參與人的支付函數都是共同知識的情況下,由參與人的分析和自省所得出的結果。不論是在概念上還是在實證上,這個理論都存在許多問題。 在《博弈學習理論》一書中,朱·弗登伯格和戴維·K·萊文提出了另一種解釋:均衡是并非完全理性的參與人隨時間的推移尋求最優化這一過程的長期結果。他們研究的模型為均衡理論提供了基礎,并為經濟學家評價和改進傳統的均衡概念提供了有用的方法。
作者簡介
朱·弗登伯格是哈佛大學的經濟學教授。黛維·K·萊文是加利福尼亞大學洛杉磯分校的經濟學教授。
目次
第1章 引論
1.1 前言
1.2 大群體模型和匹配模型
1.3 三個常用的學習和/或進化模型
1.4 庫諾特調整
1.5 庫諾特動態分析
1.6 具有鎖定功能的庫諾特過程
1.7 回顧同時行動有限博弈
附錄:動態系統和局部穩定性
參考文獻
第2章 虛擬行動
2.1 引言
2.2 兩人虛擬行動
2.3 虛擬行動中的漸近行動
2.4 對虛擬行動中循環的解釋
2.5 多人虛擬行動
2.6 虛擬行動的支付
2.7 兩戰略博弈中的一致性和相關均衡
2.8 虛擬行動和最優反應動態
2.9 虛擬行動的一般化
附錄:狄利克雷先驗和多項抽樣
參考文獻
第3章 模仿者動態和相關的確定性進化模型
3.1 引言
3.2 同質群體中的模仿者動態
3.3 同質群體模仿者動態的穩定性
3.4 進化穩定戰略
3.5 非對稱模仿者動態模型
3.6 對模仿者動態方程的解釋
3.7 模仿者動態的一般化和重復剔除嚴格劣戰略
3.8 短視調整動態
3.9 集值極限點和漂移
3.10 廉價磋商和秘密握手
3.11 離散時間模仿者系統
附錄:劉維爾(Liouville)定理
參考文獻
第4章 隨機虛擬行動和混合戰略均衡
4.1 引言
4.2 收斂的概念
4.3 漸近短視和漸近經驗主義
4.4 隨機擾動支付與平滑最優反應
4.5 平滑虛擬行動和隨機逼近
4.6 部分抽樣
4.7 普遍一致性和平滑虛擬行動
4.8 刺激反應和作為學習模型的虛擬行動
4.9 對戰略空間的學習
附錄:隨機逼近理論
參考文獻
第5章 具有持續隨機性的調整模型
5.1 引言
5.2 回顧隨機調整模型
5.3 坎多里邁拉斯羅布(Kandori Mailath Rob)模型
5.4 討論其他動態
5.5 局部相互作用
5.6 吸引域的半徑和協半徑
5.7 修正的協半徑
5.8 具有異質群體的一致隨機匹配
5.9 隨機模仿者動態
附錄A:有限馬爾可夫鏈的回顧
附錄B:隨機穩定分析
參考文獻
第6章 擴展式博弈和自確認均衡
6.1 引言
6.2 一個例子
6.3 擴展式博弈
6.4 一個簡單的學習模型
6.5 自確認均衡的穩定性
6.6 異質的自確認均衡
6.7 一致自確認均衡
6.8 一致自確認均衡與納什均衡
6.9 可理性化的自確認均衡和關于對手支付的先驗信息
參考文獻
第7章 納什均衡,大群體模型和擴展式博弈中的變異
7.1 引言
7.2 相關信息集和納什均衡
7.3 外生試驗
7.4 在被比做吃角子老虎機問題的博弈中的學習
7.5 定態學習
7.6 “快速學習”模型中的隨機調整和后向歸納
7.7 廉價磋商博弈中的變異和快速學習
7.8 試驗和期限的長度
附錄:吃角子老虎機問題回顧
參考文獻
第8章 老練學習
8.1 引言
8.2 條件學習的三個范例
8.3 老練學習的貝葉斯方法
8.4 絕對連續條件的解釋
8.5 選擇專家
8.6 條件學習
8.7 折現
8.8 分類策略和循環
8.9 內省的分類規則,校準和相關均衡
8.10 模式識別中的索斯諾模型
8.11 操縱學習程序
參考文獻
索引
1.1 前言
1.2 大群體模型和匹配模型
1.3 三個常用的學習和/或進化模型
1.4 庫諾特調整
1.5 庫諾特動態分析
1.6 具有鎖定功能的庫諾特過程
1.7 回顧同時行動有限博弈
附錄:動態系統和局部穩定性
參考文獻
第2章 虛擬行動
2.1 引言
2.2 兩人虛擬行動
2.3 虛擬行動中的漸近行動
2.4 對虛擬行動中循環的解釋
2.5 多人虛擬行動
2.6 虛擬行動的支付
2.7 兩戰略博弈中的一致性和相關均衡
2.8 虛擬行動和最優反應動態
2.9 虛擬行動的一般化
附錄:狄利克雷先驗和多項抽樣
參考文獻
第3章 模仿者動態和相關的確定性進化模型
3.1 引言
3.2 同質群體中的模仿者動態
3.3 同質群體模仿者動態的穩定性
3.4 進化穩定戰略
3.5 非對稱模仿者動態模型
3.6 對模仿者動態方程的解釋
3.7 模仿者動態的一般化和重復剔除嚴格劣戰略
3.8 短視調整動態
3.9 集值極限點和漂移
3.10 廉價磋商和秘密握手
3.11 離散時間模仿者系統
附錄:劉維爾(Liouville)定理
參考文獻
第4章 隨機虛擬行動和混合戰略均衡
4.1 引言
4.2 收斂的概念
4.3 漸近短視和漸近經驗主義
4.4 隨機擾動支付與平滑最優反應
4.5 平滑虛擬行動和隨機逼近
4.6 部分抽樣
4.7 普遍一致性和平滑虛擬行動
4.8 刺激反應和作為學習模型的虛擬行動
4.9 對戰略空間的學習
附錄:隨機逼近理論
參考文獻
第5章 具有持續隨機性的調整模型
5.1 引言
5.2 回顧隨機調整模型
5.3 坎多里邁拉斯羅布(Kandori Mailath Rob)模型
5.4 討論其他動態
5.5 局部相互作用
5.6 吸引域的半徑和協半徑
5.7 修正的協半徑
5.8 具有異質群體的一致隨機匹配
5.9 隨機模仿者動態
附錄A:有限馬爾可夫鏈的回顧
附錄B:隨機穩定分析
參考文獻
第6章 擴展式博弈和自確認均衡
6.1 引言
6.2 一個例子
6.3 擴展式博弈
6.4 一個簡單的學習模型
6.5 自確認均衡的穩定性
6.6 異質的自確認均衡
6.7 一致自確認均衡
6.8 一致自確認均衡與納什均衡
6.9 可理性化的自確認均衡和關于對手支付的先驗信息
參考文獻
第7章 納什均衡,大群體模型和擴展式博弈中的變異
7.1 引言
7.2 相關信息集和納什均衡
7.3 外生試驗
7.4 在被比做吃角子老虎機問題的博弈中的學習
7.5 定態學習
7.6 “快速學習”模型中的隨機調整和后向歸納
7.7 廉價磋商博弈中的變異和快速學習
7.8 試驗和期限的長度
附錄:吃角子老虎機問題回顧
參考文獻
第8章 老練學習
8.1 引言
8.2 條件學習的三個范例
8.3 老練學習的貝葉斯方法
8.4 絕對連續條件的解釋
8.5 選擇專家
8.6 條件學習
8.7 折現
8.8 分類策略和循環
8.9 內省的分類規則,校準和相關均衡
8.10 模式識別中的索斯諾模型
8.11 操縱學習程序
參考文獻
索引
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。