博弈论-Linux大棚

admin 管理员组

文章数量: 1087139

博弈论

博弈是多智能体强化学习中的常用理论。本文介绍几种基本的博弈游戏。

1 囚徒困境

在囚徒困境博弈中，两名犯罪的囚犯一起被警察盘问，每个罪犯都有两种选择：一种是与警察合作来对付同伙；另一种是与同伙串通而对警察撒谎。如果两名罪犯相互配合而不承认犯罪，则只会在监狱里呆几个月的时间。但如果他们中的一个为对付同伙而与警察合作，另一个却维护同伙而对警察撒谎，则这个与同伙合作并欺骗警察的罪犯将会做很长时间的牢。

（1）如果罪犯配合很好，欺瞒了警察，则会同时获得奖励5，并关几个月。

（2）如果一个罪犯向警察认罪，而另一个罪犯撒谎，则前者获得奖励10并释放，后者获得奖励0并获得终身监禁。

（3）如果都向警察认罪，则都会获得奖励1并关几年。

大多数理性的人都会选择（3）而尽量减少在监狱的时间。

选择坦白交代的行为称为纳什均衡（NE)。如果一个具有机器学习能力的智能体不断重复地玩该游戏,

那么会学习到在任何情况下都100%地选择坦白。这就是所谓的纯策略博弈。

2 猜硬币

两个小孩各有一枚硬币，然后各自选择显示硬币正面或反面。如果都同时显示两个正面或反面，则玩家1获胜并得到回报1，而玩家2输且回报为-1。若两枚硬币正反各不相同，则玩家2获胜。每玩一局都有一个玩家会赢而一个玩家会输，这就是所谓的零和矩阵博弈。

该游戏的最优策略，或其纳什均衡，是一种以50%概率选择硬币正面同时50%概率选择硬币反面的混合策略。这称为混合策略博弈。

3 剪刀石头布

剪刀石头布的规则是每次可以出石头（拳头)、剪刀或布的手势。而布能盖住（赢）石头，石头能击毁（赢）剪刀，剪刀能割开（赢）布。如果两个玩家出的一样，那么就是平局。这个游戏是一种混合策略的零和博弈。显然，解决方案应该是随机以33%的概率选择石头、剪刀或布的手势。唯不同的是该游戏可以选择3种行为。

本文标签：博弈论

版权声明：本文标题：博弈论内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://roclinux.cn/b/1686509999a3947.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

博弈论

编程

2023-6-12

博弈论。。。

编程

2023-6-25

【博弈论】势博弈（potential game）、EPG以及最佳响应、Nash均衡和帕累托（pareto）最优的理解

编程

4月前

文章目录前言一、Potential game二、Nash均衡和Pareto-optimal（帕累托最优）1.Nash 均衡2.Pareto最优三、Best response&#xff0

多智能体强化学习与博弈论-博弈论基础2

编程

4月前

多智能体强化学习与博弈论-博弈论基础2 Repeated Games(重复博弈) 之前我们介绍了一些单次博弈的例子，除了单次博弈外，重复博弈也是经常在我们生活中出现的。在重复博弈中智能体有机会

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

博弈论

博弈论

1 囚徒困境

2 猜硬币

3 剪刀石头布

更多相关文章

博弈论

博弈论 。。。

【博弈论】势博弈（potential game）、EPG以及最佳响应、Nash均衡和帕累托（pareto）最优的理解

多智能体强化学习与博弈论-博弈论基础2

发表评论

推荐文章

javascript - How to make AJAX work on local server using XAMPP or node.js - Stack Overflow

How to use javascript in PHP class functions? - Stack Overflow

amazon web services - AWS Cognito fails to resetPassword() for verified email - Stack Overflow

Can client JavaScript use its own HTTP proxy? - Stack Overflow

javascript - Add thousands separator to auto sum - Stack Overflow

热门文章

Office 2016：提升办公效率的利器

html - Javascript character encoding - Stack Overflow

Checkbox validation for checking at least 1 checkbox and at most 3 using javascript - Stack Overflow

javascript - How to fix prettier and tslint error with brackets with single props? - Stack Overflow

javascript - How to open a pop up when page loads using jquery? - Stack Overflow

Issue with Jump Metrics Calculation from Force-Time Data Using Python: Errors in Phase Detection and Velocity - Stack Overflow

asynchronous - Javascript Button OnClick Callback - Stack Overflow

如何解决Windows 1011无法通过F8进入安全模式的问题？

Xshell及Xftp v8.0安装与使用-生信工具050

2025三掌柜赠书活动第十六期 网络安全：守护安全防线，铸就高薪荣光

最新文章

javascript - How do I toggle the readonly attribute of all child element with jquery - Stack Overflow

javascript - Might it be possible to block an entire US state from accessing my site, using PHP? - Stack Overflow

c++ - Is dereferencing std::span::end always undefined? - Stack Overflow

javascript - Delay function execution if it has been called recently - Stack Overflow

javascript - Google Maps Autocomplete List - Stack Overflow

Windows 安装和连接使用 PgSql数据库

cmd打开计算机D盘,Win7利用cmd命令进入d盘文件夹的操作方法

如何在VMare中制作Windows Embedded Standard 7 (WES 7)

开机、注销后自动登录Windows

【教程】Python Flask快速学习

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

博弈论。。。

2025三掌柜赠书活动第十六期网络安全：守护安全防线，铸就高薪荣光