欢迎访问“国际科技时报”,本网以独特视角呈现科技行业的大事小事,内容包括互联网、IT业界、通信、趋势、科技新闻等,全面快速第一时间发布科技最新资讯动态。

主页 > 新闻 > 技术:AI玩麻将,6人德州扑克成新赌神?

技术:AI玩麻将,6人德州扑克成新赌神?

来源:网络转载更新时间:2021-01-07 21:00:01阅读:

本篇文章3625字,读完约9分钟

欢迎来到《创事记》微信订阅号: sinachuangshiji

文/谭婧

来源: deardata(id:deardata )

赌场的圆顶上,华丽的吊灯相连,玻璃水晶反射的灯光亮得无法区分白天和夜晚。 “注”。 加注。 “我会再写的。 ”。

桌子前很安静,只能听到这句话。

你盯着手中的关键aa,还没有构想,荷官给了你kk9。 不出声的玩家从pre-flop跟着3-bet,我必须认真考虑他握的是ak还是kk吗? 你很犹豫,fold丢了一对手的aces,但这时跟不上对方的raise。 “咬紧牙关”在你心里暗自想。 接下来,换了扑克牌发了a。 手拿aaakk full house,血液充满了黑暗。 下注,对方毫不犹豫地跟进。 川牌【川牌】我注意到你应该收获。 你是check,但对方居然按all in。 对方真的是kk吗?

技术:AI玩麻将,6人德州扑克成新赌神?

你的眼球落在小费上,幻想对象只有ak。 你要扔掉卡吗?

不,不,1

我是。

这是为什么?因为这是为什么?这是为什么?这是为什么?因为这是为什么?这是为什么?这是为什么?这是为什么?这是为什么?这是为什么? 所以,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么,这是为什么。

技术:AI玩麻将,6人德州扑克成新赌神?

没什么,没什么,没什么,没什么,没什么,没什么。 因为这是为什么。 只是年、年、年、年、年,即使是年、年、年,也没有以“年”为基础使用保罗算法。

回到开头的场景,年,卡内基梅隆大学队的人工智能系统再次战胜人类,是德克萨斯扑克的六人小组。 研究者布朗说:“六个人的游戏多而复杂,游戏的结果不太可预测。 在有限的对战中,尽管存在纳什均衡,但很多玩家的游戏中很难有效地计算纳什均衡,不清楚是否存在单一的最佳战略,即纳什均衡。 ”。

技术:AI玩麻将,6人德州扑克成新赌神?

研究小组不公开算法的源代码。 据推测,这可能是因为网络赌博和网络游戏平台的老板非常生气。 但是,为了科学研究交流,这项研究的细节和与人类玩家对战的过程将刊登在《科学》杂志上。 《科学》杂志是世界上最权威的学术期刊之一,代表着人类自然科学研究的最高水平。 两个重点是打败人类玩家,权威期刊。 因此,许多中外科技媒体不惜称赞,评价为“里程碑式的进步”或“人工智能的新突破”。 但这是多大的进步,六人德州扑克沦陷了? 也

技术:AI玩麻将,6人德州扑克成新赌神?

问题美国,没用,没用,第33333 ( )和(3)并列3 .第(3)第:第(3)。

蚊子

还不是第三第三第三第三第三第三第三第三第三第三第三第三第三第三第三第三第三第三这个,的第、围棋的第、顺序, ……………………………………………………………………………………………………………………………………………………………… 这是为什么呢?因为这是为什么?因为这是为什么?这是为什么?因为这是为什么?这是为什么?这是为什么。所以八卦掌传人宫二也在生命即将结束之前说:“人生如棋,人生如棋。”

技术:AI玩麻将,6人德州扑克成新赌神?

其次,从“扑克状态空间大”的问题开始。 状态空间大意味着可能的卡组合很大。 在几次下注的过程中,比如要多少钱? 做什么动作? 扑克运动在这里的意思是,是跟着还是不跟着? 是加大小费还是不增加? 小费是十元还是二十元? 这些事情组合起来有很大的空间。 “状态空间”越大,问题就越难解。 以状态空间为基准讨论难易度,100岁的德克萨斯扑克是超过千年的老游戏围棋。

技术:AI玩麻将,6人德州扑克成新赌神?

宋乐教授继续说:“要回到‘六人德赌神’这个话题,游戏的状态空间很大,并不是能用机器解决这样的东西,而是有需要超计算的难点。

这次“赌神”的技术亮点是如何大规模,在计算能力和记忆比较有限的情况下,处理大规模非完全新闻的游戏问题。 ”。

“六个德扑赌神”与名为counterfactualregretminimization的算法有很大关系。 如上述第一部分《人工智能德州扑克的历史》中所述,该算法是2007年人工智能机器学习顶级会议nips大会的论文《regretminimizationingameswithincompleteinformation》

人生的戏剧与梦想,赌场的风与云。

转眼12年了,很多研究者依然在处理“不完全新闻游戏问题”的道路上前进。

宋乐教授用一句话阐述了这12年前算法的关键。 “亮点简单,比较有效,理论上可以说明可以得到纳什均衡。 ”。

十二年前的算法为后代开辟了道路。

《数学简单的历史:明确性的消失》一书说数学不是天然宝石,而是人工的。 那么,我们可以理解为每一步都有价值的研究是科研工作者心血来潮打磨的宝石,铺着普通道路的石头,科研道路铺着宝石。

这个人工智能系统的研究小组自己也在复印件上写得很清楚,只是把这12年前的算法用于德州扑克,实践上效果很好,理论上没有任何保证。 也就是说counterfactualregretminimization算法在理论上由两人德州扑克保证,可以达到纳什均衡,但六人德州扑克不行。 如果不记得了,请回到开头的研究者布朗的故事。 “在多个玩家的游戏中很难有效地计算纳什均衡,不知道是否存在单一的最佳战略,即所谓的“纳什均衡”。 ”。

技术:AI玩麻将,6人德州扑克成新赌神?

换句话说,这次新赌神算法效果很好,但没有理论保证。

宋乐博士解释说:“算法与德州扑克相比,可以理解为制作了改进版。” 我是。 进一步说,“算法本身就是写在纸上的做法。 算法思想很好,但每个游戏、算法都要适应。 ”。 也就是说德克萨斯扑克赌博的算法并不能直接用于麻将、扑克升级和炸金花。

技术:AI玩麻将,6人德州扑克成新赌神?

读到这里,网上赌博和网上游戏平台的老板们默默地在微信里收藏了本文,转发给了赌场运营者。 人工智能骨干技术人员将继续阅读,找到这项技术的创新亮点。

(3)解读“赌神”的计算能力

很多人可能不清楚,进行人机对战的价格很高,其中之一是电费很高。 这些机器人和人工智能系统都是典型的“用电量多的家庭”。 一场比赛对计算资源的消耗非常大。 网民李世石吃饭,人工智能电。 举个例子,天河二号的超级计算机,如果正常运转的话,一年耗电量大约是2亿度,电费超过1亿元。 阿尔法围棋的下一个电费价格是3000美元,大约人民币20000元。

技术:AI玩麻将,6人德州扑克成新赌神?

这个“六人乘坐赌神”也面临天价电费账单吗?

但是答案是否定的。 这篇“科学”所在论文的最大亮点是,它不用超计算,只需要很少的计算资源就能完成,只需要不到150美元的云计算资源。 算法好了,不用这么多计算资源,这确实是算法的进步。

麻省理工大学的科学技术评论也在评价计算能力。 “以前的算法在超级计算机上运行,但人工智能德州扑克选手的算法在一台服务器上运行。 ”。

问题1 :你真的用150美元的计算能力实现了吗?

一句话不能简单总结。 以150美元的计算能力打败了人类选手。 过程分为两部分。 一个是训练的过程,另一个实际上是打牌的过程。 这个研究小组有很多打牌的副本,研究小组算法的以前版本采用了超计算。 换句话说,用超计算计算精确全面的模型。 在实际打牌的过程中,计算能力变少是因为采用了近似的算法。

技术:AI玩麻将,6人德州扑克成新赌神?

什么是近似算法简单地说,研究者注意到一个现象,用近似算法来进行这个问题,换言之,改进首先是近似原来的算法。 取得了同样的效果,也是算法的改进。 但是,没有前期的超算力投入,得不到精确全面的模型时,近似算法是空中楼阁。 没有一层楼。 二楼在哪里?

技术:AI玩麻将,6人德州扑克成新赌神?

问题2 :你怎么解释近似算法?

宋乐教授说:“就像现实世界的场景,让不同的画家尽可能真实地描绘。 画法因人而异。 有些画家画得很好,只用几笔就在画布上表现了场面的动作。 算法蓝图策略模型( blue print strategy )的方法是对游戏收益函数降维的近似表示。 但是同时是德克萨斯德克萨斯但是德克萨斯2德克萨斯扑克太多了,那没什么变化。 还没有,还没有,还没有,复印,复印,复印," " " "别" "别" "别" "复制" "

技术:AI玩麻将,6人德州扑克成新赌神?

田这里

疼(人工

来韩国,三分之三。

总之,作为3年来一直作为人工基础的东西没有消失。 作为狮子。 .

也有很多人工智能研究者,工人赞同这个想法。 他们反感提倡人工智能大步前进的论调是“什么时候有新的算法,降低计算力的诉求有意义”。

人工智能的计算消耗电力非常多,对环境的负面效果显着。 加大计算力度支持这一势头似乎很难抑制。

有机构的话购买60元的英伟达dgx-2超算,接近2亿人民币。

微软亚洲研究院首席研究员刘铁岩在msra、ai礼堂校园的第一次活动中说:“很多研究都在追求‘创造巨大的奇迹’。”

另一位重量级学者、微软亚洲研究院副院长、国际计算语言学协会( acl )主席周明在雷锋网ccf-gair大会上说:“(人工智能迅速发展)无止境的计算资源军备竞赛。”

看来算法不够,计算能力集中,成为了人工智能的“新”处理方案。

但是,计算能力真的行得通吗?

是的,桃子

作为等。

但是。

随着越来越多越来越多越来越多越来越多越来越多越来越来越多了。越来越多。

标题:技术:AI玩麻将,6人德州扑克成新赌神?

地址:http://www.greenichiban.com/news/10500.html

免责声明:国际科技时报是中国具有影响力的科技媒体,以全球视角,第一时间呈现最新科技资讯。所著的内容转载自互联网,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,国际科技时报的作者:何鸿宝将予以删除。

国际科技时报简介

国际科技时报是一家拥有全球视野的前沿科技媒体,是中国高新技术企业门户网站,旨在构建打造国际化、专业化的高新技术资讯与资源交流大平台,国际科技时报涵盖物联网、云计算、智能硬件、智能家居、可穿戴设备、VR、安防、锂电、新能源汽车、汽车科技、仪器仪表、传感器、3D打印、工控、机器人、人工智能、医疗科技、节能环保、智能电网、风电等高科技领域,每个行业网站均独立运营,已成为国内外各大媒体高科技行业资讯内容的主要提供者。