发布网友 发布时间:2022-04-22 22:21
共3个回答
热心网友 时间:2022-04-19 03:03
AI 的训练是这样子进行的:一个棋类玩法基本规则的分析器,和一个多层网状回路。网络层用于下棋,每下一步,分析器判断棋步是否符合规则,反馈奖或罚,网络层自己和自己对弈,不断的尝试各种可能的下法,获得尽可能高的奖励,避免得到处罚。这样的实例有很多,在github上都是开源的,并且已经有很多训练好的数据可用。比如,大名鼎鼎的阿法狗,其项目地址是:deepmind/lab。
热心网友 时间:2022-04-19 04:21
机器学习就是分类和回归问题,这个明显不是分类问题,那就是回归问题。感觉你应该把棋盘都标上号,然后告诉程序该如何去到达胜利的位置。哈哈,我也是刚学,觉得不对,就当我胡说,坐等大神>o<~追问棋盘上每个点都是有号的。跳棋棋盘比五子棋盘复杂,有些点对于游戏是没意义的,都显示出来会很乱
热心网友 时间:2022-04-19 05:55
有资源的,看我的主页哦~追问怎么看你的主页?