人工智能αβ剪枝实现的一字棋实验报告.docx
《人工智能αβ剪枝实现的一字棋实验报告.docx》由会员分享,可在线阅读,更多相关《人工智能αβ剪枝实现的一字棋实验报告.docx(17页珍藏版)》请在冰豆网上搜索。
人工智能αβ剪枝实现的一字棋实验报告
人工智能α-β剪枝实现的一字棋实验报告
实验5:
α-β剪枝实现一字棋
一、实验目的
学习极大极小搜索及α-β剪枝算法实现一字棋。
二、实验原理
1.游戏规则
"一字棋"游戏(又叫"三子棋"或"井字棋"),是一款十分经典的益智小游戏。
"井字棋"的棋盘很简单,是一个3×3的格子,很像中国文字中的"井"字,所以得名"井字棋"。
"井字棋"游戏的规则与"五子棋"十分类似,"五子棋"的规则是一方首先五子连成一线就胜利;"井字棋"是一方首先三子连成一线就胜利。
2.极小极大分析法
设有九个空格,由MAX,MIN二人对弈,轮到谁走棋谁就往空格上放一只自己的棋子,谁先使自己的棋子构成"三子成一线"(同一行或列或对角线全是某人的棋子),谁就取得了胜利。
○
╳
用圆圈表示MAX,用叉号代表MIN
○
○
○
比如左图中就是MAX取胜的棋局。
╳
╳
估价函数定义如下设棋局为P,估价函数为e(P)。
(1)若P对任何一方来说都不是获胜的位置,则e(P)=e(那些仍为MAX空着的完全的行、列或对角线的总数)-e(那些仍为MIN空着的完全的行、列或对角线的总数)
(2)若P是MAX必胜的棋局,则e(P)=+∞(实际上赋了60)。
(3)若P是B必胜的棋局,则e(P)=-∞(实际上赋了-20)。
比如P如下图示,则e(P)=5-4=1
○
╳
需要说明的是,+∞赋60,-∞赋-20的原因是机器若赢了,则不论玩家下一步是否会赢,都会走这步必赢棋。
3.α-β剪枝算法
上述的极小极大分析法,实际是先生成一棵博弈树,然后再计算其倒推值,至使极小极大分析法效率较低。
于是在极小极大分析法的基础上提出了α-β剪枝技术。
α-β剪枝技术的基本思想或算法是,边生成博弈树边计算评估各节点的倒推值,并且根据评估出的倒推值范围,及时停止扩展那些已无必要再扩展的子节点,即相当于剪去了博弈树上的一些分枝,从而节约了机器开销,提高了搜索效率。
具体的剪枝方法如下:
(1)对于一个与节点MIN,若能估计出其倒推值的上确界β,并且这个β值不大于MIN的父节点(一定是或节点)的估计倒推值的下确界α,即α≥β,则就不必再扩展该MIN节点的其余子节点了(因为这些节点的估值对MIN父节点的倒推值已无任何影响了)。
这一过程称为α剪枝。
(2)对于一个或节点MAX,若能估计出其倒推值的下确界α,并且这个α值不小于MAX的父节点(一定是与节点)的估计倒推值的上确界β,即α≥β,则就不必再扩展该MAX节点的其余子节点了(因为这些节点的估值对MAX父节点的倒推值已无任何影响了)。
这一过程称为β剪枝。
从算法中看到:
(1)MAX节点(包括起始节点)的α值永不减少;
(2)MIN节点(包括起始节点)的β值永不增加。
在搜索期间,α和β值的计算如下:
(1)一个MAX节点的α值等于其后继节点当前最大的最终倒推值。
(2)一个MIN节点的β值等于其后继节点当前最小的最终倒推值。
4.输赢判断算法设计
因为每次导致输赢的只会是当前放置的棋子,输赢算法中只需从当前点开始扫描判断是否已经形成三子。
对于这个子的八个方向判断是否已经形成三子。
如果有,则说明有一方胜利,如果没有则继续搜索,直到有一方胜利或者搜索完整个棋盘。
三、实验代码
#include
usingnamespacestd;
intnum=0;//记录棋盘上棋子的个数
intp,q;//判断是否平局
inttmpQP[3][3];//表示棋盘数据的临时数组,其中的元素0表示该格为空,
intnow[3][3];//存储当前棋盘的状态
constintdepth=3;//搜索树的最大深度
voidInit(){//初始化棋盘状态
for(inti=0;i<3;i++)
for(intj=0;j<3;j++)
now[i][j]=0;//将初值均置为0
}
voidPrintQP(){//打印棋盘当前状态
for(inti=0;i<3;i++){
for(intj=0;j<3;j++)
cout<cout<}
}
voidplayerinput(){//用户通过此函数来输入落子的位置,比如:
用户输入31,则表示用户在第3行第1列落子。
intx,y;
L1:
cout<<"请输入您的棋子位置(xy):
"<cin>>x>>y;
if(x>0&&x<4&&y>0&&y<4&&now[x-1][y-1]==0)
now[x-1][y-1]=-1;//站在电脑一方,玩家落子置为-1
else{
cout<<"非法输入!
"<gotoL1;
}
}
intCheckwin()//检查是否有一方赢棋(返回0:
没有任何一方赢;1:
计算机赢;-1:
人赢)
{//该方法没有判断平局
for(inti=0;i<3;i++){
if((now[i][0]==1&&now[i][1]==1&&now[i][2]==1)||(now[0][i]==1&&now[1][i]==1&&now[2][i]==1)||(now[0][0]==1&&now[1][1]==1&&now[2][2]==1)||(now[2][0]==1&&now[1][1]==1&&now[0][2]==1))//正方行连成线
return1;
if((now[i][0]==-1&&now[i][1]==-1&&now[i][2]==-1)||(now[0][i]==-1&&now[1][i]==-1&&now[2][i]==-1)||(now[0][0]==-1&&now[1][1]==-1&&now[2][2]==-1)||(now[2][0]==-1&&now[1][1]==-1&&now[0][2]==-1))//反方行连成线
return-1;
}
return0;
}
intvalue(){//评估当前棋盘状态的值(同时可以用p或q判断是否平局)
p=0;q=0;
for(inti=0;i<3;i++){//计算机一方将棋盘中的空格填满自己的棋子,既将棋盘数组中的0变为1
for(intj=0;j<3;j++){
if(now[i][j]==0)
tmpQP[i][j]=1;
else
tmpQP[i][j]=now[i][j];
}
}
for(inti=0;i<3;i++)//计算共有多少连成3个1的行
p+=(tmpQP[i][0]+tmpQP[i][1]+tmpQP[i][2])/3;
for(inti=0;i<3;i++)//计算共有多少连成3个1的列
p+=(tmpQP[0][i]+tmpQP[1][i]+tmpQP[2][i])/3;
p+=(tmpQP[0][0]+tmpQP[1][1]+tmpQP[2][2])/3;//计算共有多少连成3个1的对角线
p+=(tmpQP[2][0]+tmpQP[1][1]+tmpQP[0][2])/3;
for(inti=0;i<3;i++){//人一方
//将棋盘中的空格填满自己的棋子,既将棋盘数组中的0变为-1
for(intj=0;j<3;j++){
if(now[i][j]==0)
tmpQP[i][j]=-1;
else
tmpQP[i][j]=now[i][j];
}
}
for(inti=0;i<3;i++)//计算共有多少连成3个-1的行
q+=(tmpQP[i][0]+tmpQP[i][1]+tmpQP[i][2])/3;
for(inti=0;i<3;i++)//计算共有多少连成3个1的列
q+=(tmpQP[0][i]+tmpQP[1][i]+tmpQP[2][i])/3;
q+=(tmpQP[0][0]+tmpQP[1][1]+tmpQP[2][2])/3;//计算共有多少连成3个1的对角线
q+=(tmpQP[2][0]+tmpQP[1][1]+tmpQP[0][2])/3;
returnp+q;//返回评估出的棋盘状态的值
}
intcut(int&val,intdep,boolmax){//主算法部分,实现a-B剪枝的算法,val为上一个结点的估计值,dep为搜索深度,max记录上一个结点是否为上确界
if(dep==depth||dep+num==9)//如果搜索深度达到最大深度,或者深度加上当前棋子数已经达到9,就直接调用估计函数
returnvalue();
inti,j,flag,temp;//flag记录本层的极值,temp记录下层求得的估计值
boolout=false;//out记录是否剪枝,初始为false
if(max)//如果上一个结点是上确界,本层则需要是下确界,记录flag为无穷大;反之,则为记录为负无穷大
flag=10000;//flag记录本层节点的极值
else
flag=-10000;
for(i=0;i<3&&!
out;i++){//双重循环,遍历棋盘所有位置
for(j=0;j<3&&!
out;j++){
if(now[i][j]==0){//如果该位置上没有棋子
if(max){//并且上一个结点为上确界,即本层为下确界,轮到用户玩家走了。
now[i][j]=-1;//该位置填上用户玩家棋子
if(Checkwin()==-1)//如果用户玩家赢了
temp=-10000;//置棋盘估计值为负无穷
else
temp=cut(flag,dep+1,!
max);//否则继续调用a-B剪枝函数
if(tempflag=temp;
if(flag<=val)//如果本层的极值已经小于上一个结点的估计值,则不需要搜索下去,剪枝
out=true;
}
else{//如果上一个结点为下确界,即本层为上确界,轮到计算机走了。
now[i][j]=1;//该位置填上计算机棋子
if(Checkwin()==1)//如果计算机赢了
temp=10000;//置棋盘估计值为无穷
else
temp=cut(flag,dep+1,!
max);//否则继续调用a-B剪枝函数
if(temp>flag)
flag=temp;
if(flag>=val)
out=true;
}
now[i][j]=0;//把模拟下的一步棋还原,回溯
}
}
}
if(max){//根据上一个结点是否为上确界,用本层的极值修改上一个结点的估计值
if(flag>val)
val=flag;
}
else{
if(flagval=flag;
}
returnflag;//函数返回的是本层的极值
}
intcomputer(){
intm=-10000,val=-10000,dep=1;//m用来存放最大的val
intx_pos,y_pos;//记录最佳走步的坐标
charch;
cout<<"您希望先走吗?
(y/n)";
cin>>ch;
while(ch!
='y'&&ch!
='n'){
cout<<"非法输入!
"<<"您希望先走吗(y/n)"<cin>>ch;
}
system("cls");
Init();
cout<<"棋盘如下:
"<PrintQP();
if(ch=='n'){//计算机先走
L5:
for(intx=0;x<3;x++){
for(inty=0;y<3;y++){
if(now[x][y]==0){
now[x][y]=1;
cut(val,dep,1);//计算机试探的走一步棋,棋盘状态改变了,在该状态下计算出深度为dep-1的棋盘状态估计值val
if(Checkwin()==1){
cout<<"电脑将棋子放在:
"<PrintQP();
cout<<"电脑获胜!
游戏结束."<return0;
}
if(val>m){//m要记录通过试探求得的棋盘状态的最大估计值
m=val;
x_pos=x;y_pos=y;
}
val=-10000;
now[x][y]=0;
}
}
}
now[x_pos][y_pos]=1;
val=-10000;
m=-10000;
dep=1;
cout<<"电脑将棋子放在:
"<PrintQP();
cout<num++;
value();
if(p==0){
cout<<"平局!
"<return0;
}
playerinput();//玩家走一步棋
PrintQP();
cout<num++;
value();
if(p==0){
cout<<"平局!
"<return0;
}
if(Checkwin()==-1){
cout<<"您获胜!
游戏结束."<return0;
}
gotoL5;
}
else{//人先走
L4:
playerinput();
PrintQP();
cout<num++;
value();
if(q==0){
cout<<"平局!
"<return0;
}
if(Checkwin()==-1){
cout<<"您获胜!
游戏结束."<return0;
}
for(intx=0;x<3;x++){
for(inty=0;y<3;y++){
if(now[x][y]==0){
now[x][y]=1;
cut(val,dep,1);
if(Checkwin()==1){
cout<<"电脑将棋子放在:
"<PrintQP();
cout<<"电脑获胜!
游戏结束."<return0;
}
if(val>m){
m=val;
x_pos=x;y_pos=y;
}
val=-10000;
now[x][y]=0;
}
}
}
now[x_pos][y_pos]=1;
val=-10000;
m=-10000;
dep=1;
cout<<"电脑将棋子放在:
"<PrintQP();
cout<num++;
value();
if(q==0){
cout<<"平局!
"<return0;
}
gotoL4;
}
return0;
}
intmain(){
computer();
system("pause");
return0;
}
4.主要函数
1估值函数
估价函数:
intCTic_MFCDlg:
:
evaluate(intboard[])
完成功能:
根据输入棋盘,判断当前棋盘的估值,估价函数为前面所讲:
若是MAX的必胜局,则e=+INFINITY,这里为+60
若是MIN的必胜局,则e=-INFINITY,这里为-20,这样赋值的原因是机器若赢了,则不考虑其它因素。
其它情况,棋盘上能使CUMPUTER成三子一线的数目为e1
棋盘上能使PLAYER成三子一线的数目为e2,
e1-e2作为最终权值
参数:
board:
待评估棋盘
返回:
评估结果
2.Alpha-Beta剪枝算法
AlphaBeta剪枝主函数:
intCTic_MFCDlg:
:
AlphaBeta(intBoard[],intDepth,intturn,intAlpha,intBeta,int*result)
完成功能:
根据输入棋盘,搜索深度,及其他参数,给出一个相应的最优解,存入result中。
参数:
board:
待评估棋盘
Depth:
搜索深度
turn:
当前是机器走(MAX结点)还是玩家走(MIN结点)
Alpha:
alpha值,第一次调用默认-100
Beta:
beta值,第一次调用默认+100
result:
输出结果
返回:
若当前点为MAX节点,则返回alpha值;
若当前点为MIN节点,则返回beta值
3.判断胜负
intCTic_MFCDlg:
:
isWin(intcurPos)
完成功能:
根据输入棋盘,判断当前棋盘的结果,COMPUTER胜?
PLAYER胜?
平局?
参数:
board:
待评估棋盘
返回:
-1表示:
尚未结束
0表示:
平局
1表示:
PLAYER胜
2表示:
COMPUTER胜
五、实验截图
六、实验总结
通过本次实验进一步对老师课堂上所讲的α-β剪枝有了更加深刻的了解,对它的一般实现有了初步的认识。
搜索深度并非越深越好,局限于估值函数是根据能够成三子一线的数目决定的,所以搜索到最后一层,如果有人胜,则出现∞,如果没人胜,则三子一线数目为0,所以毫无意义。
。
这也是为什么大多数情况下都是平局的原因。