机器人足球比赛策略仿真系统的设计与建模.docx
《机器人足球比赛策略仿真系统的设计与建模.docx》由会员分享,可在线阅读,更多相关《机器人足球比赛策略仿真系统的设计与建模.docx(13页珍藏版)》请在冰点文库上搜索。
机器人足球比赛策略仿真系统的设计与建模
第16卷第1期2004年3月
北方工业大学学报
J.NORTHCHINAUNIV.OFTECH.
Vol.16No.1
Mar.2004
机器人足球比赛策略仿真系统的设计与建模
戴 皓 李小坚
(北方工业大学机电工程学院,100041,北京石景山
摘 要 多智能体系统(Multi2AgentSystem是近年来在智能机器人领域兴起的一个新课题.它主要研究多机器人在各种不利环境条件下,如何相互配合和合作来达到某一目的.微机器人世界杯足球比赛(MIROSOT为研究多智能体系统提供既经济又典型的实验场地.本文主要讨论机器人足球仿真比赛所必需的比赛策略.本文描述了机器人足球比赛动态建模,给出了足球机器人的基本行为与动作仿真,讨论了基于仿真平台的机器人足球比赛策略.
关键词 多智能体系统;机器人足球比赛;建模;策略;仿真
分类号 TP242
机器人足球比赛是一个在智能机器人领域出现的典型的多智能体系统(Multi2AgentSys2tem,它是一个集成视觉技术、无线电通讯技术、伺服控制技术、多传感器融合技术、战略战术及仿真等技术的综合系统.微机器人世界杯足球比赛已引起世界各国的广泛关注.机器人足球比赛是一个高度集成化信息技术系统,它标志着一个国家的通讯技术、传感器技术、实时视觉技术、机器学习、仿真等技术水平的高低,所以一个国家的机器人足球比赛研究的水平往往能够反映该国信息工业现代化的程度.
FIRA仿真比赛(SimuroSot是对MiroSot比赛的仿真,按照球员数目又可以分为MiddleLeagueSimuroSot(5vs5以及LargeLeagueSimuroSot(11vs11两种,其仿真平台的本质都是一个可以进行二次开发的应用程序.平台提供开放的接口函数与接口变量,使用者通过调用这些函数与变量完成自己的策略程序,也可以在开发环境中定义新的函数与变量,设计复杂的策略.
MiddleLeagueSimuroSot仿真系统是根据韩国机器人公司Yujin的机器人物理模型,由澳大利亚的RSS开发小组开发完成的,它采用Adobe公司的媒体软件Director作为开发工具,实现了三维仿真.该仿真系统的开发采用的是商业游戏的模式,底层所用的引擎是商业动作游戏引擎公司Havok提供的碰撞处理引擎,在Havok提供的软件开发工具包(SDK中带有完整的物体碰撞检测和碰撞响应函数.此外,在仿真模型设计上,仿真环境采用Adobe公司的3DMax软件来建模.
LargeLeagueSimuroSot比赛所采用的仿真平台是哈尔滨工业大学设计的,其视角是2D的.这个仿真系统采用的是Client/Server结构,仿真系统和决策系统通过UDP/IP协议进行通讯.为了策略开发方便,它提供了一个Client的模板,简化了数据的传输格式的处理.
本文首先讨论了MiddleLeagueSimuroSot机器人足球比赛的动态模型,其次讨论机器人的基本行为(前进、避障等和基本动作(射门、截球等,最后提出了仿真比赛的控制策略.
收稿日期:
2003—10—30
第一作者简介:
戴皓,硕士研究生.主要研究方向:
智能机器人.
1 机器人足球比赛动态建模
为使仿真系统能够模拟机器人和球的运动,需要建立动态模型,为了讨论方便,我们首先设定如下参量:
(XRi,YRi,ARi:
第i个机器人位置与方位角;
VRi:
第i个机器人初速度;
VRTi:
第i个机器人碰撞后速度;
(Xb,Yb,Ab:
球的位置、方位角;
Vb,a0:
小球初速度、方位角;
Vp,a1:
小球碰撞后速度、方位角;
MR,mb:
机器人质量、球的质量;
T:
时间周期.
1.1 机器人的动态模型
(1机器人的直线运动模型.
机器人的运动方程为:
S=VRi+1
2aT
2(1
其中a为机器人加速度,是由机器人硬件和场地情况决定的.一个时间周期后,第i个机器人的位置为:
X′Ri=XRi+ScosARi(2
Y′Ri=YRi+ScosARi(3
(2机器人的旋转运动模型.
我们以逆时针旋转为例:
(见图1
X′Ri=XRi+RSin(β/2cos(ARi+β/2(4
Y′Ri=YRi+Rsin(β/2sin(ARi+β/2(5
A′Ri=ARi+β(6
图1 机器人移动示意图
式中R为机器人旋转半径,β为机器人在一个时间周期内最大可以旋转的角度.1.2 球的运动模型
由于球场摩擦力的存在,小球在球场上作匀减速运动,其运动方程为:
S=VbT-
1
2
aT2,a=μmbg(7式中μ为球场的摩擦系数,一个时间周期后,球所在位置为:
X′b=Xb+Scosa0(8
Y′b=Yb+Ssina0(91.3 机器人的推球模型
当机器人与球的距离小于某一常数(可以设定时,机器人会产生一爆发力,迅猛撞球,产生推球动作.这种情况下,球与机器人满足动能守衡、动量守衡和能量损失等关系,可得如下运动方程:
1
2MRV
2
Ri
+
1
2mbV
2
b
=
1
2MRV
′2
Ri
+
1
2mbV
′2b
(10
MRVRi+mbVb=MRV′Ri+mbV′b(11
VRTi=μ1V′Ri,Vp=μ2V′b(12式中μ1,μ2为能量衰减系数.
2 机器人基本行为与动作仿真
在机器人足球比赛中,机器人的基本行为(Behavior包括移动和避障两种,基本动作(Ac2tion包括射门、点球、截球、阻挡、扫球等.
2.1 基本行为
(1移动.
移动行为由直线运动和旋转两种基本运动组成.当机器人得知它的目标点后,先旋转到目标点的方向,然后再向目标点直线运动.因为很小的方向误差可导致较大的位置误差,故我们用浮点数表示机器人方位角,计算机器人所在方向向量和目标向量的内积(从机器人到目标点,并判定此值是否在期望值之内.当机器人靠近目标点时,如果出现下列任何一种情况它都将停止不动:
(1机器人越过目标点.(2机器人和目标点的距离小于开始给定的标准.图1是机器人移动行为的示意图,图中D矢量表示机器人目标点的矢量,a是机器人的旋转角度.
(2避障.
62
北方工业大学学报 第16卷
在机器人足球比赛中避障是很重要的,这因为碰撞对方会被判罚.我们采用基于势场的避障方法,其基本思想为:
障碍物对机器人有斥力作用,而目标点则对机器人有引力作用.机器人的前进方向就是这个引力和斥力合作用力的方向(见图2.力的大小是机器人到目标点或障碍物距离的函数.一种可行方案是斥力和机器人与障碍物的距离的平方成反比,而引力和
机器人与目标点的距离的平方成正比.
FR1=λ1/S21,FR2=λ2S2
2
(13FR=FR1+FR2
(14
式中FR1为斥力,FR2为引力,λ1、λ2为常数,FR的方向就是机器人要运动的方向.势场方法的好处是能考虑多个障碍物的影响并允许机器人在一个连续变化的环境中自由移动
.
图2 机器人避障示意图
2.2 基本动作
(1射门和点射.
当球队进攻或传球时,常使用射门和点射
动作.若给出球和球门的位置,则可计算出它们的相对位置.射门如图3所示,点射如图4所示.如果满足下列两个条件就可以射门:
(1球位于机器人和球门之间;(2从机器人到球所成
直线在球门覆盖区内,就是θl≤θb≤θh
.
图3 机器人射门动作
为防止球员朝自己方面踢球,点射动作应
采用图4的第二种情况.
(2截球
.
图4 机器人点射动作
当球队防守或传球时,常采用截球动作.在
预测到球的轨迹之后,机器人可移动到拦截点截球.因为在短时间内可假定足球的速度是常量,所以球的轨迹是根据当前和前一个球的位置确定的,由于球移动距离与机器人移动距离的比例和预测到的球速与机器人最快速度的比例相等,因此拦截位置可通过下式计算(如图5所示:
VbΔt/VrΔt=
(Xi-Xb2+(Yi-Yb2
(Xi-Xr2+(Yi-Yr
2
(15
(3扫球.
当球处于自方区域时,自方机器人将球踢向对方区域,如图6所示.从机器人踢球角度考虑,扫球动作与射门动作一样.
72第1期 戴 皓 李小坚:
机器人足球比赛策略仿真系统的设计与建模
图5 机器人截球动作
(4阻挡.
和射门动作相反,阻挡动作就是截取球或阻挡对方机器人(见图7.此动作主要用于守门员的防守.考虑到球和自方球门的位置,机器人是通过到达一预测防守点位置来完成这种动作的.防守路线取决于对方机器人的瞄准点,所以防守机器人的位置取决于对方机器人和球的位置
.
图6
机器人扫球动作
图7 机器人阻挡动作
3 机器人足球比赛策略
3.1 修正的区域防守策略
在机器人足球比赛中,每个机器人都有自己的功能,例如前卫、中卫、守门员,而且根据场上的形势还可以交叉换位.如图8所示,区域防守的概念是每个机器人都有自己的活动区域.只有球位于自己的区域内时该区的机器人才能动作,而其他机器人不动作.这种策略有两个问题:
(1如果球位于对方区域内,并且进攻机器人受到阻挡,则我方球队将处于劣势,这是因为我方守门员和中卫都不动.(2如果球位于区域边界线,那么两个机器人都冲向球,这可能导致相互冲撞
.
图8 机器人足球比赛攻守区域示意图
为克服这些问题,我们提出修正方案,即对在自己区域内活动的机器人给予优先权,并允
许其它机器人在发生上述两种情况时可以移动到赛场的任何地方.例如,在球门区内的守门员
有优先权,而其他机器人应选择不与守门员相
冲突的其它动作.当球位于球门区时,守门员应
8
2 北方工业大学学报 第16卷
利用其优先权选择扫球动作,而其他机器人则应选择阻挡动作或其它动作.
3.2 全攻全守策略
在这种策略中,守门员只活动在球门区内,主要完成扫球动作,而其它机器人则可以根据场上的局势在赛场的任何地方活动.当球位于对方半场时,机器人采取进攻策略,离球近的机器人负责抢球,称为主攻机器人.其它机器人向对方的球门区运动,伺机得分,称为协攻机器人.主攻机器人得到球后根据场上的形势既可以传球给协攻机器人,也可以直接射门得分.当球位于自方半场时,机器人采取防守策略,离球近的机器人负责去抢球,,称为主防机器人.其它机器人向自方的球门区运动,参与防守,称为协防机器人.主防机器人得到球后根据场上的形势既可以传球给协防机器人,也可以直接带球转入进攻.也就是说机器人的攻守转换是根据球的位置来决定的.
除了上述两种策略外,还有其它策略.例如,如果对方的能力很差,则可采用3-0-0策略(3个都作攻击者,其它还有0-2-1策略(无攻击者,2个防守者,1个守门员.根据对方的能力、比赛的重要性(决赛或预赛和已有的比分可采用不同的策略,为此我们建立“策略库”从中选择动作.“策略库”是一个产生式系统,它的形式为“IfThen”,例如:
IfBallPositionInEnemyareaThen
MyRobotAttack(;球在对方半场
Else
MyRobotDefend(;球在自己方半场3.3 仿真策略的实现
目前,国内、外比较流行的MiddleLeagueSimuroSot仿真平台有韩国的基于3DMax建模的通用平台和东北大学正在尝试开发的基于Matlab环境的平台.我们则采用通用平台,通过编写后台的VC++程序来创建动态连接库,实现建模模型,从而建立我们自己的仿真系统.通过反复实验和不断完善此仿真系统,现已收到较好的效果.
4 结论
讨论的机器人足球比赛仿真系统的设计与实现,为开发策略软件提供了实验的条件和依据.同时,我们开始将这些应用于实际当中,逐步建立起我们自己的机器人足球仿真系统,并且还将在今后的工作中不断完善.
参 考 文 献
1 KukHyun,HanJungYi.ChoiHoon,KangPilSoon,SeJoong,LeeSeokHyun,Moon,1996Micro2robotdesignandstrategyforMIROSOT.1996Micro2RobotWorldCupSoccerTournamentProceedings,1996
2 SungHoKim,JongSukChoi,JaeKwonKim,ByungKookKim,Acooperativemicrorobotsystemplayingsoc2cer:
Designandimplementation,RoboticsandAu2tonomousSystem.1997,21:
77~189
3 JohnHarvey,ChaoCheng,DennisMichaelson.High2LevelDesignofaMIROSOTSimulator,1996Micro2RobotWorldCupSoccerTournamentProceedings,1996
4 TheLawsoftheGame.Micro2RobotWorldCupSoccerTournament,1997
5 Hyun2SikShim,Heung2SooKim,Myung2JinJung,In2
HwanChoi,Jong2HwanKim.Designingdistributedcon2
trolarchitectureforcooperativemulti2agentsystemanditsreal2timeapplicationtosoccerrobot.RoboticsandAu2tonomousSystem.1997,21:
49~165
6 Remcodeboer,jellekok.Theincrementaldevelopmentof
asyntheticmulti2agentsystem.2003
7 蔡自兴.智能控制及其应用.云南:
中南工业大学出版社,1998
8 李实,徐旭明,叶榛,孙增圻.机器人足球仿真比赛的Server模型.系统仿真学报,2000(2:
138~141
9 李实,陈江,孙增圻.清华机器人足球队的结构设计与实现.清华大学学报,2001(7:
94~97
10 中国自动化学会机器人竞赛工作委员会.2003中国机器人竞赛培训教材.北京:
清华大学智能技术与系统国家重点实验室,2003
(下转第36页
92
第1期 戴 皓 李小坚:
机器人足球比赛策略仿真系统的设计与建模
方工业大学学报 16卷 北第36demicPublishers,19995 严蔚敏,吴伟民.数据结构.(第2版北京:
清华大8 胡广斌,王菘,惠民等译.数据结构与算法———面向对象的C++设计模式.北京:
电子工业出版社,20009 韩俊刚.系统芯片的混合验证方法.西安邮电学院学出版社,19986 李庆杨,关治,白峰杉.数值计算原理.北京:
清华大学出版社,20007 BryantRE.Graph2basedalgorithmsforBooleanfunction-35(8:
677~691Manipulation.IEEETransactiononComputers.1986,C学报,2002,7(1:
12~1710 韩俊刚,朱宾.关于形式化方法的若干基本问题.[J]软件学报,1999年增刊,186~191MissionModelandResearchofMemoryStructureinMCTLSystemDuHui Zheying LiLiLuo(DepartmentofElectronicsEngineering,SchoolofElectronicsandInformationEngineering,BeijingJiaotongUniversity,100044,Beijing,ChinaAbstract newcheckingmethod—AMCTispresentedatfirst.ItcanbeusedinsystemverificationforLmemorystructureforbasicfunctionaloperatorsandconstraintconditionsisdetermined.Thismemorystructurecannotonlysavespaceandtime,butalsomeettherequirementsofmission2flow.KeyWords verification;MCT;mission;operator;memorystructureL(上接第29页DaiHao XiaojianLi©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.wardthebasicbehaviourandmotionsimulation.Finally,itdiscussesthestrategiesfortherobotfootballmatch.KeyWords multi2agentsystem;robotfootballmatch;modeling;strategy;simulationformulti2agentsystemresearch.Thispapermainlydiscussesthenecessarymatchstrategiesfortherobotfootballsimulationmatch.Firstly,itdescribesthedynamicmodelingoftherobotfootballmatch.Secondly,itbringsfor2mainlyexploreshowthemulti2robotscooperateandcollaboratewitheachotherinordertoachieveacertaingoaldesigningGSI.Testablishmission2flowaggregateisakeypointinthissystem.Therefore,inthisarticleaoEstablishmentofSimulationSystemofRobotFootballMatchStrategy(CollegeofElectromechanicalEngineering,NorthChinaUniv.ofTech.,100041,Beijing,Chinaundervariousadverseenvironments.MIROSOTWorldCupmatchisaneconomicalandtypicalexperimentalfieldAbstract Multi2agentsystemisbecominganewproblemintheintelligentrobotfieldinrecentyears.It