信息与通信控制前沿技术.docx
《信息与通信控制前沿技术.docx》由会员分享,可在线阅读,更多相关《信息与通信控制前沿技术.docx(59页珍藏版)》请在冰点文库上搜索。
信息与通信控制前沿技术
摘要
先进技术控制理论应用很广泛,涉及到各个领域,但是很多问题都是一些非线性的问题,因此必须找到一种算法可以求解出这些难题,而算法从哪来呢?
这就需要人类大量的学习并且掌握各种方法的能力,因此从上世纪末期产生了各种类型的系统算法和解决方案,这些技术优化人类的生活,带给我们启发。
本文从课上博弈论和蚂蚁系统出发,做了相关的研究,懂得了一些原理,得出了部分结论,但是希望能将博弈论的知识应用到蚂蚁系统中,并且学会算法的优化,这是下一步我要学习的方向和努力点。
ABSTRACT
Advancedtechnologycontroltheoryapplicationisverywide,involvingvariousfields,butmanyproblemsarenonlinearproblems,sowemustfindakindofalgorithmthatcansolvetheseproblems,andwherethealgorithmcomefrom?
Thisrequireswehumandoalotofstudyandenjoytheabilitythatjusttomastervariousmethods,Attheendofthelastcentury,therecomesoutvarioustypesofalgorithmandproducedalotofsystemsolutions,thetechnologyoptimizationofhumanlife,bringsusinspiration.
Thisarticleembarksfromthegametheoryandantsysteminclass,dotherelevantresearch,learnedsomeprinciple,findsomeconclusions,butIhopebeabletoapplytheknowledgeofgametheorytotheantsystem,andlearntoalgorithmoptimization,thisiswhatIwanttolearnandthedirectionofthenextstepandeffort.
第一章博弈论
1.1博弈论告诉我们几点内容
首先介绍一下博弈,博弈是由博弈者,决策,收益三部分组成的,我们的目标是根据博弈者的决策来分析各个决策的收益,然后得出想要的结果,前提条件我们的是我们进行一场博弈,有两个人参加,可以选择策略1或者策略2,但是两个人不能商量,所以我们有下面五种情形去考察
1.1.1情景1:
不要采取严格的劣势策略
有一个评分系统,可以选择策略1或者策略2,不可以让对方知道,如果两人都是选择策略1,那么都会得到成绩B-,如果两人都选择策略2,那么都得到成绩B+.如果一个人选择策略1一个人选择策略2,那么策略1的人得到A,策略2的人得到C。
我和对手的成绩,(,),先是我的成绩然后是对手的成绩
得分情况
对手的选择
策略1
策略2
我的选择
策略1
(B-,B-)
(A,C)
策略2
(C,A)
(B+,B+)
很显然,在这里我们看到,如果我选择策略2,对手选择策略1的话,我得到C,而对手得到的是A,如果对手选择策略2,那我么都得到了B+,
如果我选择策略1,结果正好相反,那么我可以得出结论,选择策略1的收益远远大一现则策略2的收益,因次看来策略2是一个劣势策略,因此我们不要选择严格意义上的劣势策略,
1.1.2情景2理性思想下做出的理性判断或许不是最好的选择
我们把上述的表格赋予得分的情形
得分情况
对手的选择
策略1
策略2
我的选择
策略1
(0,0)
(3,-1)
策略2
(-1,3)
(1,1)
但到上面的图标,我们很容易看到我们得分的最大值是3,那么如果我们中间有一类人叫做邪恶的废物,那么他们总是考虑着自己的利益,那么他极大的可能做出的结论是选择策略1,然而,如果对手也是选择的策略1,那么他的得分是0分,而不是他原先想象的3分,因此我们得出的第二个结论是:
理性思想下做出的理性判断或许不是最好的选择。
这个情景我先做一下囚徒困境的游戏,就是说两个犯人犯罪了,被关在两个房间了,要求他们承认自己的犯罪事实,如果其中一个人把另一个人供出来,而对方没有供出,那么供出的人释放,没供出的人被判刑5年;如果两个人都供出对方,那么他们都获刑两年;如果两个人都没有供出对方,他们将获刑1年;
对手的选择
坐牢年限
供出
不供
我的选择
供出
(2,2)
(0,5)
不供
(5,0)
(1,1)
上面的思路中我们看到是如果做一个邪恶的废物,那么选择供出对方,想着自己被获刑,但是不要忘记了如果对放也供出来,那么两人都将做了两年牢的。
因此上述结论是正确的
1.1.3情景三你将得不到任何东西,除非你知道你想要什么
由邪恶的废物跳跃到了愤怒的天使
从上面的囚徒困境中可以看出,两个犯人可以协商,都不供出对方,那么他们的获刑时间是一年,这是最好的策略,但是万一有人违规,结果他把对方供出,那么他将释放,而苦苦的坐着五年牢,对于这种情景可以签署一个协议,就是万一有以对方违规,我将会变成愤怒的天使,我将会对你做出惩罚。
那么我们还是回归到第一个问题上,来看如果两人是协商者,说是都去选择策略2,谁也不能背叛,如果有背叛者,那么我作为一个愤怒的天使,将会对你做出惩罚,你原本得分是3,我会降低到-1,和我的得分是一样的,但是游戏规则是不能协商,所以降低的最低分数也就是-1,不能再降了,那么请看下面的表格
得分情况
对手的选择
策略1
策略2
我的选择
策略1
(0,0)
(-1,-1)
策略2
(-1,-1)
(1,1)
那么我们得出一张新的表格,判断一下我们可以得出无论你选择那一种方案,
收益都是一样的,那么所以说你选择什么都无所谓,对手和你得到的收益是相同的,因此你将得不到任何东西,除非你知道你想要什么。
这个也是与我们生活中是一样的,就拿读研究生或者不读研究生来说,其实都还是为了工作,最后的收益其实也差不多,那就看你想要什么东西了,如果你想要的是学历那么读研,如果你想要经验,那么就工作,就这么简单。
1.1.4情景四学会换位思考
我们看下面一组对弈
得分情况
B的选择
策略1
策略2
A的选择
策略1
(0,0)
(-1,-1)
策略2
(-3,3)
(1,1)
这种情况是只有一个人是愤怒的天使,两一个人是邪恶的废物,那么从表中看出A邪恶的废物,本来他们的得分是(-1,3),但是作为邪恶的废物,只想着自己的利益,我就会对你惩罚,你想着自己窝将把你的分数从-1降低到-3。
而且原先B的策略为(-1,3),我们协商好了选择策略1,但是你背叛了我对你惩罚,将你的分数降低-1
明显我们可以看出上表格,如果B择策略1,A择策略1,那么他们得分是0,但是A选择策略2,那么得分差距很大,对B来说是有利的;比较一下,B选择策略1是他的优势策略,那么B很可能选择策略1了,那么当他选择策略1,A的选择选择最好也是策略1了,因此我们得出的结论是学会换位思考
那么我们就提出了对于A的收益情况,显然B选择策略1的概率远远大于选择策略2的概率。
记B选择策略1的概率为P
A选择策略1的得分为p-1
A选择策略2的得分为-3p+1*(1-p)=1-4*p
p=[0.5:
0.01:
1];
Y1=p-1;
Y2=1-4*p;
Holdon;
plot(p,Y1,'r');
plot(p,Y2);
gridon
显然我们可以看出对于A来说,选择策略1是较为好的策略;
1.2博弈论中可能与研究算法将结合的知识点
1.2.1剔除劣势决策和迭代选择
案例1游戏的
就是从1到100中选择一个数字,然后每个人的平均值算出来再乘以2/3,最接这个数字的人将会作为赢家,
分析。
首先,我们先看平均数的情况,如果现在100*2/3=67,说明你不够理性。
如果选择67*2/3=45,选择45----67之间的人,往往认为别人很傻,
45*2/3=30,选择30到45之间的人,是普遍认知。
那么选择20—30之间的人是较为明智的选择,我们得出的结论是显然45----100之间的数字是劣势选择,我们要剔除这些劣势选择,可能用到的算法再优化遗传算法中常常会发生汉明现象,我们可以用这种剔除劣势选择的方法进行设计。
案例2
总统选举的现象,又是个政治问题的对待策略,分别记做12345678910
那么对于这些策略可以看做是策略1是左翼分子的做法,策略10是右翼分子的做法,中间的56差不多就是中立的态度,那么你想应聘总统尼会选择哪一种策略呢,其中选民的思想均匀分布,会投给与自己意愿最相近的人,每一种策略最少得到10%的投票,那么我们记作u11,2)表示候选人1选择策略1,候选人选择策略2的情况下,候选人得到的收益
下面分析一下。
U1(1,1)=50%U1(1,2)=10%U1(1,3)=15%U1(1,4)=20%U1(1,5)=25%U1(1,6)=30%………
……
因此我们得出了策略2永远由于策略1,
同类策略10永远优于策略9,因此我们把策略1和10剔除。
接着额进行迭代,第二次的时候2,8策略成为了劣势策略。
。
。
。
。
,,,以此类推,我们知道中间的56策略属于优势策略
这个是由迭代效应得出的结论,因此这个思想可以应用到我们的蚂蚁系统中的群居现象中,拿TSP问题作为研究对象,如果城市很多很多,蚂蚁也很多很多。
对于一个城市可能有很多蚂蚁,蚂蚁或许围城了一圈,那么根据迭代效应我们剔除外围的劣势策略,进而得出我们的优化算法。
1.2.2蚂蚁群中的合作和背叛的现象
案例3
可以知道我们有遗传和变异的现象,要让一个种群中的基因成为稳定基因,那么这种基因必须是稳定基因,变异的基因必须灭亡才可以
假设有一个蚂蚁群体,有原来的蚂蚁,有些事变异体
原来的蚂蚁和变异体之间可以合作也可以背叛,合作就是基因繁殖,数量增加,背叛就是不愿意繁殖。
假设他们合作,将会使得各自产生2个后代,如果原来蚂蚁合作,变异体背叛,那么原来蚂蚁产生0个后代,变异的蚂蚁产生3个后代,反之亦然;如果他们都选择背叛,各自产生了1个后代。
那么看表格
蚂蚁繁殖量
变异蚂蚁的选择
合作
背叛
原来蚂蚁的选择
合作
(2,2)
0.,3
背叛
(3,0)
(1,1)
显然我们先研究一下原来的蚂蚁的情况,如果原来蚂蚁选择合作,那么他的收益u1是:
假设变异蚂蚁合作的可能性为a,u1=2(1-a)+0=2(1-a)=2-2a
如果原先的蚂蚁选择背叛,那么他的收益是U2=3(1-a)+a=3-2a;显然U2>U1.说明原先的蚂蚁选择合作不能达到稳定进化的效果;
同理我们可以考察一下变异的蚂蚁,设原先蚂蚁合作的可能性为b,如果变异蚂蚁选择合作,那么他的收益u1=2(1-b),如果变异的蚂蚁选择背叛,那么收益是u2=3(1-b)+1b,显然对于变异的蚂蚁来说合作也不是产生稳定变异的优势选择,
那么我们要想得到原先蚂蚁的稳定基因,就要让原先蚂蚁背叛,变异的蚂蚁合作,那么就很好的得到我们的效果。
这个博弈可以应用在人工智能中的;领域,怎样维持一种变量或者模型具有稳定的效果,可以应用这个方面的思想。
1.3博弈论可以解决的一些问题
1.3.1捡到100元的处理方式
上课老师讲的假如你捡到了100块钱,你应该分给对方多少,如果对方得不到想要的钱,那么他会选择报警,
因此我从博弈论中得到的种种结论,得到了下面一种解决方案,我要换位思考,跟他做一个游戏,游戏是这样的,有一顶帽子,我先放钱,我如果放到1块钱,他有两种选择,他放1块钱,那么他得到1+1.5元,如果他放3块钱,他最后得到3+2=5元,意思是他放一元挣到了1.5元,他放3元,证了2块钱,如果他直接把我的一块钱取走了,他挣到了2块钱,
我的另一种选择是开始放3块钱,如果我放三块钱,他完全可以取走,挣到了3块钱,比原先所得的钱都多的很,如果他接着也放3块钱或者三块钱以上,我就会再给他2块钱,但是他放三块钱我再给他2块钱这个规则我没有告诉他,主要是考察他的道德问题,显然我开始放进去三块钱是有一定的道德风险的。
如果我的游戏是这样的:
我先放进去3块钱,如果他也放进3块钱,最为奖励我给他40元,如果他直接拿走了,说明他不是好人,我不给钱,继续我接着放进10元,看他原则拿钱。
然后,再让他做选择,他选择放一块钱,说明他在怀疑我的为人,那么我给他20块钱,如果他放进三块钱,说明他有分享的意识,我给他40元。
那么两轮下来就是他最后拿到的钱的数目。
1.3.2从博弈论角度看足球比赛应该进行哪路进攻
我们曾经看到报纸上说足球进攻的经验,说是如果足球运动员从左边扑球,那么你选择右路进攻更容易射进,反之亦然,这是为什么呢?
下表是某科学家做的数据统计:
问题是:
当你是攻击者,你怎么根据守门员的扑球方向决定自己的进攻方向呢?
守门员左边扑球
守门员右边扑球
左路进攻射进概率
63.6%
94.4%
右路进攻射进概率
89.3%
43.7%
下面我们从博弈论角度分析一下:
守门员
进攻者
守门员走向左边
守门员走向右边
进攻者左路射门
40%,-40%
90%,-90%
进攻者中路射门
60%,-60%
60%,-60%
进攻者右路射门
90%,-90%
40%,-40%
上述表格解释:
百分数代表的是进攻这射进球的概率
为了更好的解决问题,显然我们要计算一下收益是多少
那么进攻者从左边射门的收益u1(l.p(r))=0.4*(1-p(r))+0.9*p(r)
进攻者从左边射门的收益u1(r.p(r))=0.0*(1-p(r))+0.4*p(r)
进攻者从左边射门的收益u1(l.p(r))=0.6
为了更直观的展现出我们要得到的结论,我们选择matlab作图,
程序如下:
l=0:
0.01:
1;
h=5;
h1=4;
h2=9;
x1=5*l+4;
plot(l,x1,'b');
title('左路进攻');
holdon;
x2=-5*l+9;
plot(l,x2,'r');
title('右路进攻');
holdon;
h3=6;
plot(l,h3);
title('学号:
2121149');
plot(l,h1,'r');
holdon;
plot(l,h2,'b');
holdon;
ylabel('进攻者射进的概率');
xlabel('守门员往右的概率');
holdoff;
axis([0,1,4,9]);
axissquare;
结论:
很容易看出红线和蓝线的交点是(0.5,6.5),那么根据图中我们可以清晰的看到,无论守门员往左还是往右,我们选择中路进攻不是一个好的策略,因此选择中路进攻将是一个劣势决策,那么我们一般不要选择中路进攻;
当守门员在左边时候,意思是往右边的概率越小的话,那么我们采取红线,也就是右路进攻,那么射进的几率将会大一些;
当守门员往右边防守时候,我们进攻应该选择往左,那么射进的概率也会较大一些;
我们之所以做出上面的选择方案是因为那样做我们所得到的收益最大。
但是有个特殊情况就是,如果你是个大礼选手,那么相应的就是从中路进攻的概率就会增大很多,那么我们将会得到下面的曲线图
:
那么我们的收益就会发生一定的变化,显然当我们在交点处做出不同的判断,很容易看出,当守门员扑球意向在中路的时候,那么作为大力选手的队员,完全可以选择从中路进攻。
总结:
虽然上述过程看着简单,但是两者之间的关系是非线性的,因此可以说是复杂网络,那么我们完全可以又上述问题得出研究复杂网络的科研问题方法,将其简单化,先转换为线性的问题去分析一下,那么我们将会得出较好的解决问题的方案。
1.3.3高校的奖学金的评判准则规划问题
由于现象高校的科研水平提高的准则很多,学生的能里有强有弱,但是有可能遇到两个人水平差不多但是又要必须分出高低的问题,奖学金到底应该分给谁呢,做为一个复杂的网络模型,怎么有效的提出一种解决方案成了一个很重要的问题,下面我提出了一种神经元网络的解决方案,
目前大学生学业奖学金的评定越来越困难,各项指标都很模糊不好做出抉择,包括论文的发表,专利,数模建模大赛,学习成绩。
然后当几个指标单独比较时候,无法抉择哪个更重要一些,所以本文中提出来一个解决方案,可以极大的提高公平性。
下面是某个高校奖学金评定表格
指标和结果
类别
数学建模国家一等奖
数学建模国家二等奖
数学建模国家二等奖
数学建模省级一等奖
论文发表在EI和SCI上
发明专利
实用新型和外观设计性专利
学习成绩
奖学金等级
1
是
是
一篇
2个
1个
第2名
一等奖
2
是
是
1
第三名
一等奖
3
是
3个
第五名
一等奖
4
是
第七名
三等奖
5
是
是
2个
第四名
二等奖
6
是
1
1
第六名
一等奖
7
是
1
4
第一名
一等奖
8
是
是
第十名
三等奖
9
3
第八名
三等奖
10
2
三等奖
11
4
三等奖
12
是
第十一名
三等奖
13
是
2
3
1
二等奖
14
是
2
2
2
二等奖
首先,我们的做法是进行量化,比如成绩按照比例的关系满分是10分,然后比如参加全国数模大赛的人数是:
本届大赛共有231所高校、2507支代表队、7521名研究生参加,其中“985”、“211”学校参赛队伍和人数占80%左右。
最终评选出一等奖75支队伍(获奖比例为2.991%),二等奖439支队伍,三等奖590支队伍,那么我们可以量化得出来一等奖获得者的得分应该和有100人学生学习成绩前三名得分是一样的,那么我们可以简单的在对一等奖获得者做出评判,做一些优劣选择,那么量化结果可以得出,同理我们的论文可以根据相应的发表篇数做出量化,专利也是一样;量化后结果如下:
下面是某个高校奖学金评定表格
指标和结果
类别
数学建模国家一等奖
数学建模国家二等奖
数学建模国家三等奖
数学建模省级一等奖
论文发表在EI和SCI上
发明专利
实用新型和外观设计性专利
学习成绩
奖学金等级
1
10
6.3
5
6
3.7
10
一等奖
2
9.3
6.9
3.7
9.9
一等奖
3
8.2
9
8
一等奖
4
6.8
7.8
三等奖
5
8.6
7.4
6
8.9
二等奖
6
9.5
5
4
8.7
一等奖
7
9.4
5
9
10
一等奖
8
7.6
6.9
6.7
三等奖
9
9
7.6
三等奖
10
6
三等奖
11
9.9
三等奖
12
6.3
5
三等奖
13
8.4
8
9
3.6
二等奖
14
6.4
8
6
6
二等奖
我们的算法思路如下表:
将每个等级的样本对应的哥评价指标的平均主作为各个登记的理想评价指标,即作为Hopfield神经网络的平衡点,如下表所示
指标和结果
类别
数学建模国家一等奖
数学建模国家二等奖
数学建模国家三等奖
数学建模省级一等奖
论文发表在EI和SCI上
发明专利
实用新型和外观设计性专利
学习成绩
奖学金等级
1
9.625
8.2
6.7
6.6
7
6
3.4
9
一等奖
2
9.3
8
6.6
6
6
5
3.2
8.5
二等奖
3
9.0
7.2
6
5.6
5
4.9
3.1
8
三等奖
理想的登记评价指标编码
待分类的等级指标编码:
指标和结果
类别
数学建模国家一等奖
数学建模国家二等奖
数学建模国家三等奖
数学建模省级一等奖
论文发表在EI和SCI上
发明专利
实用新型和外观设计性专利
学习成绩
奖学金等级
1
9.5
8.0
6.3
6.8
5.2
8
3
8
一等奖
2
9.8
8.2
6.7
6.4
6.9
5.5
3.9
9
二等奖
Matlab程序
class_1=[1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1];
class_2=[-11-1;-11-1;-11-1;-11-1;-11-1;-11-1;-11-1;-11-1];
class_3=[-1-11;-1-11;-1-11;-1-11;-1-11;-1-11;-1-11;-1-11];
saveclass.mat;
sim_1=[1-1-1;-11-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;-11-1];
sim_2=[-11-1;-11-1;-1-11;1-1-1;-11-1;-11-1;-11-1;-11-1];
sim_3=[-11-1;-1-11;-1-11;-1-11;-1-11;-1-11;-1-11;-1-11];
savesim.mat;
这样把评判的标准和我们要待分类的数据存在了matlab文档下的目录下
%清空环境变量
clearall
clc
%导入数据
class_1=[1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1;1-1-1];
class_2=[-11-1;-11-1;-11-1;-11-1;-11-1;-11-