红外谱图数据库.docx
《红外谱图数据库.docx》由会员分享,可在线阅读,更多相关《红外谱图数据库.docx(24页珍藏版)》请在冰点文库上搜索。
![红外谱图数据库.docx](https://file1.bingdoc.com/fileroot1/2023-5/14/05a4851b-6443-484f-98c2-0dcb456bf622/05a4851b-6443-484f-98c2-0dcb456bf6221.gif)
红外谱图数据库
3.2.
4.红外谱图数据库
服务介绍:
本数据用户可以在数据库中检索指定化合物的谱图,也可以根据谱图/谱峰数据检索相似的谱图,以协助进行谱图鉴定。
用户可以通过IE浏览器显示谱图,特别提示:
用户浏览器请勿禁用javaapplet功能,否则可能导致谱图不能正常显示。
名词与概念:
40
40
3.2.
4.1相似谱图检索——输入谱峰检索
基本原理用户输入某个谱图的特征谱峰数据,并指定命中谱图与输入的提问谱图的最低相似度、容许误差范围等参数。
系统根据这些参数,先进行初步筛选,得到候选红外谱图,然后将用户的提问谱数据与数据库中的所有候选红外谱图的特征谱峰数据进行逐一比较,找到与用户提问谱图相似的谱图,并将结果按照相似度递减顺序排列供用户对照。
第一步:
谱峰数据输入输入的用户提问谱图的每个特征谱峰数据都包括4项,谱峰位置、谱峰透过率、峰宽、峰差。
系统总是假定用户提问谱图采用透过率T来表示。
峰差
(%
半峰宽(cm-1
页面的第一部分是输入谱峰的列表,供用户校对数据。
每个谱峰后面有“不可丢失”选项,勾选此选项,
则要求检索命中的谱图中必须含有此特征峰,不包含这类特征峰的谱图,即使其他谱峰都能匹配,系统也不会认为它是合格的候选谱图。
如果用户不设定任何一个谱峰为不可丢失,则系统认为任何单个峰没有匹配时,都不影响候选谱图的筛选。
1.谱图匹配模式,是指谱图筛选过程中匹配候选谱图的模式,单选,有3种模式可以选择:
强峰匹配、官能团匹配、全峰匹配。
由于红外谱图的曲线上存在许多大小不同的谱峰,部分非常微弱的峰通常不用来作为鉴定的根据,一般只观察比较强的特征谱峰,因此强峰匹配在谱图筛选过程中只考察谱图的强峰,只要谱图的强峰索引与输入的提问谱图的强峰索引匹配,则将此谱图作为候选谱图。
官能团匹配是将输入谱峰的数据按照红外解析的规律,判断该谱图对应的官能团,生成官能团索引,系统根据官能团索引筛选出候选谱图。
全峰匹配跟强峰匹配的区别在于全峰匹配筛选过程将考察所有谱峰。
一般情况下,系统默认选择强峰匹配模式,能够快速检索出结果,如选择全峰匹配模式则需要较长时间。
官能团匹配模式是与强峰匹配模式同时进行的,对谱峰数据要求比较苛刻,检索命中率不如强峰匹配模式。
2.谱峰匹配参数谱图筛选过程中,判断谱峰是否匹配的参数,可多选。
系统默认根据峰值(谱峰位置+透过率来判断,如2个谱峰的谱峰位置的差距、透过率的差距都在容许误差之内,则认为这2个谱峰匹配。
如还选择了其他谱峰匹配参数,例如峰宽,那么判断谱峰匹配的标准还要加上峰宽的差距在容许误差之内。
所有数据间都是AND关系,即任一个数据的差距超过容许误差,就认为这2个谱峰不能匹配。
3.谱峰检索设置谱图检索结果的重要指标就是谱图相似度,任何2个谱图的相似度都在0%到100%之
间。
用户指定允许的最低谱图相似度,只有与提问谱图相似度等于或高于用户指定相似度的谱图才是命中的目标谱图。
考虑到试验误差等因素,有些用户能够接受检索命中的目标谱图的谱峰多于或少于比提问谱图的谱峰。
这种情况可以用命中谱图的特征峰多于提问谱图(谱峰冗余率,或者少于提问谱图(谱峰丢失率来表示。
显然,谱峰丢失率和谱峰冗余率越高,初筛得到候选谱图越多,检索结果的噪音也越大。
但是这2个参数太小,也可能会丢失一些有用的结果。
系统缺省值为30%,用户可以根据自己的情况适当调整。
4.谱图权重谱图权重就是候选谱图与提问谱图比较的时候,强峰、中峰、弱峰和指纹区的谱峰对谱图相似度的权重影响。
权重越大,越能体现出这部分谱峰对谱图相似度的影响。
显然,设置不同的权重值,最后计算得到谱图相似度的数值也会不同。
tips:
如果一个谱图上的特征谱峰大多是强峰,可以适当放大强峰权重,例如设置为1.5,或者1.75,可以凸显出某些谱图特征。
5.谱峰分级前面已经说到强峰和中峰、弱峰对谱图相似度的影响是不相同的。
每个用户对于强峰的概念也不相同,可在此设置强峰下限与中峰下限。
透过率<=强峰下限的谱峰就是强峰,强峰<透过率<=中峰下限的谱峰就是中峰,透过率>中峰下限的就是弱峰。
6.容许误差范围容许误差范围是用户对于谱峰匹配设置的重要参数。
只有2个谱峰的各项数据差距在容许误差范围之内,才被认为是匹配的。
检索参数选择配置完成后,点开始匹配,系统就进行检索,最后得到检索结果列表。
第三步:
检索结果列表查看检索结果按照相似度递减的顺序列表,用户可以点击查看谱图的连接查看谱图,也可以点击谱峰列表查看该谱图的峰数据,方便与提问谱图对照。
把鼠标移动到红外谱图上的峰上,可以在窗口下方的状态栏查看谱图上的对应坐标。
谱图的三个按钮Transmittance,Absorbance,ZoomOutat的使用说明见下一节。
3.2.
4.2相似谱图检索——上载谱图文件检索
40976.368
1.windows下转换工具prn2nyy_win.exe的使用
如已经存在,则会覆盖原有文件。
2.dos下转换工具prn2nyy.exe的使用
3.dos下转换工具asc2nyy.exe的使用
第二步:
谱图文件的上传与取峰系统读取用户上传的nyy文件,对谱峰曲线进行逐点扫描,根据谱图的
曲线变化获得谱峰及各项数据。
基线BaseLineHeightofIRSpectrum(%:
系统在取峰时要先对谱峰曲线进行扫描,透过率大于基线的点不在扫描范围之内。
因此,那些透过率比基线更高的曲线变化不会被纪录,系统也不会计算该段曲线是否有谱峰存在。
取峰上限UpperLimitofPeakTransmittance(%:
扫描曲线获得的谱峰,只有其透过率在取峰上限以下才会被当成有效的谱峰。
取峰上限的值不超过基线值。
例如,系统默认谱图的取峰基线为85%,取峰上限为70%。
那么那些透过率超过85%的点将不会被扫描到,而无视具体的谱图形状。
在85%以下可能有2个谱峰,其透过率分别是71%和69%,在本例中将只取透过率为69%的谱峰,而另一个谱峰(透过率71%则被忽略。
最小峰差MinimumDifferentiationofPeak(%:
谱图的曲线上总是有一些不够平滑的微弱的波动,其中有相当一部分是仪器的噪音。
考虑到红外光谱图的实际应用,系统设置了最小峰差,只有某个波的峰差大于最小峰差的时候,系统才会认为曲线上的一个波是一个真正意义上的谱峰。
那些峰差不够大的波将被认为没有意义。
不同的最小峰差值,决定了某些峰是否会被作为有意义的谱峰而被抓取出来,同时也会影响到其他一些峰的峰数据。
零线校正ZeroErrorofIRSpectrum(cm-1:
零线校正是为了校正谱图由于测量仪器产生的整体红移/蓝移的误差。
正值表示蓝移,负值表示红移,零表示该谱图无需校正。
第三步:
谱峰数据校对与检索参数选择取峰参数设定完毕,点击上载所选文件,系统将自动完成取峰过程,并进入第三步。
3.2.
4.3化合物检索
基本原理用户输入化合物的英文名称,或者CAS号,或者分子式,选择精确检索或者模糊检索。
系统根据用户输入的关键词检索该化合物的红外谱图并列表显示。
输入化合物的名称
提示:
如检索命中结果超过100条谱图纪录,则只显示前面100条纪录。
输入化合物的CAS号
输入化合物的分子式
在化合物检索的结果列表中,可以看到化合物的名称、分子式、CAS号和谱图分类。
一个化合物可能在不同的谱图分类中有多个谱图,也可能在同一个分类中有多个谱图。
不同分类的谱图的形状可能差异较大,即
使是同一个分类的不同谱图,可能也会有较大差异,用户使用时候请务必注意。
3.2.
4.4用户常见问题与解决方案
问:
本系统只接受化合物的英文名称检索,那只有中文名称的化合物怎么检索它的红外谱图?
问:
如果只有化合物的结构,没有名称与CAS号,怎么检索它的红外谱图?
答:
有2种办法。
特别要说明,本工具生成的名字都是IUPAC命名,而红外谱图数据库使用的名字相当一部分是通用的俗名。
如果用系统命名的名字检索不到结果,用户可以尝试用分子式检索。
除了上述的办法,还有第2种办法:
多信息的项目里,可以看到红外光谱的链接。
所有化合物的信息里,出现某个链接项目就表示该化合物拥
有该属性的数据。