蓝光字幕提取及处理Word格式.docx

上传人:b****3 文档编号:7649451 上传时间:2023-05-08 格式:DOCX 页数:11 大小:865.41KB
下载 相关 举报
蓝光字幕提取及处理Word格式.docx_第1页
第1页 / 共11页
蓝光字幕提取及处理Word格式.docx_第2页
第2页 / 共11页
蓝光字幕提取及处理Word格式.docx_第3页
第3页 / 共11页
蓝光字幕提取及处理Word格式.docx_第4页
第4页 / 共11页
蓝光字幕提取及处理Word格式.docx_第5页
第5页 / 共11页
蓝光字幕提取及处理Word格式.docx_第6页
第6页 / 共11页
蓝光字幕提取及处理Word格式.docx_第7页
第7页 / 共11页
蓝光字幕提取及处理Word格式.docx_第8页
第8页 / 共11页
蓝光字幕提取及处理Word格式.docx_第9页
第9页 / 共11页
蓝光字幕提取及处理Word格式.docx_第10页
第10页 / 共11页
蓝光字幕提取及处理Word格式.docx_第11页
第11页 / 共11页
亲,该文档总共11页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

蓝光字幕提取及处理Word格式.docx

《蓝光字幕提取及处理Word格式.docx》由会员分享,可在线阅读,更多相关《蓝光字幕提取及处理Word格式.docx(11页珍藏版)》请在冰点文库上搜索。

蓝光字幕提取及处理Word格式.docx

不能直接avs加载,亦不能被常用视频压缩软件识别。

须要转换成其他格式字幕文件。

2.处理

如何转换?

目前比较统一的思路是:

suptoidx+subtosrt。

Suptoidx+sub:

这里分2种情况:

sup字幕来自于hddvd以及bdmv

目前bdmv蓝光已经是绝对主流。

以下已来自于蓝光盘的sup为例。

“BDSup2Sub”,系统必须安装“java”软件。

安装java后,在cmd下,进入BDSup2Sub.jar所在目录。

键入“java-jarBDSup2Sub.jar”或“javaw-jarBDSup2Sub.jar”。

打开需要转换的sup文件:

然后:

例如:

为了提高识别率,可以移动字幕位置到黑边上,如图:

然后保存为idx+sub格式。

至此,我们就可以直接avs加载idx压制了。

然而idx+sub字幕是图片字幕,受限于字体等因素。

可能导致画面看上去不太美观。

那就可能需要把sub转换成srt文本字幕了。

srt部分

概念:

1.sub格式,由一个sub文件和一个idx文件组成。

2.sub文件中其实是一幅幅背景透明的图片,而idx则是index文件,引导显示每幅图片的时间。

3.sub字幕不能直接转换,而是要通过一种叫OCR(OpticalCharacterRecognition)的方法,也就是光学字符识别技术。

方法1:

“subrip”+“SubToSrt”

A。

用SubRip将sub文件转换为bmp图片

1.首先安装SubRip,选择安装所有。

2.打开SubRip->

文件->

打开Vob文件

3.打开文件目录->

选定sub->

语言数据流选Chinese->

右面操作里选字幕图片保存为4bit的BMP文件,以及在加时间和尺寸上打勾->

开始

4.输入任意文件名->

保存

5.预设里选I-Author->

选取CustomColorsandContrast->

把颜色#1-4全部选择成白色(#1-4分别代表字芯、字框、背景、消除走样,每个字幕的#1-4所代表的都不一样)->

一一测试哪一个为字芯,设为黑色,其他3项全部为白色,重要!

->

点选确定

6.SubRip自动将每一幅图片保存为BMP,并且加上相应时间顺序

输出格式->

设置输出格式->

Textformats下的SubRip(*.srt)->

转换成此格式

另存为->

7.关闭SubRip

B。

SubToSrt3.11的使用

1.绿色软件,直接解压开即可使用。

2.运行SubToSrt.exe->

打开SRT或SSA文件->

选取刚才保存的srt文件

3.图片处理->

自动裁剪->

确定(推荐使用此步骤,可以使识别更快)

4.依照字幕调节空格检测设置、空格宽度设置、行高检测设置的灵敏度

5.识别->

开始识别

当遇到不认识的字时,会自动跳出小窗口要求丰富字库,输入该字,按回车即可

当遇到半个字的时候,如图,按扩展(Alt+E),即可显示全字

如果前面一个字打错,可以在小框中修改该字,程序会自动从该字所在行开始识别

6.识别完毕后,会自动替换已知错误词组。

7.这时,可以随便看一下字幕,如有需要,可以略做修改(如:

原sub字幕中就是错误的)

8.文件->

保存为SRT或SSA格式

C.字幕修改校对

1.文件->

打开可对照的字幕文件->

选取已经转换好的srt/ssa文件

2.修改左面或者右面的字幕都可以,修改完毕后,点击保存

此方法的识别率及速度取决于字库文的大小。

字库越多则越高效。

方法2:

“MODI”+“IdxSubOcr”(个人建议使用)

所谓modi即“MicrosoftOfficeDocumentImaging”。

(貌似只能在MicrosoftOffice2003下调用,反正我的2010是怎样也打不开)

首先,必须安装MicrosoftOfficeDocumentImaging,建议在安装MicrosoftOffice2003时候把全部组件选上。

然后,打开IdxSubOcr(绿色软件):

如下图

然后,短暂的过程,相对于第一个方法来说快了不知多少倍了:

最后,

这种方法声称是目前识别率最高的,可达到98%。

然而余下的2%也是需要耗费大量的时间修正的。

所以,如果不是对字幕有苛刻的要求,建议直接采用idx+sub的图形字幕压制。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2