您的当前位置:首页正文

如何将蓝光SUP字幕OCR成srt字幕(一)

2022-04-06 来源:易榕旅网


按语:正规的商业片,一般导演会把剧本的台词交给剪辑师,根据台词来制作字幕,虽然导演或演员在拍摄过程中,时常会因某种需要即兴发挥,改变台词,不一定完全按剧本的台词来拍戏,但大体上改动的幅度不会太大。有些低成本电影,剧本边拍边改,拍到哪里算哪里,最终可能没有完整的台词,剪辑师做完终剪,需要自已根据成片来制作字幕,敲定字幕。

本文以一部正版蓝光DVD的电影片段为例,说说如何根据成片来制作字幕。

1、由于片源是蓝光m2ts格式,可以用tsMuxerGUI工具将里面需要的东西提取出来,当然,也可以用eac3to来提取。

PR可以直接导入m2ts这种封装格式,支持AC3音轨,但不支持DTSHD音轨,也不支持PGS这种类型的字幕,因此,

将DTSHD音轨和PGS字幕单独提取出来。

另外,AC3音轨是中文配音,是声道,我们打包时不准备用它,听写字幕时,只作为参考之用。我们打包时,准备采用DTSHD英文音轨,因为它是声道,质量比AC3更好。

PGS字幕提取后,会得到一个后缀为sup的字幕文件。

2、用SubtitleEdit导入sup格式的字幕文件。“文件”->“导入/OCR蓝光字幕…”,选中sup字幕,按<打开>

3、弹出OCR的窗口。什么是OCR?

通俗来理解,蓝光碟里的字幕,它是以图片的形式,而不是以文本文字的形式来显示,每一行字幕对应于一张图片。要将蓝光里的字幕提取出来,提取成文本格式,目前只能用OCR这种技术手段。由于汉字的结构比英文字母复杂得多,用OCR的手段来识别汉字,目前最多只能达到98%左右的识别率、准确率,也就是说,有的汉字可能会识别不出来,或者识别错误。这时候,需要在OCR的基础上,对OCR识别出来的错误字幕,进行手工修改,还是比较费事。

OCR的好处是,可以将整个片子的所有字幕自动识别出来,不需要手工一行一行地敲入字幕,可以大大提高效率。由于SubtitleEdit里的OCR功能,对中文简体的支持不大好,识别率不高,所以,暂时放弃OCR的手段,准备用手工的方式录入字幕。OCR如何操作,参见

4、录完了第一行字幕,再用鼠标点击第二行的时间轴(编号为2的时间戳),录入第二行字幕;依此类推,从第一行,一直录到最后一行,所有字幕录完后,从头到尾检查一遍,是否有漏字、错别字现象,检查无误后,按<确定>

5、这是录好的字幕,这个纪录片的片段,一共有129行字幕。

6、然后,按“同步”->“更改帧率”,“到帧率”设为24,转成24p,按<确定>;

7、用“另存为…”的方式,另存为(这个字幕可以用来分卷操作)

8、操作结束。

因篇幅问题不能全部显示,请点此查看更多更全内容