Arctime提供了根据音频信号,自动切分音频,并且产生空白字幕块的功能。如果你要从头开始制作字幕(没有字幕稿)的话,那么这个功能将比较有用。
自动切分是根据门限和卷积算法工作的,首先确定一个门限值,大于该值的信号会被认为是语音信号。门限值可以用来过滤底噪、背景音乐等。然后设置下最短静音时长和最短语音时长,来确定切分的粒度。最后设置语音的提前量和延长量,给字幕前后增加呼吸空间。
用于自动切分的音频,要使用比较干净的纯人声或者只带有轻微背景音乐的音频。不适用于人声与其他声音严重混杂在一起的素材。