我正在做信号处理,并使用librosa.load
加载音频(librosa).但我对librosa.load(path, *, sr=22050, mono=True, offset=0.0, duration=None)
中的参数感到困惑.
我的问题是offset
参数,这个引用中的偏移量意味着音频开始的N秒.然而,这真的叫做开始吗?通常,开始指的是音符或声音的开始,而偏移指的是音符的结束.
或者也许我误解了它?
我正在做信号处理,并使用librosa.load
加载音频(librosa).但我对librosa.load(path, *, sr=22050, mono=True, offset=0.0, duration=None)
中的参数感到困惑.
我的问题是offset
参数,这个引用中的偏移量意味着音频开始的N秒.然而,这真的叫做开始吗?通常,开始指的是音符或声音的开始,而偏移指的是音符的结束.
或者也许我误解了它?
偏移量只是开始加载的剪辑的秒数,这是正确的.这里使用"补偿"这个词作为论元,这与你所说的另一个意思是脱节的.我认为这只是"术语超载"在不同上下文中的症状(我认为这的真正名称是"语义超载").
要自动检测音符在哪里开始或结束,需要比Load方法做更多的工作:它只是将声音文件的数据加载到一个值数组中.如果将偏移量设置为2.0(2秒),则只会跳过您正在导入的声音的前sample_rate * 2
个样本.