执行命令提取mfcc后返回的是什么?

我一直在学习声音分析,我在其中遇到了术语mfcc.所以当我执行命令提取mfcc后,返回的是什么?librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40) 我得到的numpy数组形状为40乘216.所以我得到的是我已经提取了40个特征在216个帧.但这里到底是什么意思帧,它是类似于采样率和我们在加载音频文件时定义它。

解决方案:

什么不是马上就能看出来的呢?《多边基金公约》文件 是,它叫 librosa.feature.melspectrogram. 内部。而且 melspectrogram 有参数 win_lengthn_ffthop_length,它们定义了一个 . 你也可以将这些参数传递给 mfcc.

那么什么是帧呢?基本上,它是处理一堆原始样本的结果。假设窗口长度为2048个样本(这是默认值),跳长为512(也是默认值),每一个由 mfcc 对应于2048个原始样本,是512个样本 “进一步的音频 “比它的前身。换句话说,帧之间有明显的重叠。

举个例子,要为你的音频创建mfcc,定义一帧为1024个样本,跳长为512,你可以调用。

librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40, hop_length=512, n_fft=1024)

同样的,如果你没有明确的传递这些参数,那么默认的是: 谱图 被使用。

给TA打赏
共{{data.count}}人
人已打赏
解决方案

为什么我所有的文件上传都跳过 else if 条件?

2022-4-21 1:00:13

解决方案

在一个列表上循环--两种方法有区别吗?

2022-4-21 1:00:15

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索