基于UrbanSound8K与CNN的音频分类
语音方面的资料不如图像识别的多,所以特地写了一份博客(并不如何严谨),希望可以帮到大家。 我们需要实现10种语音的分类:冷气机,汽车喇叭,儿童玩耍,狗吠声,钻孔,发动机空转,枪射击,手持式凿岩机,警笛,街头音乐 每个录音长度约为4s,被放在10个fold文件中。 我们采用keras(可以简单的认为keras是
语音方面的资料不如图像识别的多,所以特地写了一份博客(并不如何严谨),希望可以帮到大家。 我们需要实现10种语音的分类:冷气机,汽车喇叭,儿童玩耍,狗吠声,钻孔,发动机空转,枪射击,手持式凿岩机,警笛,街头音乐 每个录音长度约为4s,被放在10个fold文件中。 我们采用keras(可以简单的认为keras是