程序代写代做代考 做成windows程序

做成windows程序
训练过程
1. 输入整段音频事件经过语音激活检测技术对其进行分段,只保留有效音频段
2. 提取每段音频的梅尔倒谱系数MFCC作为音频特征
3. 把所有音频段利用模糊聚类方法生成高斯原子码本V={a1,a2, …, aM}
4. 利用高斯原子码本对每段音频进行模糊量化,每一段的得到量化结果Yi ={fi1a1 , fi2 a2, …, fiM aM}i
5. 计算第i段音频事件中第j个原子的TF-IDF系数:

6. 保留系数最大的前K个原子为最终的量化结果(K有人为设置,此处系数T就是上面的TF_IDF)

7. 利用TF-IDF系数计算两两音频事件的相似度

8. 对第一个事件手动给个标签,电脑识别出的相似的自动给相同的标签。接着对下一个未标注的进行标注,直到全部标完

9. 经过手动标注后,相同标签的为一类,每类音频事件训练一个GMM模型
上面的(1.2.3.4.9)都有代码

监控过程
1. 监听的时候,对进来的音频文件也是先经过语音激活检测技术对其进行分段,只保留有效音频段。对其进行识别
2. 识别结果有三种:新事件,已有事件_正常(训练过程所出现每类音频事件都属于此情况),以有事件_告警
3. 对于判断为新事件的情况,人工分类,此时可分为正常,告警两类。正常的手工给个标签,进入已有事件_正常,同理告警的进入已有事件_告警

Posted in Uncategorized

Leave a Reply

Your email address will not be published. Required fields are marked *