なるほど〜入力された音声ってある程度分類できるもんなんですね。
その中からdBと周波数帯でフィルタをかけてある程度の環境音を除いたものを抜き出してから、その特徴をマッチングすればいいんだ。
といっても莫大な量だなあ〜
実際の適正値を解析してみよう。パターンが見つかるかな〜?