Fake Voice Detection System

何かこの音声は変だな? 違和感があるな? を解決します。

Fake Voice Detection Systemは、この疑問を解明します。その音声データと真正のデータを比較し、偽物か本物かの確率を計算します。どういう声の所が、おかしいかという根拠を、分かり易く図示します。

話者を認識し、「なりすまし」を見破ります。

音声は、音響学的には、
  • 基本周波数(Pitch)
  • 強度(音の強弱、音圧)(intensity,sound pressure,stress,accent,信号の強さの変化)
  • 音の速度(tempo,duration)
  • スペクトル特性(distribution of energy at different parts of the audible frequency range,周波数成分の生起消滅)

に分類(諸説有)され、感情表現、発声の休止、等が加味されたこれらの基本要素の組み合わせを定量的に測地し解析します。

FVDシステム 音声の特徴量抽出手法

Standard
  • MFCC
  • Mel Spectrum
  • Cepstrum
  • STFT/FFT
  • Envelope Spectrum
  • Bark Spectrum
Neural Network
  • i-vector/x-vector

音声を画像化し画像で識別(CNN)

  • Grad-CAM/Occlusion Sensitive/LIME/ – –

使用ツール

  • MATLAB: Audio tb, Deep Learning tb, Signal Processing tb,  Statistics and Machine Learning tb, Wavelet tb, DSP System tb
  • NCH: WavePad
  • Adobe Audition

Fake Voice Detection Serviceの流れ

  • お客様には、fake(偽の声では無いか?)という音声の録音データ(ex.30秒)と真正の音声データ(fakeと同じ、単語、短文を含む)を送付願います。
  • 当社のFVDシステムで解析し、fakeかどうかの確率を算出します。その確率値算出の根拠を判りやすい図で明示します。
  • 判定期間は、データ入手後、通常3日間、Standard FVDシステムで価格は10万円(税抜)です。
  • お申し込みは、メール(info@brsystems.jp)でお願いします。