埼玉大学 工学部 情報工学科
埼玉大学大学院 理工学研究科 数理電子情報専攻


研究紹介


島村研究室では、ディジタル信号処理とその応用に関する研究を行っています。ここでは、各分野の研究内容の一例を紹介します。

音声信号処理

高雑音環境下でのEnd-to-End音声強調・雑音除去


音声強調とは、ノイズを含む音声の中から音声のみを抽出する技術であり、音声品質の向上に寄与します。近年、スマートフォンやPCといった情報端末デバイスを用いたコミュニケーションの需要が高まっており、あらゆる音響環境においても快適に会話が出来ることが求められています。それを実現するための技術として、音声強調が注目されています。音声強調において、ノイズと音声を判別するために、深層学習(Deep Learning)が用いられます。訓練データとしてノイズを含む音声、正解データとしてクリーンな音声を与え、大量の音声データセットのペアを学習させることで、音声とノイズを判別することが可能なモデルが作成されます。

音声強調の概要

音響信号処理

高速・高精度なアクティブノイズコントロール技術の開発


アクティブノイズコントロール(ANC)とは、騒音に対して逆位相の音波を干渉させることで騒音を打ち消す技術です。例えば、イヤホンや自動車などに応用されており、人々の生活をより快適にするものとして活用されています。本研究室では、フィードバック型ANCの計算量削減や制御性能の向上、騒音収束速度の高速化を目的として研究を行っています。フィードバック型ANCとはANCの方式の1つで、もう1つの方式であるフィードフォワード型ANCと比較しサイズがコンパクトであることが特徴です。従来法よりもさらに性能の良いフィードバック型ANCが実用化されれば、ANCが現在以上に様々な場面で活躍することが期待されます。

ANC前後のスペクトログラム

通信信号処理

独立成分分析を用いた自動変調分類器の精度向上


深層学習を用いて、通信における受信信号の変調方式を推定する自動変調分類の研究を行っています。自動変調分類は、通信効率を向上させるため、通信路環境に合わせて動的に変調方式を切り替える際に用いられる技術です。I/Q サンプルとA/P サンプルの二つの入力形式を用いたマルチタスク学習方式であるMLDNNを学習モデルとして用いました。推定精度向上のため、入力に用いる信号点に独立成分分析(ICA)を適用し、学習の妨げとなっているフェージングによる信号点の歪みを補正するような前処理を加えました。

送信信号(上), 受信信号(左下), ICA信号点(右下)

画像信号処理

補助情報を学習に用いた画像補完


物体の一部(人間の顔など)が大きく切り取られた画像の補間について取り組んでいます。

物体の構造よりも背景の補間が優先されてしまうという問題に対し、エッジ情報やを学習させ、物体の形状情報を保持したり、Transformerというモデルを用いて物体のパーツ同士の関係度を学習させるなどにより、解決を図っています。さらに写真に付属する位置情報をもとに、上空写真情報を用いて物体を補完する手法を開発しています。

画像補完の例とネットワーク

エッジデバイス搭載に向けた動画雑音除去の高速化


カメラ等で動画を取得する際に生じる雑音の除去に関する研究に取り組んでいます。

撮影環境の照明変動や被写体・カメラの動き、カメラセンサーの品質によって雑音が付与された動画は、物体検知や追跡が困難になってしまうため、カメラが物体の正確な位置や動きを検出できなくなってしまいます。このような問題を解決するために、動画の雑音除去技術が必要とされています。本研究室では、演算速度向上が見込めるデータ型であるFP16やPixel Shuffleを用いることによって、雑音除去システムの高速化を図った研究を行っています。提案法では、実際に従来の手法と比較して75%の計算時間を削減することに成功しました。また、雑音除去技術の高速化によって、実際のリアルタイムシステムへの導入が可能になります。

動画雑音除去の概要