人間の目では判定の難しい和柄の種類を,人工知能を用いて複数同時識別するシステムを検討した.システム評価のための和柄画像データセットを構築し,また構築したデータセットを用いた和柄画像の識別実験を行った.またマルチラベルでの実験となることから,学習させたことのない未知の和柄カテゴリを入力した際の反応も観察すべく実験を行った.データセットについては和柄 18 カテゴリ,画像総枚数 663 枚という規模で,なおかつ複数の和柄カテゴリを含むマルチラベルを付与し構築した.本実験では構築した和柄画像から特徴量を抽出し,抽出した特徴量を次元圧縮したものを SVM によって学習させるという手法の有効性を示すべく実験を行う.
マルチラベル識別実験における手法のうち和柄画像を学習済みのモデルに入力する必要があるため,初めに和柄 18 カテゴリ,画像総枚数 662 枚という規模の和柄画像データセットを学習させる実験を行い,そこで和柄特徴検出器をえた.実験では ImageNet データセットで学習済みのResNet-18 モデルを使用しファインチューニングを行ったところ,平均の top-1 正解率は 75%,top-3 正解率は 93% となり,人の目では判別しにくい和柄・文様を比較的高精度に認識できるという結果をえた.またえられた精度より,今回実験にて作成した識別モデルが和柄検索システムとして十分利用できることが確認できた.だが当初懸念していたように 2 つ以上の和柄カテゴリを含む画像に対して精度が下がるという課題点が残った.
課題を解決すべく,実験でえた特徴検出器となるモデルを使用し,マルチラベルに対する識別実験を行ったところ,既存のラベル,また未知のラベルに対しても有効な結果をえた.和柄識別実験の結果と比べて全体としての精度は下がったものの,本実験で構築した学習済みの ResNet-18から特徴量を抽出し,PCA 次元圧縮を行った特徴量を SVM を用いて学習するという手法の有効性を示す結果となった.
上記 2 つの実験結果でえた学習済みモデルを使用することで,和柄識別システムが実現可能となったため,デモとなる WEB アプリを 2 つ作成した.1 つは画像に含まれる和柄が 1 つのカテゴリの場合,入力画像の和柄が登録されている和柄画像のうち,どの和柄カテゴリに似ているかをランキング形式で表示する.さらに遷移先のページにて選択された和柄に関する意味を表示するシステムである.もう 1 つはマルチラベルでの識別を可能とし,また登録されていない未知のカテゴリに対しては,未知ラベルであると返すシステムである.こちらについては本研究における課題の 1 つ,和柄画像データセットの構築という点において活用できる可能性がある.今後研究を発展させるうえで重要なツールとなる可能性を秘めている.
担当教授からのコメント