TabNet, U-Net を用いた Abnormalな赤血球画像の解析

今回は、" Analysis of Vision-based Abnormal Red Blood Cell Classification "という論文について紹介していきます！

Analysis of Vision-based Abnormal Red Blood Cell Classification

Identification of abnormalities in red blood cells (RBC) is key to diagnosing a range of medical conditions from anaemia to liver disease. Currently this is don...

論文情報
著者 : Annika Wong, Nantheera Anantrasirichai, Thanarat H. Chalidabhongse, Duangdao Palasuwan, Attakorn Palasuwan, David Bull
(Submitted on 1 Jun 2021)

この論文の構成
イントロダクション

この論文の構成

Introduction
Materials (モデルを学習するためのデータセットとデータ処理)
データの不均衡
異常細胞の検出とRBCタイプの分類の自動化手法
各手法の性能評価
結論

イントロダクション

赤血球の分析

　赤血球(Red Blood Cells)は、体内に酸素を運搬する役割を持っているものですが、この構造に異常があるとどうなるでしょうか？酸素の供給不足により様々な症状を引き起こす可能性があります。
　それを防ぐためには、異常な赤血球がないかを顕微鏡で目視して確認するのが従来の方法でしたが、これは時間が膨大にかかります。

　そこでこの論文では、機械学習手法を用いてプロセスを自動化することを提案しており、
これにより診断の効率の向上や、検出精度の担保ができることが期待されています！
　この記事では、その分析のアプローチや解決すべき課題などを取り上げて紹介していきます！

従来・最近の機械学習モデルの適用

　多くの研究で細胞分類に機械学習モデルが使われていたが、その流れとしては以下のようなものである。

< 従来の手法 >
形態学的特徴やテクスチャー特徴からサポートベクターマシン（SVM）に基づくモデルを構築

< 最近の手法 >
人工ニューラルネットワーク（ANN）
畳み込みニューラルネットワーク（CNN）
事前学習済みの U-Netアーキテクチャなど　の活用

分類の精度を上げるための課題

分類の精度を上げるための課題は多くあり以下のようなものがあげられる。

training dataset が少ない
データが不均衡 (imbalanced data)
1つのデータのみを分類すること
1つの疾患のみを分類する、または分類クラス数が少ない
特徴量が少ない (10未満)
重複するセルの破棄

　Hegdeら（2018）によると既存の自動化された手法は、特定の疾患を検出することしかできず、広範囲の異常を検出するには至っていないと指摘されており、汎用的な検出までは至っていない部分もある。
　また主な問題点の1つとしてあげられることは、これらの手法が照明や色の変化に対してロバストではないことである。そのためこの論文では、多数の異常細胞クラスを検討し、多数の特徴を調査している。さらに、画像の品質は様々で、細胞のエッジ部分にぼかしが入っていたり、色にばらつきがあったりするが、このような違いを利用することで、モデルのロバスト性の向上を試みている。

　また、最も重要な課題としてあげられるのは、データセットが偏っていることがあげられる。この論文でのデータセットでは11の細胞タイプに分けられるが、1%~30%で分布しているためバランスがとれたデータといえず、情報が少ないクラスを認識するのは難しくなっている。

Approach

　この論文では、2つの手法を用いて、不均衡なデータセットの問題に取り組んでいる
　1つ目の手法は、Synthetic Minority Over-sampling Technique (SMOTE) (Chawla et al., 2002) を用いた特徴空間の拡張手法
　2つ目の手法は、コスト重視の学習アプローチ(He and Garcia, 2009)
これら2つの手法の組み合わせを考え、赤血球(RBC)分類の全体的な改善につなげている。

性能比較

　この論文では、赤血球(RBC)分類におけるTabNetとU-Netの性能を、伝統的な機械学習法であるSVMと比較し、学習したモデルの性能に影響を与える特徴やRBCの種類についても分析している。

TabNet

　TabNetは、Google Cloud AI (Arik and Pfister, 2019）によって提案された、表形式データのための深層学習アーキテクチャ。
　画像やテキスト、音声を含むタスクはDNNの恩恵を受けている一方、表データを使用するタスクには恩恵が得きれていないことから考案されている。

abnormal or normal 細胞の2値分類

	f2 - scores	accuracy
SVM	0.948	0.969
TabNet	0.942	0.965

U-Net

細胞タイプの 11値分類

	average f2 - scores
SVM	0.782
TabNet	0.730

　U-Net (Ronneberger et al.) は、biomedical分野での画像セグメンテーションのために開発された深層学習ネットワーク。
　汎用性も高く、その効率性と実装のシンプルさから、他のアプリケーションのセマンティックセグメンテーションのための一般的なアーキテクチャの1つとなっている。

細胞タイプ 6クラスでの分類精度