レッスン90の画像.png
AIアプリケーションが医療画像診断をサポート。写真:Midjourney

医用画像内の関心領域に注釈を付ける(セグメンテーションと呼ばれるプロセス)ことは、多くの場合、臨床研究者が生物医学画像に関する新しい研究を行う際に行う最初のステップです。

例えば、患者の海馬の大きさが加齢とともにどのように変化するかを調べるには、 科学者は一連の脳スキャン画像から各海馬をマッピングする必要があります。海馬の構造や画像の種類が多岐にわたるため、特に関心領域の境界が明確でない場合は、時間のかかる手作業となることがよくあります。

このプロセスを簡素化するため、MITの研究者たちはAIベースのシステムを開発しました。このシステムにより、科学者は画像上でクリック、落書き、または四角を描くだけで、新しい生物医学画像データセットを迅速にセグメント化できます。AIモデルはこれらのインタラクションを用いてセグメント化を予測します。

ユーザーがより多くの画像をタグ付けするにつれて、必要なインタラクションの数は減少し、最終的にはゼロになります。その後、モデルはユーザーからの追加入力なしに、新しい画像を正確にセグメント化できるようになります。

これは、モデルアーキテクチャが、以前にセグメント化された画像の情報を活用して後続の画像の予測を行うように特別に設計されているため可能です。他の医用画像セグメンテーションモデルとは異なり、このシステムでは、画像ごとに作業を繰り返すことなく、データセット全体をセグメント化できます。

さらに、このインタラクティブツールは、学習に事前にセグメント化されたデータセットを必要としないため、ユーザーは機械学習の専門知識や複雑な計算リソースを必要としません。モデルを再学習することなく、このシステムを新しいセグメンテーションタスクに使用できます。

長期的には、このツールは新たな治療法の研究を加速させ、臨床試験や医学研究のコストを削減する可能性があります。また、医師が放射線治療計画などの臨床応用の効率を向上させるためにも活用できる可能性があります。

「多くの科学者は、手作業によるセグメンテーションに時間がかかりすぎるため、研究のために1日に数枚の画像しかセグメンテーションできないかもしれません。このシステムによって、臨床研究者がこれまで効果的なツールの不足のために実施できなかった研究を実施できるようになり、新たな科学的機会が拓かれることを願っています」と、このモデルを紹介する論文の筆頭著者である電気工学およびコンピュータサイエンスの博士課程学生、ハリー・ウォン氏は述べています。

セグメント最適化

現在、研究者が新しい医用画像セットをセグメント化するために使用する主な方法は 2 つあります。

インタラクティブなセグメンテーション:ユーザーはAIシステムに画像を入力し、関心領域をマークします。モデルはこれらのインタラクションに基づいてセグメントを予測します。MITチームが以前に開発したツール「ScribblePrompt」を使えば、この処理が可能ですが、新しい画像ごとに同じ処理を繰り返す必要があります。

タスクベースの自動セグメンテーション:セグメンテーションを自動化するために、専用のAIモデルを構築します。この方法では、数百枚の画像を手動でセグメンテーションしてトレーニングデータセットを作成し、機械学習モデルをトレーニングする必要があります。新しいタスクが発生するたびに、ユーザーはこの複雑なプロセス全体を最初からやり直す必要があり、モデルに誤りがあった場合、直接編集する方法はありません。

新しいシステム「MultiverSeg」は、両方の長所を兼ね備えています。落書きなどのインタラクションに基づいて新しい画像のセグメントを予測するだけでなく、セグメント化された各画像をコンテキストセットに保存して、後で参照できるようにします。

ユーザーが新しい写真をアップロードし、マークアップすると、モデルはコンテキストセットを利用して、より少ない作業でより正確な予測を行います。アーキテクチャ設計により、あらゆるサイズのコンテキストセットに対応できるため、このツールは多くのアプリケーションに柔軟に対応できます。

「多くのタスクでは、ある時点で追加のインタラクションを提供する必要がなくなります。コンテキストセットに十分な例があれば、モデルは単独でセグメントを正確に予測できます」とウォン氏は説明します。

このモデルは多様なデータセットでトレーニングされており、ユーザーからのフィードバックに基づいて予測精度が段階的に向上します。ユーザーは新しいデータに合わせてモデルを再トレーニングする必要はなく、新しい医療画像を読み込み、ラベル付けを開始するだけです。

他の最先端ツールとの比較テストでは、MultiverSeg は効率と精度において優れています。

より少ない労力でより良い結果

既存のツールとは異なり、MultiverSeg は画像1枚あたりの入力が少なくて済みます。9枚目の画像では、わずか2回のクリックで、タスク固有のモデルよりも正確なセグメンテーションを生成できます。

X 線などの一部の種類の画像では、モデルが残りの画像を予測できるほど正確になるまで、ユーザーは 1 ~ 2 枚の画像を手動でセグメント化するだけで済む場合があります。

インタラクティブ機能により、ユーザーは予測を修正し、望ましい精度に達するまで反復することができます。以前のシステムと比較して、MultiverSegはわずか3分の2のストロークと4分の3のクリックで90%の精度を達成しました。

「MultiverSegを使えば、ユーザーはいつでもインタラクションを追加してAIの予測を洗練させることができます。編集作業はゼロから始めるよりもはるかに速いため、プロセスは大幅にスピードアップします」とウォン氏は付け加えた。

今後、チームはこのツールを臨床現場でテストし、フィードバックに基づいて改善し、セグメンテーション機能を 3D バイオメディカル画像に拡張したいと考えています。

この研究は、Quanta Computer社、米国国立衛生研究所(NIH)、マサチューセッツ生命科学センターのハードウェアによって部分的に支援されました。

(出典:MITニュース)

出典: https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html