
Việc chú thích các vùng quan tâm trong hình ảnh y tế, một quy trình được gọi là phân đoạn (segmentation), thường là bước đầu tiên mà các nhà nghiên cứu lâm sàng thực hiện khi tiến hành một nghiên cứu mới có liên quan đến hình ảnh sinh y học.
Ví dụ, để xác định kích thước hồi hải mã (hippocampus) trong não thay đổi như thế nào khi bệnh nhân già đi, các nhà khoa học phải khoanh vùng từng hồi hải mã trong một loạt ảnh quét não. Với nhiều cấu trúc và loại hình ảnh, đây thường là một quy trình thủ công rất tốn thời gian, đặc biệt khi các vùng cần nghiên cứu khó xác định ranh giới rõ ràng.
Để đơn giản hóa quá trình này, các nhà nghiên cứu MIT đã phát triển một hệ thống dựa trên trí tuệ nhân tạo cho phép các nhà khoa học nhanh chóng phân đoạn tập dữ liệu hình ảnh sinh y học mới bằng cách nhấp chuột, vẽ nguệch ngoạc hoặc tạo khung hộp trên hình ảnh. Mô hình AI này sử dụng các tương tác đó để dự đoán việc phân đoạn.
Khi người dùng đánh dấu thêm nhiều hình ảnh, số lượng tương tác cần thiết sẽ giảm dần, cuối cùng giảm xuống bằng 0. Khi đó, mô hình có thể phân đoạn chính xác các hình ảnh mới mà không cần thêm bất kỳ đầu vào nào từ người dùng.
Điều này khả thi vì kiến trúc mô hình được thiết kế đặc biệt để tận dụng thông tin từ những hình ảnh đã được phân đoạn trước đó nhằm đưa ra dự đoán cho những ảnh tiếp theo. Khác với các mô hình phân đoạn hình ảnh y tế khác, hệ thống này cho phép người dùng phân đoạn toàn bộ tập dữ liệu mà không cần lặp lại công việc cho từng hình ảnh.
Ngoài ra, công cụ tương tác này không cần một tập dữ liệu đã được phân đoạn sẵn để huấn luyện, vì vậy người dùng không cần chuyên môn về học máy hay tài nguyên tính toán phức tạp. Họ có thể sử dụng hệ thống cho một nhiệm vụ phân đoạn mới mà không cần huấn luyện lại mô hình.
Về lâu dài, công cụ này có thể đẩy nhanh các nghiên cứu về phương pháp điều trị mới và giảm chi phí của thử nghiệm lâm sàng cũng như nghiên cứu y học. Nó cũng có thể được bác sĩ sử dụng để nâng cao hiệu quả của các ứng dụng lâm sàng, chẳng hạn như lập kế hoạch xạ trị.
“Nhiều nhà khoa học có thể chỉ phân đoạn được vài hình ảnh mỗi ngày cho nghiên cứu của họ vì việc phân đoạn thủ công quá tốn thời gian. Chúng tôi hy vọng hệ thống này sẽ mở ra cơ hội khoa học mới bằng cách cho phép các nhà nghiên cứu lâm sàng tiến hành những nghiên cứu mà trước đây họ không thể làm vì thiếu công cụ hiệu quả”, Hallee Wong, nghiên cứu sinh ngành kỹ thuật điện và khoa học máy tính, tác giả chính của bài báo giới thiệu mô hình này cho biết.
Tối ưu hóa phân đoạn
Hiện có hai phương pháp chính mà các nhà nghiên cứu sử dụng để phân đoạn tập hình ảnh y tế mới:
Phân đoạn tương tác: Người dùng nhập một hình ảnh vào hệ thống AI và đánh dấu các vùng quan tâm. Mô hình sẽ dự đoán phân đoạn dựa trên các tương tác đó. Một công cụ do nhóm MIT phát triển trước đây, ScribblePrompt, cho phép thực hiện việc này nhưng phải lặp lại cho từng ảnh mới.
Phân đoạn tự động theo nhiệm vụ: Xây dựng mô hình AI chuyên biệt để tự động phân đoạn. Phương pháp này đòi hỏi phân đoạn thủ công hàng trăm hình ảnh để tạo tập dữ liệu huấn luyện, sau đó huấn luyện mô hình học máy. Mỗi khi có nhiệm vụ mới, người dùng phải bắt đầu lại toàn bộ quy trình phức tạp này, và nếu mô hình sai, không có cách nào chỉnh sửa trực tiếp.
Hệ thống mới, MultiverSeg, kết hợp ưu điểm của cả hai. Nó dự đoán phân đoạn cho một ảnh mới dựa trên các tương tác (ví dụ như vẽ nguệch ngoạc) nhưng cũng lưu từng ảnh đã phân đoạn vào một tập ngữ cảnh (context set) để tham khảo sau này.
Khi người dùng tải ảnh mới lên và đánh dấu, mô hình dựa trên tập ngữ cảnh để dự đoán chính xác hơn với ít thao tác hơn. Thiết kế kiến trúc cho phép tập ngữ cảnh có kích thước bất kỳ, giúp công cụ linh hoạt trong nhiều ứng dụng.
“Đến một lúc nào đó, cho nhiều nhiệm vụ, bạn sẽ không cần cung cấp thêm tương tác. Nếu có đủ ví dụ trong tập ngữ cảnh, mô hình có thể tự dự đoán chính xác phân đoạn,” Wong giải thích.
Mô hình được huấn luyện trên bộ dữ liệu đa dạng để đảm bảo khả năng cải thiện dần dự đoán theo phản hồi của người dùng. Người dùng không cần huấn luyện lại mô hình cho dữ liệu mới - chỉ cần tải hình ảnh y tế mới và bắt đầu đánh dấu.
Trong các thử nghiệm so sánh với công cụ tiên tiến khác, MultiverSeg vượt trội hơn về hiệu quả và độ chính xác.
Ít thao tác hơn, kết quả tốt hơn
Khác với công cụ hiện có, MultiverSeg cần ít đầu vào hơn ở mỗi hình ảnh. Đến hình ảnh thứ 9, nó chỉ cần 2 cú nhấp chuột để tạo ra phân đoạn chính xác hơn mô hình chuyên biệt cho nhiệm vụ.
Với một số loại hình ảnh như X-quang, người dùng có thể chỉ cần phân đoạn thủ công 1-2 ảnh trước khi mô hình đủ chính xác để dự đoán phần còn lại.
Khả năng tương tác cho phép người dùng sửa kết quả dự đoán, lặp lại cho đến khi đạt độ chính xác mong muốn. So với hệ thống trước, MultiverSeg đạt 90% độ chính xác chỉ với 2/3 số nét vẽ và 3/4 số cú nhấp chuột.
“Với MultiverSeg, người dùng luôn có thể thêm tương tác để tinh chỉnh dự đoán AI. Điều này vẫn giúp tăng tốc quá trình đáng kể vì việc chỉnh sửa nhanh hơn nhiều so với làm lại từ đầu,” Wong nói thêm.
Trong tương lai, nhóm nghiên cứu muốn thử nghiệm công cụ này trong thực tế lâm sàng, cải thiện dựa trên phản hồi và mở rộng khả năng phân đoạn sang ảnh sinh y học 3D.
Nghiên cứu được hỗ trợ một phần bởi Quanta Computer, Inc., Viện Y tế Quốc gia Hoa Kỳ (NIH) và phần cứng từ Massachusetts Life Sciences Center.
(Nguồn: MIT News)
Nguồn: https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html
Bình luận (0)