Phan Minh Nhật, sinh viên Trường Đại học Bách khoa - Đại học Đà Nẵng, tác giả hệ thống MedCapSys đã giành giải Nhất tại hội nghị Khoa học và Triển lãm Công nghệ 2024-2025.
Hệ thống MedCapSys được phát triển trong hơn một năm với bốn modul chính: MedCapNet (mô hình mã hóa - giải mã chuyên biệt, tự động tạo chú thích ảnh MRI não), GuidedDCNet (mô hình phân loại tổn thương dựa trên khuếch tán, hỗ trợ nhận diện bất thường như u não), GuidedSegDiff (mô hình phân đoạn tổn thương, xác định vị trí, kích thước và số lượng tổn thương) và BrainMedQwen (mô hình ngôn ngữ thị giác, tổng hợp kết quả từ các modul trên để tạo báo cáo chẩn đoán chi tiết).
Hệ thống hiện ở giai đoạn phục vụ nghiên cứu, chưa triển khai thực tế. Các modul thành phần, trong đó có GuidedDCNet đang trong quá trình phản biện tại Tạp chí quốc tế Electronics and Telecommunications Research Institute (ETRI), thuộc danh mục Scopus, xếp hạng Q2.

Các kiến trúc mô hình nhóm của hệ thống MedCapSys. Ảnh: NVCC
Theo Minh Nhật, chẩn đoán ảnh MRI não là một trong những thách thức lớn trong y học hiện đại, vì yêu cầu độ chính xác gần như tuyệt đối và phải tạo được báo cáo tuân thủ đúng quy chuẩn chuyên ngành. Hệ thống MedCapSys được phát triển nhằm nâng độ tin cậy và tính hiệu quả chẩn đoán, đặc biệt trong bối cảnh công nghệ AI hiện vẫn tồn tại hiện tượng "ảo giác", khi máy tự sinh thông tin không có thật.
"Thay vì để AI tự diễn giải toàn bộ bức ảnh, nghiên cứu lựa chọn hướng tiếp cận mới bằng cách cung cấp thông tin bổ trợ cho hệ thống như chuỗi xung, góc chụp, vị trí tổn thương, giúp AI hiểu rõ ngữ cảnh và giảm thiểu sai lệch trong phân tích", Minh Nhật nói. Từ đó, hệ thống có thể tạo ra các báo cáo chẩn đoán giàu thông tin, hỗ trợ đắc lực cho đội ngũ y bác sĩ trong quá trình ra quyết định lâm sàng.
Quy trình hoạt động của MedCapSys bắt đầu từ việc tiếp nhận ảnh MRI đầu vào (dạng 2D hoặc 3D). Sau khi tiền xử lý để chuẩn hóa chất lượng và định dạng, ảnh được chuyển qua các modul phân loại, tạo chú thích và phân đoạn tổn thương. Cuối cùng, mô hình ngôn ngữ tổng hợp dữ liệu và tạo thành một báo cáo chẩn đoán hoàn chỉnh.
Minh Nhật cho biết, với kiến trúc modul, cho phép nâng cấp linh hoạt từng phần mà không ảnh hưởng đến tổng thể. "Các modul được cải tiến qua nhiều phiên bản, ứng dụng kỹ thuật học chuyển giao, nén mô hình, tối ưu hóa kiến trúc để đảm bảo hiệu suất và độ chính xác", Nhật nói.

Minh Nhật cho biết dành nhiều thời gian để đưa trí tuệ nhân tạo vào giải pháp ứng dụng thực tế. Ảnh: NVCC
Dữ liệu huấn luyện hệ thống được tổng hợp từ các nguồn công khai uy tín như cuộc thi Radiology Objects in Context, Multimodal Brain Tumor Segmentation Challenge 2020, cùng các bộ dữ liệu từ Figshare, SARTAJ và Br35H. Nghiên cứu cũng ứng dụng mô hình Segment Anything Model 2 của Meta để hỗ trợ gắn nhãn tự động, kết hợp xử lý thủ công trong các bước tinh chỉnh và chuẩn hóa dữ liệu.
TS Nguyễn Văn Hiệu, Trưởng bộ môn Công nghệ phần mềm, Trường Đại học Bách khoa - Đại học Đà Nẵng, cho biết so với các nghiên cứu cùng lĩnh vực như dự án Med-Gemini của Google, MedCapSys giữ được tính độc đáo khi tập trung vào phân tích ảnh y tế chuyên sâu và tích hợp báo cáo tự động - điều các hệ thống hiện tại chưa khai thác triệt để.
"Chúng tôi hy vọng công trình sẽ góp phần cải thiện hiệu quả chẩn đoán ảnh não trong thực hành lâm sàng, mở ra hướng tiếp cận mới trong ứng dụng AI vào y học", TS Hiệu chia sẻ.
Nhật Minh