Deep-learning hỗ trợ chẩn đoán cho MRI khớp gối

21/01/2019

Chụp cộng hưởng từ (MRI) đầu gối là phương pháp thường được dùng để chẩn đoán tổn thương khớp gối. Tuy nhiên, việc giải thích MRI đầu gối tốn nhiều thời gian và có thể bị lỗi chẩn đoán. Một hệ thống tự động để giải thích MRI đầu gối có thể ưu tiên trên các bệnh nhân có nguy cơ cao và hỗ trợ các bác sĩ lâm sàng trong việc chẩn đoán. Phương pháp deep- learning, có khả năng tự động nghiên cứu các lớp của các tính năng, rất phù hợp để mô hình hóa các mối quan hệ phức tạp giữa hình ảnh y học và diễn giải của chúng.

Bối cảnh

Trong nghiên cứu này, chúng tôi đã phát triển một mô hình dep- learning để phát hiện những bất thường chung và chẩn đoán cụ thể (rách dây chằng chéo trước [ACL] và rách sụn chêm) trong các xét nghiệm MRI đầu gối. Sau đó chúng tôi đo hiệu quả của việc cung cấp các dự đoán mô hình cho các chuyên gia lâm sàng trong quá trình giải thích.

Phương pháp và các phát hiện

Dữ liệu của chúng tôi bao gồm 1.370 xét nghiệm MRI đầu gối được thực hiện tại Trung tâm Y tế Đại học Stanford từ ngày 1 tháng 1 năm 2001 đến ngày 31 tháng 12 năm 2012 ( với độ tuổi trung bình 38,0 tuổi; 569 [41,5%] bệnh nhân nữ). Đa số phiếu bầu của 3 bác sĩ X quang cơ xương khớp được sử dụng để thành lập nhãn chuẩn để tham chiếu trên bộ xác nhận nội bộ gồm 120 xét nghiệm MRI.Chúng tôi đã phát triển MRNet, một mạng lưới thần kinh tích chập để phân loại chuỗi MRI và dự đoán kết hợp từ 3 chuỗi cho mỗi xét nghiệm bằng phương pháp hồi quy logistic. Khi phát hiện các bất thường, rách dây chằng chéo trước (ACL) và rách sụn chêm, mô hình này đạt được một diện tích dưới các giá trị đường cong đặc trưng hoạt động của bộ thu nhận (AUC) là 0,937 (95% độ CI 0,895, 0,980), 0,965 (95% CI 0,938, 0,993) và 0,847 (95 % CI 0,780, 0,914), tương ứng, trên bộ xác nhận nội bộ. Chúng tôi cũng đã thu được một bộ dữ liệu công khai của 917 xét nghiệm với chuỗi T1 điều chỉnh và gắn nhãn chấn thương dây chằn chéo trước từ bệnh viện lâm sàng Rijeka, Croatia. Trong bộ xác nhận bên ngoài gồm 183 bài kiểm tra, MRNet được đào tạo về chuỗi T2 điều chỉnh mặt dọc Stanford đạt được AUC là 0,824 (95% CI 0,757, 0,892) khi phát hiện chấn thương ACL mà không cần đào tạo thêm, trong khi MRNet được đào tạo bằng phần còn lại của dữ liệu bên ngoài đạt AUC là 0,911 (95% CI 0,864, 0,958). Chúng tôi cũng đã đo lường tính đặc hiệu, độ nhạy và độ chính xác của 9 chuyên gia lâm sàng (7 có chứng nhận bác sĩ X quang và 2 bác sĩ phẫu thuật chỉnh hình) bằng bộ xác nhận nội bộ trong trường hợp có và không có sự hỗ trợ của mô hình. Sử dụng một thử nghiệm chi bình phương 2 mặt Pearson với điều chỉnh nhiều so sánh, chúng tôi thấy không có sự khác biệt đáng kể nào giữa hiệu suất của mô hình và của các bác sĩ X quang không được mô hình hỗ trợ tra trong việc phát hiện các bất thường. Các bác sĩ X quang đã đạt được độ nhạy cao hơn đáng kể trong việc phát hiện rách dây chằng chéo trước (p-value = 0,002; q-value = 0,009) và độ đặc hiệu cao hơn đáng kể trong việc phát hiện rách sụn chêm (p-value = 0,003; q-value = 0,009). Sử dụng thử nghiệm 1-tailed t-test cho sự thay đổi trong hiệu số của hiệu suất, chúng tôi thấy rằng việc cung cấp dự đoán mô hình làm tăng đáng kể tính đặc hiệu của các chuyên gia lâm sàng trong việc xác định rách dây chằng chéo trước (giá trị p <0,001; q-value = 0,006) Những hạn chế chính của nghiên cứu của chúng tôi bao gồm thiếu bằng chứng về mặt phẫu thuật và quy mô của hội đồng chuyên gia lâm sàng nhỏ.

 

 Kết luận

Mô hình deep-learning của chúng tôi có thể nhanh chóng tạo ra các phân loại bệnh lý lâm sàng chính xác của các xét nghiệm MRI đầu gối từ các dữ liệu bên trong lẫn bên ngoài. Đồng thời, kết quả nghiên cứu có thể hỗ trợ việc khẳng định rằng các mô hình deep-learning có thể cải thiện hiệu suất của các chuyên gia lâm sàng trong quá trình giải đoán hình ảnh y học. Việc tiếp tục nghiên cứu sâu hơn là cần thiết để xác nhận sự triển vọng của mô hình này và tiện ích của nó trong ứng dụng lâm sàng.

Hình 1. Sơ đồ thiết lập thí nghiệm.Chúng tôi đã thu thập lại một bộ dữ liệu của 1.370 lần kiểm tra MRI đầu gối được sử dụng để phát triển mô hình và để đánh giá mô hình và mô hình hỗ trợ cho các chuyên gia lâm sàng. Các nhãn dán được thu thập thủ công từ các bài váo lâm sàng. Hình ảnh được trích xuất từ các tệp DICOM, được xử lý trước, sau đó liên kết với các báo cáo. Bộ dữ liệu được chia thành một tập huấn luyện (để phát triển mô hình), một bộ điều chỉnh (để chọn trong số các mô hình) và một bộ xác nhận (để đánh giá mô hình tốt nhất và các chuyên gia lâm sàng).Các bộ xác thực DICOM ứng với các xét nghiệm tương tự như bộ xác thực, nhưng các hình ảnh trong bộ xác thực đã được xử lý trước khi đưa vào mô hình.Các bài kiểm tra để xác nhận này được chú thích độc lập bởi các bác sĩ X quang cơ xương khớp (MSK), các chuyên gia lâm sàng không hỗ trợ thực hiện mô hình và các chuyên gia lâm sàng hỗ trợ thực hiện mô hình.      Hình 2. Cấu trúc MRNet. MRNet là một mạng lưới nơ-ron tích chập (CNN), nhận vào một chuỗi các hình ảnh MRI sau đó đưa ra dự đoán phân loại. Các tính năng AlexNet từ mỗi lát cắt của loạt chụp MRI được kết hợp bằng cách sử dụng thao tác gộp tối đa (tối đa theo từng phần). Vectơ kết quả được đưa qua một tầng nối hoàn chỉnh để tạo ra một xác suất đầu ra duy nhất. Chúng tôi đã huấn luyện từng MRNet khác nhau cho từng nhiệm vụ (bất thường, rách dây chằng trước [ACL], rách màng não) và nhiều loại nhóm (sagittal, coronal, axial), dẫn đến 9 MRNets khác nhau (để xác nhận bên ngoài, chúng tôi chỉ sử dụng MRNet mặt phẳng dọc của rách dây chằng trước). Đối với mỗi mô hình, xác suất đầu ra biểu thị xác suất mà mô hình gán lên mỗi chuỗi có xuất hiện chẩn đoán hợp lý.      Hình 3: Class activation mappings để giải thích MRNet: Class activation mappings (CAM) đánh dấu lên các đơn vị ảnh (pixel) trong hình ảnh chẩn đoán rất quan trọng trong việc quyết định phân loại hình ảnh. Một trong những bác sĩ chẩn đoán hình ảnh cơ xương khớp có chứng chỉ hành nghề đã chú thích bằng các hình ảnh (mũi tên và vòng tròn màu trắng) và được cung cấp sau đây. (a) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối cho thấy tràn dịch lớn (mũi tên) và vỡ gân cơ sinh đôi cẳng chân (vòng), được xác định chính xác vị trí bởi hình ảnh và được nhận định là bất thường. Lưu ý rằng hình ảnh không được đào tạo đặc biệt để phát hiện các bệnh lý này nhưng có thể nhận ra những bất thường dựa trên độ tương phản so với xét nghiệm đầu gối bình thường. (b) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối được phức tạp hóa bằng một thạo tác chuyển động quan trọng chứng minh rách hoàn toàn dây chằng chéo trước (ACL) (mũi tên), được mô hình phân loại và định vị chính xác. Bởi vì chúng tôi hy vọng sẽ gần đúng nhất so với thực tế lâm sàng, nơi mà tỷ lệ hiện vật (tức là chuyển động, kim loại) và tiếng ồn kỹ thuật khác làm ảnh hưởng việc chẩn đoán cộng hưởng từ (MRI) đầu gối, chúng tôi không loại trừ các trường hợp ồn ào từ khóa đào tạo hoặc dữ liệu xác nhận .(c) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối cho thấy sự tổn thương hoàn toàn của ACL, được mô hình xác định chính xác là bất bình thường và được phân loại là rách ACL. CAM chỉ ra sự tập trung của mô hình tại điểm nối bất thường của ACL (mũi tên). (d) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối cho thấy một vết rách phức tạp liên quan đến sừng sau của sụn bên (mũi tên). Trong khi mô hình đã phân loại xét nghiệm này là bất thường, CAM chỉ ra rằng tín hiệu dưới da tăng (vòng) trong các mô mềm trước/ sau góp phần xác định vào chẩn đoán nhưng việc rách sụn chêm thì không.      Hình 4: Kết hợp các nhóm dự đoán bằng cách sử dụng hồi quy logistic. Mỗi xét nghiệm có 3 loại nhóm: sagittal, coronal và axial. Tùy vào mục đích (bất thường, rách ACL, rách sụn chêm), chúng tôi đã tạo một bộ phân loại hồi quy logistic để kết hợp 3 xác suất đầu ra của MRNets để tạo ra một xác suất dự đoán duy nhất cho xét nghiệm. Các xác suất dự đoán từ một xét nghiệm trong tập kiểm định được hiển thị dưới dạng một mẫu. ACL, dây chằng chéo trước; CNN, chập chững mạng lưới thần kinh; LR, hồi quy logistic.      Hình 5: Máy thu vận hành đường cong đặc trưng của mô hình và các mốc vận hành của các chuyên gia lâm sàng chưa được hỗ trợ và hỗ trợ. Mỗi ô minh họa máy thu đường cong đặc trưng hoạt động của bộ thu nhận (ROC) của thuật toán (đường cong đen) trên tập kiểm định cho (a) bất thường, (b) rách dây chằng chéo trước (ACL) và (c) sụn chêm. Đường cong ROC được tạo bằng cách thay đổi ngưỡng chọn lọc (được sử dụng để chuyển đổi xác suất đầu ra thành dự đoán nhị phân). Các chuyên gia lâm sàng cá thể (độ đặc hiệu, độ nhạy) cũng được vẽ, trong đó x đỏ tượng trưng cho các bác sĩ chẩn đoán hình ảnh nói chung và không được mô hình hóa, x màu cam đại diện cho mô hình bác sĩ phẫu thuật chỉnh hình, dấu cộng màu xanh lá cây đại diện cho bác sĩ chẩn đoán hình tổng quát có hỗ trợ của mô hình và dấu cộng màu xanh đại diện cho bác sĩ chấn thương chỉnh hình có hỗ trợ của mô hình. Chúng tôi cũng vẽ sơ đồ trung bình vĩ mô của các chuyên gia lâm sàng không được mô hình hóa (x đen,) và trung bình vĩ mô của các chuyên gia lâm sàng có hỗ trợ mô hình (dấu cộng màu đen). Mỗi mốc vận hành chuyên gia lâm sàng không có mô hình hỗ trợ được kết nối với điểm vận hành được mô hình hỗ trợ tương ứng với một đường đứt nét.      Hình 6: So sánh các chỉ số chính xác giữa nhóm các chuyên gia lâm sàng không và có sự hỗ trợ bởi mẫu trên các thiết lập xác nhận. Sự khác biệt trung bình (với khoảng tin cậy 95% CI) trong chỉ số hiệu suất của các chuyên gia lâm sáng (được hỗ trợ trừ không được hỗ trợ) cho sự bất thường, rách dây chằng chéo trước (ACL) và phát hiện vỡ sụn chêm.

Fig Hình 1. Sơ đồ thiết lập thí nghiệm.Chúng tôi đã thu thập lại một bộ dữ liệu của 1.370 lần kiểm tra MRI đầu gối được sử dụng để phát triển mô hình và để đánh giá mô hình và mô hình hỗ trợ cho các chuyên gia lâm sàng. Các nhãn dán được thu thập thủ công từ các bài váo lâm sàng. Hình ảnh được trích xuất từ các tệp DICOM, được xử lý trước, sau đó liên kết với các báo cáo. Bộ dữ liệu được chia thành một tập huấn luyện (để phát triển mô hình), một bộ điều chỉnh (để chọn trong số các mô hình) và một bộ xác nhận (để đánh giá mô hình tốt nhất và các chuyên gia lâm sàng).Các bộ xác thực DICOM ứng với các xét nghiệm tương tự như bộ xác thực, nhưng các hình ảnh trong bộ xác thực đã được xử lý trước khi đưa vào mô hình.Các bài kiểm tra để xác nhận này được chú thích độc lập bởi các bác sĩ X quang cơ xương khớp (MSK), các chuyên gia lâm sàng không hỗ trợ thực hiện mô hình và các chuyên gia lâm sàng hỗ trợ thực hiện mô hình.

Hình 2. Cấu trúc MRNet

Hình 2. Cấu trúc MRNet. MRNet là một mạng lưới nơ-ron tích chập (CNN), nhận vào một chuỗi các hình ảnh MRI sau đó đưa ra dự đoán phân loại. Các tính năng AlexNet từ mỗi lát cắt của loạt chụp MRI được kết hợp bằng cách sử dụng thao tác gộp tối đa (tối đa theo từng phần). Vectơ kết quả được đưa qua một tầng nối hoàn chỉnh để tạo ra một xác suất đầu ra duy nhất. Chúng tôi đã huấn luyện từng MRNet khác nhau cho từng nhiệm vụ (bất thường, rách dây chằng trước [ACL], rách màng não) và nhiều loại nhóm (sagittal, coronal, axial), dẫn đến 9 MRNets khác nhau (để xác nhận bên ngoài, chúng tôi chỉ sử dụng MRNet mặt phẳng dọc của rách dây chằng trước). Đối với mỗi mô hình, xác suất đầu ra biểu thị xác suất mà mô hình gán lên mỗi chuỗi có xuất hiện chẩn đoán hợp lý.

Hình 3: Class activation mappings

Hình 3: Class activation mappings để giải thích MRNet: Class activation mappings (CAM) đánh dấu lên các đơn vị ảnh (pixel) trong hình ảnh chẩn đoán rất quan trọng trong việc quyết định phân loại hình ảnh. Một trong những bác sĩ chẩn đoán hình ảnh cơ xương khớp có chứng chỉ hành nghề đã chú thích bằng các hình ảnh (mũi tên và vòng tròn màu trắng) và được cung cấp sau đây. (a) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối cho thấy tràn dịch lớn (mũi tên) và vỡ gân cơ sinh đôi cẳng chân (vòng), được xác định chính xác vị trí bởi hình ảnh và được nhận định là bất thường. Lưu ý rằng hình ảnh không được đào tạo đặc biệt để phát hiện các bệnh lý này nhưng có thể nhận ra những bất thường dựa trên độ tương phản so với xét nghiệm đầu gối bình thường. (b) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối được phức tạp hóa bằng một thạo tác chuyển động quan trọng chứng minh rách hoàn toàn dây chằng chéo trước (ACL) (mũi tên), được mô hình phân loại và định vị chính xác. Bởi vì chúng tôi hy vọng sẽ gần đúng nhất so với thực tế lâm sàng, nơi mà tỷ lệ hiện vật (tức là chuyển động, kim loại) và tiếng ồn kỹ thuật khác làm ảnh hưởng việc chẩn đoán cộng hưởng từ (MRI) đầu gối, chúng tôi không loại trừ các trường hợp ồn ào từ khóa đào tạo hoặc dữ liệu xác nhận .(c) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối cho thấy sự tổn thương hoàn toàn của ACL, được mô hình xác định chính xác là bất bình thường và được phân loại là rách ACL. CAM chỉ ra sự tập trung của mô hình tại điểm nối bất thường của ACL (mũi tên). (d) Hình ảnh mặt phẳng dọc có điều chỉnh T2 của đầu gối cho thấy một vết rách phức tạp liên quan đến sừng sau của sụn bên (mũi tên). Trong khi mô hình đã phân loại xét nghiệm này là bất thường, CAM chỉ ra rằng tín hiệu dưới da tăng (vòng) trong các mô mềm trước/ sau góp phần xác định vào chẩn đoán nhưng việc rách sụn chêm thì không.

Hình 4: Kết hợp các nhóm dự đoán bằng cách sử dụng hồi quy logistic

Hình 4: Kết hợp các nhóm dự đoán bằng cách sử dụng hồi quy logistic. Mỗi xét nghiệm có 3 loại nhóm: sagittal, coronal và axial. Tùy vào mục đích (bất thường, rách ACL, rách sụn chêm), chúng tôi đã tạo một bộ phân loại hồi quy logistic để kết hợp 3 xác suất đầu ra của MRNets để tạo ra một xác suất dự đoán duy nhất cho xét nghiệm. Các xác suất dự đoán từ một xét nghiệm trong tập kiểm định được hiển thị dưới dạng một mẫu. ACL, dây chằng chéo trước; CNN, chập chững mạng lưới thần kinh; LR, hồi quy logistic.

Hình 5: Máy thu vận hành đường cong đặc trưng của mô hình

Hình 5: Máy thu vận hành đường cong đặc trưng của mô hình và các mốc vận hành của các chuyên gia lâm sàng chưa được hỗ trợ và hỗ trợ. Mỗi ô minh họa máy thu đường cong đặc trưng hoạt động của bộ thu nhận (ROC) của thuật toán (đường cong đen) trên tập kiểm định cho (a) bất thường, (b) rách dây chằng chéo trước (ACL) và (c) sụn chêm. Đường cong ROC được tạo bằng cách thay đổi ngưỡng chọn lọc (được sử dụng để chuyển đổi xác suất đầu ra thành dự đoán nhị phân). Các chuyên gia lâm sàng cá thể (độ đặc hiệu, độ nhạy) cũng được vẽ, trong đó x đỏ tượng trưng cho các bác sĩ chẩn đoán hình ảnh nói chung và không được mô hình hóa, x màu cam đại diện cho mô hình bác sĩ phẫu thuật chỉnh hình, dấu cộng màu xanh lá cây đại diện cho bác sĩ chẩn đoán hình tổng quát có hỗ trợ của mô hình và dấu cộng màu xanh đại diện cho bác sĩ chấn thương chỉnh hình có hỗ trợ của mô hình. Chúng tôi cũng vẽ sơ đồ trung bình vĩ mô của các chuyên gia lâm sàng không được mô hình hóa (x đen,) và trung bình vĩ mô của các chuyên gia lâm sàng có hỗ trợ mô hình (dấu cộng màu đen). Mỗi mốc vận hành chuyên gia lâm sàng không có mô hình hỗ trợ được kết nối với điểm vận hành được mô hình hỗ trợ tương ứng với một đường đứt nét

Hình 6: So sánh các chỉ số chính xác giữa nhóm

Hình 6: So sánh các chỉ số chính xác giữa nhóm các chuyên gia lâm sàng không và có sự hỗ trợ bởi mẫu trên các thiết lập xác nhận. Sự khác biệt trung bình (với khoảng tin cậy 95% CI) trong chỉ số hiệu suất của các chuyên gia lâm sáng (được hỗ trợ trừ không được hỗ trợ) cho sự bất thường, rách dây chằng chéo trước (ACL) và phát hiện vỡ sụn chêm. Các giá trị số được cung cấp trong Bảng 3 và giá trị cá nhân được cung cấp trong Bảng S2.

Tin và bài liên quan

Xem thêm