Giá trị thực sự của AI trong lĩnh vực chẩn đoán hình ảnh

4
Giá trị thực sự của AI trong lĩnh vực chẩn đoán hình ảnh
Giá trị thực sự của AI trong lĩnh vực chẩn đoán hình ảnh
Đánh giá

Nguồn : Vietnam Digital Health Network

Gần đây rất nhiều báo cáo có nói về việc AI chưa thực sự rời khỏi phòng thí nghiệm (nghiên cứu/demo). Trong thực tế, rất ít tổ chức ứng dụng AI tạo ra được lợi tức đầu tư (ROI) đâu đó từ 3-6% nếu mình nhớ không nhầm tại báo cáo của McKinsey.

Nhưng khi đi nghe trình bày hay xem demo thì thứ bạn nhận được bao giờ cũng sẽ thường theo một mô thức chung: Độ chính xác, tiết kiệm thời gian, tích hợp vào luồng công việc…

Gần đây, một nghiên cứu của Hội đồng AI chuyên ngành Chẩn đoán hình ảnh Đại học Emory đã đưa ra một cái nhìn khá ảm đảm về các giải pháp AI ứng dụng trong lĩnh vực này – được coi là lĩnh vực mà AI đã đạt độ trưởng thành và có tính ứng dụng cao trong y tế!


MỘT NỬA MÔ HÌNH AI TRONG CHẨN ĐOÁN HÌNH ẢNH BỊ LOẠI BỎ

Hội đồng AI Ngành Chẩn đoán Hình ảnh tại Đại học Emory vừa công bố báo cáo nội bộ đánh giá 13 mô hình AI đang được sử dụng hoặc đề xuất triển khai – và chỉ có 4 mô hình được phê duyệt hoàn toàn. Tại sao vậy?

Dưới đây là cái nhìn thực tế thông qua các con số:

  • 9 trong số 13 mô hình giúp cải thiện độ chính xác chẩn đoán
  • 6 trong số 13 mô hình không tiết kiệm được thời gian
  • Chỉ có 3 mô hình cho thấy hiệu quả tài chính trong phạm vi ngành chẩn đoán hình ảnh
  • Ngược lại, cũng có 3 mô hình gây ra tổn thất tài chính ròng

Và một điểm đáng chú ý: ngay cả mô hình phát hiện thoái hóa cột sống trên MRI, dù giúp giảm thời gian xử lý từ 1 tiếng đến 1 ngày, nhưng cuối cùng không mang lại lợi ích tài chính nào.

Điều này hoàn toàn trùng khớp với quan điểm được nêu ra gần đây tại hội thảo RSNA Spotlight ở Barcelona – rằng chúng ta vẫn chưa biết cách chuyển đổi việc tiết kiệm thời gian thành giá trị kinh tế. Khi đứng một mình, những cải thiện về mặt thời gian không nhất thiết tương đương với giá trị thực tiễn (tạo ra lợi ích kinh tế cho đơn vị – tổ chức).

Kết luận cuối cùng của hội đồng:

  • 4 mô hình được phê duyệt triển khai chính thức
  • 3 mô hình triển khai thử nghiệm trong môi trường hẹp không ảnh hưởng đến người dùng (shadow deployment)
  • 3 mô hình bị hoãn
  • 3 mô hình bị loại bỏ

Danh sách 4 mô hình được triển khai chính thức:

  • Phân tích thể tích và cấu trúc não
  • Tính điểm vôi hóa động mạch vành
  • Tính điểm vôi hóa van động mạch chủ
  • Dự đoán nguy cơ ung thư vú

KHÔNG MÔ HÌNH NÀO CÓ CƠ CHẾ GIÁM SÁT HIỆU SUẤT ĐỊNH LƯỢNG SAU TRIỂN KHAI

Đây là một vấn đề nghiêm trọng khác.

Có lẽ đây là phần việc mà bệnh viện hoặc đơn vị chẩn đoán hình ảnh từ xa (teleradiology) nên chủ động xây dựng trong hệ thống của chính họ. Bởi nếu mỗi nhà cung cấp mang theo một hệ thống giám sát riêng, thì cả hệ thống sẽ trở thành một “sở thú” hỗn loạn của các nền tảng rời rạc.

Nhìn rộng hơn, đâu là những thứ mà giới công nghệ, các chuyên gia bán sản phẩm AI đã chưa nhìn vào thực tế khi trình bày sản phẩm của họ tạo ra nhưng kỳ vọng nhưng không thực sự giải quyết được vấn đề?

Vấn đề không nằm ở chỗ AI không thể cải thiện ngành chẩn đoán hình ảnh (radiology). Vấn đề là: cải thiện ngành chẩn đoán hình ảnh không đồng nghĩa với việc cải thiện kinh tế y tế hoặc vận hành hệ thống. (các bác sĩ/chuyên gia chẩn đoán hình ảnh xin hãy góp ý nếu tôi đang hiểu sai!)

Con người hiện đã rất giỏi việc này – đó là thành quả của một thập kỷ đào tạo chuyên sâu. Vậy nên nếu AI được dùng để HỖ TRỢ bác sĩ chẩn đoán hình ảnh, thì việc nâng độ chính xác từ 99% lên 99.1% là một cái giá cực kỳ đắt cho một lợi ích gia tăng rất nhỏ. Chưa kể, sự cải thiện nhỏ đó lại có thể khiến bác sĩ mất thêm thời gian để kiểm tra xem AI có đúng không.

Còn nếu bạn định DÙNG AI ĐỂ THAY THẾ bác sĩ chẩn đoán hình ảnh thì cũng được thôi – nhưng khi đó bạn chỉ đơn giản là chuyển chi phí từ nhân công sang trách nhiệm pháp lý. Bạn sẽ cần mua bảo hiểm sơ suất y khoa cho thuật toán, và cũng vô tình đẩy trách nhiệm pháp lý thêm cho những bác sĩ không chuyên môn chẩn đoán hình ảnh – những người ra chỉ định chụp.

Vấn đề lớn hơn là: chẩn đoán hình ảnh không tồn tại một cách độc lập. Giá trị của việc đọc phim nhanh hơn hay chính xác hơn hoàn toàn phụ thuộc vào hệ thống y tế có thể làm gì tiếp theo sau đó.

Chẳng hạn, AI phát hiện u cột sống trong vòng 1 tiếng thay vì 1 ngày thì cũng chẳng có ích gì nếu bác sĩ phẫu thuật cột sống kín lịch 3 tuần tới. Hoặc, nếu báo cáo của AI vẫn cần chữ ký bác sĩ để được thanh toán, thì tất cả những gì bạn làm là biến “điểm nghẽn” hiện tại thành… điểm nghẽn lớn hơn.

Chừng nào mô hình chi trả và quy trình công việc vẫn chưa thay đổi, câu nói “AI sẽ giúp tiết kiệm chi phí trong chẩn đoán hình ảnh” vẫn chỉ là một giả thuyết – chưa phải điều hiển nhiên.

Tất nhiên, vẫn có một số lĩnh vực mà AI có thể thực sự tạo giá trị (tôi nghĩ đến việc tăng tốc độ luân chuyển giường bệnh trong cấp cứu chẳng hạn). Nhưng kiểu suy nghĩ “AI trong chẩn đoán hình ảnh lúc nào cũng tốt hơn như chúng ta hay được nghe trên sân khấu” thì hoàn toàn bỏ lỡ điều cốt lõi:

Chúng ta không yêu cầu chụp phim để nhìn pixel ảnh (cái mà AI nhìn giỏi hơn rõ hơn) – chúng ta làm vậy để ra quyết định.

Bài viết có tham khảo 1 số thông tin từ các tác giả: Kirill, Grahame.

LEAVE A REPLY
Please enter your comment!