REFERS đạt được mục tiêu bằng cách hoàn thành hai nhiệm vụ liên quan đến báo cáo, tức là tạo báo cáo và đối sánh báo cáo chụp X quang. Trong nhiệm vụ đầu tiên, REFERS chuyển ảnh chụp X quang thành báo cáo văn bản bằng cách mã hóa ảnh chụp X quang đầu tiên thành một biểu diễn trung gian, sau đó được sử dụng để dự đoán các báo cáo văn bản thông qua mạng bộ giải mã. Một hàm chi phí được định nghĩa để đo lường mức độ giống nhau giữa các văn bản báo cáo được dự đoán và thực tế, dựa trên đó, tối ưu hóa dựa trên độ dốc được sử dụng để đào tạo mạng nơ-ron và cập nhật trọng số của nó.
Đối với nhiệm vụ thứ hai, REFERS đầu tiên mã hóa cả ảnh chụp X quang và báo cáo dạng văn bản tự do vào cùng một không gian ngữ nghĩa, nơi các bản trình bày của mỗi báo cáo và ảnh chụp X quang liên quan được căn chỉnh thông qua phương pháp học đối chiếu.
So với các phương pháp thông thường dựa nhiều vào chú thích của con người, REFERS có khả năng thu được sự giám sát từ từng từ trong báo cáo X quang. Chúng tôi có thể giảm đáng kể 90% số lượng chú thích dữ liệu và chi phí để xây dựng trí tuệ nhân tạo y tế. Tiến sĩ ZHOU Hong-Yu đai học Hông Kong cho biết nó đánh dấu một bước quan trọng trong việc hiện thực hóa trí tuệ nhân tạo trong y tế tổng quát.
» Tin mới nhất:
» Các tin khác: