의료 이미지 분석 분야에서 딥러닝은 획기적인 발전을 이끌며, 다양한 질병 진단 및 치료 계획 수립에 활용되고 있습니다. 의료 이미지 분석에 주로 사용되는 딥러닝 모들의 종류와 사례는 다양합니다.
의료 이미지 분석, 딥러닝 종류
의료 분야에서 가장 많이 사용되고 있는 딥러닝 모델은 CNN, RNN이 대표적으로 많이 사용하고 있다고 알려져 있습니다. 특히 의료 이미지 분석에서 말이죠. 문자, 음성 등 자연어를 처리하는 모델은 구글에서 개발하고 오픈소스로 공개한 Transformer 모델이 유일할 정도로 대표적입니다.

- CNN : X-ray 등 이미지 분석에 특화
- RNN : 시퀀스 데이터 분석에 특화되어 있어서, 질환의 시간별 과거 의료 영상을 분석하면 앞으로 진행될 상태를 예측 지원
- GAN : 의료 데이터 증강, 생성하여 부족한 데이터를 만들어 인공지능이 학습할 수 있도록 지원
- Autoencoder : 고화질의 의료 데이터 용량 관리를 통해 인공지능 성능을 향상
- Transformer : 문자, 음성 등 환자의 의료차트의 텍스트를 분석해서 환자의 질병관리, 치료 계획 수립을 지원
1. CNN(Convolutional Neural Networks, 합성곱 신경망)
이미지 데이터 처리에 특화된 신경망으로 의료 이미지의 특징을 효과적으로 추출합니다. 필터를 통해 이미지의 특징을 학습하고, 이를 바탕으로 질병 여부, 종양 크기를 판단할 수 있습니다. 즉, 이미지 데이터를 처리하는 데 특화된 딥러닝 모델이며, 의료 이미지 분석에 특화되어 있죠.
그 이유는 필터와 특별한 연산방법이 있기 때문입니다. 필터를 이용하여 이미지를 작은 영역으로 나누어 각 영역의 특징을 추출합니다. 이 필터들은 이미지의 가장자리, 모서리, 텍스처 등 다양한 국조적 특징을 학습하죠. 또한 필터를 이미지 위에 슬라이딩하면서 합성곱 연산을 수행하여 특징맵을 만듭니다. 이 특징맵은 이미지보다 추상화된 형태로, 더 고차원적인 특징을 담을 수 있습니다.
즉, 이미지 위에 특정한 필터를 씌워서 이미지의 특징을 추출하는 과정이라고 볼 수 있습니다. 필터를 이미지 위에 겹쳐 놓고, 겹쳐진 부분의 값들을 곱한 후 모두 더하는 연산입니다. 이 과정을 이미지 전체에 반복하면서 새로운 이미지를 만드는데, 이때 만들어진 새로운 이미지는 원본 이미지의 특징을 강조한 형태로 나타나죠.
따라서 합성곱 신경망에서는 합성곱 연산을 통해 이미지의 가장자리, 모서리부터 객체, 얼굴까지 순차적으로 추출합니다. 쉽게 설명하면, 이미지를 좀 더 의미 있는 정보로 바꾸는 과정이며, 이미지에 필터를 씌워서 특정 부분을 강조하거나 추출하는 것과 같은 개념입니다.
예를 들면, 특정 모양을 가진 도장이 있다고 하면, 이 도장에는 가로선, 세로선, 모서리 등이 있을 것입니다. 도장을 종이 위에 찍으면서 겹쳐지는 부분의 색깔을 비교하고, 새로운 그림을 만들어내는 과정을 거치면 이미지 분석을 할 수 있습니다.
가로선 모양의 도장을 이미지 위에 쭉 밀면서 찍어보면, 이미지 속 가로선이 있는 부분에서 강한 신호가 나타나기 때문에 가로선을 찾을 수 있으며, 모서리 모양의 도장을 찍으면 이미지 속 모서리 부분이 강조되면서 모서리를 찾을 수 있습니다.
이미지 속에서 어떤 패턴이 있는지 먼저 파악하고 그 이미지에서 중요한 특징(가로선, 세로선, 모서리 등)을 찾아내는 합성곱 연산을 통해 딥러닝 모델을 이용하여 이미지 분석을 할 수 있는 것입니다.
사례
- 흉부 X-ray : 폐암, 폐렴 등 질환을 진단
- CT, MRI : 뇌종양, 암 전이 등 질환을 진단
- 안저 사진 : 당뇨망막병증, 황반변성 등 안과 질환을 진단
조직 병리 이미지를 통해 암 진단에 활용할 수 있습니다. 암세포와 정상 세포를 구분하여 암 종류를 판별하고, 암 진행 단계를 평가합니다. 또한 CT, MRI 이미지를 통해 폐암, 뇌종양 등 다양한 종류의 암을 조기에 발견하고 종양의 크기와 위치를 정확하게 파악할 수 있습니다.
황반변성 등 안과 질환을 조기에 진단할 수 있고, 흉부 X-ray를 통해 폐렴, 결핵 등의 질병의 심각성을 평가할 수 있습니다.
이렇게 발견된 질환들은 종양의 위치와 크기를 정확하게 파악하여 방사선 조사량을 최적화할 수 있기 때문에 정상 조직의 손상을 최소화할 수 있는 장점이 있죠. 결국 수술 계획을 인공지능 딥러닝을 통해 정확하게 이미지를 분석해서 세울 수 있다는 것입니다.
다만, CNN도 이미지 분석의 한계점은 있습니다. 대량의 고품질 데이터가 필요하며, 그 데이터가 양질의 것이어야만 합니다. 만약 데이터가 부족하면 한쪽으로 편향될 수 있습니다. 또한 CNN은 복잡한 구조로 이루어져 있기 때문에 어떻게 판단되는지 파악하기 어려울 수 있는 것이 한계로 알려져 있습니다.
2. RNN(Recurrent Neural Networks)
RNN은 시간 경과에 따른 변화를 감지할 수 있는 순환 신경망입니다. 즉, 시간이 지남에 따라 데이터를 분석하면 향후 어떻게 진행될 것을 예측할 수 있죠. 결국 RNN은 시퀀스 데이터 처리에 특화된 신경망으로, 의료 이미지 시퀀스를 분석하여 질병 진행 과정을 예측하거나, 동영상 기반 의료 데이터를 분석합니다.
쉽게 말하면 같은 환자의 여러 시점의 이미지를 순차적으로 입력하여 질병의 진행 과정을 분석하거나 치료 효과를 평가할 수 있습니다. 예를 들어, 폐암 환자의 CT 이미지를 시간 순서대로 입력하여 종양의 성장 속도를 예측하거나, 치료 후 종양의 크기변화를 관찰할 수 있죠.
3D 의료 이미지(CT나 MRI 등)를 여러 개의 2D 슬라이스로 나누어 순차적으로 입력하여 3차원적인 정보를 추출할 수도 있습니다.
이를 통해 장기의 구조를 더 정확하게 파악하고, 병변의 위치와 크기를 정확하게 측정하고 예측할 수 있다고 알려져 있죠.
사례
- 의료 영상 분석 : 질병 진행 과정 예측, 치료 효과 평가
- 생체 신호 분석 : 심전도, 뇌파 등 생체 신호를 분석하여 질환 진단
폐 CT 이미지를 시간 순서대로 입력하여 폐암의 성장 속도를 예측하고, 치료효과를 평가하는 연구가 진행되고 있으며, 뇌 MRI 이미지를 슬라이싱하여 뇌종양의 종류를 분류하는 연구들이 알려져 있습니다. 또한 심전도와 함께 심초음파 영상을 분석하여 심부전 심근경색 등 심장 질환을 진단하는 연구가 진행되고 있죠.
이렇게 활용할 수 있는 이유는 RNN은 이전 정보를 기억하여 다음 예측에 활용하는 능력이 뛰어나기 때문입니다. 의료 이미지의 특정 영역 간의 상관관계를 분석하거나, 복잡한 질병 패턴을 학습하여 정상적인 조직 이미지와 비정상적인 조직이미지를 비교하여 진단의 정확도를 높일 수 있기 때문입니다.
다만, 사전에 노이즈를 제거하기 위해 이미지 전처리를 하는 과정이 필요하며, 충분한 양의 의료 이미지 데이터가 있어야 정확도를 올릴 수 있습니다.
3. GAN(Generative Adversarial Networks)
GAN이란 딥러닝 모델은 생성 모델과 판별 모델이 알고리즘으로 짜여 있어서 서로 경쟁하며 학습하는 신경망으로, 의료 이미지를 생성하거나 기존 이미지를 변형하여 새로운 데이터를 생성합니다.
실제 의료 이미지와 생성된 정상 이미지를 비교하여 차이를 비교할 수 있습니다. 희귀 질환의 경우 정상 이미지와 차이가 미묘할 수 있는데, GAN을 활용하여 더욱 민감하게 확인할 수 있다고 알려져 있죠.
GAN을 의료 이미지 분석에 활용하는 주요 방법
데이터 증강
사실 의료 이미지 데이터는 수집하기 어렵고, 특정 질환의 경우 데이터 양이 적을 가능성이 많습니다. 따라서 GAN을 활용하여 기존 이미지를 기반으로 새로운 이미지를 생성하면 학습 데이터가 많아지기 때문에 모델의 성능을 높일 수 있습니다. 따라서 이러한 과정을 거쳐 스스로 데이터를 만들어내기 때문에 이미지 분석 활용 효율성이 매우 높습니다.
이렇게 만들어진 많은 데이터들은 분류되어 실제 이미지와 생성 이미지를 비교하면서 차이가 많이 날 때 이상으로 판단하는 능력을 활용하는 것이죠.
다만, 이미지 데이터 품질이 높은 데이터를 학습하면 할수록 양질의 데이터를 학습하기 때문에 고품질의 의료 이미지 데이터를 확보하는 것이 매우 중요합니다. GAN이 문제가 되는 부분은 이미지 페이크를 통해 가짜 뉴스를 만들 수 있기 때문에 사회적 부작용이 생길 수도 있습니다.
사례
- 의료 이미지 생성 : 부족한 데이터 증강, 새로운 의료 이미지 생성
- 이미지 변환 : MRI 이미지를 CT 이미지로 변환
4. 오토엔코더(Autoencoder)
오토엔코더는 의료 이미지 분석 분야에서 활용되고 있는데, 분석 데이터를 압축된 표현으로 변환한 후 다시 원래 데이터와 유사한 형태로 복원하는 신경망 모델입니다. 이는 고해상도 의료 이미지의 매우 큰 용량을 압축된 형태로 변환하면서 저장 공간을 절약하고 데이터 전송 속도를 향상시켜서 모델 성능을 높일 수 있습니다.
또한 의료 이미지에 포함된 노이즈를 깨끗한 이미지를 만들 수 있기 때문에 고품질의 의료 이미지 데이터를 확보할 수 있으며, 그 과정에서 이미지의 주요 특징을 학습하여, 분류하고 군집화하는 작업에 활용될 수 있기 때문에 이상한 점을 탐지할 수도 있습니다.
다른 모델들은 데이터를 분류하는 작업을 거치지만 오토엔코더는 분류하는 작업 없이 데이터를 활용할 수 있기 때문에 데이터 준비 과정을 간소화할수 있습니다.
그만큼 정교한 오토엔코더 모델이 필요하며 학습하는 데이터의 품질에 따라서 모델 성능이 크게 좌우될 수 있다는 점이 주의점입니다.
5. 트랜스포머(Transformer)
문자, 음성 등 자연처 처리 분야에 특화된 이 모델은 최근 의료 분야에서도 주목받고 있습니다. 예를 들면 수십 년전부터 쌓여있던 의료 데이터들의 의료 문서, 보고서 등 텍스트 데이터 분석을 통해 질병 진단, 치료 계획을 수립하는데 적용할 수 있습니다. 예를 들면 과거부터 쌓여있던 환자들의 의무 기록을 분석하여 질병의 위험 요소를 파악하거나 새로운 치료법을 개발하는 데 사용할 수 있죠.
결론적으로, 의료 이미지 분석 분야에서 딥러닝은 잠재력이 매우 높은 인공지능 기술입니다. 다양한 딥러닝 모델을 적절히 활용하면 의료 진단의 정확도를 높일 수 있고 환자 맞춤형 치료를 제공할 수 있을 것으로 기대되고 있습니다.