박장선

Update README.md

Showing 1 changed file with 20 additions and 11 deletions
......@@ -5,16 +5,18 @@
<br/>
## 1. 배경
흉부의 질환을 진단하기 위한 검사는 대표적으로 CT가 있다. 이는 흉부 병변의 정확한 진단과 위치 및 크기를 판단함에 있어 용이하게 사용되지만 검사 비용과 방사선 피폭 등의 단점이 있다. 또한 촬영 이미지로부터 병변을 찾아내기 위해서는 숙련된 의사가 어느정도의 시간 동안 직접 사진을 보고 분석하며 판단해야 한다.
최근 인공지능 기술이 급부상하면서 의료 영역 내에서도 적용 범위가 확대되어 가고 있다. 특히나 이미 딥러닝을 이용한 신경망은 의료영상 분석 분야에 적용하여 효율성이 증명되었다. 의료영상을 이해하는 면에서 최근의 기계 학습의 발전은 Deep Learning에서 의료영상의 패턴을 식별 및 분류 연구에 기여하고 있다. 의료영상 분석에 인공신경망을 기반으로 하는 CNN(Convolutional Neural Network) 알고리즘이 본격적으로 사용되기 시작하면서 다양한 질환 분석 연구 사례가 급증하고 있다. 이러한 연구 등으로 인공지능 기술을 영상의학 검사의 영상 분석에 도입하여, 이전의 의료진들이 이미지를 직접 보며 판단하는 아날로그적 방식에서, 인공지능의 도입으로 전문의를 대체 가능할 정도의 수준까지 이르고 있다. <br/>
하지만 긴급을 요하는 의료현장에서 Chest X-ray 이미지의 병변을 판단하기 위해 Deep learning network model을 설계 및 구현 하기에는 어려움이 많다. 정상 Chest X-ray 이미지와 비교해 특정 질병은 현저하게 Chest X-ray 이미지가 부족하기도 하고, Medical Image 특성상 병변에 따라 좌우 반전, 상하반전과 같은 Data augmentation을 사용할 수 없어, Deep learning network model에 유용한 Data augmentation 방법을 찾기도 쉽지 않다. 또한 데이터의 불균형으로 Deep learning network model의 Depth, 파라미터 튜닝에 따른 학습 성능 차이가 날 가능성이 높으며, 공개 및 검증된 데이터셋을 활용하여 만든 사전학습모델(Pre-trained model)이 다른 Chest X-ray 이미지에 좋은 결과를 낼 것이라고 예상하기도 어렵다. <br/>
위와 같은 문제를 인식하여 검증된 NIH Chest X-ray 데이터를 통해 병변 판단에 유용한 Data augmentation 방법을 찾고, 여러 Deep learning network model을 비교 및 검증하여 가장 유용한 Depth, 파라미터를 모색하여 사전학습모델(Pre-trained model)을 만들고, 만들어진 사전학습모델(Pre-trained model)을 Fine-tuning 하여 로컬 Chest X-ray 이미지의 심장비대증에 대한 병변 판단 binary classification 연구를 수행하고자 한다. <br/>
최근 인공지능 기술이 급부상하면서 인공신경망을 사용한 의료영상 처리에 대한 관심 또한 커져가고 있다. 이미 딥러닝을 이용한 신경망은 의료영상 분석 분야에 적용하여 효율성이 증명되었다. 의료영상을 이해하는 면에서 최근의 기계 학습의 발전은 Deep Learning에서 의료영상의 패턴을 식별 및 분류 연구에 기여하고 있다. 의료영상 분석에 인공신경망을 기반으로 하는 CNN(Convolutional Neural Network) 알고리즘이 본격적으로 사용되기 시작하면서 다양한 질환 분석 연구 사례가 급증하고 있다. 이러한 연구 등으로 인공지능 기술을 영상의학 검사의 영상 분석에 도입한다면 의료진 부족으로 인한 물리적인 시간 문제를 해결할 수 있을 것으로 기대된다.
<br/>
## 2.목표
최우선적 목표는 직접 설계한 deep learning network model에 NIH (chestX-ray 14) dataset을 학습시키고 14개의 병증에 대한 multi-classification 을 성공시키는 것이다. 만약 multi-classification에 한계가 발견될 시, 특정 병증에 대해서 positive labelling을 하고, 이외의 모든 상태에 대해 negative labelling을 적용함으로써 필터링 할 수 있는것을 목표로 한다. 이 과정에서 NIH dataset을 학습시키기 적절한 모델을 연구해야 하며, 상대적으로 적은 특정 병증의 데이터 양을 극복하기 위해 효과적인 data augmentation 기법의 제안이 필요하다.
<br/>
Deep learning network model에 NIH Dataset을 학습시키고 14개의 병증에 대한 Multi-classification 을 성공시킨다. Multi-classification에 한계가 발견될 시, 특정 병증에 대해서 Positive labelling을 하고, 이외의 모든 상태에 대해 Negative labelling을 적용함으로써 필터링 할 수 있는 것을 목표로 한다.<br/>
위 프로젝트를 바탕으로 X-ray 이미지에 적합한 데이터 증강(Data augmentation) 방법과 딥러닝 네트워크 모델(Deep learning network model)을 알 수 있으며, 사전학습모델(Pre-trained model)의 Imagenet 가중치 사용 여부에 따른 로컬 Chest X-ray 이미지의 병변 판단 성능을 보여줌으로써, 최적의 Data augmentation, Deep learning network model 방법을 제시하는 것을 목적으로 한다. 이로써 긴급을 요하는 의료현장에서 병변판단을 위한 물리적인 시간 문제 해결 뿐 아니라 응급상황을 선별하는데에 적용하거나 1차적 진단 도구로 활용될 수 있으며 향후 흉부 방사선 자동판독기술의 고도화 연구로 연결될 수 있을 것으로 기대된다.<br/>
## 3. 프로젝트 역할 분담 및 활동 내용
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;(NIH Chest X-Ray Dataset 용량이 너무 커 프로젝트 활동에 대해서 github 주소로 대체하였습니다)
#### 1) Data augmentation
###### &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 강태구 :
###### &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 박장선 :
......@@ -25,15 +27,22 @@
<br/>
## 4. 프로젝트 활동 상세 내용
#### 1) NIH Chest X-Ray Data
#### 2) Data augmentation
#### 3) Making deep learning network model
#### 1) Data augmentation
###### (1) 일반적인 Augmentation
Data augmentation 방법에 따른 성능 차이를 살펴보기 위해, X-ray 이미지 정상 2000장, 심장비대증 1000 → 2000장으로 이미지 증대 시킨 이후, DenseNet121 네트워크 모델을 사용하여 학습시킨 이후 Test set에 대한 accuracy 와 클래스에 따른 ROC curve와 AUC 값을 확인하였다. <br/>
다음은 가장 성능이 안좋았던 이미지증대 방법인 가우시안 블러, 가장 성능이 좋았던 이미지증대 방법인 ~5% 랜덤 회전에 대한 Feature Map 추출과 그에 따른 Grad-Cam이다. Grad-Cam을 확인해 보면 같은 이미지라도 네트워크가 전혀 다른 곳을 바라보고 있다는 것을 확인할 수 있다. <br/>
###### (2) CAM을 이용한 Augmentation
CAM을 이용해서 네트워크가 병변 영역으로 인식하는 부분을 떼어내 정상인 이미지와 합성해 가상의 병변 이미지를 생성해 데이터를 증강했다. <br/>
#### 2) Making deep learning network model
###### (1) 모델별 최적의 Depth 연구
###### (2) Pretrain이 미치는 영향 연구
<br/>
## 5. 결론
<br/>
Chest X-ray 이미지에 대해서 다양한 Data augmentation 진행 결과 좌우회전, 상하반전, 가우시안 블러와 같은 Data augmentation 방법은 이미지 Feature 을 감소시키기 때문에 하지 말아야 할 Data augmentation 방법이며, 이미지 Feature를 어느 정도 유지해주기만 한다면, CAM을 이용한 Image Mix와 같은 Data augmentation 방법 또한 데이터 양에 대한 갯수를 맞추어줌으로써 네트워크 성능을 올릴 수 있다는 것을 확인했다. <br/>
Deep learning network model은 모델의 특징, Depth에 따라 과적합 현상으로 오히려 성능이 저하된 것을 알 수 있었다. 이에 따라 resnet은 50, densenet은 121 네트워크 모델이 가장 성능이 좋았다. 공통적으로 두 모델은 imagenet의 weight를 initialization에 사용하지 않았을 때가 더 높은 성능을 보였다. NIH dataset으로 pretrain을 한 뒤 이 weight를 심장비대증에 대한 binary classification에 불러들여 사용하였을 때 가장 좋은 성능을 발휘한 것을 알 수 있었다. <br/>
본 연구를 통해 Chest X-ray 이미지의 병변을 판단하기 위한 유용한 방법을 제시함으로써 긴급을 요하는 의료현장에서 병변판단을 위한 물리적인 시간 문제 해결 뿐 아니라 응급상황을 선별하는데에 적용하거나 1차적 진단 도구로 활용될 수 있으며 향후 흉부 방사선 자동판독기술의 고도화 연구로 연결될 수 있을 것으로 기대된다. <br/>
## 6. 문서 및 보고서
###### - [팀원별 프로젝트활동 주간보고서](http://khuhub.khu.ac.kr/2021-1-capstone-design1/LSK_Project1/tree/master/%EC%A3%BC%EA%B0%84%EB%B3%B4%EA%B3%A0%EC%84%9C)
......