Update README.md

김지훈
Commit d303c1ce55a65bc925d278bf4093a848fcd7dd06 d303c1ce 1 parent 103822ab
Showing 1 changed file with 7 additions and 2 deletions
코드/연합학습/quantization/README.md
--- a/코드/연합학습/quantization/README.md
View file @d303c1c
+++ b/코드/연합학습/quantization/README.md
View file @d303c1c
 # 추론시간 개선 - 양자화 시도
 
- ## Pytorch quantization - 학습해도 cpu 에서만 실행 가능, 모델의 채널을 신중하게 고르지 않으면 속도 개선 미미함. 또한 양자화 과정으로 학습된 모델은 pytorch model -> onnx -> tensorRT 변환이 불가능하여 gpu 에서 실행 불가능 학습해도 cpu 에서만 실행 가능, 모델의 채널을 신중하게 고르지 않으면 속도 개선 미미함
+ ## Pytorch quantization
+ - 학습해도 cpu 에서만 실행 가능, 모델의 채널을 신중하게 고르지 않으면 속도 개선 미미함. 
+ - 또한 양자화 과정으로 학습된 모델은 pytorch model -> onnx -> tensorRT 변환이 불가능하여 gpu 에서 실행 불가능 학습해도 cpu 에서만 실행 가능.
+ - 모델의 채널을 신중하게 고르지 않으면 속도 개선 미미함.
 
- TensorRT - 양자화 학습을 사용하지 않고 바로 정밀도 감소 및 양자화 시도. float16 은 10% 정도 속도가 개선되었으나, int8 은 실패함 (사용법 미숙, 입력 값이 0.0 ~ 1.0 등)
\ No newline at end of file
+ ## TensorRT
+ - 양자화 학습을 사용하지 않고 바로 정밀도 감소 및 양자화 시도. 
+ - float16 은 10% 정도 속도가 개선되었으나, int8 은 실패함 (사용법 미숙, 입력 값이 0.0 ~ 1.0 등)
\ No newline at end of file