김대현

3.

김대현,; 여상호,; 오상윤,

분산 딥러닝에서 통신 오버헤드를 줄이기 위해 레이어를 오버래핑하는 하이브리드 올-리듀스 기법 Journal Article

In: 정보처리학회논문지. 컴퓨터 및 통신시스템, vol. 10, no. 7, pp. 191–198, 2021.

@article{김대현2021분산,

title = {분산 딥러닝에서 통신 오버헤드를 줄이기 위해 레이어를 오버래핑하는 하이브리드 올-리듀스 기법},

author = {김대현 and 여상호 and 오상윤},

url = {https://kiss.kstudy.com/thesis/thesis-view.asp?key=3898298},

year  = {2021},

date = {2021-01-01},

urldate = {2021-01-01},

journal = {정보처리학회논문지. 컴퓨터 및 통신시스템},

volume = {10},

number = {7},

pages = {191--198},

abstract = {분산 딥러닝은 각 노드에서 지역적으로 업데이트한 지역 파라미터를 동기화는 과정이 요구된다. 본 연구에서는 분산 딥러닝의 효과적인 파라미터 동기화 과정을 위해, 레이어 별 특성을 고려한 allreduce 통신과 연산 오버래핑(overlapping) 기법을 제안한다. 상위 레이어의 파라미터 동기화는 하위 레이어의 다음 전파과정 이전까지 통신/계산(학습) 시간을 오버랩하여 진행할 수 있다. 또한 이미지 분류를 위한 일반적인 딥러닝 모델의 상위 레이어는 convolution 레이어, 하위 레이어는 fully-connected 레이어로 구성되어 있다. Convolution 레이어는 fully-connected 레이어 대비 적은 수의 파라미터를 가지고 있고 상위에 레이어가 위치하므로 네트워크 오버랩 허용시간이 짧고, 이를 고려하여 네트워크 지연시간을 단축할 수 있는 butterfly all-reduce를 사용하는 것이 효과적이다. 반면 오버랩 허용시간이 보다 긴 경우, 네트워크 대역폭을 고려한 ring all-reduce를 사용한다. 본 논문의 제안 방법의 효과를 검증하기 위해 제안 방법을 PyTorch 플랫폼에 적용하여 이를 기반으로 실험 환경을 구성하여 배치크기에 대한 성능 평가를 진행하였다. 실험을 통해 제안 기법의 학습시간은 기존 PyTorch 방식 대비 최고 33% 단축된 모습을 확인하였다.},

keywords = {},

pubstate = {published},

tppubtype = {article}

}

Close

2.

김대현,; 오상윤,

분산 딥러닝 최적화를 위한 Layer 별 동기화 기법 Conference

한국차세대컴퓨팅학회 하계학술대회, 2020.

BibTeX

1.

Bang, Sungho; Kim, Daehyun; Choi, Jee; Oh, Sangyoon

Benchmarking Sparse Matrix-Vector Multiplicatrion on Heterogeneous Cluster Conference

The 5th International Conference on Next Generation Computing (ICNGC 2019), 2019.

BibTeX

김대현
^{Daehyun Kim}

After graduation

Publications

2021

2020