Kieun_Park.pdf

A Systematic Methodology for Characterizing Scalability of DNN Accelerators using SCALE-Sim (ISPASS `20)

[Slide 2] Motivation & Background 제목: Why SCALE-Sim? DNN workload는 massive parallelism을 가지며, 계속해서 규모가 커지고 있음 효율적인 DNN 가속기 설계에는 scaling 전략(Scale-up vs. Scale-out) 결정이 핵심 기존에는 monolithic 구조 중심의 분석이 많았음

[Slide 3] What is SCALE-Sim? 제목: SCALE-Sim Overview Systolic Array 기반의 DNN Accelerator용 Cycle-Accurate Simulator Hardware config와 DNN topology 입력 → compute cycles, bandwidth, utilization 추출 다양한 데이터플로우 (OS, WS, IS) 모델링 가능

image.png

[Slide 4] Systolic Array & Dataflows

제목: Supported Dataflows in SCALE-Sim 3종류의 dataflow 모델링 가능: Output Stationary (OS): 결과 pixel 고정 Weight Stationary (WS): filter 고정 Input Stationary (IS): 입력 고정 data reuse 특성에 따라 cycle 경과 및 BW 차이 발생

image.png

image.png

[Slide 5] Cycle-Accurate Simulation: How? 제목: Matrix Multiply Simulation in SCALE-Sim PE는 stall 없이 compute 되도록 read trace 생성 입력 → 처리 → 출력까지 SRAM/DRAM trace 생성 Utilization, DRAM BW, latency를 cycle 단위로 추적 실제 RTL과 유사한 결과 검증 완료

image.png

[Slide 6] Analytical Runtime Model 제목: Analytical Model for Runtime Estimation Scale-up runtime: 공식 Scale-out runtime: 공식 folding/tile 개념 포함 → 수천 개 구성 비교 가능

image.png