Mike Ferdman, NYU stony brook

1 Introduction

2-5는 PI랑 정책, 환경 방향성에 대한 내용

6 Background and Motivation

7 Overview of MPSP

8 Proposed Research Agenda

말하자면 CPU는 thread 수 딸리고, GPU는 latency 높아서 서버 Workload 처리하는데 애매모한점이 있었으니, 각 장점들을 잘 고려한 heterogeneous microarchitecture를 설계하자. conventional core 기능을 일부 포함한 SIMT 기반의 processor가 될 것

그 과정에서 SIMT의 문제를 잘 처리해야되는데, 먼저 큰 걸림돌이 control-flow divergency이고 lockstep 깨져서 SIMT 효율 낮아질 수 있는데, 실제 request들의 control flow divergency는 크지는 않다고 하고,

두번째는 memory access divergency인데, file type은 큰 상관 없지만 stack heap 얘네가 divergency 크다고 함. 근데 보니까 offset 패턴은 비슷한데 할당하는 base가 달라서 그런거지 이런거 잘 고려한 memory system 필요하다고 하는거고, 그 밖에도 instruction의 input data도 50%정도 (기준에 따라 다르지만) 같은거 쓰고 있으니 이것도 최적화 하자고 함.

뭐 이런 것들 고려해서 OS나 다른 부분은 신경 덜 쓰면서 서버 WL 돌릴 수 있는 SIMT 기반 아키텍처의 base를 설계해보자. 라는 내용인듯?