포지션 상세 정보
- 기술스택
- CUDAC++SW
- 주요업무
• 각종 인공신경망 레이어 및 텐서 연산들을 OpenCL, CUDA 등으로 구현하고 최적화 • 텐서 연산과 다양한 가속기에 대한 성능 예측 및 분석 모델 개발 • 다양한 GPU 아키텍처를 대상으로 최적의 커널 코드를 생성, 선택하기 위한 코드 생성기와 오토 튜너 개발 • AI 애플리케이션에 특화된 GPU의 구성 요소들(행렬 곱셈 유닛, GPU 간 고속 인터커넥션 등)을 활용 • GPU 간의 효율적인 통신 라이브러리 개발, 이는 서로 다른 노드에 위치한 GPU 사이의 통신을 포함
- 자격요건
• 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분 • C++ 및 개발 가능하신 분 • OpenCL 혹은 CUDA 개발 경험과 GPU 아키텍처에 대한 지식 • 컴퓨터 시스템에 대한 깊은 이해
- 우대사항
• 전문연구요원 지원 우대 • 컴퓨터 시스템 혹은 관련 분야 석/박사 졸업 • 각종 AI/HPC 애플리케이션을 GPU에서 병렬화/최적화해 본 경험 및 관련 논문 개제 이력 • MPI, NCCL 등을 사용해 GPU 클러스터에서 동작하는 프로그램을 개발해 본 경험 • C++ 기반의 대규모 소프트웨어 개발에 참여한 이력 • 딥 러닝에 대한 기본적인 지식, 인공신경망 모델을 직접 구현해 본 경험 • 주요 학술대회에 논문 게재 이력(예: ASPLOS, HPDC, ISCA, Micro, PACT, PLDI, PPoPP, SC) 및 기타 연구 경력
- 복지 및 혜택
[근무환경] • 강남역 8번 출구 위치 • 음료/커피/스낵 지원 • 유연근무제 • 재택근무제 • 장비지원금 지원 [복지제도] • 교육 및 도서 지원 • 본인 및 배우자 건강검진 지원 • 생일 휴가 및 선물 지원 • 장기근속 휴가 • 헬스장 지원 [조직문화] • 각종 문화행사 지원 • 동호회활동 지원 • 회식비 지원
기업/서비스 소개
기업상세 정보로 이동1 / 4
초거대 AI 시대가 도래하면서 대규모 계산 인프라를 잘 구축/활용하는 것이 AI 산업의 핵심이 되었습니다. 모레는 GPU/NPU 라이브러리부터 분산 런타임 시스템, 자동 병렬화/최적화 컴파일러, PyTorch/TensorFlow 호환 프레임워크, 클라우드 플랫폼에 이르기까지 AI 인프라 소프트웨어 스택을 완전히 새롭게 개발합니다. 모레는 하드웨어부터 초거대 AI 모델에 이르기까지 다양한 영역의 문제를 해결하면서 기존에 없던 혁신적인 소프트웨어를 개발하고 있습니다. 모레와 함께 성장하며 새로운 업무에 도전할 개발자 분들을 찾습니다!