담당업무
회사에서는 대규모 AI 클라우드 인프라를 효율적으로 활용, 관리하기 위한 소프트웨 어 기술 개발을 함께 할 엔지니어를 모집하고 있습니다. AI 프레임워크와 인프라 수 준 소프트웨어의 강한 연계를 통해 기존 AI 클라우드의 각종 한계 및 비효율을 극복 합니다. 모레의 플랫폼 소프트웨어 엔지니어는 구체적으로 다음과 같은 기술적 과제 를 해결하는 일을 담당합니다. i. 대규모 GPU 클러스터의 자원 관리 및 효율적인 운영을 위한 소프트웨어 구성 요소 개발: scheduling, checkpointing, fault detection, live migration 등 ii. 컨테이너 기반 AI 클라우드 서비스를 위한 소프트웨어 구성 요소 개발 iii. 회사의 AI 소프트웨어 스택과 다양한 PaaS, SaaS 서비스 간의 연동 iv. 대용량 학습 데이터로의 효율적인 접근을 위한 기술 개발
자격요건
ㆍ학력 : 대졸이상
ㆍ경력 : 경력1년↑
i. 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분 ii. C++ 및 Python 개발 가능하신 분 iii. 컴퓨터 시스템에 대한 이해가 있으신 분
우대조건 i. 컴퓨터 시스템 혹은 관련 분야 석/박사 졸업 ii. ML 워크플로우 플랫폼 및 MLOps 솔루션을 사용하거나 개발해 본 경험 iii. Docker 및 Kubernetes에 대한 깊은 지식 iv. High availability 소프트웨어 개발 경험 혹은 관련 지식 v. 분산 파일 시스템(Lustre, Ceph 등) 및 빅 데이터 분석 플랫폼(Apache Spark 등) 을 사용하거나 개발해 본 경험 vi. PyTorch/TensorFlow 등의 AI 프레임워크에 대한 지식 vii. OpenCL 혹은 CUDA 개발 경험 viii. 대규모 클러스터, 특히 GPU 클러스터를 구축, 운영해 본 경험
|