담당업무( 1명 )
ㆍ데이터 생애주기 관리 시스템 구축 및 사내 데이터 관리
ㆍ데이터 레이크 & 데이터 가공 파이프라인 설계, 구축 및 관리
ㆍ데이터의 형태, 가공 방식 등의 정의 및 개선
ㆍ데이터 변환 및 배포
ㆍ데이터 검색/조사 및 크롤링
ㆍ데이터셋 특성 분석 및 통계 도출
ㆍ데이터 라벨링 시스템 구축, 개선, 라벨링 성과 분석
ㆍ학습된 모델을 이용한 pseudo annotation 생성 및 품질 개선
ㆍ주요 사용 스택 : Airflow, PostgreSQL, Docker, boto3, Pandas, MinIO, AWS_S3
ㆍ안내사항 : 로민의 데이터 엔지니어 포지션은 머신러닝(ML) 관련 업무는 진행하지 않습니다.
스킬
ㆍAWS, Docker, Pandas, PostgreSQL, Python, Airflow
자격요건
ㆍ학력 : 대졸이상
ㆍ경력 : 5 ~ 15년
ㆍ팀 리딩이 가능하신 분
ㆍ데이터 엔지니어 경력 5년 이상이거나 그에 준하는 역량을 보유하신 분
ㆍPython 개발에 능숙한 분
ㆍ데이터, 통계에 대한 기본 지식을 가진 분
ㆍ처음 해보는 일도 당황하지 않고 침착하게 해결할 수 있는 문제해결 능력을 가진 분
ㆍ함께 서비스를 만드는 동료들과의 원활한 커뮤니케이션이 가능하신 분을 찾습니다.
ㆍ본인이 구현한 코드, 업무의 진행 상황 및 결과 등을 정확하고 체계적으로 문서화할 수 있는 능력이 있는 분
ㆍ이공계 학사 이상(전공 무관)
우대조건
ㆍ팀을 리딩해 보신 분
ㆍETL / 데이터 관련 인프라 구축 경험
ㆍ데이터 라벨링 SW 개발 혹은 구축한 경험이 있으신 분
ㆍ관련 분야 석사학위 이상 소지자
|