AI 모델 개발 및 서비스 (경력2년 이상)

[GenAI 고도화팀은 어떤 조직이고, 무슨 일을 하나요?]
저희가 추구하는 일은 실용적인 모델을 만드는 것입니다.
단순히 리더보드에서 스코어만 높은 모델이 아닌, 실제 상용 환경에서 품질, 속도 등 안정된 서비스 가능한 모델을 개발합니다.
그 동안 자연어 분야에서 다양한 인공지능 서비스를 개발해 왔으면, 앞으로 음향(STT/TTS), 멀티모달 등 분야를 더욱 넓혀갈 계획입니다.
따라서, 여러 분야의 모델을 접목하여 사람들에게 도움을 주는 AI 서비스를 만드는 것에 집중하고 있습니다.

저희가 추구하는 문화는, 끊임없이 공유하고 함께 탐구하는 것입니다.
현재 작업하는 분야가 다르더라도, 매주 스프린트를 통해 노하우를 공유하는 기술세션을 가지고 있으며,
거기서 나온 좋은 아이디어를 적용해보고, 서로 결과를 공유합니다.
또한, 잘 풀리지 않는 문제도, Case Open하여 서로 공유하고, 서로의 경험을 통해 해결하기 위해 다같이 노력합니다.
따라서, 질문하는 것에 부끄럽지 않고, 답변해주는 것에 귀찮아하지 않는 조직문화를 지향합니다.

구체적으로는 이런 일들을 합니다.

1. 모델 Research
 - Scratch 부터 모델을 학습하는 것을 포함하여, Further 학습을 진행하는 등, 논문을 찾고, 리뷰하고, 우리에 맞게 실증합니다.
 - 모델 뿐만 아니라 경량화, 학습속도 향상, 서빙을 어떻게 편하게 할까? 등의 많은 고민들에서 부터 시작하는 문제 해결을 포함합니다.
 - 모델을 개선하고, 유의미한 성과가 있다면 특허, 논문 출원이 진행될 수 있습니다.
 - 실용적이지 않은 방법은 과감하게 포기하고, 꾸준히 탐구하고 적용해보는 능력을 요구합니다.
 - 분야가 고정되어있지 않으며, 우리가 필요한 모델이라고 생각되면 어떤 분야라도 도전할 수 있는 마음가짐을 요구합니다.

2. 모델 Engineering
 - Research로 나온 모델을 실제 서비스에 적용해보고, 실제 서비스시 더 나은 성능을 위해 필요한 경우 고객사 데이터에 최적화하는 작업을 진행합니다.
 - 데이터 증강, 학습방식 변경 등 여기서도 실환경에 적합한 연구가 수반될 수 있습니다.
 - 모델 Serving API 완성까지를 수반합니다. 
   (여기서 Serving은 들어온 입려에 대해 전처리 등을 수행하여, 모델의 예측 또는 생성 결과를 클라이언트에 보내는 것을 의미합니다.)
 - 자체 GPU 장비 뿐만 아니라 AWS, GCP, 네이버클라우드 등 클라우드 등을 개발 및 서빙에 활용할 수 있습니다.

3. Competition 참여
 - 진행하고 있는 프로젝트나 분야에 적합한 Competition이 있다면 동료들과 함께 참여하여 성과를 인정받을 수 있습니다.
 - 진행중인 방법론이나 노하우, 성공/실패기를 정리하여 세미나를 진행합니다.

저희는 이런 일을 할 수 있는 준비가 되어 있는 조직이며,
함께하실 분들도 이런 업무를 함께 적극적으로 진행할 역량 및 자세가 된 분이라면 좋겠습니다.
저희 조직의 최고의 장점은 유연하다는 점과, 최대한 모델러로써의 업무에만 집중할 수 있는 환경을 마련해드린다는 점입니다.
기술 분야(음성/이미지/자연어), 스택(프레임워크)을 적용함에 있어 변화에 유연하고, 새로운 도전을 응원하는 조직입니다.
따라서, 문제를 해결할때 딥러닝 방법론이 필요하다면, 최적의 해를 제공할 수 있는 조직입니다.

업무의 범위가 꽤 넓어보일 수 있지만, 애자일하게 업무량을 관리하고 있으며, 관심도와 실력에 따라 업무를 분배하고 있습니다.
또한, 기술 스프린트를 통하여 고민과 노하우를 끊임없이 공유하므로, 문제들을 최대한 쉽게 해결할 수 있도록 노력합니다.

[저희가 2022년 하반기 ~ 2023년 동안 수행한 성과는 아래와 같습니다]
- 2022년 NIA STT 컴피티션 3개 부분 1등 (일반대화, 명령어, 방언)
- 2023년 아이코닉스 AI바우처 지원사업(다국어 AI 성우 시스템) 성공
- 2023년 HuggingFace LLM LeaderBoard 13B 부문 1등 (231004)
- 2023년 NIA Open Ko-LLM 리더보드 1위 (231014)

[기술스택에 대해서 알려주세요]
기본적으로 Python3, Torch를 사용합니다.
- 학습 모니터링: WandB, TensorBoard
- 학습 효율화: DDP, DeepSpeed, FSDP
- 학습: HuggingFace, Torch Native, Torch Lightning(and Fabric)
- 서빙: 자체 FastAPI Wrapper, BentoML, Triton
더 좋은 프레임워크가 있다면, 얼마든지 포용할 준비가 되어있으니, 다양한 기술스택 분야의 분들이 지원해주시면 감사하겠습니다.

[입사하게 되면 어떤 일을 하게 될까요?]
아래 3가지 업무를 보고, 지원 내역에 원하는 업무 기재 부탁 드립니다. 

자연어 
1. 자체 노하우로 Further Learning된 LLM42에 대한 지속적인 고도화 작업
2. 모델 경량화를 위한 각종 프레임워크 적용 (GPTQ, GGUF, QuIP, optimum-nvidia 등)
3. 고객사 프로젝트 발생 시, 데이터 증강(Prompt Engineering) 및 요구사항에 맞는 학습 실시 (SFT, PEFT 등)


멀티모달

1. 멀티모달을 위한 Embedding 기술 검토 및 실증
2. CLIP, NeXT-GPT, Meta-Transformer, OneLLM 등 멀티모달리티를 위한 기술 검토 및 실증
3. 서비스를 위한 최종 모델 아키텍쳐 선택 및 한국어 데이터로 모델 학습 및 검증

음향(STT/TTS) 
현재는 음향은 23년 프로젝트가 모두 성공리에 종료되어, 이후 로드맵을 설립중입니다.
1. 자체 노하우로 학습한 STT/TTS 모델 관리
2. Voice Conversion등 새로운 모델 탐색 및 실증

[자격요건과 우대사항이 있을까요?]
있긴 있습니다만 너무 신경쓰지 않으셔도 됩니다. 자격요건을 완벽히 갖추지 않았어도 저희는 지원자님들의 제출서류를 꼼꼼히 읽고 판단합니다
그래서, git, blog 등 보여주고 싶은 항목들이 있다면 다양하게 포함해주시면 감사하겠습니다. 

자연어

자격요건
 - 수학, 통계, 컴퓨터공학 학사
 - 인공지능 업계 경력 2년 이상
 - Production 단계까지의 인공지능 서비스를 만들고 운영해보신 경험이 있는 분
 - SFT, PEFT, RLHF, DPO 중 최소 3개 이상 학습 경험이 있는 분
 - 논문을 읽고 빠르게 구현하여 실증할 수 있는 분
 - Prompt Engineering에 관심이 많거나 개인적인 노하우가 있는 분
 - 인공지능 커뮤니티에서 활발한 활동을 하고 신기술 탐구를 즐기시는 분 (아카라이브, HuggingFace Hub 등)
 - 창의적인 방식으로 문제를 해결해본 경험이 있거나 방법을 많이 제안하시는 분
 - 논문의 수학식을 이해하고, 함수가 의도하는 목표를 말로 설명할 수 있는 분

우대사항
 - 수학, 통계, 컴퓨터공학 석사/박사
 - 본인이 연구/개발한 모델 혹은 학습 방법론을 말로 풀어서 쉽게 설명할 수 있는 분
 - Competition 참여 경험이 많거나 높은 점수를 얻은 경험이 있는 분
 - 오픈소스 Contribute 경험이 있는 분
 - Model Serving 경험이 있거나, REST API, gRPC 경험이 있는 분

멀티모달

자격요건
 - 수학, 통계, 컴퓨터공학 학사
 - 인공지능 업계 경력 2년 이상
 - LLM을 학습하고 Serving 해보신 분
 - 비전, 음성 모델을 학습하고 Serving 해보신 분
 - Production 단계까지의 인공지능 서비스를 만들고 운영해보신 경험이 있는 분
 - 인공지능 커뮤니티에서 활발한 활동을 하고 신기술 탐구를 즐기시는 분 (아카라이브, HuggingFace Hub 등)
 - 창의적인 방식으로 문제를 해결해본 경험이 있거나 방법을 많이 제안하시는 분
 - 논문의 수학식을 이해하고, 함수가 의도하는 목표를 말로 설명할 수 있는 분

우대사항
 - 수학, 통계, 컴퓨터공학 석사/박사
 - CLIP 기반의 모델을 학습하고 서비스 해보신 분
 - 본인이 연구/개발한 모델 혹은 학습 방법론을 말로 풀어서 쉽게 설명할 수 있는 분
 - Competition 참여 경험이 많거나 높은 점수를 얻은 경험이 있는 분
 - 오픈소스 Contribute 경험이 있는 분
 - Model Serving 경험이 있거나, REST API, gRPC 경험이 있는 분

음향

자격요건
 - 수학, 통계, 컴퓨터공학 학사
 - 인공지능 업계 경력 2년 이상
 - Production 단계까지의 인공지능 서비스를 운영해보신 경험이 있는 분
 - 논문의 방식을 개선하여, 더 좋은 Contribution 경험이 있는 분
 - TTS 모델을 학습하고 Serving한 경험이 있는 분
 - 논문의 수학식을 이해하고, 함수가 의도하는 목표를 말로 설명할 수 있는 분

우대사항
 - 수학, 통계, 컴퓨터공학 석사/박사
 - 본인이 연구/개발한 모델 혹은 학습 방법론을 말로 풀어서 쉽게 설명할 수 있는 분
 - STT 모델을 학습하고 Serving한 경험이 있는 분
 - 오픈소스 Contribute 경험이 있는 분
 - Model Serving 경험이 있거나, REST API, gRPC 경험이 있는 분

[채용전형은 어떻게 진행되나요?]
서류 전형 -> 과제 전형 -> 기술/직무 면접 -> 최종 면접 -> 최종 결과 발표로 진행됩니다.
과제 전형의 경우, 대체적으로 논문을 읽고, 필요 기능을 하는 모델 혹은 특정 기능의 모듈을 구현하는 것을 목표로 하며
저희가 활용하는 기술스택 프레임워크를 활용하거나, 비슷한 기능을 하는 프레임워크를 사용하여 목표한 것을 구현하였을때 추가 점수를 드리고 있습니다.

과제 전형의 경우 문제를 어떻게, 어떤 과정으로 해결하려고 하는지를 평가하기 위함이라, 내부적으로 충분한 검토시간이 수반됩니다.
따라서 결과 안내까지 시간이 걸릴 수 있으니 양해해주시면 감사하겠습니다.

[회사 소식]
저희 포티투마루는 24년 초에 시리즈 B 투자를 마무리하고, 올해 초거대 AI 상용화를 기반으로 AI 선도 기업으로 자리매김해 나가겠습니다.
관련 내용은 아래 링크를 참고해 주세요.  

[그 외 채용 관련 사항]
- 잡코리아 지원을 통해 지원해주심 감사하겠습니다. 
- 서류합격자에 한해 과제 전형 별도 안내 드리고 있으며, 최종 적격자가 있을 경우 조기 종료될 수 있습니다. 
- 허위사실이 발견될 경우 채용이 취소될 수 있습니다.