[NetsPresso] Quantization Research Engineer
직군
R&D
경력사항
경력 5년 이상
고용형태
정규직
근무지
Nota대한민국 서울특별시 강남구 테헤란로 521, 파르나스타워 16층 Nota

👋 우리 ​팀을 ​소개합니다.

NetsPresso ​Platform 팀은 ​Nota AI의 AI 모델 ​경량화 ​및 최적화 ​기술을 바탕으로, 연구·개발된 ​기술을 실제 ​제품으로 ​구현하여 사용자에게 ​제공하는 ​핵심 ​플랫폼과 소프트웨어를 설계·구현하는 ​조직입니다.

Model ​Representation, Quantization, Graph ​Optimization, ​Model ​Engineering, SW Engineering ​파트로 구성되어 ​있으며, ​그중 Quantization ​파트는 NetsPresso의 ​핵심 ​최적화 기술인 양자화를 ​연구하고, 자체 ​기술을 제품에 탑재하여 다양한 HW에서 딥러닝 모델 추론을 가속화합니다.

  • 양자화로 인한 성능 저하를 최소화하는 알고리즘을 연구하며
  • 다양한 HW 및 Backend의 제약사항에 맞는 양자화를 지원하고
  • 실제 HW에서 가속 가능한 형태로 모델을 변환합니다.



📌 해당 포지션으로 합류하신다면

NetsPresso의 핵심 역할을 수행하는 양자화 기술을 연구하고 제품화합니다. 최신 양자화 알고리즘을 연구하고, 다양한 모델과 HW의 특성에 맞게 최적화하는 노타만의 고유한 양자화 기법을 설계합니다. On-device AI를 위한 다양한 최적화 기술과 최신 모델을 경험할 수 있습니다.




✅ 주요 업무

  • Quantization 기술 연구 및 제품화
  • 차세대 Post-Training Quantization(PTQ), Quantization-Aware Training(QAT), Compression 알고리즘 연구 및 개발
  • 모델 아키텍처 및 타겟 HW 특성을 고려한 Quantization 전략 수립 및 프레임워크 설계
  • Generative AI(LLM, VLM, Diffusion 등), Computer Vision(Classification, Detection, Segmentation 등) 및 다양한 AI 모델에 대한 최적화 방법론 연구
  • 연구 결과의 논문 발표 및 특허 출원을 통한 기술 리더십 확보
  • On-device AI 모델 최적화
  • 다양한 On-device HW로의 배포를 위한 quantization 파이프라인 설계 및 고도화
  • AI 모델 최적화 프로젝트 수행
  • Quantization으로 인한 정확도 저하 원인 분석 및 체계적인 해결 방안 수립



✅ 자격요건

  • 컴퓨터공학, 전자공학 등 관련 전공 학위 소지자
  • 학사 5년 이상, 석사 후 3년 이상, 박사 졸업 및 졸업 예정자
  • Quantization, 모델 압축, 또는 딥러닝 최적화 분야에서의 심도 있는 연구/개발 경험
  • PyTorch, ExecuTorch, ONNX 기반 딥러닝 모델 최적화에 대한 깊은 이해
  • 소규모 이상의 프로젝트 리드 및 관리 경험
  • 기술 문서 작성 및 영어 커뮤니케이션 능력
  • 해외 여행에 결격 사유가 없는 분



✅ 우대사항

  • Quantization, 모델 압축, 커널 최적화 관련 top-tier 학회(NeurIPS, ICML, CVPR, ICLR 등) 논문 발표 경험
  • 연구 결과의 제품화 및 상용 서비스 적용 경험
  • ExecuTorch, ONNX, TensorRT, AIMET 등 최적화 라이브러리 심화 활용 경험
  • Low-bit 모델의 Embedded Device 포팅 및 성능 튜닝 경험
  • 오픈소스 프로젝트 기여 또는 유지보수 경험
  • 박사 학위 소지자



✅ 채용 절차

  • 서류 검토 → 사전 과제 → 1차 인터뷰 → 2차 인터뷰 → 처우 협의 → 최종 선발

(절차 간에 추가적인 과제가 있을 수 있습니다.)




🤓 팀의 메세지

새로운 기술에 대한 높은 관심과 아이디어를 실제로 구현해내는 실행력이 중요합니다. 단순한 연구에 그치지 않고, NetsPresso 서비스와 직접 연결되는 독자적인 양자화 기술을 개발하는 포지션입니다. 각 모듈이 유기적으로 연결되어 있는 만큼, 팀 내 활발한 소통과 주도적인 태도를 무엇보다 중요하게 생각합니다. 복잡한 기술적 문제를 깊이 있게 파고들고, 협업을 통해 함께 성장하고 싶은 분이라면 이 팀에서 분명 좋은 성과를 낼 수 있을 것입니다.



지원 전, 확인해주세요! 👀

  • 해당 공고는 상시 채용으로, 채용 완료 시 조기 마감될 수 있습니다.
  • 이력서 내 연봉 정보 등 민감한 개인 정보가 기재되어 있다면, 해당 서류는 검토되지 않을 수 있습니다.
  • 제출해 주신 내용 중 허위 사실이 있을 경우 채용이 취소될 수 있습니다.
  • 채용 전 레퍼런스 체크가 있음을 알려드립니다.
  • 최종 인터뷰 합격 시 별도로 처우를 협의합니다.
  • 입사 후 시용기간이 있으며, 이에 대한 처우는 차등을 두지 않음을 알려드립니다.
  • 국가보훈대상자 및 장애인은 관련 법규에 의거하여 우대합니다.
  • 장애인 고용 촉진을 위한 행정적 절차 확인이 필요한 경우, 장애인 등록증 사본을 기타 서류 란에 선택적으로 제출하실 수 있습니다. 제출 여부는 전형 평가에 어떠한 영향도 미치지 않습니다.
  • R&D 모든 포지션에서 전문연구요원, 산업기능요원으로 근무가 가능합니다. (단, 산업기능요원 현역 신규 편입의 경우 불가능)



🔎 읽어보면 도움 되는 관련 자료

공유하기
[NetsPresso] Quantization Research Engineer

👋 우리 ​팀을 ​소개합니다.

NetsPresso ​Platform 팀은 ​Nota AI의 AI 모델 ​경량화 ​및 최적화 ​기술을 바탕으로, 연구·개발된 ​기술을 실제 ​제품으로 ​구현하여 사용자에게 ​제공하는 ​핵심 ​플랫폼과 소프트웨어를 설계·구현하는 ​조직입니다.

Model ​Representation, Quantization, Graph ​Optimization, ​Model ​Engineering, SW Engineering ​파트로 구성되어 ​있으며, ​그중 Quantization ​파트는 NetsPresso의 ​핵심 ​최적화 기술인 양자화를 ​연구하고, 자체 ​기술을 제품에 탑재하여 다양한 HW에서 딥러닝 모델 추론을 가속화합니다.

  • 양자화로 인한 성능 저하를 최소화하는 알고리즘을 연구하며
  • 다양한 HW 및 Backend의 제약사항에 맞는 양자화를 지원하고
  • 실제 HW에서 가속 가능한 형태로 모델을 변환합니다.



📌 해당 포지션으로 합류하신다면

NetsPresso의 핵심 역할을 수행하는 양자화 기술을 연구하고 제품화합니다. 최신 양자화 알고리즘을 연구하고, 다양한 모델과 HW의 특성에 맞게 최적화하는 노타만의 고유한 양자화 기법을 설계합니다. On-device AI를 위한 다양한 최적화 기술과 최신 모델을 경험할 수 있습니다.




✅ 주요 업무

  • Quantization 기술 연구 및 제품화
  • 차세대 Post-Training Quantization(PTQ), Quantization-Aware Training(QAT), Compression 알고리즘 연구 및 개발
  • 모델 아키텍처 및 타겟 HW 특성을 고려한 Quantization 전략 수립 및 프레임워크 설계
  • Generative AI(LLM, VLM, Diffusion 등), Computer Vision(Classification, Detection, Segmentation 등) 및 다양한 AI 모델에 대한 최적화 방법론 연구
  • 연구 결과의 논문 발표 및 특허 출원을 통한 기술 리더십 확보
  • On-device AI 모델 최적화
  • 다양한 On-device HW로의 배포를 위한 quantization 파이프라인 설계 및 고도화
  • AI 모델 최적화 프로젝트 수행
  • Quantization으로 인한 정확도 저하 원인 분석 및 체계적인 해결 방안 수립



✅ 자격요건

  • 컴퓨터공학, 전자공학 등 관련 전공 학위 소지자
  • 학사 5년 이상, 석사 후 3년 이상, 박사 졸업 및 졸업 예정자
  • Quantization, 모델 압축, 또는 딥러닝 최적화 분야에서의 심도 있는 연구/개발 경험
  • PyTorch, ExecuTorch, ONNX 기반 딥러닝 모델 최적화에 대한 깊은 이해
  • 소규모 이상의 프로젝트 리드 및 관리 경험
  • 기술 문서 작성 및 영어 커뮤니케이션 능력
  • 해외 여행에 결격 사유가 없는 분



✅ 우대사항

  • Quantization, 모델 압축, 커널 최적화 관련 top-tier 학회(NeurIPS, ICML, CVPR, ICLR 등) 논문 발표 경험
  • 연구 결과의 제품화 및 상용 서비스 적용 경험
  • ExecuTorch, ONNX, TensorRT, AIMET 등 최적화 라이브러리 심화 활용 경험
  • Low-bit 모델의 Embedded Device 포팅 및 성능 튜닝 경험
  • 오픈소스 프로젝트 기여 또는 유지보수 경험
  • 박사 학위 소지자



✅ 채용 절차

  • 서류 검토 → 사전 과제 → 1차 인터뷰 → 2차 인터뷰 → 처우 협의 → 최종 선발

(절차 간에 추가적인 과제가 있을 수 있습니다.)




🤓 팀의 메세지

새로운 기술에 대한 높은 관심과 아이디어를 실제로 구현해내는 실행력이 중요합니다. 단순한 연구에 그치지 않고, NetsPresso 서비스와 직접 연결되는 독자적인 양자화 기술을 개발하는 포지션입니다. 각 모듈이 유기적으로 연결되어 있는 만큼, 팀 내 활발한 소통과 주도적인 태도를 무엇보다 중요하게 생각합니다. 복잡한 기술적 문제를 깊이 있게 파고들고, 협업을 통해 함께 성장하고 싶은 분이라면 이 팀에서 분명 좋은 성과를 낼 수 있을 것입니다.



지원 전, 확인해주세요! 👀

  • 해당 공고는 상시 채용으로, 채용 완료 시 조기 마감될 수 있습니다.
  • 이력서 내 연봉 정보 등 민감한 개인 정보가 기재되어 있다면, 해당 서류는 검토되지 않을 수 있습니다.
  • 제출해 주신 내용 중 허위 사실이 있을 경우 채용이 취소될 수 있습니다.
  • 채용 전 레퍼런스 체크가 있음을 알려드립니다.
  • 최종 인터뷰 합격 시 별도로 처우를 협의합니다.
  • 입사 후 시용기간이 있으며, 이에 대한 처우는 차등을 두지 않음을 알려드립니다.
  • 국가보훈대상자 및 장애인은 관련 법규에 의거하여 우대합니다.
  • 장애인 고용 촉진을 위한 행정적 절차 확인이 필요한 경우, 장애인 등록증 사본을 기타 서류 란에 선택적으로 제출하실 수 있습니다. 제출 여부는 전형 평가에 어떠한 영향도 미치지 않습니다.
  • R&D 모든 포지션에서 전문연구요원, 산업기능요원으로 근무가 가능합니다. (단, 산업기능요원 현역 신규 편입의 경우 불가능)



🔎 읽어보면 도움 되는 관련 자료