머신 러닝 영역

머신 러닝 영역 (Machine learning Stack)

AWS에는 머신 러닝 영역을 크게 세 가지로 분류함 (AI Service, ML Service, ML Frameworks&Infrastructure)

ML Frameworks & Infrastructure

  • IaaS 레벨에서 제공 -> 사용자에게 가상화된 IT 인프라(서버, 스토리지, 네트워크 등)를 인터넷을 통해 제공

  • AWS 상에서 컴퓨팅파워로 오픈소스로된 프레임워크(텐서플로우, 파이토치 등)를 구성

ML Service

  • AWS에선 머신 러닝 서비스로 SageMaker를 제공

  • 머신러닝을 잘모르는 일반 엔지니어가 사용하는 서비스가 아닌 데이터 엔지니어, AI ML전문가가 사용하는 개발환경

AI Service

  • 비전문 엔지니어들을 위한 머신 러닝 서비스들을 추상화 해놓은 서비스들을 AI 서비스라고 한다.

ML: Amazon SageMaker

주피터 노트북이 실체 대화형 환경에서 코드, 텍스트, 수식, 시각화를 작성하고 실행할 수 있는 오픈 소스 도구

  • 세이지메이커 내 포함된 수 많은 기능을 가지고 머신러닝 구현

  • 세이지(현자)를 만드는 서비스

  • 데이터 라벨링, 모델 빌드, 트레이닝, 결과물 추론 등

  • AI, ML을 위한 전반적인 라이프사이클을 통합 관리할 수 있는 개발환경

  • 주피터 노트북을 기반으로 갖고 있는 데이터들을 데이터 소스를 지정해서 빌드하고, 학습해서 모델을 만들고 모델을 배포해서 추론까지 하는 전체적인 과정을 세이지메이커에서 할 수 있다.

  • 데이터 저장, 추론 하는 과정을 클라이언트에 노출하는 등의 작업은 Lambda, S3, CloudeFront, API Gateway 등이 쓰임

AI: 추상화된 머신러닝 서비스들

머신러닝의 전문적인 지식 없이도 거기에 쓰일 정제된 데이터만 있으면 모델링을 내가하지 않고도 이미 빌드된 모델에 데이터만 놓고 학습을 시킬 수 있는 서비스

  • Amazon Personalize

    • 추천 개인화 서비스

    • 적절한 데이터만 피딩해주면 데이터 훈련, 추론을 알아서 해주는 편리함 제공

    • ML 민주화

피딩이란(Data Feeding)? 기계 학습 또는 데이터 처리 과정에서 모델에 데이터를 공급하는 작업

Last updated