2019 AWS Dev Day에 참가했다. 참가한 주 목적은 사내에 SageMaker를 도입하고자 정보를 얻기 위함이다. 😏


행사 일정

오전에는 전반적인 aws 서비스 소개를 듣고, 오후에는 본인이 원하는 세션을 찾아 듣는 방식.

시간 내용
09:00 - 10:00 등록 및 전시 부스 관람
10:00 - 11:30 기조 연설
11:30 - 12:45 점심 시간
12:45 - 17:30 강연 및 실습 워크샵


오후 시간에는 총 3세션의 강연(인공지능/기계 학습, 앱 현대화, 이머징 테크)과 4세션의 실습 워크샵(GluonCV, IoT+SageMaker, EKS, Amplify+AI)이 준비되어있었고, 나는 인공지능/기계 학습 세션을 청강했다.

사실 Amplify와 AI 서비스를 활용한 서버리스 기반 소셜 안드로이드 앱 만들기 실습도 해보고싶었던터라 조금 아쉬움이 남았다. 😢


인공지능/기계 학습 강연 일정

시간 내용
12:45 - 13:45 개발자를 위한 수백만 사용자 대상 기계 학습 서비스 확장 하기
윤석찬 수석테크에반젤리스트, AWS
문효준 책임 연구원, LG전자


기계 학습은 이제 개발자에게 필수 기술셋이 되었습니다. 이미지/비디오 인식, 음성 인식 및 합성, 비지니스 예측, 사용자 추천 등 다양한 스마트 애플리케이션 개발 및 배포를 위해 기계 학습 기술을 배우고 이를 적용해야 합니다. 본 세션에서는 AWS의 다양한 서비스를 활용하여 개발자들이 기계 학습을 처음 접하는 시점부터 혼자서 공부하는 방법부터 팀에서 초기 도입시, 그리고 정식 프로덕션 환경에서 수백만 사용자를 위한 서비스를 향해 가는 과정을 알려드림으로서 머신 러닝 엔지니어가 될 수 있는 방법을 알아봅니다.
14:00 - 15:00 기계 학습 싸고 빠르게 하는 방법 - Amazon SageMaker 편
김필호 솔루션즈 아키텍트, AWS

기계 학습을 기반한 서비스를 개발하기 위해서는, 데이터 준비, 모델 훈련과 배포의 다양한 과정을 반복적으로 진행해야 합니다. AWS에서는 각 과정별로 사용자가 각자 워크로드에 맞춘 가장 비용 효율적인 ML 프레임워크인 Amazon SageMaker 관리형 서비스를 제공하고 있습니다. 본 세션에서는 SageMaker를 활용하는 방법과 함께 어떻게 하면 모델 생성, 학습 및 배포를 위한 자원을 가장 효율적이고 경제적으로 사용할 수 있는 방법을 소개합니다.
15:15 - 16:15 AWS 기반 기계 학습 자동화 및 최적화를 위한 실전 기법
남궁영환 AI/ML 솔루션즈 아키텍트, AWS

기계 학습 모델을 서비스로 제공하려면, 지속적인 학습 및 배포 과정이 필요합니다. 모델 훈련시 최적화 과정, 배포된 모델이 추론을 통해 서비스 되기 위한 성능 개선도 필수 요소입니다. 본 세션에서는 AWS를 활용한 대규모 리소스를 이용한 효율적인 모델 학습 시 유용한 내용들을 소개합니다. 대규모 리소스를 이용할 경우 인프라 선택, 모델 학습 환경 선택 및 구성, 확장성 등이 함께 고려되어야 합니다. 이와 관련한 AWS 서비스들의 특징과 어떤 결과를 보여주는지도 함께 알아봅니다.
16:30 - 17:30 Intel on AWS, AI/ML Service 성능 향상을 위한 협력 모델
서지혜 솔루션즈 아키텍트, AWS
김종학 과장, Intel


클라우드는 데이터 수집, 저장, 맞춤형 AI/ML 모델 생성 등 대규모 AI워크로드 운영을 비용 효율적이며 쉽게 만들어 줄 수 있습니다. 이 세션에서는 AI 워크로드를 간단하고 빠르게 처리하기 위해 AWS와 Intel이 어떻게 협력하고 있는지에 관해 설명합니다. 첫 번째로 AWS C5 인스턴스에 적용된 고성능 Intel Xeon® Scalable processors 기술에 대해 설명합니다. 그리고 강화 학습으로 생성된 모델을 가지고 자율 주행하는 1/18 스케일의 자동차DeepRacer 에 적용된 Intel의 강화 학습 라이브러리 및 Inference engine (Openvino)에 대해서도 알아봅니다. 이 밖에도 AWS AI/ML Marketplace에 제공 되고 있는 Intel의 AWS AI/ML library 및 모델에 대해 알아봅니다.


Register

친절하신 aws 직원분들이 등록을 도와준다. 회사명이 이렇게 대문짝하게 찍히는줄 모르고 적어냈는데 bold 적용돼서 출력되는 덕분에, 나를 IT부문에서 왔다고 착각하시곤 말을 거시던 분들이 계셨다. 아니라고하기가 민망해서 대충 대화를 하긴 했는데 전 일개 OY 정보전략팀이라 아무것도 모릅니다..



기조 연설

Kick off (Olivier Klein, AWS)

Modern Application Design: 애플리케이션 모듈화를 위해 현재 방식에서 아키텍쳐 패턴 변경, 운영 방식 변경, 배포 방식 등을 변경해야함. 이를 microservice라고 지칭한다. microservice끼리는 API를 통해 통신을 하며, 서비스의 구성은 code, sdk, data stores로 구성되어있다. data stores를 선택할 수 있다는것은 데이터베이스 전략을 세움으로서 나에게 가장 적합한 것을 선택할 수 있다는 것을 의미한다.

Serverless: microservice를 지향하기 위해서는 serverless를 추구해야한다. AWS Lanbda, AWS Fargate, 그리고 새로운 AWS Lambda Layers를 통해서

Auto rollout: 배포 과정을 자동화해야한다.


AWS를 사용한 클라우드 마이그레이션 경험 공유 (정성권 수석, 삼성전자)

SAMSUNG Account

Cloud native를 제공하기 위해서는 IDC에서 벗어나 안정적인 클라우드로 옮겨야한다는 생각을 하게 되었음. 그러나 삼성 전체의 인증을 담당하기 때문에 안정적인 무중단 마이그레션이 필요했음

  1. 클라우드 마이그레이션
    • 인프라스트럭쳐 엔지니어의 역할: 마이그레이션 아키텍처 - API GW 기반 Strangler 패턴 적용, 클라우드 인프라스트럭처 기반 코드 작성, Immutable 인프라스트럭처, CI/CD 파이프라인 구축: Python
    • 데이터베이스 관리자의 역할: 데이터 마이그레이션 계획, 데이터 로딩 및 CDC 동기화, 스키마 및 쿼리 변환, 데이터베이스 관리
  2. 마이크로서비스로 리팩토링
  3. 컨테이너 기반 클라우드 네이티브

클라우드 이전으로 인한 이점: 라이선스 비용 절감, 관리형 서비스 활용, 오픈소스 활용 경험 축적, 다양한 서비스 실험 가능


AWS application 소개 (Olivier Klein, AWS)

DEMO

Applications with mobile app roll-on

Applications with IoT

Data

AI and Machine Learning

AI Services - ML Services - ML Frameworks + Infrastructure



개발자를 위한 수백만 사용자 대상 기계 학습 서비스 확장 하기

기계 학습은 이제 개발자에게 필수 기술셋이 되었습니다. 이미지/비디오 인식, 음성 인식 및 합성, 비지니스 예측, 사용자 추천 등 다양한 스마트 애플리케이션 개발 및 배포를 위해 기계 학습 기술을 배우고 이를 적용해야 합니다. 본 세션에서는 AWS의 다양한 서비스를 활용하여 개발자들이 기계 학습을 처음 접하는 시점부터 혼자서 공부하는 방법부터 팀에서 초기 도입시, 그리고 정식 프로덕션 환경에서 수백만 사용자를 위한 서비스를 향해 가는 과정을 알려드림으로서 머신 러닝 엔지니어가 될 수 있는 방법을 알아봅니다.


환경구성 (윤석찬 수석테크에반젤리스트, AWS)

EC2 GPU Instances

EC2 Spot 인스턴스 구매 옵션


컨테이너 기반의 기계학습 운영 사례 (문효준 책임 연구원, LG전자)

컨테이너 선택

효과적인 운영

In Closing



기계학습 싸고 빠르게 하는 방법: SageMaker

기계 학습을 기반한 서비스를 개발하기 위해서는, 데이터 준비, 모델 훈련과 배포의 다양한 과정을 반복적으로 진행해야 합니다. AWS에서는 각 과정별로 사용자가 각자 워크로드에 맞춘 가장 비용 효율적인 ML 프레임워크인 Amazon SageMaker 관리형 서비스를 제공하고 있습니다. 본 세션에서는 SageMaker를 활용하는 방법과 함께 어떻게 하면 모델 생성, 학습 및 배포를 위한 자원을 가장 효율적이고 경제적으로 사용할 수 있는 방법을 소개합니다.


Amazon SageMaker 가격 모델

Amazon SageMaker On-Demand ML Instances


머신러닝 가격 최적화 기법

모든 머신러닝 프로젝트는 대량의 데이터의 정제와 레이블링이 필요함. 그 과정에서 EC2 기반이나 EMR에 자체 ETL 툴을 활용하여 고려하면 비용을 절감할 수 있음: Amazon Athena, AWS Glue, AWS Lake Formation

SageMaker Ground Truth

Amazon Eleastic Inference

딥러닝 추론 비용의 75%까지 절감

Neo


AWS Billing and Cost Management

AWS Budgets

AWS SageMaker 프리티어



AWS 기반 기계 학습 자동화 및 최적화를 위한 실전 기법

기계 학습 모델을 서비스로 제공하려면, 지속적인 학습 및 배포 과정이 필요합니다. 모델 훈련시 최적화 과정, 배포된 모델이 추론을 통해 서비스 되기 위한 성능 개선도 필수 요소입니다. 본 세션에서는 AWS를 활용한 대규모 리소스를 이용한 효율적인 모델 학습 시 유용한 내용들을 소개합니다. 대규모 리소스를 이용할 경우 인프라 선택, 모델 학습 환경 선택 및 구성, 확장성 등이 함께 고려되어야 합니다. 이와 관련한 AWS 서비스들의 특징과 어떤 결과를 보여주는지도 함께 알아봅니다.


P3 instance

P3dn.24xlarge instnace

AWS FSx for Lustre

Horovod



마치며

내가 들은 세션은 전반적으로 aws 서비스 홍보로 시작해서 홍보로 끝나는 느낌뿐이어서.. 살짝 아쉬웠다. 우수사례 경험 공유가 중간중간 있긴 했지만, 그 외 세션들은 결국 홈페이지에 나와있는 내용을 좀 더 자세히 설명한 수준뿐이었기 때문에.. (실습 세션을 갈걸..!) 😢

그래도 매년 이렇게 좋은 행사 열어주는 Amazon에게 무궁한 감사를.. 🙇‍♀️ 끊임없이 제공되던 무한 맥주 최고 🧡