awsの機械学習サービスとamazon sagemaker の基礎 · polly transcribetranslate comprehend...

100
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Solutions Architect, Amazon Web Services Japan. 2019.9.19 AWSの機械学習サービス概要と Amazon SageMaker AWS Japan SageMaker 事例祭り#8 2019.09.19

Upload: others

Post on 22-Jul-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Solutions Architect, Amazon Web Services Japan.

2019.9.19

AWSの機械学習サービス概要とAmazon SageMaker

AWS Japan SageMaker 事例祭り#8 2019.09.19

Page 2: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

アジェンダ

• 機械学習に対するAWSのミッション

• AWSの機械学習サービス

• Amazon SageMaker概要

Page 3: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS のミッション

Amazon における機械学習の経験をすべての開発者に届けること

Page 4: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

10,000 以上のお客様が機械学習に AWS を利⽤

Page 5: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS が選ばれる理由

成熟したサービスを幅広く提供

機械学習の困難な課題を解決

75%の分類・予測コスト削減、70%のデータ準備コスト削減

主要なフレームワークをサポート

機械学習に最適化された環境

2018年1⽉から200以上の機能・サービスがリリース

TensorFlow のプロジェクトのうち85%がAWSで稼働

DAWN のベンチマークでは、優れた結果を⽰している

Page 6: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWSの機械学習サービス

Page 7: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWSの機械学習サービススタック

フレームワーク インターフェース コンピュート基盤

AI Services

画像 ⾳声 ⾃然⾔語 チャットボット 予測 リコメンド

ML Services

ML Frameworks + Infrastructure

P O L L Y T R A N S C R I B E T R A N S L A T E C O M P R E H E N D L E X F O R E C A S TR E K O G N I T I O N

I M A G ER E K O G N I T I O N

V I D E O T E X T R A C T P E R S O N A L I Z E

Ground Truth Notebooks Algorithms + Marketplace Reinforcement Learning Training Optimization Deployment HostingAmazon SageMaker

F P G A SE C 2 P 3& P 3 D N

E C 2 G 4 E C 2 C 5 I N F E R E N T I AG R E E N G R A S S E L A S T I CI N F E R E N C E

Page 8: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS の機械学習サービススタック

機械学習の深いスキルなしに、機械学習をアプリケーションに組み込める

機械学習のモデルを高速に開発・学習・デプロイできる

高性能なインフラストラクチャを自由に選ぶことができる

AI: Artificial Intelligence (人工知能), ML: Machine Learning (機械学習)

AI サービス

ML サービス

ML フレームワーク &

インフラストラクチャ

Page 9: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AI サービス

• データを用意するだけ

Page 10: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AI サービスの範囲

10種類の AI サービス静止画・動画認識 音声処理 テキスト処理

チャットボット 時系列データ予測 レコメンデーション

Page 11: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AI サービスの範囲

10種類の AI サービス静止画・動画認識 音声処理 テキスト処理

チャットボット 時系列データ予測 レコメンデーション

New

New New

Page 12: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

静⽌画・動画認識

Amazon Rekognition& Amazon Rekognition Video Amazon Textract

Name: Taro Tanaka

2019.05.29 GA

Page 13: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

⾳声処理

Amazon Transcribe Amazon Polly

Today is June 13.

Page 14: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

テキスト処理

Amazon Translate Amazon Comprehend

機械学習入門

Introduction to machine learning

Amazon.com, Inc. is located in Seattle,WAand was foundedJuly 5th, 1994.

Amazon Comprehend Medicalは医療文書に特化

Page 15: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

チャットボット

Amazon Lex

Page 16: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

時系列データ予測

Amazon Forecast

特徴

2019.08.23 GA

Page 17: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

レコメンデーション

Amazon Personalize

特徴エンドユーザの操作を逐次反映 機械学習の自動

化SageMakerからのアルゴリズム持ち込み

学習継続による性能改善

2019.06.10 GA

Page 18: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS の機械学習サービススタック

機械学習の深いスキルなしに、機械学習をアプリケーションに組み込める

機械学習のモデルを高速に開発・学習・デプロイできる

高性能なインフラストラクチャを自由に選ぶことができる

AI: Artificial Intelligence (人工知能), ML: Machine Learning (機械学習)

AI サービス

ML サービス

ML フレームワーク &

インフラストラクチャ

Page 19: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

ML サービス: Amazon SageMaker

• ニーズにあわせて独自の機械学習サービスを実装する場合• Amazon SageMaker

Page 20: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS の機械学習サービススタック

AI サービス

ML サービス

ML フレームワーク &

インフラストラクチャ

機械学習の深いスキルなしに、機械学習をアプリケーションに組み込める

機械学習のモデルを高速に開発・学習・デプロイできる

高性能なインフラストラクチャを自由に選ぶことができる

AI: Artificial Intelligence (人工知能), ML: Machine Learning (機械学習)

Page 21: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

ML フレームワーク/インフラストラクチャ

エッジデバイスも含め、機械学習の環境を自由に構築できる

Page 22: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

• Amazon SageMaker で 機械学習モデルを構築• AWS DeepRacer の 3D レーシングシミュレー

ターを使ってトラック上でトレーニングとテストを繰り返す

⾃動運転を通じて強化学習について学べるように設計された、1/18 スケールの完全⾃律型レーシングカー

AWS DeepRacer

Page 23: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

世界初の開発者向け深層学習対応ビデオカメラ

• ML スキル習得向けの特別設計• プログラムやカスタマイズに完全対応• カスタム Amazon SageMaker モデルを構築• 初めての深層学習プロジェクトを 10 分で実現

AWS DeepLens

Page 24: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

ユースケース

Page 25: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Aella Credit 様

リアルタイムに本⼈確認

• ⻄アフリカの⾦融サービス会社で、融資の際の本⼈確認に、政府発⾏IDの写真との照合を⾏っている。

• 政府発⾏IDの写真をアップロードして、⾃⾝の写真を撮影すると、Rekognitionで本⼈⼀致を判定

https://aws.amazon.com/jp/blogs/news/aella-credit-empowers-underbanked-individuals-by-using-amazon-rekognition-for-identity-verification/

Page 26: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

C-SPAN様

スケーラブルな動画インデックス作成• C-SPAN は Amazon Rekognition を使⽤し

て、⾃動的に動画ニュース映像のインデックス作成を⾏い、検索できるようにした。

• C-SPAN は Rekognition を使⽤して動画 1 本あたりのインデックス作成にかかる時間を 1 時間から 20 分に短縮し、2 時間以内に 97,000 枚の画像をアップロード

Page 27: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Lionbridge 様

リアルタイム翻訳をスケーリング• Lionbridge は Amazon Translate を使

⽤して機械翻訳をスケールできたことで、コンテンツをより早く、より多くの⾔語にローカライズできるようになった。

• Translate を使⽤して、Lionbridge は翻訳にかかるコストを 20% 削減することに成功した

Page 28: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

ユーザー体験のパーソナライズ• Domino’s は Amazon Personalize を使⽤

して、関連するマーケティングコミュニケーションを、時間、コンテキスト、およびコンテンツに基づき、顧客に合わせてカスタマイズ、スケールすることで、Domino’s ブランドのユーザー体験を向上させている

Dominoʻs Pizza 様

Page 29: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWSの機械学習サービスのまとめ

Page 30: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWSの機械学習サービスのまとめ

• AWS では、成熟した機械学習サービスを幅広く提供しており、ML スタックという考え⽅で、⽤途に応じた柔軟な選択が可能

• AI サービスを利⽤することで既存のアプリケーションにMLを簡単に組み込むことができる

• さまざまなサービスで AWS の AI サービスが利⽤されている

Page 31: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWSの機械学習サービススタック

フレームワーク インターフェース コンピュート基盤

AI Services

画像 ⾳声 ⾃然⾔語 チャットボット 予測 リコメンド

ML Services

ML Frameworks + Infrastructure

P O L L Y T R A N S C R I B E T R A N S L A T E C O M P R E H E N D L E X F O R E C A S TR E K O G N I T I O N

I M A G ER E K O G N I T I O N

V I D E O T E X T R A C T P E R S O N A L I Z E

Ground Truth Notebooks Algorithms + Marketplace Reinforcement Learning Training Optimization Deployment HostingAmazon SageMaker

F P G A SE C 2 P 3& P 3 D N

E C 2 G 4 E C 2 C 5 I N F E R E N T I AG R E E N G R A S S E L A S T I CI N F E R E N C E

Page 32: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

アジェンダ

• 機械学習の課題に対するSageMakerのメリット

• SageMakerを利⽤した機械学習プロセス

• 機械学習の開発・学習・推論を効率化する基本機能

• SageMaker のまとめ

Page 33: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

機械学習プロジェクトの基本的な流れ

• エンジニアがプロダクション環境に構築• API サーバやエッジ

デバイスにデプロイ

開発・学習

• データサイエンティストが開発と学習を同じ 1 台のマシンで実施

• Deep Learning であればGPU を使⽤

推論

Page 34: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

開発・学習

機械学習プロジェクトの典型的な課題

推論

• 環境構築が⼤変• 複数の学習ジョブを

並列で実⾏するのが⼤変• 複数マシンを使った

分散学習を実現するのが⼤変• 学習結果を管理するのが⼤変

• 推論⽤の API サーバ構築とメンテが⼤変

• エッジデバイスへのデプロイが⼤変

• バッチ推論の仕組みを構築するのが⼤変

Page 35: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon SageMaker とは

機械学習プロジェクトの課題を解決するためのマネージドサービス数分で開発環境を起動でき、学習、推論環境は柔軟にスケール多数のAPIを提供しており、他サービスとの⾃由度の⾼い連携が可能東京を含む17リージョンで提供ほとんどのコンテナ、SDKはオープンソース

ラベリング 開発 学習 モデル変換 推論

Page 36: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

開発:Amazon SageMaker Notebook Instance

Jupyter Notebook JupyterLab

SageMaker 上のワークフロー(環境・データのインポート,モデル定義,学習ジョブ,デプロイ,エンドポイント呼び出し)を SageMaker Python SDKで記述

Page 37: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

学習:分散学習や複数学習ジョブの同時実⾏

• API経由で学習⽤のインスタンスを起動可能で、学習が完了すると⾃動で停⽌する

• ⾼性能なインスタンスを⼿動で停⽌したりせずに済み、簡単にコストを抑えることができる

• 指定したインスタンス数で分散学習環境が容易に構築できる

インスタンスタイプ、起動数の指定

Page 38: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

学習:SageMaker が Managed Spot Training に対応!

https://aws.amazon.com/jp/blogs/aws/managed-spot-training-save-up-to-90-on-your-amazon-sagemaker-training-jobs/

• これまでの学習コストを最⼤で 90%削減• すべてのフレームワーク,モデル,学習構成で利⽤可能• Checkpointing により Spot instance が落ちても途中から学習を再開

NEW!

from sagemaker.tensorflow import TensorFlow

mnist_estimator = TensorFlow(entry_point='mnist.py', role=role, train_instance_count=2, train_instance_type='ml.p2.2xlarge', train_max_run = 5000, train_use_spot_instances=True, train_max_wait = 7200)

Page 39: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

推論:API エンドポイントやバッチ推論

• ⼀般に作業負荷の⼤きい推論環境の構築を、API 1つで簡単に実現

• 推論の負荷にあわせてGPUをアタッチできるElastic Inference

• バッチ推論を使えば、必要なときだけエンドポイントを利⽤可能

• エンドポイントは、オートスケール対応

• A/Bテストをサポート

オートスケールの設定やA/Bテスト⽤にリクエストの割り振りが可能

Page 40: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

開発・学習・推論は個別に利⽤可能

例 2: プロダクション環境がオンプレミスにすでにある場合スケーラブルな学習環境としてのみ SageMaker を利⽤可能

開発 学習 推論

例 3: オンプレミスに豊富な GPU クラスタを持っている場合オンプレミスで学習済のモデルを AWS 上のプロダクション環境にデプロイ

開発 学習 推論

例 1: 部署全員に対してマネージドノートブック環境を提供したい場合管理不要のノートブックをホストする環境として SageMaker を利⽤

開発 学習 推論

Page 41: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

アジェンダ

• 機械学習の課題に対するSageMakerのメリット

• SageMakerを利⽤した機械学習プロセス

• 機械学習の開発・学習・推論を効率化する基本機能

• まとめ

Page 42: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon SageMaker で機械学習を⾏うために必要なもの

学習データ 機械学習のコード 実⾏環境

Page 43: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

学習データの準備• 学習データはオブジェクトストレージの Amazon S3におく• 学習⽤のコードで読める形式であれば、学習データの形式は⾃由• コンソールからでも、

API 経由でもアップロード可能

Page 44: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

SageMakerに合わせた学習・推論コードの書き⽅

Chainer の場合,基本的には main 関数の中に学習処理をベタ書きすれば OKハイパーパラメータや⼊⼒データのパス等は,SageMaker 側で引数として引き渡し,argparse で取り出す

推論エンドポイントにおけるモデルのロード処理を,model_fn() 内に記述しておく.あとは SageMaker で提供される推論コンテナが,そのモデルを使ってくれる

①環境変数の渡し⽅

②データの⼊出⼒

Page 45: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

実⾏環境 はコンテナイメージで提供• 実⾏環境をコンテナイメージとして

Amazon ECR (Elastic Container Registry) におく• ユーザは、⾃⾝が利⽤したい環境(Tensorflow など)を

コンテナイメージから選んで利⽤

コンテナイメージ

ユーザ

Amazon SageMaker Amazon ECR

Page 46: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon SageMaker のアーキテクチャ

ノートブックインスタンス

学習⽤インスタンス

推論⽤インスタンス

クライアント

SageMaker Service

Amazon S3

Amazon ECR

AWS CloudOffice Network

Page 47: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon SageMaker での開発フロー(コード開発)

学習⽤インスタンス

推論⽤インスタンス

Amazon S3

ノートブックインスタンス

クライアント

AWS CloudOffice Network

Amazon ECR

SageMaker Service

学習・推論⽤コード開発

Page 48: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon SageMaker での開発フロー(学習準備)

推論⽤インスタンス

Amazon S3学習⽤インスタンス

Amazon ECR

クライアント

Office Network

AWS Cloud

・学習⽤インスタンス起動・コンテナイメージのロード

SageMaker Service

ノートブックインスタンス

Page 49: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon ECR

Amazon SageMaker での開発フロー(学習)

推論⽤インスタンス

学習⽤インスタンス

Amazon S3

ノートブックインスタンス

クライアント

AWS CloudOffice Network SageMaker Service

S3のデータで学習を実⾏

Page 50: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon ECR

Amazon SageMaker での開発フロー(学習完了)

推論⽤インスタンス

学習⽤インスタンス

Amazon S3

ノートブックインスタンス

クライアント

AWS CloudOffice Network SageMaker Service

⾃動削除

モデルとコード⾃動保存

モデルとコードはジョブごとにtar.gzに丸められてS3に保存される。

Page 51: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

学習⽤インスタンス

ノートブックインスタンス

Amazon SageMaker での開発フロー(推論準備)

Amazon S3

Amazon ECR

クライアント

Office Network

AWS Cloud SageMaker Service

推論⽤インスタンス

・推論⽤インスタンス起動・コンテナイメージのロード

Page 52: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon ECR

学習⽤インスタンス

ノートブックインスタンス

Amazon SageMaker での開発フロー(推論)

クライアント

Office Network

AWS Cloud SageMaker Service

推論⽤インスタンス

モデルとコードから推論⽤エンドポイント作成

Amazon S3

Page 53: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

アジェンダ

• 機械学習の課題に対するSageMakerのメリット

• SageMakerを利⽤した機械学習プロセス

• 機械学習の開発・学習・推論を効率化する基本機能

• SageMaker のまとめ

Page 54: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

学習データ 機械学習のコード 実行環境

開発・学習・推論を効率化する基本機能

Page 55: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

開発・学習・推論を効率化する基本機能

学習データの前処理とS3からの効率的な読み込み

学習データ 機械学習のコード 実⾏環境

Page 56: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

ノートブックインスタンスでのデータ前処理

• 16TBまでディスクをアタッチすることが可能• 前処理に便利な

Pandasなどのパッケージがインストール済みで対話的に処理できる• 前処理⽤に

EMR*などの他のサービスを呼び出すことも可能

*Amazon EMR では、管理された Hadoop フレームワークが提供され、動的にスケーリング可能なAmazon EC2 インスタンスで、⼤量のデータを、簡単、⾼速、⾼コスト効率な⽅法で処理できます。

Page 57: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

S3からのファイル転送FILE モード (Default): 全ファイルをダウンロードして学習

学習 学習

PIPE モード: ダウンロードしながら⾮同期に学習を実施• ファイル転送の

オーバヘッドを軽減• TensorFlow, MXNet のみ

対応

Amazon S3

Amazon S3

Amazon SageMaker

Amazon SageMaker

Page 58: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

学習時のファイルシステムにEFSとFSx Lustreが対応

TrainingSageMaker

S3 FSx for Lustre

Data

EFS

DataData

• 学習⽤のファイルシステムとして,EFS と FSx Lustre を直接指定可能に

• 学習ジョブの開始時において,S3から学習インスタンスのEBSにデータ転送する際のオーバーヘッドが削減される

• 同⼀ファイルを⽤いた反復の学習ジョブなどの場合では,⾼速キャッシュとしてファイルシステムを利⽤できる

NEW!

https://aws.amazon.com/jp/blogs/machine-learning/speed-up-training-on-amazon-sagemaker-using-amazon-efs-or-amazon-fsx-for-lustre-file-systems/

Page 59: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

開発・学習・推論を効率化する基本機能

ビルトインアルゴリズムを使って、最⼩限のコードで機械学習を使⽤

学習データ 機械学習のコード 実⾏環境

Page 60: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

モデル名 教師データ アルゴリズム説明 利⽤⽤途の例Linear Learner あり 線形回帰 分類・回帰などの分析XGBoost あり XGBoost, 勾配ブーストツリー

(eXtreme Gradient Boosting)分類・回帰などの分析

PCA なし 主成分分析 (Principal Component Analysis)

次元削減

k-means なし K平均法 クラスタリングk-NN あり K近傍法 クラスタリングFactorization Machines あり ⾏列分解 レコメンド,回帰,分類Random Cut Forest なし robust random cut tree 時系列データの異常検知LDA (Latent Dirichlet Allocation) あり ⽣成的統計モデル トピックモデル

~ 機械学習モデル ~SageMaker ビルトインアルゴリズム

※ LDAのオリジナルは教師なし

https://docs.aws.amazon.com/sagemaker/latest/dg/algos.html

Page 61: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

モデル名 教師データ アルゴリズム 利⽤⽤途の例画像処理 Image classification あり ResNet 画像の多値分類

Object Detection あり SSD (Single Shot multiboxDetector)

物体の画像内領域をバウンディングボックスで検出

Semantic Segmentation

あり FCN, PSP, DeepLabV3 (ResNet50, ResNet101)

ピクセル単位の画像内の物体領域検出

⾃然⾔語処理

seq2seq あり Deep LSTM テキスト要約,⾳声認識

Neural Topic Model なし NTM, LDA テキストデータの構造化

Blazing text なし Word2Vec センチメント分析

あり Text Classification 単語のマイニング

Object2Vec あり Word2Vec ⼀般ベクトル化 分類,レコメンド

時系列 DeepAR Forecasting あり Autoregressive RNN 確率的な時系列予測

異常検知 IP Insights なし NN (IPとentityの関連付け) 悪意あるIPアドレスの検出

~ ディープラーニング モデル ~SageMaker ビルトインアルゴリズム

https://docs.aws.amazon.com/sagemaker/latest/dg/algos.html

Page 62: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Image Classification

ILSVRC 2015で優勝したResNet による⾼精度な画像認識AWS が学習済みのモデルを提供しており、ユーザ固有のデータに合わせて追加学習(転移学習)が可能

https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/image-classification.html

dog cat

Page 63: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

ビルトインアルゴリズムを利⽤した場合のコード

• 使いたいアルゴリズムのコンテナイメージを呼び出す• S3のデータを指定して fit() を実⾏すると学習が⾏われる• インスタンス数を増やすだけで分散学習が可能

アルゴリズムに対応したコンテナ

学習の実⾏

Page 64: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

• AWSマーケットプレイス経由で,SageMaker上で使う機械学習モデルの売買が可能

• ⼩売、メディア向けなど200 以上のアルゴリズムがすでに公開済み

アルゴリズム購⼊者:学習ジョブおよび,推論エンドポイント(バッチ推論ジョブも可)をSageMakerですぐに作成可能

アルゴリズム販売者:モデルの中⾝を秘匿してモデルの出品が可能

AWS Marketplace から機械学習のモデルを購⼊する

Page 65: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

SageMakerコンソール,SDK,AWS CLIからアクセス可能

価格:モデルパッケージの利⽤に対し,ソフトウエア使⽤料とAWS のリソース使⽤料を利⽤時間に応じて課⾦

MLマーケットプレイス 価格

学習・推論モデルはインスタンスごとに価格が設定される

• アルゴリズム学習• モデルリアルタイム推論• モデルバッチ推論

Page 66: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

開発・学習・推論を効率化する基本機能

よく使われる機械学習環境をコンテナイメージで提供

学習データ 機械学習のコード 実⾏環境

Page 67: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

様々なコンテナイメージの提供• ⼀般的に利⽤される機械学習のフレームワークは、

コンテナイメージとして提供されており、ユーザは必要なものを選んで利⽤できる

• フレームワークごとの Docker ファイルは全てgithubで公開• ユーザーは公開された Docker を⾃由にカスタムし,

⾃⾝のコンテナをECR に登録することでカスタム環境をSageMaker で利⽤できる

Page 68: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

SageMaker でサポートしているフレームワーク⼀覧

https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemakerTensorFlow: https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/tensorflowChainer: https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/chainerPyTorch: https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/pytorchMXNet: https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/mxnetSklearn: https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/sklearn

フレームワーク SageMaker containerサポートバージョン

Deep learning TensorFlow Legacy mode: 1.4.1, 1.5.0, 1.6.0, 1.7.0, 1.8.0, 1.9.0, 1.10.0Script mode: 1.11.0, 1.12.0, 1.13.0

Chainer 4.0.0, 4.1.0, 5.0.0

PyTorch 0.4.0, 1.0.0, 1.1.0

MXNet 0.12.1, 1.0.0, 1.1.0, 1.2.1, 1.3.0, 1.4.0, 1.4.1.

ML scikit-learn 0.20.0

Page 69: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

SageMaker コンテナによる学習と推論のメリット

• 分散学習を簡単に⾏うことができる• 並列実⾏可能なハイパーパラメータ最適化• コンテナが動く環境であれば⼿元のPCでも実⾏可(ローカルモード)

学習

推論

• リアルタイム推論とバッチ推論を利⽤可能• 適切なGPUをアタッチできるElastic Inferenceによる推論⾼速化• オートスケーリング, A/Bテスト可能なエンドポイントを簡単に構築

Page 70: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

SageMaker コンテナによる学習と推論のメリット

学習

推論

• リアルタイム推論とバッチ推論を利⽤可能• 適切なGPUをアタッチできるElastic Inferenceによる推論⾼速化• オートスケーリング, A/Bテスト可能なエンドポイントを簡単に構築

• 分散学習を簡単に⾏うことができる• 並列実⾏可能なハイパーパラメータ最適化• コンテナが動く環境であれば⼿元のPCでも実⾏可(ローカルモード)

Page 71: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

SageMaker SDK の基本コード ジョブを実⾏するためにまず,Estimator クラスのオブジェクトを作成Chainer の場合は,専⽤の Estimator がある.ローカルにある開発済みのスクリプトを指定

fit() を実⾏すると,指定したインスタンスが⽴ち上がり,⽤意された Chainerコンテナを読み込み,S3 データを使って学習ジョブを実⾏する

学習が終わったら,deploy() メソッドを叩くと,裏側でエンドポイントが作成される.predict() で実際に推論を実施可能

バッチ推論は transformer.transform()で実⾏.S3 から対象データを読み込んで,推論結果も S3 にファイル出⼒

Page 72: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

分散学習が簡単に実装できる

• 学習⽤APIへのリクエスト

• 学習コード内の実装 (例: TensorFlowでHorovodを利⽤)

estimator = TensorFlow(entry_point='train.py’, train_instance_type=‘ml.p3.2xlarge’, train_instance_count=2,)

opt = tf.train.AdagradOptimizer(0.01 * hvd.size()) opt = hvd.DistributedOptimizer(opt)

インスタンスタイプとインスタンス数を指定

コード⾃体は分散学習対応で書く必要がある

インスタンス間の通信などインフラ部分は実装済

Page 73: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

ハイパーパラメータ最適化• Deep Learning では、多くのパラメータを調整する必要がある

• 学習率• Dropout率• バッチサイズ, ...

• 学習ジョブの並列実⾏を活⽤し、最適なパラメータを⾼速に探索

• デフォルトはベイズ最適化

• ランダム探索も選択可能に

• HPO ウォームスタートも利⽤可能(過去に実施したHPOから開始)

NEW!

Page 74: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

ハイパーパラメータ最適化 (HPO) の書き⽅1. Chainer estimator 初期化の際に

hyperparameter を指定

2. hyperparameter_ranges に探索したいハイパーパラメータを連続値またはリストで範囲指定

3. Tunerジョブを指定,Hyperparameter_rangesや最適化の⽬的となるメトリクスを定義する

4. .fit() でベイズ最適化によるHPOジョブスタート.

https://github.com/aws/sagemaker-python-sdk#sagemaker-automatic-model-tuninghttps://aws.amazon.com/jp/blogs/news/amazon-sagemaker-automatic-model-tuning-becomes-more-efficient-with-warm-start-of-hyperparameter-tuning-jobs/

Page 75: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

ハイパーパラメータ探索の結果をコンソールで確認⽬標メトリクス値に基づいてHPO探索

Page 76: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

ローカル環境での実⾏1. Notebook Instance の上で学習・推論を⾏う

• デバッグの際,Dockerから学習・推論インスタンスを⽴ち上げる時間が勿体無い

• train_instance_type=‘local’ とする,Notebook Instance のインスタンスサイズをデバッグ⽤途に合わせる

2. オンプレミス環境でSageMakerを動かす• Docker,AWS SDK,SaceMaker Python SDK をインストール

SageMakerの学習・推論ジョブを実⾏可能• オンプレミスとのハイブリッドなSageMaker環境が作成できる• train_instance_type=‘local’ でローカルで学習を実⾏

https://aws.amazon.com/jp/blogs/news/sagemaker_from_onpremises/

Page 77: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

SageMaker コンテナによる学習と推論のメリット

学習

推論

• リアルタイム推論とバッチ推論を利用可能• 適切なGPUをアタッチできるElastic Inferenceによる推論高速化• オートスケーリング, A/Bテスト可能なエンドポイントを簡単に構築

• 分散学習を簡単に行うことができる• 並列実行可能なハイパーパラメータ最適化• コンテナが動く環境であれば手元のPCでも実行可(ローカルモード)

Page 78: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

リアルタイム推論• deploy() を呼ぶだけでエンドポイントを構築でき、

APIサーバ構築に関する作業は不要• Web APIのURLが発⾏され、URL にリクエストを送ると推論できる• エンドポイント起動中は料⾦がかかる

Page 79: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

バッチ変換ジョブ(バッチ推論)

• リアルタイム推論が必要でない場合、推論エンドポイントを維持するとコストがかかる

• バッチ推論では、推論が必要なときに、エンドポイントを作成し、推論後のエンドポイント削除を⾃動で⾏う

停⽌ EP作成

推論 停⽌ EP作

成推論 停⽌

時間

EP: エンドポイント

推論リクエスト 推論リクエスト

Page 80: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

CPU インスタンスの計算を GPU でアクセラレート• スタンドアロンのGPU は主に学習に最適化されており、推論には⼤きすぎる• 適切なGPU リソースをCPUに関連づけることで,⾼速な推論を低コストで実⾏

インスタンス EIA 推論速度 (msec) 価格 ($/hour)

c5.large なし 230 msec $0.085

c5.large eia1.medium 46 msec $0.22

p2.xlarge なし 42 msec $0.90

価格は 2018/11 時点のバージニア北部のもの

https://aws.amazon.com/jp/blogs/news/amazon-elastic-inference-gpu-powered-deep-learning-inference-acceleration/

Page 81: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

Amazon Elastic Inference

推論に適した低コストのGPU駆動のアクセラレーションを,CPU の EC2 および SageMaker インスタンスに適⽤.DL 実⾏コストを最⼤75%削減

利⽤⽅法• エンドポイントのインスタンスに EIA をアタッチして利⽤• ローカルモード推論時は SageMaker Notebook インスタンスに EIA をアタッチ

Accelerator type TFLOPSFP32 throughput

TFLOPSFP16 throughput

Memory in GB

ml.eia1.medium 1 8 1

ml.eia1.large 2 16 2

ml.eia1.xlarge 4 32 4

https://docs.aws.amazon.com/sagemaker/latest/dg/ei.html

Page 82: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

機械学習パイプライン全体の⽀援

ラベリング 開発 学習 モデル変換 推論

• 2018年のre:Inventで、開発・学習・推論に対する基本となる機能に加えて、ラベリングやモデル変換をサポート

• パイプライン全体を管理する機能も追加

Page 83: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

機械学習パイプライン全体の⽀援

ラベリング 開発 学習 モデル変換 推論

• 2018年のre:Inventで、開発・学習・推論に対する基本となる機能に加えて、ラベリングやモデル変換をサポート

• パイプライン全体を管理する機能も追加

Page 84: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon SageMaker Ground Truth

• データにラベル (Ground Truth) を付与するアノテーションを⽀援• 以下の4タスクにはテンプレートが⽤意されており、⾃作も可能• ラベルを付与するワーカーは、Amazon Mechanical Turk、

外部ベンダ、プライベートなチームの3つから選べる

Page 85: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

機械学習パイプライン全体の⽀援

ラベリング 開発 学習 モデル変換 推論

• 2018年のre:Inventで、開発・学習・推論に対する基本となる機能に加えて、ラベリングやモデル変換をサポート

• パイプライン全体を管理する機能も追加

Page 86: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Git 統合 によりレポジトリからの直接学習が可能に• SageMaker 上で Git レポジトリを登録しておくことで、ノート

ブックインスタンス起動時に clone される• Amazon SageMaker Python SDK で学習/ホスティングする際に

Git リポジトリからスクリプトを直接指定可能に

NEW!

https://aws.amazon.com/jp/blogs/news/git-integration-now-available-for-amazon-sagemaker-python-sdk/

Page 87: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

機械学習パイプライン全体の⽀援

ラベリング 開発 学習 モデル変換 推論

• 2018年のre:Inventで、開発・学習・推論に対する基本となる機能に加えて、ラベリングやモデル変換をサポート

• パイプライン全体を管理する機能も追加

Page 88: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

学習ジョブの評価の可視化• CloudWatch Metrics 経由で学習ジョブの指標を可視化することが可能• 学習ジョブ実⾏時に、ログに対する正規表現を指定して、

任意のメトリクスをログから取得(ビルトインアルゴリズムは設定済)

Page 89: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

学習ジョブの検索機能

• 学習ジョブ名や学習時に指定したタグなどで、過去に実施した学習ジョブを検索できる

• 学習時の精度を正規表現で記録していれば、コンソール上でソートが可能で、最も良い学習結果を後で探すことができる

NEW!

https://aws.amazon.com/jp/blogs/machine-learning/amazon-sagemaker-now-comes-with-new-capabilities-for-accelerating-machine-learning-experimentation/?nc1=h_ls

Page 90: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS Step Functions• JSON ベースの⾔語でステートマシンを記述できるマネージドサービス• AWS Lambda をはじめとした各サービスに対応• CloudWatch Event でスケジュール実⾏やイベントトリガーが可能

Start EndTrain DeployFetch data

AWS Lambda Amazon SageMaker AWS Lambda (Amazon SageMaker)Amazon CloudWatch Events

(Schedule / event trigger)

Page 91: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Apache Airflow 対応• Airflow 1.10.1 よりSageMaker Operator をサポート• 既存の Airflow 環境からSageMaker を呼んでパイプラインを構築可能

train_config = training_config(…)

trans_config=transform_config_from_estimator(…)

train_op = SageMakerTrainingOperator(…)

transform_op = SageMakerTransformOperator(…)

transform_op.set_upstream(train_op)

SageMaker

Page 92: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

機械学習パイプライン全体の⽀援

ラベリング 開発 学習 モデル変換 推論

• 2018年のre:Inventで、開発・学習・推論に対する基本となる機能に加えて、ラベリングやモデル変換をサポート

• パイプライン全体を管理する機能も追加

Page 93: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon SageMaker Neo

• Tensorflow や PyTorch などのモデルを、EC2 インスタンスや Greengrass デバイス上で⾼速に動作するように変換

• 従来のDeep Learning フレームワークが 500MB-1GB 程度であるのに対し、Amazon SageMaker Neo Runtime は 1MB 程度

• Apache Software License で OSS として提供予定

Page 94: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

SageMaker Python SDK による Neo 利⽤の流れ

mnist_estimator = TensorFlow(entry_point='mnist.py', role=role, framework_version='1.11.0’,

training_steps=1000, evaluation_steps=100, train_instance_count=2, train_instance_type='ml.c4.xlarge’)

mnist_estimator.fit(inputs)

optimized_estimator = mnist_estimator.compile_model(target_instance_family='ml_c5', input_shape={'data':[1, 784]},

output_path=output_path, framework='tensorflow’, framework_version='1.11.0’)

optimized_predictor = optimized_estimator.deploy(initial_instance_count = 1, instance_type = 'ml.c5.4xlarge')

Page 95: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

セキュリティ: 暗号化とコンプライアンス

• 学習と推論のジョブにおいてサーバ側の暗号化 (SSE-KMS) を利⽤可能• 以下のものをすべて暗号化可能

• 学習時の⼊出⼒データ• 学習⽤インスタンス、エンドポイントインスタンスのストレージ• バッチ推論時の⼊出⼒データ

• Cloudtrail に対応済み• PCI DSS および HIPPAに対応済み

Page 96: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

セキュリティ: 閉域網での通信• SageMaker と S3 のデータ通信はすべて S3 VPC エンドポイント経

由で⾏うことが可能• 学習ジョブの⼊出⼒における S3 アクセス• 学習済モデルをデプロイする際の S3 アクセス

• SageMaker の API はすべて PrivateLink 経由で⾏うことが可能• SageMaker Notebook Endpoint• SageMaker Service API• SageMaker Runtime API

Page 97: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

アジェンダ

• 機械学習の課題に対するSageMakerのメリット

• SageMakerを利⽤した機械学習プロセス

• 機械学習の開発・学習・推論を効率化する基本機能

• SageMaker のまとめ

Page 98: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

まとめ

• Amazon SageMaker は機械学習のマネージドサービスで、インフラ管理を気にせず、すぐに機械学習をはじめることが可能

• Amazon SageMaker はモデルの開発・学習・デプロイなどの機械学習プロセス全体にわたって便利な機能を提供しており、今後も継続的にアップデート

Page 99: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Reference

SageMaker Example Notebookshttps://github.com/awslabs/amazon-sagemaker-examples

SageMaker SDKhttps://github.com/aws/sagemaker-python-sdk(Doc はこちら: https://readthedocs.org/projects/sagemaker/)

SageMaker 公式ドキュメントhttps://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/whatis.html

Page 100: AWSの機械学習サービスとAmazon SageMaker の基礎 · POLLY TRANSCRIBETRANSLATE COMPREHEND LEX FORECAST REKOGNITION IMAGE REKOGNITION VIDEO TEXTRACT PERSONALIZE Amazon SageMaker