µ ' %p i t f ¼ × µ q q i ² i t f ¼ b i t i n t e g r a tio...

29
2013/9/25 1 Krill: エッジ・ヘビー・データ時代のアーキテクチャ 丸山 宏 (情報・システム研究機構 統計数理研究所) 岡野原大輔・比戸将平・海野裕也・久保田展行(プリファー ドインフラストラクチャー) [email protected] Twitter: @maruyama 9/19/2013 1 Hiroshi Maruyama 経済産業省「IT融合政策」 9/19/2013 Hiroshi Maruyama 2 IT融合(IT Integration)による新産業創出 狭義のIT産業だけでなく、製造業、サービス業、農業等の多様な産業 において、IT・データの活⽤⽤を 点に業界構造が変化 IT・データを媒介に異異分 が融合する 『IT融合(IT Integration)』 は、新たな産業として『IT融合新産業』を創出 10 医療療・ ルスケア IT 分野での新技術の開発 製造業(⾃⾃動 ⾞⾞、ロボット等)、 サービス業(医療療・ ルスケア) 農業 等 ITと既存産業の融合 による新ビジネス エネルギー IT・データを媒介とした ⾃⾃動 ⾞⾞、 交通システム 新技術を活⽤⽤し IT分野での新ビジネスの創出 既存産業のIT IT (例例) マートメーター導⼊⼊によ DR(※)サービスの導⼊⼊ 働状況の遠隔把握を通じた早期アフターケアの導⼊⼊ ⽌機能を搭 した運転補助機能付き⾃⾃動⾞⾞⾞の ⼊⼊ ※DR: デマンド・レスポンス (例例) ネルギーシステムと交通システムの連携による EV 管理理・ 滞解消ソリューション (例例) 索索サー スの登場 、ソーシャルメディアの登場 農業 × ITを媒介とした融合

Upload: others

Post on 07-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

1

Krill: エッジ・ヘビー・データ時代のアーキテクチャ

丸山 宏 (情報・システム研究機構 統計数理研究所)

岡野原大輔・比戸将平・海野裕也・久保田展行(プリファードインフラストラクチャー)

[email protected]

Twitter: @maruyama

9/19/2013 1 Hiroshi Maruyama

経済産業省「IT融合政策」

9/19/2013 Hiroshi Maruyama 2

IT融合(IT  Integration)による新産業創出

○ 狭義のIT産業だけでなく、製造業、サービス業、農業等の多様な産業において、IT・データの活⽤⽤を

起点に業界構造が変化

○ IT・データを媒介に異異分

が融合する 『IT融合(IT  Integration)』は、新たな産業として『IT融合新産業』を創出

10

医療療・

ルスケア

IT分野での新技術の開発

製造業(⾃⾃動

⾞⾞、ロボット等)、

サービス業(医療療・ヘ ルスケア) 、

農業    等

ITと既存産業の融合による新ビジネス

エネルギー IT・データを媒介とした

⾃⾃動

⾞⾞、交通システム

① 新技術を活⽤⽤し

IT分野での新ビジネスの創出

② 既存産業のIT

IT

(例例)

マートメーター導⼊⼊によ

DR(※)サービスの導⼊⼊  

 

 建

機の

稼働状況の遠隔把握を通じた早期アフターケアの導⼊⼊    

 

 

 

 

 

衝突

⽌機能を搭載

した運転補助機能付き⾃⾃動⾞⾞⾞の導

⼊⼊  

 

 

 

※DR:  デマンド・レスポンス

(例例)

ネルギーシステムと交通システムの連携による EV管理理・

滞解消ソリューション

(例例)

索索サー

スの登場 、ソーシャルメディアの登場

農業

×

 ITを媒介とした融合

Page 2: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

2

??

新しいアーキテクチャは何か?

S/360 Mainframe

Special purpose machines

PC / Client-server

Three tier

Cloud / Smart phone

?? ??

9/19/2013 3 Hiroshi Maruyama

CACM, 2008

9/19/2013 Hiroshi Maruyama 4

Page 3: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

3

CNET ブログ

9/19/2013 Hiroshi Maruyama 5

計算機アーキテクチャ華やかりし頃

9/19/2013 Hiroshi Maruyama 6

Page 4: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

4

Connection Machine CM-1 (1985)

9/19/2013 Hiroshi Maruyama 7

http://www.mission-base.com/tamiko/cm/index.html

SIMD (Single Instruction, Multiple Data) - 65,536個のプロセッサ

- 同じ命令をすべてのノードが実行

- CM-Lisp, 後に科学技術計算

SPARC (1987)

9/19/2013 Hiroshi Maruyama 8

RISC (Reduced Instruction Set Computer - 命令を簡単に - サイクルタイムを速く

- 余ったスペースはレジスタとキャッシュに

Page 5: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

5

Transputer (1984)

9/19/2013 Hiroshi Maruyama 9

- CSPによる並列性 - Occam

Symbolics Lisp Machines (1986)

9/19/2013 Hiroshi Maruyama 10

http://www.sts.tu-harburg.de/~r.f.moeller/symbolics-info/family.html

Page 6: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

6

PIM: 並列推論マシン (1987)

9/19/2013 Hiroshi Maruyama 11

http://realwave.blog70.fc2.com/blog-entry-78.html

- 並列論理型言語KL1 - ~512ノード

冬の時代 (1990年代~)

9/19/2013 Hiroshi Maruyama 12

Page 7: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

7

9/19/2013 Hiroshi Maruyama 13

http://www.gotw.ca/publications/concurrency-ddj.htm

「待てば速くなる」時代 - Intelアーキテクチャさえあれば…

プログラミングモデルの世界では…

9/19/2013 Hiroshi Maruyama 14

Page 8: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

8

機械語

9/19/2013 Hiroshi Maruyama 15

Bubble sort in IBM 704, Helwig, H. Ed, Coding for the MIT-IBM Computer, 1957, http://bitsavers.org/pdf/mit/computer_center/Coding_for_the_MIT-IBM_704_Computer_Oct57.pdf

高級言語 40 N = N - 1 70 ISCAN = 1 IOK = 1 ISTOP = N IF(ISTART - ISTOP) 50, 110, 110 50 IF(NUMS(ISCAN) - NUMS(ISCAN+1)) 90,90,60 60 J = NUMS(ISCAN) NUMS(ISCAN) = NUMS(ISCAN+1) NUMS(ISCAN+1) = J IOK = 0 90 IF(ISCAN - (ISTOP - 1)) 80,100,100 80 ISCAN = ISCAN + 1 GOTO 50 100 IF(IOK) 105,105,110 105 ISTOP = ISTOP - 1 GOTO 70

9/19/2013 Hiroshi Maruyama 16

http://sandbox.mc.edu/~bennet/cs404/doc/sort_f.html

アーキテクチャの 詳細を隠蔽

Page 9: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

9

9/19/2013 Hiroshi Maruyama 17

Framework

http://basalgangster.macgui.com/RetroMacComputing/The_Long_View/Entries/2011/4/27_MacApp_-_part_1.html

MacApp, MFC, …

-プログラミングモデル=ライブラリ

-アプリケーション基本構造のパターン化

クライアント・サーバー

9/19/2013 Hiroshi Maruyama 18

安価なWindows PC リッチなGUI

細い回線

高価なUnixサーバー

Page 10: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

10

3-Tier

9/19/2013 Hiroshi Maruyama 19

共通のGUIプラットフォーム (プラウザ)

多数のアプリ、 比較的安価なIntelサーバー

スマホ・クラウド

9/19/2013 Hiroshi Maruyama 20

高性能・多センサーの スマートホン

時間貸しのデータセンター

Page 11: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

11

9/19/2013 Hiroshi Maruyama 21

Key-Value Store

OpenMPI

データと計算をどのノードに配置するか?

9/19/2013 Hiroshi Maruyama 22

So, What’s Next?

Page 12: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

12

9/19/2013 Hiroshi Maruyama 23

そもそも、アーキテクチャはなぜ変わるのか

9/19/2013 Hiroshi Maruyama 24

http://en.wikipedia.org/wiki/IBM_705#1400_series_architecture_.287010.29

IBM 702 -商用計算用 -可変長文字列表現

IBM 705 -科学技術計算用 -固定バイナリ

Page 13: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

13

9/19/2013 Hiroshi Maruyama 25

-2008年に首位 -ロスアラモス国立研究所 -Dual-core Opteron + Cell Broadband Engine -Total 103,680 SPE Cores

Roadrunner BlueGene/L

-2005年に首位 -ローレンスリバモア国立研究所 -Dual-core PowerPC 440 -131,072プロセッサ

Cyber-Physical Systemsに おける新しいワークロード

9/19/2013 26 Hiroshi Maruyama

Page 14: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

14

Edison: デンマークにおけるスマートグリッドプロジェクト

電気自動車を蓄電装置として用いる

9/19/2013 27 Hiroshi Maruyama http://www.edison-net.dk/

28

ストックホルムの道路課金プロジェクト

Key success factors Congestion charges will fund transit improvements

$120M/yr in revenue to City of Stockholm; payback in 4 years

15% reduction in CO 2 emissions

25% reduction in traffic entering cordon

Clearly Measurable Results

通行料制度の導入によるさらなる渋滞緩和

ストックホルム市 年間120億円の増収

CO2発生量を14% 削減

交通流入量を25% 低減

実施結果と 効果

Source: www.stockholmsforsoket.se 9/19/2013 Hiroshi Maruyama

Page 15: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

15

29

Free flow and multi lane road side equipment

CAMERA ANTENNA

SOLUTION DESIGN

LASER

9/19/2013 Hiroshi Maruyama

Conjecture: “Edge-Heavy Data”

9/19/2013 30 Hiroshi Maruyama

Page 16: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

16

データ独立(Codd, 1970)

9/19/2013 Hiroshi Maruyama 31

データ App1

App2

App3

App n

データこそが価値!

9/19/2013 Hiroshi Maruyama 32

they are generating a tremendous amount of digital “exhaust data,” i.e., data that are created as a by-product of other activities.

http://www.mckinsey.com/insights/mgi/research/technology_and_innovation/big_data_the_next_frontier_for_innovation

Page 17: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

17

データ価値の多くはエッジに存在するようになる

1. センサーデータの増加によって、データの総価値はさらに増加するが、その価値密度が下がりつつある

2. 多くのデータは収集されるが利用されない。利用を見込んで投機的に事前処理することは割に合わないことがある

3. このため、多くのデータは収集された地点で管理されるようになる

9/19/2013 33 Hiroshi Maruyama

9/19/2013 Hiroshi Maruyama 34

監視カメラ市場: 750万台 (2011年) 100GB/カメラとすると、750PB

Motivating Scenario 1: Surveillance Cameras

Main Driver: Cost

Page 18: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

18

9/19/2013 Hiroshi Maruyama 35

Main Driver: Privacy

Motivating Scenario 2: Bio Sensors

http://www.cse.wustl.edu/~jain/cse574-08/ftp/medical/

9/19/2013 Hiroshi Maruyama 36

Main Driver: Latency

Motivating Scenario 3: ITS

http://www.etsi.org/technologies-clusters/technologies/intelligent-transport

Page 19: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

19

Other Possibilities: Smartphones

センサー+ストレージ 国内スマホ市場: 2,010万台(2011年) 10GB/1台とすると、200PB! (cf. 国内で蓄積されるデータ: 年間400PB)

9/19/2013 37 Hiroshi Maruyama

Edge-Heavy Data: Main Idea

• データは異なる価値を持つ

–ビット当たりのコスト

• 価値密度の低いデータは…

–価値密度を上げる→圧縮する・解像度を落とす

–低コストのストレージに入れる

–捨てる

9/19/2013 Hiroshi Maruyama 38

Page 20: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

20

Krill: An Architecture

9/19/2013 Hiroshi Maruyama 39

DVF (Data Value Field) Probabilistic Programming Model

+

How to represent (market) value of

data

How to program with data of low

quality

9/19/2013 Hiroshi Maruyama 40

データ価値場(DVF – Data Value Field)

a2 a1

Vt(2,1)

Vt(1,2)

例:2つのエージェント {a1, a2} からなる場合

エージェントa1から見たa2のデータ価値(時刻t)

Page 21: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

21

Predictive Nature of Values

9/19/2013 Hiroshi Maruyama 41

t t0

Value

Value at time t0 will be in this range with 90% certainty

DVFの表現

9/19/2013 Hiroshi Maruyama 42

a) Discrete Graph Representation b) Euclidean Metric Space

Page 22: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

22

各エージェント(“krill”)の動き

9/19/2013 Hiroshi Maruyama 43

Sensors

Storage

Processor

Network

価値の総和 Σ Vt(i,j)

Krill i

削除・圧縮・キャッシュ・配布・…

Krill j

エッジデータへのクエリ

9/19/2013 44 Hiroshi Maruyama

Page 23: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

23

エッジデータへのクエリ (2)

9/19/2013 45 Hiroshi Maruyama

エッジデータへのクエリ (3)

カメラAとカメラB

に同時に現れる人物を求めよ

マッチング操作が必要!!

9/19/2013 46 Hiroshi Maruyama

Page 24: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

24

分散マッチング・プロトコル

9/19/2013 Hiroshi Maruyama 47

サマリ情報の交換による絞込み

分散オンライン機械学習フレームワーク: Jubatus

9/19/2013 Hiroshi Maruyama 48

Page 25: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

25

Update-Mix-Analyze サイクル

9/19/2013 Hiroshi Maruyama 49

http://www.slideshare.net/pfi/jubatus-16050975

JubatusのMIX付き分類モデル

9/19/2013 Hiroshi Maruyama 50

http://www.slideshare.net/pfi/jubatus-16050975

Page 26: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

26

市場原理に基づくDVF

• DVFは将来の価値を含めた投機的な価値の場

– 価値を指定/計算することは困難

– 市場原理(市場の効率性)に任せる

• 各Stakeholderの合理的期待をDVFに反映させることによって、ネットワーク全体の効率性を高める

9/19/2013 51 Hiroshi Maruyama

シナリオ:ショッピングモールの監視カメラ

Krill1: Frontgate Camera Krill2: Backyard Cameras

Krill3: Analytics Engine

Krill4: Tenant Camera

<… >

1 day

<… >

suspicious Reduced in size but later marked as important

<… >

Shoppers’ realtime demographic info

100GB 100GB

100GB

100GB

<… >

suspicious

Analytics on: • Shopper demographic • Suspicious activities

• Sales prediction • Shrink management

9/19/2013 52 Hiroshi Maruyama

Page 27: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

27

データ市場の単純モデル

t0 t1

bid use

Seller: a1, a2, …, ai, …, an

Buyers: b1, b2, …, bj, …, bm

bid / use

R

Bid時 • Data A = {a1, a2, …, ai, …, an} • Bid Bj ⊂ A • SellerはBidに合わせて、Aの中からR個を選ぶ

利用時 • Data A* ⊂ A • アクセス Bj* • 存在するデータに利用料を支払う

Buyerの最適戦略: Bj=Bj* Sellerの最適戦略: Σ |Bj ∩ A*| を最大化するA*

市場の効率性! 9/19/2013 53 Hiroshi Maruyama

Seller

Buyer

Seller

Buyer

time t0 time t1

< …, at0-1, at0> < …, at0-1, at0

, …, at1 >

Bid B=<v,ω(t)> a’t0

Reduction u(at0, t1)

Use/pay u(at0

, t1) * v*ω(t)

データ市場の拡張モデル

• Bid B =<v,ω(t)> • v: ベース価値 • ω(t): 時間割引関数

9/19/2013 Hiroshi Maruyama 54

Page 28: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

28

Probabilistic Programming Model What does it mean by “X = 3”?

• X = 3

• X = 3.00 ± 0.01

• X = NaN

• X = N(3, 1)

9/19/2013 Hiroshi Maruyama 55

μ(X) = 3

• スカラー量の場合 – 普通のプログラミングと同じ

• パラメトリックな分布の場合 X = N(m1, s1), Y=N(m2, s2), XとYは独立

• X + Y = N(m1+m2, s1+s2)

• X – Y = N(m1-m2, s1+s2)

• ノンパラメトリックな分布の場合 – 粒子フィルタによる表現

• 欠測値・外れ値の扱い X = Prior Distribution

• 独立性の仮定がない場合 変数の履歴を管理

X = N(0,1), Y = X+1 ⇒ X+Y = N(1, 2)

9/19/2013 Hiroshi Maruyama 56

Page 29: µ ' %P I T F ¼ × µ Q Q I ² I T F ¼ B I T I n t e g r a tio ...ia/archives/20130919-society/20130919IEICIJ... · 分散オンライン機械学習フレームワーク: Jubatus

2013/9/25

29

Challenges

• DVFの定義言語・ツール

• PPMの定義

• Krill実装

–ハードウェア特性の利用

9/19/2013 Hiroshi Maruyama 57

Questions? Comments?

一緒に新しいアーキテクチャを考えてみませんか?

9/19/2013 Hiroshi Maruyama 58