スーパーコンピューティング研究分野研究室紹介
中島 浩(学術情報メディアセンター/情報学研究科・システム科学専攻)
スーパーコンピューティングとは
スーパーコンピュータ&それを使う高性能計算の研究
スーパーコンピュータ=(中島の)パソコン(640億演算/秒)の数万~数百万倍の性能を持つ超高性能コンピュータ
世界最速=20京演算/秒 (≒PC×300万) 京大最速=6500兆演算/秒 (≒PC×10万)
プロセッサ数=1,800+1,700+64 CPUコア数 =122,400+30,600+1,152 メモリ容量 =197TB+106TB+48TB
2
研究室紹介B4 © 2020 H. Nakashima
中島研用: 119兆演算/秒(≒PC×2000)2752 CPU
計算機アーキテクチャ: 6.1 はじめに
並列プロセッサとスループット
京大スパコンの演算スループット
3
研究室紹介B4 © 2020 H. Nakashima
名称 概要 演算スループット
Camphor 2 Laurel 2FMA (fusedmultiply-add)
a×b+cをパイプライン計算する命令
×2 ×2
SIMD (single instruction multiple data)
N組のデータに対して同じ操作を施す命令
×8 ×4
スーパースカラー N個の命令の同時実行機構 ×2 ×2SMT (simultaneousmultithreading)
N個のスレッドを1個のCPUコアで実行する機構
×1(×4)
×1(×2)
マルチコア・プロセッサ N個のCPUコアで構成されたマイクロプロセッサ
×68 ×18
SMP (shared-memorymultiprocessor)
主記憶を共有するN個のプロセッサからなるコンピュータ
×1 ×2
クラスタ N個のコンピュータをネットワークで結合したシステム
×1800 ×850
総計 ×3,916,800 ×489,600各階層の並列性を最大限に活用するプログラミング
スーパーコンピューティング@中島研
多数 (~数千万個) のCPUによる並列処理を
上手くやる方法の研究
並列アルゴリズム
... n 個のCPUを使って理想的には n 倍速くする
並列/高性能実装技術
... n 個のCPUを使って本当に (e.g.) 0.9n 倍速くする
上手くやれるようにする方法の研究
並列プログラミング言語
... 面倒な並列処理を簡単に記述する言語
並列化ライブラリ
... 面倒な並列処理を(e.g.) C で簡単にプログラムする
4
研究室紹介B4 © 2020 H. Nakashima
上手くやる方法の研究
B4 © 2020 H. Nakashima
研究室紹介
イオンビーム
中和用電子放出
イオンエンジン搭載衛星
電界強度コンター図
大規模な偏微分方程式の求解
惑星近傍磁場解析
大規模行列の
圧縮表現
巨大地震
サイクル解明
計算負荷の
自動均衡
宇宙プラズマ
シミュレーション
5
100億元連立方程式を数万回解くための高速計算手法
1兆個の粒子を数万回動かすための高速計算手法
100万×100万の行列を1万分の1に圧縮する計算手法
上手くやる方法の研究
B4 © 2020 H. Nakashima
研究室紹介
イオンビーム
中和用電子放出
イオンエンジン搭載衛星
電界強度コンター図
大規模な偏微分方程式の求解
惑星近傍磁場解析
大規模行列の
圧縮表現
巨大地震
サイクル解明
計算負荷の
自動均衡
宇宙プラズマ
シミュレーション
6
10億元連立方程式を数万回解くための高速計算手法1個の未知数の近似解更新 ... FMA+スーパースカラ8個の未知数の近似解更新 ... SIMD1003個の未知数の近似解更新 ... マルチコア+SMP1000個の未知数集合の近似解更新 ... クラスタ
上手くやる方法の研究
B4 © 2020 H. Nakashima
研究室紹介
イオンビーム
中和用電子放出
イオンエンジン搭載衛星
電界強度コンター図
大規模な偏微分方程式の求解
惑星近傍磁場解析
大規模行列の
圧縮表現
巨大地震
サイクル解明
計算負荷の
自動均衡
宇宙プラズマ
シミュレーション
7
1兆個の粒子を数万回動かすための高速計算手法1個の粒子移動 ... FMA+スーパースカラ8個の粒子移動 ... SIMD1003個の小領域中の粒子移動 ... マルチコア+SMP1000個の小領域集合の粒子移動計算+負荷均衡... クラスタ
上手くやる方法の研究
B4 © 2020 H. Nakashima
研究室紹介
イオンビーム
中和用電子放出
イオンエンジン搭載衛星
電界強度コンター図
大規模な偏微分方程式の求解
惑星近傍磁場解析
大規模行列の
圧縮表現
巨大地震
サイクル解明
計算負荷の
自動均衡
宇宙プラズマ
シミュレーション
8
100万×100万の行列を1万分の1に圧縮する計算手法1個の小行列要素計算 ... FMA+スーパースカラ8個の小行列要素計算 ... SIMD1000個の小行列の計算+負荷均衡 ... マルチコア+SMP1000個の小行列集合の計算+負荷均衡 ... クラスタ
上手くやれるようにする方法の研究
task prob {...}worker int search() {for(...) { ...search(); ...}prob(...){...}}
タスク並列言語
Tascell
B4 © 2020 H. Nakashima研究室紹介
9
~10億節点の木探索を自動的に並列処理するプログラミング言語
use qw (log limit core); use limit;limit::initialize(30);prepare_submit_sync {RANGE0=> [1..3000],exe0=> "hugesim",arg0_0@=> sub {"input-$VALUE[0].txt”};}
並列スクリプト言語
Xcrypt
~1万回のプログラム実行を自動的に並列処理するスクリプト
by D2行列構造(木構造)生成木を生成しながら再帰的並列計算計算負荷の動的均衡化
上手く ... の研究 by M1/2&B4 in 2019
10
研究室紹介B4 © 2020 H. Nakashima
省電力並列計算 1800個のプロセッサ性能計算:均一/電力:不均一 (±10%)
実行するプログラムによって不均一の程度が異なる
プログラムの電力消費傾向を予測し適切なプロセッサ群を割当 全体の消費電力削減
task prob {...}worker int search() {for(...) { ...search(); ...}prob(...){...}}
Tascell
イオンビーム
中和用電子放出
イオンエンジン搭載衛星
電界強度コンター図
宇宙プラズマ
単位小領域中の粒子=0~1000個かつ変動SIMD演算による粒子移動計算 ... ○配列 ×リスト単位小領域間の粒子移動 ........... ×配列 ○リスト
粒子集合を小規模配列を要素とするリストで表現
多数のクラスタノードを使う並列計算でのノード間通信の高速化
M2: 通信のマルチスレッド化M1: 通信と計算のオーバーラップによる遅延隠蔽
B4: 並列計算に関する記法の簡略化
by M1
by M1
メンバー
中島 浩 (教授), 深沢 圭一郎 (准教授), 平石 拓 (助教) D3 D2 M2 M1
場所: 総合研究5号館4F (本部構内北門東側) web: http://ais.sys.i.kyoto-u.ac.jp イベント
コンパは最近 Halal 料理が中心
何故か毎年2~3月に若狭にフグを食べに行く1泊旅行
近年の就職先
NTTデータ, 富士通研究所, JFEスチール, JR東海, Cisco, IHI, Yahoo, ...
Who, Where, ...
11
研究室紹介B4 © 2020 H. Nakashima