Распределенные системы хранения данных, особенности...

17
Elliptics Network Evgeniy Polyakov <[email protected] > <[email protected]> Distributed hash table Key/value storage

Upload: yaevents

Post on 16-Dec-2014

9.919 views

Category:

Documents


0 download

DESCRIPTION

В этом докладе будет описана система хранения данных Elliptics network, основной задачей которой является предоставление пользователям доступа к данным, расположенным на физически распределенных серверах с плоской адресной моделью в децентрализованном окружении. Распределенная система хранения данных, предоставляющая доступ к объекту по ключу (key/value storage), и в частности распределенная хэш-таблица (distributed hash table), является весьма эффективным решением с незначительным набором ограничений. Для подтверждения работоспособности данной идеи и функционала в докладе будет представлена практическая реализация распределенной хэш-таблицы с модульной системой хранения данных и различными системами доступа: от POSIX файловой системы до доступа по протоколу HTTP. Также мы обсудим ограничения, накладываемые технологией распределенной хэш таблицы, и сравним особенности высоконагруженного и высоконадежного доступа в ненадежной среде с классическими моделями, использующими централизованные системы. Опираясь на полученные практические результаты и гибкость реализованной системы, будут предложены способы решения поставленных задач и расширения функционала.

TRANSCRIPT

Page 1: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Elliptics Network

Evgeniy Polyakov

<[email protected]><[email protected]>

Distributed hash table

Key/value storage

Page 2: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

How to handle huge dataset?

Can existing solutions scale?

Page 3: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Existing solutions

Page 4: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Distributed hash table

Consistent hashing

Map and routing table

Page 5: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Elliptics network architecture

Frontend

Core

Backend

Page 6: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Frontends

Page 7: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Frontends: HTTP

Page 8: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Frontends: bindings

Page 9: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Frontends: command line

Page 10: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Frontends: POHMELFS

Page 11: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

IO backends

Page 12: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Eblob random read performance: SAS

● 2 sas shelves (14 disks raid10 each, ext4)

● 1 Tb of data

● ~ 100 millions of objects

● Eblob: 5000 rps

● Eblob: 3500 rps within 100 ms

● Eblob: 4000 rps witin 200 ms

● Filesystem: 600 rps within 200 ms

● Filesystem: 800 rps within 300 ms

FS contains about 30 millions of objects actually

Page 13: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Eblob random read performance: SATA

● 2 sata raids (4-disks raid10 each, ext4)

● 370 Gb of data

● 30 millions of objects

● Eblob: 1000 rps

● Eblob: 900 rps within 100-150 ms

● Filesystem: 200 rps within 200 ms

Page 14: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Elliptics network: core

Page 15: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

IO models

Write always succeed

Multiple copy reading

Eventual consistency

Page 16: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network

Future plans

Page 17: Распределенные системы хранения данных, особенности реализации DHT в проекте Elliptics network