#linedevday Gravty “A scalable graph database to traverse large-scale relationship fast” の参加レポ＠LINE DEVELOPER DAY 2016

公開日：2016/09/30

LINE DEVELOPER DAY 2016に今年も今年も参加してきたのでそのメモです。

Gravty “A scalable graph database to traverse large-scale relationship fast”

LINE+ 開発7室 Lee KyoungBok様, Kim Hoonmin様

B 4 gravty from LINE Corporation

LINE LIVE

LINE LIVE（ラインライブ）| 夢を叶えるライブ配信アプリ

https://live.line.me/r/channels/31959/broadcast/52825

いつでも、どこでも、無料でライブ配信＆視聴可能！リアルタイムにメッセージやハートを送って、人気タレントやアーティストとのコミュニケーションを楽しもう。

GravityはGraph Databaseです
Graph Databaseはストレージ,グラフの検索能力が使える
- 誰が誰の友達で誰が何を好きかなどをグラフで見れる
GraphDatabase技術を取り入れたのがGoogleやFB
- 商品のリコメンデーションの仕組みに採用されていたりする
LINEサービスがどんどん増えており、より効率よくクエリーをかける必要があるので、独自のグラフデータベースであるGravtyを開発した
- あらゆるデータが全てここに集中する
LINEのタイムラインだけを見ても膨大な情報がある
Gravtyは一言で言えばスケーラビリティで、リレーショナルデータを効率よく格納して検索できる
サービスニーズは予測できない形で変化するので、うまくコントロールする必要がある
要件としてはスケールアウトが可能なこと、開発者にとって開発しやすく、クライアントサイドにとっても使いやすいものでないといけない

Gravtyについて

GravtyはDBの枠組みのフィールドワークエリアでできていて、TinkerPopを用いたGraphDBのフレームワークを使っている
- 直接GraphDBのAPIを呼び出したりができる
Gravtyの中ではApacheのPhoneixをHBaseのセカンダリのインデックスとして使っている
ストレージレイヤーにはPhoneixリポジトリを持っている
イベントのストーリーミングに対しても使用可能
良いモデルがないとちゃんとDBにならない
- テーブルの設計はスケールアップを考えて使わないといけない

DataModelについて

Flat-Wide Table

エッジとプロパティでストレージのカラムを行う
カラムにエッジは保存される
問題としてはカラムのスキャンをしないといけない（遅い）、カラムのスプリットが出来ない

Tall-Narrow Table

GravtyではTall-Narrow Tableというのを使っている
列の方にエッジを保存する
- source vertex propertyももっている
- Hbaseはrowでsplitをおこなうため、HBaseを使う場合はよい選択
- パラレルで平行に処理するのもこちらのほうがよい
ApacheのTinkerPopのグレムリンを使っている
- シンタックスがとても直感敵

それぞれのモデルの検索方法について

Flat-Wideで必要なのはまずはrow scanを用いてブラウンを探し出し、カラムのエッジを取得する
tall-narrowは1回rowスキャンをしただけでその中に関連性の情報が入っているので、何を求めているかがすぐ見つかる
- 行を分割できる
- hotspotのrowを別々にもつこともできる
- 並列でスキャンができる
クエリの例として、友達の友達を見る際に、それぞれが1つの深さのインデックスを持つ場合に、flat-wideは8回の演算でできるが、tall-narrowだと4回で検索できる

Fine-Tuning Gravty

Graphトラバーサルクエリの例として、ブラウンの友達のTOP5を出している例では、GraphStep、FilterStep, VertexStep, FilterStep, RangeStepの5つのステップを用いて検索している
- このクエリには5つのステップがある
ブラウンの友達5人を名前の順番にピックアップする例
- incoming vert stepはGravityの名前を順番に出す
- Gravityは平行に名前をよむ。

HotSpotの回避

rowのキーがどう作られているかで、リージョンスポットに悩む可能性がある
- 作られた順番でSrcVertexIdが作られた場合リージョンが偏る場合もある
- ストレージも足りない場合もある
hotspotの問題を解決する方法として、pre spitingもしくはSalting rowを使うという方法がある
Salting rowを使ってみたらパフォーマンスの問題が起こったので、LIMITを使った。しかしSaltingテーブルがドロップしてしまうかもしれなかった
- phoneixクライアントはリージョンスキャンは全てのスキャンをしてしまう事がある
- マージソートタスクはクエリーパフォーマンスを下げてしまうので別の方法を探した
考えた方法としてSaltingテーブルとPre-Splittingの両方を使う方法を編み出した
Custom Salting + Pre-splittingの方法は、row key prefixを最初につかい、近い同期をまとめて確保することができるようになり、パフォーマンスが3倍よくなった
グラフの検索が早くなったが、Secondary Indexが必要
- Hbaseはインデックスをサポートしていないのであたらしいものを使うことにした
PhoneixのIndexCommiterは同期に作業して、障害回復をするツールを開発した
GavtyのIndexCommitterフローについて
- Kafkaを使ってIndexerのコントロールを行うことにしたら、phoneixは非同期でインデックスを見ることができるようになり、rpcトラフィックのボリュームを下げることができるようになった
Kafkaを実装した後、TPSが3倍になり、接続数が1/8になった、10ms以内でレスポンスができるようになった