[AWS Summit Tokyo 2017 Day3] AWSが支えるEightのリコメンデーションエンジンの裏側

naoto

2017.6.2

名刺管理で有名な株式会社SanSanさんのアプリ、「Eight」での事例です。
とても濃い内容で、StepFunctionsの待ち受け運用とか非常に参考になりました。

ビジネス

ストリーム
* Kinesis,DynamoDB Stream
コンシューマ
* Lambda
ストレージ
* RedShift,DynamoDB,ElastuCache

KinesisはPut Recordsでリクエストをまとめる
メモリ設定でリソースを増やす
DynamoDBはなるべくBatchWriteを使う
パフォーマンスが大幅に改善された
Function数の増加問題
- Functionをシンプルにしすぎると数が増えすぎて管理できない問題
- ある意味Function内でルーティングすることでストリームの種類によって処理を分岐する
ストリーム – コンシューマ問題
- StreamとLambdaがお互いを維持できるバランスにならない
- ストリームをLambdaが書き直して差戻すFunctionを作る(分身の術)

レーティングデータの陳腐化
アルゴリズムが変わり中間データの価値がなくなる
RedShiftにある過去ログから全て中間データを作り直した! => Data Pipelineを利用して数時間で再生成!
リコメンドのマイグレーション
- まずLambdaを停止
- 再生成してから再起動
- まるで心臓バイパス手術
- ダウンタイムなしでやるにはワークフロー大事
そこでちょうどリリースされたAWS Step Function
- Lambdaの処理完了
- DataPipilineの処理まち
- タイムアウトはStepFunctionの定間隔リトライが使える!!!!!!!!

* スケーラブル
* 柔軟性
* 気軽さ