2022.09.09
#クリエイターズインタビュー No.67カヤック×クラシコム流 事業成長に寄り添うデータ分析基盤のつくり方
2019年から始まった面白法人カヤックと『北欧、暮らしの道具店』を運営する株式会社クラシコムとの協業プロジェクト。持ち前のエンジニアリングリソースやエンジニア採用ノウハウを活用し、伴走型支援を続けてきました。
今回の記事では、データ分析基盤をゼロから構築した軌跡に焦点を当て、クラシコムとの相性を考慮したツール選定の背景や、データエンジニアリングの面白さを担当者に語ってもらいました。
◆顕在化された、データ分析の環境的な限界
ー最初に、本プロジェクトのきっかけについて伺いたいと思います。もともと、クラシコムさんでは、データ分析はどのような環境で行っていたのですか。
高尾
私が入社した2019年2月当時、クラシコムにはデータ分析チームという存在が特にありませんでした。社内システムのデータが分析しやすい形でMySQLに転送されるという環境はあったので、スプレッドシートに集約して、データを分析していました。ECサイトならもっと見た方が役立つデータもあったと思うのですが、それ以上のことはできなくて......。
そんな時、インターンで来ていたカヤックの社員さんが、環境的に限界が来ていた状況を悟って、手を差し伸べてくれたことが協業のきっかけでした。
さらに、2019年11月に『北欧、暮らしの道具店』のiOSアプリをリリースするに当たり、WEBだけではなくiOSのデータも集約しないといけない状況になって、ちゃんと力を入れてデータ分析基盤を整えていく流れになりました。
ー協業はカヤック側から提案があったのですね。期待していたことは何でしたか。
高尾
期待、というよりも前の段階ですね。現状を適切に把握できていなくて、目指すゴールもよく分からない感じでした。データ周りのインフラが整っていない状況で、まず何を解決すべきか、というところから相談に乗ってもらいました。
「喉が乾いているような気がするけれど、どうしたら水が飲めるのか」と困っている時に、「水道をつくればいい」と具体案を出して、実際に整備してくれたのがカヤックさん、というイメージです。
ーどのような形で取り組みが始まったのですか。
高尾
カヤックさんとの協業は、今お話ししているデータ分析プロジェクトの他、クラシコムのエンジニアをサポートしてくれるカヤックさんのSREチームの技術支援と、エンジニア採用のための人事的支援の3つのプロジェクトに分かれています。
データ分析の基盤構築に関しては、2020年の1月にカヤックからデータエンジニアの池田さんがジョインし、本格的にプロジェクトがスタートしました。
◆会社の特性に合った先進的ツールの採用
ー基盤構築のプロジェクトはどのように進められたのですか。
池田
私がプロジェクトに参加した時、クラシコムさんは、iOSアプリのデータ分析の為にすでにGoogle Cloud Platform (GCP) のBigQueryを使い始めていました。プロダクトはAWSの環境にあり、データウェアハウスに引き続きBigQueryを使うかAmazon Web Service(AWS)のRedshiftを追加採用するか少し悩んだのですが、今後、アプリがデータのメインになるだろうと考え、コアなデータを持っているAWSのデータをBigQueryに搬送する仕組みをつくりました。
どんなにデータを分析しても、それが意思決定の役に立たなかったら何の意味も無いので、「意思決定に反映できるデータ基盤にする為にはどうしたらいいのか」ということを意識していました。
ーBigQueryとLookerを組み合わせたそうですが、それぞれのサービスの選定理由も教えてください。
池田
当時はまだチームに入っていなかったので推測になりますが、最初にBigQueryを選択した理由は、Firebaseをアプリケーション開発に使っていたからだと思います。Firebaseはスマートフォンアプリケーションのクラッシュやアクセス情報を提供して、BigQueryにデータを出力する機能を持っているので、これはごく自然な選択です。
Lookerはクラシコムさんが使っていたRedashと使用感が似ているセルフBIサービスみたいなもので、データビジュアライゼーションのツールです。最初、高尾さんが検討していたんですよね。
高尾
はい、Lookerのイベントに行きました。当時はまだ日本で20社くらいしか導入していなかった頃で、データガバナンスが実現できる良さそうなツールだな、という印象でした。
池田
Lookerは当時の欧米のデータ基盤界隈で「これは本当に良いツールだぞ」という評判があり、私自身とても興味がありました。ツールの内容もクラシコムさんの特性にマッチしていたので、おすすめした覚えがあります。
ーLookerとクラシコムさんの特性がマッチしている、というのは......?
池田
Redashをデータベースに対して使う場合、SQLに対応していればデータのビジュアライズができる点は魅力的です。しかし、Redashを使うためにはSQLを覚える必要があって、学習コストが大きいという側面があります。
一方、LookerはRedashと似たような使用感ですがSQL生成機能がついており、エンジニアがルールを記述しておけばSQLが自動的に生成されます。グラフィカルなUIをクリックするだけでデータのビジュアライズが可能になるため、非エンジニアも簡単に使えるんです。クラシコムさんは、エンジニアのリソースを確保し辛い状況だったので、すごく相性がいいなと思いました。
高尾
エンジニアリングリソースが潤沢なカヤックさんの場合は、言語取得に関しても、高いスキルセットの人が揃っていると思うんです。でも、クラシコムはエンジニアも少数ですし、商品仕入れのためにデータ分析をする人を含めて、全員がSQLを習得するのはとても大変です。だから、リソースを抑えながらデータ分析できる非常にいいツールを導入できたと思います。
ーさらに、分析基盤向けデータ統合自動化サービスのtroccoも導入されたとか。
高尾
サイト内・アプリ内のユーザーの行動や購買情報などは分析の対象にできていましたが、分析できていなかったデータがあったんです。例えば、『北欧、暮らしの道具店』のコンテンツやカスタマーサポート、在庫や予算のデータです。見たいデータソースがいっぱいある中で、エンジニアに工数を割いてもらわずに拡張していける環境をつくりたいなと思っていました。
troccoは、カヤックさんから「いいサービスがありますよ」と教えてもらったのがきっかけです。エンジニアの助けをほとんど借りることなく様々なデータをBigQueryに入れられるんですよね。
池田
troccoを使えば、スプレッドシートやブログの情報など、多様なデータソースがエンジニアリングリソース無しに取り入れられる。ブログを見ている人の購買率とか、読了率の話も出ていましたよね。データの分析に加味できる情報量が増えたので、分析の幅が広がったのではないでしょうか。
高尾
はい、意思決定を支える、幅広いデータを可視化する布石ができつつあります。
◆データエンジニアリング界の「スーパーできる人」が集結
ー本プロジェクトを振り返ってみると、どんな思いがありますか。
高尾
プロジェクトを始める際、データ分析プロジェクトにどんな人がいたらいいんだろう、という目利きの力もありませんでした。すでに信頼している協業パートナーの中からチームを組めて、私の方で要件定義をすることなくプロジェクトを進めていけたのはありがたかったです。実際に来てくれたマシオカさん(池田)が「スーパーできる人」で驚きました!
高尾
例えば、Lookerの導入時に2ヶ月ほどの教育期間があったのですが、2回目の研修ぐらいから、逆にマシオカさんが講師に教えていたりして.....。使い始めたばかりのツールなのに習得がめちゃくちゃ早いし、人にも教えられるようになっているし、「この人、とんでもないな......」と思いました。
池田
Lookerはドキュメントが丁寧なので、学習も早かったかもしれません。
私は高尾さんこそスーパーマンだなと思っています。
高尾
それは知りませんでした、笑。
池田
個人的に、データエンジニアリングでいちばん大変だと感じるのは、ステークホルダーをまとめること。数多くの関係者の調整を高尾さんが担っているのですが、人との付き合いが苦手な自分には到底できないことです。
「データの定義が変わりますよ」など、キャッチアップしてくれるのは本当に助かっています。「こういうデータが欲しい」「こういうデータが入っています」という、入力と出力が定まって、リクエストにいい感じに応えるべく工夫するのが私の得意、かつ楽しみな部分。そこに集中させてもらえるのはありがたいです。
ーお互いの得意を活かし合って取り組まれているのですね。数多くの関係者と言えば、クラシコムさんのデータ分析基盤構築には、外部のアドバイザーも加わっているのだとか。
池田
コンサルタントの風音屋さんはデータ分析基盤の本も書かれているゆずたそさんが立ち上げた会社ですし、日本のデータエンジニアリング分野のすごい方々が集まったチームです。さらに、Looker、troccoといった良いツールが集まっていて、本当に理想的な環境。通常は、理想を描いてもどこかしら妥協するものですが、その妥協がほぼないという環境です。
高尾
Lookerも日本に入ってきたばかりで、troccoもサービス提供を開始したタイミングで、いち早く導入できました。歴史的経緯が無いぶんゼロベースで、的確なアドバイスをもらいながら、その時にいちばん良いツールを選んでこれたのが良かった。
ー知見の豊かなメンバーと先進的なツール。恵まれた環境ですが、課題はありますか。
池田
すごい環境の中で、スーパーできる人たちの期待に応えるのは簡単ではないです。
例えば、データアナリストが出してくる分析はとても高度なので、それをLookerにどう落とし込むかは毎度悩みます。データマネジメントコンサルタントもなかなか高度なことをおっしゃるので、エンジニアの技量が問われますし、プレッシャーもあります。自分も精進せねば、と思いますね。
◆カヤック×クラシコム流データ分析プロジェクトのこれから
ーデータ分析プロジェクトの今後について教えてください。
池田
例えば、ML(マシンラーニング)を入れたら、どんな風に面白くなるのか考えてみたいですね。As-Is分析にMLをはめるのもいいかもしれない。
現状からAs-Isでたどっていくと、どうしても人間は甘いというか期待に満ちたゴールを考えてしまう。でも、MLだと無情にして非情な現実を突きつけてくるので、理想とのギャップが取りやすいんです。
高尾
なるほど。「MLが予測するとこうなっていますが......」と毎日突きつけられる。
池田
MLの厳しい予測を打破するためにはどこを直せばいいのかと考えると、色々見えてくるものがあるんじゃないですかね。クラシコムさんは、「いや、ここを改善すればもっといい理想を定められるんです」と言える会社だと思うので。
データエンジニアリングはナマモノ、どんどん成長していくものなので追いついていきたい。チャレンジしてみたいことはたくさんあるし、私自身がすごく成長できる環境なのですが、最終的には手離れしないといけないとも思っています。私がいなくても困らない状況に持っていくことも、ゴールのひとつです。
高尾
マシオカさんからの卒業をまだ描けていないですね。現在のデータ分析チームは、ほぼ社外の業務委託メンバーなんです。今後、クラシコムがどのような体制づくりをしていくのかも、解像度高く考えていこうと思っています。
▲ビジネスプラットフォーム部を率いる高尾さん。クラシコムさんでは一緒に働くエンジニアを募集中!
ーところで、データエンジニアリングの魅力や面白さはどんなところにあると思いますか。
池田
そうですね、ピタゴラスイッチというか、パズルというか......。あ、流しそうめん!
高尾
今あげた例が全然つながらないのですが......笑。
池田
データを搬送して、一箇所にまとめて、それを色々な人に届ける。つまり、「流しそうめん的な魅力」。竹のそうめん台のコースをつくって、水を流して、出来上がったら他の人が楽しんでいるのを見て、「ああ、いいな」と思う感覚です。自動化の仕組みをつくってそれを眺める楽しさというか。で、その仕組みに他の人が集まってワイワイしているのがいいんですよ。そう思える人は、データエンジニアリングに魅力を感じると思います。
どれだけ新鮮なそうめんを届けられるのか。どれだけ安定して届けられるのか。途中で竹が崩れてそうめんを台無しにしないような安定性や信頼性は、SREにも通じるかもしれませんね。そうめんをどう届けるかというところに工夫の違いがあって、その工夫がエンジニアとしての技量。そこを高めていくのが自分の中の楽しみです。
それから、データエンジニアリングの観点から言うと、クラシコムさんのデータは触っていてすごく面白いです。
ークラシコムさんのデータが面白いとは、どのような点でしょうか。
池田
クラシコムさんは、ブログ、ラジオ、動画なども制作しています。オーソドックスなECの分析をベースにしつつも、マルチメディアとの組み合わせがあって、基礎プラス応用が楽しめるのもこの仕事の面白さです。
最近は「ビッグデータ」という言葉が廃れてきて、「スモール&ワイドデータ」という言葉が流行っているのですが、クラシコムさんのデータはまさにこの領域です。コアなECのデータ、マルチメディアをはじめ、ユーザーとの対談やアンケートなど、本当に幅広いデータが紐づいている。
ー2021年の「お客さまアンケート」では2500件近い回答が集まったそうですね。私の周囲を見ていても、『北欧、暮らしの道具店』のユーザーさんは熱量も高くて活発なイメージです。
高尾
ありがたいことです。その熱心さが何によって生み出されているのかを紐解いていけるのが面白いです。マーケティングにもさらに力を入れていきたいと思っています。
ークラシコムさんはコンテンツも多様ですし、チャレンジの幅も広がりますね。運用コストを抑え、データ分析自体に集中できる基盤が整った実感はありますか。
高尾
もう全然違いますね。なんというか、今までは漠然と「健康な気はするけれど、実際の体重は何キロだろう......」と思っていたのが、体重計を手に入れて、安心して健康管理に励めるようになった感じです。
クラシコムが2022年8月に上場した際も、インフラ整備の重要さを実感しました。審査では過去のデータが必要なのですが、一、二週間で100近い質問に答えなくてはならず、いちいちSQLを書いていられない状況でした。Lookerでポチポチするだけでデータが見られるようになっていなかったら、ずっと大変な作業になっていたと思います、笑。環境を整えておいて良かったと心から思っています。
(取材・文 二木薫)