GO TechTalk #26 GISや因果推論でビジネス課題を解決:GO Inc. データアナリストによる実践事例

2024年5月20日に「GO TechTalk #26 GISや因果推論でビジネス課題を解決:GO Inc. データアナリストによる実践事例」(connpass)を開催しました。

本記事では当日の内容を簡単に紹介します。

GO TechTalkとは?

GO TechTalkは、GO株式会社のエンジニアたちが、タクシーアプリ『GO』をはじめとしたサービスやプロダクトを開発する中で得た技術的ナレッジを共有するイベントです。

タクシーアプリ『GO』の事業成長を支えるために、AI技術開発部分析グループのデータアナリストはデータから「なぜそうなるか?」を分析しています。収集したデータを利用して、地理空間を扱うGISによる分析や、統計的因果推論のフレームワークを利用した効果測定、ユーザーのインサイトを深く知るための探索的データ解析や可視化、機械学習を用いた解析などを行っています。

26回目となる今回は、現実世界の位置情報に応じたサービスを提供するアプリならではの複雑なデータ生成過程を経て得られたデータに対し、GISや因果推論などの分析技術をキャッチアップしながら現場に活用する分析グループの実態を紹介しました。

こちらのポストのスレッドで当日の様子や雰囲気を感じていただけると思います。

登壇者紹介

今回はこちらのメンバーが登壇しました。

  • データアナリスト:島田 哲朗
  • データアナリスト:佐竹 功次
  • データアナリスト:秋月 達樹
  • 採用:森川 なな子

分析グループの紹介

GO株式会社でデータ分析を担当する「分析グループ」は、事業戦略の意思決定をデータ分析で主導するチームです。

「データ分析」と一言で言っても、会社ごとに求められるロールやスキルが異なると思いますが、このパートではGO株式会社のデータ分析グループの役割について簡単に紹介しました。

GISでできるビジネス分析

タクシーアプリ『GO』には地理空間情報を取り扱う「GIS(Geographic Information System:地理情報システム)」データによる分析が必要になるようなビジネス課題が多いです。例えば以下のような課題です。

  • タクシーに乗れる比率の改善。 ある場所と時間にどの程度タクシーがあれば良いか?
  • 駅周辺の引き込みスポットの設置。 駅周辺でタクシーが捕まり、アプリ利用が多い場所はどこか?
  • 屋外広告によるアプリ利用促進の効果検証。 特定の施設付近でアプリ利用があったのか判別したい

このパートでは、タクシーアプリ『GO』で扱っているGISデータについて、以下のトピックを紹介しました。

  • GISデータの表現方法
    • 行政区ポリゴン、地域メッシュ、H3(Hexagonal hierarchical geospatial indexing system)など目的に合わせた表現
    • タクシーアプリ『GO』の分析ではH3を重視
    • タクシーアプリ『GO』ではH3をBigQueryで利用
  • BigQueryを用いたGISデータ処理
  • 可視化の方法
    • タクシーアプリ『GO』ではH3が利用できるkepler.glを重視
  • 事例紹介
    • 事例1:タクシーに乗れる比率の改善
    • 事例2:駅周辺の引き込みスポットの設置

H3の概要や重視している背景、BigQueryでH3の処理を行うUDF(ユーザー定義関数)、H3と親和性の高い可視化ツールであるkepler.glについてなども紹介しているので、詳しくはぜひアーカイブ動画をご覧ください。

Q&A

Q. QGISを使っているのですが、BigQueryの方が良い点を知りたいです

データウェアハウスにBigQueryを使っているのであれば、BigQuery Geo VizやLooker Studioとはシームレスに連携できるというところはメリットだと思います。

Q. タクシーに乗れる比率とは、その時間のメッシュ内における利用希望者数に対する車両の数ということでしょうか?時間による動的な変化は考慮されていますか?

今回事例で紹介した件で言うと、利用希望者数に対して実際にユーザーが乗れた数の割合で計算しています。より複雑な分析になるとさまざまな考慮が必要になると思います。

Q. タクシーの配車状況の可視化をリアルタイムデータで行っていますか?

今回紹介した事例も含め、私たちが分析する際はリアルタイムではなく、過去データを可視化・分析し、施策につなげていくというケースが多いです。

Q. 二つの課題が想定通りに解決されているのを確認するのは可視化だけなのか、あるいは数値的に分析されていますか?

数値的にも分析します。例えば、事例2の引き込みスポットの設置については、設置前後での配車数が増加したか、について因果推論のアプローチを用いて比較検証しています。

Q. 分析の結果より多くのタクシーの配車が必要であれば、 タクシーの供給分布を変えるとか、タクシー会社さんの稼働を増やすというような対応をしているのでしょうか?

1つ例を挙げますと、アプリ専用で運行するタクシーを展開することで、アプリでより乗りやすくなるような対応しています。

Q. GISを利用する理由は主に可視化をして人の目で特定の条件に合致する場所を特定する。ということでしょうか?人の目を解さず特定することもありますか?

GISを利用する理由は、前者のご認識で間違いありません。

人の目を介さずに特定する場合もありますが、その場合は何らか見たい指標があり、その指標が想定と異なっていた場合にGIS(kepler.gl)で具体的な時間や場所を確認する流れをとる場合が多いです。

因果推論とGISマーケティング分析に活用

タクシーアプリ『GO』ではさまざまなマーケティング施策を打っており、「分析グループ」ではそれらの効果分析も行なっています。

分析にあたり、施策を打つ前と打った後の前後比較をしたくなりますが、天気やイベント、公共交通機関の影響など、単純な前後比較では誤った解釈をしてしまう可能性があります。

このパートでは、DID(差分の差分法)を用いて、屋外広告を設置した際にその施設周辺でアプリ利用回数がどのぐらい増えたのかを分析した事例をもとに、以下のように順を追って紹介しました。詳しくはぜひアーカイブ動画をご覧ください。

  1. データ集計。 GISポリゴンを準備しデータを集計する
  2. 設置前効果検証。 得られる結果の頑健性をチェックする
  3. 設置後効果検証。 広告設置による効果を推定する

Q&A

Q. 分析時の比較対象として、近くの施設を選んでしまうとSUTVAの仮定は満たせなくなってしまう可能性はないか?

おっしゃる通り可能性はあると思います。今回の検証はDIDを用いて広告効果を推定できるのではないかという事始めとして取り組んだ側面があったため、その可能性は許容して取り組みました。

Q. 傾向スコアマッチングなど、分析の確度を上げる取り組みは行われていますか?

今回はSynthetic Controlでも同様の分析を行い確度を上げる取り組みを行いました。

Q. 最初の施設周辺のポリゴンはどのような基準で選定/策定したのでしょうか?

ポリゴンは面積が近くなるよう選定しました。

Q. 比較対象施設は何施設くらい設定しますか?比較対処施設によってDIDで効果があったとする場合と効果がなかったとする場合あると思いますが、比較対象施設間で結果が割れた場合どう判断しますか?

TechTalk内では説明を省きましたが、いくつかの施設を比較対象施設に設定しておりました。施設によって効果がある場合とない場合の結果が出た場合は、背景に考えられるデータ生成過程を考慮して結論を出す場合が多いです。

Q. 「広告の設置場所の影響で広告自体が見られていない」という考察がありましたが、3次元の建物データなどを用いて検証などは行っていますか?

3次元の建物データは今回利用せずに検証を行いました。

アーカイブ動画

開催履歴・開催予定

GO TechTalk は不定期開催しています。過去の開催レポートは こちら にもありますので、ぜひご覧ください!

GO株式会社の最新技術情報は公式アカウント @goinc_techtalkで随時発信していきますので、ぜひフォローして続報をお待ちください!