web-dev-qa-db-ja.com

Firebase Analyticsの生データでセッションとセッション期間を計算する方法は?

BigQueryにリンクされているFirebaseアナリティクス生データセッション期間を計算する方法は?

次のブログを使用して、各レコード内にネストされているイベントのflattenコマンドを使用してユーザーを計算しましたが、 Session の計算方法を知りたいです。およびセッション期間国および時間別。

(私は多くのアプリを構成していますが、セッション期間とセッションを計算するためのSQLクエリを手伝ってくれるとしたら、非常に役立ちます)

FirebaseとBig Queryの使用に関するGoogleブログ

7
Joshua Johnson

まず、セッションを定義する必要があります。次のクエリでは、ユーザーが20分以上非アクティブである場合は常にセッションを中断します。

ここで、SQLを使用してすべてのセッションを検索するには、 https://blog.modeanalytics.com/finding-user-sessions-sql/ で説明されているトリックを使用できます。

次のクエリは、すべてのセッションとその長さを検索します。

#standardSQL

SELECT app_instance_id, sess_id, MIN(min_time) sess_start, MAX(max_time) sess_end, COUNT(*) records, MAX(sess_id) OVER(PARTITION BY app_instance_id) total_sessions,
   (ROUND((MAX(max_time)-MIN(min_time))/(1000*1000),1)) sess_length_seconds
FROM (
  SELECT *, SUM(session_start) OVER(PARTITION BY app_instance_id ORDER BY min_time) sess_id
  FROM (
    SELECT *, IF(
                previous IS null 
                OR (min_time-previous)>(20*60*1000*1000),  # sessions broken by this inactivity 
                1, 0) session_start 
                #https://blog.modeanalytics.com/finding-user-sessions-sql/
    FROM (
      SELECT *, LAG(max_time, 1) OVER(PARTITION BY app_instance_id ORDER BY max_time) previous
      FROM (
        SELECT user_dim.app_info.app_instance_id
          , (SELECT MIN(timestamp_micros) FROM UNNEST(event_dim)) min_time
          , (SELECT MAX(timestamp_micros) FROM UNNEST(event_dim)) max_time
        FROM `firebase-analytics-sample-data.ios_dataset.app_events_20160601`
      )
    )
  )
)
GROUP BY 1, 2
ORDER BY 1, 2

enter image description here

14
Felipe Hoffa

BigQueryのFirebaseの新しいスキーマでは、@ Maziarによる回答が機能しないことがわかりましたが、その理由はわかりません。代わりに、以下を使用して計算しました。セッションは、ユーザーがアプリを最低10秒間操作することとして定義され、ユーザーがアプリを30分間操作しないとセッションが停止します。セッションの総数とセッションの長さを分単位で提供し、次のクエリに基づいています: https://modeanalytics.com/modeanalytics/reports/5e7d902f82de/queries/2cf4af47dba4

SELECT COUNT(*) AS sessions,
       AVG(length) AS average_session_length
  FROM (
  
SELECT global_session_id,
       (MAX(event_timestamp) - MIN(event_timestamp))/(60 * 1000 * 1000) AS length
  FROM (
SELECT user_pseudo_id,
       event_timestamp,
       SUM(is_new_session) OVER (ORDER BY user_pseudo_id, event_timestamp) AS global_session_id,
       SUM(is_new_session) OVER (PARTITION BY user_pseudo_id ORDER BY event_timestamp) AS user_session_id
  FROM (
       SELECT *,
              CASE WHEN event_timestamp - last_event >= (30*60*1000*1000) 
                     OR last_event IS NULL 
                   THEN 1 ELSE 0 END AS is_new_session
         FROM (
              SELECT user_pseudo_id,
                     event_timestamp,
                     LAG(event_timestamp,1) OVER (PARTITION BY user_pseudo_id ORDER BY event_timestamp) AS last_event
                FROM `dataset.events_2019*`
              ) last
       ) final
       ) session
 GROUP BY 1
       
       ) agg
WHERE length >= (10/60)
4

ご存知のように、GoogleはBigQuery Firebaseデータベースのスキーマを変更しました: https://support.google.com/analytics/answer/7029846

@Felipeの回答のおかげで、新しい形式は次のように変更されます。

SELECT SUM(total_sessions) AS Total_Sessions, AVG(sess_length_seconds) AS Average_Session_Duration
FROM (
  SELECT user_pseudo_id, sess_id, MIN(min_time) sess_start, MAX(max_time) sess_end, COUNT(*) records, 
    MAX(sess_id) OVER(PARTITION BY user_pseudo_id) total_sessions,
    (ROUND((MAX(max_time)-MIN(min_time))/(1000*1000),1)) sess_length_seconds
  FROM (
    SELECT *, SUM(session_start) OVER(PARTITION BY user_pseudo_id ORDER BY min_time) sess_id
    FROM (
      SELECT *, IF(previous IS null OR (min_time-previous) > (20*60*1000*1000), 1, 0) session_start 
      FROM (
        SELECT *, LAG(max_time, 1) OVER(PARTITION BY user_pseudo_id ORDER BY max_time) previous
        FROM (SELECT user_pseudo_id, MIN(event_timestamp) AS min_time, MAX(event_timestamp) AS max_time
          FROM `dataset_name.table_name` GROUP BY user_pseudo_id)
      )
    )
  )
  GROUP BY 1, 2
  ORDER BY 1, 2
)

注:プロジェクト情報に基づいてdataset_nametable_nameを変更します

サンプル結果: enter image description here

0