アナリティクスのリファクタリングってなんだよヲイ

アナリティクスのリファクタリングってなんだよヲイ

リファクタリングという言葉を久しぶりに聞いた。以下のリファクタリングってこの意味では昔から使ってるのは知ってた。

Refactoring リファクタリング

リファクタリングとは、プログラムの外部的振る舞い(動作)を変えることなく、内部構造としてのソースコードを変更することである。、リファクタリング、手戻り

https://ejje.weblio.jp/content/refactoring

そもそもrefactoringの意味は、Re(再び) Factor(項目)を変えるのだから、

Refactoring is a disciplined technique for restructuring an existing body of code, altering its internal structure without changing its external behavior. Its heart is a series of small behavior preserving transformations.
(約)リファクタリングとは、既存のコード体系を再構築し、外部の振る舞いを変えることなく内部構造を変更するための訓練された技術です。その中心となるのは、動作を維持する一連の小さな変換です。

https://refactoring.com/#:~:text=Refactoring%20is%20a%20disciplined%20technique,of%20small%20behavior%20preserving%20transformations.

このウェブサイトがイメージよく伝えてると思う

https://refactoring.guru/refactoring

つまり、プログラムの汚れたソース、わかりにくいソースを「整理整頓」してきれいにすることを指す。これ本当に大事で、「掃除」ではなく「整理整頓」。メーカーにいた私としては「5S」といってあげたい。

他の人がソースコードをいじりやすくしたり、ソースコードのスピードを早くしたり、エラーやトラブルやセキュリティの問題があったときに原因が突き止めやすくなったりする。

ま、そんな技術が本来のファクタリング。

で、アナリティクスのリファクタリングってなによヲイ

これがとんと見つからない。ぐぐるとホワイトペーパーダウンロードみたいなことになる。

本来はめちゃめちゃ奥が深い内容だと思う。プログラミングでのリファクタリングから察するにつまり

  1. データソースにある重複や抽出の妨げになるデータの削除や整理
  2. データソース、データベースのカラムやリレーショナルの最適化や再利用しにくいSQLの見直し
  3. APIなどの各アプリケーションとの接続方法や利用ユーザーやシステム権限の見直し
  4. 作成したデータセットやテーブルの項目や表現を読みやすくするための整理

なんてことがあるんじゃないかと思う(ソースが見つからずプログラミングの言葉から推察)

知っての通り、データサイエンスとかAIとかマシーンラーニングなんて使えるデータじゃないと何にもならんからね、データの品質管理ってそろそろちゃんと言われたほうがいいけど、アナリティクスやデータのリファクタリングって抽象度は、保全とか整備とかのような、他の言葉より適切だね。ゴミ拾いだけがデータの保全じゃないから。

Googleアナリティクス4でもファクタリングって言葉が出てくるんだけどね。GA4だけを使うなら4.の機能しか無いと思うんだよな。