日本の商人は、顧客情報は最も大事な情報として扱っていました。窪田さんから聞いた話ですが、たとえば富山の置き薬の商人は懸場帳をとても大事な資産としていました。懸場帳という言葉は、“かけがえのない場所”つまり“かけがえのない顧客”を意味しました。
懸場帳は置き薬をおいている家族の情報で、どのような人がどんな薬を求めているかが書いてあり、この懸場帳は売買され、新しく置き薬の商売を引き継ぐこともあったそうです。
江戸時代の商人は火事になっても顧客台帳だけは抱えて逃げたそうです。このように顧客情報は日本の商人においても最も大事でした。
データを読み解くことで時代の常識に逆張りをして成功した実業家もいました。鈴木商店は第一次世界大戦で、多くの事業主が戦争は短期に収束すると予測し、商品を売却する中、戦争の長期化を予測、商品を買い入れし、大きな利益をあげました。またその後自社を介さない三国間を世界中で展開し、三井物産三菱商事を抜いて日本一の商社になり、神戸製鋼所や帝人などの日本の様々な産業の礎となりました。
B2Cに視点を変えると、消費者行動の分析では鈴木敏文がコンビニエンスストアのビジネスモデルに着目し、セブンイレブンで行ったことが挙げられます。
セブンイレブンをアメリカから持ち込むとき、アメリカで行われたPOSによる商品管理システムに、鈴木は関心をもちました。
アメリカではすでにPOSによる商品の管理を行ってましたが、その目的は主に商品管理による店員などの万引防止だったそうです。しかし日本ではこのPOSデータはマーケティングに用いられました。
すべての店長はこのPOSデータの分析を通してお店が仕入れる商品の種類や点数を決めました。このことにより、日本のセブンイレブンは、どの店舗も全く違う品揃えとなりました。アメリカのセブンイレブンはどこでも同じ品揃えだったため地元の雑貨屋さんに負け、倒産しました(いまは日本のセブンアイホールディングスが株主です)。この現場がデータを見て品揃えを変えていくというスタイルが今でも日本の小売業の基本となっていますが、これは世界で見ると特殊なことでした。
3.あらゆるデータと真摯に向き合います
ウェブ解析士はデータをもとに事業の成果に貢献することが求められます。だからデータとは真摯に向き合う必要がありますが、私達の扱うデータには気をつけるべきポイントがあります。
まずアクセスログデータやウェブマーケティング解析のデータは変動が激しく、膨大であるということです。統計であれば一部の標本から全体推計しますが、ログデータは全数データに近いデータでかつ、欠損や変動が検索エンジンのロジックの変化や外的要因で頻繁に置きます。このような不確かなデータであることをまず前提におく必要があります。
そしてウェブ解析であつかう多くのデーターはインターネット経由のデータであり、どこまでいってもリアルなデータではありません。その間をつなげるために様々な技術を用いますが、どんな技術をつかっても100%つながることはありません。
私達が扱う情報は不確かでつながらないデータであることを前提として考える必要があります。
だからそのようなデータを補うために、人の想像力が必要です。理論の飛躍が求められます。そしてその仮説や予測や無理を、行動(施策)によって補い、其の施策の可否をもって補っていく必要があるのです。
データは集めるものではなく、作るものです。それはねつ造していいということではありません。仮説をたて、その仮説を証明する行動をし、そこからデータを広くことを「作る」といってます。
私達はデータと真摯に向かい、仮説や予測で欠損値を補い、行動し事業の成果に貢献していかなくてはなりません。
データを鵜呑みにしない。外れ値を大事にする
このような不確かなデータを扱っているのでデータをそのまま受け入れることの危険性を知っていなければいけません。
私達の扱うデータはほぼすべてべき分布(ロングテール)です。だから平均だけで判断するのは危険です。平均が10だから全部が10の周りに正規分布であることはほぼない、極端に大きい、少ない数字がある前提で考えます。
直帰率1%だったらそれは成果が上がってるのではなく、何かが異常です。だから数字の急増急減に疑ってかかることが必ず必要です。
私達は統計のような標本調査ではありませんし、全数調査でもありません。その間にあるデータで、不確かな中で動くデータを扱っています。
そのことから「外れ値」は気付きにつながることがあります。極端に長い滞在時間の人がいたとき、その人の動きを異常値とせず、その人の動きをつぶさに観察します。そこから気づきにつながることがたくさんあるのです。
私が考えるデータと真摯に向かう姿勢とはそういう姿勢です。