Categories
データサイエンス

mySQLやSQLserverでDATETIMEの最小値・最大値の違い

DATETIME型 SQLとひとことで言ってもOracleやPostgreSQL、DB2、mySQL、SQLserverといろいろあるのですが、データの移し変えをしていてどうもうまくいかないと思っていたらDATETIME型の最大値と最小値に違いがあるようなのです。 そこでmySQLとSQLserverでのDATETIME型の最小値と最大値を調べてみました。

最小値最大値
mySQL1000-01-01 00:00:009999-12-31 23:59:59
sqlServer1753-01-01 00:00:00.0009999-12-31 23:59:59.997
Oracle-4712-1-1 00:00:009999-12-31 23:59:59
PostgreSQL-4713-1-1 00:00:005874897-12-31 23:59:59
ただ、mySQLは0000-00-00 00:00:00を入れることもできて、WHERE句で1000-01-01 00:00:00よりも小さい値を指定しても、ちゃんと0000-00-00 00:00:00が対象に含まれるのが謎です。 ]]>

Categories
データサイエンス 書評

DMPは自社データだけではわからない新規顧客を獲得するヒント【書評】

DMP(データマネジメントプラットフォーム)の2つの定義 本書によればDMPの定義は主に2つあり、後者のプライベートDMPはWebでのCRMといった感じでしょうか。

・広告配信対象となるオーディエンスデータを販売する事業者(例:Xrost DMPAudienceOne) ・企業が自社で保有する顧客の行動をデータベース化(「プライベートDMP」と呼ぶ)

DMPのポイントは自社データではわからない部分も活用したクラスタリング

本書ではDMPを定義する要素として以下の7つを挙げている。
  1. 顧客ID、Cookie、ソーシャルメディアIDなどを統合
  2. 統合されたデータを分析し、クラスタリングを生成
  3. 生成したクラスターを連携するツールにデータをフィード、交換
  4. 生成したクラスターに属するユーザーデータを可視化
  5. 特定ユーザーと類似、関連付けられるユーザーに対象を拡張
  6. ユーザーセグメントを最適化し、セグメントごとのメッセージを最適化する
  7. ユーザーデータを広告配信に利用し、広告配信の反応によってデータ精度を高める
これらのうち、DMP業者の優劣の差をつけるのが5と7でしょう。たとえばXrostでは、TSUTAYAで有名なTポイントカードのWeb会員の情報を持っているので、たとえば東京都在住の20代女性たちがどのサイトをどのタイミングで訪れるかをまとめることで、それに似た行動履歴をするデータを東京都在住の20代女性と定義できます。 これを何度も行っていけば精度を上げていくことが可能です。ですが、そもそもベースとなるデータをどれだけ持っているかが重要なので、これがDMP業者の勝敗の分かれ目となるのではないでしょうか? できるかどうかはわかりませんが、広告主が持つ顧客情報の属性部分をを寄せ集めるという事をするDMP業者も出てくるかと思います。 しかしこちらについては、広告主側にとってよほど美味しい条件が無いといけませんし、XrostのTSUTAYAのように個人情報を出さないということを顧客側が了承しないといけませんね。 話は戻ってDMPのクラスタリングについてですが、総合通販サイトで40代の主婦が旦那の服を購入するケースが多いという事が以前ありました。これまでのリタゲや個人の属性を用いずに訪問履歴や購入履歴だけで行われるセグメントではこの主婦には男性商品を訴求する可能性が高いです。 ですが、ここにDMPならではの属性が加わる事でハズレが少ない広告を配信できるようになります。このハズレをいかに少なくするかがDMP業者の評価となっていくと思いますし、これをDSPのせいにしてはいけないかと思います。

広告の費用対効果最大がDMPの目的

DMPは自社データだけではわからない訪問者のセグメントを行うわけですから、利用目的はなんといっても広告です。DMPによって訪問者の属性が判別できますので、枠ではなく人に対して広告配信が可能なDSPを使って、DMPでのセグメント条件に当てはまる人にDSPで広告を見せていくのが一般的なパターンです。

プライベートDMP&DMP&DSPの連携が必要

プライベートDMPを構築したところで訪問者のサイト内の情報と属性しか集まりません。 DMPで得られる外部のデータ(=オーディエンスデータ)と組み合わせることで訪問者への広告の精度を上げて行く必要があるので、遅かれ早かれDMPの導入は避けられないかと思います。 本書ではlook-alikeという手法が紹介されています。そちらについては WireColumn: DMPによるデータ活用法(ExchangeWire)の説明がわかりやすいと思います。

リターゲティングとDMPの違い

ちょっと悩んだのがリスティングとDMP&DSPの違いでした。詳細は違うかもしれませんが、ざっくりいえば、ページで判断するのがリターゲティングで、動線&属性等でセグメントするのがDMP&DSPという事だと思います。
  • リターゲティング:自サイトへの訪問者が見たページに応じて外部のサイトで広告を見せる
  • DMP&DSP:自サイトへの訪問者の属性をDMPで分析して外部のサイトで広告を見せる
訪問者が自サイトの複数のページを見た場合、広告内容が絞れない可能性があります。一方のDMPでは複数のページに関連する情報をセグメント化する事で訴求できる事もあるので、DMP&DSPの方が訪問者にささる可能性が高くなると思われます。

DMPによる成果向上は長い道のり。CMOのような牽引者が必要

本書ではGDOの中澤さんのインタビューが記載されています。GDOさんはWebマーケティングでは日本でもかなり先駆者的な取り組みをしていると思います。 そのGDOさんですら3年経っても不十分というのですから、なかなか難しい事が想像できます。 また、社内体制についてGDOさんではシステム部よりもマーケティング部の中にシステム担当部門を作り、彼らが主導となっていたようです。本来ならばITに強いシステム部がすべきだと思いましたが、やはりシステム部に任せるとなるとマーケティングスキルが無いのでなかなかうまく行かないようです。(※私の会社がそうなので余計にそう感じてしまうのかもしれませんが。。。) DMPに限らずマーケティングシステムは基幹システムとは切り離して構築していく必要があり、それを実現するには全体を動かすCMO的な存在がいないと結構大変だと感じました。

DMPを実践するのは大変。でも広告効果には必要な要素

本書を読んで、DMP(DSPも含めて)を実践するには、人、モノ、金のどれをとっても結構大変な事だとわかりました。中でも人については人員不足で、金については今まで発生していないコストがかかるので捻出するのが結構大変だと感じました。 また、モノについては現在のDMPの精度がまだまだ低い事と成功例が出てきていないのでこれは時間の問題とDMP業者の努力に任せるしかないと思います。 と長々と書きましたが、私の会社はまずはプライベートDMPからです。。。 [amazonjs asin=”484439584X” locale=”JP” title=”顧客を知るためのデータマネジメントプラットフォーム DMP入門 (NextPublishing)”]]]>

Categories
データサイエンス 書評

【書評】これからのデータサイエンティストに必要なのは分析力ではなく実行力!

分析はビジネスに貢献できてはじめて結果となる 日経情報ストラテジーが選ぶ第1回データサイエンティスト・オブ・ザ・イヤーを受賞した河本薫氏が考える分析屋にとって本当に必要な事がまとめられている。 昨今、「ビッグデータ」や「データサイエンティスト」など「データ」がもてはやされていて、分析できる人がさまざまな業界で引く手あまたです。実際、私にも「データ分析ができる人を紹介してほしい」という話が何度か来ています。 しかし、分析屋に求められるものは、SASが使える、テキストマイニングができるといった手法ではなく、

ビジネスにどれだけ貢献できるか?

という事です。ブレイクダウンすると、この3つをできる人が分析のプロフェッショナルだと説いています。 1.ビジネス課題を見つける 2.分析問題を解く 3.数値解を使わせる ビジネス担当者に結果を正しく使ってもらい、業績等をアップさせる事がゴールなので、そのためには数字をこねくり回す事よりも、視野を狭めず問題を正しくとらえて、シンプルな回答を出し、担当者と円滑に進められるコミュニケーションスキルの方が重要だといいます。 分析そのものはコンテストやアウトソースで他の方でもできてしまいます。その点、それを理解してしっかりとビジネスに生かせるスキルがなければ、分析結果も紙屑と同じです。 本書では最後に、分析プロフェッショナル(=専門力を有し、それを報酬に繋げられる人)とスペシャリスト(=専門力を有する人)は違うとし、分析プロフェッショナルになるには以下の3つが必要だと書いています。 ・論理的思考力 ・右脳的思考力 ・感受性

データの意味を理解して、動かす側になれ!

本書では、分析担当者には以下の2種類に分かれると書かれています。 ・バックオフィス分析者  (1.ビジネス課題を見つける、2.分析問題を解く) ・フォワード分析者  (2.分析問題を解く、3.数値解を使わせる) 私はWebアクセス解析やCRMなどは経験がありますので、そこそこの分析者だと自負していますが、これまでの私を振り返ると圧倒的にバックオフィス分析者でフォワードの要素が足りないと感じました。 そのようなバックオフィス的な私がこれまでやってこれたのでしょうか? これまで働いてきたWebコンサル会社やダイレクトマーケティング会社を振り返ると、「1.ビジネス課題を見つける」、「2.分析問題を解く」は私の方が優れていても、「3.数値解を使わせる」については他の社員が圧倒的に優れていました。 かつていたWebコンサル会社、毎年利益は増やしていますし、今でも評判も上がっています。 その会社の特徴はコンサルと言いながらも、自分達で運用したり運用していなくても進捗管理は行って、クライアントの問題を自分たちで解決しようと踏み込んでいます。 そこまでクライアントに入っていくコンサル会社はほとんど見たことがありません。 その反面、データ分析会社も何社か知っていますが、どちらかというと下請け的な立場だったり、分析だけ行って結果に関しては全く関与しないケースが多いです。 両社を比較すると、バックオフィス的要素や分析手法はデータ分析会社が優れていますが、フォワード的要素は私が働いていた会社の方が優れていると思います。 今はツールやシステムで先を行っていますが、そのうちその差も縮まっていき、いずれは「3.数値解を使わせる」という実行力が重要になってくると思われます。 ですが、フォワード分析者ばかりが重要ではなく、バックオフィス分析者もビジネス課題を正しく理解する人は生き残れるのではないでしょうか? [amazonjs asin=”4062882183″ locale=”JP” title=”会社を変える分析の力 (講談社現代新書)”]]]>