データサイエンティスト

「データサイエンティスト」を読みました。アルファブロガー橋本大也さんの著作です。あっさりと「データサイエンティスト」「ビッグデータ」など概要を説明しています。知識としてはいいのですが、将来セクシーな職業になることが確実なら、もっと煽ってもよかったかもね。備忘します。

現場で働くデータサイエンティストは大学までで習ったような、基本的なツールを揃え直すのが先決だ。千回に一回しか使わないツールは、そうしたものがあると把握できていれば良い。本当に必要になったら、専門家を外部から呼んでもいいのだから。(六十四ページ)
車に乗る>街を歩く>海で泳ぐ>自転車に乗る>山に登る>列車に乗る>飛行機乗る>自動車に乗る。 車の死亡事故で亡くなる人というのは、一年間に10万人中3人程度だ。…列車事故はぐっと下がって0.3人、飛行機事故の死亡にいたっては0.009人だ。
(六十六ページ)
データサイエンティストは常識を疑い、認知バイアスを自覚して、ツールとデータによる検証で、真実を見出す。ときには仕事の依頼者の認知バイアスを指摘して、課題の全体の見直しを提案することも必要だ。(七十二ページ)
アブダクションは仮説と発見の論理とも呼ばれる。演繹とは原理から考えること、帰納とは実験のデータから考えることである。ビジネスの世界では、原理が展開できることを考え尽くされていることも多いだろうし、データは精度の高い議論を作れるほど、完全に揃えるのが難しいことが多い。アブダクションとは、驚くべき事実Cが観察される。しかしもしHが真実であればCは当然の事柄であろう。よってHが真であると考えるべき理由がある。という推論形式である。説明すき事実に対してたくさんの仮説を立てて、その中のもっともらしい仮説を選び出す拡張的な推論プロセスであるが、驚くべき事実の観察から始まるので、発明、発見の方法論として有効なのだ。例えば経営しているコンビニの売上が特別に高かった日があったら、そこにもっともらしい理由を想像してみることだ。それもひとつでなくいくつもいくつも。(九十三ページ)
セグメントの意味や優先順位も多少カスタマイズする必要がある。 RFMは米国の通信販売業界で生まれた手法なので通販ビジネスには適しているが、一生に一度の高額の買い物や、旅先での衝動買いを狙ったもののように、購買パターンが異なるビジネスに向かない場合もある。(百二十一ページ)
クラスター分析とは、似た得点のつけ方をしている回答者をグループ化して分類していく手法だ。ラスター分析の利点は分類の軸をあらかじめ人間が考えなくて良いとことだ。それにかければ自動的に似たパターンが寄せられる。(百六十六ページ)
テキストマイニングでは、文書の内容が肯定的な内容なのか否定的な内容なのか、自動判別できる。これをポジネガ判定と呼ぶ。ポジネガ判定をアンケートに適用すれば、百件の自由記述アンケートのうち、ポジティブな内容で五十七%で、中立が十八%で、ネガティブで二十三%というように。分類して、グラフで報告することができる。(百七十二ページ)
データサイエンティストの活躍によってつまらない広告がなくなる。ゴミ箱直行のダイレクトメールがなくなり、セールスの電話に悩まされることがなくなる。そのかわりに、タイムリーに個人的問題を解決してくれるサービスが見つかり、最適のレコメンドにより、満足度の高い消費体験が出来るようになる。データ分析は次世代の感動サービスの最大の付加価値を生む。(二百十九ページ)