2016年11月18日金曜日

お知らせ:ブログの移転

当ブログをご覧いただき、誠にありがとうございます。

 この度、当ブログを以下のURL(ユニリタホームページ)に移転しました!

 移転先でも引き続きご覧いただければ幸いです。

 ↓↓
http://www.unirita.co.jp/blog/data-utilization/data-analytics/

2016年8月2日火曜日

他でもない話

データアナリティクスグループの梅田です。



「カテゴリ」や「分類」が設定されているデータを分析していると
  • 「その他」の件数が、割と多い
という状況に遭遇することがあります。

インシデントデータを考えてみましょう。

古い記事で恐縮ですが、以下のブログ記事ではインシデントの区分分けを提案しています。
この区分に従って分類された、インシデントのデータを分析するケースを考えてみます。

インシデントの分析ってどうすんの?
http://itsmbsp.blogspot.jp/2014/08/blog-post.html

具体的には以下の状況です。
  • インシデントは、「トラブル」「Q&A」「要望」「その他」で、カテゴリの分類が行われている
  • インシデントのうち、「トラブル」に属するものは、さらに「ハードウェア」「ソフトウェア」「インフラ」「ヒューマンエラー」「その他」で、サブカテゴリの分類が行われている
このようにして区分分けされたデータを集計するとき、「その他」に属するインシデントは、他のどの分類にも当てはまらないインシデントなので、少ないのではないか、と考えてしまいがちです。例えば下図のイメージです。


ところが、実際にデータを集計してみると、「その他」に属するインシデントが割と多いことがあります。下図のイメージです。


「ハードウェアに次いで多発しているトラブルって何?」という話になり、該当するインシデントデータを調査して内訳を調べることになります。
ただ実際には、1つの分類が25%に達しているわけではなく、あくまでも既存の4つの分類に当てはまらなかったインシデントの合計が25%に達しているだけです。内訳を調べて数の多いものを分類に追加するなど、カテゴリやサブカテゴリを整理して再分類してみると、「その他」のデータは分割されていき、現状をより正しく反映した割合分布が得られると思います。

データに対してカテゴリやサブカテゴリを設定した後、途中でカテゴリの見直しを行わずにデータを溜め続けると、溜めたデータを分析しようとする段階になって、上記のようなことが起こる可能性があります。
データを起票する際に、以下のような状況が起きていないでしょうか。
  • 内容に当てはまるカテゴリがなく、仕方がないので「その他」に分類している
  • カテゴリAとカテゴリBの境界線上にあるような内容で、どちらに入れるべきか判断できないので、仕方なく「その他」に分類している
  • 最近、「分類:その他」のデータばかり起票している気がする
そのときは、カテゴリを見直すタイミングが来ているのかもしれません。
現状の再確認として、「その他」のデータがどれ位あるのか、確認してみてはいかがでしょうか。


2016年6月28日火曜日

ブラックボックスで何が悪いの?

データアナリティクスグループの左近です。



まずはじめにお断りしておくと、今回の記事の内容は、あくまで僕自身の考え(というか思いつきの羅列)に過ぎません。

決して弊社および当事業部のメッセージではないことを予めご了承頂いた上、
「また、ゆとりか・・・(失笑)」
と生暖かい目でご覧頂けますと幸いです。


よし、言い訳完了。


僕らの部署は、"データアナリティクス"の御旗のもと、
お客様のところにある『眠っているデータ』を何とかこねくり回して、
企業活動において有意な分析結果を提供することが、ミッションになっています。

で、「あんなこといいな、できたらいいな」というドラえもん的なノリで、
お客様とディスカッションさせて頂き、今あるデータのプロファイリング(調査)だったり、
必要に応じて(というかほぼ100%必要)、ユニリタのお家芸ともいえる
データの収集や加工をしたり、データの分析手法の選定をして、
出てきたアウトプットを、実業務で活用するための運用イメージを設計していきます。

そんな中で僕らは、機械学習を使った分析を推しており、
「今まで見えてこなかった特徴を捉えて、ノウハウにない新たな気づきを得ましょう
とお客様にお話しするわけです。

さすがに、
「機械学習? 何それ? 聞いたこともない」
という反応こそ、もうあまり無くなってきましたが、
64%の確率(私の体感)で、次のお言葉を頂戴します。


「機械学習ってブラックボックスですよね?」

「出てきた結果に対して『何でそうなったの?』が分からないのはちょっと・・・」


なるほど、仰ることは良く分かります。
ここで、ゆとり世代の僕は、ゆるーく呟くのです。


ブラックボックスで何が悪いの?




この場合の「ブラックボックス」はユーザ側から見たときに限るものとします。

少し言葉が乱暴だったかもしれません。
「何でそうなったの?」ということについて、考えることを放棄するつもりもありません。

洞察は当然必要なこと。
ただ、生半可な洞察では、現実離れした施策に繋がってしまう可能性があるということです。


唐突ですが、僕が普段よくつるむ友人4人を紹介します。
あーちゃんと、けんちゃんと、ぶんちゃんと、しーちゃんです。(すべて仮名)

僕とこの4人は、中学・高校が同じで、家も割と近いこともあり、
未だに週1回以上は飲みにいくような仲です。
4人は別にお医者さんでも弁護士さんでもアイドルでもなく、
僕と同じように普通のサラリーマンです。

僕を含めた5人を、よくある形でデータ化してみましょう。











同一人物なのかな??



いやいや、これだと属性が少なさすぎる。
何かもっと他にデータがあるはず。


あーちゃんは普段、私服のときは大体ビーチサンダルを履いています。
夏だけに限らず、春から秋にかけてずっとビーサンです。
通販で100円で買えるそうです。
まとめ買いしてるため、彼の靴棚はビーサンが5足ぐらい常備されています。



そう、彼はイケメンですが、足元にお金をかけません。



冬のある日、彼が白いスニーカーを履いてきました。
しかも、NIKEのエアフォースワン
僕らは驚きました。

「あーちゃんがちゃんとした靴履いてる・・・!」


しかし、よく見てみると例のNIKEのロゴがありませんでした。

彼に尋ねてみると、

「ん? よく分からんけど、通販で800円ぐらいで買った」


地面を歩く感触がしっかりとあるそうです。クッション性皆無。




そう、彼はイケメンですが、足元にお金をかけません。(繰り返し)



更に言えば、服についても割と適当であり、鞄は持たない主義のため、
ファッションに関する購買の頻度や金額は、僕ら5人の平均よりは少な目になります。



そう、彼はイケメ(以下略)



先程のデータに一つ項目を付け足します。



もしマーケティング関係の第三者がこの情報を見たとき、
「なるほど、あーちゃんという人は、ファッションに対してあまりお金を使わないから、
ファッション関係のDMや、WebのPR広告をうっても、イマイチなのかな?」
と推察できます。


ある日、あーちゃんがふと呟きました。

「俺、時計欲しいんだよね」

まぁ、携帯電話で代用できるとはいえ、一応サラリーマンですし、形式上必要ですよね。

「ふーん、何買うの?」

「オメガのシーマスター」

「出た、また通販だろ?(笑)」

正規店で買うに決まってんだろ(真顔)」




なんなの??



残念ながら全て実話です。


ちょっと特殊な例になってしまったかもしれませんが、

 ・靴は安いので十分
 ・服も安いので十分
 ・鞄は買わない
 ・腕時計はオメガのシーマスターが欲しい

「ファッション」という切り口で見れば、
【購買意欲がそれ程高くない顧客】と捉えそうになりますが、
細分化すると全く違った結果が見えてきます。

僕ら5人の中で、シーマスターの割引クーポンを一番欲しがっているのは、
実はあーちゃんだった、という。


ここで更に踏み込むと、彼は恐らく今後も定期的にビーサンを買い続けます。
僕らは履きつぶすほどビーサンを履く機会もないので、2~3年に1足程度でしょうか。

通販でビーサンを100円で販売する業者からすれば、RFM分析(※)において、
あーちゃんはR,F,Mの各項目で高い項目を示す優良顧客でしょう。
一方で僕らは、通販でビーサンを定期購入する習慣は無いので、良い顧客とは言えません。
(※RFM分析…「最終購買日(Recency)」「購買頻度(Frequency)」「累計購買金額(Monetary)」の3つの切り口から、顧客のセグメンテーションを行う分析手法。)

この場合、もしビーサン屋がクーポンやDMを送る場合、
僕らよりもあーちゃんの方が反応する可能性が高いと言えます。


一方で、今日現在、まだ購入には至っていませんが、
あーちゃんがオメガのシーマスターを買ったとしましょう。
僕らは残念ながら、オメガの時計は誰も持っていないので、
あーちゃんが一歩リードとなります。


ただ、恐らく、


恐らくですが、


あーちゃんが2本目のオメガを買うより、
僕らが1本目のオメガを買う方が先だと思います
(※もちろん、趣味嗜好もあるので、オメガではない可能性もありますが、"高級時計"という意で)

高級時計を次から次へと買えるほど、収入に恵まれている訳ではないので、
買うときは全力フルスイングで一発勝負になると思います。

この場合、先と同様の分析を行うと、
直近で買ったばかりのあーちゃんに対して、クーポン配信してしまいそうになりますが、
実際は僕ら4人の方がクーポンに反応する可能性が高い、なんてことがあり得ます。

このように、商品の性質によって、取るべきアプローチは変わってきます。



また、別の友人けんちゃんの話。

先日、僕が漫画喫茶で、何の気なしに読んだ『みどりのマキバオー』について、

「マキバオーってギャグ漫画だと思ってたけど、漫喫で読んだら涙腺崩壊レベルに号泣した」

とLINEで送ったところ、彼は数日後に電子書籍版で全巻大人買いしていました。

ここで僕が驚いたのは、彼は基本的にマンガを買うことはほとんどなく、
たまに機会があれば漫画喫茶に行って適当に読むぐらいであり、
更に言えば、これまで電子書籍で本を買ったことがなく、
今回初めてわざわざアカウントを作って購入した、ということです。

彼曰く、「お前の激プッシュが気になったのと、ボーナス直後だったから、大胆に行った」

本当にタイミングの問題ですね。
伝えるのがあと1か月早かったら、彼は漫喫の個室で号泣していたはず。



「そんなん予想できるか、たまたまの単発パターンじゃねーか」
という反論も聞こえてきそうなものですが、
いまマーケティングの世界で取り組まれようとしているのは、こういうところです。

お客様とのタッチポイントの拡張、収集できるデータの多様性、リアルタイム性。
従来の分析手法で分からなかった特徴を抽出するということ。
生半可な洞察では、現実離れした施策に繋がってしまう可能性があるということ。

分析をする上では、とにかくデータが必要になります。

そしてそれらを分析するために、ツールとして機械学習を使うということ。

たぶん、最初はブラックボックスに見えてしまうと思います。



最初にお見せしたこの表(↓)










「千葉県在住の既婚の20代男性」
みんな、別人ですからね。


次に進むために、One to Oneの話をしましょう。


2016年6月14日火曜日

ロジックツリーのススメ

データアナリティクスグループの梅田です。



今回は、「ロジックツリー」という思考技法をご紹介します。
統計学などの専門的な知識がなくても使える技法ですので、まだご存じでない方は、覚えておくと、課題を整理したいときなどに役立つと思います。

ちなみに前回の記事で宮本が紹介していた、データサイエンスのオンライン講座でも、講義の序盤の方で紹介されていました。

ロジックツリーとは?

物事を論理的に分析・検討するときに、その論理展開を樹形図に表現して考えていく思考技法です。できあがった樹形図自身も、ロジックツリーと呼ぶことがあります。

ロジックツリー(ろじっくつりー)
http://www.itmedia.co.jp/im/articles/0609/01/news133.html

下の図は、「売り上げの拡大」という課題を1段階ずつ細分化しつつ、樹形図として表現した、ロジックツリーのサンプルです。


樹形図を使って細分化していくことで、課題の要素や要因として考えられるもの、可能性のあるものが列挙されていくことになります。(漏れなく、ダブりなく列挙されるように考えながら作成する必要があります)

一通り列挙したところで、細分化したものに対して「実現可能性」「重要度」「コスト」「期待効果」などの情報や条件を重ね合わせてみると、現実的に着手できそうな候補を絞り込むことができます。
上図の場合、一般的に「店舗の追加」には多大なコストがかかり、「新規顧客の獲得」は難易度が高いことから、それ以外の候補の中で、キャンペーンを打ちやすいものが候補として絞り込まれることになるでしょう。

派生 その1

大きな課題に対して、細分化した課題を列挙していくのではなく、原因や”原因の原因”を列挙していくと、「なぜなぜ分析」と同じ考え方で問題を分析していくことができます。

ツリーで列挙した原因群に対して、取れる対策を考え、最後に実現可能性や効果が大きそうな対策を絞り込む流れになるでしょう。

派生 その2

あまりないケースですが、要因や原因の列挙が終わった後、可能なのであれば、列挙された要素に対して、全て対策を取るという手もありです。

私の先輩社員の話ですが、全員初対面のメンバーでグループを組んで活動を始めようとする場面で、チームリーダーを選出しなければならないが誰も立候補しない、という状況になったとき、各自がリーダーに立候補できない理由として考えられるものを全部列挙し、その全部に反論することによって、各自が「リーダーになれない理由」を無くそうとしたことがありました。

この説得が功を奏してか、20分後ぐらいに無事、リーダーが決まりました。

対策にコストがかかるような問題だと、全ての対策に取り組むことは不可能だと思いますが、この例のように議論レベルの話であれば、考えられる想定問答を全て列挙し応答を考えておくのが有効な場面がありそうです。


以上、ロジックツリーと、派生する話題をご紹介しました。
複雑な課題の整理などで活用していただければと思います。


2016年5月23日月曜日

データサイエンスをオンラインで学習してみた

データアナリティクスグループの宮本です。




私の所属しているデータアナリティクスグループでは、約2年前の結成当初から定期的に機械学習やデータ分析に関する勉強会を行っています。

昨年はcourseraというオンライン講座のサービスを利用して、機械学習について学びました。

coursera - Machine Learning

英語での授業かつコース全体が長かったですが、授業の内容は非常に良くできており、難しい内容をかなり簡単に説明してくれていたので、機械学習に対する理解はかなり深まったと思います。

今年に入ってからはcourseraの別の機械学習コースを企画していましたが、英語の音声+英語の字幕での授業(上記リンクのコースは英語音声+日本語字幕)ということで、内容というより英語の壁が高すぎるため断念。

メンバーそれぞれでネタを持ち寄ってやったりもしましたが、コンテンツを作るのに時間が掛かってしまったり、すぐにネタ切れになってしまったりでこちらもあまり長く続きませんでした。

そんな折、gaccoという日本のオンライン講座のサービスで今年の4月19日に開講した「社会人のためのデータサイエンス演習」というコースがちょうど良さそうだ、ということで受講し始めました。

社会人のためのデータサイエンス演習 | gacco

講座の概要は上記ページに書いてあるので割愛させて頂き、Week3まで受講してわかった各週の流れや雑感を書いてみます。

ということで、各週の学習は以下のような流れになります。

  1. 講義

    1つの講義が5~10分程度で、各週に5つの動画が用意されています。5つの動画全て見終わるのに約30分~40分程度です。
  2. 補講

    補講はPDFでの資料提供と動画での講義の2つコンテンツが用意されています。また、補講では実際にサンプルのexcelファイルを使い、自身でデータ分析を行ないます。
    私はPDFの資料を見ながら補講を受けましたが、こちらも大体20分~30分程度で終わるボリュームでした。
  3. 課題

    課題は各週でexcelファイルにデータが用意されており、問題に沿ってデータ分析を行ってブラウザ上で設問に対して回答(選択形式)します。
    課題もスムーズに進めば20分~30分程度で終わるボリュームでした。
上記のような流れで、大体の合計が90分くらいで1週間分の学習が完了できました。
1週間で90分程度というのは、お仕事をしながらでもそこまで無理なく学習できて、「社会人のための・・・」と謳っているだけあり、ボリューム的にちょうど良いように感じます。

肝心な講義などの内容ですが、データサイエンスの初歩の初歩というレベルで、基本的にはどのようにexcelでデータ分析するかのレベルです。

ただ、講師陣がかなり著名で優秀な方々なようで、基本的に説明が丁寧でわかりやすい印象です。
講師自身の体験も交えた分析時の失敗談などもふまえて講義してくれているので、データ分析をまだしたことない方や初心者レベルの方には非常に理解しやすく、データ分析のとっかかりとしてこの講座を受けるには良い内容だと思います。

また、今後配信される第4週や第5週では、より実際のビジネスでどのように分析していくかというような内容が期待できる講義のタイトルなので、コース全体ではデータ分析の初中級者向けなのかなと思います。

データサイエンス、データ分析に興味があるけど、勉强の仕方が良くわからないという方は今回ご紹介させて頂いた講座を受けてみてはいかがでしょうか。


2016年4月26日火曜日

パン屋のレジから考える機械学習の性質

データアナリティクスグループの梅田です。





先日、テレビのニュースで、パン屋向けの新型レジを取り上げているのを見かけました。調べてみると、Web上では、3年前に既に記事になっていました。

パン8個を1秒で種類と値段を自動識別してレジ精算を高速化できる「BakeryScan」
http://gigazine.net/news/20130408-bakery-scan/

要約すると、複数のパンを入れたトレーをカメラの下に置くことで、カメラに映った画像から、コンピュータがパンの種類を自動で識別して、合計金額を計算してくれるレジです。
普通のパン屋では、店員がパンの種別を1つずつ判別してレジ打ちしていますが、その負荷が軽減されるわけです。

この新型レジ、「機械学習を使って開発しました」とは一言も書かれていませんが、記事中で「修正結果がデータベースに反映されていき、識別精度がどんどん向上」と書かれている点など、私の目には、機械学習を使っている、もしくは同じ考え方で作られているようにしか見えませんでした。
そこで以下では、もしこのレジが機械学習の技術を使って作られていたとしたら、という仮定のもとで、機械学習の性質について考えてみます。


このレジは、内部的には、カメラに映ったトレーの画像を読み込んで、トレーに乗っているパンがどの種類のものであるかを”予測”しているはずです。
過去に学習した、様々なパンの画像の中から、類似度が最も高いものを計算し、予測結果として出力。個々のパンの種類がわかれば、合計金額はすぐに計算できます。

ただ、機械学習で正解率100%の予測をさせることは不可能です。予測が外れることもあります。なので、そのことを前提として、以下のような使い方をしている例を良く見かけます。
  • 機械の予測が良く当たる部分では、その予測を使う。そうでない部分は、予測を鵜呑みにせず、人間が判断したり、訂正したりする。
  • 機械の予測をそのまま使うかは、最終的には人間がチェックするが、機械の予測があまり当たらない部分を優先的にチェックするようにする。機械が「問題なし」と予測していて、かつ予測が良く当たっている部分については、放置しても問題が起きる可能性は少ないので、人間のチェックは後回しにする。
この場合、人間の判断やチェックの労力を機械が肩代わりしてくれるものの、100%の肩代わりにはなりません。しかし、6~7割肩代わりしてくれるだけでも十分な工数削減になる、というケースはたくさんありそうです。

このレジの場合は、システム上でうまく予測できなかった(予測に自信がない)パンについては、画面上に黄色枠で囲まれて表示されるようになっています。本当に予測が誤っている場合、該当部分をタッチすると次善の候補が表示され、誤りを訂正することができます。前述の「修正結果が反映されていく」とはこのような訂正のことを指しています。
店員は、黄色枠が表示された時だけ、訂正が必要かどうかを注視すれば良いわけで、まさに上で書いた通りの使い方をしていると言えます。


このレジがあると、パン屋にはどのような効果があるのでしょうか。
店員のレジ打ちの負荷が減り、会計が早くなることは想像できますが、それ以外で「アルバイト店員が、パンの種類を覚えなくてもレジ業務を担当できる」という利点があるのだそうです。教育工数の削減です。
この仕組みだと、仮にアルバイト店員が交代することになっても、学習結果は機械側に残っているので、店員を雇うたびに都度教育する必要は無くなりますね。
人間がやると労力がかかる作業を、文句も言わずに、何度でも繰り返し実行してくれるのは、機械学習に限らず、機械化の利点の1つです。


このような便利な仕組みがあると、パン屋以外のレジにも使えるのでは? ということを考えたくなります。
しかし、他の店のレジの様子を考えてみると、それぞれパン屋とは特性が違うところがあります。新型レジを適用しようとしても、上手く適用できない、またはパン屋ほどの効果は出ないと考えられます。

コンビニ、書店ほぼ全ての商品にバーコードが付いており、1回の会計で購入される商品の数も少ないことから、そもそもレジ打ちの負荷がパン屋より少ない。効果が薄そう。
スーパーマーケット特売日では籠いっぱいに商品を入れる買い物客をよく見かける。この場合、平面を写すカメラだけでは、籠の中の全ての商品を一度に認識させるのは難しそう。
100円ショップ全商品の単価が同じなので、商品の種類を識別できなくても、数を数えられれば会計できる。
衣料品店パンよりも大きな商品を売っていることが多いので、カメラの視野におさまるように複数の商品を乗せたり、識別させたりすることが難しそう。

目的と手段を取り違えるな、という言葉を耳にすることがありますが、「新型レジ」という手段だけに着目して、それに合うような目的を探そうとすると、このようなことになってしまいます。
無理を承知で、この新型レジを上手く適用できるお店を考えるなら、商品にバーコードを付けられない、八百屋や魚屋あたりが該当するでしょうか。


というわけで、新型レジの話題を取り上げつつ、機械学習の適性について、いくつか触れてみました。
今後も機械学習の適用例が色々と登場すると思いますが、上で書いたような性質を上手く生かしたり、乗りこなしたりしているはずです。その観点で見てみると、もっと面白く見ることができるかもしれません。

2016年4月14日木曜日

データ分析の間隙にあるもの

データアナリティクスグループの左近です。




少し前に放送されていた某TVドラマの中で、広瀬すずさん演じる"天才ハッカー"が、
ある堅牢なシステムに侵入しようと試みるワンシーン。


暗い部屋の中、真剣な表情でノートパソコンを睨みながら、


カタカタカタカタカタカタ…(超高速タイピング)


カタッ!(Enterキー強打)


ビィィィィ…(進捗度のパーセンテージが順調に上昇)


画面に「Complete!」の表示。


「ふぅ…」


なんで"ハッキング"の描写って、いつまで経ってもこんな感じなんですかね。


昔見た映画「バトル・ロワイヤル」の中でも、こんなワンシーンがありました。
あれが2000年の映画なので、15年経っても変わらないこの描写。

「ノートPCでやるの?」とか「その使いづらそうなOSなに?」とか
「進捗度の表示といい、Complete!の表示といい、丁寧な作りだな」とか
色々ツッコミどころはありますが、一番のツッコミとしては、
「そもそも人がやるの?」ということ。


HDD「ガリガリガリガリ!!」
ファン「ぶおおおおおお!!」

とかの方が余程リアリティある気がするのですが、
きっとこれだと視聴者が分かりづらいんでしょうね。

未だに「コンピュータよりも人がやった方が凄そうに見える」現実。


こんな一方で、書店のコンピュータ関連のコーナーに
平積みされているのは人工知能関連の本ばかり。

「人工知能の脅威」だったり「人間は不要」だったり、
シンギュラリティ(※)の向こう側を警鐘するようなキラーワードのオンパレード。

※シンギュラリティ…
技術的特異点(ぎじゅつてきとくいてん、英語:Technological Singularity)とは、
テクノロジーが急速に変化し、それにより甚大な影響がもたらされ、
人間の生活が後戻りできないほどに変容してしまうとされる、未来に関する仮説。
人工知能が人間の能力を超えることで起こる出来事と説明されることも少なくない。
単にシンギュラリティ(Singularity)ともいう。
未来研究において、正確かつ信頼できる、人類の技術開発の歴史から推測され得る
未来モデルの限界点を指す。(Wikipediaより)


僕らの部署では、機械学習を使ったデータ分析に取り組んではいますが、
現時点で手の届く"人工知能"は、あくまで計算機の延長、といったように感じます。

どうしても人工知能の話になると、ボードゲームの話題に寄りがちですが、
初めて人間のプロ棋士がコンピュータに敗れたとき、
その棋士の方は、一部の方々から物凄い誹謗中傷を浴びていました。

「プロ棋士なるもの、コンピュータごときに負けるとは何事か」と。


今から20年程前、多くのプロ棋士にこんな質問が投げかけられました。

「コンピュータがプロ棋士を負かす日は来る? 来るとしたらいつ?」

多くの棋士は、その経験とプライドから、
「プロ棋士が負ける日など来るわけが無い」という回答をしていましたが、
ただ一人「2015年」と予想した棋士がいました。

それが、当時、前人未到の七冠(タイトル総なめ)を達成した羽生善治さん。


まだ大人の事情もあってか、羽生さんvsコンピュータの対戦は実現していませんが、
羽生さんのコンピュータに対する価値観として、興味深い記事がありました。

(※「」内が羽生さんのコメント。以下、引用)

「なぜその手を指したのか、コンピュータの思考プロセスまではわからない。
 1秒間に百万手も読める莫大な計算力のあるコンピュータと同じ思考を、
 人間が持つことはできません。
 でも今後、一手一手を研究する中で、その過程が少しわかるようになるかも知れない。
 それは逆に、死角や盲点と言われる手をなぜ思いつかなかったのか、
 人間の思考プロセスが鮮明にされることにもなる。
 思考の幅やアイディアが広がり、将棋の可能性を指し示すことになるでしょう」
 
──より将棋を深められると。いいことばかりですか。
 
「いや、どうしても相容れられない部分もあると思います。
 人間の思考の一番の特長は、読みの省略です。
 無駄と思われる膨大な手を感覚的に捨てることで、短時間に最善手を見出していく。
 その中で死角や盲点が生まれるのは、人間が培ってきた美的センスに合わないからですが、
 コンピュータ的思考を取り入れていくと、その美意識が崩れていくことになる。
 それが本当にいいことなのかどうか。
 全く間違った方向に導かれてしまう危険性も孕んでいます」

(以上、引用)

この「美意識」という表現が、羽生さんだからなのか、
それとも昔から日本で愛されてきた将棋というゲームだからなのか分かりませんが、
とても繊細で絶妙な表現のように思います。


色々なところで論議されているように、
コンピュータは未だに感情を理解することができない、
効率だけを求めたデータ分析の間隙には、人の感情があるということ。

よくスポーツ系のマンガでも、敵役としてデータ重視のチームって出てきますよね。
大抵、最後は結局、主人公側の「努力・根性・熱血」みたいな、
「データにはない何か」によって打ち負かされてしまうオチ。

「お、おかしい…こんなことデータではありえないぞ・・・(ノートPCをカタカタ叩きながら)」


単なる「効率化」だけではない、その間隙にある「何か」に対する美徳が
ステレオタイプな「vs人工知能」観には根付いているようです。

この先入観を払拭した人、組織、企業から順に
ビジネスにおける機械学習、人工知能の活用に繋げているのは自明のこと。
当然、これらの活用においては、業務改革、構造改革に繋がることが多々。

とは言え、これらの活用は既に「当たり前」の時代になってきていると思っています。
ユーザ側は、システムの最新事例だけを追っていてもしょうがないのでは?とも。


ところで、誤解を招かぬよう、補足をしておくと、
羽生さん自身は将棋におけるコンピュータの台頭に対しては
肯定的に捉えているようです。対峙と迎合。

最後にそれを象徴する、このお言葉を拝借。

将棋がコンピュータによって完全解明されてしまったら、どうするんですか。
という質問に、羽生はケラケラ笑いながらこう答えた。

「そのときは桂馬が横に飛ぶとかルールを少しだけ変えればいいんです」