法人向けAIサービスの導入効果とは何なのか

はじめに

AIを使った法人向けサービスの企画をする機会があったのですが、企画検討を進めていくうちに、

  • AIを使うと何が嬉しいんだっけ?
  • AIの導入効果とは何か?

と、ドツボにハマってしまったことがありました。 この記事では今一度、AIの導入効果についてまとめ直し、AI導入の際にスムーズに検討が進むようにしたいと思います。

前提

  • 法人向けAIサービスに限定します。書いてて気づいたのですが、BtoCだとこの記事は当てはまらなさそうです。
  • 記事の性質上、新情報を継ぎ足して完成度を上げていくつもりです。
  • AIを考える上で無視できないのがロボットです。画像認識や音声認識がinputのI/Fとすると、ロボットはoutputのI/Fです。本記事では、データ処理をするソフトの部分に注目し、ロボットについては考察を割愛します。

参考

そもそもAIとは?

そもそも私たちがAIと呼んでいるものは何でしょうか。これについては、MLSE-Q&Aに良い回答が存在します。 これは、2018年5月17日に行われたMLSEキックオフシンポジウムのパネルディスカッションでの質問とシンポジウム終了後の参加者アンケートから抽出・再構成されたQ&Aなのですが、「Q. 人工知能、AIという言葉を使わないのはなぜですか? この研究会では現在よく世間で問われている『AIをいかに業務で使いこなすか?』という問いに対し、対象を機械学習に限定しているだけのように見えます。」という質問に対する回答で、下記に引用します。

これまで「AI」という用語はその時代時代で別個の技術を指していました。初期のAI研究では論理プログラムや探索アルゴリズム、1980年代の第2次AIブームではルールベースのエキスパートシステムなどが「AI」と称されました。現在の第3次AIブームで、これに相当するのがディープラーニングを含めた統計的機械学習です。 (中略) またAIの宿命として、技術が成熟?すると、その技術は世間ではAIとは呼ばれなくなります。機械学習も遠くない将来、AIとは呼ばれなくなると予想されます。しかし,その場合でも機械学習自体は重要なシステム開発技術の一つとして残るでしょう。

このことから、「AI」が指すものは時代とともに移り変わるため、AIを厳密に定義しようとすることに意味がないことがわかります。「AI」はバズワードで、その時々の社会の流れから帰納的に定義される、つまり私たちは「AI」が過去のものになって初めて「AI」に対する共通的な認識を獲得します。 第3次AIブーム1が始まってからしばらく経過し、現在の社会においてAIとして認知されているものの正体がはっきりしてきました。インテリジェント化が加速する ICT の未来像に関する研究会報告書2015によると、AIはこれまで考えられてきたものと合わせて下記の4つのカテゴリーに分類されます。

  • カテゴリー1:単なる制御(言われた通りにやる)

    • 温度が上がるとスイッチを入れる。下がるとスイッチを切る。
    • 洗濯物の重さで洗い時間を調整。
  • カテゴリー2:対応のパターンが非常に多い(探索や知識を使って、言われた通りにやる)

    • 探索や推論。将棋や囲碁で、決められたルールにしたがって、手を探す。
    • 知識。例えば、与えられた知識ベースを使い、検査の結果から診断内容や処方する薬を出力する。
  • カテゴリー3:対応のパターンを自動的に学習(重みを学習する)

    • 機械学習
    • 駒がこういう場所にあるときは、こう打てばよいということを学習。
    • この病気とこの病気はこういう相関があるということを学習。
  • カテゴリー4:対応のパターンの学習に使う「特徴量自体」も学習(変数も学習する) -(特徴)表現学習。ディープラーニングはこの一種

    • 駒の位置だけでなく、複数の駒の関係性をみたほうがいい。
    • こういった一連の症状が、患者の血糖異常を表し、複数の病気の原因になっているようだ。 (カテゴリー4は人間の認知機能を機械上に実現しようとするものであることから、「コグニティブ・コンピューティング」(認知的なコンピュータ計算)と呼ばれることがある。)

本記事では、AIをいずれかのカテゴリに特定することはせず、現在AI技術として括られている要素技術を列挙して、それぞれについてビジネスの応用例を見ていくことにします。

AI技術とAIの導入効果

現在のビジネス界で「AI」として認識されていると思われるAIの要素技術を分類すると下記のようになると思います。

これらの要素技術がどのようにして効果に結びつくのでしょうか。

ITシステムの導入効果

AIやデータサイエンスと言うと格好いいのですが、現場に投入される段階になると結局はITシステムの一部となります。ですので、ITシステムの導入効果を振り返ってみることにします。 ITシステムの導入効果については、事例広告ブログ by 村中明彦というブログにて良くまとまっていました。このブログによると、ITシステムの導入効果は次の3つに集約されます。

  1. 効率化・コスト削減
  2. 属人化の低減
  3. 基盤の確立

それぞれの意味は下記に引用します。

効率化とは、「今までもがんばればできていたが、IT製品を導入して、今はもっとラクに、よりよくできるようになった」ということです。コスト削減とは、「今までもできてはいたが、お金がかかっていた。しかしIT製品を導入したので、かかるお金が減った」ということです。抽象的には、効率化とは「単位投入労力あたりの成果量が増えること」であり、コスト削減とは、「単位成果あたりの投入資源量が減ること」です。 次に属人化の低減とは、「以前はある人ならできていたが、別の人にはできなかった。しかし、ITツールを導入したので、誰でもできるようになった」ということです。 (中略) つまり、基盤の確立とは、「将来、何らかの良い状態を実現させるための、前段階の基礎固め」です。 (中略) 社内業務に、「不可能」はありません。ERPがなくても、財務諸表は作れますし、SFAがなくても営業はできますし、CRMがなくてもマーケティングはできますし、ビデオ会議がなくても出張すれば遠くの人には会えます。青色LEDがない以上、LED信号灯は作れないっていうような不可能はないですよ。 つまり、昔でも何とかできてた。それがIT製品の導入で、よりよく、よりラクにできるようになった、ということです。

ITシステムは社内業務を効率化するものであり、青色LEDや重機などとは違って「できない」を「できる」に変えるものではないと論じています。「人でも出来る」を「機械でもっと~に出来る」に変えるものだということです。

ついでに、システムエンジニアならば誰もが読んだことのある(?)ラノベなれる!SE16 2年目でわかる?SE入門のあとがきにて、次のような一文があります。

ITの本質は自動化です。日常のちょっとした不便をプログラムで解消する。全てのモチベーションはそこが起点です。

以上から、ITシステムの本質は自動化であり、今までのIT技術「できない」を「できる」に変えるものではなく、「人でも出来る」を「機械でもっと~に出来る」ようにするという効果を持っていました。これはAIシステムでも変わらない効果です。

AIシステムの導入効果

では、AIによって「できない」を「できる」ようにした新しい導入効果はあるのでしょうか。 人工知能システムのプロジェクトがわかる本 企画・開発から運用・保守までという書籍に、AIシステムの最終的な目的の代表例として下記の4つが挙げられていました。

  • 売上向上
  • コストダウン
  • 品質向上
  • リスク低減

書籍中ではテーマパークを例にして、それぞれの例を示しています。

  • 売上向上の例……顧客ごとにアトラクションやグッズのおすすめを提示して、顧客の単価を上げる(購買予測)
  • コストダウンの例……グッズショップの在庫管理と追加発注を自動化して、店員の作業時間を 減らす(売上予測)
  • 品質向上の例……顧客がいつでも問い合わせできるチャットサービスを用意することで、顧客満足度を上げる(質問応答)
  • リスク低減の例……パーク内でのトラブルをいち早く検知し、トラブルの悪影響を減らす(トラブル検知)

AIによって検知や予測といった新しいことが出来るようになりましたが、例を見るとわかるように、元々人手で出来ていたことを代わりにAIが代行しているだけです。つまり、AIもまた「できない」を「できる」に変えるものではなく、今までのITシステム同様に「人でも出来る」を「機械でもっと~に出来る」ようにするだけだということがわかります。

それでもAIのおかげで今まで解けなかった課題にも対処できるようになりました。ITシステムの導入効果は変わりませんが、解決できる課題の種類が増えたという見方が正しいのでしょう。すなわち、AIの登場によってビジョンやKGIは変わらないけど、KPIを達成する手段が豊富になったということです。

ここまでをまとめると、AIシステムの導入効果は下記のようになります。基盤の確立はAIシステムの目的でないと思われるので除外しました。

  • コスト削減
  • (お金を払っても賄えない)時間削減
  • 属人化低減
  • 品質向上
  • リスク低減
  • 売上向上

と、まとめたのですが、実はAIシステムにできそうなことがもう一つあります。それは「大容量データから有効なビジネスパターンを発見する」ことです。これについては次々章で考えてみたいと思います。

AI活用事例

以上の導入効果と要素技術を結びつけ、どのような活用事例があるか調べてみました。 ただし、『』内の分類については、私が各事例から推測して当てはめていますので正しいかはわかりません。分類は(分類/回帰/クラスター分析/主成分分析/強化学習/探索や推論/最適化アルゴリズム)のどれかです。

※随時増やしていきます

AIで何かできないか考えるときに、効果×技術は参考になると思います。

仮説構築の手法としてのAI活用

現在はデータサイエンスという言葉に含められてしまっていますが、少し前はデータマイニングと呼ばれるものが流行っていたように記憶しています。マーケターのためのデータマイニング講座:第1章 CRMとデータマイニングの必要性 (2/2)にてデータマイニングの意味が考察されています。

 データマイニングの定義はこれまで多数紹介されていますが、多少表現の違いはあってもほとんどが「大容量データから有効なビジネスパターンを発見する」といった意味合いのもので、「大容量データ」と「発見」というキーワードが共通しているように見受けられます。

データマイニングは回帰や分類とは異なり、変数間の構造や関係性を分析し、新たな仮説の発見を目的としています。

もともと物理学や化学などでは、物質のミクロな構造や組成から、変数間に存在する相関および因果関係についての仮説を構築し、力学的なモデルでそれらを説明してきました。社会科学においても心理や経済における変数間の相関などをモデルに落として説明しようとしてきました。

そして、大容量データをハンドリングできるようになった現在では、ビジネスにおいても有用なパターンやルールを抽出することができるようになりつつあります。ただし、データマイニングと上記の統計手法は意味合いが異なります。統計解析手法とデータマイニングの違いはマーケターのためのデータマイニング講座:第1章 CRMとデータマイニングの必要性 (2/2)に解説があります。

 データマイニングという概念が紹介される以前は、データ分析といえば統計解析手法を用いたものでした。データマイニングと統計が厳密に異なるものかどうかは専門家の議論にゆだねるとして、実務的な解釈では、統計が仮説検証のための手法であるのに対し、データマイニングは仮説構築の手法とされています。

 これが「発見型」といわれるゆえんで、例えば「学歴が高い人は低い人より給与が高い」という仮説を立て、それが本当かどうかを検証するのが統計的アプローチなら、給与額に影響を与える要因を、何の偏見も持たずに白紙の状態から見つけ出すのがデータマイニングといえるでしょう。有名な「ビールと紙オムツ」の併買傾向は、仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

つまり、科学では物質の構造や人間の心理といったものに基づいて演繹的に仮説を構築していたのに対し、データマイニングでは大量のデータから帰納的に仮説を構築します。仮説の検証の手法は両者で違いはないと思われます。

では、「大容量データから有効なビジネスパターンを発見する」ことはAIの導入効果たり得るのでしょうか。

この疑問に一石を投じたのが、統計モデリングの「解釈」を価値にする営為は斜陽なんじゃね?という話です。

さて,この記事におけ概念をそれなりに定義しておきます. すなわち,主要な統計モデルと,その「説明」,統計モデルで得られた結果の「解釈」を以下のように定義します.

  • 統計モデルは「データ」を用いて何らかの結果を返す構造である
  • 統計モデルによる「説明」とは,データの特徴を何らかの指標(平均の差,回帰係数,あるいはp値など)によって見出すこと
  • 統計モデルで得られた結果の「解釈」とは,統計モデルによる「説明」がどのようなメカニズムでもたらされたかを,統計モデルの外の情報を含めて推論すること

例えばt検定の例を挙げます2.A群とB群との間に差があるかどうかを「説明」します.そして差があった,または差があるとは言えなかった3という「説明」に対して「なぜこの結果が得られたのか」ということを想像や推論で補完する,というプロセスを「解釈」と呼ぶことにしよう,という方針です.

(中略)

タイトルの通り「統計モデルによる『解釈』を"メインの"価値にする」という営為は,個人的には価値があるとはいえない将来性のある行動とはいえないと考えています.

根拠は「『解釈』の妥当性を客観的・定量的に評価できない」ことが大きいです. (中略) こうした正しいかどうかを評価できない「解釈」を価値にしたモデリングは以下の

  • 丁寧に計画されていないデータ分析をしても何かしら「意味があるように」見せられる
  • 顧客の曖昧な課題に曖昧なまま答えられる

という分析側に都合が良いことはある一方

  • アドホックな解析しかできない(≒ 継続的な収益源とならない)
  • 顧客の課題を改善する意思決定を,本当にもたらすかどうかを評価できない
  • 曖昧な顧客の課題が明らかにならないままクローズする

という都合の悪さがあり,解釈ワークに時間を割くわりにはコスパが良くないというわけです.

一言でまとめると、「予測や分類のメカニズムをデータ外の情報を用いて推測しても、正しさが証明できないので、価値たり得ないのでは?」ということです。

科学をやっていた身としては、メカニズムの解明のためにデータマイニングで仮説を構築して、仮説を検証できるデータを集めて検証して、また新たな仮説を構築して、と考察を深めていけばいいのではないかと思うのですが、私たちがいま取り組んでいるのはビジネスです。ビジネスでは予算も時間もないので仮説に対して何度も検証していられません。しかも上司からは早く結論がほしいと催促されます。結局、データマイニングで構築した仮説は検証されることはないでしょう。したがって、「統計モデルによる『解釈』を"メインの"価値にする」ことに否定的であることは理解できます。

ただ、そもそもビジネスの判断や予測なんて必ず当たるなんてものではありません。経営者にとっては、少しでも経営の判断材料になるなら、という思いで『解釈』を価値と感じることはあると思います。 あとは、往々にして人はデータでは動かないので、データの解釈を以て「納得感」を持ってもらうというのにも使えるのかなと思います。

ちなみに『説明』を越えて『解釈』を売りにしていると思わしきサービス・技術もいくつか見受けられます。

ただやっぱり、現状のビジネスでは、データマイニングは「サイエンスではない」と思います。再び、マーケターのためのデータマイニング講座:第1章 CRMとデータマイニングの必要性 (2/2)から引用して終わりにしたいと思います。

データマイニングは分析スキルが必要とされない手法である  こう断言するのは間違いですが、データマイニングの目的をビジネスプラクティスの向上と考えれば、方法論より結果が重要となるのは事実です。極言すれば、どんなに高度なアルゴリズムを駆使しようが、ビジネスにおいてアクション可能な有意義な結果が出なければマイニングを行う価値はありません。

 その意味においてはITや分析のスキルよりもビジネスセンスに依存する部分が大きいでしょう。分析結果を統計的観点から評価するにはかなりの知識が要求されますが、ビジネスの理解が十分なら、現実と照らし合わせたうえでの評価が可能です。データマイニングツールには最先端の高度なアルゴリズムが搭載されていますが、最良の結果を最短で得るためにはアルゴリズムでなくビジネスの知識がより重要で、ツールにはこのユーザーの知見を分析に反映しやすいデザインが施されていますので、スキルの要らない手法という位置付けが与えられているのもうなずけます。

おわりに

この記事では法人向けAIサービスの導入効果について調べたことをまとめました。

願わくばデータドリブン文化が醸成されて、データマイニングで構築した仮説を積極的に検証するのが当たり前のことになりますように。


  1. 松尾豊,『第1回:人工知能の概要とディープラーニングの意義』,http://ymatsuo.com/DL.pdf

  2. 最適化アルゴリズム教師なし学習と言っていいのでしょうか。この分類はill-definedな気がするので、何か分類方法があると嬉しいです。

SIからの脱却?サービス化の意義とは

はじめに

少子化による人材不足や働き方改革による残業の低減、顧客のIT投資節約など複数の要因が重なって、SI業界は収入源を人月商売以外で模索しています。

少々過激なタイトルですが、次の記事にてSIの問題が挙げられています。

課題山積のSIビジネスはやがて崩壊し、SIerに将来はない。

  • IT分野の低コスト化が求められるようになったこと
  • クラウドで提供される業務システムが増え、受託SIへの需要が減ったこと
  • SIerの人材が不足し始めていること
  • 求められる技術レベルが高くなっていること
  • IT分野の低コスト化が求められるようになったこと

これは実感があります。 特にメーカー系SIer十八番であるハードが売れなくなっているのは数字に出ています。 また、SaaSなどのサービス利用によってコストを下げようとする動きがある一方で、データサイエンスなどはコア業務と位置づけ、内製化する動きが見られます。

  • クラウドで提供される業務システムが増え、受託SIへの需要が減ったこと

これは微妙な感じです。 SaaSなどのサービス利用は増えているものの、ノウハウが無いためサービス導入を受託したり、カスタマイズで個別SIが入るというのはまだまだある印象です。

  • SIerの人材が不足し始めていること
  • 求められる技術レベルが高くなっていること

これは実感があります。 IoTやFintech、ブロックチェーンなど様々な技術が生まれ受注のチャンスである一方、必要な技術が細分化され、スキルがマッチする人材を確保することが難しくなっています。外注頼りのSIerは専門技術を持っている要員を抱え込んで確保してるところもあるでしょう。

こういった事態を打開すべく、SIを脱却し、サービスに転換する企業も見られます。

SIがサービスになることで、ユーザーは必要なときに必要な物を、使う分だけの費用で利用できるという恩恵を受けられます。

この記事では、SIと比較して、サービスがどのようなメリットを持つのか考えてみたいと思います。 技術視点ではいくらでも違いがあると思いますが、今回はサービスを提供する側のビジネス、経営視点で考えてみたいと思います。 MECEを意識せず、ブレスト的に列挙したいと思います。

定義

  • SI 顧客の企業課題を受託のITシステム開発で解決すること。

  • サービス 提供側でリソースを持ち、顧客には利用権を与えて価値を提供すること。

サービスのメリット

技術を非公開にできる

SIだとソースコードも納品することが多く、ノウハウが他社に盗まれてしまう恐れがありました。一方でサービスだと、ソースコードは公開しませんので、技術を秘匿することができます。 同様に運用報告もありませんので、効率的な運用のノウハウを盗まれることもありません。

価格を原価でなく価値に付けられる

SIではハードやソフト、人件費全て明細で確認されてしまいます。顧客の情報部門に目利きがいると、原価を推定され値下げを要求されてしまうことがあります。 サービスでは原価の構成を開示しませんので、原価をもとにした価格交渉をされにくいです。

大量展開でコストメリット

SIの場合、顧客ごとに資材や人を調達するので、それぞれ製造原価がかかります。 サービスの場合は、リソースを自社持ちにするため、異なる顧客に対して同じ基盤を使用でき、コスト低減を図ることができます。

標準化によるコストメリット

サービスでは全ての顧客に共通の基盤で対応するため、使用する技術を揃えることができます。これにより人材の確保や教育のコストが下がります。

固定収入が得られる

SIは毎回受注競争がありますが、サービスは一度導入してしまえば、継続して収入が得られます。 乗り換えにもコストが発生しますし、顧客の予算確保は年単位なので、予算検討時期に乗り換えられないようにアピールさえすれば何とか継続収入を得ることができます。

運用ノウハウが溜まるし、活かせる

同一のサービスを同一の運用部署で運用するため、ノウハウを一ヶ所で管理でき、しかもきちんと活かすことができます。SIのようにノウハウが別システムでは役に立たないものになるということはありません。

サービスのデメリット

必ず顧客が付くわけではない

サービスは受託ではなく、開発、すなわち投資案件になります。売れるか確定しないものを作るのにはリスクがあります。

値上げが難しい

SIの場合、一個一個案件が独立しているので請求費を変えることができます。 サービスの場合、顧客ごとに価格を変えたり、継続利用しているところに途中で価格を変更したりするのが難しいです。 エンハンスも追加で料金をとるのではなく、今まで儲けた分で、となりやすいです。

SIよりも安くしないと売れない

顧客側がSIに対して慣れていると、サービスの中身をSIで実現したときの費用を見積もられます。SIと比較してサービスの方が高くつく場合、うまく説明出来ないと結局SIにしてくれと言われてしまいます。

価格決めが難しい

サービスでは価値に価格がつきますが、前例の無いサービスの場合、提供側も買う側も価格の妥当性を判断できません。保守的な顧客だと、価格が妥当だとわかるまで、導入を控えられる場合があります。

何に従量課金するのかメニュー整備が難しい

単純に月額なのか、通信量なのか、使用回数なのか、値付けの方法がたくさんあり、検討に時間がかかります。 (こういう所こそ理系院卒の数理知識の使いどころだと思うんですが、経営者には認知されていないようです)

顧客規模の格差を吸収するのが難しい

使用量が多い顧客と少ない顧客で課金が同じで良いのか、という問題があります。

廃止ができない

儲からない場合はサービス廃止も必要なのですが、利用者がいる限り撤退が難しいです。 撤退する場合は、類似サービスの紹介といった保証が必要になる場合があります。

カスタマイズが難しい

個別にカスタマイズすると、コストメリットが受けづらくなります。しかし、顧客によっては業務プロセスを変えることが出来ないため、カスタマイズは必須という場合があり、その場合は失注になります。

顧客の競合が顧客にならない場合がある

サービスの内容によりますが、提供物が顧客の差別化戦略の対象になっている場合、競合と同じものを使わない、ということになり、業界全体を囲めない場合があります。

料金固定のため入札対応が難しい

公共の顧客の場合、受注は入札になりますが、価格競争となった場合、サービス価格を変えることが難しいです。 また、利用料が変動するため、公共のように予算がガチガチに決まっている場合は利用料が読めず、導入を見送る場合があります。

サービス化すると良いもの

まとめると、「顧客それぞれが持っていた共通のリソースを提供側で集約でき、かつ運用において独自のノウハウや技術があるため、それらを極端に効率化できるもの」または「業界や規制で手順が決まっており、各社共通になっている業務のプラットフォーム」はサービス化するとうまく行きそうです。

AWSはサーバリソースを集約し、独自の技術で運用することで効率化しています。

TWX-21 Web-EDI/BBサービス業界標準のデータ交換手順を実装したプラットフォームです。

GCP業務支援システム tsClinical DDworks21は治験の実施計画立案から終了手続きまでサポートするシステムで、治験はGCP省令によって厳しく手順が決められています。

米国のSaaSはもともと業務プロセス特化のソフトウェアを単純にSaaS化したものが多い印象です。(会計ソフトやワークフローシステムなど) https://www.americabu.com/saas

一方でMicrosoft OfficeAdobeサブスクリプションモデルを導入していますが、上記のようなメリットがないように思えます。 これはベンダのメリットというより、ユーザのメリットの影響が大きいからです。メリットがあるから、というよりはやらないとデメリットになるからという状態になっているのだと思います。

BPO1までやるか

サービス化の本質は自己リソースを効率的に運用して利幅を稼ぐことなので、時にはリソースを自社で抱えることが必要になります。

例えば、プラットフォーム的な事業をしている企業を買収し、IT技術で運用を効率化したり、共通業務に特化した合弁会社を設立するなどです。 特に、最近流行のAIや機械学習はコスト削減に強いため、AIシステムは外販するよりも、内部で使った方が良いと思います。

一方で、リソースを抱えるということは在庫リスクが生じるということなので、効率化によほどの自信があるか、体力のある大企業でしか、事実上は不可能でしょう。

あえてSI

無理にサービス化するのではなく、ソリューション事例をメニュー化し、カスタマイズパターンをある程度用意することで導入スピードを早く、コストを低減する方法もあります。 毎回御用聞きをするのではなく、ある程度形になっているものから選ぶという手法です。

これに取り組んでいるのが日立製作所で、過去の事例をLumadaユースケースとして用意しています。

Lumadaとは

日立では、多岐にわたる業種・業務のノウハウや知見を、さまざまな分野のお客さまとの協創で迅速に活用するために、Lumadaのユースケースとして凝縮・蓄積しています。 Lumadaユースケースとは、お客さまと協創で新たな価値の創出を実現したデジタルソリューションをモデル化したものです。それぞれの>ユースケースには、データからどのように価値を創り出したのか、人工知能やアナリティクスなどにどのような技術を適用したのか、といった要素が整理されています。

おわりに

この記事ではサービスのメリット、デメリットについて列挙しました。 サービスはデメリットはあるものの、本質的に無駄を削減するものでもあるので、これからはどんどんサービスに転換していくのではないでしょうか。

おまけ

記事とは全く関係ないですが、面白かったものをここに残しておきます。

大手SIerの役割とは http://blogs.itmedia.co.jp/noubiz/2013/09/sier.html

富士通株式会社 国内SIビジネスの強みと展望について http://www.irwebcasting.com/20180709/1/082b64521f/mov/main/index.html


  1. ビジネス・プロセス・アウトソーシング https://ja.m.wikipedia.org/wiki/ビジネス・プロセス・アウトソーシング

データサイエンティストの要件

データサイエンティストに必要なもの

Data Science Online Course

東京大学グローバル消費インテリジェンス寄付講座主催のData Science Online Courseは社会人技術者やマーケティング担当者、情報分野以外の研究者等を対象者とした東大のデータサイエンティスト/未来のCMO育成講座の社会人向けオンラインコースです。

オンラインコースの第一回はデータサイエンスの説明だったのですが、その中ではデータサイエンティストは下記のように説明されていました。

ビジネスの課題に対して、統計や機械学習(数学)とプログラミング(IT)スキルを使って、解決する人

参考としてリンクが付記されていました。データサイエンティストのスキルセットのイメージと解説が記載されています。

image.png

解説によれば、データサイエンスとは、高度な数学と統計、プログラミングおよびモデリング技術とを組み合わせ、エンタープライズクラスのツール、テクノロジーアーキテクチャ(すなわちコンピュータサイエンス)を活用することですが、それらの能力だけでは不十分で、ビジネスドメインを深く理解することによって、立てた仮説を実際の現場に適用することができるのだ、とのことです。

次のリンクにはデータ分析のプロセスの図が掲載されています。 image.png 講座では、重要度が高いのはビジネス理解であり、モデリングだけしていてはいけないということを強調していました。

データサイエンティスト協会

データサイエンティスト協会のプレスリリースでは、データサイエンティストを下記のように定義しています。

「データサイエンティストとは、データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」

こちらにも似たような図が登場します。3つの丸の一番上に「ビジネス力」が来るように、ビジネス力はかなり重視されていることがわかります。 キャプチャ.PNG

データサイエンティストとは

データサイエンティストの定義はどちらもほぼ同じ定義ですが、どちらも述語が「ビジネス課題を解決する」になっています。つまり、ただの統計屋でなく、ただのエンジニアでもなく、ただの企画屋でもない、これらの力を組み合わせてビジネスの課題解決まで導ける人がデータサイエンティストということになります。

キャプチャ.PNG

ビジネスの世界で生きていく以上は、自分は分析だけできればいい、なんてわけにはいかないようです。

【随時更新】AIの定義について引用したい文献

はじめに

分析の案件を受注する際にお客様から「AI(人工知能)って結局なんなの?何ができるの?」と聞かれることがしばしばあります。本来は自社のポリシーとして、「株式会社□□ではAI(人工知能)とは○○と考えています」と定義すべきですが、このような定義がない会社も多いと思います。かくいう私の会社もAIについて統一的見解を示していません。したがって、それぞれの案件担当者がお客様に説明をするのですが、このとき個人的な考えを伝えても説得力もありませんし、細かいことを聞かれても答えられません。そこで、AIの定義を説明する際に引用できる資料についてまとめたいと思います。

引用したい文献

AI(人工知能)とは

個人的にはディープラーニングG検定の公式テキストから引用するのが良いと思います。東京大学の松尾豊教授が理事である一般社団法人日本ディープラーニング協会が出しているテキストで、検定の教科書です。ディープラーニングについてさまざまな領域のエンジニアや研究者、学生などに技術を習得させることが目的であり、過度な宣伝などはなく、AIについて冷静な記述がなされています。このテキストによればAIは「推論、認識、判断など、人間と同じ知的な処理能力を持つ機械(情報処理システム)」となります。

人工知能」が、推論、認識、判断など、人間と同じ知的な処理能力を持つ機械(情報処理システム)であるという点については、大多数の研究者の意見は一致しているといってよいでしょう。しかし、「人工知能とは何か」については、専門家の間でも共有されている定義は未だにありません。なぜなら、そもそも「知性」や「知能」自体の定義がないため、「人間と同じ知的な処理能力」の解釈が、研究者によって異なるからです。

浅川 伸一,江間 有沙,工藤 郁子,巣籠 悠輔,瀬谷 啓介,松井 孝之,松尾 豊. 深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト.

人工知能学会も似たような説明をしていますが、こちらはいまひとつ要領を得ません。

人工知能」とは何だと思うでしょうか?まるで人間のようにふるまう機械を想像するのではないでしょうか?これは正しいとも,間違っているともいえます.なぜなら,人工知能の研究には二つの立場があるからです.一つは,人間の知能そのものをもつ機械を作ろうとする立場,もう一つは,人間が知能を使ってすることを機械にさせようとする立場です(注1).そして,実際の研究のほとんどは後者の立場にたっています.ですので,人工知能の研究といっても,人間のような機械を作っているわけではありません.

(社) 人工知能学会(https://www.ai-gakkai.or.jp/whatsai/AIwhats.html).

総務省情報通信白書では現状を分析し、あえてAIについて定義を置いていません。

例えば、人工知能(AI)を「人間のように考えるコンピューター」と捉えるのであれば、そのような人工知能(AI)は未だ実現していない。また、現在の人工知能(AI)研究と呼ばれるほぼ全ての研究は人工知能(AI)そのものの実現を研究対象としていないことから、人工知能(AI)とは各種研究が達成された先にある、最終的な将来像を表現した言葉となる。ここで例示した、「人間のように考える」とは、人間と同様の知能ないし知的な結果を得ることを意味しており、知能を獲得する原理が人間と同等であるか、それともコンピューター特有の原理をとるかは問わないとされる。また、人工知能(AI)とは「考える」という目に見えない活動を対象とする研究分野であって、人工知能(AI)がロボットなどの特定の形態に搭載されている必要はない。 このような事情をふまえ、本書では人工知能(AI)について特定の定義を置かず、人工知能(AI)を「知的な機械、特に、知的なコンピュータプログラムを作る科学と技術」と一般的に説明するにとどめる。

総務省 平成28年版 情報通信白書(http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h28/html/nc142110.html).

AI(人工知能)は何をする?

それでは,実際の研究ではどのようなことをしているのでしょうか?人工知能の研究には,人工知能研究で紹介しますようにいろいろな分野があります.ここでは,この中から「推論」と「学習」を取り上げます.

「推論」とは「知識をもとに,新しい結論を得ること」です. 「学習」は何か機械が勉強をする感じがしますが,ここでは「情報から将来使えそうな知識を見つけること」です.

(社) 人工知能学会(https://www.ai-gakkai.or.jp/whatsai/AIwhats.html).

おわりに

AIの統一的な定義はありません。このことはMLSEキックオフシンポジウムのアンケートの回答が的を得ています。

またAIの宿命として、技術が成熟すると、その技術は世間ではAIとは呼ばれなくなります。機械学習も遠くない将来、AIとは呼ばれなくなると予想されます。しかし,その場合でも機械学習自体は重要なシステム開発技術の一つとして残るでしょう。 機械学習工学研究会

AIは時代時代によって指すものが変わってきました。最初は簡単なルールベースのアルゴリズムから始まり、最近はディープラーニングを指すようにまでなりました。AIという言葉に惑わされず、中身に注目するようにしたいですね。

等価原理の数学的意味

アインシュタイン相対性理論に要請した原理として等価原理がある。等価原理は例えば内山の教科書に次のように解説してある。


重力内の任意の任意の点をとりかこむ無限小の4次元領域を考えるとき、そこに特別な座標系を求め、これを基準にとるとき、この無限小領域内が無重力地帯となるようにすることが必ずできる。これを等価原理(principle of equivalence)という。
引用元:内山 龍雄 (2011年,第25刷)『相対性理論 (物理テキストシリーズ 8)』岩波書店 p.116-117

これを幾何学的に述べると次のようになる。

幾何学では、或る座標系を採るとき、1点Pにおける$\Gamma$がすべて0になる場合、この座標系はPにおいて測地的(geodesic)であるという。また、この座標系をPにおける測地座標系、あるいは測地系(system of geodesic coordinate)という。したがって等価原理幾何学的に言えば、任意の世界点で測地系を設けることが必ずできるということになる。
引用元:内山 龍雄 (2011年,第25刷)『相対性理論 (物理テキストシリーズ 8)』岩波書店 p.146-147

"$\Gamma$"レヴィ・チヴィタ接続のことで、"1点Pにおける$\Gamma$がすべて0になる"とは、接続$\Gamma^\lambda_{\mu\nu}$のすべての成分が点Pでゼロになることをいう。
\begin{align}
\Gamma^\lambda_{\mu \nu}(P)=0 
\end{align}

さて、では具体的にどのようにすれば点Pにおいて$\Gamma$をゼロにできるか。これについてはEMANさんのサイトに解説記事がある。

EMANの物理学・相対性理論・局所直線座標系

今、座標が$(x,g)$で張られているとする。点Pの座標を$c^\mu$とする。座標$(x,g)$から$(x',g')$への座標変換でレヴィ・チヴィタ接続は次のように変換される。 

\begin{align}
\Gamma_{\mu\nu}^{\lambda} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} \frac{\partial x^\lambda}{\partial x'^\gamma} \Gamma'^{\gamma}_{\alpha\beta} + \frac{\partial x^\lambda}{\partial x'^\rho} \frac{\partial^2 x'^\rho}{\partial x^\mu \partial x^\nu}  
\end{align}

これに次の座標変換を施すと、$\Gamma'$は点Pで$0$になる。

\begin{align}
x'^\mu = x^\mu + \frac{1}{2}\Gamma^\mu_{\alpha \beta}(P) (x-c)^\alpha (x-c)^\beta
\end{align}

これで点Pで無重力にすることができた。

 

さらに線形変換$x''^\mu = a^\mu_{ \ \ \nu} x'^\nu$を施した$\Gamma''$も点Pでゼロになる。これを利用して計量を変換しよう。$x'^\mu = (a^{-1})^\mu_{ \ \ \nu} x'^\nu=b^\mu_{\ \ \nu} x''^\nu$と書き直すと計量は次のように変換される。

\begin{align}
g''_{\mu\nu} = \frac{\partial x^\alpha}{\partial x'^\mu} \frac{\partial x^\beta}{\partial x'^\nu} g'_{\alpha\beta} = b^\alpha_{\ \ \mu}b^\beta_{\ \ \nu}g'_{\alpha\beta} = (B^{\top}G B)_{\mu\nu}
\end{align}

 ここで計量とテンソル$b$を行列とみなして表した。成分の対応は次のようになる。

\begin{align} G_{ij} = g_{ij} \end{align}

\begin{align} B_{ij} = b^i_{\ \ j}  \end{align}

 点Pでの値を考える。$G(P)$は対称行列なので直交行列$R$で対角化できる。

\begin{align} R^{\top} G(P) R = \Lambda \end{align}

 $\Lambda = \mathrm{diag}(-\lambda_0,\lambda_1,\lambda_2,\lambda_3)$である。

 

さらに$C=\mathrm{diag}(\lambda_0^{-1/2},\lambda_1^{-1/2},\lambda_2^{-1/2},\lambda_3^{-1/2})$を用いて単位行列に変換できる。

 \begin{align} C^{\top} R^{\top} G(P) R C =\mathrm{diag}(-1,1,1,1) \end{align}

 

よって$B=RC$とすれば計量$g''$は点Pで$\mathrm{diag}(-1,1,1,1)$となる。

以上の結果より、座標変換で点Pで$g=\mathrm{diag}(-1,1,1,1), \Gamma_{\mu \nu}^\lambda=0$とできる。

 

また、正規座標における計量のテイラー展開も同じことを表している。

 \begin{align} g_{\mu\nu} =\mathrm{diag}(-1,1,1,1)_{\mu\nu}-\frac{1}{3}R_{\mu\alpha\nu\beta}x^\alpha x^\beta +\mathcal O (x^3) \end{align}

引用元:酒井 隆(1992)『リーマン幾何学裳華房

 

さて、話題を変えよう。

リーマン幾何学での等価原理の数学的意味を見てきたわけだが、そもそもリーマン幾何学のどの時点で等価原理が導入されたのか考えてみる。

リーマン多様体の条件は2つあった。

  1. 計量条件:$\nabla_\rho g_{\mu\nu}=0$
  2. 捩率なし:$\Gamma_{\mu\nu}^\lambda = \Gamma_{\nu\mu}^\lambda$

一つ目の条件は

ベクトルの大きさは平行移動に対して不変である

引用元:内山 龍雄 (2011年,第25刷)『相対性理論 (物理テキストシリーズ 8)』岩波書店 p.144

 を表している。これはベクトルを平行移動したときに、ベクトルの大きさが時空の曲がりの効果以外で、変化しないことを要請している。これは物理を記述する上でもっともらしいと言えるだろう。

 

接続に関係する二つ目の条件を確認してみよう。リーマン多様体であることは仮定しないでおき、多様体に計量$g$と線形接続$\Omega$を導入する。共変微分は次のように定義される。

\begin{align} \nabla_\mu V^\nu= \partial_\mu V^\nu - \Omega^\nu_{\mu \lambda}V^\lambda \end{align}

座標が$(x,g)$で張られているとする。座標$(x,g)$から$(x',g')$への座標変換で接続は次のように変換される。 

\begin{align}
\Omega_{\mu\nu}^{\lambda} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} \frac{\partial x^\lambda}{\partial x'^\gamma} \Omega'^{\gamma}_{\alpha\beta} + \frac{\partial x^\lambda}{\partial x'^\rho} \frac{\partial^2 x'^\rho}{\partial x^\mu \partial x^\nu}  
\end{align}

 等価原理が成り立つか、次の座標変換をしてみよう。

\begin{align}
x'^\mu = x^\mu + \frac{1}{2}\Omega^\mu_{\alpha \beta}(P) (x-c)^\alpha (x-c)^\beta
\end{align} 

 すると点Pで次の式が成り立つ。

\begin{align}
\Omega_{\mu\nu}^{\lambda} (P) = \Omega'^{\lambda} _{\mu\nu}(P)  + \Omega_{(\mu\nu)}^{\lambda} (P)
\end{align} 

接続の反対称成分が残ってしまった。

 \begin{align}
\Omega'^{\lambda} _{\mu\nu}(P) = \Omega_{[\mu\nu]}^{\lambda} (P)
\end{align} 

 さらに座標変換してこの成分をゼロにできるだろうか?

座標変換での接続の変換を考えると、接続の反対称成分は次の変換をする。

\begin{align}
\Omega_{[\mu\nu]}^{\lambda} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} \frac{\partial x^\lambda}{\partial x'^\gamma} \Omega'^{\gamma}_{[\alpha\beta]} 
\end{align}

 これはテンソルの変換になっている。したがって、接続の反対称成分はテンソルである。

$\Omega$が計量条件を満たすとして、接続を分解する。

\begin{align}\Omega_{(\mu\nu)}^{\lambda} =\Gamma_{\mu\nu}^{\lambda} \end{align}

\begin{align}\Omega_{[\mu\nu]}^{\lambda} =T_{\mu\nu}^{\lambda}\end{align}

$T$を捩率という。捩率はテンソルなので、座標変換で$0$にできない。したがって、等価原理が成り立つためには捩率が全時空で$0$になることが必要である。

また、全時空で$T_{\mu\nu}^{\lambda}=0$が成り立つとき$\Gamma_{[\mu\nu]}^{\lambda}$はレヴィ・チヴィタ接続になる。

\begin{align}\Gamma_{\mu\nu}^{\lambda}=\frac{1}{2}g^{\lambda \rho}(\partial_\mu g_{\rho \nu} +\partial_\nu g_{\rho \mu} -\partial_\rho g_{\mu \nu}) \end{align}

以上の考察より、等価原理が成り立つためには$\Omega_{[\mu\nu]}^{\lambda} =\Omega_{[\nu\mu]}^{\lambda} $が必要十分であることがわかった。

 

よってリーマン多様体の条件のうち、一つ目は物理量が外力を受けない限り、影響を受けるのは時空の曲がりのみであることを要請し、二つ目は等価原理を要請している。 

ボソン弦のT-双対性

閉弦の質量スペクトル

\begin{align}
m^2 = \frac{n^2}{R^2}+\frac{w^2 R^2}{\alpha'^2}+\frac{2}{\alpha'}(N+\tilde N-2)
\end{align}
よりR\rightarrow 0でも軽くなる状態が存在する。これはKK粒子を持つ通常の場の理論には見られないことである。質量スペクトルは

\begin{align}
R' = \frac{\alpha'}{R} ,\quad n' = w,\quad w' =n
\end{align}
の変換の下で不変である。この変換を(8.2.7)に行うと

\begin{align}
\label{momentum_switch}
p'_L = p_L ,\quad p'_R = -p_R
\end{align}
となることがわかる。
そこで次のような場を定義する。

\begin{align}
X' = X_L(z)-X_R(\bar z)
\end{align}
この負の符号によって式(\ref{momentum_switch})が実現される。X'Xの定数部分は異なってしまうが、理論のスペクトルを決める\alpha_nなどはすべてX微分から構成されるので問題はない。したがってXX'の理論はパラメータの変換の下で等価になることがわかる。これをT-双対性という。

次に開弦のT-双対性を考える。
開弦の場合も

\begin{align}
X' = X_L(z)-X_R(\bar z)
\end{align}
の理論はスペクトルを変えない。この変換は弦の境界条件を変える効果がある。開弦っはz平面の上半平面で表された。z = x+iyとかくとy=0,\inftyが開弦の境界であった。これより

\begin{align}
\partial_x X =& \partial_x(X_L(x+iy)+X_R(x-iy))\\
=&\partial_y(-iX_L(x+iy)+iX_R(x-iy)) \\
=&-i\partial_y(X_L(x+iy)-X_R(x-iy))\\
=&-i\partial_y X'
\end{align}
となることがわかる。したがってT-双対変換は開弦の境界条件を変える。
さらに端点間の距離を求めてみよう。

\begin{align}
X'(\pi)-X'(0) =& \int dX' \\
=&\int dz \partial X'+d\bar z  \bar\partial X'\\
=&\int dz \partial X-d\bar z  \bar\partial X\\
=&2\pi \alpha' p\\
=&2\pi \alpha'\frac{l}{R}\\
=&2\pi lR'
\end{align}
ここで\partial X' = \partial X,\quad \bar\partial X' = -\bar \partial Xと運動量の定義(8.2.6)とKK運動量p=l/R,\quad l\in \mathbb zを用いた。これはT-双対な半径R' = \frac{\alpha'}{R}の円周に巻き付いていることを示している(他の次元の方向にはNeumann境界条件が課されているので、端点がくっついて閉じているわけではない)。
つまり、弦はコンパクト次元X'軸のX'=\mathrm{const}に端点をもつ。つまり、コンパクト化された時空間Xの中を泳いでいた開弦の理論は、X'=\mathrm(const)に端点を持つ開弦の理論と等価であるのだ。この弦の端点が乗っている物体こそがD-braneである(厳密にはコンパクト化された時空間Xも開弦が乗っていたわけだから最初からD-braneは存在していたのである。つまり、一方向をコンパクト化したD25-braneの理論のT-双対はD25-braneがコンパクト方向に潰れたD24-braneの理論になる)。

次に、コンパクト空間のゲージ場について考える。 U(1)ゲージ場は物理量に微分を通してしか現れないので、定数ゲージ場には普通意味がない。しかし、コンパクト空間の時は非自明な寄与をもたらす。
ゲージ場のコンパクト空間方向の積分\thetaとする。

\begin{align}
\theta = q\oint dX^{25}A_{25} = 2\pi R qA_{25}
\end{align}
よって qA_{25} = \frac{\theta}{2\pi R}とかける。ゲージ場があると正準運動量はp\rightarrow p-qAと変化する。U(1)ゲージ場と結合するのは、弦の端点であり、弦のカレント保存則よりそれぞれの端点の電荷は逆の符号を持つ。電荷1に規格化しよう。したがって運動量のシフトはp\rightarrow p-qA+qA=pとなり、不変である。
しかし、ブレーンが複数枚あるときは話が変わってくる。n枚のブレーンの理論を考える。これは無質量レベルではU(n)ゲージ理論である。定数ゲージ場はゲージ変換で対角化可能である。

\begin{align}
\theta_i = q\oint dX^{25}A_{25,ii} = 2\pi R qA_{25,ii}
\end{align}
とすると qA_{25,ii} = \frac{\theta_i}{2\pi R}となる。したがってChan-Paton因子が(ij)の弦の運動量はp\rightarrow p-qA_{ii}+qA_{jj}とシフトする。すると

\begin{align}
X'(\pi)-X'(0) =& \int dX' \\
=&2\pi \alpha' (p-qA_{ii}+qA_{jj})\\
=&2\pi \alpha'(\frac{l}{R} -\frac{\theta_i}{2\pi R}+\frac{\theta_j}{2\pi R})\\
=&(2\pi l - \theta_i+\theta_j) R'
\end{align}
となる。よってブレーンの位置が一枚一枚シフトされることがわかる。これはU(n)理論がU(1)^n理論に破れたことを意味している。実際質量スペクトルは

\begin{align}
m^2 = (2\pi l - \theta_i+\theta_j)^2R'^2+\frac{1}{\alpha'}(N-1)
\end{align}
となり、ゲージボソンN=1,\quad l=0はブレーン間の距離に比例した質量を持つ。これがWボソンに相当する。これはブレーン上の場の理論の観点からは、ポテンシャル[A_{25},A_{25}]^2の自発的破れに対応する。

トーラスコンパクト化

閉弦のトーラスコンパクト化を考える。まずは空間次元一つがコンパクト化されているとする。

\begin{align}
X(\sigma +2\pi)=X(\sigma)+2\pi R w,\quad w\in \mathbb Z
\end{align}
Rはコンパクト化の半径である。Xの全微分をコンパクト化方向に積分すると次のようになる。

\begin{align}
\oint dX =  X(\sigma +2\pi)-X(\sigma)=2\pi R w
\end{align}
一方で

\begin{align}
\oint dX = \oint( dz \partial X+d\bar z \bar \partial X)
\end{align}
とも書ける。ローラン展開(8.2.4)を代入して

\begin{align}
\oint dX = 2\pi\Big(\frac{\alpha '}{2}\Big)^{1/2}(\alpha_0-\tilde \alpha_0)
\end{align}
を得る。\bar zでは経路が反転することに注意。

一方で時空の並進のネーターカレントはj_a^\mu = i\partial_a X^\mu/\alpha'であり、空間積分

\begin{align}
p^\mu =& \frac{1}{\pi}\oint dx^a j_a^\mu \\
=& \frac{1}{\pi}\int d\sigma^2 \sqrt g \partial_a j^{a\mu} \\
=& \frac{1}{2\pi}\int dzd\bar z  \partial_a j^{a\mu} \\
=& -\frac{1}{2\pi i}\oint (j^{z\mu} d\bar z - j^{\bar z \mu} d z )\\
=&\frac{1}{2\pi \alpha'}\oint (dz \partial X^mu-d\bar z \bar \partial X^\mu)\\
=& (2\alpha')^{-1/2}(\alpha_0^\mu+\tilde \alpha_0^\mu)
\end{align}
となる(一般性のために\muを付けたが、今は\mu=25のみを考えている)。
非コンパクト次元では常に w =0なので\alpha_0^\mu=\tilde \alpha_0\muとなるが、コンパクト次元ではw\neq 0となりうるので一般に\alpha_0^\mu\neq \tilde \alpha_0\muである。

 X = X_L(z)+X_R(\bar z)と分離し、(2.4.4)に代入する。(8.2.4)の展開を代入すればVirasoro演算子(8.2.8)を得る。質量殻条件は(8.3.1)(8.3.2)となる。

\begin{align}
m^2 = \frac{n^2}{R^2}+\frac{w^2 R^2}{\alpha'^2}+\frac{2}{\alpha'}(N+\tilde N-2)
\end{align}