今回から人工知能を活用したビジネスについての連載をすることになりました。よろしくお願いいたします。
ビジネスといってもいろいろありますが、私が代表を務める会社はECマーケティング分野のため、マーケティング関連の話題が多くなると思います。
人工知能の基礎知識・2016
まず今回は第1回ということで人工知能の基礎知識です。
そもそもなぜ人工知能の連載を持つことになったかというと、それは今が空前の?人工知能ブームだからにほかなりません。そのキッカケは何かというと、それはディープラーニングといって良いでしょう。
実際、ディープラーニング分野では大きな技術的革新がありました。そのため大きな注目を集めるのは自然なことであるといえます。
具体的な成果としては、画像認識率の飛躍的な向上を始めとする画像処理に関するものが中心です。もちろん、ディープラーニングが画像しか扱えないということはありませんし、実際自然言語処理でも活用されたりもしていますが、これまでのところブームになるほどの圧倒的なパフォーマンスを出しているのは画像に関連するものです。
ディープラーニングブームと人工知能ブーム
さて問題は、ディープラーニングブームがいつの間にか人工知能ブームになってしまっていることです。
たしかにディープラーニングは人工知能の一種ですが、人工知能ブームということはディープラーニング以外もそこに巻き込まれているということが言えます。そして、ディープラーニング以外の人工知能に関しては、特段飛躍的な進歩があったわけではありません。
人工知能というジャンルにおいて、ディープラーニング以外の手法も同時に画期的な進歩を遂げていたとしたら、それはかなりの偶然であると言えますが、実際のところ、そんなことはないのです。
もちろん人工知能がブームになることによって、そこにヒトやカネが集まり、結果として大きな成果を生み出す可能性はありますし、そうした流れは徐々に起きつつはあります。
ただそれは、成果があったからブームになったのではなく、ブームに引きずられて成果が出た、つまり因果が逆転しているということになります。
“人工知能”という括りに含まれるもの
そこでまずは、人工知能という大きな括りには何が含まれているのか、について整理・把握することが重要になってきます(整理しようにもその切り口がまたいろいろあるのが難しいところですが)。
では、いくつかの分類で整理・把握してみましょう。
データや分野で分類する
まず、よく見かける、対象となるデータや分野ごとに分ける、というアプローチです。画像、音声、自然言語、機械制御、推論などがこれに当てはまります。
強い人工知能、弱い人工知能という言い方もありますし、大人の人工知能、子どもの人工知能という分け方も聞いたことがあります。
技術的な手法で分類する
次に技術的な手法で分類するアプローチです。私は個人的には、このように具体的な(技術的な)手法で分類するのが一番しっくりきますが、これはかなり多岐にわたるのと恣意的な分類ができないため、分け方としては一番大変かもしれません。
ディープラーニングもこの「手法による分類」のいち分野となります。
どの分類が良いのか?
対象のデータで分類してしまうと、ディープラーニングが活用できる先は画像、音声、自然言語など複数にわたるのと、ジャンルごとにそのパフォーマンスが結構違うため、今の人工知能ブームを読み解く、という意味ではあまり適切ではない気がします。
また、先ほど紹介した強い人工知能と弱い人工知能というのは、自己学習できるのが強い人工知能、そうでないのが弱い人工知能だそうです。この「自己学習できる」というのが、一般的にはいわゆる“人工知能”というイメージに近いのではないでしょうか。
コンピュータが進化して自分で考え始め、いずれ人間を凌駕してしまう、ターミネーターの世界です。ただ残念ながら、現在のところそんなことはまったく夢物語です。現時点でもできていないですし、現在の技術の延長でもできる見込みはまったくありません。
ところが人工知能ブームをもっともっと広げようとする識者や、よくわかっていない記者が、そうした可能性に触れるため誤解が広まっています。困ったものです。
技術的な手法で分類した人工知能とは?
さて、エンジニア向けの媒体でもありますし、ここはやはり技術的な手法による分類について考えてみます。まず前提、すなわち「何を持って人工知能というか」という定義?が必要です。
「ある程度複雑」というしきい値
ここでは「コンピュータがある程度複雑な計算して何らかの成果を出力する」と定義します。この「ある程度複雑」というところがポイントです。
たとえば数値の列を入力して総和を出力する(sum関数的な)ものは人工知能と呼べるでしょうか? 正直無理があります。人間が手で計算するにはハードルが高い、というレベルの感じでしょうか。
一方、ディープラーニングの考え方においては、中間層の出力を人間が見ても何が何だかわからない、という特徴があるため、かなり「人工知能っぽい」と言えます。先ほどもお伝えしたとおり、人工知能ブームのキッカケになったディープラーニングは、その成果が大きかっただけではなく、その性質の人工知能らしさも高い、ということです。
その「中間層を見ても何が何だかわからない」にもかかわらず、「なぜか高い成果が出てしまう」という点が、いわゆるシンギュラリティ的な発想の一因にもなっている気もします。
一方で、たとえば相関係数の計算などは、なかなか微妙なところです。
人間が手で計算してもなんとかついていけなくもないですし、使っている手法も標準偏差とか共分散とか、そこまで難しいものではありません。ただ相関係数は、たとえばAmazonレコメンド(Aを買っている人はBも買っています)などで、商品ジャンルによってはびっくりするくらい精度の高い成果を出すため、「人間がデータを眺めていても辿りつけない成果」を出すという意味で、人工知能っぽいといえなくもありません。
出力が次の入力になるものは人工知能的である
これは私の感想ですが、フィードバックがある、つまり出力が次の入力になるような処理というのは、人工知能らしいと言えるのではないでしょうか。
元データから結果を予想するのが難しいですし、計算も人力では大変ですし、またデータが一周回るごとに成果が上がる(ことがある)というのも、「学習」というイメージを想起させます。
ただ、フィードバックがないと人工知能とは言えない、ということもないと思います。(フィードバックがあるほうが)より人工知能という呼び方にふさわしい、という感じです。
ディープラーニングにせよベイズにせよ、やればやるほど成果が高くなることが期待できるというのは、そこに知能があるという錯覚を持ちやすくなりますし、それがいずれ人間を超えるという幻想にもつながっていくのではないでしょうか。
この点こそが、人工知能を技術的に分類するうえで意識しておきたい部分です。
さて今回は、まず人工知能ブームについてと、人工知能とはなんぞや、について考えてみました。次回は具体的な手法を上げて、ブームの中身をより詳しく見ていきます。