必修 使える!数学

#13 「ベクトル」「微分」「確率」の実践講座 AIを使いこなすための数学

人工知能は数学の塊だ。『人工知能プログラミングのための数学がわかる本』の著者であるアイデミーの石川聡彦社長に、AIを使いこなすための数学について解説してもらった。

 人工知能(AI)のプログラミングに関する参考書を開くと、ページのあちこちに数式が登場します。これだけで、AIは数学を土台に成り立っていることが分かります。

 AIのプログラミングを手掛ける場合、既に用意されたアルゴリズムを活用することで、一定の結果を出すことはできます。しかし、そこから一歩踏み出し、より精度の高いAIをつくろうと考えた場合には数学の知識が必要です。

 ベクトル、微分、確率の3大分野を押さえることで、ブラックボックスのように感じていたAIが、ぐっと使えるようになるんです。

 グーグル翻訳や、顧客の問い合わせに自動で応答するチャットボット。こうしたAIの核となる技術が「自然言語処理」です。

 AIならば、ヒトのように言葉を理解する能力があるのは当たり前。こう感じる人も多いかもしれませんが、言葉をAIに理解させるためには、コンピューターが理解できる表現に言葉を置き換えなければなりません。ここで威力を発揮するのが、ベクトル(#6参照)です。

 単語一つ一つをベクトルという数学に落とし込むことで、AIは言葉を理解できるようになるのです。そして、ベクトルは足し算や引き算ができるので、「王様」-「男性」+「女性」=「女王」といった演算が可能になります。

文章を単語に分解し
ベクトルの向きで似ているかを判断

 実際にAIに文章の意味を理解させるためには、もう少し複雑なステップを踏む必要があります。

 まず、文章をばらばらな単語に分解します。英語など単語ごとに区切って書く言語では簡単にできますが、日本語は単語を区切って書きません。だから、技術的なハードルが上がります。

 日本語を単語分解できるソフトウエアとして広く使われているのが、京都大学とNTT基礎研究所が共同開発した「MeCab(めかぶ)」です。ダウンロードや使用は無料。約40万語の単語が登録され、簡単な操作で文章を鮮やかに単語に分解してくれます。

 こうして得た単語の集まりから、文章中に登場した単語の数などをベクトルで表記することで、文章の意味をAIに理解させることができるようになるのです。

 例えば、太宰治と芥川龍之介と森鴎外のそれぞれの小説によく登場する単語を抽出してベクトルの重み付けをすることで、文章が3人の文豪の誰に似ているかを判定するような、“文体”を理解するAIをつくることができます。

 このとき、句読点や「てにをは」など、出現頻度は高いけれど、文章の特徴とはあまり関係ない単語(ストップワード)を除去することで、AIの性能を高めやすくなります。われわれの作成した文豪判定AIでは、約500語をストップワードとして除去し、残りの約1万4500単語、つまり、1万4500次元のベクトルで文章の特徴を判断しています。

この続きは有料会員登録をすると
読むことができます。
cakes会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
必修 使える!数学

週刊ダイヤモンド

数学が苦手だった人は少なくないだろう。だが、数学が陰の主役として支えるAIやデータ活用などの動きはますます加速し、ビジネスのさまざまな現場に関わってくる。数学という武器は強力だ。そのエッセンスを理解するだけでも、ビジネスマンの強い味方...もっと読む

この連載の人気記事

関連記事

関連キーワード