深層学習を用いた自然言語処理

関心ワード
  • 画像認識 、
  • 自然言語処理 、
  • 自動翻訳 、
  • シナプス 、
  • 人工知能(AI) 、
  • 抽出 、
  • ディープラーニング(深層学習) 、
  • ニューラルネットワーク

講義No.g009157

「ディープラーニング」で自動翻訳がわかりやすくなった!

大きな進化を遂げた機械翻訳

日本語や英語などの「自然言語」をコンピュータで解析・処理する技術を「自然言語処理」といいます。人工知能(AI)の分野の一つで、身近な例としては、スマートフォンやパソコンで、ひらがなで入力した言葉を漢字に変換する「仮名漢字変換」や、ある文章を別の言語で表現する「自動翻訳」があります。この自動翻訳、いわゆる「機械翻訳」の精度が、ここ数年で格段に上がっています。

翻訳の精度を上げたディープラーニングとは

それは、人間の脳をモデルにした「ディープラーニング(深層学習)」という方法が使われるようになったからです。この技術の核をなすのが「ニューラルネットワーク」という数理モデルです。
この技術はもともと画像認識の分野から発達しましたが、「特徴を自動的に学習できる」という点で、これまでの機械学習の常識を覆しました。例えば画像認識なら、画像から、色や形などの特徴を自動的に分析し、複数の画像の共通点や相違点を抽出して、何の画像かを導き出します。これを、人間の脳がシナプスを強化して学習するのと同様に学習していくのです。これまでの技術では、画像の特徴を抽出するためのプログラムなどが必要でしたが、それが不要になりました。

機械翻訳のやり方はこんなに変わった!

ディープラーニングの利用により、機械翻訳の方法も劇的に変わりました。これまでの「統計的機械翻訳」では、「I read a book yesterday」という英語の文章を構成する単語の順番を、例えば「I yesterday a book read」と並べ替えてそれぞれの単語を訳し、最も確率が高い組み合わせで翻訳していました。ですが、ニューラル機械翻訳の場合は、文章をすべて読みこんでから、意味を表す「ベクトル表現」に置き換え、別の言語に訳します。文章をばらばらにしないため、よりこなれた表現に訳されるのです。ニューラル機械翻訳の研究が進めば、「言葉の壁」もどんどんなくなっていくでしょう。

この学問が向いているかも 情報工学

愛媛大学
工学部 情報工学科
教授 二宮 崇 先生

メッセージ

私は人工知能(AI)の研究、中でも、人間が普段使っている言葉(自然言語)をコンピュータで解析・処理する「自然言語処理」の研究に取り組んでいます。パソコンやスマートフォンでの自動翻訳(機械翻訳)の技術ですが、人間の脳をモデルとした「ディープラーニング(深層学習)」という技術の発展で、非常に面白い研究領域となっています。
研究のツールやデータは、インターネット上からもダウンロードできますので、やる気があれば、高校生も世界最先端の研究に関わることができます。あなたも挑戦してみませんか。

先生の学問へのきっかけ

コンピュータが大好きで、小学生の頃からパソコンでプログラミングやゲームをしていました。当然のように大学は情報科学科へ進学し、当初はOS、基本ソフトの研究をやりたいと思っていました。しかし、自然言語処理の分野で有名な情報科学者、辻井潤一教授と出会い、自然言語処理の研究に面白さを見出しました。どうすれば、人間の考えていることがコンピュータの中で表現できるのか。一筋縄ではいかない研究にわくわくしました。最近は自動翻訳などの自然言語処理にもディープラーニングの技術が活用され、研究への興味は尽きません。