株式会社まぼろしの益子貴寛です。
海外の記事を読むときに、よくお世話になるGoogle翻訳。2016年11月16日の公式発表によると、Google翻訳がニューラルネットワークで大幅な進化を遂げたとのこと。
どのように進化したのかは、次のとおり。
今回、採用した新しいシステムでは、文章をパーツごとに翻訳するのではなく、ひとつの文として扱います。文のコンテキストを把握することで、より正確な訳語の候補を見つけることができるようになり、その後、言葉の順番を変え調整することで、文法により正しく、人の言葉に近い翻訳が出来るようになります。
ここでのニューラルネットワーク(Neural Network)とは、人間の脳の神経回路を模した処理システムのことです。心理学やコーチングなどで活用されるNLP(Neuro-Linguistic Programming)にも「Neuro」の文字が入っていますし、神経細胞を表す言葉は「Neuron(ニューロン)」です。囲碁のプロ棋士に勝利した人工知能「AlphaGo(アルファ碁)」などで話題のディープラーニングは、多層構造のニューラルネットワーク(Deep Neural Network)を使った機械学習のしくみです。
川端康成『雪国』の名訳とGoogle翻訳の比較
Google翻訳の進化の報を聞いてからというもの、真っ先に気になったのは、「川端康成の『雪国』を自動翻訳したらどうなるのだろう」ということ。「国境の長いトンネルを抜けると雪国であった」ではじまる、あの名作です。
本の書き出し部分について、英訳版とGoogle翻訳を比較してみましょう。なお、『雪国』の英訳は、長らくコロンビア大学教授として日本文学を講じた、エドワード・ジョージ・サイデンステッカー氏によるもの。川端康成は「わたしのノーベル賞の半分は、サイデンステッカー教授のものだ」とし、実際に賞金を半分渡したといわれています。
まず、原文はこちら。
国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。
向側の座席から娘が立って来て、島村の前のガラス窓を落とした。雪の冷気が流れこんだ。娘は窓いっぱいに乗り出して、遠くへ叫ぶように、
「駅長さあん、駅長さあん」
明かりをさげてゆっくり雪を踏んで来た男は、襟巻で鼻の上まで包み、耳に帽子の毛皮を垂れていた。
次に、サイデンステッカー氏による名訳はこちら。
The train came out of the long tunnel into the snow country. The earth lay white under the night sky. The train pulled up at a signal stop.
A girl who had been sitting on the other side of the car came over and opened the window in front of Shimamura. The snowy cold poured in. Leaning far out the window, the girl called to the station master as though he were a great distance away.
The station master walked slowly over the snow, a lantern in his hand. His face was buried to the nose in a muffler, and the flaps of his cap were turned down over his face.
最後に、Google翻訳の結果はこちら。
It was a snowy country when I passed through a long tunnel in the border. The bottom of the night turned white.The train stopped at the traffic light.
A daughter stood up from the seated side, dropped the glass window in front of Shimamura. The cold air of snow flowed. My daughter embarked on a window full and shouted to afar,
“Station length, Ann, station length anan.”
The man who stepped on the snow slowly while slowing down the light wrapped up over the nose with a collar and was hanging a fur of a hat in his ear.
いかがでしょうか。
娘を「daughter」、駅長を「Station length」と訳しているあたりはご愛嬌という感じですが(ちなみに「駅長さん、駅長さん」に変えれば「Station manager, station chief」と、ややまともになる)、全体としてかなり正確に翻訳されている感触です。
サイデンステッカー氏の英訳では「国境」があえて省かれている一方、Google翻訳では「the border」となっています。現在では「県境」と表現すべきなのでそのように変更すると、きちんと「the prefectural border」と訳してくれました(当時はまだ、行政区域の「県」を江戸時代のように「国」と呼ぶことが多かったようです)。
これまでもGoogle翻訳の着実な進化を実感してきました。今回のニューラルネットワークの導入で、さらに数段上のサービスになった印象です。
シンギュラリティと2045年問題
人工知能やディープラーニングの進化に関連して、よく「シンギュラリティ(技術的特異点)」ということがいわれます。これは、簡単にいえば「人間と人工知能の臨界点」、つまり「人工知能が人間の能力を超えること」です。
アメリカの発明家、未来学者、人工知能研究の権威で、サービス開発の指揮をとるために2012年にGoogleにジョインしたことで話題になったレイ・カーツワイル氏が、2005年の著書『The Singularity Is Near: When Humans Transcend Biology(シンギュラリティは近い:人類が生命を超越するとき)』の中で描いた未来が、次々に現実のものとなっています。
そういえば、1999年公開の映画『マトリックス(The Matrix)』では、人工知能が人類を支配した世界と、人類を解き放つための戦いがテーマでした。
人工知能が人間の能力を超えるのは2045年と予想されています。それがいわゆる「2045年問題」です。
では、いったい何が「問題」なのでしょうか。その人工知能が、自分よりも優秀な人工知能を開発し、さらに……と、人類との能力の差がどんどん広がっていき、それこそ『マトリックス』の世界が訪れてしまうのでは、という心配があるからです。
三宅陽一郎・森川幸人『絵でわかる人工知能 明日使いたくなるキーワード68』(サイエンス・アイ新書、2016年9月)は、このような人工知能に関する知識をきちんと身につけるのにうってつけ。すでに触れたキーワードに加えて、遺伝的アルゴリズム、ミラーニューロン、サイバネティクス、シンボリズムとコネクショニズムなど、とっつきにくい話題がわかりやすく解説されています。
三宅さんはスクウェア・エニックスで人工知能研究の責任者として、森川さんは現役のグラフィック・クリエイターとして活動中。ともすれば学問チックになりそうな話が、端的な説明と豊富なイラストのおかげで、すんなりと頭に入ってきます。
わたしたちが特に気になるのは、やはりインターネットやウェブの世界。三宅さんと森川さんは、検索エンジンの役割について次のように記しています。
インターネットは20年を経て巨大なデータベースになりつつあり、検索エンジンの助けなしに、そこを旅することはできません。言うなれば、我々は検索エンジンという人工知能の船に乗ってインターネットを旅しています。かつてはモーターボートほどのものだったのが、もはや高速客船のように高性能化されつつあります。ネットはますます広大になり、より強力な人工知能なしには旅することが難しくなっています。また、セマンティック検索のような、より質の高い検索も必要とされています。検索エンジンという人工知能は、ネットの世界と人間世界とを結ぶ役割をしているのです。(75、76ページより)
ほか、検索アルゴリズム、ビッグデータ、データマイニング、セマンティックウェブ、自然言語処理など、わたしたちの業界に比較的なじみのある話題が出てくるので、興味から離れそうになっても、うまく引き戻される感じで読み進められます。
さて、シンギュラリティに対する恐れのあらわれとして、インターネットでたびたび話題になるのが「人工知能でなくなる仕事」のこと。オックスフォード大学の発表や、Googleのラリー・ペイジの「20年後、あなたが望もうが、望むまいが現在の仕事のほとんどが機械によって代行される」という発言に、強い説得力を覚える人が多いようです。
このことに対して、著者の三宅さんと森川さんはどのように考えるのか。それは、終章「人工知能にできること、できないこと」で触れられています。ぜひ手にとって読んでみてください。