S
Smarter Business

Watson は数千万の論文をどう学習する?IBM の研究員村上明子さんに聞いてきた

post_thumb

取材・文:砂流 恵介、写真:上樂 博之

 

こんにちは、砂流(スナガレって読みます)です。

最近、いろんなところで「AI」って言葉を聞くようになりましたよね。それもそのはずで、今は「第3次AIブーム」なんて言われているほどこの分野が盛り上がりを見せているそうです。

AIに関する話題はさまざまありますが、個人的に印象に残っているのは「東京大学医科学研究所が導入したIBMのWatsonが、専門医でも診断が難しい二次性白血病というがんを10分で見抜いて、患者の命を救った」というニュース。なんというか、未来感があって凄いですよね。

ちなみに、このときWatsonは2000万件以上の医学論文を学習したそうです。「これ、人間が読んだらいったいどれくらいの時間がかかるか想像もつかないな」なんて考えているときに、ふと思いました。

「Watsonってどうやって学習しているんだろう?」と。

 

「Watsonってどうやって学習しているんだろう?」と。

 

というわけで、東京ソフトウェア開発研究所の中にある「Watson Lab」にやってきました!

Watson Labは、名前の通りIBM Watsonを開発している開発研究所。ここでWatsonの学習方法や、誰にでもできるWatsonの応用についての話を聞いていきたいと思います。

*IBMでは、WatsonのことをArtificial Intelligence(人工知能)ではなく、自然言語を理解し学習しながら人間の意思決定を助けるAugmented Intelligence(拡張知能)と言っています。

 

IBMの社員でもなかなか入れない Watson の開発研究所を案内してもらった

Watson は数千万の論文をどう学習する?IBM の研究員村上明子さんに聞いてきた

 

今回、Watsonのことをいろいろと教えてくれるのは、Watsonに知識を教えてあげるツール「Watson Knowledge Studio」の開発リーダーをしている村上明子さん。

 

村上 明子(むらかみ あきこ)さん

村上 明子(むらかみ あきこ)さん
日本アイ・ビー・エム株式会社 IBM Watson 開発リーダー
ソフトウェア&システム開発研究所ワトソン開発にて知識処理に関する製品の開発リードを担当。2015年12月まで東京基礎研究所にてSNSなど分析を研究しており、関連書籍の執筆や講演も多数行っている。

 

村上さんによると、Watson Labは日本IBMの本社にありながら、IBMの社員さんが入るのも難しい場所なんだそうです。せっかくなので、まずはLabの案内をお願いしました。

 

IBMの社員でもなかなか入れない Watson の開発研究所を案内してもらった

 

入り口から進んで行くと、床を錦鯉が優雅に泳いでいました。

これは、天井から2つのプロジェクターを使って映し出されたもの。研究所をつくるときに出てきた「オフィスの中に日本庭園を作りたい」というアイデアを、ITの力で実現したそうです。

 

IBMの社員でもなかなか入れない Watson の開発研究所を案内してもらった

 

錦鯉が泳いでる隣の壁にはメッセージが刻まれていました。

このメッセージは、IBMの研究所をつくったThomas Watson Sr.さんのもので、ざっくり日本語訳すると「IBMのマシンは、使用する人が持つ能力を拡張するツールに過ぎない」みたいな感じです。

 

IBMの社員でもなかなか入れない Watson の開発研究所を案内してもらった

 

こちらは会議室。壁にかかっている絵はIBMさんの文化になっている「THINK」にまつわるもの。

 

IBMの社員でもなかなか入れない Watson の開発研究所を案内してもらった

 

左の絵をよく見てみると、身体でTHINKを表現していました。

オフィスの紹介は以上です。
ここからいよいよWatsonについてお話を伺っていきたいと思います。

 

Watsonってどうやって学習するんですか?

 

Watsonってどうやって学習するんですか?

 

筆者:開発研究所の案内ありがとうございました。IBMさんってそもそも外資企業なんでWatsonも海外で作られているのかと思っていたんですけど、日本にも開発研究所があったんですね。

村上:そうなんです。日本で開発をしていることはまだあまり知られていないのですが、Watsonの自然言語処理部分の開発などをここで行っています。

 

筆者:村上さんはどんな開発をされているんですか?

村上:私は「Watson Knowledge Studio」という、Watsonに知識を教えてあげるためのツールを開発しています。

Watsonって、クイズ大会で勝ち上がったり、がんの発見をしたりと何でも知っているように見えますが、万能ではないんですね。Watsonががんの治療の仕方を発見したニュースが話題になりましたが、あれは地道にWatsonに医療文献を読み込ませて、Watsonが医療に詳しくなった結果です。

 

筆者:初めからなんでも詳しいわけではないんですね。

村上:人間に置き換えて考えてみるとわかりやすのですが「お医者さんになりたい」と思っても急にはなれませんよね。まず、大学医学部で勉強していろんな学術論文を読んだりして、勉強しないといけません。

Watsonも人間と一緒で、がんの治療法がわかるWatsonにするには、がんの論文をたくさん読ませてあげる必要があります。ただ、がんの論文って内容が専門的ですごく難しいので、まず「これは遺伝子の名前だよ」「これはタンパク質のことだよ」といった感じで、読むための知識をWatsonに教えてあげないといけないんです。

Watson Knowledge Studioは、そういった分野ごとの専門用語などの知識を教えるためのツールです。

 

Watsonってどうやって学習するんですか?

 

筆者:Watsonはどうやって学習しているんですか?

村上:学習方法は、大きく分けて「機械学習」と「ルールベース」の2種類があります。わかりやすいように、砂流(スナガレ)さんを例にとって説明しますね。

 

筆者:お願いします。

村上:砂流って珍しい名字ですよね。砂流さんを知らない人は、いきなり“砂流”って単語だけでてきたら名字だということがわからないかもしれません。でも、砂流に“さん”をつけて“砂流さん”にすると、人の名前だと想像できます。

人間ってこういう感じで、会話をしているときに「あ、これは人の名前なんだな」というのを文脈によって推察しているんです。

Watsonも今の例と同じように「後ろに“さん”がついていたら人の名前だよ」っていう例を大量に与えてあげれば学習していきます。これが「機械学習」です。要は、正解を教えてそこから学んでもらうスタイルです。

「ルールベース」は「後ろに“さん”がついていたら、その前にある漢字2文字は全て人の名前」というルールを与えるスタイルです。

このどちらの方法でも、砂流が名字だと知らなくてもWatsonは砂流を名字と認識することができるようになります。機械学習とルールベースはそれぞれ性質が違っているので、目的によって方法を選ぶ形ですね。

 

Watsonってどうやって学習するんですか?

 

筆者:けっこう人間に近い感じで学習していくんですね。Watsonの学習に関して「人間とここが違う」ってところはありますか?

村上:機械学習の考え方は、根本的には人間と一緒だと思います。2歳とか3歳ぐらいのお子さんに、お父さんが「これは◯◯だよ」って教えてあげるのと大きくは変わらないんです。ひとつ違うのは、人間は、過去の積み重ねからなんとなく類推して学んでいくことができるようになるんですけど、Watsonはできません。ですので、きっちり教えてあげないといけない。

ただ、人間って1回覚えても忘れちゃいますよね。Watsonは、1回覚えてしまえば決して忘れないという優秀な点もあります。

 

筆者:覚えたら忘れないけど「雰囲気で察して」みたいなのができないと。

村上:でも最近は機械学習も進んできていて、ニューラルネットやディープラーニングといった学習方法は人間の脳に近い形で実現していると言われています。人間の脳みそって、いろんなものがつながって、連想ゲームみたいになって言葉を理解していますよね。機械学習も、そういう形に近い学習ができるようになりつつます。ただ、あまりに抽象的なのはまだ難しいですけどね。

 

Watsonってどんな状態で提供されるの?

 

Watsonってどんな状態で提供されるの?

 

筆者:お話を伺っていて気になったんですけど、Watsonってどんな状態で提供されるんですか?

村上:テキスト分析に関して言えば、例えば、地名や場所などの固有名詞など一般的なことは理解できる(抽出できる)状態で提供しています。ただ、専門分野の難しい言葉などは教えてあげないといけません。医療で言えば、疾患名などです。

 

筆者:僕なんかは、なんでもかんでも覚えさせとけばいいじゃんって思っちゃうんですが、それではダメなのでしょうか?

村上:“砂流さん”と単語が出てきたときに「砂流さんは人の名前」というのは一般的で普遍的に使えるので覚えておいたほうがいいと思います。ですが、例えば医学系の論文と薬学系の論文を読んでいると、同じ単語なのに振る舞いが違ったりするものが出てきます。そうすると、医学論文を読むWatsonをつくりたいと思ったら、医学論文で学習させなきゃいけないんです。

 

筆者:なるほど!

村上:ですので、Watsonを何に使いたいかによって学習させるものが変えられるように設計しています。

 

筆者:ちなみに、医学論文を読むWatsonにその分野に関係ないスポーツ選手の名前を教えたりすると、良くないことになるんですか?

村上:良くないことはありませんが、その知識が役に立たないだけです。

 

筆者:趣味で覚えたみたいな感じになっちゃう。

村上:そうですね。でも、サイバーセキュリティーを学習しているWatsonがスポーツ選手の名前を知っていれば、スポーツ選手の名前が出てくるメールに対して「このメールは、フィッシングメールかもしれない」というアラートを出して、脅威を未然に発見できるかもしれないですね。

 

マーケティングにWatsonを使って欲しい

 

マーケティングにWatsonを使って欲しい

 

筆者:Watsonがニュースになるのって医療とか大企業が多いですが、村上さんはWatsonをどんな人たちに使って欲しいと思いますか?

村上:例えば、マーケティングをしている方々などにWatsonを活用して欲しいと思います。

Watsonは製品マーケティングでも使えますし、SNSなどのソーシャル分析にも使えます。面白いAPIもいっぱいあって、テキストから人の性格診断をしてくれるものもあります。

 

筆者:Twitterのツイートから性格診断ができるものをリリースされていますよね。僕は「ライブによく行く」とか「商品を購入するときに家族からの影響は受けない」といった結果がでました。たしかにこれはマーケティングに使えそうな気がします。

 

性格特性

「Personality Insights」

 

村上:Personality Insightsのようなソーシャル分析は「誰が何を買うか」とか「誰からオススメされると買いやすいか」などもわかるので、マーケターの方はキャンペーンに活かしやすいと思いますよ。

 

マーケティングにWatsonを使って欲しい

 

筆者:村上さんは、Watsonが学習していくことで世の中はどうなっていくと思いますか?

村上:皆さんがイメージされる「AI」って「人の職を奪う」とか「人間の代わりをつくる」とか、そういった印象が強いと思うんです。でも、Watsonは「人間を助ける」「人間の生きやすさのサポートをする」ために開発をしています。まず、ここがとても重要だと思っています。

 

筆者:「奪う」と「助ける」では大きく違いますね。

村上:私は「人間というのは楽をするために苦労をする動物」だと思っています。目の前の短期的なことはもちろん、将来的なことまで考えて苦労して道具を作る。その「苦労する部分」をWatsonが助けてあげられるのではないかと思っています。

 

まとめ

 

まとめ

 

Watson LabとWatsonに関するインタビュー、いかがでしたでしょうか?

Watsonは、親が子どもにモノを説明するように“知識”を教えてあげることで学習していくことが印象的でした。また「AIは人間の脅威になる」と紹介されることも少なくない中、人をサポートする、人の知識を増強するようなWatsonの在り方も安心感があり好感が持てました。いろいろな専門分野の知識を持ったWatsonたちが活躍していくのが楽しみです。

開発研究所の案内とお話を聞かせてくれた村上さん、ありがとうございました!

 

2017年11月1日、BluemixはIBM Cloudにブランドを変更しました。詳細はこちら