AIが人間の創造能力を超越する日は来るか? 西安交通大学の「和歌」自動生成プログラム

馬場公彦の中文圏出版事情解説

「Waka VT」開発チーム
西安交通大学コンピュータサイエンス学科「Waka VT」開発チーム。左から金中、牛明軒、羅晶。右は筆者(7月10日、以下 Photo by 馬場公彦)
noteで書く

《この記事は約 10 分で読めます(1分で600字計算)》

 中国・西安交通大学の日本古典文学研究者とコンピュータ技術者が共同開発した、和歌を創作するAI「Waka VT」について、馬場公彦氏が取材レポートしてくれました。

10秒で50首を創作 AIの威力に驚嘆

 次の和歌を味わってみてほしい。

  1. 冬来ぬと 思ひ明石の 柴の庵 枕に残る 霜の音かな
  2. 梅が枝に なほ降り初むる 梅の花 なほ芽のもとに 鶯ぞ鳴く
  3. 紅葉散る 山の嵐の いたづらに 紅葉のみこそ 知られざりけれ
  4. 明けてゆく 峰の木の葉の 梢より 遥かに続く さ牡鹿の声
  5. み吉野の 山ほととぎす 長き夜の 山の都の 春を待つかな
  6. 我ばかり かき集めつる 蛍かな つらき心は 光なりけり
  7. 故郷の あとを尋ねて 夏草の 茂みにかかる 尾野の通ひ路
  8. しきたへの 枕に慣れし 夢ならば うつつをだにも 誰か頼まむ

 どことなく古今和歌集を思わせる風情だが、実はこれすべてAIが自動生成した作品なのである。

 2、3、5のように1首の中に「梅」「紅葉」「山」など、通常は禁則とされる同一単語の再出がみられるものの、それもかえって斬新な発想のように感じられる。1の「おもひあかし」における「明石」と「明かし」の掛詞、2の「梅」と「鶯」の季節感の一致、5の「み吉野」と「山の都」、6の「蛍」と「光」、8の「夢」と「うつつ」の3首における縁語、3の「こそ……けれ」の係結び、8の「枕」の枕詞「しきたへの」など、修辞的にも文法的にもミスが見られない。むろん生成したすべてがこのような秀首とは限らず、膨大に生成したものを、和歌の専門家(後述の金中氏)が選首したものである。

 Waka VTと命名された和歌生成モデルを研究開発したのは、西安交通大学の専門家による合同研究チーム[1]で、メンバーは以下の5名(敬称略)。金中(外国語学部日本語科教授)、武石悠霞(同学部博士課程大学院生)、楊新宇(コンピューターサイエンス学科教授)、羅晶(同学科博士課程大学院生)、牛明軒(同学科修士課程大学院生)。

「ゆめ」をキーワードにした和歌がスクリーンに
「ゆめ」をキーワードにした和歌がスクリーンに
 さる7月10日、西安に出張し同大のコンピュータサイエンス学科を訪問する機会があった。羅さん、牛さんからWaka VTについての説明をうかがい、実演していただいた。同モデルでの「あはれ」「うめ」など頻出単語のリストを示されたうえで、何かキーワードを指定せよというので、「ゆめ」を指示すると、たちどころに10秒余りの間に50首の作品がスクリーンに現れてきた。

 今回は出版業界を離れて、コンピュータ科学が切り開く日中文化交流の新たな頁を紹介したい[2]

AI自動生成の先駆、俳句・短歌・漢詩

 俳句の自動生成に関しては、故水谷静夫氏の疑似俳句生成プログラムの試作にヒントを得て、新田義彦が函数型文法による俳句の解釈と生成を行っていた[3]。コンピュータを使っての詩作としては、ニューラル確率的言語モデル(NPLM)を使っての俳句の自動生成が企てられた。京都工芸繊維大学大学院工芸科学研究科の研究グループは、現代俳句協会データベースより1万5775句、伊藤園おーいお茶俳句大賞の優秀賞851句を収集して形態素解析を行って自動生成をし、完全コピーの俳句を少なくし、評価実験のためのアンケートを行ってAIに学習させ、SeqGANによる俳句生成を開発し人の詠んだ俳句に近い主観評価が得られるような俳句の生成を行なった[4]

 他にもAIによる俳句生成の試みとして岩手県立大学[5]や、写真をモチーフ画像として図像識別の深層学習を用いて俳句と画像のマッチングデータを収集したうえで俳句生成のシステムを構築した、北海道大学工学部と同大大学院情報科学研究科の研究チームがある。

 短歌に関しては、NTTレゾナントが、与謝野晶子、岡本かの子、柳原白蓮、九条武子、原阿佐緒ら5人の近代女性歌人の作品をはじめ5000首をデータ化してAIに読み込ませ短歌生成を行うモデル「歌人AI」を試作した[6]

 さらに漢詩に関しては、清華大学AI研究院自然言語処理と社会人文計算研究センターのTHUAIPoetチーム(リーダーは同センター主任の孫茂松教授)が開発した中国文学詩歌自動生成システム「九歌」が今のところ最も優れたソフトと言われている。80万首を超えるこれまで人が創作した詩歌をAIに学習させて開発したもので、これまでユーザーの要望に応じて700万首を超える詩歌を創作してきた。キーワードを指定すれば漢詩を生成してくれる。絶句・蔵頭詩・律詩・詞など様々な詩体に対応している[7]。試みに「夢境(夢の世界)」と入力してみると、瞬時にして

夢境塵埃外 / 生涯道路辺 / 客来無一事 / 独座対床眠

という五言絶句が出来上がった(出来栄えのほどを評定する漢詩の素養は持ち合わせていない)。さらに類似の古人の詩作として、宋の寇准という人の、

往事都如夢 / 流年只断魂 / 不堪春尽日 / 細雨欲黄昏

という五言絶句が掲示された。

Waka VTのモデル構築

 西安交通大学が開発したWaka VTモデルには、国際日本文化研究センターの「和歌データベース」(8~16世紀の『万葉集』、21代集、私家集などの和歌17万1801首)[8]が入力されている。国立国語研究所の形態素解析ツール「Web茶まめ」[9]を使って分詞処理をしたあと、日文研の和歌はすべて「かな」で「うくひす」「もみち」など濁点表示がないので、適宜濁点をつけたデータが用いられた。

 生成システムの構築に当たっては俳句のニューロンネットワークを応用したが、和歌は俳句に比べて音数が多く、575の上の句と77の下の句の連関性が求められ、俳句のような四季の景観だけでなく、人生の哲理や生活の感情についてのテーマに関わるので、感性工学情報の処理も求められる。コンピュータ言語処理としては、「隠変量序列(a sequence of latent variables)」と「多層融合自己注意メカニズム(Fused Multi-level Self Attention Mechanism)」を採用した。

 これ以上の計算機科学上の説明は報告者の手に余る。そこで、開発チームのご説明[10]を拝借すると、こういうことだそうだ。

 Waka VTはシーケンシャル変分トランスフォーマーに基づいて和歌を生成する新しいモデルである。条件付き変分オートエンコーダー及び自己注意メカニズムを組み合わせ、指定されたキーワードに基づいて和歌を自動的に生成する。

 Waka VTモデルはまず付加的なマスクベースのアプローチを用いて5・7・5・7・7の仮名数になるように和歌を生成し、次に隠れた変数シーケンスを用いて和歌の単語レベルの変動をモデリングすることで、生成された和歌の独創性と多様性を高める。

 さらに、和歌のマルチレベル言語構造の特徴を鑑みて、マルチレベル融合自己注意メカニズムを駆使し、言語の流暢さ、内容の一貫性、及び芸術的概念の視点から生成された和歌の質を高める。

西安の興慶宮公園内に建つ阿倍仲麻呂記念碑(7月5日)
西安の興慶宮公園内に建つ阿倍仲麻呂記念碑(7月5日)

AIは生活の利便性を高め、人類の再定義を求め、人類の未来を予測不能にする

 俳句にせよ短歌にせよ、今回の和歌にせよ、AIが人類の詩歌の創造能力を超越したとは思わない。人まねのような作品のレベルならまだしも、たとえば「歌人AI」の場合、AIは人間の微妙な心理を解読するまでには至っておらず、「そばにいて」を恋情表現としてではなく、傍らの場所にいる状態として認識するのだという[11]

西安の青龍寺にある空海記念碑(7月5日)
西安の青龍寺にある空海記念碑(7月5日)
 だが、AIには人間とは比べ物にならない学習能力がある。AIのチェスや囲碁に名人がかなわないように、芸術の分野においても、想像を絶する創造能力を発揮するようになるかもしれない。自分の性格や性癖、その時々の情感に合わせて、パーソナルなリクエストに応じた詩歌作品を生成するようなモデルが開発されることだろう。ある歌人は、AI短歌の未来について、短歌配信アプリを通して、お気に入りの曲をダウンロードしプレイリストを作るように、自分なりのアンソロジーを編むような受容のされ方を予想している[12]。自動作曲ソフトの開発を考えれば、もはやそのような未来予測は夢ではない。

 さらに翻訳・通訳の分野においても、AIの音声識別能力の飛躍的向上は、近い将来、イヤホンを通して話者の音声が母国語に変換して聴者に同時に聴かれるような自動通訳機が実用化されることになるだろう。

大雁塔をバックにした玄奘像、西安市内(7月5日)
大雁塔をバックにした玄奘像、西安市内(7月5日)
 AIの開発と普及により、確かに生活は便利になる。だがそのいっぽうで、これまで人間が担ってきた通訳翻訳家といった専門技能者はどうなるのだろう。あるいは人間のみが備えるとされた知力や芸術創造能力が、はるかに高度で高速で巨大容量のAIに代替されるようになるのだろうか。

 ニーチェは神は死んだと宣告し、20世紀は人類が主役の理性の時代となった。人類のみが持ちうるとされた理性が、AIによってプログラムされた機械やロボットも持ち、人類の知的営為を代替し奪うようになると、いったい人類の未来像はどうなるのだろうか。

 西安といえばかつては唐の都長安であり、日本人にも遣唐使として赴き、「天の原ふりさけ見れば春日なる三笠の山に出でし月かも」の歌を詠んだ阿倍仲麻呂、青龍寺に真言密教を学び真言宗を開いた空海など、馴染みが深い。秦の始皇帝の兵馬俑、唐の玄宗皇帝と楊貴妃のロマンスで名高い華清池などがあり、シルクロードの起点としても知られる。歴史のロマンを掻き立てる古都で、最新最先端のAIが紡ぎだす和歌を味わうとともに、人類の未来に思いを馳せた。

西安市郊外の秦兵馬俑(7月7日)
西安市郊外の秦兵馬俑(7月7日)

脚注

[1]西安交通大学のAI和歌については「万葉集など学習AIが和歌創作」(6月14日『日本経済新聞』夕刊)など、共同通信配信による記事がある。
[2]Waka VTについてはモデル開発者のひとりである金中さんから関連資料の提供を受けた。西安での金さんとの語らいの中で、AIの実情とAIのもたらす近未来について、思索を深めることができた。今回の報告に当たっては、西安交通大学Waka VT開発チーム、とりわけ金中さんに深甚の謝意を表したい。
[3]新田義彦「形式的俳句生成について」(一般社団法人電子情報通信学会『信学技報』・2015年2月)、「正規表現による俳句の解釈と生成」(同・2015年6月)
[4]小西文昂他「SeqGANを用いた一般人に好まれやすい俳句の生成」(2017年度 情報処理学会関西支部 支部大会 講演論文集・2017年9月)、加賀ゆうた他「好みに合わせた俳句生成のためのニューラル確率的言語モデルの学習手法の検討」(同)、廣田敦士他「学習データセットを分けたseqGANによる俳句生成」(言語処理学会第24回年次大会発表論文集・2018年3月)
[5]伊藤拓哉他「俳句生成への多重的アプローチの考察」(人工知能学会全国大会論文集・2018年)、本田航紀他「深層学習を用いたモチーフ画像に基づく俳句生成」(人工知能学会『SIG-SAI』・2018年3月)
[6]中辻真・奥井颯平・野口あや子・加古陽歌人「特集 作品二十首&修業秘話 歌歴1年半でここまで上達! AI(人工知能歌人)の歌力――ついに歌壇デビューか! 筆名は「恋するAI歌人」!」(『短歌研究』76(8), 91-102, 2019年8月)
[7]「九歌」のサイトは http://jiuge.thunlp.org/jueju.html
[8]http://db.nichibun.ac.jp/pc1/ja/category/waka.html
[9]https://unidic.ninjal.ac.jp/chamame/index.html
[10] Yuka Takeishi, Mingxuan Niu, Jing Luo, Zhong Jin, Xinyu Yang、“WakaVT: A sequential variational transformer model for Waka generation”(arXiv preprint arXiv, 2021.4.1)、武石悠霞、金中、牛明軒「人工智能生成和歌的修辞手法分析」(『西安外国語大学学報』第29巻第2期・2021年6月[近刊])
[11]注4
[12] 雲嶋聆「現代短歌評論賞 受賞一年後評論 泥土か夜明けか : 人工知能と短歌の未来 (第三十六回 現代短歌評論賞 発表)」(『短歌研究』75(10), 90-95, 2018年10月)

noteで書く

広告

著者について

About 馬場公彦 32 Articles
北京外国語大学日語学院。元北京大学外国語学院外籍専家。出版社で35年働き、定年退職の後、第2の人生を中国で送る。出版社では雑誌と書籍の編集に携わり、最後の5年間は電子出版や翻訳出版を初めとするライツビジネスの部局を立ち上げ部長を務めた。勤務の傍ら、大学院に入り、国際関係学を修め、戦後の日中関係について研究した。北京大学では学部生・大学院生を対象に日本語や日本学の講義をしている。『人民中国』で「第2の人生は北京で」、『朝日新聞 GLOBE』で「世界の書店から」連載中。単著に『『ビルマの竪琴』をめぐる戦後史』法政大学出版局、『戦後日本人の中国像』新曜社、『現代日本人の中国像』新曜社、『世界史のなかの文化大革命』平凡社新書があり、中国では『戦後日本人的中国観』社会科学文献出版社、『播種人:平成時代編輯実録』上海交通大学出版社が出版されている。
タグ: / / / / / / /