《この記事を読むのに必要な時間は約 17 分です(1分600字計算)》
「ぽっとら」は、HON.jp News Blog 編集長 鷹野凌がお届けするポッドキャスト「HON.jp Podcasting」の文字起こし(Podcast Transcription)です。2025年4月1日に配信した第25回では、生成AIの普及がウェブや本の未来にもたらす影響について語っています。
#25 生成AIと本の未来
こんにちは、鷹野です。今回は「生成AIと本の未来」をテーマにお話したいと思います。生成AI、Generative Artificial Intelligenceです。これがみなさんにとって身近になったのは、2022年11月「ChatGPT」が登場してからでしょうか。
それ以前にもたとえば、「Google翻訳」のアルゴリズムがニューラルネットワークを利用したものに変更されたのが2016年11月です。「ChatGPT」が登場するちょうど6年前のことです。そのころから機械翻訳の精度って飛躍的に向上したと思うんですね。
もう海外のウェブサイトで配信されている情報をパッと把握するくらいの使い方なら、「Google Chrome」ブラウザの上で右クリックして「日本語に翻訳」ってやるだけで、もうパッと日本語に変わってしまう。もうそれだけで済んじゃうんですよね。ツークリックですよ。めちゃめちゃ便利になりましたよね。
この2016年というのはいろいろエポックメイキングな年で、囲碁の「AlphaGo」というGoogleが開発した対戦用AIが、人間のプロ囲碁棋士に勝った。囲碁で人間に勝つのは非常に難しいんじゃないかって言われてたんですけど、ついに勝った。そんなことがあったのも2016年でした。
で、その翌年の2017年には、「Transformer」という深層学習モデルがGoogleの研究者などから発表されて、自然言語処理の分野で広く利用されるようになっていきました。Google翻訳で採用されたアルゴリズムもこの「Transformer」ってやつです。
いま広く使われるようになった生成AIの多くが、この「Transformer」という深層学習モデルを基礎としているんですよね。Googleすげぇって話なんですけど。(いきなり話題になった)「ChatGPT」は、Googleを出し抜いたかっこうになりますよね。
OpenAIの「ChatGPT」も、この「Transformer」を使ってます。「ChatGPT」のうしろのGPTって、Generative Pre-trained Transformersの略です。「Transformer」が発表されてから5年で「ChatGPT」が登場した、ということになります。
そこからMicrosoftがOpenAIと資本提携して「Bing検索」に組み込んだり、Copilot、副操縦士という名前を付けて、「Word」とか「Excel」とか「Windows OS」そのものに組み込んだりしたもんだから、Googleもそれに対抗してガンガンあたらしいサービスを投入してきたりとか。
「Facebook」とか「Instagram」のMeta社も対抗して自社開発のモデルを出したりとか、「X(旧Twitter)」イーロン・マスクの会社も追随したりとか。まあ、いろんな動きが起きてます。Appleも遅まきながら、「iPhone」や「Mac」に「Apple Intelligence」というAI機能の搭載を始めました。「Apple Intelligence」はちょうど今日、これを収録している4月1日から日本でも展開が開始されました。
あとは中国のスタートアップ企業DeepSeekが、けっこう限られた計算能力でも高性能を発揮できるっていうAIモデルを、なんと無償で提供を始めたり――そういうオープンモデルを対抗して始めたりとか、などなど。生成A関連だとここ数年、もうほんと毎日のようにいろんなニュースがあって、ちょっと目を離してると話題に置いていかれるような状態になっているかと思います。
ChatGPTの“ジブリ風”画像生成
先週は、「ChatGPT」がまた新しくなって、アップグレードして新しい機能が追加されて、ジブリ風の画像が生成できるようになった。そんな話題でもちきりでしたね。モリアキさん、簡単に説明していただけますか?
はい、モリアキさんありがとうございます。これ、このポッドキャストをお聞きのみなさん、試されました? 私の周囲、とくに「Facebook」だとここ数日ですね、ニュースフィードにこのジブリ風の画像がビュンビュン飛び交っていて、ちょっとうんざりするような状況になっています。
まあ、3日もすればみんな飽きるかなと思ってたんですけど、「Facebook」のニュースフィードって数日前の投稿もレコメンドしてくるんですよ。だからまだ今日もジブリ風の画像だらけになってます。プロフィール画像もジブリ風に変える人が多くて「もういいよ! お腹いっぱいです」って気分になってます。
私は、こういうみんながウワッと殺到している状態のときって、静観するようにしてるんですよね。ハスに構えていると言ってもいいかもしれませんが。だからまだ触ってません。もう触らなくてもだいたい結果は見えますし、面白くもなんともないだろうなって思えてですね。今回は検証してみる気にもなれませんでした。
この流行ってるって状況の中、著作権法を独自解釈して合法だ違法だといろいろ騒ぐ声も見えるんですけど、今回は専門家の動きがすごく早かったですね。さきほどモリアキさんに紹介してもらった弁護士ドットコムの記事は、私が非常に信頼している、著作権法を専門とした弁護士・福井健策さんによる解説です。
非常に素早くて、非常にわかりやすい解説だと思います。著作権に限らず、利用する際に注意すべき点ってのが網羅されてまして、ああ、ほんとうにさすがだなと。私が「たぶんこれはこうだろうな」って思ってた見解とも相違ないことも確認できました。まだ読んでない方は、あとでぜひ読んでみてください。
生成AIが普及していくと、5年後、10年後にどうなる?
これ、技術的なところだとですね、「Stable Diffusion」とか「Adobe Firefly」なんかの、従来の画像生成AIで使われているのが「拡散モデル」といいまして、ランダムなノイズを加えて拡散させるプロセスってのを学習させて、逆に画像を生成するときはノイズを除去していく。除去していってデータを復元していくっていう仕組みが拡散モデルってやつなんですね。
ところがいま話題になってる「ChatGPT」の「GPT-4o」とか、「Google Gemini 2.0」ってモデルで採用されているのが「自己回帰モデル」というやつで、過去のデータと現在のデータをもとに将来の予測を行う。回帰分析ってやつですね。そういう手法になっているようです。
技術的なところではと言いながらですね、私も(技術は)よく分かってないところが結構あるんですけど。そういう難しい話は置いといてですね。これだけ話題になると、今後は画像生成のAIに関しても広く一般に知られるようになって、多くの人が利用するようになっていくんだろうなと。そんなことを感じてました。
でね? 今回のテーマは「生成AIと本の未来」なんですけど、これからこの生成AIってやつがもう当たり前の存在として世間一般に普及していくわけですよね。そうなったとき、これから5年後とか10年後くらいに、本を取り巻く環境というのがどんな状態になっているだろうか? というね。まあ、たぶん当たらない、当たらない占いみたいな話をしてみようかな、というふうに思いました。
私は楽天的なんで、あんまり悲観的な予想はしないです。こうなったらいいなっていう、希望的観測を2つほど挙げます。ほかにもいろいろ思いついたんですけど、ちょっとめちゃくちゃ長くなっちゃいそうだったので、今日は2つだけお話しします。
―― この続きは ――
《残り約6000文字》







