「メディア系団体が“世界AI原則”を発表」「写真素材サイトで無断転載」「生成AIが記事盗用」など、週刊出版ニュースまとめ&コラム #586(2023年9月3日~9日)

ブックファースト ルミネ新宿店

《この記事は約 14 分で読めます(1分で600字計算)》

 2023年9月3日~9日は「メディア系団体が“世界AI原則”を発表」「写真素材サイトで無断転載」「生成AIが記事盗用」などが話題に。広い意味での出版に関連する最新ニュースから編集長 鷹野が気になるものをピックアップし、独自の視点でコメントしてあります(ISSN 2436-8237)。

【目次】

政治

新聞業界が難癖「NHKテキストニュース」の行方 「地方紙のデジタル化」が成功しない納得理由 | メディア業界〈東洋経済オンライン(2023年9月4日)〉

 以前、日本新聞協会が「NHKはネットのテキスト業務から撤退すべきだ」と主張しているニュースをピックアップしました(#582)。メディアコンサルタントの境治氏によると、日本新聞協会のロビー活動によって「公共放送WGは新聞協会の言い分を大幅に認めた」方向へ舵を切ったそうです。

 8月29日の報告書(案)には「理解増進情報は廃止」とあるものの、よくよく読むとテキストニュースも必須業務化されると書かれていたそうです。ところが、8月31日の親会に提出された報告書(案)からは「時間的制約のために載り切らなかった情報など」というフレーズが削除されていたとのこと。

 なんというか、ギリギリのところでせめぎ合いが行われている感があります。とりまとめ(案)についての意見募集が始まっているので、私は、従前からの主張「過去記事を消すな」を提出してみようと思います。

 意見提出期限、短いな……。

報道・メディア26団体が「世界AI原則」を発表、日本新聞協会も〈朝日新聞デジタル(2023年9月6日)〉

 こちらも日本新聞協会関連。アメリカ・欧州・韓国・ブラジルなどの報道・メディア系団体とともに「世界AI原則(Global Principles on Artificial Intelligence)」へ署名したそうです。日本新聞協会のリリースはこちら

 主張されているのは、知的財産(Intellectual Property)・透明性(Transparency)・説明責任(Accountability)・品質と誠実さ(Quality and Integrity)・公平性(Fairness)・安全性(Safety)・設計により(By Design)・持続可能な開発(Sustainable Development)の8項目。原文を機械翻訳でざっと読んでみた感じ、まあ、当たり前ですが「権利者に都合の良い主張」という印象です。

生成AIの開発「透明性確保を」指針案 G7閣僚声明〈日本経済新聞(2023年9月7日)〉

 そして、G7広島サミットを踏まえた「広島AIプロセス」閣僚級会合でも、懸念される主要な分野として「透明性、偽情報、知的財産権、プライバシーと個人情報保護、公正性、セキュリティと安全性」などが特定されたとありました。「世界AI原則」とけっこう共通しています。

 個人的には、とくに「透明性」については「確かになあ」という印象があります。OpenAI社がGPT-4から学習データセットやトレーニング内容を非公開としたことには、わりと不信感を抱いています。GPT-3の学習データセット「Books2」の中身は何? とか。OpenAIって社名のわりに、とくに最近のやり方はオープンじゃないですよね。

社会

「NURO 光」広告に既存イラストを使用? 写真素材サイトの無断転載が原因か…… イラストレーターの訴えに「広告は急遽停止」と謝罪〈ねとらぼ(2023年9月4日)〉

 こわ! この訴えをきっかけに、写真素材サイト「Bigstock」のユーザーが無断転載と思しきイラストを多数投稿していることが明らかになったそうです。こわいこわい。イラストレーターが被害者なのはもちろんですが、無断転載だと知らずに使ってしまった「NURO 光」もある意味被害者なのでは。

 それとも、素材サイトにある画像すべてを、利用者は疑ってかかるべきなのでしょうか? あるいは、このユーザー大丈夫かな? と過去投稿をチェックするくらいの用心深さが必要なのでしょうか。そんな素材サイト、はじめから使わないほうがマシかもしれません。

 いまの技術なら、ユーザーが登録する前に類似画像検索で弾くなどの予防措置がシステム的に可能だと思うんですよね。類似画像検索APIなんかも提供されてますし。登録後だと、仮に利用者が類似画像を検索しても、すでにその画像が使われてるサイトが山ほど引っかかってくる可能性が高いわけで。

日米韓3ヶ国比較:マンガ・WEBTOON・アニメに関する動向調査~マンガ編~〈MMD研究所(2023年9月5日)〉

 面白いレポートなんですが、ちょっと考え込んでしまいました。「あなたがマンガを読む形式」の選択肢に「アプリ」と「電子書籍を購入&ダウンロード」があるんですが、この違いを一般ユーザーは認識できるのでしょうか? なんとなく「アプリ」は基本無料のサービスで、「電子書籍を購入&ダウンロード」はいわゆる電子書店のことかな? という印象はありますが、厳密な区別は難しい。たとえば「ebookjapan」みたいに両方の性質を備えたサービスもあるわけで。

 国によるユーザーの違いは、素直に面白い(interesting)と思いました。「読んだことのあるマンガが制作された国」で、日本以外のどの国のユーザーも、日本制作より韓国制作のほうが多いんですよね。とくにアメリカのユーザーでは、日本制作8.2%、韓国制作32.9%と、意外なほど差が付いています。数字を素直に読めば、ワールドワイドで横読みはすでに縦読みに負けている、ということになるでしょうか。ほんとかなあ?

成熟期を迎えた ソーシャルメディア 。「ネタ」投稿で生き残るか、「手堅い」目的に特化すべきか〈DIGIDAY[日本版](2023年9月6日)〉

 言い替えれば、バズ狙いでいくのか、コツコツいくのか。ブランド公式アカウントの運用に関する話ですが、クリエイターの個人アカウントにも同じことが言えるだろうな、と感じました。インフルエンサーになりたいならバズ狙いなんでしょうけど、クリエイターの場合、影響力を高めたいというより「自分の作品を見てもらいたい」だと思うんですよね、本質的には。作品でバズるに越したことはないのですが、バズを狙った作品ばかりだと、方向性が歪んでいく恐れもあるという。アルゴリズムの変更に振り回されたりもしますし。難しい。

経済

08月22日に公開された記事につきまして〈The HEADLINE(2023年8月23日)〉

 本稿執筆時点より少し前の記事ですが、はてなブックマークのホットエントリーに入っていて気付きました。日経クロステック・日本経済新聞に掲載された文章をそのまま用いた「剽窃・盗用に該当すると言える箇所が確認」できる記事を公開していた、という謝罪文です。

 なぜわざわざこれをピックアップするのかというと、弁明の中に「当該記事は本誌記者による執筆ではなく、弊誌がβ版として開発・検証をおこなっている生成系 AI によって生成された記事でした」という記述があるから。つまりこれは、生成AIの出力が既存の著作物と酷似していたケースなのです。辻正浩氏によると「日本で本格的な問題化は初めてかな?」とのこと。

 海外では以前、画像生成AIの「Stable Diffusion」が、学習データセットとほぼ同一の画像を生成する場合があるという研究報告がありました。重複しそうなサンプルで1億7500万枚生成して94枚が酷似という低確率(約170万分の1)ですが、決してゼロではないことを実証しています。

 元の著作物が学習データセットに含まれていれば依拠性は認めてよいのでは、という法見解が優勢だとすると、生成AIを利用するうえではそういうリスクもあることを認識しておく必要があります。先日の「HON-CF2023」規制セッションで、弁護士・福井健策氏が「こういう場合は損害保険の出番」とおっしゃっていたのが印象的でした。

 本件の場合、謝罪文に「同 AI は、GPT4 をベースとしてファインチューニングおよび独自データベースとの繋ぎ込みなどをおこなったものです」という記述もあり、その内容次第では「偶然による事故」とは言い難い可能性もあります。日経クロステックの元記事が8月22日公開で、類似記事も同日公開だった点は指摘しておきたい。

 つまり、速攻で真似して記事化して、すぐ指摘され削除し、翌日には謝罪文を公開しているわけです。発覚後の対応も素早いけど、そもそもの記事化もめちゃくちゃ素早い。「過去に生成された AI 記事も非公開」とありますが、どこまで自動化されていて、どれくらいの規模で行われていたんでしょうね?

「ニュースを盗む」生成AIで検索最適化、それをブランド広告が支える仕組みとは?〈新聞紙学的(2023年9月4日)〉

 関連して、生成AIによるコンテンツファーム問題です。ニュースを自動収集し、生成AIでSEO対策を施したリライトを行い公開、広告で稼ぐというもの。「盗用チェックツールをすり抜けるケースも多い」とのことですが、「生成AI特有のエラーメッセージ」が混入していてバレてるのが馬鹿っぽい。

 これも先日の「HON-CF2023」規制セッションで、デジタルハリウッド大学教授の橋本大也氏が「リライトしてあっても類似性がチェックできるツールはすでにある」とおっしゃっていたのを思い出しました。恐らくGoogleなら、こういうのは検出できる(そしてペナルティを食らわす)と思うんですよね。

Microsoft、生成AI「Copilot」の企業顧客が著作権侵害で提訴されたら「責任を持つ」〈ITmedia NEWS(2023年9月8日)〉

 さらに関連して。「一部の顧客も訴訟リスクを懸念している」のに応えて、とのことです。「損害保険の出番」の前に、自ら責任を負う宣言。それだけ自信がある、ということでもあるでしょう。あるいは、そのリスクを織り込んだ上で、月額30ドルという価格設定なのかも。

集英社 第82期決算は増収減益 デジタル収入が前期比15.9%増〈文化通信デジタル(2023年9月4日)〉

 先週の本欄で「デジタル収入の金額は(少なくとも新文化の報道では)明かされていません」と取り上げたばかりですが、括弧書きしておいて正解でした。デジタル収入、ばっちり公開されています。新文化はなぜ伏せたんだろう?

 ともあれ、これで大手4社の直近決算から、以下のような現状であることがわかります。括弧内は、各社の総売上に占める割合です。

講談社:事業収入 1001億7200万円(59.1%)、うちデジタル関連収入 778億円(45.9%)
小学館:デジタル収入 451億9200万円(41.7%)、版権収入等 106億5700万円(9.8%)、計558億4900万円(51.5%)
KADOKAWA:電子書籍 531億9620万円(20.8%)、出版以外のセグメント1154億3900万円(45.2%)、計1686億3520万円(66.0%)
集英社:デジタル 698億1000万円(33.3%)、版権収入563億1100万円(26.9%)、計1261億2100万円(60.2%)

 4社とも、紙の出版事業以外が5割~6割以上を占めています。もはや伝統的な「出版社」というより、コンテンツ・パブリッシャーと呼んだほうが良いでしょう。そして恐らくこれは、マンガをやっていない中小出版社とはまったく状況が異なると思われます。

KDP での出版プロセスへの AI に関する質問の追加〈KDP Community(2023年9月7日)〉

 今後、KDPで新たに出版(もしくは既刊を編集して再出版)する際には、その本の内容がAI生成コンテンツかどうかを尋ねるメッセージが表示されるようになるそうです。求められているのはアマゾンへの「正確な通知」までで、いまのところAI生成コンテンツが「除外」されるわけではなさそう。とはいえ、いままでは野放しに近い状態だったことを思うと、少し規制を強める方向に舵を切った感があります。

 「正確な通知」が行われていないのに、利用者からの報告などによりAI生成コンテンツだと疑われるような場合は、ガイドライン違反として出版停止措置やアカウント停止措置も行われる可能性があります。まずは、正直に申告することが重要でしょう。また、申告したうえで出版前審査が厳しくなる可能性も考えられます。類似性と依拠性をチェックするため、プロンプトなど生成プロセスの追加提出が求められるかも?

関係性開示:アマゾンジャパンは、HON.jpの法人会員として事業活動を賛助いただいています。しかし、本欄のコメント記述は筆者の自由意志であり、対価を伴ったものではありません。忖度もしていません。

技術

グーグルの視覚支援アプリ「Lookout」、AIで画像の説明を自動生成〈CNET Japan(2023年9月6日)〉

 キャプションやALTテキストがない画像でも、AIが文章で説明してしてくれるそうです。EPUBアクセシビリティの規格では画像のALTテキストが要求されており、作業負荷の増大が懸念されていました。でも、いずれAIが解決しちゃうかも――なんてことを想像していたのですが、思っていたより早く実現されそう。制作工程でALTテキストを自動で埋め込むようなことも可能でしょうし、過去のコンテンツもそのうちビューア側が自動処理してくれるようになりそう。技術の正しい使い道ですね。

お知らせ

「HON-CF2023」について

 ことばの表現と市場の課題をテーマに語り合ったオープンカンファレンス「HON-CF2023」全セッションの録画が視聴できる「リモート参加チケット」は9月末まで購入できます。

HON.jp「Readers」について

 HONꓸjp News Blog をもっと楽しく便利に活用するための登録ユーザー制度「Readers」を開始しました。ユーザー登録すると、週に1回届く HONꓸjp メールマガジンのほか、HONꓸjp News Blog の記事にコメントできるようになったり、更新通知が届いたり、広告が非表示になったりします。詳しくは、こちらの案内ページをご確認ください。

日刊出版ニュースまとめ

 伝統的な取次&書店流通の商業出版からインターネットを活用したデジタルパブリッシングまで、広い意味での出版に関連する最新ニュースをメディアを問わずキュレーション。TwitterやFacebookページは随時配信、このコーナーでは1日1回ヘッドラインをお届けします。
https://hon.jp/news/daily-news-summary

メルマガについて

 本稿は、HON.jpメールマガジン(ISSN 2436-8245)に掲載されている内容を同時に配信しています。最新情報をプッシュ型で入手したい場合は、ぜひメルマガを購読してください。無料です。なお、本稿タイトルのナンバーは鷹野凌個人ブログ時代からの通算、メルマガのナンバーはHON.jpでの発行数です。

雑記

 10周年記念イベントへ向けて全力疾走だったので、終了後はしばらく腑抜けになっていました。HPもMPもかなり減っちゃって、なかなか回復しない。まともに稼働できる時間が普段より短く、すぐ眠くなっちゃう感じでした。でも、そろそろ元に戻ってきたかな?(鷹野)

CC BY-NC-SA 4.0
CC BY-NC-SA 4.0
※本稿はクリエイティブ・コモンズ 表示 – 非営利 – 継承 4.0 国際(CC BY-NC-SA 4.0)ライセンスのもとに提供されています。営利目的で利用される場合はご一報ください。

広告

著者について

About 鷹野凌 793 Articles
HON.jp News Blog 編集長 / NPO法人HON.jp 理事長 / 日本電子出版協会 理事 / 日本出版学会理事 / 明星大学 デジタル編集論 非常勤講師 / 二松学舍大学 エディティング・リテラシー演習 非常勤講師 / デジタルアーカイブ学会 会員 / 著書『クリエイターが知っておくべき権利や法律を教わってきました。著作権のことをきちんと知りたい人のための本』(2015年・インプレス)など
タグ: / / / / / / / / / / / / / / / / / / / /

コメント通知を申し込む
通知する
0 コメント
インラインフィードバック
すべてのコメントを見る