第57回生成AIと真夏の夜の夢

ここしばらく身辺多忙で間が空いてしまったものの、前回紹介したように、ソースコードが公開されたOpenGPUカーネルモジュールを組み込んで、Plamo LinuxでもNVIDIA GPUを使えるようにし、さっそく当初の目的だった画像生成AI、StableDiffusionを動かしてみました。

GitHubで公開されている、ブラウザ経由でStableDiffusionを操作できるstable-diffusion-webuiを試したところ、特にシステム側に修正を加える必要もなく動作し、指定したキーワードに沿った綺麗な画像が生成できました。

"StableDiffusion"の動作の仕組みは理解できていないものの（苦笑⁠）⁠、画像生成のきっかけとなるランダム・シードが1つ違うだけで全く異なる画像が生成されますし、同じランダム・シードを使っていてもサンプリング・メソッドやステップ数を変えるとまた違った画像が生成されるあたりは、運だのみのガチャ的な要素もあって面白いところです。

さらに、HuggingFaceやCivitaiでは、さまざまな特徴を持つ「モデル」が多数公開されており、写真のようなリアルタッチから、アニメ風、よりデフォルメされたマンガ調まで、さまざまな画像が生成できるようになっていて、あれこれ試していると、時の経つのを忘れてしまいます。

このように、"StableDiffusion"のような画像生成AIを使えば、筆者のような絵心の無い人間でも簡単に好みの画像を作成して楽しむことができます。

一方、この技術に対し否定的な意見を持つ人々もいます。いわく、画像生成AIが使う「モデル」は既存の画像を元にしているので、たとえ著作権は侵害していないとしても、画像生成AIを使うことは元画像の作者を含めた「クリエイター」たちの権利を侵害し、彼らの生活を苦境に追いこむことになる、のだそうです。実のところ、この種の意見は結構根強く、AI画像を使ったポスターや投稿が叩かれて炎上する例はしばしば見られます。

このあたりは「現代版ラッダイト運動」のようなもので、しだいに収まってくるだろうとは思うものの、自分の作った「作品」に対する思いは分野によってずいぶん異なるのだなぁ、と、あらためて気づくことができたので、少しそのあたりについて考えてみました。

CopyrightとCopyleft

才能あふれるクリエイターが心血を注いで作りあげた「作品」は、作者の不可侵な分身であり、利用方法を含めた一切の権利は作者に属する、というのが著作権法の基本的な考えです。著作権（copyright）は、文字通り「複製（copy⁠）⁠」作りに関する「権利（right⁠）⁠」であり、当初の対象だった印刷や出版物から、技術の進歩と共に写真や録音、録画へと範囲が広がりました。

その中でも異色なのがコンピュータのプログラムです。というのも、著作権法が想定する「著作物」とは「思想又は感情を創作的に表現したもの」なのに対し、プログラムは「作者の思想や感情の表現」と言うよりも「コンピュータに対する指示」に過ぎないからです。

もちろん「プログラム」も著作権法の保護対象であり、日本の著作権法では、第十条の「著作物の例示」の中で、「⁠映画の著作物」や「写真の著作物」と並んで「プログラムの著作物」が位置づけられています。

プログラムはコンピュータの動き方の指示なので、思想や感情を表現した「作品」よりは、コンピュータを使うための「道具」に近いと考えることもできます。事実、最初期のコンピュータ用プログラム（ソフトウェア）は、高価なコンピュータ（ハードウェア）のおまけとしてやりとりされ、ユーザ同士が互いに情報交換して、改造、機能追加し、よりよいものに育てていました。

その後、コンピュータが普及していくにつれ、プログラムの持つビジネス的な価値が高まり、プログラムの内容を記述したソースコードは企業秘密として囲い込まれていきます。その結果、ソースコードを共有して育てていくコミュニティは崩壊していきました。

その状況に一石を投じたのがリチャード・ストールマン氏のGNUプロジェクトです。彼は、権利者が全てを所有する「著作権（copyright⁠）⁠」のパロディとして、「⁠コピーレフト（copyleft⁠）⁠」という概念を提唱し、プログラムのソースコードの公開と共有、改造を認めるような「一般公衆利用許諾契約（GPL:General Public License⁠）⁠」を定めました。そして、そのライセンスに従って利用されるプログラムを「フリー（自由）ソフトウェア」と呼び、そのような「フリーソフトウェア」のみでUNIX互換のOS環境を作ることを目指しました。

1983年に始まった彼の「フリーソフトウェア」運動は、次第に参加者を増やしてUNIX互換OSに必要なパーツを揃えていき、1991年にOSの核となるカーネルとしてLinuxが開発されたことで実際に動作するOS環境が完成、その後の「フリー/OSS」論争などを経ながらも現在のFOSS（Free/OpenSource Software）へと発展していきます。

筆者のようなFOSSに共鳴する人間にとっては、自分の書いたプログラムは「作品」ではあるものの、他の人が使ってくれれば嬉しいし、改造して機能を追加してもらったりするともっと喜びます。というのも、自分が使っているLinuxをはじめ、Xウィンドウ・システムや各種デスクトップ環境、エディタやコンパイラといったプログラムがそういう過程を経て成長し、便利で高機能になってきたことを知っているからです。

もちろん「思想又は感情を創作的に表現した」詩や小説、イラストといった「作品」とコンピュータを動かすための手順である「プログラム」では作者の思い入れの強さも違うのでしょうが、過去数十年のFOSSの急激な発展を目にしてくると、「⁠作品」の「利用条件」を少し緩めるだけで、もっと新しい可能性が生まれてきそうに思います。

クリエイティブ⁠・コモンズ

このように考えるのは筆者だけではありません。FOSSの成功を背景に、プログラム以外の著作物、すなわち文芸作品や写真、音楽、絵画といった分野でも、「⁠コピーレフト」的なライセンスで作品をより広く利用できるようにしよう、という試みが始まっています。それが「クリエイティブ・コモンズ（CC：Creative Commons⁠）⁠」です。

CCはGPLのアイデアをソフトウェア以外の分野にも適用することを目指し、作者の「作品に有するあらゆる権利（=著作権⁠）⁠」を認めた上で、あらかじめ指定した条件を守る限り、他者による作品の利用を積極的に認めよう、と提案しています。条件（ライセンス）の詳細はCCのサイトを参照していただくこととして概略のみを紹介すると、CCでは「作者のクレジットの表示（BY⁠）⁠」⁠、「⁠改変禁止（ND⁠）⁠」⁠、「⁠非営利（NC⁠）⁠」⁠、「⁠利用条件の継承（SA⁠）⁠」の4種の大きな条件を設定し、これらを組み合わせて作者が作品の使われ方を指定できるようになっています。

たとえば、ボーカロイドの「初音ミク」の画像は「表示-非営利（BY-NC⁠）⁠」の条件になっているので、営利目的でなければ自由に利用でき、改変（ネギを持たせたり、2頭身化したり）することも可能です。一方、自分の作品を多くの人に見てもらいたいけど、かってに商用利用されたり、改造してネタ画像にされたくない場合は「表示-非営利-改変不可（BY-NC-ND⁠）⁠」としておけばいいでしょう。

CCは不特定多数の利用者との契約で、特定個人との契約を妨げるものではありません。すなわち、「⁠初音ミク」の場合、“⁠BY-NC⁠”の条件を守れば誰でも使えるものの、権利者（クリプトン・フューチャー・メディア社）と直接契約を結べばCMやコンサートといった商用利用も可能になります。

著作権をきちんと守ろうとすると、ある作品に関するイラストを描いたり同人誌等で二次利用する際には、いちいち事前に権利者の許諾を得なければなりません。そのような手間を省いて、あらかじめ決められた使い方のルールに従う限り「作品」を簡単に利用できるようにしよう、というのがCCの目的です。

「コミック・マーケット」等の同人文化が広まっている日本では「黙認」という形での二次利用が慣習化しています。「⁠黙認」は、ある意味では権利者にも利用者にも便利な方法なものの、成文化されたルールではないのでトラブルが生じがちです。

「著作権」は「作者」が心血を注いで創作した「作品」を守るための権利です。しかしながら、どのような「創作物」も無から生まれたわけではなく、その作品に至るまでの歴史や文化の蓄積の上に成立しているはずです。

著作権法の下では、ある作品が誰でも使える「歴史や文化の蓄積」の一部になるためには、作者の死後一定期間が経過して、著作権が消滅するのを待つ必要があります。CCは、著作権に守られた作品も利用条件を定めることでこの蓄積の中に取り込んでいこう、という試みとも言えます。

「クリエイティブ・コモンズ」の「コモンズ」とは、かっての村落社会に存在した、燃料となる薪や家畜の餌となる草を地域住民の誰もが採集できる「共有地」の謂（いい）で、その「共有地」のような存在を著作物の世界に作り出そう、というのが「クリエイティブ・コモンズ」の名前の由来です。

自らの作品は自分の「創作物」ではあるものの、今までに学んできた過去の無数の作品の上に成立している、そう考えればクリエイターも謙虚になれるし、画像生成AIの価値を認めることもできるのではないでしょうか。

たとえば、過去の膨大な棋譜を学習した囲碁や将棋のAIは、もはや人間が敵（かな）う相手ではありません。しかし、囲碁や将棋は絶対的な強さを求めるのではなく、対戦相手に勝つことが目的の競技なので、藤井聡太七冠をはじめとする棋士たちは、将棋AIをアシスタントに日夜新しい可能性（＝手順）を研究しているそうです。

クリエイターたちも、画像生成AIを仕事を奪う競争相手と見るのではなく、過去の膨大な画像データを蓄えた巨大なデータベースと見ることができれば、それを相棒に、今までに描かれたことのない、あらたな表現の可能性を拓（ひら）いていけるのではないでしょうか。

寝苦しい夏の夜、StableDiffusionであれこれ遊びながら考えたことを綴ってみました。

最近は画像生成AIだけでなくコード生成AIも普及し、こちらの方でも学習に利用したコードの著作権やライセンス違反が問題となっています。

これらの問題の根本は、インターネットから無料で集めた素材を使って教育したAIで有料サービスを提供する「フリーライダー（ただ乗り⁠）⁠」的なビジネスモデルと考えています。

しかしながら、感情論はさておき、現行の著作権法やそれに基づくさまざまなライセンスは、著作物としての「作品」を守るように設計されているので、AIによる機械学習のような「使い方」を縛るのは難しいでしょう。

このような法規制が追いついていない分野はさまざまな問題を抱えてはいるものの、新たなフロンティアとして大きな経済圏になる可能性も秘めています。動画投稿サイトが違法アップロード問題に苦しみながらも影響力を高め、「⁠ユーチューバー」という新しい職業を生み出したように、生成AIとクリエイターが共栄できるような経済システムの誕生を夢見ています。