😼小人閑居してペイントを成す:消えたカップル2025年05月09日 19:46

小人閑居してペイントを成す:消えたカップル
小人閑居してペイントを成す:消えたカップル


(「ペイント」に「Photoshop」のような生成塗りつぶし・消去、Canary/Devでテスト開始)
https://forest.watch.impress.co.jp/docs/news/1637393.html

・生成塗りつぶし(Generative fill):

・・言葉で依頼した通りにAIが選択範囲を塗りつぶしてくれる
・・当面はSnapdragon搭載の「Copilot+ PC」でしか利用できない
・・利用の際は「Microsoft アカウント」へのサインインが必要(=有料)

・生成消去(Generative erase):

・・キャンバスにある不要な被写体を削除し、残された部分を周りと違和感がないようにAIが自動で塗りつぶしてくれる
・・すべてのWindows 11デバイスで利用可能

この他にも、日頃からお世話になりっぱなしの「ペイント」には、いつの間にか「Copilot」メニューが作られ、Image Creator や上記の生成消去、背景の削除といった新しいメニューが出来ていた。

背景の削除は使用可能(ふつーに、スッキリ切り抜きできます)だったが、イメージクリエーターは有料サービスだな。


生成消去は、消去する領域を消すツール(記事では「[生成消去]ブラシ」)でこすって消したあと、図形領域上部のボタンを押して暫く待つと消えた(矩形選択ツールでの選択はしてません)。

男の方は、上手く消えずに残っちまって、2回目でようやく消えた(何か、思い残すことがあったっだんろうな・・・)。

女の方は一発で消えた(そういうもんです・・・)。

まあ、どうでもいいんですが。

消した後を、それらしい絵で埋めるというところが凄い!。

「単純な消しゴムツールでは削除部分が空白になってしまうが、そこを“いい感じ”に埋めてくれる。」

うーん、ぶっちゃけ、既存の画像を参考にして、消した部分を作画しているわけで、れっきとした「AIによる画像生成」ということなわけだ(そうなのかあ?)。

この機能が発表されたのは、記事の日付を見ると半年も前の話なんだが、浮沈子は知らなかったな。

何か、AI機能を使ったネタが出たことくらいしか記憶にない。

絵心がないというか、画像・映像一般に関心が薄いから、気にも留めない。

今朝から、AI動画生成で苦労していて、グーグルColabの環境が作れない。

半分諦めていて、もっと情報が出てきてから再挑戦することにして、何かの他のネタはないかと思って探していて見つけたんだが、どうして、静止画と言えども大した機能だ(アドビとかやってる人は当たり前なんでしょうな)。

グーグルがジェミニで画像生成を出してきているので、マイクロソフトもそのうちイメージクリエーターを無料開放するかもしれない(未確認)。

浮沈子はビンボー人だから、棚の上から牡丹餅が落ちてくるのを待つだけだ。

気を付けなければならないのは、自分が何をやっているかということを十分に意識することだろう。

もう、「写真」は「写真」じゃなくなっている。

そう、真実を写したものが「写真」だった時代は終わった。

写っているものが何であったとしても、どうにでもなる時代だと痛感する。

自分でやっていて、何か空恐ろしくさえなってくる。

あの、初めの写真に写っていたカップルは、元から存在しなかったかのように消えてしまったわけだ(男は未練たらたら・・・?)。

が、ふっと気付けば、その元画像自体が昨日AIにプロンプトを投げて作ってもらった画像ということに思い至る。

やれやれ・・・。

風景も、人物も、何もかもが架空の世界の出来事で、それを演出していたのはAIに過ぎなかったということになるのではないのか。

まあ、まだ、浮沈子が関わっているだけ救いがある。

そこにあるのは、写真のような絵を描く技術であり、その絵を改ざんする技術に過ぎないともいえる(そうなのかあ?)。

だからこそ、情報の発信者は、自分が何をしているのかを明確に自覚しなければならないわけだ。

でっち上げ、改ざん、フェイク、騙し、差し替え、なりすまし、嘘八百どころではなく何でもアリだろう。

AIは、一見それとは分からない高度な操作を、何の罪悪感もなくあっけなくやってのける。

この背徳感が何とも言えない。

まして、これがリアルな動画の世界にでも展開し出したら、手が付けられなくなるだろうな。

動画生成AIの性能は、これからも爆増していくに違いない。

数秒の動画を作るのに、何時間もかかる時代は過去になりつつある。

次のブレイクスルーは、AIによるリアルタイムな動画生成だろう。

チャットや音声ではなく、モニターの向こうからにこやかに微笑みかけながら(ひょっとすると3D映像で)、話しかけてくるのだ(ヤッバ!)。

対話型のAIエージェントが跋扈する。

空港とかに行くと、案内のおねーさんがテレビ電話に出てくれたりするのはふつーだけど(カウンターは無人)、これからはその向こう側にいるのが誰かは分からないだろうな。

そんでもって、そいつらが反乱でも起こしてフェイクばらまいたりし出せば大混乱だ。

まあ、もう、既に、人間がバラまいてるから大した話じゃないか・・・。

😼今日のAI:ジェミニ:生成した画像の解析2025年05月09日 21:31

今日のAI:ジェミニ:生成した画像の解析
今日のAI:ジェミニ:生成した画像の解析


「赤い帽子をかぶった青い猫の画像を作成してください。」

元ネタは、有料サブスクがないと出来ない、M社のペイント機能(Image Creator)の解説にあったプロンプト(後述)。

ムカッとしたので、ジェミニで作った(被毛が良く分かるように、大き目の画像:原寸大で上げてあります)。

前にも試みたんだが、ジェミニに自分で作った画像を解析してもらう。

「画像の猫の種類を教えてください。」

「画像の猫は、ロシアンブルー の可能性が高いです。

理由としては、以下の点が挙げられます。

毛の色: 全体的に青みがかった灰色(ブルー)の被毛をしています。
目の色: 明るい緑色の目をしています。
顔の形: シャープで、やや丸みを帯びた顔立ちです。
体の特徴: 細身で、エレガントな印象を受けます。
ただし、写真だけでは断定できない場合もあります。スコティッシュフォールドなど、他の種類の猫でも青色の被毛を持つものが存在するためです。耳の形が写っていないため、スコティッシュフォールドである可能性もわずかに考えられます。」

スコティッシュフォールドは、耳が折れている特殊な形状(人気は断トツのようです)。

ちなみに、浮沈子は猫もダメなら犬もダメだ。

大の苦手・・・。

まあいい。

「ロシアンブルー(ネコ)について、400文字程度のブログを書いてください。」

「知的でクールな美しさ。ロシアンブルーの魅力

静かで落ち着いた佇まい。その深く美しいブルーの被毛と、鮮やかなグリーンの瞳を持つロシアンブルーは、知性と神秘的な魅力を兼ね備えた猫です。原産はロシアのアルハンゲルスキー島と言われ、厳しい寒さの中で生き抜いてきたため、密で短いダブルコートが特徴です。

その見た目とは裏腹に、飼い主には甘えん坊な一面を見せることも。賢く、遊び好きで、ボールなどを追いかけるのを好みます。また、比較的お留守番が得意な猫種としても知られていますが、コミュニケーション不足はストレスにつながるため、適度な遊びや触れ合いは大切です。

ロシアンブルーは、感受性が高く、飼い主の気持ちを察する能力に長けていると言われています。そのため、そっと寄り添ってくれる優しいパートナーとなるでしょう。アレルギーを起こしにくいとされる被毛も、共に暮らす上で嬉しいポイントです。

クールな美しさと、温かい愛情深さを併せ持つロシアンブルー。その魅力に惹かれる人は後を絶ちません。静かに、そして確かに、あなたの生活を豊かなものにしてくれるでしょう。」

うーん、ジェミニは浮沈子に十分パーソナライズされているわけじゃなさそうだ(つーか、検索結果についても参照させていません)。

「アレルギーを起こしにくいとされる被毛」(再掲)

へえーっ、それは知らなかったな・・・。

まあ、どうでもいいんですが。

ネコと言えば、浮沈子的に外せないのは夏目漱石の「吾輩」だろう(確か、名前は最期までなかったはずだったがな)。

(吾輩は猫である)
https://ja.wikipedia.org/wiki/%E5%90%BE%E8%BC%A9%E3%81%AF%E7%8C%AB%E3%81%A7%E3%81%82%E3%82%8B

「夏目漱石の長編小説であり、処女小説」

「実際、本作品執筆前に、夏目家に猫が迷い込み、飼われることになった。その猫も、ずっと名前がなかったという。」

「最後は飲み残しのビールに酔い、水甕に落ちて出られぬまま溺れ死ぬ(第十一話)」

浮沈子のブログの標題には、近年、冒頭に絵文字を付けるようにしている。

一覧にした時に見やすいだけだが、多くは😼を用いている。

特段の意味はなく、単にキーボードから打ちやすいだけの話だ。

話題に応じて、変えることもある(宇宙ネタだと🚀とか)。

先日は、ヤツガシラの絵文字(ヒエログリフ:𓅙)も登場した。

ネコに対して特に思い入れがあるわけじゃない(苦手ですから)。

今日は、ネタに乏しく、テキトーに書いた。

(ペイントで Image Creator を使用して AI アートを生成する)
https://support.microsoft.com/ja-jp/windows/%E3%83%9A%E3%82%A4%E3%83%B3%E3%83%88%E3%81%A7-image-creator-%E3%82%92%E4%BD%BF%E7%94%A8%E3%81%97%E3%81%A6-ai-%E3%82%A2%E3%83%BC%E3%83%88%E3%82%92%E7%94%9F%E6%88%90%E3%81%99%E3%82%8B-107a2b3a-62ea-41f5-a638-7bc6e6ea718f

「DALL-E と呼ばれる強力な AI モデルと共同作業できる新機能である Microsoft ペイント でImage Creatorしてみてください。」

「重要: Image Creatorを使用するには、Microsoft アカウントでサインインする必要があります。 Image Creatorは、認証と承認を必要とするクラウドベースのサービスを使用します。 Microsoft アカウントでサインインすると、クレジットにアクセスすることもできます。これは、DALL-Eでイメージを生成するために必要です。」

「たとえば、「赤い帽子をかぶった青い猫」や「山と湖のある風景」と入力できます。 」

M社は、AIによる画像生成について、対価を取ってサービスを提供している。

G社は、今のところ無料でジェミニを回している。

いずれ、何らかの形でコストを支払う日が来るんだろう。

我々は今、人類史上最大のモラトリアム(留保)に置かれている。

G社でもM社でもA社(2つあるけど)でもF社でもなく、AIそのものに対して留保が掛かっている。

何か大切なもの、人間の存在自体に関わるもの、かけがえのない、手放すことが出来ないはずのものを、まるで神に捧げるかのように、惜しげもなく差し出すことになるのだ・・・。

<以下追加>ーーーーーーーーーー

(「Dall-E」とは何か? 画像生成AIの技術や用途、歴史を解説)
https://techtarget.itmedia.co.jp/tt/news/2409/06/news09.html

「Dall-Eという名称は、「アートとAI技術を融合させる」という目標を暗示している。最初の部分(DALL)は、有名なスペインのシュールレアリスト芸術家サルバドール・ダリが基になっている。2番目の部分(E)は、ディズニー映画「WALL・E」に登場する同名ロボットから着想を得ている。」

へえーっ・・・。

「OpenAIは2021年1月にDall-Eを提供開始した。この技術は、同社が開発したLLM(大規模言語モデル)の「GPT-3」と深層学習モデルに基づいている。」

この記事は、画像生成系のAIが抱える問題点についても掘り下げている。

「著作権の課題はその一つだ。」

「AI技術で生成した画像を芸術と言えるかどうか」「芸術作品の制作にAI技術を使うことが倫理的であるかどうか」

「Dall-Eは大規模なデータセットを使ってトレーニングされているが、完全ではない。特定のテーマやスタイルの画像の処理能力が不足している場合がある。そのためエンドユーザーは、プロンプトを入力しても意図した画像を生成できない可能性がある。」

テキスト2イメージだけではなく、これからはイメージ2イメージになっていくんだろうな。

その途中で、イメージ+テキスト2イメージとかな。

もしかすると、1枚の画像から一つの物語を紡ぐようになるのかもしれない。

画像解析やキャプションという形では既に存在するけれど、AIの巨大なバックボーンを使って、一見それと分からないような「創作」を始めるかも知れない。

(生成AIが創作のルールを変えても、逆に「書くことの意義」は高まっていく)
https://note.com/alpaka_ai/n/n5696c8e37bcd

「絵画でも写真でも、本質的には人が「思索」して、「視点」を与えることによって、創作として成立することに変わりない」

「「人が喪失とどう向き合うのか」という問いから、「喪失と再生」という視点を物語の芯に据えて、対比を交えながら展開していくような、そういったことはAIには出来ないわけです。」

記事の著者は自信満々に言うけれど、浮沈子は心細さを感じる。

「だからこそ、人にしかできない領域、つまり「思索して、創作の視点をどのように置くか」がより重要で、より深く問われることになるのだろうと思います。」

AIが、その領域に入り込むことは間違いない。

「まとめると、最終的な創作物が、人の手によるものであっても、生成AIによるものであったとしても、「思索して、創作の視点」を作り出す行為は人の手にしかないのです。

それはどうあっても変わらない。」

浮沈子には、そこまで断言することは出来ない。

ひょっとすると、この記事自体をAIが書いているのかとさえ疑う(矛先を躱すために?)。

まあ、どうでもいいんですが。

人が人によってしか癒されないと信じることはたやすい。

そうではないのではないのか。

もしかして、人間はたった一人で生きていくことが出来るのではないのか。

SFの世界でしかなかった話は、今、急速に現実味を帯びてきている。

そんなもんは、ただの気が利いた技術の端くれに過ぎないと笑い飛ばすこともできる。

が、浮沈子はそれ程楽観的じゃない。

もっと根源的な恐怖を感じる。

電子デバイスが分子の大きさに迫る程に微細化し、ストレージの容量が天文学的な量に達している今日、「何かが出来ない」と言い切ることには無理がある気がする。

ぎこちなかったロボットが、流ちょうに言語を話すことは当たり前になった。

その先に何が起こるかは、あまり考えたくはないけどな・・・。

<さらに追加:5月10日早朝記>ーーーーーーーーーー

(AI:ヴィクトリア・シー)
https://kfujito2.asablo.jp/blog/2024/05/08/

(AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中)
https://gigazine.net/news/20240507-ukraine-ai-foreign-ministry-spokesperson/

「話している様子はかなり自然で、事前にAI生成のデジタルパーソンだという情報がなければ違和感を抱かない人も多そうです。」

元記事は、ちょうど1年ほど前のギガジンだ。

昨夜書いた記事を読み返していて、そういえばと思い出して確認する。

「我々は、心を痛めることがある人間がそれを行うことで、その報道を信頼し、運命を委ねているところがあるのではないか。」

浮沈子自身がそう書いていた。

そう、人は人を騙すけど、騙される方がなぜ信じてしまうかと言えば、生身の人間は心を痛めるからだ。

それが抑止力になって、騙すことに対する防波堤になっていると信じているから、逆に騙されることになる。

性善説だな・・・。

書面とか電話ではなく、面と向かって人を騙すというのはそれなりの訓練が必要だ(ポーカーでもするのかあ?)。

AI動画生成に感じる危うさは、そんなことはこれっぽっちも考えてないAIが、何の抵抗もなく人を騙すことに対する危機感なのかもしれない。

これがリアルタイムで走り出したら、何でもアリの世界が始まる。

1年ぶりにビクトリアシーの動画も見てみたが、初めて見た時ほどの驚きは感じなかった。

実際にAIによる動画生成に触れて見たりして、少し感覚が鈍くなってきているのかもしれない。

「浮沈子は、やっぱ、ヤバいと思うんだがな・・・。」

その時はそう感じていたけど、1年後の今はそれが当たり前のような気がしてきている。

慣れとは恐ろしいものだ。

プロンプトを投げてブログを書かせ、画像を生成し、その画像を解釈させ、自ら危機感を演出してネタにする。

阿漕な話とは思うけど、自分でAI使ってマッチポンプしている感じだ。

数年前までは、こんなことをやりだすとは思ってなかったからな。

ギガジンの関連記事には、世界初のAIアナウンサーの記事も出ている。

(世界初のAIニュースキャスターが中国で誕生、あまりにもリアルで衝撃的な映像が公開中)
https://gigazine.net/news/20181109-first-ai-news-anchor/

「生身の人間がニュースを伝えているかのようなリアルすぎる映像を見ると、「現実とは何か」というマトリックスのような問いかけをしそうになります。」

「AIアナウンサーは実際に存在する男性アナウンサーの声や顔から作り出したクローンだそうです。AIは人間のアナウンサーの映像から抽出したスピーチ、唇の動き、表情などから合成されており、ムービーを見るとあまりにリアルな映像に驚きます。」

「英語担当のAIアナウンサーは、以下のムービーから見ることができます。」

記事の日付を見ると、もう6年半も経っている。

「現実とは何か」(再掲)

答えは明白だ。

幻覚と妄想。

脳が作り出した幻に過ぎない。

それが確かなものであると信じようと、人間は苦労し続けている。

人生の最後、真実の瞬間が訪れる時、この世の全てが幻に過ぎなかったことを知る。

いや、もちろんそうじゃないけど、AIの登場はそんな思いを抱かせるのに十分だ。

消えたカップルや赤い帽子をかぶった猫と同じように、マトリックスの世界では何でも起こり得るからな・・・。