Geminiがすごい
公開日:2025/09/04
この記事をざっくりまとめると・・・
Geminiの進化がすごいことになっています。特に画像関連では可能性をすごく感じる状況。いくつか実験をした結果をレポートします。
・・・ということが書いてあります。
生成AIのニュースは、びっくりするくらいあちらこちらで毎日毎日リリースされていて本当に追いつけないほどの勢いです。そんな中、Geminiの進化の中で画像関連が非常に興味深く、面白いものでしたので実験の模様を記録しておきます。
あらかじめやっておくこと
最近の生成AIにはいろんなモードがあります。Geminiもその例外にはなくさまざまなモードを切り替えることで適した体験ができるようになっています。
画像をそのままアップロードして指示を出す(プロンプトを書く)という方法でもある程度は実行できることは確認できていますが、あらかじめモードは切り替えておく方がよさそうです。
プロンプトの入力エリアの下にある「画像」を選択しておきましょう。

あとは楽しむだけ
さて、どんなことができるのか・・ですが、このサイトでも使っていますが私のプロフィール画像を使って遊んでみます。早速ではありますが、画像をアップロードして、「金髪にしてMA-1を着せて」と指示を出しました。
一分程度でしょうか・・・待つだけで次の画像のような変化が起こりました。

!!
ちゃんとなっています。驚きです。そして、意外と金髪が似合ってる笑。
これまでの画像生成AIで似たような指示をだしますと、若干目線がずれたり顔が変わったり・・ということがあったのですが、ちゃんと維持しているのがみて取れます。また、通常のジャケットからMA-1というジャンバーに切り替わったので少しふっくらした体つきになってるのもポイントかなと思います。
次に「ジャケットを脱いでトレーナーを着せて」と指示をだしました。今の時代「トレーナー」とはいわず「スウェット」という表現がいいのでしょうが、あえて「トレーナー」として指示をだしました。
その結果がこちらです。

!!
はい。ちゃんとトレーナーですね。少しガッチリした感じになったでしょうか?ここでも先ほどと同じことが言えますが、顔に違和感がないということです。ちゃんと前の画像を維持している状況ですね。
続けて服を着替えさせてみましょう。試しにGoogleにて「トレーナー US」で画像検索をして気になった画像を拝借し、Geminiにアップロード。そして「このトレーナーの雰囲気で生地を黒、文字を黄色にして」と指示を出しました(プロンプトを書きました)。
その結果がこちら


!!
ちゃんと着替えてますね!すばらしい。何よりすごいのが文字まわりのシワの具合です。もとの画像とはシワの具合は大きく異なります。というか、全然違います。それをここまでできるとは!
さて続けましょう。服が変えれるのはわかったので、角度を変えてみます。
「この画像の人物を体ごと左に向けてほしい」と指示を出してみます。その結果がこちら。

向いた!完全に別カットで撮影しましたといってもバレないレベルじゃないでしょうか?少々髪型は違っていますし、少し笑顔がなくっていますが、こっちとあっちと・・撮影で角度を変えたらそれはそうなる時もあるよなというところじゃないでしょうか?そして何より、やはり「シワ」です。
拡大してみますと、

ちゃんとしてます。この理解がすごいと感動しています。
可能性
この類の画像加工がものの数分(早ければ数十秒)でできるとなるとかなり変革が生まれそうです。例えば、アパレル系での活用。服をモデルに着せることなく、平場で撮影しておいてAIで着させるというのは簡単にできそうです。
試しに、以下のURLに記載されている商品の写真を使って「この商品を着せて」とプロンプトを打ってみました。
https://nafco-online.com/products/detail.php?product_id=21567735

細かい部分は異なりますが、ある程度は現時点でもいけてるようです。左腕の黒いところは実際の商品写真にはないですから、このまま使うことはできない画像ではありますが、感覚としてしばらくすればできそうな感じはあります。
ちなみに、現時点ではページのURLを渡して「この商品を着せて」というものには対応できておらず、画像を画像としてアップロードして・・という手順が必要になります。
まとめ
これがGoogleの力なのか・・。と感じる次第ですが、Geminiが本当にすごいことなっています。予想でしかありませんが、Geminiがこれからもっとすごくなっていく予感があります。
その理由は「ログオン(ログイン)の壁」に関係します。あらゆる生成AIが世の中に出ていますが、それぞれどうしても「新規登録」をしないといけません。しかしながら、GeminiはGoogleのAIです。今やスマホを持っている人の多くがGoogleアカウントを持っているという状況ではないでしょうか?その「アカウントを持っている」という状況がすごく好転的に作用するのがGeminiのように思います。
ますますGeminiが市民権を得ていきそうな気がしてなりません。その昔あったブラウザのシェア争いに似ている気がします。ChatGPTですらもしかしたら、「専門家が使う生成AI」となり、他の先進的な生成AIサービスたちは「マニアックな(ギークな)人たちが使う、知る人ぞ知る生成AI」になるんじゃないかとも思います。
さらにいうと市民権を得る生成AIは、そのほかのマニアックな生成AIに比べて学習スピードが大きく異なってくることは容易に想像できます。学習スピードが進化のスピードとほぼ一致するのがAIの世界。
Geminiがとてつもないことになりそうな予感があります。
PS どうでもいいことですが、金髪が似合ってるという意見をいろんな人からいただきました。ちょっと考えようかな笑

著者:稲本浩介
コミュニケーション設計所代表/情報アーキテクト
「わかりやすく伝えるにはどうしたらいいか?」を常に考える福岡の情報アーキテクト(IA)。前職では主にWebサイト制作にディレクターやエンジニアとして関わり、ホームセンターや老舗菓子メーカーのEC事業の構築および運用にゼロから携わる
。その活動は、ウェブサイトの枠に限定せず、動画やイベント実施などコミュニケーションという視点でのわかりやすさを追求。大学や社会人講座、企業における講演経験もあり多方面にて活動中。
▶︎ X(Twitter): @sevenina



