eyecatch

はじめに

こんにちは。
いつもDBひとりでできるもんをご覧いただきありがとうございます。技術チームです。

今回は最近話題である、Google Geminiの「2.5 Flash Image Preview」についてご紹介します。2.5 Flash Image Preview(通称:Nano Banana)は、画像生成の分野で非常に高い性能を持つと注目されています。

この技術を使って、どれくらいリアルなイメージが生成できるのか気になり、GeminiのAPIを契約して試してみました!今回は、その検証結果について詳しく語ります。

AIメディアブーストでも2.5 Flash Image Previewを使っているぞ!
無料デモも対応しているから、気軽に問い合わせくれ!

「Nano Banana」とは?

Nano BananaはGoogle Geminiの画像生成モデル「2.5 Flash Image Preview」の俗称です。
AIによる画像生成技術の中でも特に高性能なモデルとして注目されています。

最大の強みはキャラクターの一貫性の維持です。
一度生成した人物やキャラクターの顔立ち、体型、服装などの特徴を記憶し、異なる背景やポーズ、服装に変更しても、その「らしさ」を保ったまま画像を生成できます。

また、2次元のイラストを3次元的にリアルに変換したり、既存の写真に違和感なく新しい要素を合成できるのも強みです。

実際にNano Bananaを使ってみた

Nano Bananaの画像生成モデルで、イラストキャラクターをまるで実在しているかのように写真に溶け込ませたり、ポーズを変えたりすることはできるでしょうか。

それを確認するため、新サービス「AIメディアブースト」のキャラクター「Mr.ブースト」をリアルな会議室の写真に合成してみました!

実際の合成プロセス

まず、スマートフォンで弊社の会議室の写真を撮影しました。
また、Mr.ブーストのイラストも用意します。


撮影した画像に、AIメディアブーストの責任者_長沢がうっかり写り込んでしまいました💦
でも、Geminiの画像生成モデルなら人物の入れ替えができるので、さっそく試してみます。

画像生成モデルのAPIに「画像1の人物を画像2のキャラクターに置き換えて、そのキャラクターを本物のようにしてください。キャラクターがノートPCをタイプしている様子にしてください。」という指示プロンプトを送信します。


あれ・・レッサーパンダになってしまいました・・・

コードを確認したところ、どうやら「Mr.ブースト」の画像をAPIに送っていないようでした。
画像データを送っていないと、ランダムなキャラクターで生成されてしまうようですね。
Mr.ブーストの画像データをちゃんと送るように、もう一回試してみます。

できました!
Mr.ブーストがリアルに合成され、特に手の動きやヘルメットの光の反射が自然に表現されていました。

複数キャラクターの合成とシーンの拡張

Mr.ブーストが一人では寂しいので、少し仲間を増やしましょう。
プロンプトは「テーブルのすべての席に同じロボットが座っている。ロボットたちは会議中で議論している」で送信してみます。


まるで実際に会議が行われているかのように見えました。
驚くと同時に、このAI画像生成モデルの可能性をいろいろ想像しました。

画像の細かい調整と文字入れの工夫

会議室は少し地味なので、会議室の窓のブラインドをなくし、外に富士山が見える景色に変更したいと思います。
プロンプトは「窓のブラインドをなくして、外の景色が見えるようにしてください。外の景色は、富士山が見える。」で送信します。

ライトの反射に若干の違和感はありましたが、全体としては非常に自然な仕上がりでした。

最後に、地味な白い壁に文字を入れたいと思います。
画像生成モデルでは、文字が上手く生成されません。
特に日本語の生成は難しいです。
画像に文字を生成するのが難しいのなら、先に正しい文字が入っている画像を使って合成したらどうなるでしょうか。実験します。


画像編集ソフトで上記の画像を作成し、プロンプトは「画像1の壁に画像2の文字を立体にしたものを差し込んで」で送信してみます。

誤字や読めない文字は全くなく、きれいに完成しました!

まとめ

今回、画像生成を試した結果、Nano Bananaはラストキャラクターをリアルな写真に違和感なく合成できる高い性能を持つことがわかりました。
また、画像生成は1枚あたり約10秒くらいで完了し、ほかの画像生成モデルと比べて比較的早かったです。

ちなみに、Geminiで生成された画像には「SynthID」という識別情報が埋め込まれており、スクリーンショットや拡大、回転などの編集を加えても残るそうです。
生成画像と実写を見分ける手段があるのは安心ですね。

備考

今回はOracle Cloud上のOracle APEXとPL/SQLで検証を行いました。
画像データはAPEXで表示しやすいBLOB形式でDBに保存されます。

BLOBを使用することで、APEXの標準コンポーネントとの親和性が高く、DBレベルでのセキュリティとバックアップが確保され、ファイルパス管理の複雑さを回避できます。

構成・バージョン
Oracle APEXで試作したページ

最後になりますが、弊社にはOracle Cloudに強いエンジニアが多数在籍しています。
何かご不明なことやご興味を持たれたことがございましたら、お気軽にお問い合わせください。

Oracleの課題、専門家が解決します


Oracle導入を相談する

豊富な実績で最適な解決策をご提供

投稿者プロフィール

技術チーム
技術チーム
DBひとりでできるもんを盛り上げるべく、技術チームが立ち上がり早8年。ひとりでできるもんと言いつつ、技術者が読んでプッとなるような、極めてピンポイントでマニアックな技術ネタを執筆しています!
最新技術情報や資格情報をチェックしたいアナタ!毎日遊びに来てください。きっとお役に立てます。