
😄兄弟たち!大規模言語モデルの限界能力を試すのは本当に面白い実験だ! 今夜グループチャットで面白いテスト実験を見たので、自分が実現したアイデアと過程について簡単に説明するね。 🤔起因:グループの仲間たちが議論していたニーズ——小新家の4枚の画像を自分が提供する4枚の写真に置き換えること——について、何度もバージョンを繰り返したけど依然として実現できず、様々なプロンプトを試してもダメだった。 🧠思考:この画像の核心的なポイントは実は空間的な位置と複数のキャラクターだ。以前、服替えや顔替えなど複数シーンのテストをしたことがあるが、基本的に大きな問題はなかった。ただし人物が非常に複雑な場合を除く。 まず画像内の重要な画像の位置と比率を変えずに保ち、完璧に置き換えられるようにすることを解決する。この2つの問題を解決すれば基本的に実現できる。 ✍🏻実行ステップ:①Geminiに小新家の画像を送信し、対応する位置を記憶させてマークさせる。 つまりこのプロンプト:複製専門家としてこの画像を複製し、特に空間感覚の位置を分析し、座標で位置をマークした上で1:1ピクセル単位で複製し、位置や比率などを含むすべての細部を可能