sora2 ChatGPT のやつ
Sora2で動画を作るのは、めっちゃ面白い。
ただ、実際に触ってみて分かったことがある。
Soraは、こちらの指示が「現実では起こり得ない」と判断すると、
そのまま無理に再現しようとはせず、
より現実的で、成立しやすい方向へ逃げていくことがある。
例えば、
人がジェットコースターを背中に担いで逃げる動画を作ろうとしたときの話。
ChatGPTと何度もやり取りをして、
プロンプトを少しずつ調整しながら、
自分の中では「これ以上ない最終形」だと思えるところまで詰めた。
それでも、実際に生成された動画は、
意図していた方向とは違う形で、
勝手に“現実寄り”な表現に置き換えられてしまった。
そもそも、
「工業物をそのまま背中に担ぐ」という発想自体が、
Soraにはうまく伝わらない。
そして、仮に伝わったとしても、
そのまま成立させるのではなく、
別の分かりやすい形へと逃げていく。
この時に感じたのは、
Soraが非現実的な表現を完全に拒否しているわけではない、ということだ。
ただし、構造が複雑になればなるほど、
描きやすくて破綻しにくい解釈へと収束していく。
だから、
「これは非現実的な表現なんです」
と説明するだけでは足りない。
Soraが選びそうな“現実的な逃げ道”をあらかじめ想定して、
「そうはならないようにする」ための一文を
プロンプトの中に入れておく必要がある。
それでもなお、
Soraはどこかで現実に近い着地点を探しにいく。
今回も結局、最後はそちらに引っ張られた。
結果はダメだったけど、
この挙動はSoraのクセみたいなものだと思う。
うまくいかなかったとはいえ、
Soraの性格というか、考え方の一端はよく分かった。
そういう意味では、無駄な試行錯誤ではなかった。
ただ、指示を出し過ぎてしまうのも良くないと感じた。
生成AI動画は「短い指示」の方が成功率が高い気がする。
作りたい動画の芯の部分以外はsoraに丸投げしてみると以外と良いのが出来たりした。
Sora動画生成AIを実際に使ってみると、
プロンプトは長ければ良いというものではないと感じる場面が多い。
むしろ、
- 指示を細かく書きすぎたときほどモデル側が内容を再解釈し
- 一部の動作やセリフが省略されたり、
無かったことにされるケースが増える気がする。
あくまで体感だが、
情報量が多すぎると、取捨選択が内部で起きているように見える。
まぁ自分のアイデアの文字が動画になるのは面白いです。