マスク gpt-image-1.5
maskで透明領域を指定し、imageの該当範囲のみを編集します(gpt-image-1.5)- 参照画像
image、マスク画像mask、テキストpromptが必要です - リクエストボディは
multipart/form-data(バイナリ画像フィールドを含む) - 公式ドキュメント: Images createEdit
Authorizations
Request Body
編集する画像。サポートされている画像ファイルまたは画像配列である必要があります。gpt-image-1 の場合、各画像は 25MB 未満の png、webp、または jpg ファイルである必要があります。dall-e-2 の場合、画像は 1 枚のみで、4MB 未満の正方形 png ファイルである必要があります。
"binary"希望する画像のテキスト説明。dall-e-2 の最大長は 1000 文字、gpt-image-1 の最大長は 32000 文字です。
完全に透明な領域(例: アルファ値がゼロ)が image の編集位置を示す追加画像。複数の画像が提供された場合、マスクは最初の画像に適用されます。有効な PNG ファイルで 4MB 未満、かつ image と同じサイズである必要があります。
"binary"画像生成に使用するモデル。gpt-image-1、gpt-image-1-all、flux-kontext-pro、flux-kontext-max のみ。
生成する画像の数。1 から 10 の間である必要があります。
生成画像の品質。gpt-image-1 のみ high、medium、low をサポートします。dall-e-2 は standard のみ。デフォルトは auto。
生成画像の返却形式。url または b64_json のいずれかである必要があります。URL は画像生成後 60 分間有効です。このパラメータは dall-e-2 にのみ適用されます。gpt-image-1 は常に base64 エンコード画像を返すため、このパラメータは使用しないでください。
生成画像のサイズ。GPT 画像モデルでは 1024x1024、1536x1024(横)、1024x1536(縦)、または auto(デフォルト)のいずれか。dall-e-2 では 256x256、512x512、または 1024x1024。dall-e-3 では 1024x1024、1792x1024、または 1024x1792。
生成画像の背景の透明度を設定できます。gpt-image-1 のみでサポート。transparent、opaque、または auto(デフォルト)のいずれか。auto の場合、モデルが最適な背景を自動決定します。
gpt-image-1 で生成される画像のコンテンツモデレーションレベルを制御します。制限の少ないフィルタリングには low、デフォルトは auto。