图片生成

用文本描述生成 AI 图片，可选参考图，并在 pro 与 flash 模型及各种宽高比之间选择。

用文本描述生成 AI 图片。可在画质更高的 pro 模型和更快更省的 flash 模型之间选择，挑选分辨率与宽高比，并可选传入参考图进行风格引导。图片以本地文件返回或内联显示。

触发方式

输入 /image-gen 命令，或使用以下任意短语触发：

短语	语言
`generate an image` / `generate image`	英文
`draw` / `visualize` / `create picture`	英文
`生成图片` / `画一张`	中文
`AI图` / `配图`	中文

使用前请先安装 ListenHub Skills — 参见快速开始。

生成图片：赛博朋克城市夜景，16:9，2K

AI 会逐个问题收集你的偏好，汇总后请你确认，然后生成图片。

参数	选项	默认值
模型	🍌 `pro`（`gemini-3-pro-image`，画质更高，推荐）、⚡️ `flash`（`gemini-3.1-flash-image`，更快更省，可解锁极端宽高比）	—
分辨率	`1K`、`2K`（推荐）、`4K`	—
宽高比	`16:9`、`1:1`、`9:16`、`2:3`、`3:2`、`3:4`、`4:3`、`21:9`；`flash` 额外支持 `1:4`、`4:1`、`1:8`、`8:1`	—
参考图	最多 5 张，支持本地文件或图片 URL	无

两个模型都是 Google Gemini 图片模型。根据画质与速度的取舍，以及你需要的宽高比来选择。

模型	模型 ID	适用场景
🍌 `pro`	`gemini-3-pro-image`	追求最高画质和细节。推荐的默认选项。
⚡️ `flash`	`gemini-3.1-flash-image`	追求更快、更省的生成，或需要极端宽高比（`1:4`、`4:1`、`1:8`、`8:1`）。

四种极端宽高比 — 1:4（窄竖图）、4:1（宽横图）、1:8（极端竖图）和 8:1（全景）— 仅 flash 模型支持。八种标准宽高比两个模型都支持。

请勿写死积分消耗 — 它取决于模型、分辨率和账户。生成前如需查看费用，请查阅 estimate-credits 接口。

好的提示词应包含以下要素：

基础：

一只猫坐在窗台上

更好：

a fluffy orange tabby cat sitting on a sunny windowsill, warm afternoon light, cozy interior, highly detailed, photorealistic

风格	关键词
写实	photorealistic, highly detailed, 8K, professional photography
赛博朋克	neon lights, futuristic, dystopian, rain-slicked streets
水墨画	Chinese ink painting, traditional art style, brush strokes
水彩	watercolor painting, soft edges, flowing colors
动漫	anime style, Japanese animation, cel shading
极简	minimalist, clean lines, simple composition, white space