图片生成
用文本描述生成 AI 图片,支持参考图进行风格引导。
用文本描述生成 AI 图片。支持多种分辨率和宽高比,可选参考图进行风格引导。图片保存为本地文件。
触发方式
输入 /image-gen 命令,或使用以下任意短语触发:
| 短语 | 语言 |
|---|---|
generate an image / generate image | 英文 |
draw / visualize / create picture | 英文 |
生成图片 / 画一张 | 中文 |
AI图 / 配图 | 中文 |
使用前请先安装 ListenHub Skills — 参见快速开始。
快速示例
生成图片:赛博朋克城市夜景,16:9,2KAI 收集你的偏好后生成图片。
参数
| 参数 | 选项 | 默认值 |
|---|---|---|
| 模型 | 🍌 pro(gemini-3-pro-image-preview,画质更高,推荐)、⚡️ flash(gemini-3.1-flash-image-preview,更快更省) | — |
| 分辨率 | 1K、2K(推荐)、4K | — |
| 宽高比 | 16:9、1:1、9:16、2:3、3:2、3:4、4:3、21:9;flash 额外支持 1:4、4:1、1:8、8:1 | — |
| 参考图 | 最多 14 张,支持图片 URL 或 base64 编码 | 无 |
提示词写法
好的提示词应包含以下要素:
- 主体 — 图片中有什么
- 风格 — 艺术风格或视觉处理方式
- 构图 — 元素的排列方式
- 光影/氛围 — 氛围和时间段
- 画质 — 细节程度和渲染质量
示例
基础:
一只猫坐在窗台上更好:
a fluffy orange tabby cat sitting on a sunny windowsill, warm afternoon light, cozy interior, highly detailed, photorealistic风格关键词
| 风格 | 关键词 |
|---|---|
| 写实 | photorealistic, highly detailed, 8K, professional photography |
| 赛博朋克 | neon lights, futuristic, dystopian, rain-slicked streets |
| 水墨画 | Chinese ink painting, traditional art style, brush strokes |
| 水彩 | watercolor painting, soft edges, flowing colors |
| 动漫 | anime style, Japanese animation, cel shading |
| 极简 | minimalist, clean lines, simple composition, white space |
提示词请使用英文 — 图片模型基于英文描述训练。如果你用中文描述,AI 会自动翻译。
参考图
参考图引导 AI 的风格,而非内容。你的提示词仍然控制图片中出现的内容。
使用图片 URL
- 将参考图上传到图床(imgbb.com、sm.ms、postimages.org)
- 复制图片直链(以
.jpg、.png、.webp或.gif结尾) - 在 AI 询问参考图时提供 URL
使用 Base64 编码数据(API)
通过图片生成 API 调用时,还可以使用 inlineData 字段直接传入 base64 编码的图片数据,无需上传图床。适用于已经在内存中持有图片的程序化场景。
每张参考图必须且仅能使用 fileData(URL)或 inlineData(base64)之一。请求格式和代码示例请参阅 API 参考文档。
输出
输出方式取决于配置时设置的 outputMode:
inline(默认) — 图片直接显示在对话中download— 保存到当前项目的.listenhub/image-gen/YYYY-MM-DD-{id}/目录下both— 内联显示并同时保存到本地
如需更改输出方式,在 AI 显示当前配置时说"重新配置"即可。
API 参考
接口详情、请求参数和代码示例请查看图片生成 API 参考文档。