ListenHubSkills

图片生成

用文本描述生成 AI 图片,支持参考图进行风格引导。

用文本描述生成 AI 图片。支持多种分辨率和宽高比,可选参考图进行风格引导。图片保存为本地文件。

触发方式

输入 /image-gen 命令,或使用以下任意短语触发:

短语语言
generate an image / generate image英文
draw / visualize / create picture英文
生成图片 / 画一张中文
AI图 / 配图中文

使用前请先安装 ListenHub Skills — 参见快速开始

快速示例

生成图片:赛博朋克城市夜景,16:9,2K

AI 收集你的偏好后生成图片。

参数

参数选项默认值
模型🍌 progemini-3-pro-image-preview,画质更高,推荐)、⚡️ flashgemini-3.1-flash-image-preview,更快更省)
分辨率1K2K(推荐)、4K
宽高比16:91:19:162:33:23:44:321:9flash 额外支持 1:44:11:88:1
参考图最多 14 张,支持图片 URL 或 base64 编码

提示词写法

好的提示词应包含以下要素:

  1. 主体 — 图片中有什么
  2. 风格 — 艺术风格或视觉处理方式
  3. 构图 — 元素的排列方式
  4. 光影/氛围 — 氛围和时间段
  5. 画质 — 细节程度和渲染质量

示例

基础:

一只猫坐在窗台上

更好:

a fluffy orange tabby cat sitting on a sunny windowsill, warm afternoon light, cozy interior, highly detailed, photorealistic

风格关键词

风格关键词
写实photorealistic, highly detailed, 8K, professional photography
赛博朋克neon lights, futuristic, dystopian, rain-slicked streets
水墨画Chinese ink painting, traditional art style, brush strokes
水彩watercolor painting, soft edges, flowing colors
动漫anime style, Japanese animation, cel shading
极简minimalist, clean lines, simple composition, white space

提示词请使用英文 — 图片模型基于英文描述训练。如果你用中文描述,AI 会自动翻译。

参考图

参考图引导 AI 的风格,而非内容。你的提示词仍然控制图片中出现的内容。

使用图片 URL

  1. 将参考图上传到图床(imgbb.comsm.mspostimages.org
  2. 复制图片直链(以 .jpg.png.webp.gif 结尾)
  3. 在 AI 询问参考图时提供 URL

使用 Base64 编码数据(API)

通过图片生成 API 调用时,还可以使用 inlineData 字段直接传入 base64 编码的图片数据,无需上传图床。适用于已经在内存中持有图片的程序化场景。

每张参考图必须且仅能使用 fileData(URL)或 inlineData(base64)之一。请求格式和代码示例请参阅 API 参考文档

输出

输出方式取决于配置时设置的 outputMode

  • inline(默认) — 图片直接显示在对话中
  • download — 保存到当前项目的 .listenhub/image-gen/YYYY-MM-DD-{id}/ 目录下
  • both — 内联显示并同时保存到本地

如需更改输出方式,在 AI 显示当前配置时说"重新配置"即可。

API 参考

接口详情、请求参数和代码示例请查看图片生成 API 参考文档

On this page