模型介绍
Kolors 是快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训练,Kolors 在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比开源和闭源模型表现出显着优势。此外,Kolors 支持中文和英文输入,在理解和生成中文内容方面表现出强大的性能。生成效果比肩 Midjourney-v6 水平,支持长达 256 字符的文本输入。
运行方法
1. 克隆并运行容器
2. 待容器为「运行中」状态时,复制 API 地址到浏览器中打开
3. 打开链接后
4. ,并输入文本提示,点击 Generate Image 即可生成结果
也可以根据需要修改相关参数
Height:修改生成图像的高
Width:修改生成图像的宽
Inference Steps:生成图像时所采用的去噪步骤的数量,通常,使用默认的推理步数(例如 50 步)可以得到高质量的图像。如果需要快速预览生成效果,可以使用较小的步数;而如果追求最高质量的结果,则可以使用较大的步数
Guidance Scale:控制模型生成图像时对文本提示条件服从程度的超参数。数值较大时(例如大于 7),生成的图像可能会在视觉上更接近文本提示的描述,具有更高的质量和一致性。数值较小时(例如低于 7),生成的图像可能会展现出更多的多样性,模型在生成图像时对文本提示的依赖性降低,从而允许更多的创造性和变化。
Images per Prompt:修改模型生成图像的数量。
Kolors 是快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训练,Kolors 在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比开源和闭源模型表现出显着优势。此外,Kolors 支持中文和英文输入,在理解和生成中文内容方面表现出强大的性能。生成效果比肩 Midjourney-v6 水平,支持长达 256 字符的文本输入。
运行方法
1. 克隆并运行容器
2. 待容器为「运行中」状态时,复制 API 地址到浏览器中打开
3. 打开链接后
4. ,并输入文本提示,点击 Generate Image 即可生成结果
也可以根据需要修改相关参数
Height:修改生成图像的高
Width:修改生成图像的宽
Inference Steps:生成图像时所采用的去噪步骤的数量,通常,使用默认的推理步数(例如 50 步)可以得到高质量的图像。如果需要快速预览生成效果,可以使用较小的步数;而如果追求最高质量的结果,则可以使用较大的步数
Guidance Scale:控制模型生成图像时对文本提示条件服从程度的超参数。数值较大时(例如大于 7),生成的图像可能会在视觉上更接近文本提示的描述,具有更高的质量和一致性。数值较小时(例如低于 7),生成的图像可能会展现出更多的多样性,模型在生成图像时对文本提示的依赖性降低,从而允许更多的创造性和变化。
Images per Prompt:修改模型生成图像的数量。



