Z-Image基础模型发布：AI图像生成新里程碑

阿里通义实验室在Hugging Face平台开源了图像生成基础模型Z-Image，该模型采用单流扩散Transformer架构，为AI创作者、研究人员和开发者提供了极高的创作自由度。Z-Image是一个非蒸馏的完整容量模型，与追求极致生成速度的Z-Image-Turbo版本不同，它保留了完整的训练信号，支持无分类器引导（CFG）和负面提示词控制。用户可以通过输入负面指令精确压制图像中不需要的元素，并在构图、面部特征和光影表现上获得更高的生成多样性。Z-Image覆盖了从超写实摄影、电影级数字艺术到风格化插画的广泛视觉风格，非常适合作为开发者进行下游任务的起点，能够兼容LoRA微调以及ControlNet等结构化和语义化条件控制。开发者可通过Diffusers库直接调用该模型，官方建议的推理步数为28至50步，支持512至2048像素的任意宽高比图像生成。该模型遵循Apache 2.0开源协议，相关论文已发布，模型权重已开放下载。

Z-Image基础模型发布：AI图像生成新里程碑

评论已关闭