阿里通义实验室在Hugging Face平台开源了图像生成基础模型Z-Image,该模型采用单流扩散Transformer架构,为AI创作者、研究人员和开发者提供了极高的创作自由度。Z-Image是一个非蒸馏的完整容量模型,与追求极致生成速度的Z-Image-Turbo版本不同,它保留了完整的训练信号,支持无分类器引导(CFG)和负面提示词控制。用户可以通过输入负面指令精确压制图像中不需要的元素,并在构图、面部特征和光影表现上获得更高的生成多样性。Z-Image覆盖了从超写实摄影、电影级数字艺术到风格化插画的广泛视觉风格,非常适合作为开发者进行下游任务的起点,能够兼容LoRA微调以及ControlNet等结构化和语义化条件控制。开发者可通过Diffusers库直接调用该模型,官方建议的推理步数为28至50步,支持512至2048像素的任意宽高比图像生成。该模型遵循Apache 2.0开源协议,相关论文已发布,模型权重已开放下载。

标签: none

评论已关闭