最近,我一直在使用Chenyme大佬开发的grok2api,一个强大的图像和视频处理工具。随着春节的到来,Chenyme大佬的更新步伐有所减缓,而我看到前几个版本有意加强webui上的玩法,这给了我很大的灵感。我让codex帮我实现了一些增强功能,我认为这些功能非常有用,因此想与大家分享。以下是我在增强功能方面所做的工作总结:

  1. WS瀑布流增强:WS瀑布流图片可点击进入预览编辑模式,方便快速迭代图片元素。同时,可以复制parentPostId,并写入全局记忆供后续视频/编辑复用。
  2. 新增图片编辑工作台:支持首次上传图片(文件选择 / 拖拽 / 粘贴),后续循环编辑(不重复上传)。右侧显示编辑历史,可以“设为当前”和“复制ID”。支持粘贴parentPostId直接拉取并继续编辑。
  3. 视频生成页加强/视频拼接:支持文本生视频、参考图生视频、parentPostId生视频,视频选帧拼接生视频。支持直接粘贴parentPostId,自动回填参考图预览。文件选择 / 拖拽 / 粘贴图片,并发视频可选。视频拼接工具可以循环拼接,喜欢多少秒就多少秒(需要浏览器内核支持,不过只要不是远古时期的浏览器都可以)。
  4. NSFW全流程:先出候选图,再选图并行生成视频。因为先生图再生视频NSFW程度比起一句话生视频强得多。候选图支持编辑(复用与工作台一致的编辑交互和历史)。并行视频数可选1~4,可随时中断。

补充(跨页面共用):全局parentPostId记忆,来源包括WS瀑布流、图片编辑工作台、NSFW候选图/编辑结果。去向包括视频生成页、图片编辑工作台可直接粘贴使用。目标是让用户从“生图 → 选图 → 编辑 → 生视频”全程不需要反复上传。内置提示词增强,移动端汉堡菜单优化和注册成pwa应用方便桌面进入。夜间模式支持,移动端livekit修复。

标签: none

评论已关闭