支持首尾帧生成视频的开源模型

在开源领域，有几个模型支持根据首尾帧生成视频。除了您提到的万相模型，还有以下一些模型也可以实现这一功能：

OpenPose：OpenPose 是一个开源的人体姿态估计库，它能够从视频中提取出人体的关键点，进而生成动画视频。
DeepMotion：DeepMotion 是一个基于深度学习的动作捕捉和视频生成工具，它可以根据首尾帧生成连续的动作视频。
Video Deep Motion：这个模型专注于视频的生成，它能够根据给定的首尾帧生成中间的视频帧，从而形成完整的视频。
Swin Transformer：Swin Transformer 是一种基于Transformer架构的视频生成模型，它能够根据首尾帧生成高质量的连续视频帧。
Video Generation with 3D CNNs：使用三维卷积神经网络（3D CNNs）的模型也可以根据首尾帧生成视频，这些模型通常能够捕捉视频中的时空信息，生成更加流畅的视频。

这些模型各有特点，可以根据您的具体需求选择合适的模型进行使用。希望这些信息对您有所帮助。