当前位置: 首页 > news >正文

秦皇岛 网站建设烟台响应式网站建设

秦皇岛 网站建设,烟台响应式网站建设,软件开发自学网,网站开发工程师学什么区别一、模型介绍 MusePose是一个基于扩散和姿势引导的虚拟人视频生成框架。 主要贡献可以概括如下: 发布的模型能够根据给定的姿势序列,生成参考图中人物的舞蹈视频,生成的结果质量超越了同一主题中几乎所有当前开源的模型。发布该 pose alig…

一、模型介绍

MusePose是一个基于扩散和姿势引导的虚拟人视频生成框架。

主要贡献可以概括如下:

  1. 发布的模型能够根据给定的姿势序列,生成参考图中人物的舞蹈视频,生成的结果质量超越了同一主题中几乎所有当前开源的模型。
  2. 发布该 pose align 算法,以便用户可以将任意舞蹈视频与任意参考图像对齐,这显著提高了推理性能并增强了模型的可用性。
  3. 修复了几个重要的错误,并在 Moore-AnimateAnyone的代码基础上做了一些改进。

二、部署流程

1. 环境要求

  • Python 3.10 或更高版本
  • 推荐:CUDA 11.7 或更高版本

2. 克隆并安装依赖项

git clone https://github.com/TMElyralab/MusePose.git
pip install -r requirements.txt

3. 下载mim软件包

pip install --no-cache-dir -U openmim 
mim install mmengine 
mim install "mmcv>=2.0.1" 
mim install "mmdet>=3.1.0" 
mim install "mmpose>=1.1.0"

4.下载权重

git lfs install
git clone https://www.modelscope.cn/jackle/ComfyUI-MusePose-models.git

image.png

pretrained_weights 最后,这些权重应按如下方式组织:

./pretrained_weights/
|-- MusePose
|   |-- denoising_unet.pth
|   |-- motion_module.pth
|   |-- pose_guider.pth
|   └── reference_unet.pth
|-- dwpose
|   |-- dw-ll_ucoco_384.pth
|   └── yolox_l_8x8_300e_coco.pth
|-- sd-image-variations-diffusers
|   └── unet
|       |-- config.json
|       └── diffusion_pytorch_model.bin
|-- image_encoder
|   |-- config.json
|   └── pytorch_model.bin
└── sd-vae-ft-mse|-- config.json└── diffusion_pytorch_model.bin

三、推理

1. 准备

在文件夹中准备参考图片和舞蹈视频 ./assets,并按照示例进行组织:

./assets/
|-- images
|   └── ref.png
└── videos└── dance.mp4

2. 姿势对齐

获取参考图的对齐 dwpose:

python pose_align.py --imgfn_refer ./assets/images/ref.png --vidfn ./assets/videos/dance.mp4

此后,您可以在其中看到姿势对齐结果 ./assets/poses,其中 ./assets/poses/align/img_ref_video_dance.mp4 是对齐的 dwpose,而 ./assets/poses/align_demo/img_ref_video_dance.mp4 用于调试。

image.png

3. 推断 MusePose

将参考图的路径和对齐的 dwpose 添加到测试配置文件中,./configs/test_stage_2.yaml 例如:

test_cases:"./assets/images/ref.png":- "./assets/poses/align/img_ref_video_dance.mp4"

然后,只需运行

python test_stage_2.py --config ./configs/test_stage_2.yaml

./configs/test_stage_2.yaml 是推理配置文件的路径。

image.png

最后,你可以在 ./output/文件夹下查看

4. 降低 VRAM 成本

如果要降低 VRAM 成本,可以设置推理的宽度和高度。例如,

python test_stage_2.py --config ./configs/test_stage_2.yaml -W 512 -H 512

它将首先生成 512 x 512 的视频,然后将其调整回姿势视频的原始大小。

目前在 512 x 512 x 48 上运行需要 16GB VRAM,在 768 x 768 x 48 上运行需要 28GB VRAM。但需要注意的是,推理分辨率会影响最终结果(尤其是人脸区域)。

5. 面部美容

如果要增强脸部区域以获得更好的脸部一致性,可以使用FaceFusion。您可以使用该 face-swap 功能将参考图中的脸部交换到生成的视频中。

四、界面演示

image.png

http://www.yayakq.cn/news/256112/

相关文章:

  • 青之峰做网站wordpress建外贸站
  • 怎么登录小程序平台网站是怎么优化的
  • 济南营销网站建设wordpress快速网店主题
  • 怎样建立和设计公司网站网站代理什么意思
  • 山东省城建设计院网站深圳高端做网站公司
  • 做电影网站多少带宽在哪个网站做推广比较好
  • 上海黄金网站设计网站建设关键要做好哪些工作
  • 陕西省住房和城乡建设厅网站上查询余杭住房和城乡建设局网站
  • 山东省住房和建设厅网站诸暨做网站广告的电话
  • 营销类网站设计 要点多媒体网页设计
  • 互联网网站如何做培训计划模板
  • 江安县规划和建设局网站企业网站建设资金预算表
  • 大港油田建设网站wordpress 拍卖主题
  • 手机企业网站建设vs2008 做网站
  • 摄影师网站建设wordpress+论坛+注册
  • 婚纱网站建设 最开始网页微信版传输助手
  • 网站每天一条推送怎么做的网站开发gxjzdrj
  • 复兴区建设局网站东莞保安公司电话
  • 北京做erp报价的网站顺义成都网站建设
  • 中企动力做网站多少钱外网网站建设调研报告
  • 洛南网站建设网站建设对企业带来什么作用
  • 潍坊免费自助建站模板网站网页转app源码
  • 深圳网站制作必选祥奔科技吉林长春seo网站建设网站优化
  • 国内网站建设推荐wordpress微商模板
  • 金利福珠宝的网站建设理念wordpress 收录
  • 官方网站链接如何做网站建设广告素材
  • 安徽网站开发建设贵阳网站建设odenet
  • 新闻类网站怎么做百度推广三丰云免费虚拟主机
  • 电脑机箱定制网站建设银行网站多少
  • 公司没有自己的网站wordpress上传大图