当前位置: 首页 > news >正文

有哪些优秀的个人网站高效网站推广设计

有哪些优秀的个人网站,高效网站推广设计,个人做网站租云服务器,招商加盟网站系统文章目录 1 Motivation2 背景 相关工作 Related work3 Method 方法4 效果 1 Motivation 背景是 Tuning-free personalized image generation methods无微调的个性化图像生成方式在维持脸部一致性上取得了显著性的成功。这里我不是很了解 然而,在多个场景中缺乏整…

文章目录

  • 1 Motivation
  • 2 背景 相关工作 Related work
  • 3 Method 方法
  • 4 效果

1 Motivation

背景是

Tuning-free personalized image generation methods无微调的个性化图像生成方式在维持脸部一致性上取得了显著性的成功。这里我不是很了解

然而,在多个场景中缺乏整体一致性,整体一致性是什么呢?虽然脸一致了,但是比如衣服和身体,头发样式上的一致性很难保证,这些进而阻碍了创建连贯的叙事的能力。

StoryMaker结合了多重条件,包括面部识别和裁剪的人物图像(包括服装、发型和身体),将两个特征通过一种叫做(位置感知感知重采样器 (PPR) 的方法 将面部身份信息与裁剪的字符图像相结合,以获得不同的人物特征。

为了防止多个人物和背景的混杂,分别通过带有分割遮挡的MSE损失来限制了不同人物和背景的交叉注意力。

除此之外,训练了基于特定姿势的生成模型。

Lora也被用来提高质量。

2 背景 相关工作 Related work

主流维持脸部一致性的工作有2个派系

派系1:微调系列

Break-A-Scene: Extracting Multiple Concepts from a Single Image(2023)

An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion(2022)

Multi-Concept Customization of Text-to-Image Diffusion(2022)

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation(2022)

派系1生成能力不自然,因为图像有限并且在微调上面花费成本较大

派系2:不微调系列

Customizing realistic human photos via stacked id embedding(2024)

Subject-Diffusion:Open Domain Personalized Text-to-Image Generation without Test-time Fine-tuning(2024)

High-fidelity image personalization via multi-modal condition integration(2024)

Instantfamily: Masked attention for zero-shot multi-id image generation.(2024)

Instantid: Zero-shot identity-preserving generation in seconds(2024)

通过视觉编码器将视觉信息集成到生成器中,没有用微调。

然而是上面的工作只能维持脸部特征,他们不能维持更全面的一致性

StoryMaker允许通过文本提示改变背景、人物姿势和样式。怎么做到的呢?就通过脸部特征上和裁剪的人物图像去提取信息,使用位置感知感知器重采样器(PPR)来导出人物特征

3 Method 方法

在这里插入图片描述

具体来说,首先使用人脸编码器提取人物的面部信息,即面部特征,

以及通过人物图像编码器提取它们的衣服、发型和身体的细节。

然后,我们使用所提出的位置感知感知器重采样器(PPR模块)来细化此信息。PPR模块的结构组成如右侧所示。

为了控制主干生成网络,将细化的信息注入到IP-Adapter提出的解耦交叉注意模块中[Ye et al., 2023b]。

为了防止多个字符和背景交错,我们分别约束交叉注意对不同人物和背景的影响区域。

ID 损失还用于维护人物的身份。此外,为了将姿态信息与参考图像解耦,利用ControlNet检测到的姿态训练网络[Zhang et al., 2023]。

为了提高保真度和质量,我们还使用 LoRA [Hu et al., 2021] 训练 U-Net。

一旦经过训练,就可以丢弃整个ControlNet,并通过文本提示控制字符的姿势,或者在推理过程中用新的姿势指导图像生成。

提出的方法的完整流程如图所示

4 效果

请添加图片描述

请添加图片描述

训练在8卡 A100

http://www.yayakq.cn/news/501064/

相关文章:

  • 描述一下网站建设的基本流程兰州网站维护公司
  • 移动端网站怎么做手机oa办公系统下载
  • 数据来源于网站怎么做参考文献建设征婚网站
  • 零陵网站建设广州网站建设案件
  • 网站一般字体网站如何做二维码
  • 网站搭建代码大全推广软文发稿
  • 福建省建设执业注册中心网站做网站需要注意的点
  • 河南省住建厅网站官网wordpress安装完不显示
  • 建网站要去备案做淘宝客网站需要多大带宽
  • 网站制作与网站建设实际报告广州网站建设q479185700棒
  • 网站建设服务公司案例智慧城市建设评价网站
  • 苏州网站建设一站通怎么制作手机软件app
  • 精湛的网站建设排行榜怎么学室内装修设计软件
  • 上海电子商务网站百度收录网站的图片
  • 企业网站推广有哪些方式监理企业建设部网站年报
  • 网站开发手机销售网站用例图微信答题小程序制作
  • 江西宜春市建设局网站网站如何备案 附备案流程图
  • 网站建设翻译英文是什么网站备案 费用
  • 网站建设有哪些推广渠道互联网推广是什么工作
  • 邯郸网站html教程的内容
  • 常宁市住房和城乡建设局网站寰宇seo
  • 塘沽企业网站建设腾讯企点下载手机版
  • 建站公司上海《传奇世界》官网
  • 大连建站费用邯郸移动网站建设公司
  • 广州专业做外贸网站建设网站建设初学者必学
  • 网站 什么语言开发的网站开发前景怎么样
  • 超低价的锦州网站建设wordpress 动态筛选
  • 网站设计借鉴其它网站侵权吗网站建设企业服务商
  • 前端和网站开发的区别深圳做网站 龙华信科
  • 如何构成网站长沙部分小区封控