星级打分
平均分:5 参与人数:1 我的评分:未评
PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity)且风格多样的照片。 PhotoMaker具有多项关键特性:首先,它支持在几秒内完成快速定制化,无需额外的LoRA训练,极大提升了用户体验;其次,确保了令人印象深刻的身份一致性,同时提供多样化的输出和灵活的文本控制性;此外,PhotoMaker还可以作为适配器(Adapter),与其他基础模型及LoRA模块协同工作,扩展了其应用场景和兼容性。 随着版本的更新,PhotoMaker V2在保持高质量生成和编辑能力的同时,进一步提升了ID一致性。同时,它提供了与ControlNet、T2I-Adapter等插件的集成脚本,为用户提供了更强大的控制能力。用户可以通过自定义脚本来实现功能的升级,如与LCM结合加速处理速度,或与IP-Adapter-FaceID等工具结合以进一步提高ID一致性。 以上是软件介绍,我测试下来生成的图像跟原始人脸挺像的,而且会随机扭转人脸角度,但是能不能按照指定角度生成图像我还没弄明白,SD的提示词大部分可用,感觉可以用来补src角度,就是对硬件要求比较高。我是笔记本4080,12G显存,运行的时候显存基本占用99%,按照默认的30的采样步数,生成一张图片需要大概6分钟,我感觉采样步数弄到20也够了。
|