SSR-Encoder：从图像提取不同特征

SSR-Encoder：从图像提取不同特征

小红书新发布的一个编码器SSR-Encoder，可以实现从一张图片种提取不同的主题（人物、物体等）特征生成图像。与 SD 现有的能力都能结合，Animatediff 也可以。

SSR-Encoder，这是一种新架构，旨在从单个或多个参考图像中选择性地捕获任何主题。它响应各种查询模式，包括文本和掩模，而无需在测试时进行微调。
SSR-Encoder结合了一个Token-to-Patch Aligner，用于将查询输入与图像块对齐，以及一个细节保留的主题编码器，用于提取和保留主题的精细特征，从而生成主题嵌入。
这些嵌入与原始文本嵌入结合使用，条件化生成过程。SSR-Encoder以其模型泛化性和效率为特点，适应于一系列自定义模型和控制模块。通过Embedding Consistency Regularization Loss进行增强，以改进训练。
SSR-Encoder：从图像提取不同特征

正文完

主题图像编码器

发表至：系统工具

2024-01-02

0

微软本月晚些时候宣布 Windows 活动的下一步

Google Bard AI 注册 – 如何访问 Bard AI 搜索工具？

如何在 Twitter 上解锁“潜在敏感内容”

如何在 Microsoft Outlook 日历中管理新的时间建议

不喜欢 Twitter 的新 Chirp 字体？这是禁用它的方法

如何使用开源模型构建大型语言模型（LLM）和 RAG 管道

Alexa 能做什么？如何充分利用任何 Amazon Echo 设备

LibreOffice 7.3 将支持两种合成语言；克林贡语和间斯拉夫语

如何在 iPhone 上使用 ChatGPT

Microsoft Teams 更新带来更多表情符号选择

如何在 Windows 10 上的电影和电视中始终全屏显示视频

Win10自带录屏软件不能录全屏怎么办？无法录屏怎么办？解答集合

Forza Horizon 5 在 Windows 11 中崩溃？这是该怎么做

如何在 iPhone 上从 Twitter 保存视频

如何删除您的 Google Bard 历史记录

Ventoy是什么，如何下载和官方介绍

I2V-Adapter：直接从图片生成视频

Musicgen-remixer：将音乐重新混音

文章搜索

热门文章