用新兴技术具象化你所有的性幻想？寻找文爱搭子×文爱合伙人√

太长；不看：你是否希望在新兴技术的加持下通过"文爱"的方式引出交互式的世界观，探索XP的新模式？你是否希望实现你最独特的性幻想，观察或进入这种未知的场景去体验？你是否曾设想未完成的文章后续，或是让剧情按照你的想法发展？欢迎加q 2073549171与我进行探讨，一起做“文爱合伙人” （名字略尴尬XD）。

---

近两年的生成式技术进展已经将众多曾经认为的复杂任务变得触手可及，创作工具的发展也使得创作生产能力存在飞跃式提升的可能。各种内容站点，包括R-18站点，也涌现了众多的生成式模型辅助作品，以文本对话、图像生成（尽管许多作品的质量明显有较大进步空间）为代表。作为一名机器学习研究者，虽然我的研究方向并非生成式模型/大语言模型 (LLM)，但我也一直在关注着这方面的进展。毕竟，从很小的时候开始，我就经常想象能否有一种技术，能够以交互式的方式在各种模态下实现我的XP，构建出我所幻想的场景。然而，由于目前性能最好的几个模型的Alignment团队在生成内容审核方面的投入都较多，使用了各种技术，如人工反馈学习的方法来压制模型生成NSFW内容。这使得生成这类内容并没有那么容易，想要生成这些内容的用户不得不尝试开发各种模型攻击方法来绕过这些限制。因此，在过去的一年里，在通过各种调查/实验/炼丹的方式进行探索后，我认为我在稳定生成可交互的NSFW涩涩内容上已经有了基本的经验。在这些尝试中，我基本已经将我过往的大部分幻想场景进行了实现，而效果实际上是超出我的预期的。那么我为什么又想要找“合伙人”来一起探索呢？我会用接下来的内容来简单讲解。如果你对这些探索也有兴趣，或者希望使用这些技术构建你的性幻想，欢迎继续阅读并与我交流XD。

### 定制化涩涩内容生成 Customized LLM for NSFW对于如何让LLM生成涩涩文本，对模型进行jailbreaking (越狱)，过往的使用者/研究者已经进行了初步的探讨。例如通过构建复杂环境的提示技巧、进行角色扮演式的引导等方式。通常来说，我们并不希望这些和具体任务无关的jailbreaking消耗太多的提示tokens，因为它们一方面提高了计算成本，另一方面也容易误导模型关注非重点的部分而非我们的核心要求。不同模型通常对jailbreaking的敏感度并不相同，而随着所需输出内容的违反道德程度的提高，jailbreaking难度也剧烈提升。幸运的是，OpenAI提供的GPT4-Turbo的preview版本并不需要太多的jailbreaking就能提供质量较高的输出，同时具有非常长的lookback window，这意味着它能接受非常长的背景设定文本，这也使其可操控性较高，能够生成更具想象力的文本（贵可能是这个api的唯一缺点了）。在此基础上，我构建了一个简单的pipeline来帮助我进行NSFW环境下的写作与交互。这个pipeline很好地满足了我的XP，并且在其中一种XP任务上表现非常令我满意——这个XP是在正常世界观下，修改了某一种社会或道德规则来构建出dom/sub或者羞耻/羞辱场景，从而让角色说出的色色话语有一种“正经而羞耻”的奇妙感觉。模型实际上体现了其认知“世界规则”的能力，而这也是我们想要的定制化世界的核心。