- Published on
- Published on
- Published on
太长;不看:你是否希望在新兴技术的加持下通过"文爱"的方式引出交互式的世界观,探索XP的新模式?你是否希望实现你最独特的性幻想,观察或进入这种未知的场景去体验?你是否曾设想未完成的文章后续,或是让剧情按照你的想法发展?欢迎加q 2073549171与我进行探讨,一起做“文爱合伙人” (名字略尴尬XD)。
---
近两年的生成式技术进展已经将众多曾经认为的复杂任务变得触手可及,创作工具的发展也使得创作生产能力存在飞跃式提升的可能。各种内容站点,包括R-18站点,也涌现了众多的生成式模型辅助作品,以文本对话、图像生成(尽管许多作品的质量明显有较大进步空间)为代表。作为一名机器学习研究者,虽然我的研究方向并非生成式模型/大语言模型 (LLM),但我也一直在关注着这方面的进展。毕竟,从很小的时候开始,我就经常想象能否有一种技术,能够以交互式的方式在各种模态下实现我的XP,构建出我所幻想的场景。然而,由于目前性能最好的几个模型的Alignment团队在生成内容审核方面的投入都较多,使用了各种技术,如人工反馈学习的方法来压制模型生成NSFW内容。这使得生成这类内容并没有那么容易,想要生成这些内容的用户不得不尝试开发各种模型攻击方法来绕过这些限制。因此,在过去的一年里,在通过各种调查/实验/炼丹的方式进行探索后,我认为我在稳定生成可交互的NSFW涩涩内容上已经有了基本的经验。在这些尝试中,我基本已经将我过往的大部分幻想场景进行了实现,而效果实际上是超出我的预期的。那么我为什么又想要找“合伙人”来一起探索呢?我会用接下来的内容来简单讲解。如果你对这些探索也有兴趣,或者希望使用这些技术构建你的性幻想,欢迎继续阅读并与我交流XD。
### 定制化涩涩内容生成 Customized LLM for NSFW对于如何让LLM生成涩涩文本,对模型进行jailbreaking (越狱),过往的使用者/研究者已经进行了初步的探讨。例如通过构建复杂环境的提示技巧、进行角色扮演式的引导等方式。通常来说,我们并不希望这些和具体任务无关的jailbreaking消耗太多的提示tokens,因为它们一方面提高了计算成本,另一方面也容易误导模型关注非重点的部分而非我们的核心要求。不同模型通常对jailbreaking的敏感度并不相同,而随着所需输出内容的违反道德程度的提高,jailbreaking难度也剧烈提升。幸运的是,OpenAI提供的GPT4-Turbo的preview版本并不需要太多的jailbreaking就能提供质量较高的输出,同时具有非常长的lookback window,这意味着它能接受非常长的背景设定文本,这也使其可操控性较高,能够生成更具想象力的文本(贵可能是这个api的唯一缺点了)。在此基础上,我构建了一个简单的pipeline来帮助我进行NSFW环境下的写作与交互。这个pipeline很好地满足了我的XP,并且在其中一种XP任务上表现非常令我满意——这个XP是在正常世界观下,修改了某一种社会或道德规则来构建出dom/sub或者羞耻/羞辱场景,从而让角色说出的色色话语有一种“正经而羞耻”的奇妙感觉。模型实际上体现了其认知“世界规则”的能力,而这也是我们想要的定制化世界的核心。
### 世界模拟器 World SimulatorOpenAI近来推出了文生视频的Sora产品,并称其为"World Simulator",因为开发者认为其在图像的时间轴上学习到了一定的物理知识,如重力的影响(虽然这一点被众多研究者质疑)。然而在对世界知识的了解中,人类语言这个接口能够浓缩的知识密度,以及进行查询与交互的效果显然是比图像要强的。因此,将LLM视为世界模拟器/社会模拟器/文化模拟器似乎更符合实用角度下的认知。在使用LLM的过程中,用户确实能够通过自己的设定描述一种世界观/场景,在这种条件下进行一系列的任务:如观察这个世界观下的各种角色的生态 / 叙述这个场景的演化 / 与这个场景下的人物进行交互 / 控制某些变量来观察故事的行进。用户可以随时进行沉浸式的交互,在旁观者和场景内的角色之间进行交替,随时进入/推进这个场景。这允许你自由控制某些故事中的行进方向,观察"what-if"的世界线,或是直接扮演其中的角色,这提供了比普通看文章时更新奇的体验。能够看出,这实际上和一个具有自动化、高产出、可控性强的优点的语C/文爱环境有着异曲同工之处。更进一步地,实际上,为了达到更高的可控性以及更强的生成质量,提供一定的真实对话文本是非常重要的,这也是我为什么认为“合伙人”的存在能够帮助我们更有效地激发这些方法的更高性能。
### 参考文本 Reference Text在各类提示工程 (prompt engineering) 的指引中都明确了清晰、流畅、具有逻辑思维的提示词能够让模型输出的质量提高。而提供参考文本的重要性也被众多指引多次提及。在模型用户的社群中,许多用户遇到的一个大问题是他们的模型不断输出”莎士比亚风格的文本内容“。模型倾向于长篇大论、列举事例、证明观点,而不是表现得更像一个情感丰富的人(可能就像我这篇文章一样\\)。由于下一步预测的训练目标和alignment的存在,模型天生倾向于稳定以及平均的回答。虽然提升temperature等参数能够缓解这一问题,但这大概率会使模型向意料之外的风格的方向前进,直至输出胡言乱语。因此,如果能够在最开始的设定与提示中给定足够多的参考文本,在我们的具体场景下可能是一些对话内容,那么模型就能够很好地按照我们的语言风格与方向进行展开,提供更贴近设定的场景来帮助我们的互动。也就是说,通过设定 + 参考故事 / 参考对话 (例如从语C/文爱内容进行采样),模型能够为我们提供一个可交互的世界观场景。这反过来又可以提升语C/文爱内容的沉浸式体验。这也是为什么我在探索到一定阶段,希望寻找”合伙人“来进行聊天合作,获取更多的经验。
### 寻找目标无论你是想要实现自己的幻想/世界观、想要在某个场景下进行更多样的交互、想要畅想某些未完成的作品的发展、想要让某个故事按照自己的方向行进,我们都可以一起探讨。我个人是一名24岁的男生,还在读博阶段。我个人的XP可能包括sp/bdsm/dom-sub/DiD/羞耻/拘束/以及更多奇怪的内容。由于我之前对文爱之类的交流方式经验并不丰富,因此我也可以作为一个服务者/支持者的角度来帮助你实现你的XP。对于我对这个点子未来的想法,由于目前的状态还非常原始,我希望它能够维持一个简单的形态,我也认为目前很多生成式模型的产品化模式很欠考虑。虽然我用了找“合伙人”这个词,但也只是基于这个新兴领域环境开个玩笑hh,只是聊聊天交流一下而已。而对于模型的使用成本问题,虽然目前这个api的价格用起来有点心疼,但是感觉少出去吃几次饭还是能省下来的,毕竟我现在的地方人力成本太高了,吃个饭贵的不行,对比起来其他的东西都感觉便宜了😓。还是怀念在国内随时点外卖的日子。在不过度使用的情况下,我来支付计算成本,毕竟以后也是想要开实验室的,资金不能成为问题XD。感觉上面罗嗦了这么多,如同写了一篇奇怪的技术报告,如果不符合你的口味与观点希望不要喷我orz。欢迎加,我们一起进行更多探讨。
--- 在人类历史上,这是否是对个体性幻想最友好的时代呢?