《生成式推荐模型》-1-intro
1.1 context
在本书中,整合了生成式人工智能和更传统的推荐系统的推荐系统被称为Gen-RecSys。Gen-RecSys可以根据其产生的输出的性质进行区分:
- 结构化输出:这些系统生成的推荐可能比单个item更结构化。因此,推荐输出可以构造为向量、捆绑包或item序列,为用户提供一组互补的推荐(参见第3章)
- 文本生成:这些系统可以以文本内容的形式生成项目推荐。文本可以是对话请求/响应或解释。它们总体上与用户产生了更自然、更吸引人的互动(参见第4章)
- 图像和多媒体生成:这些系统可以生成视觉内容,如虚拟试穿、时装设计、个性化视觉广告和情境产品可视化。此外,他们可以制作音频或视频内容,增强用户的整体交互体验(参见第5章)
在实践中,我们对Gen RecSys的定义相当宽泛,任何结合了生成式人工智能和推荐系统的系统都属于这一类。
1.3 Types of Deep Generative Models (DGMS)
- 直接训练模型
- 这种方法涉及使用常用的标准化user-item交互数据(显式或隐式)专门为推荐任务训练生成模型,而不依赖于预先训练的大型数据集。
- 推荐系统中直接训练的模型示例包括VAE-CF(用于top-k推荐)、SVAE1(用于顺序推荐)和IRGAN(用于负采样),更多示例请参见第3章
- 预训练生成模型
- 这种方法采用对不同数据(文本、图像、视频)进行预训练的模型来识别复杂的模式、关系和背景,从而能专门处理新任务。适用于各种数据模式的预训练模型包括GPT-4、LLaMA、CLIP等。
1.5 Guide to the Reader
这本专著是一本关于使用生成模型的推荐系统的中级指南,面向研究人员、从业者、学生和行业专业人士。
为了支持不同专业水平的读者,第2章提供了一些基本的定义和结果——从经典模型到生成模型及其应用——并且应该能被广大读者理解,使其也适用于教学目的。
尽管如此,这本书通常是供有兴趣学习生成推荐系统最先进技术的研究人员阅读的。虽然一些技术仍在发展,但本书旨在捕捉该领域的最新发展。鼓励读者按顺序阅读章节,以便顺利理解,但第2章除外,如果读者已经熟悉了最基本的概念,可以跳过第2章。然而,更高级的读者也可以根据自己的特定兴趣独立阅读每一章。
- 第2章:推荐模型的基础
- 概述了传统推荐模型和生成推荐模型,介绍了关键概念以及判别方法和生成方法之间的区别。
- 第3章:基于ID的模型
- 讨论了利用用户项目交互数据来增强推荐的生成模型。主题包括VAE、GAN和扩散模型等模型架构。
- 第4章:LLM驱动模型
- 探讨了如何利用大型语言模型(LLM)进行自然语言推荐、偏好启发和解释生成。
- 第5章:多模式模型
- 侧重于整合多种数据模式(文本、图像、音频)的模型,以提供更丰富、更个性化的建议。
- 第6章:评估方法
- 介绍了生成推荐系统特有的新指标和基准,解决了输出复杂性和系统范围性能等挑战
- 第7章:社会危害和风险分析围绕生成模型的伦理考虑,如偏见放大、错误信息和隐私问题。