With PQDT Open, you can read the full text of open access dissertations and theses free of charge.
About PQDT Open
Search
人工智能在过去十年取得了重大进展,但是机器和人类智能之间还存在很大差距。大多数监督学习的方法依赖于海量人工标记的数据,并且容易受到领域迁移和对抗攻击的影响。为了实现真正的智能,另一种方法是对世界构建一个通用模型。它使智能体在做出决策之前能对它所处的环境进行建模。判别模型通过数据学习类标的条件概率分布,而生成模型直接学习数据的整体概率分布,这需要对环境有更深入的理解。对于确定的环境,智能体直接优化它的收益;对于不确定的环境,智能体优化它的期望收益。
本论文从博弈论的角度研究生成模型,并给出几个问题的解决方案。我们首先回顾非合作博弈与合作博弈的基本概念,包括纳什博弈、贝叶斯博弈、和鲁棒博弈模型。
第一部分,我们介绍三种衡量不同概率分布之间差异的常用距离度量:Bregman divergence, f-divergence, 和Wasserstein距离。我们比较这些度量方法在训练生成模型时的性能,并给出一些近似算法。这一部分是整篇论文的基础,许多算法需要使用这些距离度量对不确定性进行建模。
第二部分,我们研究用于生成新数据的生成模型,并提出分布式鲁棒博弈模型(DRG)。在这个模型中,每个智能体需要在不确定的环境中做出决策。这引出一个分布式鲁棒优化问题,它的解是通过动态优化最差场景收益得到的。我们分别使用f-divergence和Wasserstein距离来定义这个问题,并给出求解纳什均衡的相应算法。然后,我们使用分布式鲁棒博弈模型(DRG)训练深度生成模型,并将它应用于计算机视觉领域,实现无监督图像生成。
第三部分,我们研究用于修改已有数据的生成模型。我们提出了一个加入条件约束的生成模型,实现语音情感转换。它能改变语音信号中的情感特性,并保留语音内容和说话者的身份。我们假定语音信号在隐空间里可以被分解成一组情感无关的内容编码和一组情感相关的风格编码。情感转换是通过提取内容编码、并与目标情感的风格编码合并来实现的。我们设计了一个自动编码器来学习解耦表征,其中编码器、解码器、和情感分类器组成了一个分布鲁棒博弈,智能体之间有竞争、合作与联盟。我们在一个非平行语料库上进行实验,转换四种情感,并评估生成语音的质量。
Advisor: | Hamidou, Tembine |
Commitee: | Hamidou, Tembine, Wong, Edward, Togelius, Julian, Xia, Gus |
School: | New York University Tandon School of Engineering |
Department: | Computer Science and Engineering |
School Location: | United States -- New York |
Source: | DAI-B 81/9(E), Dissertation Abstracts International |
Source Type: | DISSERTATION |
Subjects: | Computer science, Artificial intelligence, Electrical engineering |
Keywords: | Distributionally robust games, Game theory, Generative models, Image synthesis, Robust optimization, Voice conversion |
Publication Number: | 27672221 |
ISBN: | 9781658450799 |