契合用户兴趣变化的评论文本深度建模

作者:黄文明;张健; 刊名:计算机工程与设计 上传者:魏政君

【摘要】针对目前推荐系统对评论文本的特征提取能力不足导致的性能局限,以及数据稀疏性问题和用户兴趣漂移问题导致的推荐精度下降问题进行研究,提出一种契合用户兴趣变化的评论文本深度建模方法,基于深度学习改进传统推荐算法。使用词嵌入技术,挖掘并利用数据集评论中的语义得到表达结果;通过使用并行的一组卷积神经网络,充分挖掘用户和项目评论数据中的隐含特征;设计兴趣衰减曲线,针对用户兴趣漂移现象进一步调整用户建模的契合度;设计一层耦合结构,将两组特征作为输入使用因子分解机进行评分预测,得到推荐结果。仿真结果表明,推荐结果的准确度得到了提升,该方法可行有效。

全文阅读

0 引 言由于传统推荐系统自身结构上的限制,极度依赖人工进行规则的设计与特征的提取,使得算法模型对于特征和隐信息的提取能力有限。一定程度上限制了推荐系统的性能,造成推荐系统的发展难有较大突破。本文基于深度学习对数据特征进行挖掘和提取的优势,针对目前大部分推荐系统主要基于数据中的数值型数据和人工分类数据进行算法设计造成对于文本数据的特征提取深度及性能有限的问题,通过设计兴趣衰减函数结合卷积神经网络(CNN)提出一种契合用户兴趣变化的评论文本深度建模方法,利用用户评论文本数据实现对其隐含信息的充分挖掘,由此提升推荐系统性能并提高推荐准确度。1 相关研究1.1 基于传统机器学习的推荐算法目前,传统推荐算法主要分两大类:基于内容的推荐和协同过滤推荐,具体如下:(1)基于内容的推荐算法,基本步骤是先获取目标项目和有过用户行为的项目特征,接着计算其相似度,再结合历史评分进行推荐。田耕等基于联合已有信息组合的模型进行下一步的推荐,从而解决数据稀疏性问题并满足推荐多样性[1]。张桂平等提出一种融合用户主题兴趣和用户行为的文档推荐方法,实现主题兴趣与行为的融合,再基于此应用推荐算法,解决了个性化推荐不足及数据稀疏性问题[2]。杨武等基于内容发现用户潜在兴趣并与既有兴趣融合,得到个性化与多样化兼具的用户模型再与项目模型进行相似度计算进而得到推荐结果,提高了推荐系统多样性并解决混合推荐中的冷启动问题[3]。(2)协同过滤推荐,作为业界当前应用最广泛的推荐算法,主要包含两个方向:基于模型的协同过滤和基于内存的协同过滤[4]。基于模型的协同过滤算法根据大量的用户历史行为数据设计出可用模型,基于此对目标用户的未来行为进行预测[5],产生推荐结果。由选取的目标对象不同,基于内存的协同过滤又可分为两类:基于用户的协同过滤和基于项目的协同过滤[6]。于金明等提出一种基于改进相似度量方法的项目协同过滤算法,其核心是充分考虑项目评分之间的差值、单个评分与中值之差,以及项目评分与其它评分的均值之差,从而解决冷启动问题,提升推荐准确度[7]。彭敏等提出一种基于情感分析的推荐算法,在协同过滤算法的基础上,考虑评论文本对相似度计算的影响,解决数据稀疏性问题并充分利用评论文本[8]。高茂庭等为使协同过滤能更真实反映用户本身评分偏好,提出一种结合用户聚类和评分偏好的推荐算法,解决了用户评分矩阵维度高、计算量大等问题[9]。叶晓庆等提出一种基于协同过滤的三支粒推荐算法,在推荐过程中引入三支决策,考虑了推荐过程中产生的误分类成本和学习成本,基于用户真实的评分偏好构建三支推荐。降低传统协同过滤算法的推荐成本,并解决评分信息单一的问题[10]。张磊通过将遗忘函数结合数据集中的用户评分进行衰减,由此反应用户兴趣变化以得到符合用户兴趣漂移的个性化协同过滤推荐[11]。研究者们在传统推荐算法的基础上对影响系统性能的问题进行多年的研究和解决,目前大量的推荐系统研究主要针对挖掘系统中的数值型数据和通过人工设计规则提取数据的特征进行算法设计。但随着网络日新月异的发展,交互式的应用遍布所有角落,由此产生了巨量的用户生成内容。推荐系统能够获取数据更加丰富多样,受限于目前推荐算法对数据中尤其是文本内容的特征提取能力不足,业界逐渐将目光投向深度学习领域。1.2 基于深度学习的推荐算法近年,深度学习在计算机视觉、自然语言处理等领域取得大量成功,又掀起了人工智能领域的发展浪潮。尤其是深度学习在自然语言处理方面取得的进展,高度契合推荐系统使用原始评论文本数据的需求。目前,基于深度学习的推荐算法仍是崭新的概念。直至2016年,业内

参考文献

引证文献

问答

我要提问