英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
移 动 信 息 检 索
使用内容和
上下文
信息挖掘
的音乐推荐
台湾成功大学的Ja-Hwung Su和Hsin-Ho Yeh
芝加哥伊利诺伊大学的Philip S. Yu
为了提供适合各种听众和各种情境的音乐推荐,uMender挖掘
台湾成功大学的Vincent S. Tseng
能手机等移动设备越来越流行,在不同环境下实时访问多媒体数据变得越来越轻松。 通过适当配备的信息服务,用户可以轻松获得他们想要的广泛分布的视频,音乐和文档。 因为它的
智
上下文信息和音乐内容,然后考虑相关的用户评分。
可用性和容量要求,音乐比其他类型的多媒体数据更受欢迎。 文档和视频很难在手机的小屏幕上查看,而视频的大数据量会导致检索的高额费用。 但是先进的音乐压缩技术可显着减少所需的存储空间,并使音乐数据的流通更加容易。 这意味着用户可以直接从网络上获取他们最喜欢的音乐,而不需要去音乐商店。 因此,帮助用户在庞大音乐库中找到他们喜欢的音乐在过去几年已成为一个吸引人且具有挑战性的问题。
传统的音乐推荐主要是基于协同过滤(CF)。(请参阅“协同过滤的相关工作
“以获得关于这项技术的更多信息。)但是,由于信息不足,包括评分数据的稀疏和背景信息的缺乏,使这项技术的有效性受到限制。 稀疏的评分数据会在实际应用中频繁出现,并可能导致推荐列表与用户偏好不符合。 此外,用户的偏好可能会在不同的情况下有所不同,比如位置,时间,移动状态和温度的不同。 举个例子,有些人慢跑的时候可能喜欢嘻哈音乐胜过古典音乐。 一项调查显示,活动(一种上下文信息)显着影响了听众的情绪1这一发现提供了一个重要信息,即上下文信息是音乐推荐人在选择音乐以适应听众情绪时考虑的重要因素。 下一代
16 1541-1672/10/$26.00 copy; 2010 IEEE IEEE智能系统
由IEEE计算机协会出版
协作过滤的相关工作
在
音乐推荐领域,传统的方法如协同过滤(CF)被用来发现用户和音乐项目之间的关系,建立在用户
给每个音乐项目评分的基础上。 (我们在本文中使用术语音乐项目来表示音乐作品,例如歌曲)。实际上有好几种类似CF的推荐系统。
为了在用户的兴趣和音乐项目之间建立桥梁,基于模型的推荐系统使用机器学习技术来通过一组评分来表示用户偏好并且构建特殊预测模型1。受基于模型的CF的驱动,过去几年的好几个研究都集中在建模行为的有效性上。
与基于模型的推荐系统不同,基于记忆的推荐系统使用大量明确的用户投票找到活跃用户的最相似用户2-4。然后,他们汇这些相似用户的评分,以预测活跃用户对相关项目的评分。
除了这些基于CF的一套方法之外,一些过去的研究已经开发出混合推荐系统,它们结合了不同的CF算法以产生更好的推荐系统。5Jun Wang,Arjen de Vries和Marcel Reinders整合了基于用户和基于项目的CF方法,并表明混合方法优于单个方法4
CF背后的主要思想是,通过具有类似评分行为的用户,可以将书籍,音乐,电影等产品与喜好的建立联系。不幸的是,类似CF的推荐系统信息不足,特别是缺乏背景信息。
尽管一些当代上下文感知的推荐系统试图通过对环境元数据的更多考虑来加强推荐,但他们仍然难以在不同的上下文条件下学习用户的偏好6,7
参考
- G. Adomavicius and E. Tuzhilin, “Toward the Next Genera-tion of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions,” IEEE Trans. Knowledge and Data Eng., vol. 17, no. 6, 2005, pp. 734–749.
- R. Burke, “Hybrid Recommender Systems: Survey and Experi-ments,” User Modeling and User-Adapted Interaction, vol. 12, no. 4, 2002, pp. 331–370.
- B.M. Sarwar et al., “Item-Based Collaborative Filtering Rec-ommendation Algorithms,” Proc. 10th Intrsquo;l Conf. World Wide Web (WWW 01), ACM Press, 2001, pp. 285–295.
- J. Wang, A.P. de Vries, and M.J.T. Reinders, “Unifying User-Based and Item-Based Collaborative Filtering Approaches by Similarity Fusion,” Proc. 29th Ann. Intrsquo;l ACM SIGIR Conf. Re-search and Development in Information Retrieval (SIGIR 06), ACM Press, 2006, pp. 501–508.
- K. Yoshii et al., “Hybrid Collaborative and Content-Based Mu-sic Recommendation Using Probabilistic Model with Latent User Preferences,” Proc. 7th Intrsquo;l Conf. Music Information Re-trieval (ISMIR 06), Intrsquo;l Soc. Music Information Retrieval, 2006, pp. 296–301.
- J. Hong et al., “Context-Aware System for Proactive Personal-ized Service Based on Context History,” Expert Systems with Applications, vol. 36, no. 4, 2009, pp. 7448–7457.
- G. Reynolds et al., “Interacting with Large Music Collections: Towards the Use of Environmental Metadata,” Proc. IEEE Intrsquo;l Conf. on Multimedia and Expo, IEEE Press, 2008, pp. 989–992.
的手机可能会提供这样的上下文信息。 因此,如图1所示,普遍存在的音乐推荐最近受到了相当的关注。
在这篇文章中,我们提出了Ubiquitous Music Recommender(uMender),它通过挖掘音乐内容和上下文信息来解决音乐推荐问题。 对于音乐内容,我们提出了一种两阶段的聚类方法来识别每个音乐项目的感知模式,这些模式由在音乐中隐藏的声学和时间特征组成。
图1.无处不在的音乐推荐情景。
考虑到这种模式,我们可以更精确地控制用户在音乐项目中的聆听偏好。 对于上下文信息,我们已经设计了一种新颖的解决方案用来捕获用户在各种条件下的偏好。 与传统方法中计算用户评级的相关系数不同,我们将在相似的情境条件下的用户进行分组,以找出隐含的,更适用的感知模式。 通过综合挖掘情境信息和音乐内容,uMender
移动信息检索
推荐结果
类似的用户
首选实例
推断
运动
日历
环境条件
健康状况
推荐结果
类似的用户
首选实例
位置
推断
图2.uMender的主要思想。 uMender通过从音乐内容和上下文信息中发现用户的聆听兴趣来预测用户对音乐的偏好。
...
...
图3. uMender的工作流程。该系统在离线预处理阶段挖掘用户兴趣的感知模式,以便根据上下文信息进行在线偏好预测。
图2显示了我们推荐的推荐系统的主要思想。 基本上,我们的系统将音乐项目表示为能唯一标识音乐项目的变换符号序列。 在CF原理的基础上,uMender将具有类似情境的用户分组,这意味着每一组对音乐有着相似的兴趣。 然后,uMender识别符合用户的聆听兴趣和当前情境的相关音乐项目。 uMender是一个创新的推荐系统,它集成了音乐内容挖掘和上下文信息过滤,以实现高质量的普遍存在的音乐推荐。
骨架
...
如图3所示,uMender框架包含两个阶段:离线预处理和在线预测。 在离线预处理过程中,系统根据用户的聆听兴趣挖掘感知模式,这有助于在上下文信息的基础上进行在线偏好预测。
离线预处理
这个阶段的重点是音乐预处理,其中包括特征提取,双向聚类和音乐符号化。 由于我们提出的预测是基于音乐特征,因此这一阶段对在线预测非常重要。 我们的系统首先从数据库中的音乐中提取音乐特征。 接下来,通过两次聚类,它将每个音乐项目转换为由一组感知模式组成的连续符号字符串(也称为感知模式字符串)。
提供适当的,无处不在的音乐推荐。
概念基础
uMinder的主要挑战是如何使用
上下文信息和音乐内容来有效发现用户的隐含兴趣。 为了应对这一挑战,我们根据可用的上下文信息探讨如何挖掘音乐的感知模式。
在线预测
当活跃用户ui到达时,系统会搜索评分矩阵和上下文日志,以生成一个改进的子矩阵,代表了最相关的具有类似上下文信息的用户和音乐项目。
感知模式字符串m
字符串m
帧K
m个音乐流
感知模式字符串2
帧2 字符串2
感知模式字符串1
字符串1
帧1
然后,它会逐个预测每个音乐项目的评分。 对于每个音乐项目,系统将一组连续模式作为窗口中的片段以窗口方式进行编码。 根据从改进的子矩阵的正负集合中挖掘出的匹配片段,系统可以使用基于模式的偏好预测来确定首选的音乐项目。 最后,系统生成推荐列表。
预处理阶段
到目前为止,基于音乐特征的音乐推荐效果非常有限。2,3这是因为在将传统的低级特征转化为诸如节奏,音调,韵律,音色等语义特征的过程中
图4.离线预处理。 两阶段聚类方法将每个音乐项目转换成一组连续的感知模式。 MDCT:改进的离散余弦变换。
对齐聚类和编码
相关系数聚类和编码
流划分和MDCT提取
...
...
...
,用户的聆听兴趣模式可能会丢失。 为了捕捉用户的聆听兴趣,我们提出了一种两阶段聚类方法,将音乐转换为一组连续的感知模式(图4)。 感知模式就像一个音乐项目的基因,通过声音和时间特征来表示音乐的签名。
实验评估结果显示了感知模式的稳健性。 现在,我们展示如何从低级音乐特征中推导出感知模式。 在聚合之前,我们从音乐中提取低级特征。 对于MP3格式的音乐,我们在一秒内提取38帧并将每帧表示为26毫秒内做改进的离散余弦变换(MDCT)生成的576个系数。 在这个方法中,我们从576个系数中选出36个重要系
也就是说,它将具有相似频谱的帧分组以表示声学特征。 基本上,基于帧的聚类是一种分层分裂策略。 我们的方法使用两个标准 - 比例和密度 - 作为分割每个叶节点的阈值。 比例表示聚类中帧的总数; 密度表示聚类的可信半径中的帧数(可信半径指定聚类质心周围的质量区域,以验证帧分布的密度)。假定聚类Cj是由一组帧组成,并且c是Cj的质心,
自信半径为(1),
其中
术语dist(f,c)表示帧f和质心c之间的距离,如下所示:
dist(f,c)=
1i MDCT
lt;
全文共13388字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[11634],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。