基于音乐类型分类和个性诊断的移动混合音乐推荐系统Word下载.docx

资源描述

基于音乐类型分类和个性诊断的移动混合音乐推荐系统Word下载.docx

《基于音乐类型分类和个性诊断的移动混合音乐推荐系统Word下载.docx》由会员分享，可在线阅读，更多相关《基于音乐类型分类和个性诊断的移动混合音乐推荐系统Word下载.docx（11页珍藏版）》请在冰豆网上搜索。

基于音乐类型分类和个性诊断的移动混合音乐推荐系统Word下载.docx

动态相关性学习技术可以根据用户偏好给系统提供提炼查询结果的能力，因此，系统可以提供一个简单的推荐信息表。

更复杂的搜索引擎如谷歌利用其他“权威性”标准,旨在尽可能为用户提供有用的结果,但仍不是一种个性化的方式。

推荐系统的研究结合了近期快速发展的移动技术，并且继续被手机技术和移动网络技术的革新所推进。

现代手机依靠其内在能力提供多媒体服务。

内置了照相机、收音机、媒体播放器和其他生成和处理多媒体数据的模块。

这些优势导致用户不仅把手机当成基本通话工具，更把它视为娱乐和存储设备。

除此之外，近几年一系列对手机存储容量的限制也被排除。

随着移动技术的快速发展，移动宽带用户创作音乐库文件已经实现。

明显的，操纵大量数据越来越成为复杂耗时的过程，一致移动用户不能有效管理音乐文件资源。

这个事实促成一个能推荐给其用户合适音乐的系统。

因此，期望一个给用户查询结果的推荐系统，并且能够尝试预测用户是否对推荐音乐有兴趣。

具体地说，音乐推荐系统根据用户的相似之处尝试推荐给用户一些音乐文件，这样，用户的个性化也被嵌入到推荐系统之中。

我们当前的工作重点是建设一个在拥有很少甚至没有用户偏好甚至没有用户偏好数据的情况下，能适应不断变化的用户偏好的推荐系统，该系统能迅速反馈给用户所希望查询的结果。

众所周知，协同过滤技术患有不协作、用户偏见、冷启动等问题，我们建立的是基于内容检索和个人偏好诊断的协作过滤系统。

具体来说,本文的组织结构如下:

第二部分回顾之前的相关工作,第三介绍我们已经开发出来系统。

第四部分描述了后端整合到系统的推荐技术。

第五部分对基于最小绝对错误和得分排序标准的评价结果的推荐技术的评估。

最后,在第六部分，插入描绘了系统的未来研究方向。

2相关工作

常规的推荐技术室系统过滤，具体的说，协同过滤技术就是在考虑其他人对部分音乐的排序等级而推荐给用户的一种技术。

例如，有目标用户喜欢音乐A和B，现有一部分用户喜欢音乐A、B、C，音乐C可能将会被推荐给这个目标用户。

换句话说，也就是推荐给目标用户的是消费偏好相似的其他一组用户的内容。

由于其本身的特性,协同过滤已经普遍用于预测各种偏好问题,如网络新闻、电子商务、数字图书馆等。

在文献中，协同过滤技术一再应用在移动环境中。

例如，MobiTip就是利用协同过滤技术预测基于新的或用户提供更新的电影数据变化率。

类似的，我们在[8]提到的，最早之一的音乐推荐系统就是用协同过滤技术。

这个系统利用WEB过滤过的数据来支撑节目播放列表。

所以被称作“基于系统过滤的推荐引擎”。

他们的系统产生的是基于用户播放列表内容的推荐。

另一方面,基于内容的推荐系统是基于系统通过关联特征发现对象的兴趣。

这些系统学习基于用户相关项目特征的兴趣文件。

然后，推荐系统在没有匹配兴趣的情况下建立起来。

为进一步改进推荐性能和消除每个独立推荐技术的缺点，考虑使用各种混合技术。

一种混合的推荐方法是基于内容预测和系统过滤技术。

基于内容的预测部分可以解决依靠相关性项目来预测不相关项目等级的稀疏矩阵和第一评估者问题。

由于混合方法的性能通常依赖于精确的基于内容预测，支持向量机通常被应用到基于内容的预测任务中。

更具体的说，混合推荐系统可以分为以下几类：

-联合分离推荐；

-增加基于内容特征协作模式；

-增加协作特征的内容模式；

-单一统一推荐模式。

第一类混合推荐系统包括两个独立协作和基于内容的系统。

有四种不同的方法结合两个分离的系统：

加权混合方法：

输出（评级）获得个人推荐系统组合在一起以产生一个单一的最后的建议或者使用线性组合[7]或[18]投票方案P-Tango系统最初给两个推荐系统相等的权重，但逐渐地根据用户的评级来调整预测权重。

系统保持两个过滤方法相互独立，保证发挥各自的优势。

切换权重方法：

系统在推荐技术之间进行切换，并且选择对当前状况推荐质量较好的推荐技术。

该技术一个典型的例子是日学习推荐系统，它选择具有较高可信度的推荐子系统。

这种方法的另外一个例子是在[27]提到的，它选择根据提供的推荐结果与用户评级一致性较高的基于内容或协同过滤技术。

分区混合法：

在这种方法中，结果从不同的推荐子系统同时给出。

一个例子是在[25]提到的基于电视播出和用户偏好系统信息的文字描述。

推荐系统在最后的推荐结果中同时给出这两种技术的推荐结果。

梯度混合法：

在这种方法中，先用一种技术产生一个粗略的候选结果，再采用第二种技术对粗选结果进行精确选择。

这种方法比加权混合方法的各种应用技术在所有预测项目上都更有效。

因为第一级过滤已把候选项进行了过滤，所以这种混合方法计算任务更小。

然而，这种方法对于低优先级推荐时对无用数据具有更高的兼容性。

换句话说，这种梯度混合方法可以分析两个梯度。

第一级（基于内容的方法或基于（协同）知识）选择中间推荐结果。

然后，第二级（基于内容协同或基于知识协同方法）从第一级推荐结果中选择更合适的项目。

BurKe[5]开发了一个叫做EntreeC.的酒店推荐系统。

这个系统首先用基于知识的方法选择客户的用餐偏好，在基于知识的方法中，创作者根据事先定义好的描述酒店特征的属性构造特征向量。

这种方法与基于内容的方法相似，然而，我们必须注意是在基于知识的属于已被使用并且元数据是独立于内容的。

这些酒店用协同方法进行等级排序。

除前面提到的方法之外，最近的推荐系统包括下面方法：

在[9]里，作者提出了一个上下文感知的音乐推荐系统，该系统是就内容检索，音乐本体和领域专用术语诸如精神和心里情景。

创建了情绪状态转换模型（ESTM）,来描绘复杂的人类情感并且能够把用户的心里情景和喜好用COMUS来评估。

音乐推荐系统基于当前的、用户想要的、ESTM已经完成低等级特征算法分类。

ALBANESEETAL.[2],提出了另外一种方法，该方法融合了隐藏在使用日志中的低等级特征的信息使用模式和用于预测用户行为的语义描述符来提供有效的推荐信息。

在这个推荐系统中，作者介绍了多通道浏览器和多通道对象来模拟用户并发浏览多类型对象。

在系统原型上进行了广泛的试验，得到了良好的试验结果。

在[10]里，创建者提出了一个基于用户上下文的框架来为周围媒体服务。

拟议的框架包含了动态确定上下文并提供媒体用户需求。

该框架能随着时间的变化适应媒体服务，并且能根据环境灵活的更新用户喜好。

3推荐系统综述

我们的推荐系统是一个固件系统。

具体地说，我们的系统允许移动用户通过他/她的移动终端发送实例音乐到音乐库查询和与需求音乐相似的音乐文件名进行查询。

在前述的预备工作中[13-15],开发系统的动机是减少现有移动音乐推荐系统的局限性。

具体的说，我们的系统是不需要操作的系统，并且不需要应用程序接口或特别的客户端安装。

该系统使用支持所有手机的推送技术。

推送就是在不需要用户明确需求的情况下给移动用户发送一条信息。

信息发送可能是人到人或应用到人甚至应用到应用。

一些推送应用的例子包括预警信息、股票行情和每日星座。

在这几种情况中，有用户定制服务和根据用户喜好推送的预警信息。

在WAP推送中，允许推送发起者传送推送内容并且传递指令到推送网关，然后推送网关根据传送指令推送内容到WAP客户端（诸如“客户”或“终端”）。

典型的是推送发起者是运行在WEB服务器中的应用程序。

它与推送网关通过推送接受协议进行通信。

推送网关通过空中接口协议传送推送内容到客户。

前段推荐水平依靠开放资源技术和仿真模型工具。

编程使用JAVA语言。

一些完成前段运行水平的服务已经实现。

我们使用开放资源软件WAPPushSDKV2.0版本来实现推送协议。

推送代理网关已经使用开放资源软件Kannel.Kannel是开服昂资源WAP网关。

最后，对形同运行说明和评估，我们使用DeveloperPlatform2.0SDK-Nokia6230平台版本。

它是NokiaDeveloperPlatform2.0SDK仿真规范。

SDK提供媒体内容和J2ME平台应用的环境。

另外，虽然推荐系统算法是基于先进的久经考验的辨识/机器学习技术，推荐系统程序与用户交互非常简单，不需要用户有先进的技巧。

的确，用户通过多媒体终端发起的服务，包含用户通过音频文件发起推荐处理程序。

推荐处理过程有两步组成。

第一步，处理程序区分用户提交的音乐文件流派，然后第二步推荐系统按照以下程序进行。

协同过滤技术应用把选择的歌曲文件排列在较高的等级序列。

推荐结果的内容传送格式不需要呈现给用户，因为这样将引起用户不必要的高消费。

推荐系统反馈给用户简单的推送信息来代替。

每一个推送消息与推荐音乐文件列表进行连接。

然后，用户可以选择推荐音乐文件或者通过提供排序等价更新系统提供的推荐列表。

随后，系统根据用户排序等级更新推荐列表。

推送技术允许系统在没有用户发送信息的情况下更新推荐文件列表。

连接都有命名，一边用户根据连接名称选择是否从WEB服务器下载这些音乐文件到他的手机。

现实中，通信系统是一个前段到后端的多层级体系结构。

前段包括实现用户通信的模块，移动网，应用程序。

后端是指实现推荐机制的模块。

本文设计的推荐系统允许音乐数据库是分布式的并且和后端代理网关，推送发起者，前段无线接入协议服务器相分离。

4基于音乐类型分类和个性诊断的混合音乐推荐方案

如上一节所述，用于方案实现的后端包含所有模块。

具体而言，我们中间件系统后端包含两个方面。

第一，采用径向基函数神经网络支持向量机分类器，从而增强内容信息，以便于在音乐类型分类系统查询支持的音乐文件。

第二，利用现有特定用户或其他用户的评级以提供个性化的方案。

本推荐机制的目的在于返回音频/音乐搜索结果，而不仅仅是查询同类型的音频/音乐和内容相似的文件。

但也考虑到用户喜好的每一个音乐文件的评级。

（如图1）

具体步骤如下：

1.用户通过提交询问（目的音乐）进行初始查询，特征提取器提取对应30个音频详情的一组值。

2.第一，分类标识查询音乐文件的类型。

第二，推荐程序将根据用户喜好返回歌曲。

更确切的说，一级分类器识别音乐查询文件类型的信心。

判决值（信心）是查询特定类别幅度的差额。

选择对应最高判定值分类器类型。

3.第二级采用个性诊断方法，返回一个推荐列表。

数据库中的每个音乐文件可以关联五个评分等级。

另外，每个音乐类型被细分成4个等级{0,1,2,3}。

4.最后，用户既能够选择并下载音频/音乐或提供推荐项目评级，还可以收到新的推荐列表。

4.1SVM分类器

支持向量机（SVM）是寻找单独数据点最佳超平面途径，概括最优数据的监督分类系统。

超平面即所谓的每类的最近点距离最大化的最大间隔超平面。

令S={S1,S2,...,Sn}其中，Sj∈Rd是对应音乐数据库文件的一组d维特征向量。

任何超平面分离的两个数据类（二进制或二分类）形式如

（1）。

图1推荐方案

（1）

其中，f：

Rd->

[-1,+1]。

SVM分类器得到解决二次规划问题如

（2）

约束条件：

（3）

最佳解决方案的决策函数如下：

（4）

支持向量机的一个显著特征是仅有一小部分的Wi系数为非零。

相应的Si对（边缘支持向量）和完整定义输出标签的决策功能。

设定训练模式只出现在点乘积项Φ（Si）·

Φ（Sj），这里定义一个核心函数K（Si，Sj）=Φ（Si）·

Φ（Sj）映射到多维空间并进行点积运算。

我们引用的具体的高斯函数为K（si,sj）=

在第一步的音乐推荐过程中多类而非出现二元分类问题。

为解决这一问题，本文理由协同分类技术通过分类集合致力于空间的特定视图，包括原始空间的分解。

分为以下两个步骤：

第一，训练的二进制SVM分类器对其中每个特定类的对象进行分类。

第二，与第一步的分类结果相结合，以得出最终的分类决策。

集成分类器，遵循反对（OAO）或成对策略。

OAO方法是通过在成对类之间培训二进制SVM。

因此，OAO模式为K（K-1）/2二进制SVM解决K类分类问题。

每个K（K-1）/2SVM为目的类投一票，并将票数最高的分配给输入样本X。

4.2个性诊断

推荐过程实现的第二层是个性诊断技术。

这一层面的主要特点是，有意义概率语义的预测，此外，假设每个用户的喜好构成其基本人格类型的一个特征。

因此，考虑到在线用户已知的项目评级，这使得估计他/她与另一用户有相同的性格类型的概率成为可能。

用户可以看到给定用户采用“真”收视率向量的个性类型。

一个真正的评级不同于一定量的（高斯）噪声下用户给出的实际报告评级。

特定用户个性类型，个性诊断方法估计的是系统相同性格类型中给定用户的概率，从而，估计用户喜好新项目的概率。

[19]

对每个用户Uk的个性类型归纳如下，其中K=1,2,……m，Um={u1，u2，……um}，用户Uk的优选条件是In={i1，i2，……in}：

（5）

Rture（Uk，il）其中，il∈In，l=1,2，……n代表项目il的用户Uk的真正评级。

关键在于区别“真”的用户评级和（已知）用户评级报告。

推荐系统的设计者是不能直接访问真正的用户喜好的评级编码。

然而，用户提供的报告评级应用于推荐系统。

据推测，用户给出的评级报告包括高斯噪声。

假设用户可以在不同情况下，相同的项目，根据上下文的不同评级报告。

因此，我们可以认为一个项目il的用户评级报告服从独立正态分布Rture（Uk，il）。

特别是：

（6）

其中σ是空闲变量，X是推荐系统的用户评级报告，y是无噪声条件下用户Uk报告评级值。

此外，假设用户评估项目组R代表目标人群的个性类型的分布。

因此，考虑到这样的假设，制定先验概率

，在线用户Ua对应的向量v，根据v其他用户的速率作为给定的的频率，因此，明确计算出现，并非我们简单定义。

是一个随机变量，可以取值m，（R（u1）,R（u2）,...,R（um）），每个概率为1/m：

（7）

结合（6）和（7），并给出在线用户的评级，可以运用贝叶斯法则计算出在线用户相同性格类型占其他用户的概率。

（8）

因此，计算每个用户Uk数量，可以计算得到不可见项目IJ在线用户的评级分布。

这个概率分布

，推荐系统所产生的在线用户Ua项目IJ预期评级。

（9）

该模型被描述为贝叶斯网络结构中一个典型的诊断模型，如下：

首先，观察到评级和计算概率，每个人的个性类型使用的原因（8）。

评级可以被视为“症状”，而个性类型为“病”，导致这些症状出现在诊断模型中。

其次，可为不可见项目计算出等级值的概率（9），返回预测推荐系统最有可能的评级。

个性诊断另外一层意思，在线用户评级被认为是通过选择其他用户之一均匀随机高斯噪声添加到他/她的评级“产生”。

可根据在线用户评级推断出他/她实际上是其他用户之一，计算得到其他项目评级的概率。

5推荐系统评估

设定用户组U={u1,u2,...,um}，音乐数据库中相关项目I={i1,i2,...,in}，用于音乐推荐系统的实现。

数据库中的每一个音乐文件对应于30维向量空间V，要求参与我们实验的每个用户为数据库中每个项目分配唯一的评级值。

设R（u,i）为用户U分配给项目I的评级值，通过以下公式定义四类：

（10）

为了说明本推荐方法的性能，研究采用从4类西方音乐选出400个音乐文件。

具体地，集合包含了四类西方音乐中每个30S持续时间的100个音乐文件（见表1）。

表1classesofwesternmusic

为捕获某些方面具体的应用功能，音频信号可以以多种形式表示。

特征提取的大量重要的工作更适合于描述和模拟音乐信号。

本文中，采用Tzanetakis和Cook[28,29]最初提议的特定30维客观特征。

值得一提的是，这不仅提供了低级别音乐信号的统计特性表示方法，也包含高水平心理声学算法信息的提取。

总之，这些功能表现出有节奏的内容（节奏，节拍和速度信息），音乐信号音调，旋律及和声的描述。

这些文件被15个用户分配评级值，用户至少对150个音乐文件声明他们的观点。

正如之前提到的评级值按照数值规模从1（低优优先级）到3（高优先级），评级为0表示相应的文件没有评级值，因此被视为非首选。

分类算法，采用基于RBF-SVM分类器，设γ=0.1，所有30维空间向量归到[0,1]区间。

使用十倍交叉验证评估方法对第一级分类精度进行计算。

进行评估的数据集和的90%用于训练，另外10%用于测试。

过程中，对与不相交的分区迭代的结果取平均值。

准确的说，十倍交叉验证结果见表2，其中N=10，MA：

平均精度，ME:

平均误差，SD:

标准差，SEM：

标准差。

（11）

表2Musicalgenreclassificationfoldanalysis

（12）

（13）

（14）

音乐类型分类推荐系统的平均精度见表3。

表3Accuracy%

鉴于推荐方法的评估效率，对每个用户的评级采用十倍交叉验证程序。

因此，每个用户的数据集合中90%用于训练，10%用于测试。

每一段，系统从每个类型查询十块共收录40个音乐文件。

最后，对所有用户的结果取平均值，采用平均值绝对误差（MAE）和评级标准等级（RS）对预测方法准确性进行评价。

MAE是推荐系统评估效率最常采用的方法。

更确切的讲，MAE对用户U，段K的定义如下：

（15）

其中，P（u,k）是正模式，即查询文件所属特定类型模式。

另一方面，N（u,k）是负模式，不属于特定类型的模式，但作为第一级分类类型的模式。

Ru，k（v）是用户给定的评估值，

u，k（v）是系统预测的评估值。

RS假定根据用户预测项目评级将推荐系统以列表的方式呈现给用户。

具体地，RS评估用户项目排名清单，被视为用户预期效用乘以用户实用项目效用。

一个项目效用的计算，如观察评级差异，默认值，域中性评级，它可以是评级表的中点或数据集合的平均值。

查看项目等价增加呈指数衰减的概率。

从形式上看RS是段K，特定用户Ui的项目排名清单

，根据指标j降序排列Rui，k（vj），由下式给出：

16）

进行多次实验后，与其他三个推荐方案即两个协同过滤方案，一种混合方案相比，具体在以下三个方面：

（1）CFPearson相关系数为基准,

（2）CF个性诊断，（3）混合音乐类型分类与Pearson相关系数相结合。

实验结果证明，MAE和RS分别表示于表4，表5。

显然，本文提出的混合推荐方法，即混合音乐类型分类与个性诊断相结合，两个指标（MAE和RS）可以更好的展现协同过滤方案。

此外，混合推荐方案是从具体的用户感兴趣的音乐推荐项目得到的结果。

该方案仅利用音乐文件内容，并克服了前面所述单纯基于内容的协同过滤方法的问题。

表5Rankedscoring（RS）

总之，本文提出的混合音乐类型分类与个性诊断相结合，可高效地指出每个用户对不同音乐类型的喜好。

现有的推荐系统主要尝试提供音乐对象准确的评级值，一般来说，返回属于不同的音乐类型最好音乐文件的排名列表。

事实上，现有的推荐系统只关注的音乐文件的评级，忽略了音乐文件的内容，这是直接相关的信息和音乐类型导致的。

另一方面，本文推荐系统关注的不仅是音乐文件的评级，而且还关注音乐类型和分布在不同音乐类型的音乐文件评级信息如何。

这两个特点有效地组织了推荐系统混合级联形式。

此外，这种级联形式使得由两个相应的条件MAE和RS对齐的评级和质量最优排名名单预测更准确。

6结论和前景展望

本文中，开发了通过移动业务实现接入数字音频/音乐的移动音乐推荐系统固件。

具体地说，音乐文件推荐系统融合了基于内容的系统过滤技术和移动技术推荐方法。

因此，赋予移动用户通过他/她的手机发送简单的示例音乐文件进行音频/音乐查询的能力。

推荐系统能够依据用户先前的选项和通过协同过滤技术诊断的其他用户的个人喜好来推荐给用户相同类型的音乐。

本系统推荐方法与其他三种推荐方法进行了对比测试，分别是：

CF皮尔逊相关系数作为基准，CF的个性诊断法和混合音乐类型分类与皮尔逊优先系数结合法。

它的性能按照MAE和RS标准进行了评估。

按照这两个评估标准，系统展现出更高的性能。

当前和未来在这一领域的研究遵循设计和实现第一级有效分类推荐处理分类器。

其他更重要的相关研究工作是扩充多媒体应用比音乐数据的收集。

这并不影响我们的一般方法，我们更需要我们的方法适应其他标准（E.G.来至MPEG-7标准）和适应除音频以外的其他类型相关数据分类器。

这些和其他一些相关工作正在进行，研究结果在不远的将来会在其他地方报道。

展开阅读全文

基于音乐类型分类和个性诊断的 移动混合音乐推荐系统Word下载.docx

基于音乐类型分类和个性诊断的移动混合音乐推荐系统Word下载.docx