流行音乐的分类研究
韩浩 王寅潇 王博
随着我国信息化速度的加快,互联网的不断发展,流行音乐风格经历了相当复杂的演变过程。每个时代都有其代表性的人物和风格,歌曲的成功要素也随时间不断改变。本文以中国的流行音乐为研究对象,将流行音乐的法阵历程分成了六个不同的时期,然后就如何通过其原唱录音或曲 谱来推断其所处时代问题,建立了3个数学模型对流行音乐的风格给出一个自然、合理的分类判断方法。
模型一:我们建立了RBF(径向基函数)神经网络模型,根据音乐曲谱的音符出现的频率, 给出了一个合理的较高准确性分类用于推断其所处时代。我们将所处理的音符频率数据,选择60组数据作为训练数据用来训练网络,运用Matlab编程进行智能运算求解,我们可得到测试结果的准确率为63.3%,根据测试率来看,用RBF神经网络来判断歌曲年代还是可行的。由于样本数据的不确定性因素太多,准确率不是很高,我们进一步建立模型二来提高准确率。
模型二:我们建立了概率神经网络(PNN)模型, 根据音符频率推断其所处时代给出了一个合理的较高准确性高的分类。我们选取了重要的七个音符在乐谱中出现的频率来反应歌曲的风格,我们选取了六个不同时期流行音乐90首歌曲作为样本数据, 运用Matlab编程求解其具体的分类方案,我们训练60个样本,做出PNN网络训练后的效果图和误差图,只有0.05的概率存在样本训练误差。 之后我们又进行模型验证,我们用Matlab软件求解,得到PNN网络的测验准确率为72.2%,比较RBF(径向基函数)神经网络模型的测验率63.3%更加准确了,更证明了该模型的可行性以及有效性。
模型三:我们用离差平方和聚类法(Ward)对流行音乐的年代做出判断研究,首先采取分层随机抽样 30个歌曲样本,用spss数学软件作离差平方和法聚类分析。其次按爱国、爱乡、思亲、生活、爱情、社会等6个主题进行聚类分析。还有抽取的30个不同时期流行音乐歌曲样本的深情、美好、励志、伤感、激情、安静等6个情感因素进行聚类分析。综上聚类分析所述,我们可以结合流行歌曲的主题和情感因素来推断其所处时代。
最后我们写了短文——(在某个时期内)流行 歌曲的“成功要素”是如何变化,指出歌曲的确可以反映时代,而歌曲风格的形成也是由时代塑造。
关键词: 判断时代 RBF神经网络模型 PNN神经网络模型 离差平方和聚类法 Matlab Spss
1.引言
1.1背景资料
流行音乐(Popular Music) 于19世纪末20世纪初起源于美国,从音乐体系看,流行音乐是在叮砰巷音乐、布鲁斯、爵士乐、摇滚乐、索尔音乐等美国大众音乐架构基础上发展起来的音乐。其风格多样,形态丰富,可泛指Jazz、Rock、Soul、Blues、Reggae、Rap、Hip-Hop、Disco、New Age等20世纪后诞生的都市化大众音乐。 中国流行音乐的风格与形态主要受欧美影响,中国现代创作歌曲约起始于清末至民国初。清王朝的倒台,民国的创立所经历的旧民主主义革命造成了深刻的社会变化。在此期间,西方资本主义文化逐步东渐,并与中国传统文化形成了既相冲突又逐步结合的态势。当时已有直接借用外国歌曲的曲调填词作为军歌及学堂歌曲的现象,如:《中国男儿》(石更填词)、《汉族历史歌》(王引才填词)等。
改革开放30年来我国音乐发生了巨大变化,近几十年来,流行音乐的风格经历了相当复杂的演变过程。这些优美的经典歌曲伴随我们的岁月久久在耳边回荡、回忆那一段美好的时光,记录着社会的发展和进步。因为社会发展比较快,所以到当代流行音乐大部分都指一些轻音乐和节奏明快、通俗易懂、不是很严谨的演唱方法的这一类的音乐和歌曲。故流行音乐随着时代和社会的变迁,它们的也风格经历了相当复杂的演变。我们梳理了中国流行音乐的发展历程[1]:第一期(1978年-1985年)抒情歌曲的复兴,第二期(1986年—1990年)内地流行歌坛的崛起,第三期:(1991年—1996年)多音乐元素交汇时期,第四期:(1997年—2002年)新时代歌曲的创作,第五期(2003年—2008年) 信息时代歌曲风格的形成,第六期(2009年—2013年),今日的歌曲风格,其中每个时代都有其代表性的人物和风格。
1.2问题重述
随着互联网的发展,流行音乐的主要传播媒介从传统的电台和唱片逐渐 过渡到网络下载和网络电台等。网络电台需要根据收听者的已知喜好,自动 推荐并播放其它音乐。由于每个人喜好的音乐可能横跨若干种风格,区别甚 大,需要分别对待。这就需要我们去探讨如何区分音乐风格的问题。
近几十年来,流行音乐的风格经历了相当复杂的演变过程。 每个时代都有其代表性的人物和风格,歌曲的成功要素也随时间不断改变。需要建立合理的数学模型,对曾经走红过的流行歌曲,通过其原唱录音或曲谱来推断其所处时代。
2.模型假设
1、我们假设把中国流行音乐的发展历程从改革开放开始分成6个时期,每个时期的音乐都有其代表性的人物和风格。
2、假设音高、升8拍、降8拍、空 拍、节拍减半、节拍延长、浮点音符等7个音符在乐谱中出现的机会是均等的,即服从均匀分布。(说明引用第一阶段
的音符假设)。
3、我们所选取的七个音符在乐谱中出现的音符频率可以反应歌曲的风格。 4、我们排除每首歌中其它不确定的因素,所选取的音乐样本 都可以反映所在时期的特征性,训练的样本数据可以正常的作为训练对象。
3.符号说明
x1 音高
x2 x3 x4 x5 x6 x7 x Ci ? yp
Wi ? hA、hB NA,NB N lA lB fA,fB
升8拍 降8拍
空 拍 节拍减半 节拍延长 浮点音符
n维输入向量
第i个隐节点中心
高斯函数的宽度参数
为在xp输入下网络的输出向量
输入层到模式层连接的权值
平滑因子
为故障模式的?A、?B先验概率 为故障模式的?A,?B的训练样本数
训练样本总数
为将本属于?A的故障特征样本X错误地划分到模式?B的代价因子
为将本属于?B的故障特征样本X错误地划分到模式?A的代价因子
为故障模式的?A,?B的概率密度函数
4、问题分析
对于本问题的解决,我们的目的就是建立合理的数学模型,对曾经走红过的流行歌曲,通过其原唱录音或曲谱来推断其所处时代。我们从以下几个方面分析流行音乐时代判断问题:
1、对于如何对流行音乐进行分类的问题,通过其原唱录音或曲谱来推断其所处时代。我们根据曲谱来推断其所处时代,音符是曲谱中一个重要的组成成分,故我们所选取的七个音符在乐谱中出现的音符频率可以反应歌曲的风格。这里我们把中国流行音乐的发展历程从改革开放开始分成6个时期,我们根据不同时期流行音乐的音符数出现的频率作为研究 数据,利用神经网络用于智能分类这一特点对其进行分类,来判断其所处时代。
2、对于流行音乐的风格经历了相当复杂的演变过程,每个时代都有其代表性的人物和风格,每个时期流行歌曲的“成功要素”是如何变化的。我们根据抽取的30个不同时期流行音乐歌曲样本,按爱国、爱乡、思亲、生活、爱情、社会等6个主题进行聚类分析。还有抽取的30个不同时期流行音乐歌曲样本的深情、美好、励志、伤感、激情、安静等6个情感因素进行聚类分析。综上聚类分析所述,我们可以结合流行歌曲的主题和情感因素来推断其所处时代。
5.模型的建立与求解
5.1数据处理
我们从百度网上查找了以下时期的歌曲:
第一期(1978年-1985年)抒情歌曲的复兴,第二期(1986年—1990年)内地流行歌坛的崛起,第三期:(1991年—1996年)多音乐元素交汇时期,第四期:(1997年—2002年)新时代歌曲的创作,第五期(2003年—2008年) 信息时代歌曲风格的形成,第六期(2009年—2013年)新时代歌曲的成熟阶段,并且我们在曲谱网上找到了相应歌曲的曲谱。
我们选取的样本数据,(见附录一)其中包括七个音符在六个时期流行歌曲的15首歌曲乐谱中音符数和出现的音符数频率。我们根据数据源分别计算出主要音符在乐谱中出现的频率(数据见附录二)
从的数据表中,我们可以看出歌曲乐谱中的音符数频率满足一定的均匀分布,基本分布在0到1之间,我们的样本数据可以作为训练样本,在径向基神经网络系统中试验,我们希望我们的试验可以达到一定的准确率。 5.2模型一
模型一:RBF(径向基函数)神经网络模型
1985年,Powell提出了多变量的径向基函数方法(Radial-based Function Method)。1988年,Broomhead和Lowe在此基础上提出了径向基函数神经网络,即RBF神经网络结构。[2]径向基函数神经网络采用高斯函数等径向基函数作为神经元传递函数,能够实现非线性关系的映射,对分类问题也有重要的应用价值。径向基函数(RBF)网络是一个具有单隐层的三层前馈网络(如图1 所示)。输入层神经元个数n与输入向量维数一致,输出层神经元个数m与输出向量维数一致。输入层神经元与隐层神经元、隐层神经元与输出层神经元(除偏置单元外)
相关推荐: