吉林大学学报(工学版) ›› 2018, Vol. 48 ›› Issue (3): 866-873.doi: 10.13229/j.cnki.jdxbgxb20170509

• 论文 • 上一篇    下一篇

基于递归神经网络的自动作曲算法

李雄飞1, 冯婷婷2, 骆实1, 张小利1   

  1. 1.吉林大学 计算机科学与技术学院,长春 130012;
    2.吉林大学 软件学院,长春 130012;
  • 收稿日期:2017-05-18 出版日期:2018-05-20 发布日期:2018-05-20
  • 通讯作者: 张小利(1987-),男,助理研究员,博士.研究方向:机器学习,信息融合.E-mail:zhangxiaoli@jlu.edu.cn
  • 作者简介:李雄飞(1963-),男,教授,博士生导师.研究方向:机器学习,信息融合,图像处理.E-mail:lxf@jlu.edu.cn
  • 基金资助:
    中国博士后科学基金项目(2017M611323).

Automatic music composition algorithm based on recurrent neural network

LI Xiong-fei1, FENG Ting-ting2, LUO Shi1, ZHANG Xiao-li1   

  1. 1.College of Computer Science and Technology, Jilin University, Changchun 130012,China;
    2.College of Software, Jilin University, Changchun 130012,China
  • Received:2017-05-18 Online:2018-05-20 Published:2018-05-20
  • Supported by:
     

摘要: 提出了一种以音乐音频为处理对象的基于长短时记忆递归神经网络的音乐自动合成算法。该算法首先将音乐集以基于单位时长分割成由单位音乐序列组成的音乐序列集,并在对音乐进行预处理时提取了音乐音频的梅尔倒谱系数作为特征;其次,将进行数据处理过的特征向量构成的训练样本通过长短时记忆模型进行训练和预测;最后,将生成的音乐序列进行拼接融合从而得到新的音乐。为了验证算法的有效性,将模型生成的乐曲与人为作曲的乐曲进行了匿名打分评价,实验结果表明,该算法能够较好地实现自动作曲。

关键词: 人工智能, 递归神经网络, 自动作曲算法, 长短时记忆模型

Abstract: In this paper, we propose an automatic music composition algorithm based on Long Short Term Memory-Recurrent Neural Network (LSTM-RNN). In this algorithm, we first divide music set into set which consists sequences of unit by length, and in the preprocessing we get the Mel frequency cepstrum coefficient as the feature of audio music. Second, the proposed training samples are trained and predicted by LSTM-RNN. Finally, the generated music sequences are joined to get a new music. In order to verify the effectiveness of the algorithm, we carry out an anonymous evaluation of the original music and the music generated by the algorithm. The results show that the algorithm can work well on automatic music composition.

Key words: artificial intelligence, recurrent neural network, automatic music composition algorithm, long short term memory model

中图分类号: 

  • TP181
[1] 刘涧泉. 第三种作曲方式——论计算机音乐创作的新思维[J]. 中国音乐,2006(3):51-54.
Liu Jian-quan.The third way of composing music on the new thinking of computer music creation[J]. Chinese Music,2006(3):51-54.
[2] Turkalo D M.All music guide to electronica (book review)[J]. Library Journal, 2001,126(13):90.
[3] Hiller L A, Isaacson L M.Experimental music/composition with an electronic computer[M]. New York: McGraw,1959.
[4] Loubet E.The beginnings of electronic music in Japan, with a focus on the NHK studio: the 1970s[J]. Computer Music Journal,1998,22(1):49-55.
[5] Sigtia S, Benetos E, Boulanger-Lewandowski N, et al.A hybrid recurrent neural network for music transcription[C]∥2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP),Brisbane,QLD, Australia,2015:2061-2065.
[6] Eck D, Schmidhuber J.A first look at music composition using LSTM recurrent neural networks[M]. Lugano:IDSIA USI-SUPSI Instituto Dalle Molle, 2002.
[7] Franklin J A.Recurrent neural networks for music computation[J]. Informs Journal on Computing,2006,18(3):321-338.
[8] Liu I, Ramakrishnan B. Bach in2014: music composition with recurrent neural network[J]. Eprint Arxiv, 2014.https//arxiv.org/pdf/1412.3191.pdf.
[9] Dhanalakshmi P, Palanivel S, Ramalingam V.Classification of audio signals using SVM and RBFNN[J]. Expert Systems with Applications,2009,36(3):6069-6075.
[10] Mathieu B, Essid S, Fillon T, et al.YAAFE, an easy to use and efficient audio feature extraction software[C]∥International Society for Music Information Retrieval Conference, Ismir 2010, Utrecht, Netherlands,2010:441-446.
[11] Salas H A G, Gelbukh A, Calvo H. Music composition based on linguistic approach[C]∥Advances in Artificial Intelligence,Mexican International Conference on Artificial Intelligence, Pachuca,Mexico, 2010:117-128.
[1] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[2] 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585.
[3] 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205.
[4] 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213.
[5] 黄岚, 纪林影, 姚刚, 翟睿峰, 白天. 面向误诊提示的疾病-症状语义网构建[J]. 吉林大学学报(工学版), 2018, 48(3): 859-865.
[6] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[7] 王旭, 欧阳继红, 陈桂芬. 基于多重序列所有公共子序列的启发式算法度量多图的相似度[J]. 吉林大学学报(工学版), 2018, 48(2): 526-532.
[8] 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538.
[9] 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544.
[10] 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603.
[11] 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611.
[12] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
[13] 王生生, 王创峰, 谷方明. OPRA方向关系网络的时空推理[J]. 吉林大学学报(工学版), 2017, 47(4): 1238-1243.
[14] 马淼, 李贻斌. 基于多级图像序列和卷积神经网络的人体行为识别[J]. 吉林大学学报(工学版), 2017, 47(4): 1244-1252.
[15] 周炳海, 彭涛. 混流装配线准时化物料配送调度优化[J]. 吉林大学学报(工学版), 2017, 47(4): 1253-1261.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 张琳, 章新杰, 郭孔辉, 王超, 刘洋, 刘涛. 未知环境下智能汽车轨迹规划滚动窗口优化[J]. 吉林大学学报(工学版), 2018, 48(3): 652 -660 .
[2] 赵二辉, 马彪, 李和言, 杜秋, 吴健鹏, 马成男. 非均匀接触对湿式离合器摩擦特性的影响[J]. 吉林大学学报(工学版), 2018, 48(3): 661 -669 .
[3] 李启良, 曹冠宁, 李璇, 杨志刚, 钟立元. 三厢轿车多参数气动优化[J]. 吉林大学学报(工学版), 2018, 48(3): 670 -676 .
[4] 陈永恒, 刘鑫山, 熊帅, 汪昆维, 谌垚, 杨少辉. 冰雪条件下快速路汇流区可变限速控制[J]. 吉林大学学报(工学版), 2018, 48(3): 677 -687 .
[5] 李志慧, 胡永利, 赵永华, 马佳磊, 李海涛, 钟涛, 杨少辉. 基于车载的运动行人区域估计方法[J]. 吉林大学学报(工学版), 2018, 48(3): 694 -703 .
[6] 孙宝凤, 高坤, 申琇秀, 梁婷. 基于能力平衡和变覆盖半径的加油站网络扩充选址模型[J]. 吉林大学学报(工学版), 2018, 48(3): 704 -711 .
[7] 宫亚峰, 申杨凡, 谭国金, 韩春鹏, 何钰龙. 不同孔隙率下纤维土无侧限抗压强度[J]. 吉林大学学报(工学版), 2018, 48(3): 712 -719 .
[8] 虞浏, 刘忠长, 刘金山, 刘江唯, 杜宏飞, 程鹏. 汽油喷雾前锋粒径特性[J]. 吉林大学学报(工学版), 2018, 48(3): 720 -726 .
[9] 钟兵, 洪伟, 金兆辉, 苏岩, 解方喜, 张富伟. 进气门早关液压可变气门机构运动特性[J]. 吉林大学学报(工学版), 2018, 48(3): 727 -734 .
[10] 江涛, 林学东, 李德刚, 顾静静. 压缩天然气缸内直喷发动机喷射方式对混合气形成及燃烧特性影响的模拟[J]. 吉林大学学报(工学版), 2018, 48(3): 735 -743 .