大数据 ›› 2020, Vol. 6 ›› Issue (4): 92-104.doi: 10.11959/j.issn.2096-0271.2020036

• 研究 • 上一篇    

适用于特殊类型自然语言分类的自适应特征谱神经网络

王一峰,孙丽茹,崔良乐,赵毅   

  1. 哈尔滨工业大学(深圳)理学院,广东 深圳 518055
  • 出版日期:2020-07-15 发布日期:2020-07-18
  • 作者简介:王一峰(1995- ),男,哈尔滨工业大学(深圳)理学院硕士生,主要研究方向为自然语言处理、计算机视觉、智能控制、机器人运动、惯性制导以及机器学习的数学原理|孙丽茹(1994- ),女,哈尔滨工业大学(深圳)理学院硕士生,主要研究方向为自然语言处理、教育大数据和机器学习中的聚类算法|崔良乐(1978- ),男,哈尔滨工业大学(深圳)理学院讲师,主要研究方向为西方美学、中国近现代思想文化传播、文化研究和与在线学习相关的教育大数据|赵毅(1977- ),男,博士,哈尔滨工业大学(深圳)理学院教授、博士生导师,哈尔滨工业大学(深圳)应用数学研究中心主任,主要研究方向为非线性时间序列分析、动力系统、复杂网络、生物数学和数据科学
  • 基金资助:
    学位与研究生教育资助项目(2017Y0902);深圳市教育科学规划2015年度重大招标课题重点资助项目(zdzz15001);哈尔滨工业大学(深圳)高等教育教学改革资助项目

Adaptive feature spectrum neural networks for special types of natural language classification

Yifeng WANG,Liru SUN,Liangle CUI,Yi ZHAO   

  1. School of Science,Harbin Institute of Technology(Shenzhen),Shenzhen 518055,China
  • Online:2020-07-15 Published:2020-07-18
  • Supported by:
    Academic Degrees & Graduate Education Program(2017Y0902);Shenzhen Education Science Planning 2015 Major Bidding Project Key Funded Project(zdzz15001);Harbin Institute of Technology (Shenzhen) Higher Education Teaching Reform Project

摘要:

计算机算力的提升使得深度学习算法迅速发展,然而由于古诗文特殊的语序、用词、结构、句式、文法结构、表达方式,深度学习模型需要消耗更多的算力进行特征提取等工作,因此并未在这一领域取得广泛的应用。为此,提出了一种新型的神经网络结构——自适应特征谱神经网络。该算法有效减少了运算时间,可以自适应地选择对分类最有用的特征,形成最高效的特征谱,得到的分类结果具有一定的可解释性,而且由于其运行速度快、内存占用小,因此非常适用于学习辅助软件等方面。以此算法为基础,开发了相应的个性化学习平台。该算法使古诗文分类的准确率由93.84%提升到了99%。

关键词: 自适应特征谱, 神经网络, 文本分类, 古诗词, 拉普拉斯矩阵

Abstract:

The improvement of computer computing power has led to the rapid development of deep learning algorithms.However,due to the special word order,wording,structure,sentence structure,grammatical structure,and expression of ancient poetry,deep learning models need to consume more computing power for feature extraction,etc.Therefore,it has not been widely used in this field.As a result,a new kind neural network:the adaptive feature spectrum neural network was proposed,which can considerably reduce the computation and adaptively select the features that are the most useful for classification in order to form the most efficient feature spectrum.The classification results obtained have certain interpretability.Moreover,its fast running speed and lower RAM consumption make it very suitable for learning aids software,and other fields.Based on this algorithm,a corresponding personalized learning platform was developed.This algorithm improves the classification accuracy of ancient Chinese poetry from 93.84% to 99%.

Key words: adaptive feature spectrum, neural network, text classification, ancient poems, laplace matrix

中图分类号: 

No Suggested Reading articles found!