吉林大学学报(信息科学版) ›› 2019, Vol. 37 ›› Issue (1): 88-95.

• • 上一篇    下一篇

大数据背景下的恐怖主义信息传播途径分析

孙学诚a,陈前a,唐家骏a,石小川b   

  1. 武汉大学a. 计算机学院; b. 国家网络安全学院,武汉430072
  • 出版日期:2019-01-24 发布日期:2019-05-09
  • 作者简介:孙学诚( 1997— ) ,男,上海人,武汉大学本科生,主要从事自然语言处理研究,( Tel) 86-17717411795 ( E-mail)zelda2013e3@163. com; 石小川( 1984— ) ,男,武汉人,武汉大学副教授,主要从事无线网络、数据挖掘以及大数据信息聚类分析、舆情监控等研究,( Tel) 86-13507180716( E-mail) shixiaochuan@ whu. edu. cn。
  • 基金资助:
    国家社会科学基金青年基金资助项目( 16CXW034)

Analysis on Spread of Terrorism through Media in Era of Big Data

SUN Xuechenga,CHEN Qiana,TANG Jiajuna,SHI Xiaochuanb   

  1. a. School of Computer Science; b. School of Cyber Science and Engineering,Wuhan University,Wuhan 430072,China
  • Online:2019-01-24 Published:2019-05-09

摘要: 为加强对互联网以及社交媒体的恐怖主义信息的甄别和处理,利用数据的爬取和分析甄别,分类恐怖主义信息。通过scrappy 框架以及gensim 工具包对数据进行爬取,得到了4 个数据集,并且进行LDA( Latent Dirichlet Allocation) 主题模型的建立,分别得到恐怖主义信息传播在4 个不同领域中的主题分类,以及主题间的关系。实验表明,通过爬取可以有效鉴别出不同的恐怖主义信息主题,以及其在传播中的作用。

关键词: 恐怖主义, 大数据, 网络爬虫, 主题分析

Abstract: Improving screening and addressing terrorist information in social media becomes a critical topic of research. Our study uses data crawlers and screening analysis to classify different terrorist information. Through scrappy framework and genism tool pack,we obtained the relevant data from four datasets. After constructing a LDA ( Latent Dirichlet Allocation) theme model,we then classified several themes in four different area that played major roles in propagating terrorism,and investigated the interconnected relationship between these themes. The experiment indicates that the model can effectively distinguish different themes of terrorism information and the role it played in propagation.

Key words: terrorism, big data, web crawler, theme analysis

中图分类号: 

  • TP391