吉林大学学报(信息科学版) ›› 2014, Vol. 32 ›› Issue (2): 195-200.

• 论文 • 上一篇    下一篇

基于网络信息挖掘的股市影响因素分析

马俊伟1, 王铁军1, 李庆1, 林漳希1,2   

  1. 1. 西南财经大学 金融智能与金融工程重点实验室, 成都 611130;2. 德克萨斯理工大学 商务智能高级研究中心, 美国 德克萨斯州 79409
  • 出版日期:2014-03-25 发布日期:2014-06-12
  • 作者简介:马俊伟(1984—), 男, 甘肃嘉峪关人, 西南财经大学博士研究生, 主要从事金融工程研究, (Tel)86-13438862464(E-mail)majunweihiker@gmail.com; 李庆(1976—), 男, 成都人, 西南财经大学教授, 博士生导师, 主要从事文本挖掘研究, (Tel)86-13408004039(E-mail)kooliqing@gmail.com。
  • 基金资助:

    国家社科基金重点资助项目(11AZD077); 西南财经大学中央高校基本科研业务基金资助项目(JBK1207018; JBK1307200)

Stock Market Influence Factor Analysis Based on Web Data Mining

MA Junwei1, WANG Tiejun1, LI Qing1, LIN Zhangxi1,2   

  1. 1. Laboratory for Financial Intelligence and Financial Engineering, Southwestern University of Finance & Economics, Chengdu 611130, China;2. Center for Advanced Analytics and Business Intelligence, Texas Tech University, Texas 79409, USA
  • Online:2014-03-25 Published:2014-06-12

摘要:

针对海量网络文本信息的获取、 量化和分析的难题, 采用信息抓取技术获得网络金融舆情文本信息, 并根据数据的信息量对金融舆情信息进行分类, 建立因子模型和时间序列模型, 分析网络金融舆情信息对我国股票市场的影响。通过实证得到以下结论: 与单只股票相关的网络文本信息数量, 明显影响了该只股票在第2日的收益率; 信息容量越大的网络文本信息对股票的影响力越大, 而不同组的信息对收益率的作用方向不同; 网络文本信息的数量与股票波动率明显相关, 信息容量不同的文本信息对波动率的影响力也不同。

关键词: 网络文本挖掘, 股票市场, 因子分析

Abstract:

We collect Web financial text information from financial BBS(Bulletin Board System) and classify all these text information according to their word count. Then we do empirical analysis by factor model and GARCH(Generalized Autoreg Ressive Conditional Heteroskedasticity) models. Our three findings are: number of new posts and stock yield are directly related; posts with more words are expected to have greater affects on stock yield; the correlation between count of new posts and stock volatility is statistically significant.

Key words: Web text mining, stock market, factor analysis

中图分类号: 

  • TP39