上证股票综合指数统计分析和数据挖掘

(银河统计工作室 2016-11-06 发布于博客园
 

摘要:上海证券交易所股票上市交易20多年,已经积累了大量历史数据。随着网络技术的发展,人们获取交易信息的途径非常广泛,特别是大数据时代来临,大量金融数据、地理数据、天气数据等被有关部门和公司实时或定期在网上发布。特别是股票数据极为丰富、规范,新浪、雅虎、腾讯等公司都有免费的股票数据接口供使用和二次开发。3000多家上市公司、20多年的数据累计,良好的股票数据接口,统计和数据挖掘技术的推广,都为实现量化交易提供了基础条件和环境。

本文阐述网络环境下上证股票指数实时和历史数据接入、图形展示、分组统计和数据挖掘,为进一步进行量化交易分析奠定基础。

 

 1、量化交易

量化交易(Quantitative Trading)是指借助现代统计学和数学的方法,利用计算机技术来进行交易的证券投资方式。量化交易从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,用数量模型验证及固化这些规律和策略,然后严格执行已固化的策略来指导投资,以求获得可以持续的、稳定且高于平均收益的超额回报。

量化交易起源于上世纪七十年代的股票市场,之后迅速发展和普及,尤其是在期货交易市场,程序化逐渐成为主流。有数据显示,国外成熟市场期货程序化交易已占据总交易量的70%-80%,而国内则刚刚起步。手工交易中交易者的情绪波动等弊端越来越成为盈利的障碍,而程序化交易天然而成的精准性、100%执行率则为它的盈利带来了优势。

量化交易的优势:

注:摘自MBA智库百科
 

 

 2、股票指数数据接口

I、上海和深圳主要股票代码:

II、腾讯常用股票指数历史数据接口:

链接地址中90指90年历史数据,2000年为00、2000年为01,以此类推。例如,打开上证综合股票指数数据接口网址,返回数据如下:

    daily_data_90="\n\
    901219 113.10 113.10 113.10 113.10 2650\n\
    901220 113.10 113.50 113.50 112.85 1990\n\
    901221 113.50 113.50 113.50 113.40 1190\n\
    901224 113.50 114.00 114.00 113.30 8070\n\
    901225 114.00 114.10 114.20 114.00 2780\n\
    901226 114.40 114.30 114.40 114.20 310\n\
    901227 114.30 114.25 114.30 114.10 6110\n\
    901228 114.30 114.40 114.40 114.20 4840\n\
    901231 114.70 114.70 114.80 114.60 2400\n\

III、腾讯常用股票指数图形接口:

注:将上证综指代码【sh000001】替换为其它指数代码即可得到不同指数分数和K线图

 上证综指    深证成指    沪深300    大数据100    创业板指

分时线日K线
周K线月K线
注:选择其它指数单选按钮即可得到不同指数分数和K线图。K线图中黑、蓝、粉三种颜色曲线为5日(MA5)、10日(MA10)和30日(MA30)移动平均线

IV、腾讯常用股票指数历史数据提取:

腾讯上证股票指数接口及其它主要股票指数接口数据提取步骤为:选择股票指数类型和起始时间(一般选择近期1-3年数据),然后点击“数据抓取”按钮获得数。

 上证综指    深证成指    沪深300    大数据100    创业板指  
   - 2019   数据抓取

 
 

 
test

Copyright © 2019 哈尔滨商业大学银河统计工作室