AI量化交易(二)——Tushare财经数据框架

AI量化交易(二)——Tushare财经数据框架

一、Tushare简介

1、Tushare简介

Tushare是一个免费、开源的python财经数据接口包,目前为Tushare Pro版本,主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据。Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas、NumPy、Matplotlib进行数据分析和可视化。
AI量化交易(二)——Tushare财经数据框架

2、Tushare安装

Github: https://github.com/waditu/Tushare

pip install tushare lxml
pip install beautifulsoup4

3、Token生成

Tushare使用需要注册账户,并生成Token。
本人邀请注册链接:https://tushare.pro/register?reg=306303
注册成功,登录Tushare,点击个人信息设置:
AI量化交易(二)——Tushare财经数据框架
在接口Token页找到个人的Token,Token是使用Tushare接口的惟一凭证,如果发现泄露,可以刷新生成新的Token。

import tushare as ts

if __name__ == '__main__':
    print(ts.__version__)
    # 设置Token
    ts.set_token('xxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()

# output:
# 1.2.45

4、Tushare API简介

Tushare的数据接口分为沪深股票、指数、基金、期货、期权、债券、外汇、港股、行业经济、宏观经济、特色大数据共计十一大类,沪深其中股票分为基础数据、行情数据、财务数据、市场参考数据四类接口。Tushare也提供了区块链相关的基础数据、行情数据、资讯公告三类接口,以及新浪财经、东方财富、同花顺、云财经、华尔街见闻等财经网站的宏观经济、外汇、A股、区块链、美股、石油、黄金、黄金外汇、港股、商品、债券、公司、市场、焦点、央行等财经资讯类消息。
Tushare API接口需要根据注册账户的积分数量获取相应的访问权限,积分等级不够可能导致API接口无权限访问,区块链相关接口需要捐款获取相应权限。
Tushare API接口使用参考:https://tushare.pro/document/2

二、Tushare股票数据接口

1、股票列表

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.stock_basic(exchange='', list_status='L', fields='ts_code,symbol,name,area,industry,list_date')
    # data = ts_api.query('stock_basic', exchange='', list_status='L',
    #                     fields='ts_code,symbol,name,area,industry,list_date')
    print(data)

获取股票基础信息数据,包括股票代码、名称、上市日期,行业、概念等。

2、IPO新股上市

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.new_share(start_date='20190101', end_date='20190901')
    print(data)

获取新股上市列表数据

3、日线行情

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.daily(ts_code='000001.SZ', start_date='20190101', end_date='20190901')
    print(data)

交易日每天15点~16点之间。本接口是未复权行情,停牌期间不提供数据。

4、周线行情

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.weekly(ts_code='000001.SZ', start_date='20180101', end_date='20181101',
                         fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

获取A股周线行情

5、月线行情

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.monthly(ts_code='000001.SZ', start_date='20180101', end_date='20181101',
                          fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

获取A股月线数据。

6、通用行情接口

pro_bar接口整合了股票(未复权、前复权、后复权)、指数、数字货币、ETF基金、期货、期权的行情数据,未来会包括外汇在内的所有交易行情数据,同时提供分钟数据。

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts.pro_bar(api=ts_api, ts_code='000009.SZ', adj='qfq', start_date='20170101', end_date='20181011', ma=[5],
                      freq='D')
    print(data)

获取A股的K线数据,带有复权参数“adj”、均线参数“ma”、数据频度参数“freq”。

7、获取股票的全部数据

import tushare
import os
import datetime
import timedelta

def fetch_kline_data(code):
    filename = 'your path'
    if not os.path.exists(filename):
        end_date = datetime.strftime(datetime.now(), '%Y%m%d')#获取当前时间
        outputflag = True
        api = tushare.pro_api()
        while outputflag:#循环判断,直到返还的数据为空
           data = tushare.pro_bar(pro_api=api,ts_code=code,
                                end_date=end_date,asset='E', adj=None, freq='D')
           if data.empty == True:
               outputflag = False
           else:
                #计算下次请求数据的截止日期
                next_end_date = datetime.strptime(data.iloc[-1]['trade_date'],
                                              '%Y%m%d') - timedelta(hours=24)
                end_date = datetime.strftime(next_end_date, '%Y%m%d')
                #写csv文件
                if os.path.exists(filename):
                    data.to_csv(filename, header=None, mode='a')#追加写入模式
                else:
                    data.to_csv(filename, header=None, mode='a')

三、Tushare上市公司财务数据接口

1、利润表

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('xxxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.income(ts_code='600001.SH', start_date='20190101', end_date='20190901')
    print(data)

获取上市公司财务利润表数据

2、资产负债表

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.balancesheet(ts_code='600000.SH', start_date='20190101', end_date='20190901',
                               fields='ts_code,ann_date,f_ann_date,end_date,report_type,comp_type,cap_rese')
    print(data)

获取上市公司资产负债表。

3、现金流量表

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.cashflow(ts_code='600000.SH', start_date='20190101', end_date='20190901')
    print(data)

获取上市公司现金流量表。

4、业务预告

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.forecast(ann_date='20190131',
                           fields='ts_code,ann_date,end_date,type,p_change_min,p_change_max,net_profit_min')
    print(data)

获取业绩预告数据。

5、分红送股数据

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.dividend(ts_code='600848.SH', fields='ts_code,div_proc,stk_div,record_date,ex_date')
    print(data)

分红送股数据。

6、业绩快报

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.express(ts_code='600000.SH', start_date='20180101', end_date='20180701',
                          fields='ts_code,ann_date,end_date,revenue,operate_profit,total_profit,n_income,total_assets')
    print(data)

获取上市公司业绩快报。

7、财务指标数据

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.fina_indicator(ts_code='600000.SH')

    print(data)

获取上市公司财务指标数据,为避免服务器压力,现阶段每次请求最多返回60条记录,可通过设置日期多次请求获取更多数据。

8、财务审计意见

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.fina_audit(ts_code='600000.SH', start_date='20100101', end_date='20180808')
    print(data)

获取上市公司定期财务审计意见数据

9、主营业务构成

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.fina_mainbz(ts_code='000627.SZ', type='P')
    print(data)

获取某只股票的主营业务构成
df = ts_api.fina_mainbz_vip(period='20181231', type='P', fields='ts_code,end_date,bz_item,bz_sales')
获取某一季度全部股票的主营业务构成

10、上市公司完整财务指标获取

import tushare
import datetime
import os
import timedelta

def fetch_finance_indicator(code):
    filename = 'your path'
    if not os.path.exists(filename):
        end_date = datetime.strftime(datetime.now(), '%Y%m%d')
        outputflag = True
        api = tushare.pro_api()
        while outputflag:
            data = api.fina_indicator(ts_code=code, end_date=end_date)
            if data.empty == True:
                outputflag = False
            else:
                next_end_date = datetime.strptime(
                    data.iloc[-1]['end_date'], '%Y%m%d') - timedelta(hours=24)
                end_date = datetime.strftime(next_end_date, '%Y%m%d')
                if os.path.exists(filename):
                    data.to_csv(filename, header=None, mode='a')
                else:
                    data.to_csv(filename)

四、Tushare指数接口

1、指数基本信息

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_basic(market='CSI')
    print(data)

获取指数基础信息。
MSCI:MSCI指数
CSI:中证指数
SSE:上交所指数
SZSE:深交所指数
CICC:中金所指数
SW:申万指数

2、指数日线行情

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_daily(ts_code='399300.SZ', start_date='20190101', end_date='20190910')
    print(data)

获取指数每日行情,还可以通过bar接口获取。由于服务器压力,目前规则是单次调取最多取8000行记录,可以设置start和end日期补全。指数行情也可以通过通用行情接口获取数据。

3、指数周线行情

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_weekly(ts_code='000001.SH', start_date='20180101', end_date='20190329',
                               fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

获取指数周线行情,单次最大1000行记录,可分批获取,总量不限制。

4、指数月线行情

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_monthly(ts_code='000001.SH', start_date='20180101', end_date='20190930',
                                fields='ts_code,trade_date,open,high,low,close,vol,amount')
    print(data)

获取指数月线行情,每月更新一次,单次最大1000行记录,可多次获取,总量不限制。用户需要至少600积分才可以调取,积分越多频次越高。

5、指数成分和权重

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.index_weight(index_code='399300.SZ', start_date='20180901', end_date='20190930')
    print(data)

获取各类指数成分和权重,月度数据 ,如需日度指数成分和权重,用户需要至少400积分才可以调取。

五、Tushare市场参考数据接口

1、港股通10大成交股

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.ggt_top10(trade_date='20190925')
    print(data)

获取港股通每日成交数据,其中包括沪市、深市详细数据。

2、融资融券交易汇总

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.margin(trade_date='20190925')
    print(data)

获取融资融券每日交易汇总数据。

3、融资融券交易明细

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.margin_detail(trade_date='20190925')
    print(data)

获取沪深两市每日融资融券明细。

4、前十大股东

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top10_holders(ts_code='600000.SH', start_date='20190101', end_date='20191231')
    print(data)

获取上市公司前十大股东数据,包括持有数量和比例等信息。

5、前十大流通股东

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top10_floatholders(ts_code='600000.SH', start_date='20190101', end_date='20191231')
    print(data)

获取上市公司前十大流通股东数据。

6、龙虎榜每日明细

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top_list(trade_date='20190925')
    print(data)

龙虎榜每日交易明细,单次最大10000,用户需要至少300积分才可以调取。

7、龙虎榜机构交易明细

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.top_inst(trade_date='20190925')
    print(data)

龙虎榜机构成交明细,单次最大10000,用户需要至少300积分才可以调取。

8、大宗交易

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.block_trade(trade_date='20190925')
    print(data)

大宗交易,单次最大1000条,总量不限制,300积分可调取,每分钟内限制次数,超过5000积分无限制。

9、股票开户数据

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.stk_account(start_date='20190101', end_date='20191231')
    print(data)

获取股票账户开户数据,统计周期为一周,600积分可调取。

10、股东人数

import tushare as ts

if __name__ == '__main__':
    # 设置Token
    ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
    # 初始化接口
    ts_api = ts.pro_api()
    data = ts_api.stk_holdernumber(ts_code='300209.SZ', start_date='20190101', end_date='20191231')
    print(data)

获取上市公司股东户数数据,数据不定期公布。单次最大3000,总量不限制,600积分可调取,基础积分每分钟调取100次,5000积分以上无限制。

猜你喜欢

转载自blog.51cto.com/9291927/2450913