Skip to content

talib extension for formula computation in pure cython in your custom strategies.

License

Notifications You must be signed in to change notification settings

sric0880/ta_formula

Repository files navigation

ta_formula

PyPI PyPI

依赖库

安装使用

pip install ta_formula

参考案例 examples.ipynb

特性

  • 自定义指标,在TA-Lib(0.4.29)库(Github)的基础上扩展自己的指标,完全在Cython中实现。
  • 自定义区间指标。
  • 自定义策略(同样纯Cython实现),根据参数和输入数据即时编译成动态链接库,实现微秒级信号发现
    • 普通台式机CPU i5-10400 @2.9GHz 大概一个指标计算在0.5~5微秒(timeit结果,实际运行考虑到缓存缺失,会慢很多,可以尝试多进程方案)
    • 支持传入不同市场多个标的物
    • 支持传参
    • 支持自定义返回字段
    • 一次计算中,相同指标计算结果缓存,不重复计算
  • 数据流入、信号流出框架,自定义数据流,数据流支持asyncio,多线程,相同策略相同数据去重,避免重复计算。

策略文件示例

cimport ta_formula._indicators as ta
cimport numpy as np

# define datas intervals
datas = [['1m']]

# define constant params
kdj_minvalue = 10
kdj_maxvalue = 90

# define datas params
CLOSE = datas[0][0]['close']
HIGH = datas[0][0]['high']
LOW = datas[0][0]['low']

# define indicators
ma5 = ta.SMA(CLOSE, 5)
ma250 = ta.SMA(CLOSE, 250)
skd = ta.stream_SLOW_KD(HIGH, LOW, CLOSE, 69, 3)

# define signals
ret = {
    'open_long_condition1': ta.kup(ma250,-1) and ta.crossdown(ma5, ma250, -1),
    'open_short_condition1': ta.kdown(ma250,-1) and ta.crossup(ma5, ma250, -1),
    'open_long_condition2': skd[0] <= kdj_minvalue and CLOSE[-1] > ma250[-1],
    'open_short_condition2': skd[0] >= kdj_maxvalue and CLOSE[-1] < ma250[-1],
    'close_long': skd[0] >= kdj_maxvalue,
    'close_short': skd[0] <= kdj_minvalue,
    'last_close_price': CLOSE[-1],
    'last_ma250': ma250[-1],
}

test_strategy.pyx

返回示例:

{
  "symbols": [["shanghai001", "ag2412"]],
  "data_rec_time": 1717486288.8170903,
  "calc_time": 269900,
  "open_long_condition1": false,
  "open_short_condition1": false,
  "open_long_condition2": false,
  "open_short_condition2": false,
  "close_long": false,
  "close_short": false,
  "last_close_price": 7952.0,
  "last_ma250": 7922.2
}

其中symbols, data_rec_timecalc_time为附加返回字段,分别表示:

  • symbols返回当前策略计算用的金融标的组合
  • 接收到数据的时间戳,单位秒,float,系统时间可能有误差
  • 策略从接收数据,到计算完成,发送信号经过的时间,单位纳秒,int

通过比较三者的时间差,可以大致知道计算延迟和网络延迟

其他字段为自定义返回字段

TODO

  1. 所有stream_XXX指标函数,需要显式注明返回类型,比如int, double,或者tuple类型,比如(double, double)。如果不标明,返回的不是c类型,而是python类型,比如int返回的是PyInt。目前只有部分函数修改了。Cython不支持python对象的tuple,比如(np.ndarray, np.ndarray)。
  2. ZIG、PERIOD_MAX_BIAS 没有stream和recent函数
  3. 多进程数据后台支持

指标

一个指标有三个版本,比如MACD:

  1. MACD: 从头到尾计算所有指标,返回ndarray。
  2. stream_MACD: 只计算最后一天的指标,返回double,或者tuple(double,double)等。
  3. recent_MACD: 计算最近calc_length天的指标,返回ndarray,当calc_length==1时,效果和stream_MACD一样。

已扩展的自定义指标

指标含义及用法见代码_indicators.pyx注释

// 一般指标
SMA, BIAS, MACD, STOCH, KD, KDJ, SLOW_KD AMPLITUDE, ZIG,

// 区间指标
PERIOD_MAX_BIAS

扩展TA-Lib

_ta_lib_xxx文件是从TA-Lib源码复制过来的。安装完TA-Lib之后,不会安装对应的pxd和pxi文件,所以这里的pxd和pxi直接从TA-Lib源码复制过来。

复制过来的方法,是def定义的,全部改成了cdef,只允许c内部调用。如果要用python测试,可以封装成strategy

如果要改写TA-Lib的方法,_func.pxi源文件、或_stream.pxi源文件已经复制到对应_ta_lib_xxx.pxi,直接在里面改写就行。但是要添加好注释。

添加recent_xxx方法:

从TA-Lib_stream.pxi源文件直接复制到_indicators.pyx改写,并改名为recent_xxx

stream_xxx 和 recent_xxx 函数计算精度的问题

使用任何talib库中的stream函数时,都要测试他和非stream函数的返回是否一致

talib计算stream指标时,只计算最后一天的值,但是会往前查看历史数据,一般长度为timeperiod+不稳定期限。

比如EMA(3), 3天前的数据也会影响最后结果,不稳定期限越长,最后结果越精确。

talib所有指标默认不稳定期限为0,要满足自己的精度要求,需要自己设置不稳定期限。

不同的指标,不同的timeperiod,需要设置不同的不确定长度,才能达到相同的精度。

设置不确定长度的方法为:__ta_set_unstable_period(非线程安全)

talib计算精度受历史数据长度影响的指标有:

ADX, ADXR, ATR, CMO, DX, EMA, HT_DCPERIOD, HT_DCPHASE, HT_PHASOR,
HT_SINE, HT_TRENDLINE, HT_TRENDMODE, KAMA, MAMA, MFI, MINUS_DI,
MINUS_DM, NATR, PLUS_DI, PLUS_DM, RSI, STOCHRSI, T3