backtester.py


import bt
import pandas as pd
from algos import WeighTarget
import numpy as np
from influxdb import InfluxDBClient
from datetime import datetime as dt

class Backtest():

    def __init__(self, tickers=None):

        # if tickers == 'All':
        #     self.ticker_list = self._retrieve_tickers()
        # else:
        #     self.ticker_list = tickers
        #
        # self.data = self._load_data(self.ticker_list)
        self.db = InfluxDBClient('104.248.41.39', 8086, 'admin', 'jndm4jr5jndm4jr6', 'darwinex')

    def _retrieve_tickers(self):
        with open("links", 'r') as f:
            tmp = []
            for row in f:
                if not row.split(".com/")[1].replace("\n", "") in tmp:
                    tmp.append(row.split(".com/")[1].replace("\n", ""))
        return tmp

    def influx_to_pandas(self, result):
        df = pd.DataFrame(result, )
        df.index = pd.to_datetime(df['time'])

        return df.drop(['time'], axis=1)

    def load_data(self, ticker, start=None, end=None, freq='1m', remote = False):
        if remote is True:
            start_dt = dt.strptime(start, '%Y-%m-%d')
            end_dt = dt.strptime(end, '%Y-%m-%d')
            start_epoch = int(float(start_dt.timestamp())) * 1000 * 1000 * 1000
            end_epoch = int(end_dt.timestamp()) * 1000 * 1000 * 1000
            query = "Select last(price) from {} where time > {} and time < {} group by time({})".format(ticker,
                                                                                                          str(start_epoch),
                                                                                                          str(end_epoch),
                                                                                                          freq)

            result = list(self.db.query(query))[0]
            data = self.influx_to_pandas(result)
        else:

            data = pd.read_csv(
                'histdata\\stocks_psi_geral\\minimal\\{}_daily_minimal.csv'.format(ticker.replace(':', '-')),
                                parse_dates=True, index_col=0)
            if start is not None:
                data = data[data.index > start]
            if end is not None:
                data = data[data.index < end]
        data.index.name = 'Date'
        data.columns = [ticker]

        # data.drop_duplicates(keep='first', inplace=True)
        data = data.fillna(method='ffill')

        data = data.iloc[::-1]


        return data

    # def _load_data(self, tickers):
    #
    #     data = pd.DataFrame()
    #     comb_index = None
    #     for ticker in tickers:
    #         df = pd.read_csv('histdata/stocks_psi_geral/minimal/{}_daily_minimal.csv'.format(ticker.replace(':','-')),
    #                        parse_dates=True, index_col=0)
    #         df = df[df.index > '2017-01-01']
    #         df.index.name = 'Date'
    #         #df.columns = [ticker.split(':')[0]]
    #         df = df.iloc[::-1]
    #         # if comb_index is None:
    #         #     comb_index = df.index
    #         #     data = df
    #         # else:
    #         #     comb_index.union(df.index)
    #
    #         data[ticker] = df
    #         # data = data.reindex(index=comb_index, method='pad')
    #         # data.fillna(inplace=True, method='ffill')
    #     # print(data.head())
    #     # print(comb_index)
    #
    #     # data.plot()
    #
    #     return data

    def above_sma(self, tickers, sma_per=50, start='2010-01-01', name='above_sma'):
        """
        Long securities that are above their n period
        Simple Moving Averages with equal weights.
        """
        # download data
        # Guarantee all data iterates over the same index.


        # calc sma
        # sma9 = self.data[tickers].rolling(9).mean()
        # sma21 = self.data.rolling(21).mean()
        data = self._load_data([tickers])
        sma100 = data.rolling(100).mean()
        from algos import SelectWhere
        # create strategy
        s = bt.Strategy(name, [SelectWhere((data[tickers] > sma100)),
                               bt.algos.WeighEqually(),
                               bt.algos.Rebalance()])

        # now we create the backtest
        return bt.Backtest(s, data)

    # def ma_cross(self, ticker, start=None, end=None, fitted_ma=9,
    #              short_ma=21, long_ma=100, name='ma_cross'):
    #     # these are all the same steps as above
    #     #
    #     # data = pd.read_csv('histdata/stocks_psi_geral/minimal/{}_daily_minimal.csv'.format(ticker.replace(':','-')),
    #     #                    parse_dates=True, index_col=0)
    #     # data = data[data.index > '2016-01-05']
    #     # data.index.name = 'Date'
    #     # data.columns = [ticker]
    #     # data = data.iloc[::-1]
    #     data = self.load_data(ticker, start=start, end=end, remote=True)
    #     print(data.head())
    #     print(data.isnull().values.any())
    #     _ma = data.rolling(short_ma).mean()
    #     fitted_ma = data.rolling(fitted_ma).mean()
    #     short_ma = data.rolling(short_ma).mean()
    #     long_ma = data.rolling(long_ma).mean()
    #     # self.data[ticker].columns = [ticker]
    #     #print(data.head())
    #     # target weights
    #     tw = long_ma.copy()
    #
    #     tw[ticker] = np.zeros((1,len(long_ma)))[0]
    #     tw[(short_ma > long_ma) & (fitted_ma > short_ma)] = 1.0
    #     tw[(short_ma <= long_ma) | (fitted_ma < short_ma)] = -1.0
    #     tw[long_ma.isnull()] = 0.0
    #     # tw.fillna(inplace=True, method='ffill')
    #
    #     for i in range(0,len(tw)):
    #         if tw[ticker].iloc[i] == 1.0:
    #             break
    #
    #         elif tw[ticker].iloc[i] == -1.0:
    #             tw[ticker][i] = 0.0
    #
    #     # here we specify the children (3rd) arguemnt to make sure the strategy
    #     # has the proper universe. This is necessary in strategies of strategies
    #     s = bt.Strategy(name, [WeighTarget(tw), bt.algos.Rebalance(), bt.algos.LimitWeights(limit=0.1)], [ticker])
    #
    #     return bt.Backtest(s, data)

    def ma_cross(self, ticker, start=None, end=None, fitted_ma_period=9, short_ma_period=19, long_ma_period=100,
                 name='ma_cross'):
        # these are all the same steps as above
        # C:\Users\utilizador\PycharmProjects\tss\histdata\stocks_psi_geral\minimal\lig-pl_daily_minimal.csv
        # data = pd.read_csv(
        #     'C:\\Users\\utilizador\\PycharmProjects\\tss\\histdata\\stocks_psi_geral\\minimal\\{}_daily_minimal.csv'.format(
        #         ticker.replace(':', '-')),
        #     parse_dates=True, index_col=0)
        # data = data[data.index > '2016-02-01']
        # data.index.name = 'Date'
        # data.columns = [ticker]
        # data = data.iloc[::-1]

        data = self.load_data(ticker, start=start, end=end, remote=True)

        print(data.head())
        print(data[ticker].where(data[ticker] < 0.0000001).notnull()[data[ticker].where(data[ticker] < 0.0000001).notnull() == True])
        print(data.isnull().values.any())

        fitted_ma = data.rolling(fitted_ma_period).mean()
        short_ma = data.rolling(short_ma_period).mean()
        long_ma = data.rolling(long_ma_period).mean()
        # print(data.head())
        # fitted_ma = pd.DataFrame(talib.EMA(data[ticker].values, timeperiod=fitted_ma_period),index=data.index, columns=[ticker])
        # short_ma = pd.DataFrame(talib.EMA(data[ticker].values, timeperiod=short_ma_period),index=data.index, columns=[ticker])
        # long_ma = pd.DataFrame(talib.EMA(data[ticker].values, timeperiod=long_ma_period),index=data.index, columns=[ticker])
        # print(fitted_ma.head())
        # print(len(fitted_ma), len(short_ma), len(long_ma))
        # target weights
        tw = long_ma.copy()
        tw.columns = [ticker]
        tw[(short_ma > long_ma) & (fitted_ma > short_ma)] = 1.0
        tw[(short_ma < long_ma) | (fitted_ma < short_ma)] = 0.0
        tw[long_ma.isnull()] = 0.0
        for i in range(0, len(tw)):
            if tw[ticker].iloc[i] == 1.0:
                break
            elif tw[ticker].iloc[i] == -1.0:
                tw[ticker][i] = 0.0
        print('\nTW HAS VALUES?\n', tw[tw[ticker] > 0.0])

        # s = bt.Strategy(name, [WeighTarget(tw), bt.algos.Rebalance(), bt.algos.LimitWeights(limit=0.1)], [ticker])
        s = bt.Strategy(name, [WeighTarget(tw), bt.algos.Rebalance()], [ticker])
        return bt.Backtest(s, data)

    def run(self, selected_tickers, start=None, end=None):

        t1 = self.ma_cross('EURUSD', name='eurusd_ma_cross', start='2018-12-1', end='2018-12-10')
        t2 = self.ma_cross('EURGBP', name='eurgbp_ma_cross', start='2018-12-1', end='2018-12-10')
        # t1 = self.above_sma('galp:pl')
        # t2 = self.above_sma('bcp:pl')

        # let's run these strategies now
        res = bt.run(t1, t2)

        return res

if __name__ == "__main__":
    test = Backtest(tickers=['EURUSD','EURGBP'])

    res = test.run(['EURUSD'])
    print(res.display())
    # res.plot()