A Two-stage Mean-CVaR Investment Strategy Based on LSTM
-
摘要:
文章提出了一种基于长短期记忆网络(Long-short Term Memory network, LSTM)的两阶段均值-CVaR投资组合模型(LSTM+CVaR)。该模型在第一阶段采用LSTM预测股票收益并对股票进行选择;在第二阶段运用均值-CVaR模型来确定所选股票的投资比例。最后,以沪深300指数股为样本数据,在考虑交易成本和上界约束的情况下,比较LSTM+CVaR模型、LSTM预测选股的等比例模型、随机选股的CVaR模型、随机选股的等比例模型和沪深300指数的风险收益特征、累计收益率和夏普比率。实证结果表明:LSTM+CVaR模型能够实现比传统的投资组合模型更高的平均收益率、收益风险比、累计收益率和夏普比率;减少交易成本和放宽上界约束能提升投资组合模型的表现。
Abstract:A novel dual-stage mean-CVaR investment strategy based on long-short term memory networks (LSTM) is proposed, namely, LSTM+CVaR model. Specifically, in the first stage, the LSTM is used to predict the return of stocks and select stocks. In the second stage, the mean-CVaR model is used to determine the weight of every stock. Finally, using China Securities 300 Index component stocks as sample, considering the influence of threshold constraints and transaction costs, the characteristics of risk and return, cumulative return and Sharpe Ratio of portfolio models are compared in this paper, and the portfolio models include LSTM+CVaR model, equal weight model based on LSTM prediction, CVaR model based on random stock selection, equal weight model based on random stock selection and China Securities 300 Index component stocks. The empirical results demonstrate that the LSTM+CVaR model achieves higher average returns, return-risk ratio, cumulative returns, Sharpe Ratio, and decreasing the transaction costs or increasing the threshold constraint can improve the performance of the above model.
-
预测股票收益是投资组合理论中的重要部分,已有的预测方法主要依据历史数据与未来价格之间的关系进行建模[1],如线性回归模型、自回归移动平均模型和广义自回归条件异方差模型。但实际的股票市场中股票收益不一定满足线性关系,想要获得更准确的符合实际股票市场的预测结果,还需要探索新的模型和方法。
深度学习方法放宽了对市场模式的假定,通过级联多层非线性处理单元进行特征的自动提取和运用,建立了数据之间的非线性关系,因此逐渐地被应用于金融时间序列数据的预测。如:ERSAN等[2]运用人工神经网络预测金融时间序列数据的走势;VO等[3]运用长短期记忆网络预测金融时间序列数据。运用深度学习算法预测股票收益的基本模型大致分为3种[4]:前馈神经网络、卷积神经网络和递归神经网络。其中,前馈神经网络和卷积神经网络的节点间不能够形成循环,但仍可在一定程度上进行时间序列数据的预测。如:梁姝娜等[5]运用BP神经网络预测粮食产量;SONG等[6]利用深度神经网络对股票价格进行预测;HOSEINZADE和HARATIZADEH[7]运用卷积神经网络进行金融市场中的价格预测。而递归神经网络之间的节点能够沿着时间序列形成一个循环,有助于其跟踪时间动态行为。长短期记忆网络(Long-short Term Memory network, LSTM)和门控循环单元是递归神经网络中的一个子类,可以通过引入遗忘门来解决由于循环次数过多而出现的梯度降低或者消失的问题。如:DING和QIN[8]、MINH等[9]分别运用LSTM、门控循环单元预测股票价格;杨青和王晨蔚[10]采用LSTM研究了全球30个股票市场指数;SU等[11]将交易成本纳入到LSTM遗忘门的激活函数中,以达到更准确地预测资产收益的目的。
均值-方差(Mean-variance, MV)模型[12]运用均值和方差来度量投资组合的收益和风险,但是,该模型严格的假定条件以及大规模资产计算的复杂性限制了其在实际中的应用,因此涌现了很多拓展的投资组合模型。现有的拓展模型主要集中在2个方面对传统均值-方差模型进行优化:一方面是考虑具有现实约束(如基数约束和交易成本)的投资组合模型。如GAO等[13]考虑到投资者并不是在所有时间段都会进行投资,研究了具有时间基数约束的均值-方差动态投资模型。另一方面是选取不同的风险度量指标。如:张鹏和曾永泉[14]考虑卖空总量限制、上下界约束和V型交易成本的情况,使用半绝对偏差衡量下行风险;STOILOV等[15]在考虑基数约束和上界约束的情况下,运用风险价值(Value at Risk, VaR)衡量投资组合的风险;ROCKAFELLAR和URYASEV[16]提出的条件风险价值(Conditional Value at Risk, CVaR)克服了VaR不完全满足次可加性和凸性的缺憾,可作为投资组合的风险度量指标;XU等[17]和HUANG等[18]均运用CVaR构建投资组合模型。
CVaR已经成为目前较为成熟的度量投资组合下方风险的风险指标,鉴于LSTM在预测股票收益上的良好表现,本文结合深度学习方法和现代投资组合理论,提出了一种基于LSTM的两阶段均值-CVaR投资组合模型(LSTM+CVaR)。该模型在第一阶段采用LSTM预测股票收益,并选择收益较高的股票作为投资资产,以帮助投资者选择优质投资标的;第二阶段,在考虑上界约束和交易成本的基础上,采用均值-CVaR模型[16]确定股票的投资比例,以帮助机构或投资者制定更贴近现实的投资决策。最后,采用2013年1月1日至2021年12月31日期间的沪深300指数成分股作为样本数据进行实证分析,从风险收益特征、累计收益率和夏普比率3个方面衡量LSTM+CVaR模型、LSTM预测选股的等比例模型、随机选股的CVaR模型、随机选股的等比例模型和沪深300指数表现,同时探究交易成本和上界约束对模型表现的影响。
1. 长短期记忆网络(LSTM)
深度学习方法能够有效地学习并识别金融市场中数据之间的非线性关系,LSTM作为一类特殊的递归神经网络,在保留并记忆长期信息方面具有明显的优势[4]。LSTM增加了细胞状态,通过细胞状态的更新和传递来实现长期记忆。
LSTM通过门结构更新并处理细胞状态。门结构包括遗忘门、输入门和输出门,主要由Sigmoid函数进行信息流的筛选工作。Sigmoid函数的取值范围为[0, 1]。当Sigmoid函数的取值为1时,对应的信息被保留;当取值为0时,对应的输入信息会被删除。这一门结构也是LSTM解决多次循环导致的梯度消失问题的关键。
一个LSTM单元首先利用遗忘门决定旧细胞状态中哪些信息会被丢弃;然后通过输入门决定哪些新的信息需要添加到细胞状态中,在这个过程中会形成一个候选细胞状态;接着按照运用遗忘门选择忘记旧细胞状态的部分信息、输入门选择添加候选细胞部分信息的原则得到新细胞状态;之后通过输出门判断需要输出的细胞状态特征;最终结合新细胞状态和输出门得到该LSTM单元的输出。
LSTM单元中每个状态和门的计算公式[8]如下:
ft=σ(wf,xxt+wf,hht−1+bf),˜Ct=σ(w˜C,xxt+w˜C,hht−1+b˜C),it=σ(wi,xxt+wi,hht−1+bi),Ct=ft∗Ct−1+it∗˜Ct,ot=σ(wo,xxt+wo,hht−1+bo),ht=ottanh(Ct), 其中,xt、ht表示一个LSTM单元在时间t的输入、输出,ft、it、ot表示遗忘门、输入门和输出门在时间t的输出,˜Ct表示在时间t的候选细胞状态,Ct表示在时间t的细胞状态,wf, x、wf, h分别是遗忘门中关于x、h的权重矩阵,w˜C,h是候选细胞状态中关于h的权重矩阵, wi, x、wi, h分别是输入门中关于x、h的权重矩阵, wo, x、wo, h分别是输出门中关于x、h的权重矩阵,bf、b˜C、bi、bo分别是遗忘门、候选细胞状态、输入门、输出门的偏置向量,b˜C、bi和bo的初始值是0,bf的初始值是1,偏置向量的添加能够增强模型拟合数据的灵活性。
2. 投资组合模型
2.1 问题描述与符号说明
假设金融市场中有n种风险资产可供投资者选择,Ri代表风险资产i的随机收益率,ri是Ri的期望值,即ri= E(Ri);wi代表风险资产i的投资比例,投资组合w=(w1, w2, …, wn)T, w1+w2+…+wn= 1;wi0是风险资产i的初始投资比例;rp、rN分别代表投资组合w的期望收益率、净收益率;ui代表wi的上界约束;ci代表风险资产i的单位交易成本。
2.2 投资组合的收益和风险
假设投资组合w的交易成本函数是V形函数,各风险资产的初始投资比例为w10, w20, …, wn0,则投资组合w的总交易成本[14]为:
Ci=n∑i=1ci|wi−wi0| 。 (1) 投资组合w的净收益率为其期望收益率与总交易成本之差:
rN=n∑i=1riwi−n∑i=1ci|wi−wi0|。 (2) VaR指的是在一定置信水平下,某一投资组合在未来特定时间内的最大可能损失[15]:
P(rp⩽ (3) 其中,c∈(0, 1)为给定的置信水平。若随机收益率r的概率密度函数为g(r),损失函数为L(w, r),则VaR可以表示为:
\operatorname{VaR}_c=\min \left\{\alpha \in \mathbb{R}: \int_{L(w, r) \leqslant \alpha} g(r) \mathrm{d} r \geqslant c\right\}。 (4) ROCKAFELLAR和URYASEV[16]提出的CVaR为投资组合的损失超过给定置信水平下VaR的条件均值。当置信水平为c时,CVaR可以表示为:
\begin{array}{r} \mathrm{CVaR}_c=E[L(w, r) \mid L(w, r) \geqslant \alpha]= \\ (1-c)^{-1} \int_{L(w, r) \geqslant \alpha} L(w, r) g(r) \mathrm{d} r。 \end{array} (5) 由式(5)可以看出在收益率分布未知的情况下计算CVaRc比较困难,因此,ROCKAFELLAR和URYASEV[16]构建了辅助函数Fc(w, α),运用VaR计算CVaR,并证明了函数Fc(w, α)的最小值为CVaRc,其对应的α*即为VaR的值。Fc(w, α)的表达式如下:
F_c(w, \alpha)=\alpha+\frac{1}{1-c} \int\limits_{r \in \mathbb{R}^n}[L(w, r)-\alpha]^{+} g(r) \mathrm{d} r, (6) 其中,[L(w, r)-\alpha]^{+}=\max \{L(w, r)-\alpha, 0\}, L(w, r)= -\left(r_1 w_1+r_2 w_2+\cdots+r_n w_n\right) 。
由于实际金融市场中随机收益率的概率密度函数是未知的,因此利用历史数据表示未来随机收益率的分布情况。假设市场中存在n只股票,并已知其M个交易日的历史收益率,则函数Fc(w, α)的近似值可以表示为[16]:
\widehat{F}_c(w, \alpha)=\alpha+\frac{1}{(1-c) M} \sum\limits_{m=1}^M \max \left\{L\left(w, r_m\right)-\alpha, 0\right\}, (7) 其中,L(w, rm)=-(w1r1m+w2r2m+…+wnrnm)。那么,CVaRc可以表示为关于(w, α)的线性函数[16]:
\mathrm{CVaR}_c=\alpha+\frac{1}{(1-c) M} \sum\limits_{m=1}^M \max \left\{-\sum\limits_{i=1}^n w_i r_{i m}-\alpha, 0\right\} \text { 。 } (8) 2.3 均值-CVaR模型
本文在以上研究的基础上,引入风险厌恶系数λ,用以描述投资者对预期收益和风险的态度,并考虑交易成本和上界约束,构建了均值-CVaR投资组合模型:
\begin{aligned} & \min \lambda\left(\alpha+\frac{1}{(1-c) M} \sum\limits_{m=1}^M \max \left\{-\sum\limits_{i=1}^n w_i r_{i m}-\alpha, 0\right\}\right)- \\ &\ \ \ \ \ \ \ \ (1-\lambda)\left(\sum\limits_{i=1}^n r_i w_i-\sum\limits_{i=1}^n c_i\left|w_i-w_{i 0}\right|\right) \\ & \text { s.t. }\left\{\begin{array}{l} 0 \leqslant w_i \leqslant u_i, \\ \sum\limits_{i=1}^n w_i=1, \end{array}\right. \\ & \end{aligned} (9) 其中,风险厌恶系数λ的取值范围是[0, 1],λ越小则表示投资者对收益的偏好程度越大,λ越大则表示投资者对风险的偏好程度越大。
令g_m-h_m=-\sum\limits_{i=1}^n w_i r_{i m}-\alpha, g_m+h_m=\left|-\sum\limits_{i=1}^n w_i r_{i m}-\alpha\right| , p_i+q_i=\left|w_i-w_{i 0}\right|,则模型(9)可以转化为:
\begin{array}{l} \min \lambda\left(\alpha+\frac{1}{2(1-c) M} \sum\limits_{m=1}^M\left(g_m-h_m+g_m+h_m\right)\right)- \\ \ \ \ \ \ \ (1-\lambda)\left(\sum\limits_{i=1}^n r_i w_i-\sum\limits_{i=1}^n c_i\left(p_i+q_i\right)\right) \\ \text { s.t. }\left\{\begin{array}{l} \sum\limits_{i=1}^n w_i=1, \\ w_i \geqslant 0, -w_i \geqslant-u_i \quad(i=1, 2, \cdots, n), \\ p_i \geqslant 0, q_i \geqslant 0 \quad(i=1, 2, \cdots, n), \\ g_m \geqslant 0, h_m \geqslant 0 \quad(m=1, 2, \cdots, M) 。 \end{array}\right. \end{array} (10) 模型(10)可化简为:
\begin{aligned} & \min \lambda\left(\alpha+\frac{1}{(1-c) M} \sum\limits_{m=1}^M g_m\right)-(1-\lambda)\left(\sum\limits_{i=1}^n r_i w_i-\sum\limits_{i=1}^n c_i\left(p_i+q_i\right)\right) \\ & \text { s.t. }\left\{\begin{array}{l} \sum\limits_{i=1}^n w_i=1, \\ w_i \geqslant 0, -w_i \geqslant-u_i \quad(i=1, 2, \cdots, n), \\ p_i \geqslant 0, q_i \geqslant 0 \quad(i=1, 2, \cdots, n), \\ g_m \geqslant 0, h_m \geqslant 0 \quad(m=1, 2, \cdots, M) 。 \end{array}\right. \end{aligned} (11) 模型(11)是线性规划问题,可以运用线性规划的旋转算法[19]进行求解。
3. 实证结果与分析
3.1 样本选择
去掉沪深300指数成分股中暂停上市和未上市的股票,本文随机选取其中数据较为充分的48只股票,并以这些股票于2013年1月1日至2021年12月31日的收益率为样本数据。选取的样本股票代码有:000001,000568,000725,000776,000895,002024,002142,002304,002475,002594,300015,300059,600011,600000,600009,600015,600016,600028,600030,600031,600036,600048,600104,600276,600340,600519,600585,600837,600887,600999,601006,601009,601111,601166,601169,601186,601318,601328,601398,601601,601628,601668,601688,601800,601818,601857,601933,601998。
同时,考虑到金融时间序列数据的连续性,本文采用滚动窗口的方法进行样本外检验,将样本数据划分为6个周期,每4年为1个周期,每个周期包括3年训练期和1年测试期,如图 1所示。
3.2 参数及指标因子设置
运用网格搜索法与交叉验证法确定LSTM的最优参数,优化器选择SGD、RMSprop和Adam,其他参数设置如表 1所示。
表 1 LSTM预测选股的参数设置Table 1. Parameter settings of the stock selection model based on LSTM prediction超参数 超参数值 隐藏节点 5,10,15,20,25,30 隐藏层数 1,2,3,…,10 学习率 0.000 1,0.001,0.01,0.1 耐心参数 0,5,10 批次大小 50,100,200 丢弃率 0.1,0.2,…,0.5 循环丢弃率 0.1,0.2,…,0.5 在PAIVA等[20]的基础上,本文选择关于价格数据的16种滞后变量和3个技术指标作为输入指标(如表 2所示),其中OP、CP、HP、LP分别表示开盘价格、收盘价格、最高价格、最低价格。
表 2 LSTM输入的指标因子Table 2. Indicator factors of LSTM input序号 指标因子 因子描述 序号 指标因子 因子描述 1 rt ln(CPt)-ln(CPt-1) 11 ht-2 ln(HPt-2)-ln(OPt-2) 2 rt-1 ln(CPt-1)-ln(CPt-2) 12 lt ln(LPt)-ln(OPt) 3 rt-2 ln(OPt-2)-ln(CPt-1) 13 lt-1 ln(LPt-1)-ln(OPt-1) 4 rt-3 ln(OPt-3)-ln(CPt-1) 14 lt-2 ln(LPt-2)-ln(OPt-2) 5 ot ln(OPt)-ln(CPt-1) 15 lt-3 ln(LPt-3)-ln(OPt-3) 6 ct ln(CPt)-ln(OPt) 16 TR Max{|HPt-LPt|, |CPt-1-LPt|, |CPt-1-LPt|} 7 ct-1 ln(CPt)-ln(OPt-1) 17 MA 简单移动平均(周期为1个月) 8 ht ln(HPt)-ln(OPt) 18 MTM 动量指标(周期为1个月) 9 ht-1 ln(HPt-1)-ln(OPt-1) 19 RSI 相对强弱指标(周期为14天) 10 ht-2 ln(HPt-2)-ln(OPt-2) 3.3 实证结果分析
本文将投资组合决策分为2个阶段:第一阶段是股票选择,即通过LSTM预测股票收益并选择预测收益较大的股票进行投资;第二阶段是投资组合优化,即在考虑交易成本和上界约束的情况下,利用均值-CVaR模型确定各资产的投资比例。
为了验证LSTM+CVaR模型的有效性,本文采用LSTM预测选股的等比例模型、随机选股的CVaR模型和随机选股的等比例模型作为对照模型。在不同上界约束和交易成本的情况下,比较4个模型和沪深300指数的风险收益特征、累计收益率和夏普比率。为方便表述,本文将3个对照模型和沪深300指数分别命名为Random+CVaR、LSTM+1/N、Random+1/N模型和CSI 300。
3.3.1 LSTM预测选股模型评价
参考文献[21-22],采用平均绝对误差(Mean Absolute Error, MAE)、均方误差(Mean Squared Error, MSE)和均方根误差(Root Mean Squared Error, RMSE)来评估LSTM预测选股模型的误差表现。各指标的具体公式如下:
\text { MAE }=\frac{1}{n}\left|r^{(i)}-\hat{r}^{(i)}\right|, (12) \text { MSE }=\frac{1}{n} \sum\limits_{i=1}^n\left(r^{(i)}-\hat{r}^{(i)}\right)^2, (13) \text { RMSE }=\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(r^{(i)}-\hat{r}^{(i)}\right)^2}, (14) 其中,r^{(i)} 、\hat{r}^{(i)}分别表示测试集股票收益率的真实值、预测值。
由2016年1月至2021年12月期间,LSTM预测选股的各周期误差值(表 3)可知:MAE、MSE和RMSE在各周期均处于较低的稳定水平,与文献[23]的研究结果一致,说明LSTM预测股票收益的误差较小,具有较好的预测效果。由此可知:LSTM有助于本文进行下一步的CVaR模型构建。
表 3 LSTM预测选股模型的表现Table 3. The performance of the stock selection model based on LSTM prediction年份 MAE MSE RMSE 2016 0.018 7 0.000 7 0.027 0 2017 0.024 3 0.001 2 0.034 0 2018 0.022 6 0.000 9 0.029 9 2019 0.019 1 0.000 7 0.025 5 2020 0.031 3 0.001 3 0.036 0 2021 0.021 8 0.000 9 0.029 3 3.3.2 投资规模的确定
投资者一般只投资有限数目的股票,因此,本文借鉴文献[23],在风险厌恶系数λ为0.9、交易成本为0.000 5、上界约束为0.5、无风险利率为0.000 125的情况下,探究各投资模型的收益率、标准差、夏普比率和索提诺比率。
由结果(表 4)可知:(1)投资6只股票时,LSTM+CVaR模型的收益率最高,但标准差较高;投资8只股票时,LSTM+CVaR模型的标准差最低,但收益率最低,其他模型也有相似的表现。因此,仅根据收益率和标准差并不能够决定最优的投资规模。(2)投资7只股票时,各模型均拥有较高的夏普比率和索提诺比率。因此,本文选择进行投资的股票数量为7。
表 4 各模型的收益率、标准差、夏普比率和索提诺比率(k=5, 6, 7, 8)Table 4. The return, standard deviation, Sharpe Ratio and Sortino Ratio of each model(k=5, 6, 7, 8)特征指标 模型 k=5 k=6 k=7 k=8 收益率 LSTM+CVaR 0.344 3 0.379 7 0.375 5 0.330 4 LSTM+1/N 0.319 3 0.304 3 0.320 2 0.300 9 Random+CVaR -0.002 5 -0.055 8 -0.045 2 -0.040 6 Random+1/N -0.027 3 -0.065 2 -0.057 7 -0.064 5 CSI300 0.062 9 0.062 9 0.062 9 0.062 9 标准差 LSTM+CVaR 0.304 3 0.302 8 0.294 0 0.283 3 LSTM+1/N 0.293 0 0.281 1 0.279 0 0.269 9 Random+CVaR 0.913 9 0.310 4 0.325 7 0.339 5 Random+1/N 0.399 1 0.286 6 0.286 4 0.273 6 CSI300 0.132 0 0.132 0 0.132 0 0.132 0 夏普比率 LSTM+CVaR 1.033 1 1.155 1 1.175 3 1.060 4 LSTM+1/N 0.987 4 0.975 9 1.040 2 1.003 8 Random+CVaR -0.035 5 -0.276 4 -0.231 0 -0.208 1 Random+1/N -0.143 6 -0.332 1 -0.306 2 -0.345 4 CSI300 0.249 6 0.249 6 0.249 6 0.249 6 索提诺比率 LSTM+CVaR 1.750 9 1.955 8 1.998 9 1.791 0 LSTM+1/N 1.652 9 1.646 7 1.754 9 1.689 6 Random+CVaR 0.147 1 -0.192 7 -0.128 8 -0.096 6 Random+1/N -0.008 6 -0.264 2 -0.225 2 -0.275 7 CSI300 0.567 1 0.567 1 0.567 1 0.567 1 3.3.3 投资组合结果
在投资7只股票、风险厌恶系数λ为0.9、无风险利率为0.000 125的情况下,评价各投资组合模型的风险收益特征、累计收益率和夏普比率。
(1) 风险收益特征分析。本文从平均收益率、标准差、夏普比率和索提诺比率等方面对投资组合模型的风险收益特征进行分析。
在交易成本为0.000 5,上界约束分别为0.3、0.5时,各模型的风险收益特征(表 5,表 6)显示:在增加上界约束的情况下,LSTM+CVaR模型和Random+CVaR模型的年度平均收益率、夏普比率、索提诺比率有一定程度的提升。上界约束的提升代表着投资者拥有更加自由的投资权力,实证结果也表明更强的投资灵活性能够提升投资组合的收益表现。
表 5 c=0.000 5且ui=0.3时各模型的风险收益特征Table 5. The risk and return characteristics of each model when c=0.000 5 and ui=0.3特征类型 特征指标 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 日度风险收益特征 平均收益率 0.001 4 0.001 3 -0.000 1 -0.000 1 0.000 3 标准差 0.017 2 0.017 2 0.014 0 0.013 8 0.012 2 收益率最小值 -0.082 6 -0.082 0 -0.081 6 -0.081 4 -0.078 8 收益率最大值 0.067 4 0.080 7 0.071 0 0.081 9 0.059 5 年度风险收益特征 平均收益率 0.355 4 0.320 2 -0.055 6 -0.057 7 0.062 9 标准差 0.286 4 0.279 0 0.297 5 0.286 4 0.132 0 下方风险 0.177 7 0.179 5 0.160 7 0.157 4 0.141 1 夏普比率 1.136 4 1.040 2 -0.287 9 -0.306 2 0.249 6 索提诺比率 1.920 8 1.754 9 -0.202 1 -0.225 2 0.567 1 最大回撤 0.404 3 0.382 6 0.460 4 0.373 2 0.324 6 表 6 c=0.000 5且ui=0.5时各模型的风险收益特征Table 6. The risk and return characteristics of each model when c=0.000 5 and ui=0.5特征类型 特征指标 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 日度风险收益特征 平均收益率 0.001 4 0.001 3 -0.000 1 -0.000 1 0.000 3 标准差 0.017 5 0.017 2 0.014 2 0.013 8 0.012 2 收益率最小值 -0.072 9 -0.082 0 -0.080 4 -0.081 4 -0.078 8 收益率最大值 0.071 9 0.080 7 0.075 2 0.081 9 0.059 5 年度风险收益特征 平均收益率 0.375 5 0.320 2 -0.045 2 -0.057 7 0.062 9 标准差 0.294 0 0.279 0 0.325 7 0.286 4 0.132 0 下方风险 0.178 8 0.179 5 0.160 8 0.157 4 0.141 1 夏普比率 1.175 3 1.040 2 -0.231 0 -0.306 2 0.249 6 索提诺比率 1.998 9 1.754 9 -0.128 8 -0.225 2 0.567 1 最大回撤 0.390 4 0.382 6 0.429 2 0.373 2 0.324 6 在上界约束为0.3,交易成本分别为0.000 5、0.001时,各模型的风险收益特征(表 5,表 7)显示:在增加交易成本的情况下,LSTM+CVaR模型的日度平均收益率以及年度平均收益率、夏普比率、索提诺比率均有所降低。交易成本的提升代表着投资困难增加,实证结果也表明更高的交易成本会削弱投资组合的收益表现。
表 7 c=0.001且ui=0.3时各模型的风险收益特征Table 7. The risk and return characteristics of each model when c=0.001 and ui=0.3特征类型 特征指标 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 日度风险收益特征 平均收益率 0.000 9 0.000 8 -0.000 6 -0.000 6 0.000 3 标准差 0.017 2 0.017 2 0.014 0 0.013 8 0.012 2 收益率最小值 -0.083 1 -0.082 5 -0.082 1 -0.081 9 -0.078 8 收益率最大值 0.066 9 0.080 2 0.070 5 0.081 4 0.059 5 年度风险收益特征 平均收益率 0.195 1 0.164 0 -0.167 5 -0.169 3 0.062 9 标准差 0.244 8 0.231 9 0.231 1 0.225 8 0.132 0 下方风险 0.181 7 0.183 4 0.164 7 0.161 4 0.141 1 夏普比率 0.674 3 0.578 0 -0.854 7 -0.882 5 0.249 6 索提诺比率 1.185 2 1.030 5 -0.962 2 -1.000 2 0.567 1 最大回撤 0.467 8 0.434 8 0.694 6 0.671 6 0.324 6 (2) 累计收益率分析。在交易成本、上界约束分别为0.000 5、0.3时,本文进一步分析各模型的累计收益率。由结果(图 2)可知:LSTM+CVaR模型的累计收益率高于其他模型,其中LSTM+CVaR模型和LSTM+1/N模型的累计收益率分别为4.830 7和4.006 1。
上界约束和交易成本的变动会影响投资组合的累计收益率,本文分别改变上界约束和交易成本,以探究这2种约束对累计收益率的影响。
在交易成本为0.000 5,上界约束分别为0.3、0.5时,各模型的累计收益率(图 2,图 3)显示:当上界约束从0.3增加到0.5时,LSTM+CVaR模型的累计收益率从4.830 7增加到5.350 7,与风险收益特征分析中的结果一致。
在上界约束为0.3,交易成本分别为0.000 5、0.001时,各模型的累计收益率(图 2,图 4)显示:当交易成本从0.000 5增加到0.001时,LSTM+CVaR模型的累计收益率从4.830 7降低到1.810 1,与风险收益特征分析中的结果一致。
(3) 夏普比率分析。本文以1年作为1个周期,进一步探究模型在各周期的夏普比率,其中交易成本、上界约束分别为0.000 5、0.3。
由结果(表 8)可知:①从选股模型上看,LSTM预测选股模型在大多数情况下都能够实现正的夏普比率,尤其是在2017、2020、2021年,在随机选股模型的夏普比率为负或者接近0的情况下,LSTM预测选股模型仍旧实现了正的夏普比率。②从投资组合模型上看,在2016、2017、2020、2021年,LSTM+CVaR模型的夏普比率高于其他模型;在2018年和2019年,与其他模型相比,LSTM+CVaR模型的夏普比率没有明显优势。
表 8 c=0.000 5且ui=0.3时各模型的夏普比率Table 8. The Sharpe Ratio of each model when c=0.000 5 and ui=0.3年份 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 2016 1.004 9 0.465 1 0.525 8 -0.122 6 -0.273 6 2017 2.858 3 2.144 0 -0.607 8 -0.498 4 1.658 6 2018 -1.592 8 -1.192 7 -1.621 2 -1.679 9 -1.526 2 2019 1.464 1 1.853 6 1.654 5 1.910 2 1.623 0 2020 2.761 5 2.784 5 0.017 4 -0.041 4 1.014 9 2021 0.823 6 0.595 5 -1.701 8 -1.447 4 -0.435 9 为进一步探究上界约束和交易成本的变动在各时期对投资组合的影响,本文在以上研究的基础上,分别改变上界约束和交易成本。
在交易成本为0.000 5,上界约束分别为0.3、0.5时,各投资模型的夏普比率(表 8,表 9)显示:①当上界约束提升时,在2016年和2020年,LSTM+CvaR模型和Random+CVaR模型的夏普比率有一定程度的提升;在其余周期,各投资模型的夏普比率相差不大。②上界约束的增加对1/N模型的夏普比率影响不大。
表 9 c=0.000 5且ui=0.5时各模型的夏普比率Table 9. The Sharpe Ratio of each model when c=0.000 5 and ui=0.5年份 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 2016 1.312 4 0.465 1 0.530 5 -0.122 6 -0.273 6 2017 2.237 9 2.144 0 -0.591 3 -0.498 4 1.658 6 2018 -1.425 3 -1.192 7 -1.669 4 -1.679 9 -1.526 2 2019 1.317 0 1.853 6 1.629 7 1.910 2 1.623 0 2020 2.944 2 2.784 5 0.263 9 -0.041 4 1.014 9 2021 0.823 8 0.595 5 -1.616 8 -1.447 4 -0.435 9 在上界约束为0.3,交易成本分别为0.000 5、0.001时,各模型的夏普比率(表 8,表 10)显示: ①当交易成本提升时,各模型在各周期的夏普比率明显降低,特别是随机选股模型在2020年和2021年的夏普比率变为负值。②在大部分周期中,LSTM+CVaR模型的夏普比率最高。
表 10 c=0.001且ui=0.3时各模型的夏普比率Table 10. The Sharpe Ratio of each model when c=0.001 and ui=0.3年份 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 2016 0.532 4 0.020 8 -0.045 7 -0.675 3 -0.273 6 2017 2.069 5 1.308 2 -1.498 1 -1.481 2 1.658 6 2018 -2.072 7 -1.641 7 -2.151 7 -2.215 3 -1.526 2 2019 1.019 9 1.407 4 1.058 6 1.318 3 1.623 0 2020 2.329 1 2.364 3 -0.484 0 -0.555 0 1.014 9 2021 0.450 2 0.183 2 -2.201 6 -1.972 6 -0.435 9 4. 结论
本文构建了一个基于LSTM预测股票收益的两阶段均值-CVaR投资组合模型(LSTM+CVaR),并在投资7只股票的情况下,比较LSTM+CvaR模型、随机选股的CVaR模型、LSTM预测选股的等比例模型、随机选股的等比例模型和沪深300指数的风险收益特征、累计收益率和夏普比率;通过控制变量法,分别改变投资组合模型的上界约束和交易成本,比较分析这2种现实约束对模型的影响。
从本文的实证结果可以看出,相较于传统的投资组合模型,LSTM+CVaR模型能够实现更高的平均收益率、收益风险比、累计收益率和夏普比率。同时验证了上界约束的提升或交易成本的降低在一定程度上优化了LSTM+CVaR模型的各方面表现。
-
表 1 LSTM预测选股的参数设置
Table 1 Parameter settings of the stock selection model based on LSTM prediction
超参数 超参数值 隐藏节点 5,10,15,20,25,30 隐藏层数 1,2,3,…,10 学习率 0.000 1,0.001,0.01,0.1 耐心参数 0,5,10 批次大小 50,100,200 丢弃率 0.1,0.2,…,0.5 循环丢弃率 0.1,0.2,…,0.5 表 2 LSTM输入的指标因子
Table 2 Indicator factors of LSTM input
序号 指标因子 因子描述 序号 指标因子 因子描述 1 rt ln(CPt)-ln(CPt-1) 11 ht-2 ln(HPt-2)-ln(OPt-2) 2 rt-1 ln(CPt-1)-ln(CPt-2) 12 lt ln(LPt)-ln(OPt) 3 rt-2 ln(OPt-2)-ln(CPt-1) 13 lt-1 ln(LPt-1)-ln(OPt-1) 4 rt-3 ln(OPt-3)-ln(CPt-1) 14 lt-2 ln(LPt-2)-ln(OPt-2) 5 ot ln(OPt)-ln(CPt-1) 15 lt-3 ln(LPt-3)-ln(OPt-3) 6 ct ln(CPt)-ln(OPt) 16 TR Max{|HPt-LPt|, |CPt-1-LPt|, |CPt-1-LPt|} 7 ct-1 ln(CPt)-ln(OPt-1) 17 MA 简单移动平均(周期为1个月) 8 ht ln(HPt)-ln(OPt) 18 MTM 动量指标(周期为1个月) 9 ht-1 ln(HPt-1)-ln(OPt-1) 19 RSI 相对强弱指标(周期为14天) 10 ht-2 ln(HPt-2)-ln(OPt-2) 表 3 LSTM预测选股模型的表现
Table 3 The performance of the stock selection model based on LSTM prediction
年份 MAE MSE RMSE 2016 0.018 7 0.000 7 0.027 0 2017 0.024 3 0.001 2 0.034 0 2018 0.022 6 0.000 9 0.029 9 2019 0.019 1 0.000 7 0.025 5 2020 0.031 3 0.001 3 0.036 0 2021 0.021 8 0.000 9 0.029 3 表 4 各模型的收益率、标准差、夏普比率和索提诺比率(k=5, 6, 7, 8)
Table 4 The return, standard deviation, Sharpe Ratio and Sortino Ratio of each model(k=5, 6, 7, 8)
特征指标 模型 k=5 k=6 k=7 k=8 收益率 LSTM+CVaR 0.344 3 0.379 7 0.375 5 0.330 4 LSTM+1/N 0.319 3 0.304 3 0.320 2 0.300 9 Random+CVaR -0.002 5 -0.055 8 -0.045 2 -0.040 6 Random+1/N -0.027 3 -0.065 2 -0.057 7 -0.064 5 CSI300 0.062 9 0.062 9 0.062 9 0.062 9 标准差 LSTM+CVaR 0.304 3 0.302 8 0.294 0 0.283 3 LSTM+1/N 0.293 0 0.281 1 0.279 0 0.269 9 Random+CVaR 0.913 9 0.310 4 0.325 7 0.339 5 Random+1/N 0.399 1 0.286 6 0.286 4 0.273 6 CSI300 0.132 0 0.132 0 0.132 0 0.132 0 夏普比率 LSTM+CVaR 1.033 1 1.155 1 1.175 3 1.060 4 LSTM+1/N 0.987 4 0.975 9 1.040 2 1.003 8 Random+CVaR -0.035 5 -0.276 4 -0.231 0 -0.208 1 Random+1/N -0.143 6 -0.332 1 -0.306 2 -0.345 4 CSI300 0.249 6 0.249 6 0.249 6 0.249 6 索提诺比率 LSTM+CVaR 1.750 9 1.955 8 1.998 9 1.791 0 LSTM+1/N 1.652 9 1.646 7 1.754 9 1.689 6 Random+CVaR 0.147 1 -0.192 7 -0.128 8 -0.096 6 Random+1/N -0.008 6 -0.264 2 -0.225 2 -0.275 7 CSI300 0.567 1 0.567 1 0.567 1 0.567 1 表 5 c=0.000 5且ui=0.3时各模型的风险收益特征
Table 5 The risk and return characteristics of each model when c=0.000 5 and ui=0.3
特征类型 特征指标 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 日度风险收益特征 平均收益率 0.001 4 0.001 3 -0.000 1 -0.000 1 0.000 3 标准差 0.017 2 0.017 2 0.014 0 0.013 8 0.012 2 收益率最小值 -0.082 6 -0.082 0 -0.081 6 -0.081 4 -0.078 8 收益率最大值 0.067 4 0.080 7 0.071 0 0.081 9 0.059 5 年度风险收益特征 平均收益率 0.355 4 0.320 2 -0.055 6 -0.057 7 0.062 9 标准差 0.286 4 0.279 0 0.297 5 0.286 4 0.132 0 下方风险 0.177 7 0.179 5 0.160 7 0.157 4 0.141 1 夏普比率 1.136 4 1.040 2 -0.287 9 -0.306 2 0.249 6 索提诺比率 1.920 8 1.754 9 -0.202 1 -0.225 2 0.567 1 最大回撤 0.404 3 0.382 6 0.460 4 0.373 2 0.324 6 表 6 c=0.000 5且ui=0.5时各模型的风险收益特征
Table 6 The risk and return characteristics of each model when c=0.000 5 and ui=0.5
特征类型 特征指标 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 日度风险收益特征 平均收益率 0.001 4 0.001 3 -0.000 1 -0.000 1 0.000 3 标准差 0.017 5 0.017 2 0.014 2 0.013 8 0.012 2 收益率最小值 -0.072 9 -0.082 0 -0.080 4 -0.081 4 -0.078 8 收益率最大值 0.071 9 0.080 7 0.075 2 0.081 9 0.059 5 年度风险收益特征 平均收益率 0.375 5 0.320 2 -0.045 2 -0.057 7 0.062 9 标准差 0.294 0 0.279 0 0.325 7 0.286 4 0.132 0 下方风险 0.178 8 0.179 5 0.160 8 0.157 4 0.141 1 夏普比率 1.175 3 1.040 2 -0.231 0 -0.306 2 0.249 6 索提诺比率 1.998 9 1.754 9 -0.128 8 -0.225 2 0.567 1 最大回撤 0.390 4 0.382 6 0.429 2 0.373 2 0.324 6 表 7 c=0.001且ui=0.3时各模型的风险收益特征
Table 7 The risk and return characteristics of each model when c=0.001 and ui=0.3
特征类型 特征指标 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 日度风险收益特征 平均收益率 0.000 9 0.000 8 -0.000 6 -0.000 6 0.000 3 标准差 0.017 2 0.017 2 0.014 0 0.013 8 0.012 2 收益率最小值 -0.083 1 -0.082 5 -0.082 1 -0.081 9 -0.078 8 收益率最大值 0.066 9 0.080 2 0.070 5 0.081 4 0.059 5 年度风险收益特征 平均收益率 0.195 1 0.164 0 -0.167 5 -0.169 3 0.062 9 标准差 0.244 8 0.231 9 0.231 1 0.225 8 0.132 0 下方风险 0.181 7 0.183 4 0.164 7 0.161 4 0.141 1 夏普比率 0.674 3 0.578 0 -0.854 7 -0.882 5 0.249 6 索提诺比率 1.185 2 1.030 5 -0.962 2 -1.000 2 0.567 1 最大回撤 0.467 8 0.434 8 0.694 6 0.671 6 0.324 6 表 8 c=0.000 5且ui=0.3时各模型的夏普比率
Table 8 The Sharpe Ratio of each model when c=0.000 5 and ui=0.3
年份 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 2016 1.004 9 0.465 1 0.525 8 -0.122 6 -0.273 6 2017 2.858 3 2.144 0 -0.607 8 -0.498 4 1.658 6 2018 -1.592 8 -1.192 7 -1.621 2 -1.679 9 -1.526 2 2019 1.464 1 1.853 6 1.654 5 1.910 2 1.623 0 2020 2.761 5 2.784 5 0.017 4 -0.041 4 1.014 9 2021 0.823 6 0.595 5 -1.701 8 -1.447 4 -0.435 9 表 9 c=0.000 5且ui=0.5时各模型的夏普比率
Table 9 The Sharpe Ratio of each model when c=0.000 5 and ui=0.5
年份 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 2016 1.312 4 0.465 1 0.530 5 -0.122 6 -0.273 6 2017 2.237 9 2.144 0 -0.591 3 -0.498 4 1.658 6 2018 -1.425 3 -1.192 7 -1.669 4 -1.679 9 -1.526 2 2019 1.317 0 1.853 6 1.629 7 1.910 2 1.623 0 2020 2.944 2 2.784 5 0.263 9 -0.041 4 1.014 9 2021 0.823 8 0.595 5 -1.616 8 -1.447 4 -0.435 9 表 10 c=0.001且ui=0.3时各模型的夏普比率
Table 10 The Sharpe Ratio of each model when c=0.001 and ui=0.3
年份 LSTM+CVaR LSTM+1/N Random+CVaR Random+1/N CSI300 2016 0.532 4 0.020 8 -0.045 7 -0.675 3 -0.273 6 2017 2.069 5 1.308 2 -1.498 1 -1.481 2 1.658 6 2018 -2.072 7 -1.641 7 -2.151 7 -2.215 3 -1.526 2 2019 1.019 9 1.407 4 1.058 6 1.318 3 1.623 0 2020 2.329 1 2.364 3 -0.484 0 -0.555 0 1.014 9 2021 0.450 2 0.183 2 -2.201 6 -1.972 6 -0.435 9 -
[1] GUNDUZ H, YASLAN Y, CATALTEPE Z. Intraday prediction of Borsa Istanbul using convolutional neural networks and feature correlations[J]. Knowledge-Based Systems, 2017, 137: 138-148. doi: 10.1016/j.knosys.2017.09.023
[2] ERSAN D, NISHIOKA C, SCHERP A. Comparison of machine learning methods for financial time series forecasting at the examples of over 10 years of daily and hourly data of DAX 30 and S&P 500[J]. Journal of Computational Social Science, 2020, 3(1): 103-133. doi: 10.1007/s42001-019-00057-5
[3] VO N N Y, HE X Z, LIU S, et al. Deep learning for decision making and the optimization of socially responsible investments and portfolio[J]. Decision Support Systems, 2019, 124: 113097/1-11. doi: 10.1016/j.dss.2019.113097
[4] JIANG W W. Applications of deep learning in stock market prediction: recent progress[J]. Expert Systems with Applications, 2021, 184: 115537/1-22. doi: 10.1016/j.eswa.2021.115537
[5] 梁姝娜, 张友祥, 王学稹. 基于BP神经网络和Logistic模型的中国人均粮食产量预测研究[J]. 华南师范大学学报(社会科学版), 2015(5): 102-106. [6] SONG Y, LEE J W, LEE J. A study on novel filtering and relationship between input-features and target-vectors in a deep learning model for stock price prediction[J]. Applied Intelligence, 2019, 49: 897-911. doi: 10.1007/s10489-018-1308-x
[7] HOSEINZADE E, HARATIZADEH S. CNNpred: CNN-based stock market prediction using a diverse set of variables[J]. Expert Systems with Applications, 2019, 129: 273-285. doi: 10.1016/j.eswa.2019.03.029
[8] DING G Y, QIN L X. Study on the prediction of stock price based on the associated network model of LSTM[J]. International Journal of Machine Learning and Cybernetics, 2019, 11(6): 1307-1317.
[9] MINH D L, SADEHI-NIARAKI A, HUY N D, et al. Deep learning approach for short-term stock trends prediction based on two-stream gated recurrent unit network[J]. IEEE Access, 2018, 6: 55392-55404. doi: 10.1109/ACCESS.2018.2868970
[10] 杨青, 王晨蔚. 基于深度学习LSTM神经网络的全球股票指数预测研究[J]. 统计研究, 2019, 36(3): 65-77. YANG Q, WANG C W. A study on forecast of global stock indices based on deep LSTM neural network[J]. Statistical Research, 2019, 36(3): 65-77.
[11] SU Z, XIE H L, HAN L. Multi-factor RFG-LSTM algorithm for stock sequence predicting[J]. Computer Economics, 2021, 57: 1041-1058. doi: 10.1007/s10614-020-10008-2
[12] MARKOWITZ H. Portfolio selection[J]. The Journal of Finance, 1952, 7(1): 77-91.
[13] GAO J, LI D, CUI X Y, et al. Time cardinality constrained mean-variance dynamic portfolio selection and market timing: a stochastic control approach[J]. Automatica, 2015, 54: 91-99. doi: 10.1016/j.automatica.2015.01.040
[14] 张鹏, 曾永泉. 具有卖空总量限制的多阶段M-SAD投资组合优化[J]. 中国管理科学, 2021, 29(6): 60-69. ZHANG P, ZENG Y Q. Multiperiod mean semi-absolute deviation portfolio selection with total short selling constraints[J]. Chinese Journal of Management Science, 2021, 29(6): 60-69.
[15] STOILOV T, STOILOVA K, VLADIMIROV M. The probabilistic risk measure VaR as constraint in portfolio optimization problem[J]. Cybernetics and Information Techno-logies, 2021, 21(1): 19-31. doi: 10.2478/cait-2021-0002
[16] ROCKAFELLAR R T, URYASEV S P. Conditional Value-at-Risk for general loss distributions[J]. Journal of Ban-king & Finance, 2002, 26(7): 1443-1471.
[17] XU Q F, ZHOU Y Y, JIANG C X, et al. A large CVaR-based portfolio selection model with weight constraints[J]. Economic Modelling, 2016, 59: 436-447. doi: 10.1016/j.econmod.2016.08.014
[18] HUANG D S, ZHU S S, FABOZZI F J, et al. Portfolio selection under distributional uncertainty: a relative robust CVaR approach[J]. European Journal of Operational Research, 2010, 203(1): 185-194.
[19] 张鹏. 不允许卖空情况下均值-方差和均值-VaR投资组合比较研究[J]. 中国管理科学, 2008, 16(4): 30-35. ZHANG P. The comparison between mean-variance and mean-VaR Portfolio models without short sales[J]. Chinese Journal of Management Science, 2008, 16(4): 30-35.
[20] PAIVA F D, CARDOSO R T N, HANAOKA G P, et al. Decision-making for financial trading: a fusion approach of machine learning and portfolio selection[J]. Expert Systems with Applications, 2019, 115: 635-655.
[21] ZHANG J, TENG Y F, CHEN W. Support vector regression with modified firefly algorithm for stock price forecasting[J]. Applied Intelligence, 2019, 49(5): 1658-1674.
[22] LI L L, ZHAO X, TSENG M L, et al. Short-term wind power forecasting based on support vector machine with improved dragonfly algorithm[J]. Journal of Cleaner Production, 2020, 242: 118447/1-12.
[23] CHEN W, ZHANG H Y, MEHLAWAT M K, et al. Mean-variance portfolio optimization using machine learning-based stock price prediction[J]. Applied Soft Computing, 2021, 100(1): 106-943.
-
期刊类型引用(0)
其他类型引用(3)