保序回归与金融时序数据

news/2024/7/23 11:34:50 标签: 回归, 数据挖掘, 量化投资

保序回归回归问题中的作用是通过拟合一个单调递增或递减的函数,来保持数据点的相对顺序特性。

一、保序回归的作用

主要用于以下情况:

1. 有序数据:当输入数据具有特定的顺序关系时,保序回归可以帮助保持这种顺序关系。例如,时间序列数据、评级数据或排序数据等。

2. 无噪声数据:如果数据中存在噪声,即一些离群点或错误标记的数据点,保序回归可能会受到这些异常值的干扰。因此,保序回归更适用于相对干净且有序的数据。

3. 数据平滑:保序回归可以用于平滑数据,消除数据中的波动和噪声,以获得更加稳定的趋势。

4. 非线性关系:当数据中存在非线性的关系时,保序回归可以更好地捕捉这种非线性关系,而不受线性回归的限制。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.isotonic import IsotonicRegression

# 构造示例数据
X = np.array([1, 2, 3, 4, 5])  # 自变量
y = np.array([2, 3, 1, 5, 4])  # 因变量

# 创建并训练保序回归模型
model = IsotonicRegression()
model.fit(X, y)

# 预测新的数据点
new_X = np.array([5, 6, 5.5])
predicted_y = model.predict(new_X)

# 输出预测结果
print(predicted_y)

二、保序回归处理金融股票时序数据并可视化

data = {}
data['close'] = pd.read_pickle('close.pkl')['stock_1'].iloc[-500:]
data['open'] = pd.read_pickle('open.pkl')['stock_1'].iloc[-500:]

n = len(data['close'])
X = np.array(data['open'].values)
y = data['close'].values

from sklearn.isotonic import IsotonicRegression

ir=IsotonicRegression()
y_ir=ir.fit_transform(X,y)

plt.figure(figsize=(15,6))
plt.plot(X,y,'r.',markersize=12)
plt.plot(X,y_ir,'g.-',markersize=12)
plt.legend(('Data','Isotonic Fit'))
plt.title("Isotonic Regression")
plt.show()

回归" style="background-color:transparent;">三、一个小例子

  1. 收集了股票价格和动量因子的历史数据,其中 stock_prices 是股票价格的时间序列数据,momentum_factors 是相应的动量因子数据,target 是标记股票涨跌的目标变量。

  2. 创建一个 IsotonicRegression 对象 model,并使用 fit 方法拟合模型,将动量因子作为自变量,目标变量作为因变量进行训练。

  3. 定义了新的动量因子 new_momentum_factors,并使用 predict 方法对其进行预测,得到相应的股票涨跌预测结果 predicted_target。

# 收集股票价格和动量因子的历史数据
stock_prices = np.array([100, 110, 120, 130, 120, 110, 100])
momentum_factors = np.array([0.5, 0.7, 0.9, 1.2, 0.8, 0.6, 0.4])
target = np.array([1, 1, 1, -1, -1, -1, -1])  # 标记股票涨跌,1为涨,-1为跌

# 创建并拟合保序回归模型
model = IsotonicRegression()
model.fit(momentum_factors, target)

# 预测新的动量因子对应的股票涨跌
new_momentum_factors = np.array([0.5, 0.4, 0.7])
predicted_target = model.predict(new_momentum_factors)

# 输出预测结果
print(predicted_target)

http://www.niftyadmin.cn/n/5101262.html

相关文章

出差学小白知识No5:ubuntu连接开发板|上传源码包|板端运行的环境部署

1、ubuntu连接开发板&#xff1a; 在ubuntu终端通过ssh协议来连接开发板&#xff0c;例如&#xff1a; ssh root<IP_address> 即可 这篇文章中也有关于如何连接开发板的介绍&#xff0c;可以参考SOC侧跨域实现DDS通信总结 2、源码包上传 通过scp指令&#xff0c;在ub…

手写redux的connect方法, 使用了subscribe获取最新数据

一. 公共方法文件 1. connect文件 import React, { useState } from "react"; import MyContext from "./MyContext"; import _ from "lodash";// 模拟react-redux的 connect高阶函数 const connect (mapStateToProps, mapDispatchToProps) &…

【Note】CNN与现代卷积神经网络part4(附PyTorch代码)

文章目录 2.2 残差网络&#xff08;ResNet&#xff09;2.2.1 函数类2.2.2 残差块2.2.3 ResNet模型2.2.4 训练模型2.2.5 Summary 本《CNN与现代卷积神经网络》Note系列会共分为4个part&#xff0c;本文为part4。本Markdown共4k字。 2.2 残差网络&#xff08;ResNet&#xff09; …

GEO生信数据挖掘(九)肺结核数据-差异分析-WGCNA分析(900行代码整理注释更新版本)

第六节&#xff0c;我们使用结核病基因数据&#xff0c;做了一个数据预处理的实操案例。例子中结核类型&#xff0c;包括结核&#xff0c;潜隐进展&#xff0c;对照和潜隐&#xff0c;四个类别。第七节延续上个数据&#xff0c;进行了差异分析。 第八节对差异基因进行富集分析。…

call 和 apply的区别?

call()和apply()都是用来改变函数的作用域的方法&#xff0c;它们的区别在于参数的传递方式不同。 call()的语法&#xff1a; fun.call(thisArg, arg1, arg2, ...)thisArg&#xff1a;传递给函数的this值arg1, arg2, ...&#xff1a;函数参数&#xff0c;可以是多个 apply()…

函数的扩展

文章目录 函数的扩展1.函数参数的默认值1.1 基本用法-- 参数变量是默认声明的&#xff0c;所以不能用 let或const 再次声明-- 使用参数默认值时&#xff0c;函数不能有同名参数1.2 与解构赋值默认值结合使用☆☆☆ 函数参数的默认值生效以后&#xff0c;参数解构赋值依然会进行…

jdbc设置StatementTimeout后还需要设置socket timeout参数吗

背景 我们设置JDBC参数时&#xff0c;不管有没有在Statement中配置超时时间StatementTimeout&#xff0c;我们都需要配置jdbc的socket timeout参数&#xff0c;那么为什么这个socket timeout参数如此必要&#xff0c;不设置又会怎么样&#xff1f; 问题真相 首先设置了State…

Hive跨集群数据迁移过程

文章目录 环境数据迁移需求迁移过程记录 环境 Hive集群AHive集群B跳转机一台 数据迁移需求 本次迁移数据100G&#xff0c;15亿条&#xff0c;数据流转方向从集群A经过跳转机到集群B&#xff0c;通过HDFS拉取和重新建表导入的方式完成数据库迁移。 迁移过程记录 - 当前操作…