当前位置: 开发笔记 > 编程语言 > 正文

【机器学习方法研究】——思路整理、支持向量机

作者：哦是你的嘛_416 | 来源：互联网 | 2023-09-25 19:48

机器学习方法是计算机科学的一个分支，它借助于计算机算法，对数据进行分析后，实现模式识别，进而实现对未来数据的预测。机器学习方

机器学习方法是计算机科学的一个分支&＃xff0c;它借助于计算机算法&＃xff0c;对数据进行分析后&＃xff0c;实现模式识别&＃xff0c;进而实现对未来数据的预测。

机器学习方法可以分为以下几个类别&＃xff1a;

1.监督学习&＃xff1a;

训练的输出分类是预先设定好的&＃xff0c;根据输入和输出&＃xff0c;算法的目标在于寻找其中的对应函数。

2.无监督学习&＃xff1a;

训练的输出分类是预先不知道的。算法的目标在于发现数据中的结构&＃xff0c;如聚类分析。

3.半监督学习&＃xff1a;

介于监督学习和无监督学习之间。

4.增强学习&＃xff1a;

算法通过执行一系列的动作&＃xff0c;影响环境中的可观察变量&＃xff0c;从而得到环境对动作反应的规律。最后根据这个规律&＃xff0c;判断该采取何种行动以最大化某种回报。

监督式学习是机器学习的一个分支&＃xff0c;可以通过训练样本而建立起一个输入和输出之间的函数&＃xff0c;并以此对新的事件进行预测。

典型的监督学习流程如下&＃xff1a;

支持向量机

是监督学习中一种常用的学习方法。

支持向量机&＃xff08; Support Vector Machines SVM &＃xff09;是一种比较好的实现了结构风险最小化思想的方法。它的机器学习策略是结构风险最小化原则为了最小化期望风险&＃xff0c;应同时最小化经验风险和置信范围&＃xff09;。具体就不详细介绍了&＃xff0c;百度有很多资料。

http://scikit-learn.org/stable/modules/svm.html#svm 中是SVM函数和简单介绍。

from sklearn.svm import SVR 可以构造支持向量回归&＃xff08;Support Vector Regression&＃xff09;模型

from sklearn.svm import SVC 可以用于分类&＃xff08;Support Vector Classification&＃xff09;

首先来看支持向量回归&＃xff08;Support Vector Regression&＃xff09;模型如何使用&＃xff0c;下面是官网的一个简单例子。

http://scikit-learn.org/stable/auto_examples/svm/plot_svm_regression.html#example-svm-plot-svm-regression-py

In [1]:

import numpy as np
from sklearn.svm import SVR
import matplotlib.pyplot as plt
import time# 产生数据
X &＃61; np.sort(5 * np.random.rand(40, 1), axis&＃61;0)y &＃61; np.sin(X).ravel()
# 添加噪声
y[::5] &＃43;&＃61; 3 * (0.5 - np.random.rand(8))# 拟合回归模型&＃xff0c;不同的核函数
svr_rbf &＃61; SVR(kernel&＃61;&＃39;rbf&＃39;, C&＃61;1e3, gamma&＃61;0.1)
svr_lin &＃61; SVR(kernel&＃61;&＃39;linear&＃39;, C&＃61;1e3)
svr_poly &＃61; SVR(kernel&＃61;&＃39;poly&＃39;, C&＃61;1e3, degree&＃61;2)
y_rbf &＃61; svr_rbf.fit(X, y).predict(X)
y_lin &＃61; svr_lin.fit(X, y).predict(X)
y_poly &＃61; svr_poly.fit(X, y).predict(X)# 画图展示结果
plt.scatter(X, y, c&＃61;&＃39;k&＃39;, label&＃61;&＃39;data&＃39;)
plt.plot(X, y_rbf, c&＃61;&＃39;g&＃39;, label&＃61;&＃39;RBF model&＃39;)
plt.plot(X, y_lin, c&＃61;&＃39;r&＃39;, label&＃61;&＃39;Linear model&＃39;)
plt.plot(X, y_poly, c&＃61;&＃39;b&＃39;, label&＃61;&＃39;Polynomial model&＃39;)
plt.xlabel(&＃39;data&＃39;)
plt.ylabel(&＃39;target&＃39;)
plt.title(&＃39;Support Vector Regression&＃39;)
plt.legend()
plt.show()

从回归的角度&＃xff0c;我们可以根据之前的历史数据&＃xff0c;预测下一个时间点的股价&＃xff1b;分类的角度&＃xff0c;我们可以根据历史数据&＃xff0c;预测下一个时间点股价的正负。下面对股票数据进行回归建模

In [10]:

df.index

Out[10]:

DatetimeIndex([&＃39;2015-01-05&＃39;, &＃39;2015-01-06&＃39;, &＃39;2015-01-07&＃39;, &＃39;2015-01-08&＃39;,&＃39;2015-01-09&＃39;, &＃39;2015-01-12&＃39;, &＃39;2015-01-13&＃39;, &＃39;2015-01-14&＃39;,&＃39;2015-01-15&＃39;, &＃39;2015-01-16&＃39;, ...&＃39;2016-01-29&＃39;, &＃39;2016-02-01&＃39;, &＃39;2016-02-02&＃39;, &＃39;2016-02-03&＃39;,&＃39;2016-02-04&＃39;, &＃39;2016-02-05&＃39;, &＃39;2016-02-15&＃39;, &＃39;2016-02-16&＃39;,&＃39;2016-02-17&＃39;, &＃39;2016-02-18&＃39;],dtype&＃61;&＃39;datetime64[ns]&＃39;, length&＃61;273, freq&＃61;None, tz&＃61;None)

In [13]:

import numpy as np
from sklearn.svm import SVR
import matplotlib.pyplot as plt
import timestart_date &＃61; &＃39;2015-01-01&＃39;
df &＃61; get_price(&＃39;000423.XSHE&＃39;, fields&＃61;&＃39;price&＃39;, start_date&＃61;start_date, end_date&＃61;time.strftime(&＃39;%Y-%m-%d&＃39;, time.localtime()))
X &＃61; mat(range(1,len(df[&＃39;price&＃39;].values)&＃43;1)).T
y &＃61; df[&＃39;price&＃39;].values# 拟合回归模型
svr_rbf &＃61; SVR(kernel&＃61;&＃39;rbf&＃39;, C&＃61;1e3, gamma&＃61;0.1)
# 注意这里对数据建模完了还是预测的该数据
y_rbf &＃61; svr_rbf.fit(X, y).predict(X)# 画图展示结果
_, ax &＃61; plt.subplots(figsize &＃61; [18,8])dates &＃61; df.index
ax.scatter(X, y, c&＃61;&＃39;k&＃39;, label&＃61;&＃39;data&＃39;)
ax.plot(X,y_rbf, c&＃61;&＃39;g&＃39;, label&＃61;&＃39;RBF model&＃39;)
ticks &＃61; ax.get_xticks()
ax.set_xticklabels([dates[i].date() for i in ticks[:-1]])
plt.xlabel(&＃39;data&＃39;)
plt.ylabel(&＃39;target&＃39;)
plt.title(&＃39;Support Vector Regression&＃39;)
plt.legend()
plt.show()

那么如何在策略中使用呢&＃xff1f;一个暴力的方法就是预测未来股价&＃xff0c;如果涨了就买入&＃xff0c;跌了就卖出。使用SVR进行回归预测&＃xff0c;需要预测中未来股价&＃xff0c;那么学习这种非平稳、噪声的股价序列难度是很大的。

下面是个人想法&＃xff0c;作为引子&＃xff0c;欢迎大家一起讨论

特征选择

查阅文献发现有各种因子应用到其中&＃xff0c;

基本面因子&＃xff1a;PE&＃xff0c;PB&＃xff0c;ROE等

技术指标因子&＃xff1a;RSI、KDJ、MA、MACD等

蜡烛图形态因子&＃xff1a;三乌鸦、锤子线等

输出辨识

涨跌分类

未来一段时间收益率

还有一类用法是利用非监督学习甚至深度学习找到特征

比如找到大涨的股票&＃xff0c;然后看大涨前一段时间的形态有没有相似的&＃xff0c;利用非监督学习的方法

统计套利方法是看股价的相关性&＃xff0c;比如A和B两只股票价差一向稳定在10块钱&＃xff0c;某天价差突然跌倒5块钱&＃xff0c;统计套利就假设&＃xff0c;这个价差会恢复到10块钱&＃xff0c;那么我们就可以就此设计交易策略。如果股价价差真的恢复了&＃xff0c;那么就可以实现套利。但是显然&＃xff0c;这样的关系可能不是那么明显地存在于股票的价格中&＃xff0c;可能存在于收益曲线中或者方差曲线中&＃xff0c;甚至更高复杂度的统计量中。DL提供了将原数据投影到另一个特征空间中的方法&＃xff0c;而且是高度非线性的。那么&＃xff0c;原数据中没有体现出来的相关性&＃xff0c;会不会在这种高度非线性的投影空间中体现出来呢

推荐阅读

php
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
usb
Oracle VM VirtualBox 使用指南：创建静态网页及高级功能

本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换，包括安装Guest Additions增强功能，以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]

蜡笔小新 2024-11-21 18:13:22
tags
防范互联网服务提供商的恶意劫持行为

本文探讨了互联网服务提供商（ISP）如何可能篡改或插入用户请求的数据流，并提供了有效的技术手段来防止此类劫持行为，确保网络环境的安全与纯净。 ... [详细]

蜡笔小新 2024-11-23 09:41:45
get
数据输入验证与控件绑定方法

本文提供了多种数据输入验证函数及控件绑定方法的实现代码，包括电话号码、数字、传真、邮政编码、电子邮件和网址的验证，以及报表绑定和自动编号等功能。 ... [详细]

蜡笔小新 2024-11-23 07:47:36
php
深入解析Unity3D游戏开发中的音频播放技术

在游戏开发中，音频播放是提升玩家沉浸感的关键因素之一。本文将探讨如何在Unity3D中高效地管理和播放不同类型的游戏音频，包括背景音乐和效果音效，并介绍实现这些功能的具体步骤。 ... [详细]

蜡笔小新 2024-11-22 21:05:22
char
使用Matlab创建动态GIF动画

动态GIF图可以有效增强数据表达的直观性和吸引力。本文将详细介绍如何利用Matlab软件生成动态GIF图，涵盖基本代码实现与高级应用技巧。 ... [详细]

蜡笔小新 2024-11-22 16:52:32
char
解决Android Studio意外崩溃及重启后Import错误问题

本文提供了一种有效的方法来解决当Android Studio因电脑意外重启而导致的所有import语句出现错误的问题。通过清除缓存和重建项目结构，可以快速恢复开发环境。 ... [详细]

蜡笔小新 2024-11-22 11:53:00
usb
Delphi XE2 之 FireMonkey 入门(19) - TFmxObject 的子类们(表)

td{border:1pxsolid#808080;}参考:和FMX相关的类(表)TFmxObjectIFreeNotification ... [详细]

蜡笔小新 2024-11-21 22:35:24
char
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
get
ABAP开发者需关注的几大关键问题

长期从事ABAP开发工作的专业人士，在面对行业新趋势时，往往需要重新审视自己的发展方向。本文探讨了几位资深专家对ABAP未来走向的看法，以及开发者应如何调整技能以适应新的技术环境。 ... [详细]

蜡笔小新 2024-11-21 18:21:06
client
SIP基础概览

本文介绍了SIP（Session Initiation Protocol，会话发起协议）的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]

蜡笔小新 2024-11-21 17:42:08
request
Struts2 + json+ jquery 实现三级联动action和jsp代码竟然有小红叉，提示缺双引号，检查了转义符号也没缺啊，求解

publicclassBindActionextendsActionSupport{privateStringproString;privateStringcitString; ... [详细]

蜡笔小新 2024-11-21 16:25:41
php
深入解析JQuery Mobile特有的事件与方法

本文详细介绍了JQuery Mobile框架中特有的事件和方法，帮助开发者更好地理解和应用这些特性，提升移动Web开发的效率。 ... [详细]

蜡笔小新 2024-11-21 14:24:21
php
龙蜥社区开发者访谈：技术生涯的三次蜕变 | 第3期

龙蜥社区的开发者们通过自己的实践和经验，推动着开源技术的发展。本期「龙蜥开发者说」聚焦于一位资深开发者的三次技术转型，分享他在龙蜥社区的成长故事。 ... [详细]

蜡笔小新 2024-11-21 11:12:28
char
IC卡操作功能实现

本文介绍了如何通过C#语言调用动态链接库（DLL）中的函数来实现IC卡的基本操作，包括初始化设备、设置密码模式、获取设备状态等，并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]

蜡笔小新 2024-11-21 11:02:19

哦是你的嘛_416

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章