- 博客(17)
- 收藏
- 关注
原创 AI-支持向量机分类预测
基于支持向量机的分类预测1.简介支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机,其决策边界是对学习样本求解的最大边距超平面。SVM还包括核技巧,这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化,*即从决策边界到各个数据集的距离越大,分类操作出错率越小。*可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。SVM的的学习算法就是求解凸二次规划的
2020-08-26 21:05:57 3401
原创 AI基础-基于决策树的分类算法
基于决策树的分类预测1. 逻决策树的介绍和应用1.1 决策树的介绍决策树是一种常见的分类模型,在金融风控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通过年龄、长相、收入和是否公务员对将男人分为两个类别:见和不见(此案例纯属虚构),如下图图完整表达了这个女孩决定是否见一个约会对象的策略,其中绿色节点表示判断条件,橙色节点表示决策结果,箭头表示在一个判断条件在不同情况下的决策路径,图中红色箭头表示了上
2020-08-23 23:52:59 1343
原创 时间序列规则和时间序列模型
1. 时间序列规则1.1 什么是时间序列规则对于赛题/业务的规则之前已经描述了它的重要性和应用,在此不再赘述。这章主要了解时间序列及其规则,和周期的应用。1.1.1 时间序列时间序列(或称动态数列):指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。目的:时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。可以反映
2020-08-22 17:57:40 8387
原创 AI体验-基于逻辑回归的分类预测
前言本次的机器学习基础巩固是基于天池实验室-实时在线数据分析工具进行学习的,逻辑回归为第一章章节。所以此章节分为两部分,前面的部分是对实验工具的了解与使用,后半部分是对逻辑回归的内在描述和应用。因为本次学习是对学习器的巩固学习,所以此时对于模型的评估,超参数、参数、过/欠拟合和监督式/无监督式学习算法不予介绍。天池实验室-AI算法学习体验点击“开始体验”,进入体验环节,整个体验环节如下图所示:第一部分显示的题目,右侧可以直接结束实验,实验体验是有完成时间,时间为1小时。第二部分是个人的空间以
2020-08-20 23:44:34 322
原创 Python基础 - 模块&datetime模块
模块(本篇内容均在PyCharm运行)以往脚本基本是用 Python 解释器来编程,如果从 Python 解释器退出再进入,那么定义的所有的方法和变量就都消失了。为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。小汇总容器–> 数据的封装函数–>
2020-08-07 23:02:42 321
原创 Python基础7&8 - 类和对象&魔法方法
Python的类和对象类比介绍要搞懂类和对象,可以以类比到实际生活经验帮助自身充分了解,例如建房子。类(class):相当于施工图纸(blueprint)对象(object):房子(已建成的)注:假设有施工图纸(blueprint),里面有房子的所有信息。对着图纸开始憧憬这个新家后面的美好生活,家具细节,厨房美食来秀恩爱等……这些没有实际意义,只是想象,一切待房子建成后才行。综上,只有图纸是没用的,必须在建好的房子里才可以。这些建好的房子就是对象,在Python中,一切皆为对象,有了
2020-08-03 18:51:53 381
原创 CV基础-模型集成
集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度可以使用交叉验证的方法。下面假设构建了10折交叉验证,训练得到10个CNN模型。那么在10个CNN模型可以使用如下方式进行集成:对预测的结果的概率值进行平均,然后解码为具体字符;对预测的字符进行投票,得到最终字符。深度学
2020-06-02 21:37:47 207
原创 CV-模型训练与验证
构建验证集模型训练和验证模型保存与加载模型调参构造验证集验证集存在的原因评估模型的重点在于将可用数据还分为三个部分:训练集(training set)、验证集(validation set)和测试集(test set)。在训练集上面训练模型,并且在验证集上面评估模型。一旦模型被准备好,最后就在测试集上面测试模型。 不这样做的原因在于,开发一个模型通常需要我们去调整模型的配置:例如,选择最佳的全连接层数或者每一层的节点数(这些被称之为模型的超参数,以区分于模型自身的参数,如:模型的权重和偏.
2020-05-30 23:20:00 1458
原创 CV基础-字符识别模型
CNN学习网站:CNN历史和强化学习(强推):https://blog.csdn.net/jiaoyangwm/article/details/80011656?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachi
2020-05-28 12:01:03 258
原创 CV基础-数据读取与数据扩增
定长字符识别构建模型3.数据读取与数据扩增主要内容为数据读取、数据扩增方法和Pytorch读取赛提数据。3.1 图像读取提供数据为图像数据,目的是识别图像中的字符,应先对需要完成对数据的读取操作,常见的有Pillow和OpenCV.3.1.1 Pillow详细的基础操作可见:https://www.liaoxuefeng.com/wiki/1016959663602400/1017785454949568对应文档:https://pillow-cn.readthedocs.io/zh_CN/
2020-05-23 22:22:28 294
原创 CV基础-调试环境&Baseline
运行环境及安装前言将不定长字符转换为订场字符的识别问题,并使用CNN完成训练和验证:赛题数据读取(封装为Pytorch的DataLoder)构建CNN模型(使用Pytorch)模型训练与验证模型结果预测环境安装1.现在Anaconda中创建一个专门用于本次练习的虚拟环境。conda create -n py37_torch131 python=3.7检查更新当前condaconda update conda2.激活环境并安装pytorch1.3.1#windows: ac
2020-05-20 23:04:39 437
原创 Baseline & EDA(一)
先Baseline,在基础上优化提升。导入函数工具箱,参数搜索、评价指标等数据读取-浏览-统计信息浏览是(否有异常值)(对应的train和test统计值)特征工程-特征与标签构建特征有非数值列做处理(onehot等),特征筛选-提取非数值列,可以做多项式特征构建,Log各种生成,构建基于业务逻辑的特征,或RNN的特征。问:特征加多了是否会过拟合?统计标签的基本分布信息统计及绘图缺失值...
2020-04-12 08:53:44 457
原创 建模调参前期
#导入数据import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom operator import itemgetter%matplotlib inline##载入训练集合测试集test_data = pd.read_csv(r'C:\Users\M...
2020-04-04 21:58:46 129
原创 特征工程前期
特征工程目标1.对于特征进行进一步分析,并对数据进行处理。2.完成对于特征工程的分析,并对数据进行图表或文字总结。#导入数据import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom operator import itemgetter%matplot...
2020-04-01 21:42:52 132
原创 EDA-数据探索分析
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport missingno as msno#缺失值可视化处理包import warningswarnings.filterwarnings('ignore')#载入数据##载入训练集合测试集te...
2020-03-28 21:55:06 1642
原创 DW学习-二手车预测赛题分析
赛题解析字段表FieldDescription备注SaleID交易ID,唯一编码name汽车交易名称,已脱敏汽车市场性信息脱敏regDate汽车注册日期,例如20160101,或201601月01日注册二手网时间model车型编码,已脱敏brand车型品牌,已脱敏bodyType车身类型:豪华轿车-0,微型车-1,厢型车...
2020-03-24 21:57:35 441
原创 CSDN-markdown编辑器模板
@[TOC]CSDN模板欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设...
2020-03-22 11:23:54 128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人