自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JR_lu的博客

machine learning 初学者

  • 博客(20)
  • 问答 (1)
  • 收藏
  • 关注

原创 机器学习在电能需求预测中的应用

问题:电力公司会提前一天或者几天跟发电厂购买电量,买多了势必会造成不必要的浪费,而买少了临时向发电厂买电代价是比平时高得多的,如何根据以往的数据对未来的电量需求做出精准的预测,是电力公司非常重视的一个问题。解决方案:通过历年来该地区的实际电量需求数据和该地区的天气数据进行建模,建立一个回归模型,预测未来几天的用电需求。数据来源:美国纽约州电力NYISO公司公布了历年来纽约州各个地区的实际用电数据,该

2017-04-07 14:56:35 6135 7

原创 用机器学习对CTR预估建模(一)

题目网址:https://www.kaggle.com/c/avazu-ctr-prediction数据集介绍:train - Training set. 10 days of click-through data, ordered chronologically. Non-clicks and clicks are subsampled according to different strat

2017-02-02 18:04:15 9672 9

原创 c++调用python脚本遇到的那些坑

问题一:一开始我是在qt上编写程序的,qt是32bit,但Python是64bit,在*.pro文件中配置了:INCLUDEPATH += C:/Python27/include/LIBS += C:/Python27/libs/python27_d.lib还是报错,究极原因是bit位数一定要匹配,因此要下载64bit的qt,但自带编译器的qt MinW版找了好久没看到64bit,

2017-01-06 21:41:22 11756 10

原创 leetcode--字符串循环左移

// convert_test.cpp : 定义控制台应用程序的入口点。//字符串循环左移问题#include "stdafx.h"#include<iostream>using namespace std;// 问题:给定一个字符串S[0...N-1],要求把S的前K个字符移动到S的尾部,比如字符串"abcdef",//前面两个字符 'a' 'b'移动到字符串的尾部,得到新字符串"cd

2016-12-11 21:31:01 1694

原创 leetcode--一个for循环找出数组最大和次最大值

//给定一个数组,找出数组中最大值和次最大值。要求在一个for循环里实现#include "stdafx.h"#include<iostream>using namespace std;void select_max(const int*a, int size, int&nMax, int& nSecondMax){ nMax = a[0]; nSecondMax = a[0

2016-12-09 10:59:24 7741

原创 leetcode--压缩空格问题

// test1.cpp : 定义控制台应用程序的入口点。//题目:给定某字符串S,该字符串中有若干个空格,删除这些空格并返回修改后的字符串。要求:时间复杂度为O(N),//空间复杂度为O(1)。 注:有可能两个单词间有若干个空格!#include "stdafx.h"#include<string.h>#include <iostream>using namespace std;void

2016-12-09 10:19:51 847

原创 data_analysis(二)时间戳、日期等各种日期型python相互转换

1.将字符串的时间转换为时间戳 方法: a = "2013-10-10 23:40:00" 将其转换为时间数组 import time timeArray = time.strptime(a, "%Y-%m-%d %H:%M:%S") 转换为时间戳: timeStamp = int(time.mktime(tim

2016-11-10 10:21:56 487

转载 Data_analysis(一)Kaggle上对StandarBank推荐产品的NAN数据进行fill

Kaggle上的一个比赛,https://www.kaggle.com/c/santander-product-recommendation 下面是一位大兄弟写的kernel,对数据进行清洗和nan填充 https://www.kaggle.com/apryor6/santander-product-recommendation/detailed-cleaning-visualization-

2016-11-07 21:51:42 2120

转载 机器学习(十二)决策树

直接上链接http://www.cnblogs.com/leoo2sk/archive/2010/09/19/decision-tree.html

2016-11-02 10:26:21 475

转载 机器学习(十一)使用sklearn对kaggle的Titanic进行建模

转自寒老师的七月算法ML课程 数据集下载地址:https://www.kaggle.com/c/titanic# -*- coding: utf-8 -*-"""Created on Tue Nov 01 09:04:12 2016@author: Siriuskaggle上的Titanic经典案例,建立一个模型,预测乘客是否获救,二分类问题记:寒老师七月算法ML课程课后笔记"""impo

2016-11-01 16:21:11 1769 1

转载 机器学习(十)使用sklearn库对时间特征进行处理

转自寒老师的七月算法ML课程,加了一点自己理解# -*- coding: utf-8 -*-"""Created on Mon Oct 31 20:27:11 2016@author: Sirius特征工程之时间型特征处理"""import pandas as pddata=pd.read_csv('kaggle_bike_competition_train.csv',

2016-10-31 22:10:55 15176

原创 机器学习(九)使用sklearn库进行数据分析_——文本特征处理

# -*- coding: utf-8 -*-"""Created on Wed Oct 26 21:35:31 2016@author: siriustest word2word"""from sklearn.feature_extraction.text import CountVectorizerimport numpy as npvectorizer=CountVectoriz

2016-10-27 17:00:00 1224

原创 机器学习(八)使用sklearn库进行数据分析_——特征处理之过滤、包裹、嵌入型

# -*- coding: utf-8 -*-"""Created on Thu Oct 27 10:53:56 2016@author: siriusfeature chioce""""""---------------------特征处理之--过滤型-----------------------------------评估单个特征和结果值之间的相关程度,排序留下TOP相关的特征部分"

2016-10-27 16:57:03 1447

原创 机器学习(七)使用pandas库进行数据分析_——统计信息和离散化

在特征工程中,对于数值型数据(比如年龄为25岁、31岁。。,商店某个时间段的销量为20W件等等),通常要对这些数值型数据进行统计分析,比如求取它们的最大最小值、期望方差等,pandas库在数据分析中非常好用。 对 数值型数据进行离散化,也用到pandas的cut函数,具体操作如下代码:# -*- coding: utf-8 -*-"""Created on Wed Oct 2

2016-10-26 16:30:57 2517

原创 机器学习(六)使用sklearn库的model存储

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 21:39:04 2016@author: Administratormodel说明,normalization"""from sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sk

2016-10-26 10:43:14 2770

原创 机器学习(五)使用sklearn库的cross validation

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:10:51 2016@author: SIriustest sklearn"""import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom

2016-10-26 10:06:05 1349

原创 机器学习(四)使用sklearn库的练习normalization和model的一些参数

“`-- coding: utf-8 --“”” Created on Tue Oct 25 21:39:04 2016@author: Administrator model说明,normalization “”” import numpy as np from sklearn import datasets from sklearn.cross_validation import t

2016-10-25 22:09:03 1393

原创 机器学习(三)使用sklearn库的datasets练习LinearRegression

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:42:24 2016@author:SiriusLinearRegression"""from sklearn import datasetsfrom sklearn.linear_model import LinearRegressionfrom sklearn.cross_valid

2016-10-25 21:00:50 1119

原创 机器学习(二)使用sklearn库的datasets练习KNN分类

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:10:51 2016@author: SIriustest sklearn"""import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom

2016-10-25 20:38:16 1275

原创 机器学习(一)概率论基础

**1. 期望** 定义: 期望有两种形式,离散型: 和连续型: 期望的意思就是概率加权下的“平均值”。性质: 补充一点: 随机事件是随机变量取某一特定值时的情况,有两个重要性质: 独立性: 互斥性: 2.方差定义: n个样本的分布规律偏离于平均值的程度 性质: 3.协方差定义: 性质: 协方差矩阵: ——–怎样评价多个特征属性之间的相关关系呢?

2016-10-24 11:11:51 801 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除