自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

月上桃花,拨灯书尽百世梦

好坏都忍住 也算是进步!

  • 博客(37)
  • 收藏
  • 关注

原创 oracle:中位数查询整理

对现有的求中位数的方法进行整理归纳:1)从数值角度出发;2)数值索引(所在位置)出为了方便说明,leetcode上的案例:编写SQL查询来查找每个公司的薪水中位数。IdCompanySalary1A23412A3413A154A153145A4516A5137B158B139B1154...

2020-03-22 17:17:04 1562

翻译 Oracle:数据类型速记

<21天学通Oracle,张朝明,陈丹>笔记

2020-03-28 17:13:58 146

原创 oracle:实现滑动平均效果

文章目录问题背景时间序列重复,连续数据准备完整的查询语句时间序列重复,不完全连续数据准备具体实现结论问题背景1321. 餐馆营业额变化增长 - 力扣(LeetCode) 实现思路:(1) 首先找到对应的7天之末的终点,分别是2019-01-07,2019-01-08,2019-01-09,2019-01-10.在Oracle中可以通过lead函数实现上述效果.但是需要考虑的两种情况:...

2020-03-28 13:29:53 528

原创 oracle:用户购买平台案例分析与优化

用户购买平台案例,涉及时间型数据.个人第一眼感觉特别简单,但是当深入处理是难成狗了.虽然在测试样例中的结果中通过,但是在最终提交过程中,却显示超时.唉,还得优化呀!本文就是关于这个问题的分析和总结.文章目录问题分析问题及要求实现思路数据准备实现分步实现优化问题分析问题及要求要求:写一段 SQL 来查找每天 仅 使用手机端用户、仅 使用桌面端用户和 同时 使用桌面端和手机端的用户人数和...

2020-03-26 11:20:04 209

原创 oracle:时间数据的处理

文章目录日期函数日期操作转换函数日期函数系统时间:sysdate 无参数 (默认格式:DD(日)-Mon(月)-RR(2位年)) select sysdate from dual;--结果:26-3月 -20日期操作1.add_months(date,i)函数:在指定日期上添加月份,i位任意整数;2.next_day(date,char):若char的星期*,则返回date指定日期...

2020-03-26 09:47:07 354

原创 爬虫:网页信息提取

网页信息提取常用的python工具包括正则表达式、CSS以及xpath.正则表达式叶落阁 的正则表达式总结;以及正则表达式的在线测试工具Xpath(教程)XML中的节点关系包括:父(parent)、子(children)、同胞(sibling)、先辈(ancestor)、后代(descendant).常用的路径表达式:/:表示从根节点开始//:表示匹配当前节点下的所有节点....

2020-03-24 09:35:47 1365

原创 Python:int,float,str之间的转换

文章目录数据类型转换其它数据转换的内置函数数据类型转换主要介绍int,float,str之间的相互转换,转换方向见上图.其它数据转换的内置函数python各种类型转换-int,str,char,float,ord,hex,oct等_Python_sunlylorn的专栏-CSDN博客 ...

2020-03-24 07:42:51 1427

原创 基于selenium的爬虫

基于selenium,利用Cookies进行免密登录,实现搜狗微信(新闻)抓取

2020-03-22 19:39:27 284

原创 oracle学习笔记(六):oracle中排序函数及其应用

Oracle中row_number,dense_rank,rank等排序函数的介绍及应用

2020-03-20 17:07:39 492

原创 oracle:oracle基础知识(一)

数据库的登录权限;表空间;数据的增删改查.

2020-03-20 16:40:14 99

原创 oracle:oracle基础知识(二)

分组查询、多表查询、子查询、以及回收站表的处理

2020-03-20 16:39:59 152

原创 oracle:oracle学习笔记(三)

oracle:oracle基础知识(三):存储过程、函数笔记对于视频中涉及java部分的章节省略;存储过程、存储函数指存储在数据库中供所有用户过程调用的子程序叫存储过程、存储函数。共同点:完成特定功能的程序区别:是否用return 语句返回值语法:create procedure命令建立存储过程和存储函数create [or replace ] procedure 过程名(参...

2020-03-20 16:39:45 170

原创 oracle:oracle学习笔记(四)循环、光标、异常、瀑布模型

IF、For、While、Loop循环、光标、以及异常的处理

2020-03-20 16:39:31 175

原创 oracle:oracle学习案例(五):基础练习

基本oracle语句应用

2020-03-20 16:39:02 208

原创 学习笔记:决策树

参考文献:1.周志华.《机器学习》,2016版.2.李航.《统计学习方法》.3.中国地质大学,蒋良孝博士,MOOC上的《机器学习》视频课程.4.于剑.机器学习:从公理到算法.初次接触《机器学习》,只是为了寻求一种解决问题的捷径(如建模),由此带来的一连串行为:找软件、找程序包(自己徒手码,是个奇迹),找不到,就换"阵地"。虽然在当时可以解决问题,但是频繁地使用,其中不可言喻的遗憾和...

2019-09-06 19:38:55 573

转载 k近邻法的实现(kd树)-相关问题梳理

K邻近算法的伪代码机器学习实战 李锐等译对未知类别属性的数据集的每一个点依次进行如下操作:1.计算已知类别数据集中的点与当前点之间的距离;2.按照距离递增次序排序3.选取与当前点距离最小的k个点;4.确定前k个点所在类别的出现频率;5.返回前k个点出现频率最高的类别作为当前点的预测分类python源码:import numpy as np import mathde...

2019-05-18 12:26:31 483

翻译 深度学习入门读书笔记:Day-14

1.进行手写数字识别的深度CNN:(1).网络的特点:基于3*3的小型滤波器的卷积层;激活函数是ReLU;全连接层的后面使用了Dropout;基于Adam的最优化;使用He初始值作为权重初始化。(2).提高识别精度的方法集成学习、学习率衰减、Data Augmentation(数据扩充)等。数据扩充基于算法"人为地"扩充输入数据。即通过施加旋转、垂直或水平方向上的移动等微小...

2019-05-12 13:04:17 291

翻译 深度学习入门:Day-12

内容:- 池化层- 池化层和卷积层的实现池化层(1).池化是缩小高、长方向上的空间的运算.池化方法:Max池化是从目标区域中取出最大值;Average池化则是计算目标区域的平均值,只需要将上面的max–>>mean(2)池化后的形状:设输入图像尺寸为WxH,其中W:图像宽,H:图像高,D:通道数(图像深度),滤波器大小(FxF),S:步长,池化后输出图像...

2019-05-09 11:52:29 338 1

翻译 深度学习入门:Day-11_CNN

卷积神经网络CNN(Convolutional Neural Network)术语术语描述全连接相邻层的神经元之间都有连接输入特征图卷积层的输入数据输出特征图输出数据滤波器的参数对应于全连接中的权重偏置通过只有一个(1*!),向应用了滤波器的元素加上某一个固定的元素(偏置)步幅应用滤波器的位置间隔连接顺序基于全连接层(Af...

2019-05-08 11:36:53 120

翻译 深度学习入门笔记:Day-10

正则化过拟合问题指的是只能拟合训练数据,但不能很好地拟合不包含在训练数据中的其他数据的状态(机器学习的目标是提高泛化能力)。过拟合的原因:模型参数量大、表现力强;训练数据少。解决方法(1). 权值衰减- 权值衰减是一种抑制过拟合的方法。- 该方法通过在学习的过程中加大权重进行惩罚,来抑制过拟合。(权值衰减方法都会为损失函数加上权重的L2范数 1/2*C*W**2)(2). ...

2019-05-08 09:53:08 117

翻译 Python知识整理_1

3D画图import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D# 定义等高线高度函数def f(x, y): return (1 - x / 2 + x ** 3 + y ** 3) * np.exp(-x ** 4 - y ** 2)+np.tan(np....

2019-05-07 16:18:21 165

翻译 Day9 深度学习入门

参数的更新神经网络学习的目的是找到使损失函数的值尽可能小的参数。常见的有以下四种:SGD(stochastic gradient descent)、Momentum、AdaGrad、Adam。Adam论文这四种方法并不存在能在所有问题中都表现良好的方法,都有各自擅长和不擅长解决的问题。SGD受具体问题(函数形状)的限制,负梯度方向不一定始终指向最优值。所以后三种都是对其的一种改进(下图表...

2019-05-07 15:43:20 114

翻译 Day7--误差反向传播

1.计算图背景神经网络通过数值微分计算神经网络的权重参数的梯度(即损失函数关于权重参数的梯度)数值微分虽然简单,容易实现,但是计算比较耗时。优点计算图的特征是可以通过传递“局部计算结果“获得最终结果。可以通过正向传播和反向传播高效地计算各个变量的导数值。模型计算图将神经网络的计算过程通过数据的图结构表示出来。(“从左往右进行计算”是一种正方向上的传播(从计算图出发点...

2019-05-07 15:03:18 163

翻译 Day8_误差反向传播

1.激活函数的实现ReLU层Relu函数y=max(0,x) dy/dx=(1 if i >0 else 0 for i in x)正向传播时的输入值小于等于0,则反向传播的值为0;反向传播过程中会使用正向传播时保存的mask,将上游传来的dout[mask]=0ReLU层的作用就像电路中的开关一样。class Relu: def __init__(self): ...

2019-05-07 15:01:07 156

原创 Python文件的读取与写入

主要包括“.txt”、“.csv”和".json"格式。文件的读写与open函数有着密切的关系,open函数引用方式为:open('绝对路径',‘mode’,'buffering'). mode:包括:"r"-->读模式;‘w’-->写模式;‘a’-->追加模式; ‘b’-->二进制模式(可与其他混合);‘+’-->读/写模式(可混合使用)。 “buffer...

2019-04-04 11:51:52 179

原创 关于字典的若干问题

万丈高楼从地起字典的创建.字典的相关属性,常用的有keys(),items(),values,update(),copy(),其他的可以通过dir(dict_object)及其help(具体的函数)(万能助手)In [2]: A={'Name':'A',&amp;quot;Age&amp;quot;:18,&amp;quot;sex&amp;quot;:'man'}In [3]: AOut[3]: {'Name': 'A', 'Age':

2019-01-19 11:21:36 149

原创 Selenium+requests出现窗口不能跳转的情况

用selenium+requests进行央视网新闻抓取的时候,会出现搜索页面无法跳转的情况。爬虫设计的思路:def search()#主要用来打开网页,并输入关键字进行搜索def get_link_url()#定义抓取链接def parse_html(link_url):#link_url是个列表,解析每一个链接得到的网页(requests.get())def get_content(...

2019-01-02 13:00:33 971

原创 python中的axis=0和1代表什么

python中的axis=0和1代表什么之前一直很疑惑axis=0和axis=1到底什么时候代表按行操作、什么时候是按列操作。记得在R中也有类似的问题(0代表行、1代表列)。在(caiqingfei)的博客中提到: axis=0:表示沿着每一列或者行标签\索引值向下执行方法(垂直方向) axis=1:表示沿着每一行或者列标签横向执行对应的方法(水平方向)案例...

2019-01-02 12:07:05 7550

原创 R中神经网络的实现

神经网络的实现神经网络的原理(后补),可以查阅张铃教授的相关文章。以下主要讲的是前馈神经网络在R中的实现,目前主要有nnet,neuralnet,AMORE等包,以下以AMORE为例。公式:x−min(x)(max(x)−min(x))x−min(x)(max(x)−min(x))\frac{x-min(x)}{(max(x)-min(x))}还原:min(x)+X∗(ma...

2018-06-08 17:58:33 395

原创 R的更新

R的在线更新关于R的更新,就以自身在anaconda环境中的更新为例,版本3.4.3到3.5insatll.packages(&quot;installr&quot;)#library(installr)#有时候会报错,“stringr&quot;问题,网上有人说安装包stringr,没试过#用require(installr)应该比library调用好#require和library的区别:载入需要的包时,li...

2018-05-17 18:13:38 1127

原创 python字符串中千分位标记的转化

一个很尴尬的问题,卡了一个晚上。现在解决了,虽然,没有找到最合适的方法,但解决这种问题的思路值得不段思考。问题:将a='1,077'怎么转化为a=1077背景:就是在网页抓取时,有时会碰到这种计数风格,就很纠结,直接引用int(),float()等都会出现错误,因为这个逗号,无法识别。然后就考虑用到replace,直接将‘,’换成‘’,然后int(),不就解决了吗?但是我昨晚刚好,绕过了这种,当时...

2018-03-27 14:47:37 7045

原创 python不同版本安装;第三方库的安装

python不同版本安装以及安装第三方库 1.安装不同版本的python:               python2.7 &amp; python3.6ps:安装过程中需要注意的是默认没有配置环境变量,在第一次安装时注意勾选(后面就省去配置环境变量的过程))调用:    在实际应用时会涉及到不同版本的切换,可以将不同版本的python重命名(之前网上都是python2、python3,没有什么影...

2018-02-18 09:34:05 2362

原创 rvest爬虫及案例分析

由于最近准备着学习手数据挖掘,想着先从爬取数据开始。现做一下总结,可能需要的R包有: rvest(主要)、xml2、stringr(主要用来实现字符串处理)一、简单介绍rvest函数read_html() #用来下载网页htnl_nodes() #用来标记要抓取网页元素的节点html_attrs() #用来下在相应的网址(2,3函数单数情况也可以使用)html_tag() #提取标签名称ht

2017-10-27 20:54:13 2869 4

原创 Rwordseg安装

一连几天都在尝试使用Rwordseg包,来实现分词,但是安装真的很艰难,看了好多大神写的贴终于安装好了。我就把我安装的步骤做一下总结:版本 R-3.4.2 jre-9.01(都是最新版)一 配置JAVA环境### R和jre 的位数要一致具体的安装可以参考链接问题:有时候可能在安装过程中即使参考链接配置了JAVA环境,也通过CMD命令行查看显示配置成功,但是也会出现rJava无法加载的问题

2017-10-27 20:51:19 1267

原创 最优化读书笔记R(二)

线性规划简单的线性规划(目标函数和约束都是线性函数)R中常用lpSolve、Rglpk包来解决。lpSolve包的核心函数的lp(),lp.assign,lp.transport()依次解决简单线性规划、分配问题、生产计划和交通运输问题。用法:简单线性规划lp (direction = "min", objective.in, mat,dir,rhs, int.vec,binary.vec, all

2017-10-27 20:10:05 4483

原创 最优化读书笔记R(一)

人生是场穷游,偶尔需要暴走*# R读书笔记(一)*无约束的线性规划实质可以转化为求根问题1.求单根时:uniroot(f,interval)2.求多项式的根**f(x)=a0+a1*x....+an*x^n**polyroot(y)#y=(an,...a1,a0)3.一般方程library(rootSolve)uniroot.all(f, interval, lower = min(interv

2017-10-27 20:05:16 1233

原创 读书笔记之 数据框操作与常用函数

如何把列表转化为整齐的矩阵?mylist<-as.list(iris[,1:4])result<-sapply(mylist,mean)result<-lapply(mylist,mean)#结果【1】Sepal.Length Sepal.Width Petal.Length Petal.Width 5.843333 3.057333 3.758000

2017-10-27 19:59:09 412

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除