自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hello world!

加油

  • 博客(133)
  • 收藏
  • 关注

原创 pandas回顾

pandas内容,添加了目录

2022-06-03 08:37:17 496

原创 R语言总结

主要把学习工作中遇到的一些R语言基础知识记下来,方便查看。

2020-03-09 12:12:42 849

原创 excel 常用操作

字符串处理函数(left, right, mid, find)leftrightmidfind条件函数(sumifs, countifs)字符串处理函数(left, right, mid, find)leftrig...

2018-06-29 11:05:05 293

原创 linux定时执行R脚本

linux 定时执行脚本

2022-06-03 09:20:49 354

原创 hive相关内容

hive

2022-06-03 08:25:34 265

原创 利用pandas中的iloc和loc来选取df数据

pandas iloc loc

2022-06-02 16:33:50 1002

原创 python基础内容备查

基础内容备查...

2020-02-20 11:10:00 274

原创 模型开发实践(python)

模型开发python

2020-02-08 21:33:52 588

原创 使用R语言中的tidyverse进行分组处理

使用tidyverse包可以方便地进行分组处理。> data name id grade1 a 1 602 a 2 NA3 b 3 604 c 4 805 c 5 606 c 6 60** 可以对不同class进行分组,并作相应地统计。**library(tidyverse)...

2018-11-06 23:53:03 5590

原创 python地图可视化

python最全画地图,可视化数据

2018-10-18 00:06:59 14644

原创 R 语言中的地图包

R语言 baidumap和REmap包使用学习(一)——baidumap包: https://blog.csdn.net/lotterychampion/article/details/51404364Leaflet 主要是用R语言的语法封装了JS版的Leaflet,可以在R语言的plot窗口,利用html5技术显示各种地图,还可以绘制自己的要素图形。https://blog.csdn.net/...

2018-10-17 23:56:47 4264

原创 在ubuntu上部署R以及shiny server

Ubuntu16.04 安装R与RStudioinstall ubuntu安装Rstudio server

2018-10-16 23:42:40 3347

原创 网页版RStudio Server

网页版Rstudio︱RStudio Server多人在线协作开发

2018-10-15 22:53:37 5363

原创 python交互式web应用dash/plotly

dash入门笔记官方文档安装dash layout主要由dash_html_components和 dash_core_components组成。前者是纯html组件,如div; 后者是高级的组件,如 graph。一个div中包含子元素,这些子元素放在一个列表中。children参数放在第一位,可以省略。样式:和css中样式有些区别:这里的style是以字典形式出现的html中的...

2018-09-20 23:51:18 5947 1

原创 git 命令

git 命令git add将本地工作区的修改提交到缓存区。git commit将缓存区的内容提交到head。(远程仓库不变)git push将修改同步到远程仓库。git checkout – filename如果在工作区中修改了文件,但还没有add到缓存区,可以使用这个命令来撤销在本地工作区的修改。但是如果执行了add,就无法撤销了。而且,“–”符号......

2018-09-16 16:03:57 186

原创 R语言字符串处理函数

R笔记——基础主要把学习工作中遇到的一些基础知识记下来,方便查看。tryCatch()result <- tryCatch({}, warning = function(w){}, error = function(e){ paste0('错误: ', e) #这里的e就是字符串}, finnally = {})tryCatch()本身是一个函数,...

2018-09-16 16:03:00 3544

原创 R和sql实现传播(spread)

如果要观察的?![这里写图片描述](http://r4ds.had.co.nz/images/tidy-8.png)) 数据 名称科目等级 1爱丽丝数学78 2爱丽丝语文88 3伯特数学79 4伯特语文80...

2018-09-07 10:37:39 629

原创 pandas问题

好久没用pandas,下面这个语句怎么是这样的结果,难道是我记错了? 定义一个data,再对data进行筛选。data = pd.DataFrame({"a":[4,5,6],"b":[2,8,10]})下面语句为什么是这个结果?data[data["a"]>4 & (data['b']<10)]a b 0 4 2 1 5 8 2 6 ...

2018-07-14 17:22:14 238

原创 ubuntu的配置pip/python

修改pip镜像ubuntu中将python3设置为默认环境修改pip镜像由于默认的镜像网站下载太慢,可以换成国内的。 方案一:修改配置文件 1)检查pip.conf文件是否存在 cd ~ mkdir .pip ls ~/.pip 2)直接编辑pip.conf sudo vi ~/.pip/pip.co...

2018-07-14 00:44:22 441

原创 shiny

shiny:用R语言轻松开发交互式web应用。 中文教程

2018-07-03 19:39:07 499

原创 impala 中的sql

Impala SQL 语言元素

2018-06-26 13:55:17 2108

原创 sql 汇总

sql汇总

2018-06-25 20:39:53 1089

原创 R中的三个点...

ff <- function(a, b, c, d){a+b+c+d}fff<- function(a, ...){result<-ff(a, ...); print(result)}fff(1,2,3,4)#10这里,函数fff()中的参数…和函数ff()中的…表示相同的参数,这里是指b,c,d三个参数,要注意参数的数量和位置需要相对应。当参数较多时,可以这样使用。...

2018-06-25 14:27:30 3128

原创 R语言中mlr包

R机器学习和mlr包

2018-06-12 20:40:16 822

原创 R语言中的异常处理和eval函数

异常处理tryCatch()eval()可以把字符串转化成表达式来执行。 eval和parse结合使用,参数 text 等于要转化的字符串。s<- "print('hello world')"eval(parse(text = s))...

2018-06-06 18:46:13 11843

原创 R中的日期转换

常见的日期转换方法参考文章 R语言日期的表示和运算(详细总结)

2018-06-04 13:14:15 8416

原创 R语言基础

apply : 用于遍历数组中的行或列,并且使用指定函数来对其元素进行处理。 lapply : 遍历列表向量内的每个元素,并且使用指定函数来对其元素进行处理。返回列表向量。 sapply : 与lapply基本相同,只是对返回结果进行了简化,返回的是普通的向量。 mapply: 支持传入两个以上的列表。 tapply: 接入参数INDEX,对数据分组进行运算,就...

2018-05-30 14:35:47 1488

原创 数据透视表pivot_table,和crosstab()

很少使用数据透视表,在pandas中一般用groupby来处理问题,其实有些情况下使用pivot_table()来处理问题会更加方便。 先看看pandas的官方的文档:pandas.pivot_table 另外,这篇文章讲得更详细。...

2018-05-21 16:42:37 1455

原创 机器学习的好文

使用sklearn做单机特征工程 使用sklearn优雅地进行数据挖掘

2018-05-21 15:01:55 213

原创 sql中的窗口函数、用户变量和存储过程

窗口函数,也可以被称为OLAP函数或分析函数。mysql之前并不支持窗口函数,但也可以用其他方法实现,但mysql8.0是有窗口函数的,可以看看这篇文档。

2018-05-20 23:35:51 1384

原创 如何使用sklearn对决策树进行可视化

在sklearn的官网上已经对决策树的实现进行了详细介绍,这里主要讲一下可视化的过程。安装和配置GraphViz首先去下载软件,我的版本是graphviz-2.38.msi。然后就是配置环境变量,把\bin文件夹放到path中就行了。最后在终端命令行中输入:dot -version,检测一下有没有设置成功。决策树可视化需要安装一些python库,如graphviz等。 ...

2018-05-18 13:14:17 5419

原创 mysql的full join的实现以及join中的on条件的使用

在mysql里是不支持full join的。但是可以通过以下方式来实现: 左连接+ union+右连接 另外: union 操作符选取不同的值,会自动去重。如果允许重复的值,请使用 union all。...

2018-05-11 16:11:04 5000

原创 信用评分卡

传统的信贷模型以评分卡为主,了解一下。 这里有几篇关于评分卡的文章,可以看一下。参考文章

2018-05-09 17:03:51 768

原创 awk,了解一下!

虽然工作中用不上linux,但自己也学过一段时间的linux,竟然没听说过awk。这里放一些教程。 awk,了解一下! 这个教程写得挺好,可以点一下: 参考文章...

2018-05-08 18:09:06 165

转载 mysql的优化

一、前提 这里的原则只是针对MySQL数据库,其他的数据库某些是殊途同归,某些还是存在差异。我总结的也是MySQL普遍的规则,对于某些特殊情况得特殊对待。在构造SQL语句的时候要养成良好的习惯。二、原则总结 原则1、仅列出需要查询的字段,这对速度不会明显的影响,主要是考虑节省应用程序服务器的内存。原来语句:select * from admin优化为: select admin_i...

2018-05-08 10:15:18 146

原创 sorted的巧妙用法

如果要对一个整数序列中奇数和偶数单独排序,如下所示:a = [2, 3, 5, 4, 22, 45, 99, 16]#结果:[3, 5, 45, 99, 2, 4, 16, 22]b = sorted(a, key=lambda x: (x+100000) if x%2==0 else x)print(b)这里的key就是排序条件, 我们可以给lambda函数赋予不同的映射,如当元素...

2018-05-07 23:31:50 1574

转载 svm

惊呼——SVM支持向量机三重境界!

2018-05-07 11:52:13 578

原创 Hbase入门

大数据框架比较多,之前学了一些hive,由于它存在响应慢,不支持事务等缺点,所以我还得了解一下hbase。先看看别人总结的东西HBase详细概述 HBase 深入浅出...

2018-05-03 14:57:40 179

原创 hive基础

(使用hive 2.3版本)hive的资料Hive 教程(官方Tutorial) Hive HiveQL基础知识及常用语句总结 Hive2.0函数大全(中文版) 过往记忆的博客表格的操作创建表格创建“课程”表格,用逗号分隔。create table course(Cno int,Cname string) row format delimited fie...

2018-04-28 18:20:56 231

原创 在hdfs中安装hive2.3时遇到的问题

hive2版本需要初始化hadoop@master:/etc/mysql$ schematool -dbType mysql -initSchema会提示以下结果:SLF4J: Class path contains multiple SLF4J bindings.SLF4J: Found binding in [jar:file:/home/hadoop/apache-hi...

2018-04-27 18:13:42 839

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除