4 Just_do_it_2018

尚未进行身份认证

暂无相关简介

等级
TA的排名 4w+

SQL syntax:...MySQL server version for the right syntax to use near 'rank CHAR(1))'

SQL版本:MYSQL8.0.11;MacOS错误语句:CREATETABLEgrade(lowTINYINT,uppTINYINT,rankCHAR(1));错误提示:YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversion...

2018-08-08 17:37:19

SQL的on及where对join过程的影响分析

Outlinejoin各类型on与where对join的过程影响总结join各类型首先,对于join的各种类型的区别,不仅是各大面试中最常见的问题,也是在实际问题场景中使用频率很高的子句。我觉得无需多言,看两张图就足够了:1、笛卡尔积(cross join,其实叫交叉积更便于自己理解) 假设集合A={a, b},集合B={0, 1, 2},则两个集合的笛卡尔积为{(a, ...

2018-08-07 16:38:21

用户运营之push和短信

写在前面:运营是连接用户和产品的桥梁。用自己的话讲,运营的目的就是为了更多的人能持久地用自己的产品。而转化为行话就是我们需要推广拉新、活动促销、提高用户留存、提高用户活跃率、提高用户粘性、流失用户召回等等。而运营的手段也不外乎push、短信、闪屏、弹窗、播报等。今天正好看到几篇关于短信和push的好文章,趁热想从这几篇文章来梳理一下自己的感悟和总结~ 1、你真的了解push么? 2、没推送...

2018-08-06 17:26:45

pandas读取中文文件的UnicodeDecodeError编码问题汇总

Outline批量处理文件获取文件编码不能decodebytes…python的异常处理read_csv中的error_bad_line参数小感批量处理文件为了批量处理文件,当然是想办法获取文件名,通过文件名形成文件路径从而批处理文件。我以前绕过大弯,根据文件的命名规律,尤其是其中的数字递增规律来创建路径,自从发现os库里的listdir函数才知道自己有多蠢!...

2018-08-02 16:57:03

OSError: Initializing from file failed

问题场景:在用pandas的read_csv函数直接读取批量的包含中文名的CSV文件时,发生如下错误:问题原因:1、文件名包含中文名;2、传入参数是文件路径而非文件名解决方案:解决方案有两种:1、在read_csv之前先用open函数f=open('人效日报-20180701.csv')data=pd.read_csv(f,skiprows=1,hea...

2018-08-02 15:56:09

SQL暑期进阶计划_4

今天是SQL第八天,专注于SQL的操作语言,主要是对数据库中数据的操作。OutlineinsertupdatedeleteNULL 零与空格的区别insertinsert是往数据库中插入数据如果要插入的数据量较小,记住insert values语句 例:insert into table_name(col1,col2,col3) values (a,b,1);...

2018-07-30 18:35:56

SQL暑期进阶计划_3

今天是SQL第六、七天的内容,主要涉及到SQL中的高级查询部分:Outline多表查询子查询多表查询多表查询也叫表联合查询,主要分为内连接和外连接。进一步又可以分为: 1. inner join A inner join B 返回的是满足连接条件的A和B的记录 2. left join A left join B 返回的是A的所有记录以及B中满足连接条件的记录...

2018-07-30 17:19:32

Excel技巧大杂烩

写在前面:看了秦璐老师的知乎专栏,很喜欢秦璐老师的分享和总结,对于我的启发是有必要把自己在实际中常用同时觉得给自己带来很大便利的操作记录总结下来,总结的过程也是提高的过程!数据准备: 秦璐老师的分享,密码:jqm8Outline快捷键数据透视表条件定位之查找公式错误冻结窗口持续更新…快捷键对于快捷键的使用,我确实体会到了它的便利性,尤其数据量越来越多的时候...

2018-07-25 17:40:07

python运用DBSCAN算法对坐标点进行离群点检测&dataframe的append问题

问题描述(关于dataframe的append问题,直接拖至文后)我们有n多单车,每个单车一段时间(差不多一个星期)规律返回的经纬度位置数据,类似于下图,但是有个问题是单车的这些经纬度数据的准确性只有70%左右,不准确的经纬度会出现偏差,我们要做的就是去掉那些噪音比较大的坐标点,筛选出正确位置从而进行之后的操作。解决方案DBSCAN算法简介操作源码小收获&小总...

2018-07-23 18:03:18

SQL暑期进阶计划_2

今天继续SQL第五天:SQL中的子句OUTLINEwherestarting withorder bygroup byhaving附加:where和having的区别where1、where使我们返回的数据更具有选择性2、where是使用频率仅次于select 和 from的语句starting with1、starting with类似于 like子...

2018-07-20 17:38:17

SQL暑期进阶计划_1

今天完成《SQL21日自学通》的前四天的内容。OUTLINESQL概述select表达式、条件语句、运算函数:对数据的进一步处理SQL概述SQL:structured query language 结构化查询语言 它是连接我们和数据库的一个纽带,通过命令行的方式与数据库进行会话select1、 两个特性: - ① 对大小写不敏感,但是涉及具体数据时要注...

2018-07-18 16:42:42

SQL暑期进阶计划_0

写在前面:最近借着实习的机会接触了数据部门大牛的主页,他们主页上分享了很多学习资源,而且还有很多实操的案例,借着这样的机会,正好巩固一下SQL基础,在实际场景中不断提高自己的SQL能力。OUTLINE前期学习资料总结本次进阶计划两点希望前期学习资料总结之前没接触过SQL的小白,可以先从这两个网站看看,跟着过一遍~ w3school: http://www.w3s...

2018-07-18 16:10:49

关于SQL语句中要不要加单引号的问题

前言:今天上午犯了一个超级超级蠢的错误,把population写成polulation而不自知,多次提醒我找不到polulation列,这是其一;其二是我在未得知我写错的时候,我以为是字段名没有加单引号的问题,加了单引号之后结果变成:所以,对于SQL我有了一些新的认识:1、不能手快!不能手快!不能手快!好好记单词!好好记单词!好好记单词!2、对于单引号的问题,不能仅仅用其他编程...

2018-07-17 12:25:40

pycharm的激活问题

前言:前后因为多次原因,涉及到在Windows和mac上的pycharm的激活问题,而搜索的很多相关文章激活码已经失效,在这个地方暂存一下自己试过有用的,方便自己日后查找。OUTLINEWindows版的pycharm激活Mac版的pycharm激活Windows版的pycharm激活参考网址:https://blog.csdn.net/qq_25073545/artic...

2018-07-15 23:01:59

pandas将日期转换成timestamp

OUTLINE常见的时间字符串与timestamp之间的转换日期与timestamp之间的转换常见的时间字符串与timestamp之间的转换这里说的字符串不是一般意义上的字符串,是指在读取日期类型的数据时,如果还没有及时解析字符串,它就还不是日期类型,那么此时的字符串该怎么与时间戳之间进行转换呢?①时间字符串转化成时间戳将时间字符串转化成时间戳分为两步:第一步:...

2018-06-14 14:29:59

pandas去除重复列

OUTLINE数据准备问题描述解决方案数据准备假设我们目前有两个数据表:①一个数据表是关于三个人他们的id以及其他的几列属性信息importpandasaspdimportnumpyasnpdata=pd.DataFrame(np.random.randint(low=1,high=20,size=(3,4)))data['id']=ra...

2018-06-13 11:17:37

diff函数

OUTLINE问题场景解决方案问题场景假设我有一份操作日志数据,其中一个特征是操作app的时间,时间结构譬如“2018-03-1323:26:19”,我想知道上一次操作跟下一次操作的间隔时间是多少?解决方案关于某列或者某行数据的差分自然要想到python中的diff函数,无论是在pandas中还是在numpy里面都可以直接调用。在numpy中:调用方...

2018-06-11 16:15:41

python中的filter、map、reduce、apply用法总结

这几个函数在平时使用时不能立即想起来,而且它们之间区别不清,借该文做个总结。OUTLINEfiltermapreduceapply总结filter功能:filter的功能是过滤掉序列中不符合函数条件的元素,当序列中要删减的元素可以用某些函数描述时,就应该想起filter函数。调用:filter(function,sequence),function可以是匿名函...

2018-06-09 16:19:42

交叉验证——对数据集的划分

写在前面:为什么划分数据集?以我们的比赛为例,赛方提供有标签的训练数据和无标签的测试数据,要求我们提交测试数据的预测标签值,如果我们不划分数据集,直接用所有的数据进行训练,最后直接对无标签的测试数据预测,我们很难预测我们模型的好坏。以我的理解来看,对于数据集划分形成的验证集,相当于是平时学习中的小考,而测试数据可以看成是期末考或者高考,我们想通过数据集的划分,在验证集上达到评估我们学习能...

2018-06-07 20:19:36

主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]

(本文为转载)摘要最近打各种比赛,在这里分享一些GeneralModel,稍微改改就能用的环境:python3.5.2XGBoost调参大全:http://blog.csdn.net/han_xiaoyang/article/details/52665396XGBoost官方API:http://xgboost.readthedocs.io/en/latest...

2018-06-07 10:24:02

查看更多

勋章 我的勋章
    暂无奖章