3 fff2zrx

尚未进行身份认证

我要认证

交通民工,公众号:小周note

等级
TA的排名 2w+

基于conv-lstm方法预测共享单车需求

基于conv-lstm方法预测共享单车需求终于不用写期末作业了,我来营业了。公众号居然破500关注了,一颗赛艇。本期分享下我们小组的数据挖掘期末(划水)大作业,小组成员还有李天豪and张振同学。主题是:基于conv-lstm方法预测共享单车需求主要参考的论文是:Bao J, Yu H, Wu J, et al. Short-term FFBS demand prediction with multi-source data in a hybrid deep learning framework

2020-06-28 16:14:24

如何获得行政区划的地理文件

做一些空间特征时,经常需要把属性值映射到行政区划上集计,看一看各行政区划的分布属性特征。那么如何快速获取这些地理文件呢method 1这个是我在这篇推送里看到的,亲测很多次,炒鸡有用。这个网站可以免费下载全国任一地区行政区划的 GeoJSON 格式数据http://datav.aliyun.com/tools/atlas/#&lat=31.728167146023935&lng=104.32617187499999&zoom=3跟推送里提到的不一样的是,我用谷歌浏览.

2020-06-23 10:55:45

问卷中出行目的的处理

问卷中经常有各种出行目的,是为了方便被调查者填写,后期分析的时候需要对一些选项(出行目的)进行合并、去除等。对于回家 ,应该去掉,因为回家是其他所有出行的回程。对于回单位,应该并到业务中...

2020-05-28 11:46:04

用python如何画出好看的地图

最近正好在学空间数据处理,这次更一下用python如何画出好看的地图下面主要是用foliumpoltlygeopandas+matplotlib三种方式绘制地图1.foliumimport foliumimport pandas as pd#输入上海经纬度,尺度latitude = 31.2longitude = 121.5sh_map = folium.Map(location=[latitude, longitude], zoom_start=10)sh_ma

2020-05-23 10:52:52

github使用

github操作github fork 别人的项目源作者更新后如何同步更新git学习–GitHub上如何进行PR(Pull Request)操作GitHub怎样fork别人代码到自己仓库并进行贡献git使用教程github项目下载github下载加速网址

2020-05-13 16:10:09

可视化城市可达性

知乎似乎终于通过大数据发现我是交通专业的了2333,最近推送了一个跟交通相关的内容,是一个人转载外国关于可达性分析的博客,博客里面的图成功吸引到了我的注意,颜值也太高了,果然人都是看脸传送门:https://geoffboeing.com/2016/07/visualize-urban-accessibility-walkability/,文中给了相关代码,稍作修改即可,安装库比较麻烦点我拿上海的poi数据试了试:poi数据是从高德api搞下来的,不推荐百度api爬了地铁站,公交站,学校,餐.

2020-05-11 11:30:31

泊松回归

文章目录泊松分布泊松回归泊松回归求解及分析泊松分布当时学交通工程学的时候就看到书上讲,泊松分布是n趋向于无穷时的二项分布,书上还给出了推导公式,确实没毛病,但是还是没有明白两者之间有什么关联,这到底是为什么呢?最近需要做泊松回归模型,正好看到了知乎上一些答主的回答,恍然大悟,要是当时书上这样讲一下再推导就好了。简而言之就是:把泊松分布里的单位时间或者空间划分为无穷多份,这样子每一份里事件的发...

2020-05-04 15:25:46

pandas的100个tricks

最近发现kaggle上一位pandas大神总结的100个tricks,觉得有些很有用,节选了整理一些,记录于此原地址点击文章目录Trick 1: 打印出 pandas的版本和它的依赖Trick 2: 使用pandas内置的npTrick 3: 一行查看数据总体情况Trick 4: pd.read_csv()的很有用的参数加载大文件的样例数据读取指定列和指定列数据类型用header和skiprow...

2020-04-30 23:58:39

pandas的100个tricks(精细版)

最近发现kaggle上一位pandas大神总结的100个tricks,觉得有些很有用,https://www.kaggle.com/python10pm/pandas-100-tricks文章目录Trick 1: 一行查看数据总体情况Trick 2: pd.read_csv()中有用的参数加载大文件的样例数据读取指定列和指定列数据类型Trick 3: datetime对象可用接口Trick ...

2020-04-30 23:52:26

使用bat脚本双击打开jupyter notebook

用惯了pycharm,所以懒得再安装anaconda,安装了jupyter notebook这个包,但每次想使用时,就要两步走win+R 输入cmd,打开命令行窗口输入jupyter notebook,然后就在浏览器里打开了实在是有点烦,天天打jupyter notebook这个单词查到了bat脚本@echo off cd C:/Users/zrxstart cmd /k ...

2020-04-25 11:26:49

datetime时间类型加减运算

python中处理时间数据,建议使用datetime类型计算时间差import datetimea=datetime.datetime.now()#some codeb=datetime.datetime.now()print((b-a).seconds)时间加减x天(小时/分钟/秒)import datetimea=datetime.datetime.now()+da...

2020-04-24 23:31:50

pandas之resample踩坑

之前强烈安利的pandas函数resample最近坑我不浅,记录下来一言以蔽之:它娘的会自动补全中间缺的日期背景是这样:我想按下雨工作日和周末,不下雨工作日和周末,统计按15min集计订单时变量,然后绘制这种图于是筛选好四部分数据后,依次放入下面代码所示函数中进行集计resample_data=order_data.resample('15T',on='start_time').agg...

2020-04-22 16:46:26

字符串时间与datetime对象相互转换

普通的字符串与datetime对象时间互相转换普通字符串==>>datetime对象strptime 格式要对应parser.parse 格式自由datetime对象==>>普通字符串strftimefrom dateutil import parserimport datetimetime_string='Thu Dec 22 12:40:...

2020-04-19 23:03:02

pandas之上下行运算

有时候我们需要判断相邻两行关系,比如想去除掉相邻两行某个字段相同的数据行。比如我们可以写一个循环,判断每一行与上一行的关系但是pandas已经有了现成的函数供我们使用diff函数pandas.Series.diffCalculates the difference of a Series element compared with another element in the Ser...

2020-04-17 22:56:56

利用C4.5算法对鸢尾花分类

文章目录数据选取和数据情况利用C4.5算法分类离散化连续变量C4.5原理C4.5实现应用训练好的决策树分类数据选取和数据情况本次实验选取鸢尾花数据集(http://archive.ics.uci.edu/ml/datasets/Iris)数据包含5列,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度、鸢尾花种类。鸢尾花属种类包含三种:iris-setosa, iris-versicolour,...

2020-04-17 20:54:06

pandas之多行按类合并为一行

前言前面讲到explode操作是把某一列中的嵌套列表拆分为多行那有时候我们会有着相反的需求,即按照某一列,把相同值对应的多行合并成一行原理主要用到groupby函数+apply函数读取数据data=pd.read_csv('data.csv',header=None)data.columns=['car_id','time','lon','lat']2. 多列合并为一列...

2020-04-05 20:43:28

快速上手python操作postgresql

前言总结下前期利用python操作postgresql数据库的笔记,方便以后使用,顺便安利markdown真舒服python上传dataframe数据入数据库主要是通过create_engine来连接数据库进行数据上传pd.to_sql上传数据是dataframe形式则不需要新建表,直接上传即可,但是数据量很大的时候就很慢用到的主要函数是df.to_sql()函数,跟df.to...

2020-04-05 17:23:58

如何绘制频率直方图+累计概率曲线

前言matplotlib画直方图是通过hist函数来画的,但是有时候或许我们想画一个直方图加上累计概率曲线,既然没有现成的,就只能咱们自己造了计算累计曲线ax1 = fig.add_subplot(111)a1,a2,a3=ax1.hist(data,bins =10, alpha = 0.65,normed=1,edgecolor='k')a1返回的是直方图每个柱子的高度,如果...

2020-04-04 23:12:10

pandas之explode、resample

今天记一下处理数据中发现的pandas的好功能1、explode ->拆分数据为多行我们遇到的车辆轨迹数据是这样的,第一列是车辆的id,第二列是该车辆的轨迹信息,包括时间,经度,纬度我们现在想做的是将最后一列按照第一列car_id拆分为多行,即下图所示 ,这样才方便进行后续处理最早我是拿循环加嵌套列表完成转换的,后来发现pandas有explode这个函数,简单来说,...

2020-03-25 21:50:34

matplotlib的颜色及线条控制

参考网址:http://stackoverflow.com/questions/22408237/named-colors-in-matplotlibhttp://stackoverflow.com/questions/8409095/matplotlib-set-markers-for-individual-points-on-a-line代码:plt.subplots(1, ...

2020-03-22 18:03:00

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。
  • 分享小兵
    分享小兵
    成功上传3个资源即可获取