自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 运筹学随笔

模拟退火算法(SA)步骤:1.初始化温度T(充分大),温度下限Tmin(充分小),初始解X,每个T值迭代次数L2.随机生成临域解x_new;3.设f(x)函数来计算用来计算解得好坏,计算出f(x_new)-f(x);4.如果f(x_new)-f(x)>0,说明新解比原来的解好,则无条件接受,如果f(x_new)-f(x)<0,则说明旧解比新解好,则以概率exp((f(xnew)-f(x))/kT)接受x_new作为解。5.如果当前温度<Tmin时,则退出循环,输出当前结果,否则

2020-11-18 15:44:03 173

原创 python 手写kmeans聚类算法

看到一些面经中出现了手写K-means,因此自己写了一版,如有错误,欢迎指正。输入:raw_data: list()(例如,多个坐标点[[0, 0], [1,1],…])k:簇的个数mse_limit:若更新中心点后的mse和更新前的mse,误差在该值以内,则停止迭代early_stopping:最大迭代次数输出:聚类后的结果:dict(),(例如: {0: [[-0.2, -0.2], [0.1, 0.3], [0.2, 0.2], [0.2, 0]], 1: [[-0.1, 1]],

2020-07-14 20:04:40 2231 1

原创 python 快排优化版加随机数实现

经典快排存在的问题:若N个数原来就已经按照规定要求排好序,那么使用快排比较次数会达到最大,复杂度会达到最坏的情况O(n2n^2n2),因此引入随机数,以防止该情况出现# 快排优化版加随机数import randomdef quick_sort(arr,start, end): if start < end: p = partition(arr, start, end) quick_sort(arr, start, p-1) quick_so

2020-07-13 22:11:27 533

原创 机器学习模型评估总结

准确率Accuracy=ncorrectntotalAccuracy=\frac{n_{correct}}{n_{total}} Accuracy=ntotal​ncorrect​​ncorrectn_{correct}ncorrect​: 被正确分类的样本个数ntotaln_{total}ntotal​ :总样本个数存在问题:当不同类别的样本比例不均衡时,占比大的类别往往决定了准确率。精准率、召回率、F-measureprecision精确率针对预测结果,它表示的是预测为正的样本中有多少

2020-07-13 16:04:04 238

原创 轨迹预处理(轨迹清洗)

轨迹轨迹由一系列轨迹点组成,单个轨迹点通常包含三个属性,经度(lng) ,纬度(lat),以及时间戳(timestamp);1. 轨迹分段轨迹采集的过程中由于硬件设备信号的不稳定,容易丢失部分轨迹点,形成的轨迹不能表达车辆的行驶路线2. 去除停留点3. 波动点过滤4. 轨迹抽稀...

2019-12-05 17:32:13 7536 1

原创 轨迹坐标点网格化生成对应的网格ID python实现

需求:划分坐标区域,GPS坐标点网格化处理输入:GPS坐标经纬度,网格的行数和列数输出:坐标的网格区域ID区域范围import pandas as pdimport randomLON1 = 121.4135 LON2 = 121.4176LAT1 = 31.2165LAT2 = 31.3233随机生成100个范围内的坐标点lon =[] lat =[] for i i...

2019-05-17 22:08:18 10145 14

原创 python数据预处理之特征缺失值和异常值处理

python对数据预处理过程中缺失值或异常值的处理,可以使用sklearn.impute包中的 SimpleImputer# 引入SimpleImputer包import pandas as pdfrom sklearn.impute import SimpleImputer'''详解:https://scikit-learn.org/dev/modules/generated/skle...

2019-03-14 14:31:31 4932 2

原创 Linux查看端口占用情况总结

查看具体端口lsof -i:端口号或netstat -tunlp | grep 端口号查看所有端口netstat -tunlp lsof 命令即(List Open Files)用于系统监控、诊断netstat 命令用于显示各种网络socket连接情况netstat 主要参数说明-t 显示tcp相关选项-u 显示udp相关选项-n 不解析名称主机名,忽略端口名称和用...

2018-12-03 21:17:07 508

原创 零基础学会用Github+Hexo搭建个人博客教程

既然是教程,那就得接地气。那就开始动手吧!第一步,建立Github博客域名(建立域名就像给房子选个地址,弄个门牌号,告诉大家这里能找到你。)打开-&amp;amp;amp;gt;GitHub注册依次输入username(用户名)、Email Address(邮箱)、Password(密码)然后点击Create an account(创建账户)直接按Continue(我因为免费所以用GitHub...

2018-11-12 14:48:44 230

原创 python爬虫在windows中能爬取网页数据,但部署到linux环境中时无法获取数据问题的解决

本人在python爬虫时遇到了在windows中能爬取网页数据,但部署到linux环境中时无法获取数据 的问题, 检查后发现是BeautifulSoup解析问题。解决方法:BeautifulSoup的解析器问题,即把lxml 替换为 html.parser将soup = BeautifulSoup(html, &amp;quot;lxml&amp;quot;)替换为:soup = BeautifulSoup(html,...

2018-11-12 10:52:16 2359

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除