自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 使用HMM与osmnx进行地图匹配

主要思路:1.使用osmnx获取路网2.利用osmnx包获得距离gps点较近的几条边(或者几个点)3.将hmm利用到map-matching中gps数据预处理思路:已知观察变量,即给定模型和观测序列,求给定观测序列条件下,最可能出现的对应的隐藏状态序列。使用维特比算法对于每个输入的GPS位置,计算在GPS位置周围一定半径范围内的若干地图匹配候选。然后使用hmm-lib提供的Viterbi算法来计算最可能的地图匹配候选序列。因此,考虑GPS位置与地图匹配候选点之间的距离以及连续地图匹配候选

2021-04-15 16:07:28 2192

原创 支持向量机(SVM)

支持向量机机器学习周志华:支持向量机线性可分最大间隔超平面支持向量SVM最优化吴恩达机器学习:支持向量机优化目标大间隔分类器数学原理核函数SVM的使用机器学习周志华:支持向量机线性可分在二维空间上,两类点被一条线分隔开称为线性可分。在n维空间中,要分开两个线性可分的点集合,我们需要找到一个超平面(Hyper Plane)。最大间隔超平面从二维空间扩展到多维空间时,分开左右两类点的直线 wx + b = 0就成为了一个超平面。为了使这个超平面更具有鲁棒性,我们需要寻找到一个最大间隔把两类点分开

2020-11-13 22:50:58 3408

原创 关于深度学习中的各种卷积

卷积与互相关在信号/图像处理领域,卷积的定义是:其定义是两个函数中一个函数经过反转和位移后再相乘得到的积的积分。信号处理中的卷积。过滤器 g 经过反转,然后再沿水平轴滑动。在每一个位置,我们都计算 f 和反转后的 g 之间相交区域的面积。这个相交区域的面积就是特定位置出的卷积值。互相关是两个函数之间的滑动点积或滑动内积。互相关中的过滤器不经过反转,而是直接滑过函数 f。f 与 g 之间的交叉区域即是互相关。在深度学习中,卷积中的过滤器不经过反转。严格来说,这是互相关。我们本质上是执行逐元素

2020-11-04 20:55:29 405

原创 关于osmnx的安装流程

使用pycharm对osmnx包手动安装使用pycharm依次下载下列模块安装方式:在pycharm中找到settings打开到该界面点击右边加号,在搜索里查找对应包名安装osmnx的依赖包按照下列顺序一个个进行安装(包虽然多,但是安装起来很快)1、descartes2、folium3、geopy4、matplotlib5、networkx6、numpy7、pandas8、requests9、pyproj10、GDAL11、Fiona12、Rtree13、lxml14

2020-10-13 12:14:51 1609 4

原创 机器学习之数据分析

1、数据探索:简单来说就是认识数据,看看数据长什么样2、数据清洗:将“脏”数据清洗干净,转化为我们想要的数据;如果遇到非结构化的数据,需要先将其转换为结构化数据。在数据清洗过程中,需要清洗的主要内容有:缺失值,异常值,噪音值等。3、数据预处理:主要是:归一化、标准化、滤波、热编码、稀疏化等4、特征工程:特征转换、特征拆分、特征重要性、特征合并等5、建立模型:根据需要解决的问题,建立相关的算法模型6、模型调优:调节算法参数、模型选择、选择评价指标、交叉验证等...

2020-05-13 00:15:27 357

原创 机器学习(四)————正则化

正则化:减少过拟合问题欠拟合:算法没有很好地拟合数据,具有高偏差过拟合:会在变量过多的时候出现,无法泛化到新样本,具有高方差以下从左到右:欠拟合,拟合,过拟合正则化的思想当复杂的模型容易出现过拟合,我们可以通过控制模型的中的某些参数,让模型向着简单发展,来减轻拟合。...

2020-05-12 23:41:00 125

原创 机器学习(三)————逻辑回归

参考博客:https://blog.csdn.net/yinyu19950811/article/details/81321944逻辑回归的函数逻辑回归的假设其第一个假设是:假设数据服从伯努利分布其第二个假设是:假设模型的输出值是样本为正的概率。图中g(z)所对应的函数称为Sigmoid函数,而h(x)可以理解为概率,即当h(x)>=0.5时,z>=0,此时y为1分类,当h(x)<0.5时,<0,此时y为0分类使用sigmoid函数原因详见https://blog.csd

2020-05-10 23:52:19 182

原创 机器学习(二)————线性回归+梯度下降算法

线性回归代价函数:用于衡量假设函数的准确性平方差代价函数θ0和θ1为模型参数简化:令θ0=0,即h(x)=θ1*x无简化的代价函数图形等高图梯度下降...

2020-05-08 22:39:53 423

原创 数据处理三剑客之panda

panda的dataframe类:DataFrame有四个重要的属性:index:行索引。columns:列索引。values:值的二维数组。name:名字。数据操作:维度查看df.shape获得数据表基本信息(维度,列名,数据类型,占用空间等)df.info()获取每一列的数据格式df.dtypes获得某一列的数据格式df[“A”].dtypes读取头几条数据d...

2020-05-06 22:45:57 152

原创 数据分析三剑客之matplotlib

matplotlib基本要点:1、绘制折线图(plt.plot)2、设置图片大小和分辨率(plt.figure)3、实现图片的保存(plt.saveflg)4、设置xy轴上的刻度和字符串(xticks,yticks)5、解决刻度稀疏和密集问题(xticks,yticks)6、设置标题,xy轴的lable(title,xlable,ylable)7、设置字体(font manager....

2020-05-05 00:33:13 355

原创 数据处理三剑客之Numpy

ndarray和list列表的区别:python list 列表保存的是对象的指针,比如 [0,1,2] 需要保存 3 个指针和 3 个整数的对象,浪费内存资源和cpu计算时间Numpy中的ndarray是一种保存单一数据类型的多维数组结构,储存在一个连续的内存块中,节约了计算资源。numpy:-NumPy(Numerical Python):Python语言的一个扩展程序库,支持大量的...

2020-05-02 01:59:00 248

原创 jupyter模块安装——jupyter notebook

打开cmd窗口使用cd到python目录的Scripts文件下输入python -m pip --default-timeout=300 install jupyter -i http://pypi.douban.com/simple --trusted-host pypi.douban.com即可

2020-04-28 00:01:36 1175

原创 一些知识点总结

mysql数据库中varchar和char的区别:1、varchar的长度是可变的,char的长度不可变。2、存储时,char类型的数据要比varchar类型的数据速度更快,因为其长度固定,方便存储于查找。3、从存储空间的角度讲,因为插入类型数据的长度固定,有时候需要用空格进行占位,所以存储数据时占用更大的空间。而varchar却不会。char是以空间换取时间效率,而varchar是以空间效...

2020-04-23 23:02:21 81

原创 qq音乐推荐下载器(一)——模拟搜索,下载,读取评论制作词云并将下载数据传至数据库

模拟qq音乐网页的搜索和下载功能第一步:模拟搜索功能其中需要掌握request库进行爬虫关键是获取存有歌曲信息的地址其中第一个url的获取不能直接复制搜索网址我在一开始直接使用搜索网址,发现无论搜什么,都是第一个url要通过F12,获得调试网页的开发者工具,在Network中的XHR中找到文件client_search其中的Request URL就是我们需要的歌曲信息地址,通过多...

2020-04-16 18:26:19 459

原创 python——Re库与正则表达式

正则表达式特点:简洁通用的字符串表达框架简洁表达一组字符串的表达式针对字符串表达“简洁”和“特征”思想的工具判断某字符串的特征归属用法:表达文本类型的特征(病毒、入侵等)同时查找或替换一组字符串匹配字符串的全部或部分常用操作符^ 匹配字符串开头 ^abc表示abc且在一个字符串的开头$  匹配字符串结尾 abc$表示abc且在一个字符串的结尾( ...

2020-04-07 22:38:18 133

原创 python学习笔记————爬虫入门

爬虫(网页蜘蛛)原理:互联网比喻成一张网,每张网上的节点就是数据存储的地方;Python程序类似蜘蛛,到每个节点中抓取自己的猎物;爬虫指:模拟客户端给网站发送请求,获取资源后解析并提取有用数据的程序#只要浏览器能做的事情,爬虫都能做。爬虫分类:通用爬虫:通常指搜索引擎的爬虫聚焦爬虫:针对特定网站的爬虫聚焦爬虫工作流程: 获得浏览器的url(浏览器的路径) 响应内容 提取ur...

2020-04-04 23:56:22 191

原创 mysql数据库学习笔记(九)————储存过程

储存过程语法:delimiter//create procedure 储存过程名(in 输入参数名 参数类型,out 输出参数名,参数类型)begin   代码块;end//delimiter ;#书写一个加薪的存储过程DELIMITER//CREATE PROCEDURE addSalary(money FLOAT,idd BIGINT)BEGIN UPDATE `emp...

2020-04-03 00:51:45 213

原创 mysql数据库学习笔记(八)————事务

事务什么是事务:多组操作,要么全部成功,要么全部失败开启事务:start transaction回滚事务:(如果事务提交后,不能回滚)rollback提交事务:commit事务的4大特性(AICD):  原子性(automic):    #同一个事务中多组操作不能分割,必须是一个整体     一致性(consistent):    #事务操作前与事务操作后,总量保持一致   ...

2020-04-02 22:27:02 92

原创 mysql数据库学习笔记(七)————3表联合查询及视图

视图视图:在真实表上面构建的一张虚表CREATE VIEW view_allAS SELECT a.empName,a.salary,a.phone,b.deptNameFROM dept b INNER JOIN emp a ON b.id=a.deptidSELECT * FROM view_all;#操作视图与操作表的语法相同创建视图:create view 视图名 as...

2020-04-02 12:12:13 316

原创 mysql数据库学习笔记(六)————多表查询

多表查询建表:USE dt4;CREATE TABLE dept( id BIGINT(20) NOT NULL AUTO_INCREMENT PRIMARY KEY COMMENT'部门编号', deptName VARCHAR(20) COMMENT'部门表')CREATE TABLE emp( id BIGINT(20) NOT NULL AUTO_INCREMENT PRI...

2020-04-01 00:46:51 100

原创 mysql数据库学习笔记(五)

聚合函数在mysql函数使用select关键字调用:select 函数名(字段)from 表名找出最大值:max(字段名)找出最小值:min(字段名)求平均数:avg(字段名)求和:sum(字段名)统计记录:count(/字段名)#如果字段的值为NULL,则此字段对应的条数不在统计之内#为了解决上述问题,在统计某一张表中的所有数据记录时,最好用count()。练习:USE dt...

2020-03-31 22:37:42 96

原创 mysql数据库学习笔记(四)——属性

对数据库的备份与还原(一)通过命令:备份数据:通过cmd:mysqldump -uroot -p密码 需要备份的数据库名>备份后的sql脚本名;还原数据:首先进入mysql环境----->创建一个库----->在库下还原数据----->通过命令:source 备份的数据库脚本(二)通过SQLyog:选中需要备份的数据库——>右键——>备份/导出—...

2020-03-31 00:21:30 75

原创 mysql学习笔记(三)————DDL

对sql语言进行分类数据库查询语言(DQL:database query language):对表的查询语句,select数据库定义语言(DDL:database defined language):create database、drop database、create table、、drop table、修改库、修改表等数据库操作语言(DML:database manage langua...

2020-03-30 01:28:06 112

原创 mysql学习笔记(二)————库、表和数据

库,表和数据(windows)mysql → 库(1,2,3…n)→ 表(1,2,3…n)→ 数据库:用来存放N张表表:在数据库中,表(table)类似于excel, 可以用来存放数据。#字段:类似于excel中的表头#数据类型: 字符串(verchar)、整数(tinyint,int,bigint)、小数(flaot)、日期(Date,datetime等)数据:文本,视频,图片,音频...

2020-03-29 01:27:03 75

原创 MySQL数据库学习(一)——开始

数据库:数据仓库,只能用sql语句访问mysql数据库:关系型数据库(分类存储)常见数据库:*Oracle数据库:大型数据库,收费*MySQL数据库:小型数据库,免费开源*SQLServer:微软的数据库*DB2:IBM公司产品,大型数据库,收费sql是一门标准化语言mysql下载了社区版 版本5.7.29由于直接安装压缩包,产生了一系列问题…...

2020-03-28 01:27:56 90

原创 python学习笔记——异常处理

异常类型AssertionError断言语句失败AttributeError尝试访问未知的对象属性IndexError索引超出序列的范围KeyError字典中查找一个不存在的关键字NameError尝试访问一个不存在的变量OSError操作系统产生的异常SyntaxErrorpython语法错误TypeError不同类型间的无...

2020-03-27 22:45:38 95

原创 python学习笔记——类和对象

面向对象编程的表现形式:1.导入库2.设计各种全局变量3.决定需要类4.给每个类提供完整的一组操作5.明确地使用继承来表现不同类之间的共同点6.可选择是否需要main函数作为入口对象 = 属性+方法类:用来描述具有相同属性和方法的对象的集合。它定义了该集合中每个对象多共有的属性和方法。其中的对象被称为类的实例。#Python中类名约定以大写字母开头对象:也叫实例。通过类定义的初...

2020-03-27 22:13:35 177

原创 python学习笔记——文件

一.文件操作1.打开文件例: flie = open(“C:\Users\Desktop\record.txt”,‘r’)#第一个参数指定文件路径,第二个参数指定打开方式.几种基本打开模式‘r’以只读方式打开文件(默认)‘w’以写入方式打开文件(会覆盖已存在文件)‘x’以写入方式打开文件(若文件已存在,会导致异常)’t‘以文本模式打开(默认)‘...

2020-03-26 18:45:38 158

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除