6 程序员duke

尚未进行身份认证

我要认证

喜欢编程带来的成就感!

等级
TA的排名 5w+

python计算高德地图距离和面积

python计算高德地图距离和面积因为项目中经常使用高德的距离和面积计算组件,但是高德并未公布计算逻辑,这就导致项目中数据出问题时不知道该如何去定位。因此花费了1天时间把距离计算和面积计算用python语言整理了出来。距离计算公式:from math import asin,sqrt,cos,pi#point_a,point_b是经纬度,格式为[lng,lat]def st_dista...

2020-01-07 10:17:40

数据仓库

最近可能要转岗数据开发了,先占个坑,熟悉后回来填上。

2019-10-24 22:43:40

python数据分析-NumPy (二)

python数据分析-NumPy (二)1. NumPy数组基础python中的数据操作几乎等同于NumPy数组操作,另外一个重要的工具包pandas也是构建在Numpy数组的基础之上的。1.1 NumPy数组的属性首先定义三个随机的数组:一个一维数组、二维数组和三维数组。In[1]: import numpy as np np.random.seed(0) # 设置随机数种子...

2019-09-06 14:24:16

python数据分析-NumPy (一)

python数据分析-NumPy (一)前言:1.开发环境:Anaconda3-5.2.0,点击这里下载所有版本2.语言:python3.如果对jupyter notebook的快捷键不知道如何使用,点击这里1. NumPy入门1.1 python中的数据类型首先要了解一点,python是动态语言,Java/c是静态语言。这两者最明显的地方就在于java/c需要明确声明变量类型,而p...

2019-09-04 17:15:12

短文本相似度匹配

短文本相似度匹配服务器环境:Centos 7.xpython环境:3.6.X问题描述:1.项目中遇到这样一个问题:公司的正式名称和工作人员手动录入的公司名称匹配问题。例如:杭州艾索电子科技有限公司和杭州艾索电子公司豪世华邦(和平店)和豪世华邦浙江维尔科技股份有限公司和浙江维尔科技有限公司工作人员手动录入时会把某些公司名称缩写,但是项目中需要的是公司全称。因此需要来匹配相似度,...

2019-04-16 15:42:28

在centos上部署机器学习环境遇到的坑

在centos上部署机器学习环境遇到的坑服务器环境:Centos 7.xpython环境:3.6.X问题描述:1.在图片识别类的机器学习应用里,常用到cv2这个模块。服务器线上部署时,提示一系列的错误:ImportError: libSM.so.6: cannot open shared object file: No such file or directoryImportErr...

2019-04-15 17:08:31

机器学习(三) 线性代数-矩阵

机器学习(三) 线性代数-矩阵矩阵矩阵是一个二维的数据集合。我们将矩阵表示为列表的列表,每个内部列表的大小都一样,表示矩阵的一行。如果A是一个矩阵,那么A[i][j]就表示第i行第j列的元素。按照数学表达的惯例,我们通常用大写字母表示矩阵。例:A = [[1,2,3], # A有2行3列 [4,5,6]]B = [[1,2], # B有3行2列 [3,4], ...

2019-04-12 15:35:20

机器学习(二) 线性代数-向量

机器学习(二) 线性代数-向量对于机器学习来说,数学很重要,即使你已经把大学阶段的数学知识都忘完了,还是要从记忆里拾取一些。向量数学概念里,向量是指具有大小和方向的量。具体的说向量可以相加生成新的向量,可以乘以标量(数字),也可以生成新的向量的对象。比如说,一个班级里所有学生的身高、体重、年龄数据,可以把数据记为三维向量(height,weight,age),这个班级有4门考试,可以把学...

2019-04-11 16:13:54

在markdown中写数学公式

插入公式规则类型语法效果行内公式$x=2$x=2x=2x=2行间公式 (居中)$$x=2$$x=2x=2x=2下面所有语法都是放在$$之间使用的。字母修饰上下标上标:^下标:_展示语法Cn3C_n^3Cn3​C_n^3矢量展示语法a⃗\vec aa\vec axy→\overrighta...

2019-04-11 15:56:24

机器学习(一) 数据可视化

机器学习(一) 数据可视化前言:1.开发环境:Anaconda3-5.2.0,点击这里下载所有版本2.语言:python机器学习是一个很大的概念,我会的也是其中的沧海一粟,我从基础的开始和大家一起分享一下学习心得。为什么不先说别的,要先说数据可视化?从日常工作中,机器学习的成果怎么展示?有的是润物细无声系列,比如说Facebook的反爬虫策略就使用的机器学习分析用户行为,来判别你是...

2019-04-09 21:23:43

Jupyter Notebook常用快捷键

Jupyter Notebook常用快捷键Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。命令模式 (Esc 开启)Enter : 转入编辑模式Shift-Enter : 运行本单元,选中下个单元Ctrl-Enter : 运行本单元Alt-Enter : 运行本...

2019-03-19 14:08:28

Java命名规范

Java命名规范1. 项目名全部小写。如:bigdata、startdt2. 包名全部小写。如:com.startdt.bigdata3. 类名、接口名首字母大写,多个单词组成时,采用驼峰法,每个单词首字母大写。public class MyArray {}4. 方法名首字母小写,多个单词组成时,从第二个单词开始,每个单词的首字母大写。第一个单词一般为动词,如:public ...

2019-03-06 19:59:52

全面深入了解python(五)

全面深入了解python(五)1. 字典dict类型不但在各种在各种程序里广泛使用,也是python语言的基石。模块的命名空间、实例的属性和函数的关键字参数中都可以看到字典的身影。字典类型性能出众的原因是使用了散列表。1.1 泛映射类型collections.abc模块中有Mapping和mutableMapping这两个抽象基类。它们的作用是为dict和其他类似的类型定义形式接口。...

2019-03-05 19:26:29

全面深入了解python(四)

全面深入了解python(四)1. 用bisect来管理已排序的序列bisect模块包含两个主要函数,bisect和insort,两个函数都利用二分查找算法在有序序列中查找或插入元素。1.1 用bisect来搜索bisect(haystack, needle),其中haystack必须是一个有序的序列,把needle插入位置之后,haystack还能保持升序。也就是说在这个函数返回位置前面...

2019-02-28 17:17:14

全面深入了解python(三)

全面深入了解python(三)1. 切片在python里,列表、元组和字符串这类序列类型都支持切片操作。1.1 为什么切片和区间会忽略最后一个元素在切片和区间不包含最后一个元素是python的风格,这个习惯符合python、c和其他语言里以0作为起始下标的传统。当只有最后一个位置信息时,可以快速看出切片和区间里有几个元素:range(3)和my_list[:3]都返回3个元素。当起止...

2019-02-27 20:10:49

yum出现Error downloading packages错误

yum出现Error downloading packages错误错误表现方式:yum可以list,可以clean cache,但是无法安装,错误提示:Downloading packages:Error downloading packages: libevent-devel-2.0.21-4.el7.x86_64: [Errno 5] [Errno 2] 没有那个文件或目录 ...

2019-02-22 11:57:30

全面深入了解python(二)

全面深入了解python(二)1. 序列构成的数组1.1 内置序列类型概览python标准库用C实现了丰富的序列类型:容器序列:list、tuple和collections.deque这些序列能存放不同类型的数据。扁平序列:str、bytes、bytearray、memoryview和array.array,这类序列只能存放一种类型的数据。容器序列存放的是它们所包含的任意类型的对象...

2019-02-20 20:26:01

Centos7安装配置mysql5.6详细教程

Centos7安装配置mysql5.6详细教程1. 删除Centos7自带的数据库打开终端:[root@duke ~]代表当前目录为~[root@duke mysql]代表当前目录为mysql查询自带的数据库[root@duke ~]# rpm -qa|grep mariadbmariadb-libs-5.5.60-1.el7_5.x86_64删除查询出来的数据库[root@...

2019-02-20 11:48:16

全面深入了解python(一)

全面深入了解python(一)写在开始前,此教程不是基础教程,在看之前你需要有一定的python基础,不然你可能无法理解教程到底教了哪些东西。环境:python版本是3.6.5(>=3.4即可)1. Python数据模型数据模型其实是对Python框架的描述,它规范了这门语言自身构建模块的接口,这些模块包括但不限于序列、迭代器、函数、类和上下文管理器。Python解释器碰到特殊的句...

2019-02-11 14:44:44

java 爬虫大型教程(四)

java 爬虫大型教程(四)基本爬虫进阶(二)1. 爬虫的监控你可以利用爬虫的监控功能查看爬虫的执行情况——已经下载了多少页面、还有多少页面、启动了多少线程等信息。该功能通过JMX实现,你可以使用Jconsole等JMX工具查看本地或者远程的爬虫信息。如果你完全不会JMX也没关系,因为它的使用相对简单,这次教程比较详细的讲解使用方法。如果要弄明白其中原理,你可能需要一些JMX的知识,推荐阅...

2019-01-29 20:15:53

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。