自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (3)
  • 收藏
  • 关注

原创 学习日记2

1利用xlsxwriter自动生成excel报表,在unbuntu下公式不会自动运算,在windows下可以,主要功能代码: workbook = xlsxwriter.Workbook('new_table.xlsx') sheetslit = workbook.add_worksheet('slit') sheetnormal = workbook.add_workshee...

2018-07-07 19:17:18 181

原创 学习日记

接触了DELF模型,用来找图片之间的局部相似图片,从github上下的源码,找图片相似性分为两步:1 抽取特征2 匹配图片为将其改成适用于自己任务,对代码进行了修改    txt文件的命令行参数换成了图片的文件路径 parser.add_argument( '--full_images', type=str, default='list_images.txt',...

2018-07-03 19:59:17 245

原创 数据挖掘十大算法之k均值聚类算法

K-Means算法K-Means是一种聚类算法,属于无监督学习方法的一种。也是基于原型的聚类算法。简单的介绍就是选取k个中心点,形成簇,然后不断更新中心点,直至簇不再改变。算法流程随机生成k个初始点作为中心点将数据集中的数据按照距离中心点的远近分到各个簇中将各个簇中的数据求平均值,作为新的中心点,重复上一步,直到所有的簇不再改变距离的选择欧氏距离 每个维度的差的平方之和曼哈顿距离 每个维

2018-04-17 20:38:20 952

原创 数据挖掘十大算法之C4.5决策树

C4.5决策树C4.5决策树属于分类算法,基于信息增益率来选择样本划分特征,每次根据这个特征将样本划分到不同的集合中。了解信息增益率信息增益率=信息增益/分裂信息度量 ,信息增益是ID3分类决策树的划分样本特征,它的缺点在于倾向于选择特征取值多的特征作为划分标准,从信息增益的计算可以看出来(稍后说明),而分裂信息度量等于各种特征的取值所占比例*它的对数之和的负数,因为比例一定小于等于1,所以对数为

2018-04-17 11:01:42 363

原创 Python中Numpy基础

numpy的功能:提供数组的矢量化操作,所谓矢量化就是不用循环就能将运算符应用到数组中的每个元素中。提供数学函数应用到每个数组中元素提供线性代数,随机数生成,傅里叶变换等数学模块numpy数组操作numpy.array([],dttype=)生成ndarry数组,dttype指定存储数据类型numpy.zeros((3,4))生成指定元素0的3行4列矩阵。numpy.

2018-01-29 13:51:05 11755

原创 Python中的类

关于Python中的类要知道的几点python中的类也是对象,是实例的工厂。两者都是命名空间对象。python中的类支持多继承python调用属性(函数或者成员变量)时,会在类树(类的继承关系树)上从底往上搜索,找到即止,否则报错。最底层是实例,实例继承类的属性,再上层是类,再上层是超类。执行模块代码的时候,遇到class语句会创建类对象实例的继承指使用.运算调用属性时,连接类的属性,实例

2018-01-28 21:10:15 146

原创 Python中的模块

模块的概念Python中的一个模块是一个文件。是一个命名空间,组织函数与类的地方。导入模块时所发生的事(3件事)寻找模块路径,通过sys.path寻找模块路径。sys.path可静态配置,也可动态配置,动态配置指在模块的代码中添加sys.path.add(“模块路径”)。不过只在该模块载入运行时有效。静态配置指在程序的标准库的sitepackages目录中添加.pth文件和配置P

2018-01-18 16:14:35 157

原创 Python的函数

Python的函数基本概念使用def定义基本函数,函数本身是对象,即可以返回函数对象本身。类似于c里面的函数指针。函数被调用的时候才检查def语句,所以def语句可以写在函数调用之后。函数变量的作用域变量名的查找遵循LEGB原则,即先在本地(一般是函数内部,如果是嵌套函数则是嵌套函数内部)寻找对应的变量,再在函数中寻找对应的变量,再去模块中查找,最后去内置模块查找。函数中对变量名有两种修饰

2018-01-17 11:43:22 171

原创 使用selenium自动化测试工具进行页面信息的抓取遇到的坑

为什么选择使用selenium?selenium是一个Web程序测试工具,selenium能解析js,而我平常写的简单爬虫都是爬静态页面,即原始的html,当js改变html的元素时,如果依照原来的那个爬取的html来弄就会出错。selenium支持多种浏览器,Chrome,Firefox,Phantomjs(已经被弃用了,可以使用其他浏览器的无头模式)。重要的事说三遍,Chrome是真的快!C

2018-01-09 00:20:46 2453

原创 Python基本语法

Python和Java的语法区别多路分支只支持if多路分支,switch不支持,也可以用列表和字典处理多路分支,这样简便。字典式多路分支在处理动态数据的程序中很有用。语句末尾不打分号,除非多个语句连在一行,语句之间用分号相隔,末尾依然不打分号。条件外的()省略掉了,没有代码块{},以缩进区分。循环else语句,while :循环之后可以接else语句,循环结束之后执行一次,break跳

2018-01-06 23:14:49 210

原创 Python核心对象类型之元组及文件

元组元组是不可变类型,以()表示,是任意对象的有序集合,同样是序列的一种,index和count方法分别是取元素,统计元素个数。 语法比如(2,3)就是一个元组。元组与列表如此类似,为何需要重复的类型,主要它提供了不变性,提供了”常数”声明。元组项虽不能修改,但是嵌套里面的列表项还是可以修改的。文件open内置函数创建文件对象,通过这个对象对外部文件进行操作。函数有三个参数,第一个文件路径,第二个

2018-01-04 21:08:23 201

原创 Python核心对象类型之列表与字典

列表和字典都属于可变类型,都支持序列的基本操作。字典支持一部分,如索引,像分片不支持。列表的基本操作支持运算符操作,比如+就是合并列表生成新的列表,*就是把重复列表加起来生成新的列表。注意操作符两边必须是相同类型,即必须都为列表类型。in判断某个元素是否在列表中,可用于for循环遍历的对象。索引,分片,嵌套。s=[1,2,3],s[0]=1,s[1:3]表示{1,2},s=[[3

2018-01-03 15:23:07 507

原创 Python核心对象类型字符串

Python的字符串的特点Python与C语言,Java语言都不一样,没有单个字符,只有一个有一个字符的字符串。字符串对象不可修改,属于不可变类型字符串和列表,元组都从属于序列这个对象类别。所以序列支持的操作,字符串也支持。用单引号和双引号表示都行,并列的字符串串常量会自动合并,不需要显式的用加号表示。单双引号里面的特殊字符必须用转义序列表示,比如”,’,\都需要在前面加个、,但是在三引号

2018-01-02 21:57:18 561

原创 Python的动态类型简介

Python的变量不需要声明类型,到代码运行的时候才决定,这就是Python的动态类型,变量没有类型,有类型的是对象,变量只是在运行的时候引用了这个对象。对象和变量,引用之间的关系变量是一个系统表的元素,拥有指向对象的连接的空间对象是分配的一块内存,有足够的空间去表示它们所代表的值引用是自动形成的从变量到对象的指针关于引用Python的垃圾收集是基于引用计数器,这就会遇到一个问题,带循环的

2018-01-01 21:06:11 281

原创 Python核心对象类型之数字

Python的数字类型整数和浮点数 123,0o12(八进制),0x32(十六进制),0b10(二进制)复数 3+4j,3.0+4.0j固定精度的十进制数 有理分数 Fraction(x,y) y分之x集合 set{1,2,3}布尔类型 True False无穷的整数精度 当整数超出范围后自动改为长整型各种数字内置函数和模块Python的数字运算除法分为Floor除法和真除法

2018-01-01 10:34:20 274

原创 初识Python

Python是一门解释性,面向对象(也可面向过程),动态语言。Python首先将源代码编译成字节码,再将字节码放到PVM(Python虚拟机)上解释运行。Python的三种主要实现方式 CPython运行速度最快,JYthon与Java虚拟机兼容,IronPython与.NET框架兼容。pypy是Python的即时编译器,在解释执行的时候进行边编译边解释,提高程序运行速度。冻结二进制文

2017-12-31 22:25:58 214

原创 四大组件之ContentProvider

ContentProvider是提供在应用程序之间共享数据功能的组件。只要其中一个应用提供了Provider,另一个应用便可以通过ContentResolver访问到它的数据。ContentProvider提供了CRUD操作,大多数时候都不需要自己实现一个ContentProvider,只需要知道Android系统应用提供的Provider的ContentURI就好了。常用的ContentURI如下

2017-07-01 16:07:27 295

原创 四大组件之Service

Service服务是一个应用程序组件,它表示应用程序希望执行长时间运行的操作,运行在应用程序的主线程上。如果要进行耗时操作,就需要创建新的线程,继承Service的IntentService帮我们完成了这一操作开启一个线程进行处理。直到操作完成,自动销毁。创建一个工作队列,每次调用startService将会向onHandleIntent()传入一个启动的intent。当处理完所有Intent就自动

2017-06-28 22:46:22 191

原创 Android数据存储

Android数据存储Android数据存储主要有几种方式,Sqlite数据库,xml文件存储,Json文件存储,普通的图片文件存储,对象序列化存储。这里首先介绍下关于Sqlite数据库数据存储。我们都知道需要借用SqliteOpenHelper来创建数据库,创建表。来进行数据的操作。-

2017-06-28 18:24:20 347

原创 四大组件之Activity

Activity是App应用程序界面的控制器。Activity的重要知识点:生命周期:onCreate 在Activity被创建后调用,用来加载布局,初始化UI。onStart 当启动一个Activity时,在onCreate之后调用,表示Activity可见onResume 当启动一个Activity时,在onStart之后调用,表示Activity位于前台,可与用户交互。此时Act

2017-06-27 20:12:30 191

原创 Xml文件通用解析与序列化

xml文件也是一种数据存储格式,可以用来存储数据,这里介绍Xml文的通用解析,和通用序列化,序列化一般指转换为流,这里指对象转换为xml文件存储起来。什么是通用?一般解析一个xml文件就需要特定为其写一个xml文件解析函数,多个xml文件就需要多个xml函数。这样太过繁琐?有没有只用一个函数就能解析不同的xml文件,序列化不同的对象。答案是已经有了,第三方框架XStream,还有Retrofi

2017-06-24 23:07:45 1297

软件测试技术介绍

软件

2018-01-03

Python3.3入门指南官方中文

Python官方入门书籍,全面,详细,简单。适合新手或者初级Python工程师。

2018-01-03

rose软件使用

rose软件的使用,关于这个的一些介绍和讲解,使用方法的叙述

2017-12-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除