自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 收藏
  • 关注

原创 python-flask框架

什么是Flask?Flask是一个Web框架,就是提供一个工具,库和技术来允许你构建一个Web应用程序.这个Web应用程序 可以是一些Web页面,博客, wiki ,基于 Web 的日历应用或商业网站。Flask依赖模块: web服务网关接口(Python Web Server Gateway Interface,缩写为WSGIWerkzeug 一个WSGI工具包, 是为python语言定义...

2019-09-03 22:54:31 201

原创 lxml库和Xpath语法

文章目录lxml和xpathlxml库文件读取lxml和xpath什么是XPath?XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进 行遍历。XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看 到的表达式非常相似。最常用的路径表达式:谓语(Pr...

2019-08-27 20:43:33 181

原创 爬虫——正则表达式

文章目录正则表达式目的正则表达式匹配规则re模块re 模块一般使用步骤compile 函数Pattern 对象match 方法search 方法findall 方法与finditer 方法split 方法sub 方法贪婪模式与非贪婪模式:abbbc正则表达式为什么要学正则表达式?实际上爬虫一共就四个主要步骤:明确目标 (要知道你准备在哪个范围或者网站去搜索)爬 (将所有的网站的内容全部...

2019-08-27 20:14:01 281

原创 机器学习——神经网络

神经网络的介绍神经网络是为了模拟人的大脑神经网络起源于1943年,A Logical Calculus of Ideas Immanent in Nervous Activity , 使用一个间划过的计算模型来描述在动物的大脑中,神经元如何通过命题逻辑来实现复杂的计算 在80年代流行过一阵,但是到了90年代后期,由于各种原因,应用逐渐消失了近几年,神经网络又火了起来生物神经元:由包含...

2019-08-19 16:49:00 194

原创 卷积神经网络——代码实现

import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets('MNIST_data_bak/', one_hot=True)sess = tf.InteractiveSession()# 截断的正太分布噪声,标准差设为...

2019-08-19 16:37:34 487

原创 机器学习——卷积神经网

我们把这两个场景抽象出来:我们把对象的轮廓提取出来,与我们脑子里的“人脸数据库”进行对比如果有相似概率比较高的,我们就进行下一步处理;如果没有,这个人我们大概率就不去看了抽取对象的局部特征,与我们脑子里某个人的局部特征进行对比得出结论:(1)如果相似度接近100%,那我们断定,就是这个人(2)如果相似度较高,根据新的特征,那我们推测,这哥们可能是被揍了,或者化妆了(3)如果相似度...

2019-08-19 16:35:58 128

原创 爬虫——拉勾网职位需求采集项目

拉勾网职位需求采集项目需求分析知己知彼,方可百战不殆。在学习技术的时候我们往往面临太多选择而不知所措,可能是各个方面都有涉猎,对某个领域没有深入研究,看似什么都会,真要让你做个什么东西的时候就显得捉肘见襟。如果我们能从招聘职位所需的技能开始学习,便可练就一身硬功夫,为实战应用中打下良好的基础。通过python抓取拉钩网的招聘详情,并筛选其中的技能关键词,存储到 excel 中。项目简介...

2019-08-19 16:01:01 281

原创 机器学习——验证码

import randomfrom PIL import ImageDraw, Image, ImageFontdef getRandomStr():random_num = str(random.randint(0, 9))return random_numdef getRandomColor():font_color = [random.randint(0,255), random...

2019-08-12 16:39:44 304

原创 机器学习——聚类

文章目录聚类距离的概念欧几里得距离曼哈顿距离闵可夫斯基距离相似度推荐系统相似度聚类K-Means聚类K-Means 改进K的选择Canopy聚类层次聚类层次聚类谱和谱聚类谱聚类PCA降维谱聚类聚类距离的概念欧几里得距离曼哈顿距离闵可夫斯基距离相似度推荐系统用户实际喜欢 [8, 9, 17, 25, 4]给用户的推荐 [9, 10, 17, 24, 4, 8] ...

2019-08-12 16:20:32 199

原创 机器学习——决策树

决策树决策树案例分析: 离散化数据类型决策树生成计算纯度的方式基尼系数决策树的分割方式:非线性随机森林随机森林VS逻辑回归剪枝决策树做回归决策树逻辑回归是一种线性有监督离散型分类模型决策树是一种非线性有监督离散型分类模型逻辑回归对于非线性的解决方案:映射到高维案例分析: 离散化数据类型离散的数据 需指明取值数量 2^M 种分割方式天气 : 晴天 雨天 多云学历: 高中 ...

2019-08-12 15:37:30 109

原创 爬虫基础

文章目录通用爬虫和聚焦爬虫通用爬虫爬虫限制局限性聚焦爬虫HTTP和HTTPS浏览器发送请求URL客户端HTTP请求请求方法GET 和POST 详解请求报头HTTP响应响应状态码Cookie和Session图片下载器通用爬虫和聚焦爬虫根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种.通用爬虫通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。...

2019-08-08 11:01:43 91

原创 机器学习————逻辑回归练习(音乐分析)

文章目录音乐分类音乐分类有一家音乐app公司希望我们提供一个音乐分类器,他们希望得到的结果是:输入一首歌,可以对输入的歌曲进行分类import numpy as npfrom sklearn.linear_model import LogisticRegressionfrom scipy import fftfrom scipy.io import wavfilefrom tqd...

2019-08-05 17:38:25 356

原创 机器学习—逻辑回归

文章目录逻辑回归逻辑回归的引入更新的模型:更新的模型:决策边界非线性决策边界熵逻辑递归的损失函数逻辑回归有监督机器学习线性回归:预测一个连续的值逻辑回归:预测一个离散的值逻辑回归的引入良性肿瘤 and 恶性肿瘤有一家医院希望我们能开发出一款分类器,可以通过数据分析出一块肿瘤到底是良性的,还是恶性的当我们要做二分类的时候,我们一般只希望得到两个值 y = 0 或 1但是, 线性回...

2019-08-05 16:58:44 126

原创 机器学习—线性回归

文章目录线性回归线性回归一般步骤损失(代价)函数梯度下降多变量线性回归特征缩放(归一化)随机梯度下降和‘Mini-batch’梯度下降‘Mini-batch’梯度下降线性回归大自然让我们回归到一定的区间范围之内;反过来说就是,有一个平均的水平,可以让突出的事物能向他靠拢那些高个子的后代的身高,有种回归到大众身高的趋势 ...

2019-08-05 15:26:58 108

原创 简单机器学习和NLP基础

文章目录机器学习基本概念简单的机器学习流程训练集/验证集(开发集)/测试集有监督机器学习和无监督机器学习机器学习VS人类学习NLP基础把评论翻译成机器看的懂的语言使用机器看的懂得算法轮询去比较每一条和所有评论的相似程度(TF-IDF)TF-IDF练习机器学习基本概念训练集/验证集(开发集)/测试集有监督机器学习和无监督机器学习常见的机器学习算法机器学习vs人类学习简单的机器学习流程...

2019-08-05 14:34:14 611

原创 JavaScript

文章目录JavaScriptJavaScript 函数和事件语法声明变量运算符比较运算符if 语句实例函数定义事件DOMJavaScriptJavaScript 是属于 HTML 和 Web 的编程语言。<script> 标签在 HTML 中,JavaScript 代码必须位于 <script> 与 </script> 标签之间。JavaScrip...

2019-08-02 17:08:25 80

原创 前端学习练习

html 中 title 属性和 alt 属性的区别?请说出几个常用的块级元素和行内元素.介绍一下 CSS 的盒子模型?JavaScript 里有哪些数据类型JS 怎么实现一个类。怎么实例化这个类。请列举五个常用的 Javascript DOM 方法1.导航栏:网站使用导航栏是为了让访问者更清晰明朗的找到所需要的资源区域,寻找资源。设置导航栏如下:<!DOCTYPE h...

2019-08-02 16:53:44 135

原创 HTML-jQuery

文章目录jQueryjQuery介绍jquery加载jQuery选择器基本选择器选择器修饰过滤选择器函数过滤选择器转移操作行间样式操作样式类名jQuery属性操作设置html内同设置属性值绑定click事件jquery特殊效果应用实例二级联动jQueryjQuery介绍jQuery是目前使用最广泛的javascript函数库。据统计,全世界排名前100万的网站,有46%使用jQuery,远远...

2019-08-02 15:20:34 91

原创 CSS层叠样式表

文章目录CSS层叠样式表CSS介绍基本语法内联式嵌入式外联式常用CSS样式文本设置颜色表示基本选择器标签选择器id选择器类选择器层级选择器组选择器伪类及伪元素选择器盒子模型CSS浮动典型布局案例![在这里插入图片描述](https://img-blog.csdnimg.cn/20190802150442996.png?x-oss-process=image/watermark,type_ZmFuZ...

2019-08-02 15:08:50 170

原创 HTML超文本标记语言

HTML超文本标记语言HTMLWeb前端开发介绍Web概述Web起源Web特点Web工作原理URL介绍HTML网页结构HTML基本结构目前常用的两种文档类型是xhtml 1.0和html5HTML文档规范与注释HTML注释HTML标签文本标签![在这里插入图片描述](https://img-blog.csdnimg.cn/20190802142533408.png)列表标签div与span标签图片...

2019-08-02 14:40:46 269

原创 python网络编程练习

一. 常见网络编程面试题目1.简述 OSI 七层协议。1、物理层为数据链路层提供物理连接,实现比特流的透明传输,所传输数据的单位是比特,该层定义了通信设备与传输线接口硬件的电气、机械以及功能和过程的特性。2、数据链路层在通信的实体之间建立数据链路连接,传送以帧为单位的数据,通过检查发生在连接通信系统间传送路上的比特错误并进行恢复,确保比特序列组成为数据流准确无误地传送给对方的系统。数据链...

2019-07-24 15:57:28 1240

原创 python网络编程

网络通信概述⽤⽹络能够把多⽅链接在⼀起,然后可以进⾏数据传递⽹络编程就是,让在不同的电脑上的软件能够进⾏数据传递,即进程之间的通信TCP/IP协议有的说英语,有的说中⽂,有的说德语,说同⼀种语⾔的⼈可以交流,不同的语⾔之间就不⾏了 为了解决不同种族⼈之间的语⾔沟通障碍,现规定国际通⽤语⾔是英语,这就是⼀个规定,这就是协议.网络通信协议问题: 不同种类之间的计算机到底是怎么进⾏数据传递...

2019-07-24 10:54:17 87

原创 python多线程编程

IP 地址归属地批量查询任务注意: 使用创建子类的方式实现多线程任务 import requests import json import threading import time import random import pymysql import multiprocessing from threading import Thread class Get_ip...

2019-07-22 17:09:47 67

原创 python Redis编程

Redis简介NoSQL,全名为Not Only SQL,指的是非关系型的数据库随着访问量的上升,网站的数据库性能出现了问题,于是NoSQL被设计出来Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API并提供多种语言的 API的非关系型数据库。Github 源码:https://github.com/ant...

2019-07-22 16:47:31 62

原创 python多任务编程

多任务编程多任务就是操作系统可以同时运⾏多个任务。打个 ⽐⽅,你⼀边在⽤浏览器上⽹,⼀边在听MP3,⼀边在⽤Word赶作业,这就是多任务,⾄少同时有3个任务正在运⾏。还有很多任务悄悄地在后台同时运 ⾏着,只是桌⾯上没有显示⽽已。操作系统轮流让各个任务交替执⾏,每个任务执⾏0.01秒,这样反复执⾏下去。 表⾯上看,每个任务交替执⾏,但CPU的执⾏速度实在是太快了,感觉就像所有任务都在同时执⾏⼀...

2019-07-22 16:34:25 199

原创 Python贪心算法

贪心算法贪心算法在对问题求解时,总是作出在当前看来是最好的选择。也就是说,不从整体上加以考虑,它所作出的仅仅是在某种意义上的局部最优解(是否是全局最优,需要证明)。最优装载问题有一天海盗们截获了一艘装满各种各样古董的货船,每一件都价值连城,一旦打碎就是去了价值,海盗船载重量为C,每件固定的重量为wi,海盗们该如何尽可能装载最多数量的古董呢?算法设计古董重量清单:船载重量固定为...

2019-07-19 01:58:33 799

原创 Python动态规划

动态规划动态规划动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。科技公司面试必考算法题目类型多, 没有固定的模板难度属于中上动态规划之Fib数列问题描述有个小孩上楼梯,共有N阶楼梯,小孩一次可以上1阶,2阶。走到N阶楼梯,一共有多少种走法?思路分析DP之自顶向下分析方式:爬到第N阶楼梯,...

2019-07-19 01:54:23 963

原创 Python链表

链表链表顺序表的构建需要预先知道数据大小来申请连续的存储空间,而在进行空充时又需要进行数据的搬迁,所以使用起来并不是很灵活。链表结构可以充分利用计算机内存空间,实现灵活的内存动态管理。链表(Linked List)是一种常见的基础数据结构,是一只种类线性表,但是不像顺序表一样连续存储数据,而是在每一个节点(数据存储单元)里存放下一个节点的位置信息(即地址)。单链表单向链表也叫单...

2019-07-19 01:25:02 66

原创 Python顺序表

数据表数据结构问题 —> 数据结构+算法 == 程序 —> 解决问题算法是为了解决实际问题而设计的,数据结构是算法需要处理的问题载体 Python提供现成的数据结构类型叫做Python的内置数据结构,比如列表、元组、集合,字典。Python系统里面没有直接定义需要自定义的称为Python的扩展数据结构,比如栈,队列等。顺序表的基本形式顺序表,将元素顺序地存放在一块连续的...

2019-07-18 20:53:37 124

原创 python_数据结构与算法

数据结构与算法算法什么是算法 数据结构和算法是一名程序开发人员的必备基本功,不是一朝一夕就能连就成功的。需要我们平时去不断练习和学习积累算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。对于算法而言,实现的语言并不重要,重要的是思想。算法可以有不同的语言描述实现版本(如C描述、C++描述、Java描述...

2019-07-18 20:21:10 56

原创 Python————数据结构与算法练习

单链表class Node(object): def __init__(self, element): self.element = element self.next = Noneclass SingleLink(object): def __init__(self): self.head = None def i...

2019-07-18 20:14:54 860

原创 Python练习

import oskey = ['学号','姓名','年龄','性别','出生年月','地址','电话','E-mail','其他']class student(object): def open_file(): with open('information.txt', 'a+') as f: pass def add(key): ...

2019-06-27 13:54:11 141

原创 Python面向对象高级特性

面向对象高级特性一、类属性与实例属性什么是类属性?类属性就是类对象所拥有的属性,它被所有类对象的实例对象所共有,在内存中只存在一个副本。什么是实例属性?在前面的例子中我们接触到的就是实例属性(对象属性),它不被所有类对象的实例对象所共有,在内存中的副本个数取决于对象个数。二、静态方法和类方法什么是类方法?类方法是类对象所拥有的方法,需要用修饰器一般以@classmethod来标识其...

2019-06-20 15:38:54 75

原创 python面向对象练习实现双人小游戏

"""作业: 1). 实现游戏重新开始的按钮; 2). 实现一个双人游戏;""" import randomimport timeimport pygameimport sysfrom pygame.locals import * # 导入一些常用的函数width = 640height = 480pygame.init()screen = pygame...

2019-06-20 15:36:23 2286 1

原创 python面向对象,基础回顾

1.队列数据结构的封装队列类。队列(queue)是具有先进先出(FIFO)特性的数据结构。一个队列就像是一行队伍,数据从前端被移除,从后端被加入。这个类必须支持下面几种方法:功能:class Queue(object):def init(self):self.__queue = [] def enqueue(self,n): self.__queue.ap...

2019-06-13 14:38:55 133

原创 面向对象编程三大特性

对象和类 类(Class)是现实或思维世界中的实体在计算机中的反映,它将数据以及这些数据上的操作封装在一起。 对象(Object)是具有类类型的变量。类和对象是面向对象编程技术中的最基本的概念。 如何定义类? class 类(): pass如何将类转换成对象?实例化是指在面向对象的编程中,把用类创建对象的过程称为实例化。是将一个抽象的概念类,具体到该类实物的过程...

2019-06-13 13:46:21 901

原创 python面向对象

向对象编程介绍面向过程编程“面向过程”(Procedure Oriented)是一种以过程为中心的编程思想。这些都是以什么正在发生为目标进行编程,不同于面向对象的是谁在受影响。与面向对象明显的不同就是封装、继承、类。面向过程编程的特性特性:模块化 流程化优点:性能比面向对象高, 因为类调用时需要实例化,开销比较大,比较消耗资源;单片机、嵌入式开发、Linux/Unix等一般采用面...

2019-06-13 13:37:34 70

原创 pyhon_高级特性_练习

一. 记录日志装饰器练习题好的日志对一个软件的重要性是显而易见的。如果函数的入口都要写一行代码来记录日志,这种方式实在是太低效了。 那么请你创建一个装饰器, 功能实现函数运行时自动产生日志记录。 日志格式如下:程序运行时间 主机短名 程序名称: 函数[%s]运行结果为[%s]产生的日志文件并不直接显示在屏幕上, 而是保存在 file.log 文件中, 便于后期软件运行结果的分析.im...

2019-06-06 11:13:48 164

原创 python模块与包

模块模块就是工具包,要想使用这个工具包中的工具(就好比函数),就需要导入这个模块模块是非常简单的Python文件,单个Python文件就是一个模块,两个文件就是两个模块。如何导入模块当解释器遇到import语句,如果模块在当前的搜索路径就会被导入为什么必须加上模块名调用呢?因为可能存在这样一种情况:在多个模块中含有相同名称的函数,如果只是通过函数名来调用,解释器无法知道到...

2019-06-05 22:29:46 103

原创 python文件_练习

import osdir = '/home/hyj/Desktop/test'dir_name = os.listdir(dir)for name in dir_name: new_name = dir + '/[westos]-' + name os.rename((dir + '/' +name),new_name)print(os.listdir(dir))读...

2019-05-30 21:43:50 748

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除