自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 sublime Text 3实现对java编译执行

简单总结下在Sublime Text 中配置java运行环境 一。安装JDK并配置环境变量 网上有很多教程,也是学习java第一步,这里不介绍。 二。 在JDK的bin目录下,新建runJava.bat文件,内容如下:@ECHO OFF cd %~dp1 ECHO Compiling %~nx1....... IF EXIST %~n1.class ( DEL

2017-09-28 15:00:07 366

原创 前端性能优化之——缓存

*缓存是前端性能优化的重要方式之一。缓存方式有多种,但都不难理解。 实现方式大致分三类:HTTP协议头控制,Dom Storage、AppCache。* 一.HTTP协议头控制 Cache-Control用于控制文件在本地缓存有效时长。 最常见的,比如服务器回包: Cache-Control:max-age=600表示文件在本地应该缓存,且有效时长是600秒(从发出

2017-07-28 13:49:46 4013

原创 js重点浅谈(跨域,作用域和作用域链,闭包,原型和原型链继承)

一.跨域问题的解决方法 啥是跨域: 所有的浏览器都遵守同源策略,保证一个源的动态脚本不能读取或操作其他源的http响应和cookie,这就使浏览器隔离了来自不同源的内容,防止它们互相操作。所谓同源是指协议、域名和端口都一致的情况。 怎么解决跨域问题: 1.第三方网站开启HTTP的Access-Control-Allow-Origin参数 只有当目标页面的response中,包含了 Ac

2017-07-19 17:30:46 3480

原创 前端浏览器兼容之——css hack

一般情况下,我们尽量避免使用CSS hack,但是有些情况为了顾及用户体验实现向下兼容,不得已才使用hack。比如由于IE8及以下版本不支持CSS3,而我们的项目页面使用了大量CSS3新属性在IE9/Firefox/Chrome下正常渲染,这种情况下如果不使用css3pie或htc或条件注释等方法时,可能就得让IE8-的专属hack出马了。方式一:条件注释法这种方式是IE浏览器专有的Hack方式,

2017-07-18 16:50:56 529

转载 搞定python多线程和多进程

1 概念梳理: 1.1 线程1.1.1 什么是线程线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。一个线程是一个execution context(执行上下文),即一个cpu执行时所需要的一串指令。1.1.2 线程的工作方式假设你正在读一本书,没有读完,你想休息一

2017-07-10 13:14:11 3901 1

原创 给Scrapy添加代理

给请求添加代理有2种方式,第一种重写start_request方法,第二种是添加download中间件。下面分别介绍这2种方式。 一.重写start_request方法 比较简单,只是在meta中加了一个proxy代理。然后可以测试了,那么问题来了,我怎么知道我的请求是否带上了代理呢?可以在测试的时候去爬 "http://ip.filefab.com/index.php" 这个网站,它会显示

2017-07-07 17:10:29 10632

原创 Scrapy-redis改造scrapy实现分布式多进程爬取

一.基本原理: Scrapy-Redis则是一个基于Redis的Scrapy分布式组件。它利用Redis对用于爬取的请求(Requests)进行存储和调度(Schedule),并对爬取产生的项目(items)存储以供后续处理使用。scrapy-redi重写了scrapy一些比较关键的代码,将scrapy变成一个可以在多个主机上同时运行的分布式爬虫。 参考Scrapy-Redis

2017-06-21 16:54:44 10485

原创 scrapy-splash爬取JS生成的动态页面

利用scrapy-splash爬取JS生成的动态页面 目前,为了加速页面的加载速度,页面的很多部分都是用JS生成的,而对于用scrapy爬虫来说就是一个很大的问题,因为scrapy没有JS engine,所以爬取的都是静态页面,对于JS生成的动态页面都无法获得。解决方案:利用第三方中间件来提供JS渲染服务: scrapy-splash 等。 利用webkit或者基于webkit库 Splash

2017-06-06 10:14:29 1126

原创 CentOS 6.5安装LAMP,并开启MySQL远程访问

准备: 1、配置防火墙,开启80端口、3306端口vi /etc/sysconfig/iptables-A INPUT -m state --state NEW -m tcp -p tcp --dport 80 -j ACCEPT #允许80端口通过防火墙-A INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCEPT #允许

2017-06-01 16:15:30 755

原创 centos安装MySQLdb,及相关问题解决方法

centos环境Python的MySQLdb安装问题稍多点,整理一下,也方便自己以后查看。1.#sudo yum install gcc-c++(使用sudo yum install gcc-c++时会自动安装/升级gcc及其他依赖的包。)2.#wget http://sourceforge.net/projects/mysql-python/files/mysql-python/1.2.3/M

2017-06-01 13:36:49 477

原创 Centos装完MySQL模块后还是报 No module named MySQLdb错误

我yum,安装MySQL-python模块很简单: # yum install MySQL-python -y 可是执行Scrapy爬虫时依然报 No module named MySQLdb经过一番搜索终于找到问题: 没有安装Python连接MySQL的模块# easy_install MySQL-python完美解决!

2017-05-24 17:24:54 2284

原创 Centos下装Python+Scrapy

我的版本centos6.5,其他版本没试过,应该差不多。 首先确保电脑能上网喔!安下面步骤直接复制粘贴就行。1.#su – root2.#yum install gcc zlib-devel bzip2-devel openssl-devel ncurses-devel libffi-devel libxslt-devel libxml2-devel sqlite-devel3.#cd /us

2017-05-24 17:03:47 701

原创 MySQL中文乱码

mysql中文乱码很可能是在创建数据库和表的时候没有设置字符集为UTF-8 一.创建数据库 CREATE DATABASE db_name DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; “db_name”为你要创建的表名。 在这个库下创建的表默认就会是utf-8

2017-05-24 16:05:05 250

原创 用scrapy写爬虫 显示 Filtered offsite request to 错误.

爬电源网公司信息,无法爬取。 查看控制台发现报如下错误: DEBUG: Filtered offsite request to ‘product.dianyuan.com’: 果断上网百度 ,找到答案 。官方对这个的解释,是你要request的地址和allow_domain里面的冲突,从而被过滤掉。可以停用过滤功能。 yield Request(url, callback=self.

2017-05-20 11:45:17 621

原创 php爬虫模拟浏览器,ini_set()用法

用PHP写爬虫时,会遇到浏览器能打开URL,爬虫却返回不了数据。 这时候就可能是该URL有手机端版本,而PHP默认是不带浏览器信息的,就可能返回的是手机端页面。 可以在程序头部加入: ini_set(‘user_agent’,’Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; 4399Box.560; .NET4.0

2017-05-19 13:33:09 1845

原创 最简单方法将项目上传到github

准备材料: 1.首先你需要一个github账号,所有还没有的话先去注册吧!https://github.com/ 2.我们使用git需要先安装git工具,这里给出下载地址,下载后一路直接安装即可:https://git-for-windows.github.io/ 一.进入Github首页,点击New repository新建一个项目 二.填写相应信息后点击create即可 Repo

2017-05-18 15:36:22 12896 4

原创 在虚拟机VirtualBox中centos6.5网络设置

一,虚拟机网络配置 1.默认只是设置了网卡1:方式NAT(对应ifcfg-eth0) 2.网卡2设置回环网卡,实现虚拟机与宿主机组成局域网(对应ifcfg-eth1),这样即使没有路由器也可以组成局域网,可以进行ssh连接。 需要宿主机安装Microsoft Loopback Adapter。参靠底部附录。 3.网卡3设置连接到互联网,并与宿主机组成局域网(对应ifcfg-eth2)

2017-05-16 14:29:41 1070

原创 用PHP爬取51job上苏州地区的PHP职位信息

用PHP爬取51job上苏州地区的PHP职位信息

2017-04-21 11:23:35 956

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除