4 鱼的一滴泪1990

尚未进行身份认证

暂无相关描述

等级
博文 8
排名 26w+

python +selenium 爬取淘宝网商品信息

前几天用python爬取豆瓣关于电影《长城》的影评,发现豆瓣的网页是静态的,心中一阵窃喜。以为对于动态网页了解的不是太多。但是主要是用cookie加headers爬取的。效果还不错,爬取了六七万条网友的评价,后期主要打算研究一下,如何发现那些用户是水军。今天研究了动态网页的爬取,主要是爬取的淘宝网上商品信息。主要是用到了selenium库。主要是实现一下几个步骤: (注释)用到的pytho

2016-12-31 17:01:49

MATLAB 保存图片变黑色

今天用MATLAB作图,碰到一个问题:想把结果保存成为图片,结果,失望,保存之后打开一片黑色。之后再试了几下,不论是jpg,bmp还是png都不行   只好Google,最后,总算找到答案,原来是着色属性的问题,修改其实很简单:              set(gcf,'Renderer','ZBuffer')    这样,就把属性

2016-12-21 13:12:21

kernel PCA

PCA不进行分类的动作,而只做做数据预处理,将样本变换到一个容易分类(向最大化方差的方向,principalcomponentaxes,投影)的更低维的新的特征空间中。KernelPCA比PCA多了一步,也即先升维(RBF包括多项式核均是升高到无穷维)再进行投影的动作,因为有些非线性可分的数据集只有在升维的视角下才线性可分。PCA均值化的数据: ∑ixi=0#

2016-09-19 18:32:57

python求各种距离公式

今天一个偶然的机会体会到了python数据运算的强大。求一个数组各样本之间的距离仅简单的几句代码就行。看来真的技术改变世界啊。废话不多说,记下来怕以后忘记。fromscipy.spatial.distanceimportpdist,squareform下面结合API文档标注一下具体用法:1.X=pdist(X,'euclidean')计算数组X样本之间的欧式距离返回值为

2016-09-19 17:01:29

快速排序 python

原理讲解转自点击打开链接快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。总的说来,要直接默写出快速排序还是有一定难度的,因为本人就自己的理解对快速排序作了下白话解释,希

2016-08-30 23:01:21

Java+MySql图片数据保存与读取的具体实例

创建表:createtableimg_table(img_idintnotnullauto_incrementprimarykey,img_namevarchar(10)comment'名字',img_datamediumblob):图片流存取工具:packagecom.lijianrong.Mysql.cn;importjava.io.File;

2016-07-17 21:27:11

java 与数据库连接 实现用户的注册和登录

packagecom.lijianrong.Mysql.cn;importjava.awt.*;importjava.awt.event.*;importjavax.swing.*;importjava.util.*;importjava.io.*;importjava.sql.*;/***作者:rong*功能:与数据库中的用户数据进行匹配匹配成功的话显示成

2016-07-17 19:40:17

java 实现简单的日历查询

importjava.text.DateFormat;importjava.text.ParseException;importjava.text.SimpleDateFormat;importjava.util.Calendar;importjava.util.Date;importjava.util.GregorianCalendar;importjava

2016-01-22 20:02:34
奖章
    暂无奖章