4 南方的孩子

尚未进行身份认证

我要认证

与有肝胆者共事,从无字句处读书

等级
TA的排名 16w+

程序员实用工具网站

目录1、搜索引擎2、PPT3、图片操作4、文件共享5、应届生招聘6、程序员面试题库7、办公、开发软件8、高清图片、视频素材网站 9、项目开源10、算法11、在线工具宝典大全程序员开发需要具备良好的信息检索能力,为了备忘(收藏夹真是满了),将开发过程中常用的网站进行整理。1、...

2019-12-21 10:01:15

如何将请求时的参数或者包体快速转换成字典形式

以百度搜索csdn为例# url后的参数如下s = """ie: utf-8f: 8rsv_bp: 1rsv_idx: 2tn: baiduhome_pgwd: csdnrsv_spt: 1oq: %E5%AF%8C%E5%AE%9D%E8%A2%8Brsv_pq: b95cb2150002353brsv_t: 6094e1L3QavAxng0GfZWmvEHgI+Cyt3...

2019-12-10 14:53:06

Pandas函数之数据筛选与清洗函数

文章目录数据筛选函数数据清洗函数拼接concatmergejoin缺失值、重复值处理str & dt数据筛选函数函数解释loc根据行列名筛选数据,第一个参数是行名,第二个参数是列名iloc根据行列号筛选数据,第一个参数是行号,第二个参数是列号isin()传入一个列表,判断DadaFrame或者Series是否包含列表中的元素between()...

2019-12-05 19:19:29

Xpath——text()内容定位

<html lang="en"><head> <meta charset="UTF-8"> <title>Title</title></head><body> <div class="class1"> <div class="class2"> ...

2019-12-04 10:20:30

Pandas函数之统计函数

文章目录基本统计函数高级统计函数部分一部分二基本统计函数函数描述sum()所有值的和,默认对列操作count()非空的数量,默认对列操作mean()平均值,默认对列操作median()中位数,默认对列操作std()标准差,默认对列操作max()最大值,默认对列操作min()最小值,默认对列操作describe()描述...

2019-11-27 09:12:40

偏度与峰度

偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩。偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏分布(也叫负偏分布,其偏度<0)。Python代码实现方法:pandas的Series 数据结构可以直接调用skew()方法来查看df.iloc[:,1].skew(...

2019-11-26 11:05:11

markdown字体颜色,背景颜色

Markdown 常用技巧1.字体、字号与颜色Markdown是一种可以使用普通文本编辑器编写的标记语言,通过类似HTML的标记语法,它可以使普通文本内容具有一定的格式。但是它本身是不支持修改字体、字号与颜色等功能的!  CSDN-markdown编辑器是其衍生版本,扩展了Markdown的功能(如表格、脚注、内嵌HTML等等)!对,就是内嵌HTML,接下来要讲的功能就需要使用内嵌HTML的...

2019-11-26 10:16:47

mongo之python操作

连接MongoDBmongodb://[username:password@]host1[:port1][,host2[:port2],...[,hostN[:portN]]][/[database][?options]][]的参数均为可选项若不指定端口,默认为27017import pymongoclient = pymongo.MongoClient('mongodb://lo...

2019-11-21 17:07:12

mongo入门之基本准备

简介MongoDB是有C++编写,是一个基于分布式文件存储的开源系统MongoDB将数据存储为一个文档,数据结构由键值(key-value)对组成。MongoDB文档类似于JSON对象。字段值可以包含其他文档,数组及文档数组MySql与MongoDB术语对比mysqlmongodb解释说明databasedatabase数据库tablecollecti...

2019-11-21 17:05:29

猫眼爬虫-字体加密

引言最近又爬了一次猫眼的票房数据,发现其字体加密手段又加强了,在此记录一下分析字体源下载字体文件​ 从此处可以得到字体文件链接,下载下来分析字体文件不难发现每次请求,都会随机匹配一个字体文件先用fontEditor打开看看对比两次请求的字体文件,并无规律可寻利用TTfont将字体文件转成xmlfont = TTFont(woff_file)font.s...

2019-10-27 23:48:17

猫眼-字体训练

工具JDK,jTessBoxEditor是运行在java环境上的jTessBoxEditor:下载链接http://down2.opdown.com:8019/opdown/jTessBoxEditor.zip,下载解压,双击train.bat准备训练数据两份字体文件的数字图像操作步骤​ Tools -> Merge TIFF生成tif文件全选,点击打开tif...

2019-10-27 23:43:57

梯度下降法

不是一个机器学习算法是一种基于搜索的最优化方法作用:最小化一个损失函数梯度上升法:最大化一个效用函数使用梯度下降法前,最好进行数据归一化,提高效率代价函数损失函数:计算的是一个样本的误差代价函数:是整个训练集上所有样本误差的平均最小二乘法真实值y,预测是hθ(x),则误差平方为(y−hθ(x))2真实值y,预测是h_\theta(x),则误差平方为(y-h_\t...

2019-10-09 00:48:31

逻辑回归

文章目录逻辑函数(sigmoid函数)二分类损失函数梯度下降代码实现解决多分类OvROvO逻辑回归中的模型正则化逻辑回归既可以看做时回归算法,也可以看做是分类算法通常作为分类算法用,理论上只能解决二分类问题逻辑函数(sigmoid函数)σ(t)=11+e−t\sigma(t) = \frac{1}{1+e^{-t}}σ(t)=1+e−t1​二分类p(y=1∣x,w)=11+e−...

2019-10-07 02:05:42

模型评估指标

回归模型评估指标均方误差(MSE)MSE=1m∑i=1m(ytest(i)−y^test(i))2MSE = \frac{1}{m}\sum_{i=1}^{m}(y_{test}^{(i)} - \hat{y}_{test}^{(i)})^2MSE=m1​i=1∑m​(ytest(i)​−y^​test(i)​)2from sklearn.metrics import mean_squa...

2019-10-07 01:38:30

线性回归

优点:具有很强的解释性一元线性回归一个自变量和一个因变量,两个变量之前的关系用一条直线来模拟hθ(x)=θ0+θ1x,其中θ1=∑i=1m(x(i)−x‾)(y(i)−y‾)∑i=1m(x(i)−x‾)2,θ0=y‾−θ1x‾h_\theta(x) = \theta_0+\theta_1x,其中\theta_1 = \frac{\sum_{i=1}^{m}(x^{(i)} -...

2019-10-07 01:32:48

selenium

selenium是一个浏览器自动化测试框架chorm浏览器驱动下载http://chromedriver.storage.googleapis.com/index.htmlchorm浏览器版本与驱动映射关系https://blog.csdn.net/zbj18314469395/article/details/100560044相关方法find_element_by_id...

2019-10-07 01:24:07

哈夫曼编码

如字符串为acbacdccbadcbbc,设计哈夫曼编码。首先统计每个字符出现的个数a:3b:4c:6d:2构建哈夫曼树(每次都选择最小的两个节点,默认左节点比右节点小)则每个字符的编码分别为:a:111b:10c:0d:110

2017-06-06 18:55:33

分支限界——01背包问题

回溯法采用的是深度优先搜索,而分支限界采用的则是广度优先搜索。  分支限界法的搜索策略是,在扩展结点处,先生成其所有的儿子结点(分支),然后再从当前的活结点表中选择下一扩展结点。为了有效地选择下一扩展结点,加速搜索的进程,在每一个活结点处,计算一个函数值(限界),并根据函数值,从当前活结点表中选择一个最有利的结点作为扩展结点,使搜索朝着解空间上有最优解的分支推进,以便尽快地找出一个最优解。

2017-06-06 17:46:41

回溯法——01背包问题

问题不多描述直接说思路:构造解空间树。在搜索解空间树时,只要左子节点是可一个可行结点,搜索就进入其左子树。对于右子树时,先计算上界函数,以判断是否将其减去。代码如下:(Java实现)import java.util.Scanner;public class Knapsack { static int W;//箱子容量 static int n;//物品数量 static in

2017-06-02 17:00:24

贪心算法——活动安排

问题描述:活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合,是可以用贪心算法有效求解的很好例子。该问题要求高效地安排一系列争用某一公共资源的活动。贪心算法提供了一个简单、漂亮的方法使得尽可能多的活动能兼容地使用公共资源。思路:先将活动按结束时间非递减进行排序,然后每一次贪心选择满足条件的最小结束时间的活动代码如下:(java实现)import java.util.Scann

2017-06-01 11:16:04

查看更多

勋章 我的勋章
  • 签到达人
    签到达人
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv1
    阅读者勋章Lv1
    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。