9 William_Dong

尚未进行身份认证

我要认证

Focus on machine learning, data mining, and text mining. Research about text mining and social media analytics.

等级
TA的排名 4w+

python有意思的eval函数

eval()函数作用:自动去掉字符串两侧的引号,将字符串转为python语句,即字符串转命令,然后执行转化后的语句例子1:a = 1b = 2c = eval("a+b")print(c)#输出为3例子2:c = eval('pow(2,2)')print(c)#输出为4...

2020-03-27 16:06:34

RNN序列模型介绍

5.1 序列模型5.1.1 RNN结构介绍在CNN模型中一定是要求固定长度的输入和输出,而RNN单元的内部结构如下图所示。RNN序列是可以有多种结构的,并且每种结构下又可以有多种变体。One-to-n的结构如下,圆圈或是方块表示的是向量,一个箭头就表示对该向量做一次变换。 one-to-n 的结构可以用来从图像生成文字...

2020-01-03 01:11:07

召回率recall精确率precision准确率accuracy一句话解释

准确率(accuracy):在总样本(全部正样本和负样本)中,预测正确的正样本和负样本的比例。召回率 (Recall):在所有正样本中你预测对了多少(正样本有多少被找出来了,即召回了多少)。精确率 (Precision):你认为的正样本,有多少预测对了。...

2019-12-25 12:08:46

boost编译libboost_python3解决PyClass_Type未定义错误

linux系统自带的是python2.7,boost直接编译会变成libboost_python2.7.这时如果你用的是python3执行,那就会出现未定义的符号:PyClass_Type这个错误,因而需要编译boost的python3版本下面是编译libboosr_python3.7的步骤:(1)下载boost并解压进到boost_1_67_0编译并安装boost(2)编译步...

2019-12-11 12:12:47

Softmax分类器与cross entropy损失函数

1. Logistic regression模型我们先看下logistic regression模型及损失函数。有m个样本,,。Logistic regression采用的sigmoid函数是损失函数为:2. Softmax回归模型Softmax回归用于多类分类,假设有k个分类,则其中1/ 是为了归一化。3. 损失函数Logistic regression...

2019-10-18 11:29:01

Batch Normalization介绍及其在权重初始化中的作用

1. Batch Normalization(Batch Normalization是由Sergey Ioffe et al.在2015年提出)机器学习假设training data和testing data是IID独立同分布,从而在testing data上有很好的效果。实际应用会出现Internal Covariate Shift问题。Batch Normalization(2014年...

2019-10-18 11:09:38

windows下pip升级出错然后pip找不到了解决方案

参考链接:https://www.cnblogs.com/Teachertao/p/11027886.html正是我遇到的问题。1、pip的版本为 9.0.3 想用 pip install -U pip 更新下包,但是在更新过程中出现了报错,如下所示:2、然后尝试用pip install pandas包,提示 ModuleNotFoundError: No module na...

2019-09-19 00:32:56

CMake引入opencv编译时includes non-existent path问题解决

在用opencv时编辑CMakeLists.txt时添加下面一句find_package( OpenCV 3.3 REQUIRED )然后就会报下面的错误CMake Error in CMakeLists.txt: Imported target "opencv_calib3d" includes non-existent path "/usr/local/include...

2019-08-31 15:18:28

Requests后用Beautifulsoup找不到指定元素(原来是页面元素被注释)

这个问题是在Requests抓取百度贴吧内容列表时出现,可能在抓取其他某些网页时也会出现这个问题。在用Requests时大家习惯加上header,这个header往往是Chrome的header。但是加了这个header就会导致页面中大部分html标签被放在了注释里面,后面用Beautifulsoup的find或是select都找不到对应的标签。head = {'User-Agent':...

2019-03-01 15:01:31

Bug解决windows及linux下安装python igraph库报错 Cannot find the C core of igraph

一、首先针对windows电脑的报错pypi网站有多个python igraph的版本通常是下载第二或第三个,但如果电脑没有C编译器的话,使用pip install *.whl文件或是python setup.py install源码都会报以下错误: 尝试了很多人的建议都还是装不成功,最终从https://www.lfd.uci.edu/~gohlke/pythonlibs...

2018-11-22 18:40:28

Gini和AUC的关系(Gini=2AUC-1真的成立吗?)

在做信用评分卡研究时,除了用KS/AUC指标,还经常见到基尼系数(gini coefficient)。gini系数通常被用来判断收入分配公平程度。  图.洛伦茨曲线与基尼系数  Gini coefficient 是指绝对公平线(line of equality)和洛伦茨曲线(Lorenz Curve)围成的面积与绝对公平线以下面积的比例,即gini coefficient = A面积 / ...

2018-10-31 09:54:41

pymysql pymysql.err.OperationalError 1045 Access denied最简单解决办法

我使用的是python3.6+pymysql+mysql8.0在cmd命令行直接输入mysql回车出现:ERROR 1045 (28000): Access denied for user 'ODBC'@'localhost' (using password: NO)这时在cmd命令行输入mysql -u root -p 回车输入密码,就可以成功连接数据库但用pymysql登陆报错...

2018-05-10 20:27:12

Selenium动态爬虫页面元素无法点击报WebDriverException

亲测以下链接给的第一点和第三点建议非常有用,第二点没试。特转过来。原文链接    https://blog.csdn.net/lyl_7310/article/details/78532628报错selenium.common.exceptions.WebDriverException: Message: Element is not clickable at point (234.75, 22)...

2018-04-26 10:03:43

Python有意思的lambda

lambda的本质是以表达式的形式定义一个匿名函数。lambda的作用是简化了函数定义的书写形式,使得代码更为简洁。注意:(1)lambda并不是一个必要的方法,可以使用函数或其他替代。          (2)lambda并不会提高计算效率。          (3)如果可以用for ...  in  ...  if ... 完成的功能就不用lambda下面介绍下lambda方法 : g = l...

2018-04-11 01:28:12

Python有意思的defaultdict方法

本文主要参考最下面的网页,简单做个提炼。defaultdict主要解决在创建的dict为空时的赋值问题。(1)dict.setdefault()方法当不用defaultdict方法时,可用dict.setdefault()方法替代下面使用参考资料中的例子举例。例子是用来统计数组中每个词出现的次数。setdefault(kw,0)方法可在dict中没有kw这个key的时候,将这个key的value设...

2018-04-11 01:11:40

python有意思的yield

yield主要使用在遍历、迭代等会占用较大内存的地方。yield 的作用就是把一个函数变成一个 generator,带有 yield 的函数不再是一个普通函数,Python 解释器会将其视为一个 generator。调用这个generator function的时候,返回的是一个 iterable 对象!在 for 循环执行时,每次循环都会执行generator函数内部的代码,并返回一个yield...

2018-04-11 00:08:30

Python列表list排序

list排序共有四种方法。1. list[::-1]list的三个参数是:起点,终点,步长。可以缺省。因此,list[::-1]对应的三个参数依次是:第一个参数是起点;第二个参数是终点;第三个参数为-1,其中负数表示从起点到终点位置是倒着取数的,1表示一次减少一个。举例 a=[0,1,2,3,4,5,6,7,8,9]a[:] #是[0,1,2,3,4,5,6,7,8,9]a[::] #是[0,1,...

2018-04-10 19:31:21

Python3 Selenium+ChromeDriver抓取动态网页

以前抓取动态网页是用PhantomJS + Selenium + ChromeDriver,但是新版的Selenium不支持PhantomJS了,程序跑的时候总会跳出一些warnings.现在的操作是放弃PhantomJS,直接用headless ChromeDriver。可直接在Google主页下载个ChromeDriver,都是支持headless的。下面的程序就是启动driver,抓取数据,...

2018-03-30 19:08:30

Python3 request抓取网页内容乱码解决方案

下面的解决方案也是参照网上其他人的总结,放在这里方面自己日后查看。 # --- 百度搜索框默认是GBK编码 orgName_gbk = orgName.encode('gbk') orgName_gbk = urllib.parse.quote(orgName_gbk) search_url = 'https://zhidao.baid...

2018-03-29 16:41:30

深度学习之一:CNN初见

本篇是转载以下链接的网址,对CNN有很直观的介绍http://www.36dsj.com/archives/420651,BP算法2,激励函数3,正则化与交叉验证等其他防止过拟合的方法BP神经网络在之前的工作中取到了不错的效果,但是在Micheal Nilson的数的第五章,描述了之前的神经网络在增加多个隐含层之后训练效果会大大下降,也就是说,对

2017-06-06 19:46:33

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。