自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 资源 (13)
  • 收藏
  • 关注

原创 supervisor安装使用

安装 pip install supervisor配置### 首先切换到root用户sudo su root### 生成配置文件,且放在/etc目录下echo_supervisord_conf > /etc/supervisord.conf ###为了不将所有新增配置信息全写在一个配置文件里,这里新建一个文件夹,每个程序设置一个配置文件,相互隔离mkdir /...

2020-04-23 19:50:13 1841

原创 pycharm 快速导包/导包快捷键

alt + 回车

2020-04-10 15:00:01 21532 1

原创 ImportError: pycurl: libcurl link-time ssl backend (openssl) is different from compile-time ssl back

首先尝试重新安装解决pip uninstall pycurlexport PYCURL_SSL_LIBRARY=opensslpip install pycurl但是这里有一个坑:在高版本的mac系统环境变量里是找不到openssl的头文件的pip uninstall pycurl# 卸载库export PYCURL_SSL_LIBRARY=opensslexport LDFLAG...

2019-12-31 16:05:16 2841

原创 元类实现单例模式

# -*- coding:utf-8 -*-class Singleton(type): """ 单例模式 e.g. #Python2 class MyClass(BaseClass): __metaclass__ = Singleton #Python3 class MyClass(BaseClass, ...

2019-12-19 22:34:47 261

原创 MySQL-python安装不成功 ERROR: Command errored out with exit status 1: python setup.py egg_info Check the

报错信息 ERROR: Command errored out with exit status 1: command: /Users/liuzh/Documents/tiger/auth_guardian/venv/bin/python -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/private/tmp/p...

2019-12-17 20:22:34 9644

转载 通俗理解@functools.wraps()

功能Python装饰器(decorator)在实现的时候,被装饰后的函数其实已经是另外一个函数了(函数名等函数属性会发生改变),为了不影响,Python的functools包中提供了一个叫wraps的decorator来消除这样的副作用。写一个decorator的时候,最好在实现之前加上functools的wrap,它能保留原有函数的名称和函数属性不加wrapsdef my_decorato...

2019-12-17 20:03:22 13834 2

原创 1205 - Lock wait timeout exceeded; try restarting transaction, Time:

解决办法:– 查询被锁语句select * from information_schema.innodb_trx– 我们可以用下面三张表来查原因:-- innodb_trx 当前运行的所有事务-- innodb_locks 当前出现的锁-- innodb_lock_waits 锁等待的对应关系– 找到trx_mysql_thread_idkill 738178711– 查询...

2019-11-14 14:44:02 209

原创 mysql中使用update同时更新多个字段,包括select查询

错误尝试:update 表名 set(字段1,字段2,字段3,...) = (select 数值1,数值2,数值3,...) where 条件 正确方式:# 不使用select情况UPDATE OldData o, NewData n SET o.name = n.name, o.address = n.address where n.nid=234 and o.id=123;...

2019-10-28 16:00:32 90751 5

原创 mysql高性能去重方法

问题描述:由于table中的数据量达到千万级别,使用原来的去重机制(详见https://blog.csdn.net/liuzonghao88/article/details/88822039)性能过低解决方案:新建一个t_copy表结构和原始t表具有相同结构:CREATE TABLE t_copy LIKE t;选择不要删除的行插入与原始表具有相同结构的空表:INSERT INTO ...

2019-10-16 14:35:35 526

原创 可视化python执行过程

http://www.pythontutor.com/

2019-09-12 17:29:34 1241

原创 笔试中python3的标准输入

举个例子:输入1 2 3 4获取输入值List = []try: while True: line = sys.stdin.readline().strip() if line == "": break lines = line.split() List.append([int(lines...

2019-09-07 19:48:10 1274

原创 python中使用进度条

运行代码:import timefrom tqdm import tqdmfor i in tqdm(range(5000)): time.sleep(0.01)效果: 25%|██▌ | 1263/5000 [00:14<00:43, 85.34it/s]

2019-08-19 18:43:31 193

原创 Python发送邮件(smtplib)

import smtplib #加载smtplib模块from email.mime.text import MIMETextfrom email.utils import formataddrimport timemy_sender='发件人邮箱账号' #发件人邮箱账号my_password = '发件人邮箱密码'my_user=['收件人邮箱账号1', '收件人邮箱账号2']...

2019-08-19 15:36:32 881

原创 crontab定时任务实例

需求:每天早上6点运行DailyUpdate.py文件将文件的运行流程写成一个shell脚本DailyUpdate.py所在的路径是/home/BlueRunSpider/qmp/function/API/function/qmp_original_data_build/update/# 创建shell脚本cd /home/BlueRunSpider/qmp/function/API/...

2019-08-08 13:41:09 299

原创 通过url上传图片到oss

通过图片原始url请求图片然后上传到oss中并返回图片新的urlimport ioimport requestsimport oss2'''funtion: 传入image_url和oss文件夹名,上传image到oss,返回新的image_url和状态码'''auth = oss2.Auth('<>', '<>')endpoint = '<&gt...

2019-08-05 14:11:09 4130

原创 python中去除字符串中空格,换行问题

先来说说空格问题吧!如果字符串之间都是标准空格那就很好办了。一句话搞定str = str.replace(" ", "")但是往往有一些情况是,空格不定长,这样上述办法就不好处理了。举个例子:def main(): str = '智普信科技 智能安防云 首页 产品与服务 产品展示 Safirst/初柜 ...

2019-07-23 16:29:25 3419 1

原创 python中解析html中的meta(title,description,keywords)信息

html中的meta信息往往包含title,description,keywords,下面通过BeautifulSoup来解析meta信息from bs4 import BeautifulSoupfrom selenium import webdriverdef main(): driver = webdriver.Chrome() driver.get('https:/...

2019-07-23 14:21:00 3488 1

原创 Python中去除html中的标签,css(style样式)

需求:获取公司官网数据question1:部分网站是通过js动态加载的,如果直接只用requests.get(url),就会出现获取信息不全的问题,举个例子:import requestsdef main(): r = requests.get('https://www.tee.com/index') print(r.text)if __name__ == '__ma...

2019-07-23 13:52:43 6267 2

原创 动手实践bert+BiLstm+crf

网上大部分都是使用ChinaPeoplesDailyNerCorpus语料做的,真正应用到自已的语料和需求中还是有一些坑,这里整理记录一下首先明确语料需要处理成什么格式,贴图理解一下这里面需要搞清楚几点,我们的语料最小粒度是字级别的,然后每句话结束会有一个空行(当年踩过的坑),后面的标记简单科普一下,专业人士直接跳过,大O表示非实体,B-ORD表示机构开头第一个字,I-ORD表示中间,有些预...

2019-06-26 17:08:06 18385 19

原创 解决终端运行代码导包问题ModuleNotFoundError: No module named 'qmp'

问题简述:pycharm运行没有问题的代码,终端运行提示 提示导包问题先来看看目录结构执行命令cd ....../BlueRunSpider/qmp/function/spider/goose3_GASPpython3 main.py 错误信息Traceback (most recent call last): File "main.py", line 4, in <m...

2019-06-21 11:12:24 3922 1

原创 Xpath根据标签包裹的内容定位标签

需求:根据内容 “北京” 定位span标签,然后点击xpath语法:self.driver.find_element_by_xpath('//span[contains(text(), "北京")]').click()

2019-06-21 10:52:21 2381

转载 批量读取数据next_batch()简单实现

def next_batch(train_data, train_target, batch_size): index = [ i for i in range(0,len(train_target)) ] np.random.shuffle(index); batch_data = []; batch_target = []; for i...

2019-06-19 14:45:28 1627

原创 src标签动态传入图片地址

<img src="{{ url_for('static', filename='image/') }}{{ context.projectname + '.png' }}" >

2019-06-14 16:09:04 3913

原创 TensorFlow 多标签转化为one-hot

import tensorflow as tfdef main(): NUM_CLASSES = 2 # 2分类 labels = [0, 1, 1, 0, 1, 0, 1, 0] # sample label batch_size = tf.size(labels) # get size of labels : 8 labels = tf.expand_...

2019-06-14 11:21:13 1463

原创 提取html网页正文信息

最近陆陆续续尝试了一些解析html的方法,场景不同,说不好孰优孰劣,请自行选择版本一(goose):py2版本: https://github.com/grangier/python-goosepy3版本:https://github.com/goose3/goose3版本二(boilerpipe):https://github.com/misja/python-boilerpipe版...

2019-06-11 18:52:35 3563

原创 Python爬虫解决乱码问题

问题原因:爬取的所有网页无论何种编码格式,都转化为utf-8格式进行存储,与源代码编码格式不同所以出现乱码。目前大部分都是utf-8格式或者ISO-8859-1,一部分是gbk格式(会出现乱码),国内网页还没有看到别的编码格式,欢迎补充指正!简单科普一下:  UTF-8通用性比较好,是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。U...

2019-06-04 12:08:30 4627

原创 使用pymysql查询数据库,将结果保存为列表并获取指定元素下标

from pymysql import *from qmp.config import *def main(): conn = connect(host=HOST, port=3306, database=DATABASE, user=USER, password=PASSWORD, charset='utf8') cs1 = conn...

2019-06-04 10:31:17 11439

原创 查看网页源码的编码格式

需求:解析网页数据时偶尔会出现乱码,这是由于编码格式不对导致的,这时我们就需要知道网页源码的编码方式解决办法:以http://stock.jrj.com.cn/2018/12/04000025448047.shtml为例使用谷歌浏览器打开网页右键—>检查点击Console输入document.charset,然后回车运行结果...

2019-06-03 13:04:39 6241

转载 神奇的谷歌最强NLP模型BERT

干货推荐谷歌最强NLP模型BERT如约开源,12小时GitHub标星破1500,即将支持中文

2019-05-21 11:53:55 286

转载 卷积神经网络(CNN)在TensorFlow文本分类中的应用

好文推荐卷积神经网络(CNN)在TensorFlow文本分类中的应用英文原版Implementing a CNN for Text Classification in TensorFlowgithub源码cnn-text-classification-tf

2019-05-07 20:46:28 325

转载 理解NLP中的卷积神经网络(CNN)

好文推荐理解NLP中的卷积神经网络(CNN)英文原版Understanding Convolutional Neural Networks for NLP

2019-05-07 17:15:07 355

转载 完备的 AI 学习路线,最详细的中英文资源整理

干货推荐完备的 AI 学习路线,最详细的中英文资源整理

2019-05-06 10:50:11 308

转载 效果惊人的GPT 2.0模型:它告诉了我们什么

好文推荐效果惊人的GPT 2.0模型:它告诉了我们什么

2019-04-28 13:15:51 1370

转载 BERT大火却不懂Transformer?读这一篇就够了

好文推荐BERT大火却不懂Transformer?读这一篇就够了

2019-04-26 12:22:38 371

转载 放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较

好文推荐放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较

2019-04-25 11:34:50 299

原创 urllib.error.URLError: urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_s

解决方案:全局取消证书验证import sslssl._create_default_https_context = ssl._create_unverified_context

2019-04-24 14:39:43 1995 1

原创 python3使用pymysql操作数据库时字符串中含有单双引号(""/'')的问题

操作之前多加一步转化pymysql.escape_string(str)

2019-04-23 12:23:32 5343

转载 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

干货推荐从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

2019-04-22 11:23:37 270

转载 error: The following untracked working tree files would be overwritten by merge:

问题:运行git pull错误信息:error: The following untracked working tree files would be overwritten by merge:解决办法:git clean -d -fx然后再 git pull

2019-04-19 13:54:57 55939 3

原创 Flask 通过URL传递参数,参数中含有'/'斜杠问题

**问题:**Flask 通过URL传递参数,参数中含有’/'斜杠会出现如下报错信息The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.解决办法:后端接受参数的地方指定类型为path,如下:@bluep...

2019-04-18 13:31:11 6075

深度学习基础

第一、深度学习需要大量的训练数据集 第二、训练深度神经网络需要大量的算力 可能要花费数天、甚至数周的时间,才能使用数百万张图像的数据集训练出一个深度网络。所以深度学习通常 需要强大的GPU服务器来进行计算 全面管理的分布式训练与预测服务——比如谷歌 TensorFlow 云机器学习平台

2019-04-13

数据挖掘基础

机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景。 用在挖掘、预测领域: 应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类… 用在图像领域: 应用场景:街道交通标志检测、人脸识别等等 用在自然语言处理领域: 应用场景:文本分类、情感分析、自动聊天、文本检测等等 当前重要的是掌握一些机器学习算法等技巧,从某个业务领域切入解决问题。

2019-04-13

机器学习基础

机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景。 用在挖掘、预测领域: 应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类… 用在图像领域: 应用场景:街道交通标志检测、人脸识别等等 用在自然语言处理领域: 应用场景:文本分类、情感分析、自动聊天、文本检测等等 当前重要的是掌握一些机器学习算法等技巧,从某个业务领域切入解决问题。

2019-04-13

数据结构基础

如果将开发程序的过程比喻为作战,我们码农便是指挥作战的将军,而我们所写的代码便是士兵和武器。 那么数据结构和算法是什么?答曰:兵法! 我们可以不看兵法在战场上肉搏,如此,可能会胜利,可能会失败。即使胜利,可能也会付出巨大的代价。我们写程序亦然:没有看过数据结构和算法,有时面对问题可能会没有任何思路,不知如何下手去解决;大部分时间可能解决了问题,可是对程序运行的效率和开销没有意识,性能低下;有时会借助别人开发的利器暂时解决了问题,可是遇到性能瓶颈的时候,又不知该如何进行针对性的优化。 如果我们常看兵法,便可做到胸有成竹,有时会事半功倍!同样,如果我们常看数据结构与算法,我们写程序时也能游刃

2019-04-13

python爬虫基础

那么对于一些中小型的公司,没有如此大的用户量的时候,他们该怎么办呢? 1.1 数据的来源 去第三方的公司购买数据(比如企查查) 去免费的数据网站下载数据(比如国家统计局) 通过爬虫爬取数据 人工收集数据(比如问卷调查) 在上面的来源中:人工的方式费时费力,免费的数据网站上的数据质量不佳,很多第三方的数据公司他们的数据来源往往也是爬虫获取的,所以获取数据最有效的途径就是通过爬虫爬取

2019-04-13

前端基础知识

HTML是 HyperText Mark-up Language 的首字母简写,意思是超文本标记语言,超文本指的是超链接,标记指的是标签,是一种用来制作网页的语言,这种语言由一个个的标签组成,用这种语言制作的文件保存的是一个文本文件,文件的扩展名为html或者htm。

2019-04-13

Flask项目详情

Flask诞生于2010年,是Armin ronacher(人名)用 Python 语言基于 Werkzeug 工具箱编写的轻量级Web开发框架。 Flask 本身相当于一个内核,其他几乎所有的功能都要用到扩展(邮件扩展Flask-Mail,用户认证Flask-Login,数据库Flask-SQLAlchemy),都需要用第三方的扩展来实现。比如可以用 Flask 扩展加入ORM、窗体验证工具,文件上传、身份验证等。Flask 没有默认使用的数据库,你可以选择 MySQL,也可以用 NoSQL。 其 WSGI 工具箱采用 Werkzeug(路由模块),模板引擎则使用 Jinja2。这两个也是 Flask 框架的核心。

2019-04-13

django项目

B2B (Business to Business)是指进行电子商务交易的供需双方都是商家(或企业、公司),她(他)们使用了互联网的技术或各种商务网络平台,完成商务交易的过程。电子商务是现代 B2B marketing 的一种具体主要的表现形式。

2019-04-13

django基础

在前后端分离的应用模式中,后端仅返回前端所需的数据,不再渲染HTML页面,不再控制前端的效果。至于前端用户看到什么效果,从后端请求的数据如何加载到前端中,都由前端自己决定,网页有网页的处理方式,App有App的处理方式,但无论哪种前端,所需的数据基本相同,后端仅需开发一套逻辑对外提供数据即可。 在前后端分离的应用模式中 ,前端与后端的耦合度相对较低。 在前后端分离的应用模式中,我们通常将后端开发的每个视图都称为一个接口,或者API,前端通过访问接口来对数据进行增删改查。

2019-04-13

python高级Linux|tcp|线程

1991 年 林纳斯(Linus) 就读于赫尔辛基大学期间,对 Unix 产生浓厚兴趣,尝试着在Minix 上做一些开发工作 因为 Minix 只是教学使用,因此功能并不强,林纳斯 经常要用他的终端 仿真器(Terminal Emulator) 去访问大学主机上的新闻组和邮件,为了方便读写和下载文件,他自己编写了磁盘驱动程序和文件系统,这些在后来成为了 Linux 第一个内核的雏形,当时,他年仅 21 岁! 林纳斯 利用 GNU 的 bash 当做开发环境,gcc 当做编译工具,编写了 Linux 内核,一开始 Linux 并不能兼容 Unix 即 Unix 上跑的应用程序不能在 Linux 上跑,即应用程序与内核之间的接口不一致 一开始 Linux 只适用于 386,后来经过全世界的网友的帮助,最终能够兼容多种硬件

2019-04-13

Python高级HTTP|Mysql

域名是什么呢? 我们在访问一台服务器的时候, 需要记住该服务器的IP地址, 由于IP地址不利于人们记忆, 所以推出的域名技术. 域名是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称, 用于在数据传输时标识计算机的位置. 域名可以用来表示一个单位、机构或可以利用个人在 Internet上 的确定的名称或位置. 域名是惟一的. 客户可以利用这个名字找寻有关的产品和服务信息. DNS 是什么呢? 由于我们用域名来标识计算机的位置, 但是我们前面讲过, 网络上标识主机的唯一标识是IP地址, 所以就需要记录一下, 一个域名和IP地址的对应关系, 这个对应关系就存储在DNS服务器中, 当我们向DNS发出请求时, DNS会返回给我们域名所对应的IP地址.

2019-04-13

python基础

python基础入门,Python的作者,Guido von Rossum(吉多·范·罗苏姆,中国Python程序员都叫他 龟叔),荷兰人。1982年,龟叔从阿姆斯特丹大学获得了数学和计算机硕士学位。然而,尽管他算得上是一位数学家,但他更加享受计算机带来的乐趣。用他的话说,虽然拥有数学和计算机双料资质,他总趋向于做计算机相关的工作,并热衷于做任何和编程相关的事情。

2019-04-13

斯坦福大学 2014 机器学习教程

Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的 知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是 使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而 不是演绎。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网 络搜索,并极大地提高了人类基因组的认识。机器学习是当今非常普遍,你可能会使用这一 天几十倍而不自知。很多研究者也认为这是最好的人工智能的取得方式。在本课中,您将学 习最有效的机器学习技术,并获得实践,让它们为自己的工作。更重要的是,你会不仅得到 理论基础的学习,而且获得那些需要快速和强大的应用技术解决问题的实用技术。最后,你 会学到一些硅谷利用机器学习和人工智能的最佳实践创新。

2019-01-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除