自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Ivan.J的博客

用代码构建世界

  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 Error: Can‘t locate revision identified by ‘xxx‘

错误原因:数据库版本不符合,可能是migration文件夹中的文件有变动但是数据库版本仍旧是原来的解决方法:删除 migration 文件夹,并删除数据库中的alembic_version表重新初始化(init, migrate, upgrade),即可保留原来数据...

2022-02-08 11:55:21 1193

原创 Python爬虫之四:使用BeautifulSoup爬取微博热搜

利用Python爬取微博热搜(一)安装BeautifulSoup模块目前,Beautiful Soup 的最新版本是 4.x 版本,之前的版本已经停止开发了。这里推荐使用 pip 来安装,安装命令如下:pip install beautifulsoup4(二)BeautifulSoup的介绍BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。BeautifulSoup 会帮你节省数小时

2020-11-09 14:03:41 2524

原创 Python爬虫之三:使用requests模块动态爬取微博评论

上个月的时候,周杰伦发了新歌,微博上话题不断,于是博主就想看看大家对于新歌及其MV的看法是怎样的,那怎么获取这些观点呢?经过思考,博主决定使用Python爬虫的方法,获取几个热评的博文进行抓取,把评论抓取下来。抓取其中一条微博评论的代码如下import requestsimport reimport randomimport timeimport codecsfrom json i...

2019-10-08 11:40:06 1483 4

原创 Python学习网站汇总

自己在学习Python期间,查看了很多相关的网站,现拿出来供大家学习参考Python语言学习1.廖雪峰的Python3教程2.python中正确安装对应版本的包-------------python非官方镜像Windows版3.Python 数据结构网站开发:刘江的Django教程网络爬虫1.静觅 崔庆才的个人博客2.Beautiful...

2019-08-30 11:06:05 208

原创 条件随机场(CRF)模型详解

近期做一个小整理,把之前学过的一些模型重新拿出来学习一下。而CRF(Conditional Random Fields,条件随机场)模型是自己了解到的第一批模型之一,所以拿过来复习一下假设你有许多小明同学一天内不同时段的照片,从小明提裤子起床到脱裤子睡觉各个时间段都有(小明是照片控!)。现在的任务是对这些照片进行分类。比如有的照片是吃饭,那就给它打上吃饭的标签;有的照片是跑步时拍的,那就...

2019-08-05 16:06:44 18011

原创 Python爬虫之二:使用requests模块

Python实现爬虫的文件上传、下载,以及同一会话(一)安装requests模块对于python2,直接在命令行输入pip install requestsPython3的话,在命令行输入pip3 install requests如果你使用的电脑只使用了一个版本的Python程序的话,当然只需要使用pip 的命令就好了(二)Python代码的实现代码如下所示...

2019-07-08 11:22:24 139

原创 Python爬虫之一:获取简单的网页源代码

代码可实现获取简单的网页源代码,包括简单的登录、代理、cookies的使用import urllibimport socketfrom urllib import request, parsefrom urllib.request import HTTPPasswordMgrWithDefaultRealm, HTTPBasicAuthHandler, build_opener, Pr...

2019-07-03 10:24:37 2320

原创 深度学习之词向量Word Embedding总结

目录一、Word Embedding介绍二、One-Hot表示三、Distributed 表示四、word2vec表示五、BERT任务六、BERT与其他模型的调用一、Word Embedding介绍 word embedding,又名词嵌入、词向量,在近几年的NLP领域变得越来越热,从概念上讲,它涉及从每个单词一维的空间到具有更低维度的连续向量空...

2019-05-17 17:32:32 2823

原创 Python生成项目依赖requirements及其安装

近期在写一个项目的时候,发现不会把Python项目的依赖包(包括版本)提取出来,生成requirements.txt,于是搜了博客,看到了一个博主的文章,于是学习了一下。Python生成项目依赖requirements使用pip freezepip freeze > requirements.txt这种方式配合virtualenv 虚拟环境才好使,否则把整个环境中的包都列...

2019-04-04 16:15:51 2845

原创 Python基础之数据读取相关操作

在做一些自然语言处理的相关工作时,总是要读取很多不同类型的文件,作为数据方便后面的处理(包括分词、计算词向量等),因此,我受教于本科时期的学长(博客https://me.csdn.net/alanconstantinelau),学习并总结了一些常用的文本的操作函数,方便个人使用和大家学习。(一)Python常用文本操作函数import codecsdef write...

2019-04-01 11:55:30 330

原创 有关算法工程师工作的理解

目前找工作的本科童鞋,目标肯定是算法工程师、数据工程师、数据挖掘等,研究生毕业的童鞋都会去做自然语言处理、深度学习等工作。既然大家目标都是与数据算法相关的职业,那么推荐大家看一下这篇文章 为什么“高大上”的算法工程师变成了数据民工? 如今的程序世界,出现了很多种语言,如一开始的C、C++,后面的Java,乃至现在十分火热的Python。这些语言变得越来越高级,代码写的...

2018-12-13 17:21:31 1667

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除