自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 leetcode练习10:

解析:解法1:转换为字符串解法2:用数学计算反转class Solution(object): def isPalindrome(self, x): """ :type x: int :rtype: bool """ xx = x if x < 0: ...

2020-02-12 19:39:36 193

原创 leetcode练习5:最长回文子串

题目:思考:1、偶数对称子串和奇数对称子串2、如何记录其中的最大值class Solution(object): def longestPalindrome(self, s): """ :type s: str :rtype: str """ max_l = 0 res =...

2020-02-08 11:34:52 164

原创 leetcode练习2:两数相加

题目二:解答:1、判断链表的长度2、如何增加节点(调用类)3、进位问题,如果进位的下一个节点为空,则必须新添加一个节点# Definition for singly-linked list.# class ListNode(object):# def __init__(self, x):# self.val = x# ...

2020-02-04 19:53:01 198

原创 leetcode刷题:1、两数之和

解题: 使用语言:python 解法一: class Solution(object): def twoSum(self, nums, target): """ :type nums: List[int] :type target: int :rtype: List[i...

2020-02-03 21:15:12 126

原创 Hadoop学习:window环境下idea连接linux上的hdfs集群

1、安装idea2、新建Maven项目其中GroupId一般是公司域名倒写,例:www.baidu.com,一般包名为com.baidu,这是一种规范,ArtifactId一般是指项目的具体作用,比如testHdfs。3、项目完成后打开项目目录下的pom.xml文件,并添加如下依赖<dependencies> <dependency> &...

2019-11-05 11:09:17 989

原创 Endnote X9批量导入web of science中的文献

问题:导入失败,点击导入后,Endnote 无反应解决:双击ciw文件,可以导入文件,但一次只能导入50篇文献,解决方案还未查找,临时解决方案,将批量导入文献设为50篇...

2019-09-23 09:09:16 5008

原创 python:anaconda安装whl文件

anaconda对应python3.7版本win10,64位系统step1:下载whl文件https://www.lfd.uci.edu/~gohlke/pythonlibs/#pygamestep2:打开anaconda commond promptstep3:打开whl文件夹,pip install whl文件名...

2019-09-21 18:50:55 14817 2

原创 python:打开文件open和codecs区别

当我面有数据需要保存时,第一时间一般会想到写到一个txt文件中,当然,数据量比较大的时候还是写到数据库比较方便管理,需要进行网络传输时要序列化,json化。下面主要整理一下平时用的最多的写入到文件中,一般以txt结尾,linux里不会以后缀来区分文件类型,后缀可以随便,也可以没有。 python读写文件估计大家都用open内置函数,或者file这个工厂函数,这两个的效果基本一样。...

2019-05-19 08:09:43 695

原创 NLP:关键词提取

2019-04-09 14:37:03 338

翻译 python:py2cytoscape安装

1、先到https://www.lfd.uci.edu/~gohlke/pythonlibs/去下载python-igraph的whl文件,并安装;2、检查自己是否安装了scipy包,如果没有,则安装上;3、使用pip install py2cytoscape安装这个包。在Cytoscape官网上下载安装包并安装,编写程序时则自动在Cytoscape中显示图...

2019-03-30 09:35:16 787

原创 NLP:知识图谱总结

1、知识图谱的直观展示:知识图谱本质上是一种语义网络,将客观的经验沉淀在巨大的网络中;结点代表实体或者概念;边代表实体/概念之间的关系;2、知识图谱的表示方法构成知识图谱的核心三元组三元组:实体、属性、关系,Entity、Attribute、Relation抽取为&lt;实体1,关系,实体2&gt;和&lt;实体1,属性1,属性值1&gt;例如&lt;达观数...

2019-01-14 19:19:15 8949

原创 研究生学习经历

 总结:这是某学长的研究生三年的学习过程。自己学了很多基础知识,但是没有用到实处,缺乏项目经历,应该主动参加比赛。github:https://github.com/altmanWang/altman.github.io   ...

2019-01-13 21:48:41 2301 1

转载 win10宽带连接720错误 解决办法

  1 打开 我的电脑 2 打开 管理 3 在设备管理里把“网络适配器”里的“WAN Miniport(IP)”卸载了然后重启电脑

2018-11-27 12:41:49 12542 4

转载 python数据分析:PDFminer3k解析pdf为文字遇到:WARING:root:GBK-EUC-H

然后运行自己真正需要的PDF时,报错:刚开始我天真的以为是pdf加密了,后来查了下发现pdfminer3k自带能解密一些简单的加密方法,且遇到加密报错不是这样的。然后重新仔细研究报错,觉得应该是pdf的字体的问题,pdfminer3k不能解析特殊字体,需要下载相应的字体包来解决。字体包下载网站:https://github.com/euske/pdfminer/pull/71/co...

2018-11-26 19:11:13 3709 4

原创 python数据分析:异常值处理

import pandas as pddf = pd.DataFrame({'col1':[2,4,1,7,8,77],'col2':[12,34,32,76,55,66]})df_zscore = df.copy()cols = df.columnsfor col in cols: df_col = df[col] z_score = (df_col - df_co...

2018-11-07 09:22:14 5667

转载 Neo4j学习:Win系统安装Neo4j

一、 简介Neo4j 是目前最流行的图形数据库,支持完整的事务,在属性图中,图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作节点,边也称作关系,每个节点和关系都可以由一个或多个属性。Neo4j创建的图是用顶点和边构建一个有向图,其查询语言cypher已经成为事实上的标准。其他的图形数据库还包括Oracle NoSQL数据库,Or...

2018-11-05 20:36:57 290

原创 python数据分析:缺失值处理

缺失值处理可以使用主要以pandas缺失值处理最为常用import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputerdf = pd.DataFrame(np.random.randn(6,4),columns = list('abcd'))df.iloc[4,3] = np.nan#iloc...

2018-11-05 11:09:32 1684

转载 anaconda环境霞安装tensorflow

Anaconda 安装是由社区提供支持的,并没有任何官方支持。按照以下步骤在 Anaconda 环境中安装 TensorFlow:按照 Anaconda 下载网站上的说明下载并安装 Anaconda。调用以下命令创建名为 tensorflow 的 conda 环境:C:&gt; conda create -n tensorflow pip python=3.5发出以下命令以激活 ...

2018-11-02 11:11:57 146

转载 Spider修改界面风格

修改效果这里写图片描述原文步骤:这里写图片描述三步操作:    Step1: 安装QDarkStyleSheetpip install qdarkstyle    1    Step2: 三步修改qthelper.py文件        ①进入anaconda安装目录,Ctrl+F查找到qthelper.py文件        这里写图片描述        ②文件...

2018-11-02 10:25:02 5933

转载 SPARQL:Jena搭建SPARQL查询RDF数据

1 Jena搭建SPARQL查询RDF数据 1.1 Jena概要· SPARQL是W3C的RDF数据工作组设计的一种查询语言和协议,用于RDF数据的查询。经过类似于JDK安装时候的配置,可以在命令行运行SPARQL查询,也可以在安装了Jena API之后,在Java程序用使用SPARQL查询。 1.2 Jena环境搭建· 到oracle官网上下载最新版本的JDK然后安装,地址:ht...

2018-10-30 16:04:15 618

转载 Python日期与字符串互转

1,str -&gt; dateimport datetimedetester = ‘2017-01-01'date = datetime.datetime.strptime(detester,’%Y-%m-%d') 2,date -&gt; strimport datetimedate = datetime.now()detester = date.strftime...

2018-10-28 11:43:17 418

转载 python数据分析:mysql安装

如果你的电脑是windows,参考下面的安装步骤。一、下载mysql打开搜索引擎输入MySQL,第一个搜索结果是MySQL官网(MySQL Community Downloads)。 进入MySQL官方网站后,按下图顺序点击“Downloads”-&gt;'Community'-&gt;“MySQL on Windows”-&gt;'MySQL Installer'进入下载页面。...

2018-10-17 22:07:03 510

原创 Ubuntu环境下基于Anaconda安装Tensorflow

1.安装GPU条件sudo apt-get install libcupti-dev如果不安装GPU版本,则不需要运行命令2.创建tensorflow环境conda create -n tensorflow python=3.62.1如果出现安装不成功,则需要把已存在的tensorflow清除cd /home/clover/anaconda3/envsrm -r tensorflow3.激活t...

2018-05-31 16:37:45 600

原创 虚拟机安装ubuntu出现问题及解决方法

最近重新买了电脑,配置还不错,需要使用ubuntu系统,于是就决定在虚拟机中安装1.安装过程出现了如下问题(图片是网络上找的,左上角是ubuntu,不是osx),在网络上找了很多方法,最后终于找到了,第一种是找到后缀名为.vmx的文件修改,但是没有起到任何作用2.第二种方法是更改虚拟机设置,如下图所示:然后再进入系统的bios界面,找到virtual configration,将其更改为为enab...

2018-05-27 22:16:13 9099

转载 Python:append、extend与insert几个方法的区别

Python语言,看到向列表增加更多数据时被append(),extend(),insert()方法绕晕了。append 和extend都只需要一个参数,并且自动添加到数组末尾,如果需要添加多个,可用数组嵌套,但是  append是将嵌套后的数组作为一个对象,extend是将嵌套的数组内容作为多个对象,添加到原数组中作为编程0基础的小白,觉得有必要自己再梳理一遍:1.append()方法是指在列表...

2018-03-19 10:14:09 1464

原创 python数据分析:在pandas中加载mongodb中的数据

#导入相应的包import pymongoimport pandas as pdfrom pandas import Series,DataFrame#连接数据库client = pymongo.MongoClient('localhost',27017)ganji = client['ganji']info = ganji['info']#加载数据data = DataFram...

2018-03-02 20:58:02 5682 3

原创 python:pdf转文字(在线和本地文档)

在线文档:#encoding=utf-8from urllib.request import urlopenfrom pdfminer.pdfinterp import PDFResourceManager, process_pdffrom pdfminer.converter import TextConverterfrom pdfminer.layout import LAParams...

2018-02-27 20:46:45 2121

转载 Python数据分析:NumPy、pandas中(axis=0 与axis=1)区分

转自:http://blog.csdn.net/wangying19911991/article/details/73928172           https://www.zhihu.com/question/58993137 python中的axis究竟是如何定义的呢?他们究竟代表是DataFrame的行还是列?考虑以下代码:&gt;&gt;&gt;df = pd.DataFrame([[1...

2018-02-20 10:08:15 5285

原创 python爬虫:快到情人节啦,做些爱心图片

爬虫代码:#encoding=utf-8import requestsfrom bs4 import BeautifulSoupimport timeimport randomurls = ['https://www.duanwenxue.com/huayu/tianyanmiyu/list_{}.html'.format(str(i)) for i in range(1,50)]...

2018-02-12 15:41:47 3784 1

转载 python日常:wordcloud安装

python第三方组件有很多都是whl文件,遇到这样的whl文件应该怎样安装呢,今天来介绍一下whl文件怎样安装。 更多内容访问omegaxyz.com 先推荐一个非正式第三方whl文件包的网站:https://www.lfd.uci.edu/~gohlke/pythonlibs/下面以安装wordcloud为例介绍怎么安装whl文件①先检查自己的python版本,我使用的python版本是3.6...

2018-02-11 10:29:42 2820 3

原创 python数据分析:charts使用中遇到的问题

1、charts安装问题刚开始不知道,在pycharm中使用charts,原来charts是用js代码,所以必须在网页中运行,也就是,jupyter notebookcharts包,直接在cmd中使用pip安装,可是安装以后不能使用,我们可以到charts的官网教程中查看解决方法替换代码网址:https://github.com/mugglecoding/Plan-for-combating/tr...

2018-02-08 18:56:56 784

转载 python爬虫:如何安装phantomjs

下载地址:http://phantomjs.org/download.html下载以后解压,将bin目录下的exe文件放到python的scripts目录下,就可以在python中使用了

2018-02-04 20:44:17 3986 1

原创 python爬虫:爬取猫眼电影(分数的处理和多线程)

爬取用的库是requests和beautifulsoup,代码编写不难,主要是个别的细节处理需要注意1、电影得分的处理右键审查元素,我们看到分数的整数部分和小数部分是分开的,在beautifulsoup中,我们可以用(.strings或者.stripped_strings),但是这样取出来的内容是一个可迭代的生成器,只用用列表或字典才能看到结果到网上搜罗了一圈终于找到解决办法,

2018-02-02 10:39:51 1693

原创 python爬虫:又和geckodriver折腾了一番(火狐浏览器)

geckodriver下载地址:   https://github.com/mozilla/geckodriver/releases换了python真是什么都得重新弄。1、首先使用pip安装selenium:pip install selenium2、到官网下载geckodriver(一定注意版本,不然会出现版本问题)注意geckodriver的存放目录位置如果是pyt

2018-01-30 11:32:27 4987

转载 python:anaconda

找到系统设置环境变量的地方在path中添加以下三个文件地址,相互之间用分号(注意是英文状态)连接F:\program files (x86)\anaconda;F:\program files (x86)\anaconda\Scripts;F:\program files (x86)\anaconda\Library\bin设置好anaconda的环境变量后,可直接用

2018-01-21 11:11:10 207

转载 python爬虫:cookie的使用

在做登录的post请求时,需要记住cookie,否则不能访问登录后的页面。下面是登录的代码:#coding:utf-8import urllibimport http.cookiejarurl = "http://c.highpin.cn/Users/CLogin"postdata =urllib.parse.urlencode({ "Logon_Password":"

2018-01-19 20:25:00 685

原创 python爬虫:代理及相关注意问题

代理网址:http://www.goubanjia.com/free/index.shtmlimport randomimport requestsfrom bs4 import BeautifulSoup#自动导入包,alt+inter# http://cn-proxy.com/proxy_list = ( 'http://117.177.250.151:8081',

2018-01-19 14:55:23 411

原创 python爬虫:xpath

xpath学习网址:http://www.w3school.com.cn/xpath/index.asp基础知识和实际操作存在一定差异,还在探索中,感觉使用xpath没比beatifulsoup快多少,可能是电脑问题练习:# -*- coding: utf-8 -*-import requestsimport urllib.requestfrom lxml import etreeimpo

2018-01-19 10:18:27 448

原创 python爬虫:不同解析网页方式添加报头

一、使用urllib.requestimport urllib.requesturl = 'https://weheartit.com/discover/book/articles'#向服务器发送请求req = urllib.request.Request(url) #添加报头,add_header()是方法,所以中间用逗号,注意与下面区分req.add_header('Use

2018-01-18 17:18:00 640

原创 python爬虫学习第二周总结

一、在pycharm中使用mongodb打开pycharm,点击setting,如图所示,安装mongo插件练习一:向数据库中存入数据from bs4 import BeautifulSoupimport requestsimport pymongoimport random #引入random模块,是想每次让程序sleep()的时间变为随机数,而不是固定的几秒,random.randi

2018-01-18 14:14:30 408

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除