自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 情感分析--word2vec

分词–list of list格式(df2的来源请看上一篇博客https://blog.csdn.net/dongzixian/article/details/103474094)import jiebadf2['cut'] = df2[0].apply(jieba.lcut)df2.head()from sklearn.model_selection import train_te...

2019-12-10 15:11:45 379 2

原创 情感分析(支持向量机,逻辑回归)

以某宝购物评论为例(表分为好评和差评)好评df = pd.read_excel("F:/文本大数据/购物评论.xlsx",sheet_name="正向",header=None)df标记为1df['class']=1df.head()差评df1 = pd.read_excel("F:/文本大数据/购物评论.xlsx",sheet_name="负向",header=None)...

2019-12-10 14:18:05 2650 3

转载 如何自定义Tableau 调色板

在日常工作中,人们做数据分析可视化时,对色彩的选择是非常有趣的体验:同样一个图表,换一种颜色之后,看上去似乎就变得不同了。其实,Tableau 颜色搭配功能非常强大,可供选择的颜色也是多种多样的。可是,有些用户会有自己的一套配色方案,或者是要增加一些 Tableau 调色板上没有的颜色。有办法解决吗?打开“我的 Tableau 存储卡”文件夹在该文件夹的最下方有一个“ Prefere...

2019-12-08 17:01:36 682 1

转载 文本预处理:词袋模型(bag of words,BOW)、TF-IDF

*** 这篇博客主要整理介绍文本预处理中的词袋模型(bag of words,BOW)和TF-IDF。 ***一、词袋模型(bag of words,BOW)词袋模型能够把一个句子转化为向量表示,是比较简单直白的一种方法,它不考虑句子中单词的顺序,只考虑词表(vocabulary)中单词在这个句子中的出现次数。下面直接来看一个例子吧(例子直接用wiki上的例子):"John likes to...

2019-11-28 09:26:51 757

原创 jieba库基本介绍(中文分词)

jieba库概述(jieba是优秀的中文分词第三分库)中文文本需要通过分词获得单个的词语jieba是优秀的中文分词第三方库,需要额外安装jieba库提供三种分词模式,最简单只需要掌握一个函数jieba库的安装(cmd命令行)pip install jieba(导入)import jieba(查看版本)jieba.__version__jieba分词的原理(jieba分词依靠...

2019-11-25 17:16:21 34884 5

转载 词云(WordCloud)参数详情

准备工作安装pip install wordcloud导入import wordcloudfrom wordcloud import WordCloudWordCloud参数font_path:string(字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf’)width,height: int(默认为400,200,画...

2019-11-24 14:39:18 3393

转载 如何用pyecharts绘图(堆积折线图,桑基图,玫瑰图,地图,3D弹簧,时间轴轮番图,自定义图)

版权声明:本文为CSDN博主「千语_肉丸子」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/u012535605/article/details/806777911.基本语法学习from pyecharts import Barbar = Bar("我的第一个图表", "这里是副标题")bar.a...

2019-11-14 09:43:41 3072

原创 如何用pyecharts绘制柱状图,条形图,折线图,饼图,环形图,散点图

简介pyecharts是一个由百度开源的数据可视化,凭借着良好的互交性,精巧的图表设计,得到了众多开发者的认可,而python是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts诞生了。安装pip3 install pyecharts版本检查import pyechartspyecharts.__version__>>>'...

2019-11-07 14:25:33 4621

原创 如何用Seaborn描绘线图,分面网格关联图,密度图,连接图,热力图,线性回归图,分面网格绘图

事前准备请看之前的文章0o0!线图data = { 'apple':[4,0,7,8], 'orange':[3,5,6,7], 'bananas':[6,4,5,3]}df = pd.DataFrame(data,index=['a','b','c','d'])dfplt.figure(dpi=150)sns.lineplot(data=df)#一列一条...

2019-10-26 21:32:14 1576

原创 如何用Seaborn描绘柱状图(条形图),箱线图,小提琴图,分类散点图,分面网格分类图,散点图(3)

柱状图x = ['金融','农业','制造业','新能源']y = [163,86,125,58]sns.barplot(x,y)y = ['金融','农业','制造业','新能源']x = [163,86,125,58]sns.barplot(x,y,order=['金融','制造业','农业','新能源'],#自定义顺序 orient='h',#可把图横着...

2019-10-20 22:12:55 958

原创 Seaborn(2)调色板

在seaborn中颜色主要分为连续渐变色板和离散分类色板。分类色板,主要用color_palette()函数。color_palette()能传入任何Matplotlib所支持的颜色color_palette()不写参数则为默认颜色set_palette()设置所有图的颜色六个默认的颜色循环主题deepmutedpastelbrightdarkcolorblindc...

2019-10-10 21:35:46 977

原创 Seaborn(1)图画背景刻度设置

Seaborn的安装安装最新的seaborn的版本,我们可以通过使用pip命令:pip install seaborn如果你已经安装conda,可以使用下面的命令进行seaborn安装conda install seaborn安装成功后,我们需要检查seaborn的安装是否成功,可以通过导入seaborn相关的包,来检查下。import seaborn as snssns.__ver...

2019-10-10 14:58:24 6793 2

原创 matplotlib(4)饼图

准备工作import matplotlib.pyplot as plt%matplotlib inlineimport numpy as npimport pandas as pdplt.rcParams['font.sans-serif'] = ['SimHei']#用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False#用来正常显...

2019-10-10 12:45:29 201

原创 matplotlib(3)

plt.gcf()与plt.gca()当前的图表和子图可以使用plt.gcf()和plt.gca()获得。可让边框变换颜色。x = np.linspace(-10,10,100)y = np.sin(x)plt.plot(x,y,'r-*')ax = plt.gca()ax.spines["right"].set_color('red')#右边ax.spines["left"].se...

2019-09-29 21:08:50 115

转载 matplotlib(2)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/pengjunlee/article/details/81989778————————————————版权声明:本文为CSDN博主「pengjunlee」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声...

2019-09-22 22:00:18 81

原创 数据可视化(matplotlib绘图)

基于Matplotlib模块的绘图使用简单绘图语句,实现复杂绘图效果以交互式操作实现渐趋精细的图形效果使用嵌入式的Latex输出具有印刷级别的图表,科学表达式和符号文本对图表的组成元素实现精细化控制导入和画图准备导入模块matplotlib.pyplotimport matplotlib.pyplot as plt在notebook中显示所绘图像%matplotlib inl...

2019-09-14 00:24:20 322

原创 统计自然语言处理基础(一)

基础认知语言学的目的是为了能够描述和解释我们周围的语言现象。人们对在自然语言处理中使用统计方法抱有的热情,在很大程度上是 因为他们看到了统计方法在解决实际问题时的前景,而这些问题正是传统方法无法解决的。大家对语言使用形式的频率感兴趣是有清晰的,毋庸置疑的科学原因的。(统计学是研究语言的一种方法)语言和认知 是随机现象:把概率作为理解语言的一种科学方法的最基本论点认为,人类的认知是随机的,因此...

2019-09-08 14:29:45 990

原创 错误与异常

程序的错误语法错误,逻辑错误和运行时错误语法错误是指源代码中的拼写等错误,这些错误导致python编译器无法把python源代码转换为字节码,故也称之为编译错误。逻辑错误是程序可以执行(程序运行本身不报错)但执行结果不正确。对于逻辑错误,python解释器无能为力,需要根据结果来调试判断。运行时错误是当:1.程序中没有导入相关的模块(例如,import random)时,解释器将在运行...

2019-06-23 11:44:02 529

原创 面向对象编程之生成器与迭代器

生成器列表推导式[i * i for i in range(8)]>[0, 1, 4, 9, 16, 25, 36, 49]生成器表达式(i * i for i in range(8))><generator object <genexpr> at 0x0000025C8F9019A8>查看生成器对应的所有元素,有两种方式:1.多次调...

2019-06-07 13:56:40 130

原创 面向对象编程(第四篇)

issubclass()与isinstance()内置函数issubclass()用于判断类对象与类对象之间的关系内置函数isinstance()用于判断实例对象与类对象之间的关系内置函数issubclass()接受两个实参,第一个实参是类对象,第二个实参是类对象或由类对象组成的元组。当第二个实参是类对象时,如果第一个实参是二个实参的子类,那么返回True当第二个实参是类对象组成的元...

2019-06-03 22:13:49 118

原创 面向对象编程(第五篇)

__new__1.调用特殊方法__new__()创建实例对象查找该类对象是否实现了特殊方法__new__(),如果没有实现,则去其父类中依次查找,直到类对象object2.调用特殊方法__init__()对创建的实例对象进行初始化__new__()返回的实例对象会作为实参数被自动传递给__init__()的第一个形参selfclass Parent(object): def __...

2019-06-03 18:09:52 81

原创 面向对象编程 封装 继承 多态(三大特征)(第三篇)

封装封装是面向对象编程的三大特征之一。封装有两方面的含义:1.将数据(属性)和行为(方法)包装到类对象中。方法内部对属性进行操作,在类对象的外部调用方法。这样,无需关心方法内部的具体实现细节,从而隔离了复杂度。2.在类对象的内部通过访问控制把某些属性和方法隐藏起来,不允许在类对象的外部直接访问,而是在类对象的内部对外提供公开的接口方法以访问隐藏的信息。这样,就对隐藏的信息进行了保护。cl...

2019-05-20 22:23:17 628

原创 面向对象编程 object oriented programming(OOP)(第二篇)

函数装饰器对于某个函数,如果我们希望在不改变该函数代码的前提下,为该函数增加额外的功能,那么就可以使用装饰器来装饰该函数。装饰器是一个函数,装饰器接收一个函数作为参数(传入的实参是被装饰的函数)装饰器的内部嵌套定义另一个函数,内函数中会引用装饰器的参数,并且装饰器的返回值是内函数。为了让内函数接收任意类型的参数,将内函数的形参定义为(*args,**kwargs)在函数中,首先完成为被装...

2019-05-16 22:52:44 92

原创 文件系统

标准库OS常用命令先自建一个文件夹import osos.getcwd() #查看当前路径os.chdir("#文件夹路径") #修改当前路径建立一个子文件夹,已存在时会报错os.mkdir("#名称")删除一个文件夹,不存在时会报错os.rmdir("#名称")列出当前目录或指定目录下所有文件夹及文件名称,返回一个列表os.listdir()修改文件或文件夹的名...

2019-05-06 20:07:49 120

原创 面向对象编程 object oriented programming(OOP)

面向对象编程,是一种编程方式,这种编程方式需要使用“对象”来实现对象的特征世间万物皆对象每个对象都是唯一的对象具有属性和行为(对象的行为包括具有的功能及具体的实现)对象具有状态对象分为类对象和实例对象两大类类对象:具有相同属性和行为的实例对象的抽象类对象是实例对象的模板,实例对象是由类对象创建出来的面向对象编程的大体步骤1.抽象出类对象2.抽象出类对象的属性3.抽象出类...

2019-05-05 22:43:01 263

转载 模块

一.模块的引入在Python中用关键字import来引入某个模块,比如要引用模块math,就可以在文件最开始的地方用import math来引入。在调用math模块中的函数时,必须这样引用:模块名.函数名为什么必须加上模块名这样调用呢?因为可能存在这样一种情况:在多个模块中含有相同名称的函数,此时如果只是通过函数名来调用,解释器无法知道到底要调用哪个函数。所以如果像上述这样引入模块的时候,调...

2019-04-21 14:41:53 115

原创 自定义函数变量的设置(*/**),lambda匿名函数(map/filter/zip/enumerate)

自定义函数变量的设置一个星号*传入元组,且这个变量为可变变量两个星号**后的那些参数被当做字典类型传递到函数中带有双星号的可变参数只能出现在参数列表的最后注意双星号是字典类型(字典形式要有键值对)>>>def d(a,b=6,*c,**d): print("a=",a,"b=",b,"c=",c,"d=",d)>>>d(1,2,3,4)...

2019-04-13 20:22:09 205

原创 标准库time,datetime,calendar,random的使用

标准库time(python中文处理时间的标准库)time库的载入import timetime库包括三类函数1.时间获取:time() ,ctime() ,gmtime()2.时间格式化:strftime() , strptime()3.程序计时:sleep() , perf_counter()时间获取time()获取当前时间戳【从1970年1月1日 00:00开始但当...

2019-04-11 22:13:03 117

原创 组合数据类型{集合,序列【字符串,元组,列表】,字典}

集合类型及操作<1>集合元素之间无序,每个元素唯一,不存在相同元素<2>集合元素不可更改,不能是可变数据类型集合用大括号{}表示,元素间用逗号分隔建立集合类型用{ }或set()建立空集合类型,必须使用set()>>>B = set("pypy123"){'1','p','2','3','y'}集合间操作 1.新建一个集合S...

2019-03-30 15:29:57 687

原创 python字符串方法详解

字符串长度len(S)生成字符串变量str = ‘<变量名称>’字符串的格式操作去掉不需要的字符(默认为空格)1.s.strip()去掉字符串两端的字符s = ' abc 123 's.strip()>>>'abc 123'2.s.lstrip()去掉字符串左端的字符s = ' abc 123 's.lstrip()>>...

2019-03-24 10:06:20 350

原创 python内置函数

数字运算abs(x)求绝对值1、参数可以是整型,也可以是复数2、若参数是复数,则返回复数的模complex([real[, imag]])创建一个复数divmod(a, b)分别取商和余数注意:整型、浮点型都可以float([x])将一个字符串或数转换为浮点数。如果无参数将返回0.0int([x[, base]])将一个字符转换为int类型,base表示进制long(...

2019-03-14 23:06:35 88

原创 math标准库函数----python

如何加载math库import math如何使用math库中的函数在函数名前加math.(函数)如果在加载函数时代码为import math as m则可以用m.(函数)来调用函数常数pi&amp;gt;&amp;gt;&amp;gt; math.pi&amp;gt;&amp;gt;&amp;gt;3.141592653589793e&amp;gt;&amp;gt;&amp;gt; m

2019-03-13 22:21:24 502

原创 Markdown部分知识点

点击下方Markdown部分知识点

2019-03-12 12:09:32 200

原创 Jupyter Notebook知识点

下面标题点开即可浏览Jupyter Notebook知识点

2019-03-12 12:06:39 126

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除