1 dzx159266

尚未进行身份认证

暂无相关简介

等级
TA的排名 21w+

情感分析--word2vec

分词–list of list格式(df2的来源请看上一篇博客https://blog.csdn.net/dongzixian/article/details/103474094)import jiebadf2['cut'] = df2[0].apply(jieba.lcut)df2.head()from sklearn.model_selection import train_te...

2019-12-10 15:11:45

情感分析(支持向量机,逻辑回归)

以某宝购物评论为例(表分为好评和差评)好评df = pd.read_excel("F:/文本大数据/购物评论.xlsx",sheet_name="正向",header=None)df标记为1df['class']=1df.head()差评df1 = pd.read_excel("F:/文本大数据/购物评论.xlsx",sheet_name="负向",header=None)...

2019-12-10 14:18:05

如何自定义Tableau 调色板

在日常工作中,人们做数据分析可视化时,对色彩的选择是非常有趣的体验:同样一个图表,换一种颜色之后,看上去似乎就变得不同了。其实,Tableau 颜色搭配功能非常强大,可供选择的颜色也是多种多样的。可是,有些用户会有自己的一套配色方案,或者是要增加一些 Tableau 调色板上没有的颜色。有办法解决吗?打开“我的 Tableau 存储卡”文件夹在该文件夹的最下方有一个“ Prefere...

2019-12-08 17:01:36

文本预处理:词袋模型(bag of words,BOW)、TF-IDF

*** 这篇博客主要整理介绍文本预处理中的词袋模型(bag of words,BOW)和TF-IDF。 ***一、词袋模型(bag of words,BOW)词袋模型能够把一个句子转化为向量表示,是比较简单直白的一种方法,它不考虑句子中单词的顺序,只考虑词表(vocabulary)中单词在这个句子中的出现次数。下面直接来看一个例子吧(例子直接用wiki上的例子):"John likes to...

2019-11-28 09:26:51

jieba库基本介绍(中文分词)

jieba库概述(jieba是优秀的中文分词第三分库)中文文本需要通过分词获得单个的词语jieba是优秀的中文分词第三方库,需要额外安装jieba库提供三种分词模式,最简单只需要掌握一个函数jieba库的安装(cmd命令行)pip install jieba(导入)import jieba(查看版本)jieba.__version__jieba分词的原理(jieba分词依靠...

2019-11-25 17:16:21

词云(WordCloud)参数详情

准备工作安装pip install wordcloud导入import wordcloudfrom wordcloud import WordCloudWordCloud参数font_path:string(字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf’)width,height: int(默认为400,200,画...

2019-11-24 14:39:18

如何用pyecharts绘图(堆积折线图,桑基图,玫瑰图,地图,3D弹簧,时间轴轮番图,自定义图)

版权声明:本文为CSDN博主「千语_肉丸子」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/u012535605/article/details/806777911.基本语法学习from pyecharts import Barbar = Bar("我的第一个图表", "这里是副标题")bar.a...

2019-11-14 09:40:33

如何用pyecharts绘制柱状图,条形图,折线图,饼图,环形图,散点图

简介pyecharts是一个由百度开源的数据可视化,凭借着良好的互交性,精巧的图表设计,得到了众多开发者的认可,而python是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts诞生了。安装pip3 install pyecharts版本检查import pyechartspyecharts.__version__>>>'...

2019-11-07 13:06:05

如何用Seaborn描绘线图,分面网格关联图,密度图,连接图,热力图,线性回归图,分面网格绘图

事前准备请看之前的文章0o0!线图data = { 'apple':[4,0,7,8], 'orange':[3,5,6,7], 'bananas':[6,4,5,3]}df = pd.DataFrame(data,index=['a','b','c','d'])dfplt.figure(dpi=150)sns.lineplot(data=df)#一列一条...

2019-10-26 21:14:52

如何用Seaborn描绘柱状图(条形图),箱线图,小提琴图,分类散点图,分面网格分类图,散点图(3)

柱状图x = ['金融','农业','制造业','新能源']y = [163,86,125,58]sns.barplot(x,y)y = ['金融','农业','制造业','新能源']x = [163,86,125,58]sns.barplot(x,y,order=['金融','制造业','农业','新能源'],#自定义顺序 orient='h',#可把图横着...

2019-10-20 21:53:40

Seaborn(2)调色板

在seaborn中颜色主要分为连续渐变色板和离散分类色板。分类色板,主要用color_palette()函数。color_palette()能传入任何Matplotlib所支持的颜色color_palette()不写参数则为默认颜色set_palette()设置所有图的颜色六个默认的颜色循环主题deepmutedpastelbrightdarkcolorblindc...

2019-10-10 20:28:22

Seaborn(1)图画背景刻度设置

Seaborn的安装安装最新的seaborn的版本,我们可以通过使用pip命令:pip install seaborn如果你已经安装conda,可以使用下面的命令进行seaborn安装conda install seaborn安装成功后,我们需要检查seaborn的安装是否成功,可以通过导入seaborn相关的包,来检查下。import seaborn as snssns.__ver...

2019-10-10 13:57:56

matplotlib(4)饼图

准备工作import matplotlib.pyplot as plt%matplotlib inlineimport numpy as npimport pandas as pdplt.rcParams['font.sans-serif'] = ['SimHei']#用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False#用来正常显...

2019-09-29 21:13:54

matplotlib(3)

plt.gcf()与plt.gca()当前的图表和子图可以使用plt.gcf()和plt.gca()获得。可让边框变换颜色。x = np.linspace(-10,10,100)y = np.sin(x)plt.plot(x,y,'r-*')ax = plt.gca()ax.spines["right"].set_color('red')#右边ax.spines["left"].se...

2019-09-29 20:42:33

matplotlib(2)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/pengjunlee/article/details/81989778————————————————版权声明:本文为CSDN博主「pengjunlee」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声...

2019-09-22 21:59:38

数据可视化(matplotlib绘图)

基于Matplotlib模块的绘图使用简单绘图语句,实现复杂绘图效果以交互式操作实现渐趋精细的图形效果使用嵌入式的Latex输出具有印刷级别的图表,科学表达式和符号文本对图表的组成元素实现精细化控制导入和画图准备导入模块matplotlib.pyplotimport matplotlib.pyplot as plt在notebook中显示所绘图像%matplotlib inl...

2019-09-13 23:21:51

统计自然语言处理基础(一)

基础认知语言学的目的是为了能够描述和解释我们周围的语言现象。人们对在自然语言处理中使用统计方法抱有的热情,在很大程度上是 因为他们看到了统计方法在解决实际问题时的前景,而这些问题正是传统方法无法解决的。大家对语言使用形式的频率感兴趣是有清晰的,毋庸置疑的科学原因的。(统计学是研究语言的一种方法)语言和认知 是随机现象:把概率作为理解语言的一种科学方法的最基本论点认为,人类的认知是随机的,因此...

2019-09-08 12:18:59

错误与异常

程序的错误语法错误,逻辑错误和运行时错误语法错误是指源代码中的拼写等错误,这些错误导致python编译器无法把python源代码转换为字节码,故也称之为编译错误。逻辑错误是程序可以执行(程序运行本身不报错)但执行结果不正确。对于逻辑错误,python解释器无能为力,需要根据结果来调试判断。运行时错误是当:1.程序中没有导入相关的模块(例如,import random)时,解释器将在运行...

2019-06-23 11:44:02

面向对象编程之生成器与迭代器

生成器列表推导式[i * i for i in range(8)]>[0, 1, 4, 9, 16, 25, 36, 49]生成器表达式(i * i for i in range(8))><generator object <genexpr> at 0x0000025C8F9019A8>查看生成器对应的所有元素,有两种方式:1.多次调...

2019-06-07 13:56:40

面向对象编程(第四篇)

issubclass()与isinstance()内置函数issubclass()用于判断类对象与类对象之间的关系内置函数isinstance()用于判断实例对象与类对象之间的关系内置函数issubclass()接受两个实参,第一个实参是类对象,第二个实参是类对象或由类对象组成的元组。当第二个实参是类对象时,如果第一个实参是二个实参的子类,那么返回True当第二个实参是类对象组成的元...

2019-06-03 22:13:49

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。