自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

转载 面试---方差分析

1.背景:假如你们现在针对用户提出了三种提高客单价的策略A、B、C,现在想看一下这三种策略最后对提高客单价的效果有什么不同,那我们怎么才能知道这三种策略效果有什么不同?最简单的方法就是做一个实验,我们可以随机挑选一部分用户,然后把这些用户分成三组A、B、C组,A组用户使用A策略、B组用户使用B策略、C组用户使用C策略,等策略实施一段时间以后,我们来看一下这三组分别的客单价是什么水平?哪组平均客单价高,就说明哪组策略有效果。真的可以得出这的结论吗?是可以,但是不够严谨。为什么说不够严谨呢?是因为我们.

2021-10-26 09:17:35 375

原创 wps三线框

1、打开WPS文字,新建一个文档。然后点击工具栏中的“插入”,再点击“表格”右边的小箭头,再点击“插入表格”,并根据自己的需要设置表格列数、行数。2、选中所有的表格,点击工具栏中的“表格样式”,再点击“边框”选择“无边框“,并把线粗细设置为“1.5磅”。3、现在表格没有边框了,还是选中所有表格,点击“边框”选择“上框线”。4、选中所有表格,点击“边框”选择“下框线”。...

2019-11-08 15:27:34 649

原创 python将csv文件转化成txt

import pandas as pdimport osdata = pd.read_csv('news_data.csv', encoding='utf-8')with open('news_data.txt','a+', encoding='utf-8') as f: for line in data.values: f.write((str(line[0]...

2019-11-01 09:50:07 22287 5

原创 wps中将文档的下一节与本节页眉页脚改为不同的方法

1、启动wps文档,定位本页的最后,页面布局功能区→分隔符→下一页分节符;2、定位到下一页的页脚,鼠标双击,功能区显示页眉和页脚,将同前节取消(也就是说当前页与前一页设置不一样),插入页码根据实际需求将应用范围为本页或本页及之后,勾选重新开始编号。就实现了将文档的下一节与本节页眉页脚不同。3、wps文档中可以通过以上设置方法能快速设置当前页与前后页之间的页眉页脚是否相同,以满足实际...

2019-10-27 21:16:33 1657

原创 分词用结吧分词器原因

1、中文分词技术是中文自然语言处理的第一项核心技术,在语言理解中,词是最小的语言成分,分词处理过程通过计算机将句子转化为词的表示。自中文自动分词技术被提出以来,目前已经出现了很多方法,可主要归纳为规则分词、统计分词和混合分词三类主要方法。(1)基于规则的分词是一种机械分词方法,主要是通过维护词典,在切分语句时将语句的每个字符串与词表中的词进行逐一匹配,找到则切分,否则不予切分。按照切分方式...

2019-10-19 21:24:31 358

转载 python对列表中的元素进行去重操作

1.案例要求:"""有列表:["a","a","a","b","b","c","d","d","f"],要求去除重复的列表数据,达到效果["a","b","c","d","f"]"""2.案例分析:(1)集合可以去重,列表转为集合,再转回列表。隐患:集合无序,索引会变。(2)第一步:引入一个临时空列表,遍历元素列表,如果元素不在临时列表,就加到临时列表,如果临时列表已经有该元素...

2019-10-09 09:17:12 505

转载 吴恩达机器学习笔记(week6——)

http://ai-start.com/ml2014/html/week6.htmlWeek6十、应用机器学习的建议(Advice for Applying Machine Learning)10.1 决定下一步做什么10.2 评估一个假设10.3 模型选择和交叉验证集10.4 诊断偏差和方差10.5 正则化和偏差/方差10.6 学习曲线10.7 决定下一...

2019-10-01 20:08:54 150

转载 吴恩达机器学习笔记(week1——week5)

Week1转自该大神~~~~~http://scruel.gitee.io/ml-andrewng-notes/week1.html一、 引言(Introduction)1.1 欢迎1.2 机器学习是什么?1.3 监督学习1.4 无监督学习二、单变量线性回归(Linear Regression with One Variable)2.1 模型表...

2019-10-01 20:07:45 318

转载 聚类分析

监督学习与非监督学习的一个最本质的区:监督学习的应用要求数据集事先有标签,而非监督学习则不需要标签。无监督学习就是事先没有训练数据样本,直接对数据进行建模,比如说聚类。聚类定义将物理或抽象对象的集合分成由类似的对象组成的多个类的过程称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一簇中的对象相似度较高,与其它簇中的对象相似度较低。聚类分析的类型:Q型聚类:对样品的聚类;...

2019-09-28 11:10:56 1719

原创 划分数据集train_test_split参数含义

在使用sklearn进行数据集划分时,代码from sklearn.model_selection import train_test_splitx_train,x_test,y_train,y_test = train_test_split(df_train['contents_clean'].values, ...

2019-09-01 19:37:04 1524 1

原创 TfidfVectorizer参数解析

vectorizer = TfidfVectorizer(stop_words=stpwrdlst, sublinear_tf=True, max_df=0.5) ''' 关于参数: stop_words: 传入停用词,以后我们获得vocabulary_的时候,就会根据文本信息去掉停用词得到 vocabulary: vocabulary...

2019-08-06 21:19:40 6095

转载 关键词提取

#使用jieba 和 sklearn都可以进行关键词提取import jieba.analyseindex=2400print(df_news['content'][index])# str.join(sequence) sequence中用str连接content_S_str=''.join(content_S[index])#jieba.analyse.extract_tags...

2019-07-23 19:50:38 207

原创 sklearn调用朴素贝叶斯报错dimension mismatch

fit、transform、fit_transform区别fit():就是求得训练集的均值,方差,最大值,最小值,这些训练集的固有属性。transform():在fit的基础上,进行标准化,降维,归一化等操作。fit_transform():fit_transform是fit和transform的组合,既包括了训练又包含了转换。transform()和fit_transform()二者的功能...

2019-07-22 16:44:30 1639

原创 贝叶斯新闻分类(二)

前面(一)中用一种简化的方式是直接使用TfidfVectorizer来生成TF-IDF向量,这里我们按照一般的方式将生成TF-IDF向量分成两个步骤:1.生成词频向量. 2.生成TF-IDF向量。最后我们开始训练我们的MultinomialNB分类器。TfidfVectorizer将原始文档的集合转换为tf - idf特性的矩阵 ,相当于CountVectorizer配合TfidfTran...

2019-07-22 16:03:32 199

转载 贝叶斯新闻分类(一)

(一)读入数据df_news = pd.read_csv('news_data.csv', encoding='utf-8')df_news=df_news.dropna()# print(df_news.shape)# print(df_news.head())content=df_news.content.values.tolist()#df_news的content列...

2019-07-22 15:47:35 567

转载 六天带你玩转Mysql笔记--第六天

1.1 事务操作1.1.1手动事务操作流程1.1.2 事务操作原理1.1.3 回滚点1.1.4 自动事务处理1.1.5 事务特性1.1.6 锁机制2. 变量2.1 系统变量2.1.1 查看系统变量2.2 修改系统变量2.2 自定义变量2.2.1 自定义变量3 触发器3.1创建触发器3.2 查看触发器3.3 使用触发器3.4 修改触...

2018-09-14 14:14:44 374

转载 六天带你玩转Mysql笔记--第五天

1.外键1.1增加外键1.2修改外键&删除外键1.3外键作用1.4外键条件1.5外键约束2联合查询2.1基本语法2.2意义2.3 order by使用3.子查询3.1子查询分类3.2标量子查询3.3列子查询3.4行子查询3.5表子查询3.6 exists子查询4.视图(view)4.1创建视图4.2查看视图4....

2018-09-14 14:14:17 334

转载 六天带你玩转Mysql笔记--第四天

1. 连接查询1.1 连接查询分类1.1.1交叉连接1.1.2 内连接1.1.3 外连接1.1.4 自然连接(natural join)1.连接查询(1)连接查询:将多张表(大于2张)进行记录的连接(按照某个指定的条件进行数据拼接)。最终结果是记录数有可能变化,字段数一定会增加(至少两张表合并)。(2)连接查询的意义:在用户查看数据的时候,需要显示的数...

2018-09-14 14:13:59 162

转载 SQl学习笔记第三天

1. 字段属性1.1 主键(primary key)1.1.1增加主键1.1.2 主键约束1.1.3 主键更新&删除主键1.1.3 主键分类1.2 自动增长1.2.1 新增自增长1.2.2 自增长的使用1.2.3 修改自增长1.2.4 删除自增长1.2.5 唯一键(unique key)1.3 索引2关系2.1 一对一2.2 一对...

2018-09-14 14:13:42 222

转载 SQl学习笔记第二天

一、修改表:rename table 老表名 to 新表名二、字段:1、新增字段alter table表名add [column]数据类型[列属性][位置];2、修改字段alter table表名modify字段名 数据类型[属性] [位置];3、重命名alter table表名change旧字段 新字段名 数据类型[属性][位置];4、删除alter table表名drop...

2018-09-14 14:13:23 239

转载 SQl学习笔记第一天

day11.数据库的基础(1) 什么是数据库(2)数据库分类(3) 不同的数据库阵营中的产品有哪些(4)两种数据阵营的区别1.1关系型数据库1.1.1什么是关系型数据库1.1.2关系型数据库的设计1.2关键字说明1.3SQL1.4 Mysql数据库2.SQL基本操作2.1库操作:对数据库的增删改查2.1.1新增数据库2.1.2查看数据库...

2018-09-14 14:12:19 244

转载 Excel网课学习笔记

第一讲 认识Excel1、shift+选择三张工作表,右键插入三张表。2、调换两列的顺序:选中一列,按shift,拖动该列到替换的那列的边框位置。3、调整列宽:选中列,双击边框,自动调整为刚好合适的大小。4、到达表格数据的边界:选中单元格,鼠标变成四个箭头,双击单元格上边框、下边框、左边框、右边框依次到达。5、ctrl是拖拽填充的开关,复制或者序列方式填充。点击右键拖拽,会出现...

2018-09-14 14:11:45 2067 1

原创 Excel菜鸟学习笔记

一、常用的分析模型:波特五力模型:用于行业分析和商业战略研究SWOT分析模型:用于市场分析(strength、weakness、opportunity、threats)5W2H分析模型:用于解决问题(what、why、when、where、who、how、how much)PEST分析模型:用于宏观环境分析(political、economic、social、technologic...

2018-07-06 09:36:47 17386

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除