自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(115)
  • 收藏
  • 关注

转载 欢迎使用CSDN-markdown编辑器!

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...

2019-04-23 16:08:59 258

原创 数据分析各度量数据描述及应用对象

分类数据:评价等级A,B,C,D,E顺序数据:1,2,3,4,5,6,7,8,9数值型数据:温度,销售数,成绩各种字母对应:频数(fi)集中趋势的度量:分类数据:众数(Mo)顺序数据:中位数(Me),四分位数(Q)数值型数据:平均数(x-),几何平均数 G(算利率)离散程度的度量:分类数据:异众比率 (Vr)顺序数据:四分位差(Qd)数值型数据:方差(s2),标准差(s),极差(R),平均差(Md...

2018-07-10 17:41:16 1982

转载 数据分析-Python数据分析与挖掘所需的Pandas常用知识

转载至:https://mp.weixin.qq.com/s/jlDTXBmuMUU6kC2nRQXoSg前言Pandas基于两种数据类型:series与dataframe。一个series是一个一维的数据类型,其中每一个元素都有一个标签。series类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。一个dataframe是一个二维的表结构。Pandas的dataframe可以存...

2018-07-02 14:50:48 453

转载 亚马逊跟卖的一点建议

内容截选至:http://blog.sina.com.cn/s/blog_15fa176970102w95i.html1.跟卖什么产品:我觉得应该从你自己熟悉的产品入手,但又一定不能仅仅局限于你熟悉的产品;一条你发掘出的Listing未必适合跟卖,但众多的跟卖卖家以及各自卖家店铺里面的众多产品,都是你跟卖的研究对象,舍弃了这些,你想做好跟卖会很难;​2.能否跟卖的判定:跟卖一条产品,不是依你是否能...

2018-06-26 10:22:11 1629

转载 亚马逊选品技巧‘7’步走

主要包括: 1. 认识理想中的产品 2. 如何快速获取产品灵感 3. 如何找到合适的产品关键词 4. 产品市场前景和竞争力分析 5. 产品的市场有多大 6. 如何快速创造新品 7. 如何快速验证市场 一、认识理想中的产品 开始选品之前,首先脑海中要构建“理想中的产品”的样子,围绕这些思路去选品目标才会更清晰。目前陈晨认可的理想产品包括以下7个共同特点: 1. 方便运输:体积小,质量小的产品有仓储和...

2018-06-26 10:09:43 1430

转载 不吹不擂,你想要的Python面试都在这里了【315+道题】 转载

转载至微信公众号:PythonPush第一部分 Python基础篇(80题)1、为什么学习Python?2、通过什么途径学习的Python?3、Python和Java、PHP、C、C#、C++等其他语言的对比?4、简述解释型和编译型编程语言?5、Python解释器种类以及特点?6、位和字节的关系?7、b、B、KB、MB、GB 的关系?8、请至少列举5个 PEP8 规范(越多越好)。9、通过代码实现...

2018-06-20 18:38:05 462

原创 统计学陷阱

1.内在有偏的样本:样本条件不一致,不具备准确性2.精心挑选的平均数:平均数误导(算术平均数,众数,中位数在不满足正太分布的前提下,差距较大)3.没有披露的数据:样本过低4.毫无意义的工作:利用毫无价值的数据宣传产品,提高产品竞争力5.惊人的统计图形:图表数据不展示基数,或省略中间部分(刻度值欺骗)6.平面图形:在三维角度上,根据增加倍率相应变宽变高,达到视觉欺骗7.不相匹配的资料:比如:“去年飞...

2018-06-19 19:47:39 1517

转载 如何快速成为数据分析师?

第一周:Excel学习掌握第二周:数据可视化第三周:分析思维的训练第四周:数据库学习第五周:统计知识学习第六周:业务学习(用户行为、产品、运营)第七周:Python/R 学习...

2018-06-19 16:33:44 274

原创 odoo-库位链个人理解

推式流:当产品到达一个库位的时候,Odoo能够自动建议将产品移动到其相关的库位(个人理解:设计货物的未来计划)拉式流(补货规则):拉式流跟推式流不同,拉式流操作的是需求,而不是直接的产品。它不处理产品的移动,而是处理需求和补货单(个人理解:设计货物的过去计划)...

2018-05-25 19:27:57 872

转载 odoo-OPENERP仓库各类知识详解

转载至:https://www.jianshu.com/p/33d8d90cbed9?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendationOPENERP仓库各类知识详解一、复式库存(DOUBLE-ENTRY STOCK MANAGEMENT)和库存移动(S...

2018-05-24 10:00:06 1760

转载 odoo-Odoo进销存(采购、销售、仓库)入门教程

转载至:Odoo进销存(采购、销售、仓库)入门教程 - 上         Odoo进销存(采购、销售、仓库)入门教程 - 下由于未经过原作者允许转载,如有冒犯,请联系删文。目的:方便自己学习odoo系统开发正文:0. 前言Odoo(OpenERP)作为一款优秀的开源ERP软件,开发历史已有10年之久。随着系统的发展成熟,已有越来越多的公司借助Odoo管理日常业务的方方面面。本文以一个贸易公司为例...

2018-05-22 18:16:15 8768

原创 数据库优化方法

1.建索引2.优化数据库结构3.优化查询语句

2018-05-09 18:01:01 227

原创 MongoDB-处理速度变慢问题(索引能提高3倍的搜索速度)

问题:之前在另一台电脑已经搭好的项目,在跑上传并储存数据到数据库的时候,总耗时只要10s。后来将项目重新部署到一个新电脑上面,重新搭好环境,跑同一段代码的时候,总耗时变成;了30s。经过研究,发现代码中主要的耗时在mongoDB的update中,而且update命令也是要有查询操作的,在原来的项目中,mongoDB里的索引已经建立好。在换到新电脑的时候,没有想到这一层面,导致运行速度降低了66%。...

2018-05-09 17:56:51 3281

原创 ubuntu 下更新pip后发生 ImportError: cannot import name 'main'的问题解决

参考资料:https://stackoverflow.com/questions/28210269/importerror-cannot-import-name-main-when-running-pip-version-command-in-windo国内百度到的2个都是有点问题的,实际上思路是正确的(错误文章:http://www.mamicode.com/info-detail-226483...

2018-05-05 10:57:30 1364

转载 优化VMware提高虚拟机运行速度的技巧

转载:https://blog.csdn.net/shanzhizi/article/details/8293638vmware虚拟机如何设置不当的话会造成运行速度慢,并影响主机运行,甚至会出现死机。一下是提高vmware虚拟机运行速度的几个技巧,文章来自:http://blog.csdn.net/shanzhizi1        修改preference中的选项(全局设置)a         ...

2018-05-03 15:16:40 13440

原创 Python基础-list中元素为字典的排序

参考资料:https://neue.v2ex.com/t/320176from operator import itemgetterlst = [ {'student_name': 'zhangsan', 'student_score': 65}, {'student_name': 'lisi', 'student_score': 95}, {'student_na...

2018-04-27 09:51:19 1925

转载 MongoDB-一对多建模

前言:原文地址  https://www.cnblogs.com/zsychanpin/p/6881257.htmlMongoDB 一对多关系建模本篇博客翻译自:http://blog.mongodb.org/post/87200945828/6-rules-of-thumb-for-mongodb-schema-design-part-1?mkt_tok=3RkMMJWWfF9wsRonsq7L...

2018-04-21 17:26:16 315

原创 MongoDB-入门

-----------------------------------------------------前言----------------------------------------------------- windows下安装:http://www.runoob.com/mongodb/mongodb-window-install.html 系统资料:http://www.runo...

2018-04-20 18:46:03 219

原创 SQL原生常用命令

show databases;use 数据库名;show tables;desc 表名;      查看表结构select * from 表名;     查看该表所有数据select distinct * from 表名;     查看该表所有字段不重复的数据drop table 表名;      删除数据表...

2018-04-17 15:39:01 301

原创 聊天软件原理

前提:socker长连接建立

2018-04-13 12:31:29 1889 1

原创 Docker-常用命令

docker pull : 获取image(镜像)docker build : 创建imagedocker images : 列出imagedocker run : 运行container(容器)docker ps : 列出container  // 参数 -adocker rm : 删除containerdocker rmi : 删除imagedocker cp : 在host和containe...

2018-04-04 19:47:28 208

原创 数据分析-多因子探索分析理论铺垫

多因子探索分析理论铺垫假设检验与方差检验相关系数:皮尔逊、斯皮尔曼回归:线性回归PCA与奇异值分解假设检验:  1.建立原假设Ho(包括等号),Ho的反命题为H1,也叫备择假设2.选择检验统计量3.根据显著水平(一般为0.05),确定拒绝域4.计算P值或样本统计值,作出判断卡方检验:一个样本样本内部比较假设化妆这个行为不分男女,用卡方检验检验该假设129.3 > 3.841 ,在拒绝区,故假...

2018-04-04 15:06:36 855 1

转载 回顾正态分布

如果一组数据满足正态分布,请问意义是什么,数据有什么特点?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。   2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越...

2018-04-04 15:02:40 344

原创 数据分析与挖掘建模(理论知识)

学习进度(3-10)理论铺垫:集中趋势(数据聚拢位置的衡量):均值( df.mean() )、中位数( df.median() )、众数( df.mode() )、分位数( df.quantile(q=0.25)  0.25下四分位数  0.5中四分位数  0.75上四分位数 )离中趋势(值越大越离散,越小越集中):标准差( df.std() )、方差( df.var() )数据分布:偏态( df...

2018-04-03 19:53:29 1760

转载 绘图-图形(柱状图)中添加纯文本注释(text)

转载至:https://blog.csdn.net/you_are_my_dream/article/details/53455256在图形中,通过text添加纯文本的注释text所有相关的参数:官网链接[python] view plain copy #!/usr/bin/python  #c...

2018-04-03 15:42:03 3950

原创 数据分析工作有感

转行入职已经过了一个星期了,由于之前是主要学习web方向,入职的工作是数据挖掘(应该以后还会进行网站开发,所以web技能不能落下,应该抽空回顾复习相关知识)。一开始,工作主要内容是进行数据分析。由于自己也并不熟悉这一块,便从看教程,书本,视频,论坛,Q群等渠道进行快速学习,期间学会了学习并了解了Mumpy的基本结构与常用方法,熟悉了Pandas的基本操作与数据处理等,学会了Matplotlib绘图...

2018-04-02 20:26:12 1175

原创 NumPy/Pandas-目前接触到要用的方法

Numpy:astype:显式转换成其他dtype类型arr.array([1,2,3,4,5])# int --> float64folat_arr = arr.astype(np.float64) # arr.astype(float64) , numpy会自动映射到等价dtype上 np.nan : 手动设定NaNPandas:数据读入:pd.read_csv('目标文件.cs...

2018-04-02 20:11:49 557

原创 爬虫-re模块学习

1.贪婪模式和非贪婪模式的区别默认是贪婪模式贪婪模式是从后面开始匹配(反过来匹配)非贪婪模式是从前面开始匹配

2018-03-27 21:31:21 223

转载 Python-Python2和Python3的主要区别

前提:主要摘录至知乎 王猫猫 对于  ‘Python 2 和 Python 3 有哪些主要区别?’ 该提问的回答。Python2和Python3的主要区别:> 1. print不再是语句,而是函数,比如原来是 print 'abc' 现在是 print('abc')但是 python2.6+ 可以使用 from __future__ import print_function 来实现相

2018-03-18 23:04:51 737

转载 爬虫-Python爬虫常用库

原文链接:https://www.cnblogs.com/youmingkuang/p/7780737.html一、常用库1、requests 做请求的时候用到。requests.get("url")2、selenium 自动化会用到。3、lxml4、beautifulsoup5、pyquery 网页解析库 说是比beautiful 好用,语法和jquery

2018-03-18 16:27:51 9767

转载 数据库-基本的增删改查

原文地址:http://blog.csdn.net/eternalray/article/details/51303658增加:INSERT INTO 表名(字段名1,字段名2) VALUE(字段值1,字段值2)例:INSERT INTO a(id,name) VALUE(2,'李四');删除:DELETE FROM 表名 WHERE 条件例:DELETE FR

2018-02-27 12:15:22 275

原创 Python小工具-电影天堂爬取电影下载链接

import requestsimport bs4# 获取单独的urldef movie_info(url): ''' 内容标签: 下载链接标签:--》a标签属性:thunderrestitle ''' # url = 'http://www.dytt8.net/html/gndy/dyzz/20180118/56127.html' hea

2018-02-11 05:39:18 2644

原创 算法-冒泡排序

import random# 冒泡排序原理:对比两个数,大的放在后面(从小到大排)# 原版# 时间复杂度:O(n平方)def bubble_sort(li): for i in range(len(li) - 1): for j in range(len(li) - i - 1): if li[j] > li[j+1]:

2018-02-09 05:50:27 219

转载 装载-百度云的“链接不存在或失效”怎么破?

参考:https://zhuanlan.zhihu.com/p/31511997

2018-02-09 05:48:37 11005

原创 Python小工具-批量修改视频名称

需要解决的问题:如何获得当前文件夹下的文件及名称 dir_path = 'E:\电影' for root, dirs, files in os.walk(dir_path): print(root) # 当前目录路径 print(dirs) # 当前路径下所有子目录 print(fil

2018-02-09 05:46:12 2985

原创 数据结构-queue队列应用(走迷宫)

# 思路:从一个节点开始,寻找所有下一个能继续走的点,根据下一个的点继续寻找所有能走的点,直到该点等于出口。# 方法:创建一个空队列,将起点位置进队。在队列不为空的时候循环:出队一次。如果当前位置为出口,则结束算法;# 否则找出当前方块的4个相邻方块中可走的方块,加入队列。# 和stack的优势:第一个出队的终点是最短路径# 相关知识:广度优先搜索from collecti

2018-02-09 00:23:12 2650

原创 数据结构-queue队列

from collections import deque'''使用方法:创建队列:queue = deque(li)右边加左边出: 进队:append 出队:popleft左边加右边出: 双向队列队首进队:appendleft 双向队列队尾出队:pop'''li = [1,2,3,4]queue = deque(li)# queue = d

2018-02-09 00:22:21 281

原创 数据结构-stack栈应用(走迷宫)

# 思路:从一个节点开始,任意找到下一个能走的点,当找不到能走的点时,退回上一个点寻找是否有其他方向的点。# 方法:创建一个空栈,首先将入口位置进栈。当栈不空时循环:获取栈顶元素,寻找下一个可走的相邻方块,如果找不到可走的相邻方块,说明当前位置是死胡同# ,进行回溯(就是讲当前位置出栈,看前面的点是否还有别的出路)maze = [ [1,1,1,1,1,1,1,1,1,

2018-02-08 23:40:44 422

原创 数据结构-stack栈

# 栈的理解:后进先出,如果代码走完了,栈是空的,为True,否则为False# 利用栈的原理进行括号的匹配def cheak_kuohao(s): stack = [] for char in s: if char in {'(','[','{'}: stack.append(char) elif char == ')

2018-02-08 23:36:43 160

原创 算法-二分法查找

前提条件:列表必须有序,列表从小到大。二分法原理:找到列表的中间值,比较这个值与要查找的值的大小,若比这个值大,则把区间缩小到左边,反之右边。然后继续相同的步骤,直到找到。二分法时间复杂度:O(logn)def bin_search(data,val): left = 0 right = len(data) - 1 while left <= rig

2018-02-04 05:31:31 442

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除