自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 实用技巧:数据可视化综述

作为一名数据产品经理,不仅需要了解数据产品设计与研发的流程,数据可视化更是必不可少的技能之一。通过数据可视化,数据产品经理可以更加直观地呈现数据信息,让用户更容易理解、解读数据。

2023-06-07 11:55:54 175

原创 PRML_频率与贝叶斯(一)

PRMLPRMLPRML_频率与贝叶斯一、我们从数据中能得到的信息总体信息。总体所属分布或者所属的分布族带来的信息;样本信息。从总体中抽样得来的样本给我们提供的信息;以上两种信息进行的统计推断称为经典统计学。它的观点是把样本看成来自具有一定概率分布的总体。先验信息。在抽样之前,对总体的基本认知,一般来自经验或历史资料。利用以上三种信息进行的统计推断称为贝叶斯统计。它的观点...

2019-09-23 12:01:01 221

原创 AB Testing

A/B Testing说到决策,必然就是一道选择题。是A还是B,this is a question!如何使用风险、代价最小的方法,找到最适合生存的方案,在企业应用中,就显得及其重要。而物竞天择,优胜劣汰,使得A/B Testing尤为重要,并在互联网的世界,大行其道。一、A/B Testing 在企业中的应用。在实际应用当中,提出问题的假设是解决问题的第一步。当发生运营疑问和决策的时候,...

2019-09-17 13:30:53 1125

原创 HIVE----工作常用知识点

Hive中常用的交互式命令hive -help 查看交互式命令hive -e 不进入hive的交互窗口执行sql语句;hive -f 执行脚本中的sql语句,其中使用>输出到指定目录下的文件当中(定时任务);exit 先隐性提交数据,再退出;quit 不提交数据,退出;参数配置方式配置文件方式默认配置文件:hive-default.xml用户自定义配置文件:hive-...

2019-09-09 10:41:57 273

原创 BP_fetch_mnist

%matplotlib inlineimport numpy as npfrom sklearn.datasets import fetch_openmlfrom sklearn.model_selection import train_test_splitimport matplotlibimport matplotlib.pyplot as pltmnist = fetch_op...

2019-07-12 10:53:51 171

转载 分类算法的评估方法

几个常用术语 1) True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数; 2) False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数; 3) False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数; 4) True ...

2019-06-24 15:28:56 1602

原创 Python_NetWorkX_教程

NetworkXimport networkx as nx一、创建空的图1.G = nx.Graph() #创建无向图2.G = nx.Digraph() #创建有向图二、添加节点Node、edge、weighted_edgeGraph.__init__(**attr[, data]) Initialize a graph with edges, name, graph...

2019-01-24 18:04:42 1586

原创 统计学--假设检验过程

假设检验原理基础:小概率原理,即一般认为小概率事件在一次随机抽样中不会发生。基本思想:先建立一个关于样本所属总体的假设,考察在假设条件下随机样本的特征信息是否属小概率事件,若为小概率事件,则怀疑假设成立有悖于该样本所提供特征信息,因此拒绝假设事实上,小概率事件在随机抽样中还是可能发生的,只是发生的概率很小。若正好碰上了,则假设检验的结论就是错误的。当然,犯这种错误的概率很小。假...

2018-10-11 11:50:35 1013

原创 Python3----Pandas

Python3–Pandas1. 导包import numpy as npimport pandas as pd2. Series的创建data = pd.Series(["skey","syl","earth"]) #Series is a one-dimensional array of indexed data.print(data)...

2018-09-14 19:29:31 5827

原创 Python3----Numpy总结

Python–Numpy1. 导包import numpy as np2. 创建一个数组Array(不同于List)array1 = np.array([1,2,3,4,5])# 数组当中存储相同的数据类型,不同于一般的列表print(array1)[1 2 3 4 5]print(array1.dtype) # 查看当前数组中存储数据的数据类型...

2018-09-13 16:46:20 305

原创 Python编程基础

Python入门基础知识1. Python数据基本结构 Python的数据是弱类型,使用一个变量前不必提前声明。1.1. 字符串string = "this is a string!" #单引号可代替双引号print(string)this is a string!string_new = 'this is a ""' print(string...

2018-09-11 12:35:45 274

原创 Python3--爬虫之Xpath使用

Python3Python3Python^3–爬虫之Xpath使用准备工具:Google Chromexpath-helper.crx 百度网盘链接:https://pan.baidu.com/s/15XqmdvWgxNqC7Cvd_aPuOw密码:ixsh使用:将xpath-helper.crx拖放到浏览器chrome://extensions/下,即可完成安装Xp...

2018-09-05 19:01:13 382

原创 数据提取方法值json

数据提取方法json数据交换格式,看起来像python类型(列表、字典)的字符串使用json之前,需要导入import json哪里会返回json的数据浏览器切换到手机版转包appjson.loads把json字符串转化为python类型json.loads(json字符串)# 百度翻译示例import requestsimport jsonurl = ...

2018-08-21 12:59:37 761

原创 Python3之爬虫----retrying模块的使用和处理cookie相关的请求

1.1. 设使用超时参数 requests.get(url,headers = headers,timeout = 3) #设置超时参数,若url在三秒内未得到响应,报错 1.2.retrying模块的使用(第三方模块)from retrying import retry @retry(stop_max_attempt_number = 3)示...

2018-08-13 14:44:16 1061

原创 统计学之方差分析(单因素)

方差分析目的: 研究一个或多个分类型自变量与一个数值型因变量之间的关系。 1. 一个或多个分类型自变量 2. 一个数值型因变量存在原因: 如果使用一般的假设检验方法,一次只能研究两个样本的关系,则实现方法: ...

2018-08-02 22:33:28 4419

原创 Python3--我的代码库之Pandas库之DataFrame(二)

import pandas as pdimport numpy as np### 1.导入数据df = pd.read_csv("outschool.csv",encoding = 'gbk')df.head(5) .dataframe tbody tr th:only-of-type { vertic...

2018-07-30 10:37:21 260

原创 Python3--我的代码库之Pandas库之DataFrame(一)

一、什么是DataFrame? - 这是一种带名称的表格型的数据结构,我们可以看成很多Series堆砌而成; - 第一行为字段值,从第二行开始每一行为一条记录; - 每一列可以为不同的字段数据类型; - 既有行索引,也有列索引二、创建一个DataFrameimport pandas as pdimport numpy as npf = pd.Dat...

2018-07-30 09:42:53 645

原创 Python3--我的代码库之Pandas库之Series(二)

主题导入import numpy as npimport pandas as pdarray_1 = pd.Series(np.arange(10,15),index = list('abcde'))1.切片1.1 按照索引切片array_1[1:3] # 前包后不包 b 11 c 12 dtype: int641.2 按照索引名称切片...

2018-07-28 23:01:58 279

原创 友邻优客21天--Day01

It is appropriate that a big tent is most closely associated with a circus. 生词 读音 释义 appropriate 美 /əˈproprɪət;(for v.) əˈproprɪet/ adj. 适当的;恰当的;合适的 vt. 占用,拨出 tent 美 /tɛnt...

2018-07-28 17:05:22 617

原创 Python3--我的代码库之Pandas库之Series(一)

1、什么是Series? 简单地讲,就是一组带标签的 数组。 由一组数据和与之相关的标签组成的一维数组对象 标签 值 a 1 b 2 c 3 d 42、Series的特征 数组中的数据类型可以为任意的数据类型; 数组中的数据一般为同一种数据类型。 3、创建Series1....

2018-07-27 22:52:53 544

原创 Python3--我的代码库之Axis(五)

一、Along an Axis Axes are defined for arrays with more than one dimension. A 2-dimensional array has two corresponding axes: The first running vertically downwards across...

2018-07-19 14:45:32 337

原创 Python3--我的代码库之numpy合并(四)

1. 创建两个数组a = np.array([1]*3)b = np.array([2]*3) a Out: array([1, 1, 1]) b Out: array([2, 2, 2])2. 上下拼接np.vstack((a,b)) #vertical stack Out: array([[1, 1, 1], ...

2018-07-19 13:16:28 178

原创 Python3--我的代码库之numpy索引(三)

1. 准备工作import numpy as np A = np.arange(3,15) B = A.reshape((3,4))1.1. 查询第三个元素print(A[2]) #索引从0开始1.2. 查询第二列的元素B[:,1] Out: array([ 4, 8, 12])1.3. 查询第二行、第三列右下角的所有值B[1:,2:...

2018-07-17 21:59:26 222

原创 Python--Anaconda无法输入中文

找到文件 /usr/lib/x86_64-linux-gnu/qt5/plugins/platforminputcontexts/libfcitxplatforminputcontextplugin.so复制到 在anaconda3下搜索platforminputcontexts目录,确认是Python下的目录。即可!...

2018-07-17 20:54:45 1393 1

原创 Python--Anaconda段错误 (核心已转储)

更新Ubuntu系统后,Spyder启动失败:air@airfull:~$ spyder段错误 (核心已转储)解决办法: air@airfull:~$ conda install pyopengl

2018-07-17 18:51:32 10058 5

原创 Python3--我的代码库之numpy(二)

Numpy运算import numpy as np a_vec = np.array([10,20,30,40]) b_vec = np.arange(4) array([10, 20, 30, 40]) array([0, 1, 2, 3])sum_a_b = a_vec + b_vec array([10, 21, 32, 43]) #加、减、乘...

2018-07-17 15:35:21 201

原创 Python3--我的代码库之numpy(一)

1、导入numpy模块,并起别名npimport numpy as np2、创建一个数组arrayarray = np.array([[1,2,3],[2,3,4]]) array([[1, 2, 3], [2, 3, 4]])3、打印各基本属性array.ndimOut[4]: 2array.shapeOut[5]: (2...

2018-07-17 14:09:12 283

原创 EXCEL--批量插入图片

批量往excel中插入图片 先决条件: - 获取所有图片名称 - python代码import osdef file_name(file_dir): for files in os.walk(file_dir): return list(files[2])print(file_name('D:\\360CloudUI\\Desktop\\图片...

2018-07-10 15:03:23 2338

原创 Python--我的代码库之字典

字典列表是有序的对象集合字典是无序的对象集合,即输出的顺序与定义时的顺序无关字典使用键值对存储数据,键值对之间使用,分隔 键key是索引值value是数据键和值之间使用:分隔键必须是唯一的值可以取任意数据类型,但键只能使用字符串、数字与元组...

2018-07-08 18:44:16 221

原创 Python3--我的代码库之循环遍历

循环变量遍历就是从头到尾依次从列表中获取数据,在循环体内部针对每一个元素,执行相同的操作在Python中为了提高列表的遍历效率,专门提供了迭代iteration遍历使用for就能实现迭代遍历for name in name_list: # 操作 print(name)...

2018-07-08 17:57:59 161

原创 python3---我的代码库之初体验

模块 模块是Python程序架构的一个核心概念 模块就好比工具包,要想使用这个工具包的工具,就必须导入import这个模块 每个以扩展名.py结尾的python源代码文件都是一个模块 在模块中定义的全局变量、函数都是模块能够提供给外界直接使用的工具 命名规则仅包含字母、下划线、数字不能以数字开头高级变量类型列表元组字典字符串公共方法...

2018-07-08 10:56:09 168

原创 陈列--对角线构图

对角线构图其实是引导线构图的一个分支,将视觉引导线沿画面对角线方向展布,就成了对角线构图。 引导线可以是直线,也可以是曲线甚至是折线,只要整体延伸方向与画面对角线方向接近,就可以视为对角 线构图。...

2018-07-05 09:38:12 682

原创 Python3--爬虫基础知识和软件准备(一)

1、python版本 air@airfull:~$ python --version Python 3.6.5 :: Anaconda, Inc.1、什么是爬虫 模拟客户端(浏览器)发送网络请求,获取响应,按照规则提取数据的程序照着浏览器发送一模一样的请求,获取和浏览器一模一样的数据2、爬取的数据去哪儿了 呈现出来:展示在网页上,或者是展示在app上(...

2018-07-04 22:08:28 302

原创 Python--我的工具之git

1、安装git air@airfull:~$ sudo apt install git 2、卸载git air@airfull:~$ sudo apt remove git 3、初始化airgit文件夹为git仓库 air@airfull:~$ cd airgit air@airfull:~/airgit$ git init /home/air/airgit/.git: 权限...

2018-07-02 22:35:55 191

原创 Python3--我的工具之Ubuntu(一)

1、查看当前Ubuntu版本: air@airfull:~$ sudo lsb_release -a [sudo] air 的密码:x x x x No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 17.10 Release: 17.10 Cod...

2018-07-02 22:35:28 262

原创 MYSQL 语句的执行过程详解

在以上的10个处理步骤中, 每一步的处理都生成一个虚拟表来作为下一步的输入. 虚拟表对于调用者或输出查询来说是不存在的, 仅在最后步骤生成的表才会返回给调用者或者输出查询. 如果某一子句没有出现在SQL语句中, 这一步就被简单跳过..这10个具体步骤是:1.FROM: from子句中的两个表首先进行交叉连接(笛卡尔积), 生成虚拟表VT1。2.ON: on条件作用在VT1上, 将...

2018-06-19 10:09:19 1101

转载 配色--明度

明度是指色的明暗程度,也可以称色的亮度、深浅。若把无彩色的黑白作为两个极端,在中间根据明度的顺序,等间隔地排列出若干个灰色,就成为明度阶段,靠近白端为高明度色,靠近黑端为低明度色,中间部分为中明度色。明度阶段从无色彩的角度来看,很容易区分明暗程度,但是混合了色相明暗度就不是那么容易区分乐。1.高明度 玉兰油白里透红美白霜的广告网站可以看作为高明度型站点的典型参考,主色(白色)是明度最高...

2018-05-09 10:25:32 908

原创 陈列--三角形构图

在店铺当中使用三角形构图法,就是在一个陈列面中,将商品或结合陈列道具来安排陈列位置,以构成一个稳定的三角形,增加整体的层次感,使整组陈列更为立体。这种三角形可以是正三角,也可以是倒三角或斜三角,其中斜三角较为常用,也最为灵活。三角形构图具有安定、均衡但不失灵活的特点。图例: ...

2018-05-09 10:10:49 2970

翻译 如何定义机器学习

What is Machine Learning?Two definitions of Machine Learning are offered. Arthur Samuel described it as: “the field of study that gives computers the ability to learn without being explicitly progra...

2018-05-08 21:22:05 381

原创 python3--我的代码库之file 文件操作(一)

1、创建file对象,打开文件my_file = open("##.txt") 2、打开一个file对象一定要在程序结束时关闭它,以免浪费资源my_file.close() 为了避免发生异常,导致无法正常关闭file对象,我们使用try-finally进行规避try: f = open('##') print(f.read()) #一次...

2018-05-04 10:45:00 275

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除