自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

原创 EXCEL中提取各sheet表中的固定区域到一个表格中

=INDIRECT("Sheet"&ROW(F1)&"!F1")好久不做数据分析了,今天因为要申报一个项目又开始调用其一些公式、函数等等。再次看csdn感觉还是很有感触。毕业后选择了一份稳定的体制内工作,数据分析的思维和经历带给我很多很多,只可惜自己是那条路上半途而废的一员。简洁的代码、编译器,为了一个问题反复思索的图书馆的一个又一个下午。emmmm~~回想自己求学的经历明明擅长数学和文科,对物理化学一窍不通,高二分科却报了理科。上了个中规中矩的大学,学了个文理.

2022-04-24 18:10:06 3354 1

转载 删除PPT固定图片的宏

Sub Test()Dim oSlide As Slide, oShape As ShapeDim myWidth As Single, myHeight As Single, myTop As Single, myLeft As SingleOn Error Resume NextIf ActiveWindow.Selection.ShapeRange.Count <> 1 ThenIf Err.Number <> 0 ThenMsgBox "none" & v

2020-12-22 13:07:41 786

原创 python访问phone包获取运营商、地区等

#!/usr/bin/env python##-*- coding:utf-8 -*-from phone import Phoneimport datetimeinput_csv = open('123.txt',encoding='utf-8')output_csv = open('output4.txt','w')i = 0j = 0for line in input_cs...

2019-07-02 09:11:44 1486

原创 excel:csv文件批量转换为xlsx的宏

1、新建一个excel2、选择alt+F113、选择insert model4、输入程序,选择包含csv文件的文件夹Sub CSVtoXLS()'UpdatebyExtendoffice20170814    Dim xFd As FileDialog    Dim xSPath As String    Dim xCSVFile As String    Dim xWs...

2018-12-05 10:12:12 10269 1

原创 SQL行号选取函数

SQL行号插入函数row_number() over (ORDER BY v.open_id) AS rownum,SELECT row_number() over (ORDER BY v.open_id) AS rownum,    v.open_id AS open_idFROM.....

2018-10-23 18:14:55 2207

转载 Presto适用的SQL函数

序号 功能和说明 1 abs(x) 返回x的绝对值 2 cbrt(x) 返回x的多维数据集根 3 ceiling(x) 返回舍入为最接近整数的x值 4 ceil(x) 天花板别名(x) 5 degrees(x) 返回x的度数值 6 e(x) 返回欧...

2018-10-10 10:00:04 36545 1

原创 SNA中心论的相关概念

度中心性(degree)度中心性(Degree Centrality)是在网络分析中刻画节点中心性(Centrality)的最直接度量指标。网络中与该节点直接相连的节点个数,一个节点的节点度越大就意味着这个节点的度中心性越高,该节点在网络中就越重要。 接近中心性(Closeness Centrality)反映在网络中某一节点与其他节点之间的接近程度。某点到网络中其他点的距离总和。将...

2018-09-28 14:44:44 898 1

转载 盈利模式

❶广告模式新闻类门户网站大多是这种模式,新浪、搜狐、网易三大门户很大部分盈利是靠广告收入获取的。还有视频类平台也多属这种,如爱奇艺、搜狐视频、腾迅视频,在看视频前都要先看一段广告。 广告模式的产品特点是: 低门槛。谁都能进,谁都能看,用户量是此模式收益的主要依托。 内容高质量。内容必须有价值,价值是吸引用户的前题,像现在这个自媒体时代,每个自媒体人的收益很大一部分是来自...

2018-08-08 09:29:17 3224 1

原创 调用百度API进行情感分析

# -*- coding: utf-8 -*-from aip import AipNlpimport csvimport pandas as pdfrom pandas.core.frame import DataFrameAPP_ID = '******'API_KEY = '888888888'SECRET_KEY = '88888888'client = AipNlp(A...

2018-06-26 12:57:16 7225 2

原创 简单的结巴分词与词频统计

#!/usr/bin/env python# -*- coding: utf-8 -*-import reimport sysimport jiebaimport jsonfrom collections import Counterreload(sys)sys.setdefaultencoding("utf-8")filename = "rowss.txt"f1 = open...

2018-06-10 16:31:54 3428

原创 关于小程序的一点总结

1.小程序优点:A.能给人们带来便捷的游戏体验和休闲的享受; B.借助微信社交圈快速变现,通过社群交互,扩大游戏的覆盖面及影响力,吸引更多的人关注游戏,从而在游戏内做到提高其他游戏曝光度,提高广告流量,公众号引流,充值消费等等进行变现; C.开发成本低,投入少,产出快。2.小​​程序缺点:A.但是小游戏的开发,运营都比较“轻”,往往对公众来说不具备长时间吸引力; B.小程序小游戏与大型网游相比,成...

2018-06-09 11:53:02 324

原创 在做数据时多问自己几个问题

1.    将历史accrual用总accrual减去当月新签accrual 忽视了数据之间的验证,只是表内数据的加减,应该将历史数据重新在系统中跑出,进行验证。2.    Accrual和业绩的表格框架应该达成统一,统一之后方便看业绩和accrual之间的关系。3.    将总计列在表的第二行,可以随时方便验证准确性。4.    Accrual摊销不仅仅是到2018年的4月,考虑摊销的时间性,明...

2018-06-01 15:56:44 232 1

原创 SQL里的按照制定字段排序函数

order by case 'name' //name是列名 when 'tom' then 1 // 当值为tom,排在第一个 when 'jhon' then 2 // 当值为jhon,排在第二个 when 'mary' then 3 // 当值为mary,排在第三个 ...

2018-05-25 15:14:52 678

原创 python txt转换为字典,并用中文导出

#!/usr/bin/env python# -*- coding: utf-8 -*-# -*- encoding: gbk -*-import matplotlib.pyplot as pltfrom wordcloud import WordCloudimport json_dict = {}def load_dict_from_file(filepath): try: ...

2018-05-23 15:00:29 3249

原创 Python自然语言处理的一些资料整理

一、基于PYTHON的简单的自然语言处理https://blog.csdn.net/qfire/article/details/78786651二、自然语言处理工具包https://www.cnblogs.com/baiboy/p/nltk2.html三、NLTK自然语言处理工具包https://blog.csdn.net/u010099495/article/details/46776135可能...

2018-05-13 15:37:31 308 4

原创 presto 扫盲、行列转置函数

presto是什么是Facebook开源的,完全基于内存的并⾏计算,分布式SQL交互式查询引擎是一种Massively parallel processing (MPP)架构,多个节点管道式执⾏⽀持任意数据源(通过扩展式Connector组件),数据规模GB~PB级使用的技术,如向量计算,动态编译执⾏计划,优化的ORC和Parquet Reader等presto不太支持存储过程,支持部分标准sql...

2018-05-13 15:24:07 11426 1

原创 element_at 函数

库里有类似josn形式的字符串数据attr{"a":"123","b":"234"."c":"345","分类":"aaa"}类型的数据redash平台可以识别汉字,直接用element_at(attr,"分类")即可原本想用unicode将汉字进行转码操作,结果失败,可能是平台支持的语句不同temp.elementAt(0) 返

2018-05-10 22:49:19 6860 1

转载 python一元线性回归

上图中,'x'轴表示匹萨直径,'y'轴表示匹萨价格。 能够看出,匹萨价格与其直径正相关,这与我们的日常经验也比较吻合,自然是越大越贵。 下面就用 scikit-learn 来构建模#!/usr/bin/env python# -*- coding:utf-8 -*-import matplotlib.pyplot as pltfrom matplotlib.font_manager impo...

2018-04-16 11:56:20 6419

转载 CPT CPC CPA CPM 广告投放了解

网络广告发展到今天,经历了从最初的短信联盟到现在的广告联盟,广告形式也有了很大的变化,出现了CPC、CPM、CPA、CPS、CPT等众多广告形式。今天就为大家科普这些广告术语,一次搞懂!1CPM:按展示付费CPM—英文全称Cost Per Mille 或者是Cost Per ThousandImpression, 也称千人印象成本。CPM是一种展示付费广告,只要展示了广告主的广告内容,广告主就为此...

2018-04-15 15:46:54 24670 1

原创 SQL空值处理

空值的处理:1.      应该有值,目前不知道2.      不应该有值3.      不便于填写空值和0不同,具有不缺定性1.      查找年龄或者性别遗漏的信息的记录SELECT *FROM StudentWHERE Ssex IS NULL OR Sage IS NULL 有NOT NULL约束条件的不能取空值加了UNIQUE限制的属性不能取空值码属性不能取空值 空值与另外一个空值的算术...

2018-04-15 14:21:54 2920

原创 SQL视图

l  视图创建CREATVIEW 视图名 列名AS 子查询[WITHCHECK OPTION][WITH CHECK OPTION]:当用视图进行UPDATE\INSERT\DELETE 进行更新、插入、删除时的行需要满足子查询子查询可以是任意SELECT语句视图的属性列名可以全部省略或指定1.全部省略的话由子查询中SELECT中列的诸字段组成。2.明确指定试图的所有列名的话:某个目标列是聚集函数...

2018-04-15 14:20:01 426

原创 SQL数据查询

l  单表查询:SELECT [ALL\DISTINCT]目标列表达式FROM&lt;表名或视图名&gt;[表名或视图名]…[SELECT语句] AS&lt;别名&gt;WHERE条件表达式GROUP BY &lt;列名1&gt;[HAVING&lt;条件表达式&gt;]ORDER BY &lt;列名2&gt;[ASC/DESC]GROUP BY 对查询结果按照指定列进行分组,该属性列值相等的元祖...

2018-04-15 14:18:53 266

原创 SQL函数

聚集函数通常和GROUP BY联合起来使用()必选,[]可选COUNT(*) 统计元组个数,返回被选行数COUNT([DISTINCT|ALL]&lt;列名&gt;) 统计一列中值的个数SUM([DISTINCT|ALL]&lt;列名&gt;) 统计一列值的总和  此列必须为数值型AVG([DISTINCT|ALL]&lt;列名&gt;)计算一列值的平均值  此列必须为数值型MAX([DISTIN...

2018-04-15 14:14:51 472

原创 SQL高级进阶

l  限定返回的行数TOPSELECT TOP number | percent 列名FROM 表名SELECT TOP 2 * FROMPersons                                      SELECT TOP 50 PERCENT * FROMPersonsl  LIKE在WHERE字句中搜索制定模式 通配符等(%可以定义通配符,模式中缺少的字母)SELEC...

2018-04-15 14:12:09 988

原创 scipy- linalg以及矩阵相关知识学习

1.det(A)行列式行列式在数学中,是由解线性方程组产生的一种算式,是取自不同行不同列的n个元素的乘积的代数和。n阶行列式(定义1)设有n²个数,排成n行n列的表 ,作出表中位于不同行不同列的n个数的乘积,并冠以符号(-1)t,的形式如下的项,其中为自然数1,2,...,n的一个排列,t为这个排列的逆序数。由于这样的排列共有n!个,这n!项的代数和称为n阶行列式①行列式A中某行(或列)用同一数k...

2018-04-10 16:31:14 3706

原创 scipy-optimizer优化器

#!/usr/bin/env python# -*- coding:utf-8 -*-import numpy as npfrom scipy.optimize import minimize # 求出最小值 #from scipy.optimize import leastsq # 引入最小二乘法算法 #import matplotlib as pltdef main(): ...

2018-04-10 11:14:37 1760

原创 scipy-integrate 数值积分

#!/usr/bin/env python# -*- coding:utf-8 -*-import numpy as npfrom scipy.integrate import quad, dblquad,nquaddef main(): # 1---Integral# print (quad(lambda x: np.exp(-x), 0, np.inf)) ...

2018-04-10 11:11:58 4011

原创 scipy-interpolation scipy插值运算

Scipy还是需要较强的数学基础。需要学习。#!/usr/bin/env python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as pltfrom scipy import interpolatedef main(): x = np.linspace(0, 1, 10) #插...

2018-04-10 11:09:40 2874

原创 SQL初级基础

SQL基础l  选择数据,SELECT语句SELECT LastName,FirstName FROM PersonsSELECT * FROM Persons l  返回不同的值,去除重复值SELECTDISTINCTSELECT DISTINCT 列名称FROM 表名称 l  如需有条件地从表中选取数据,可将 WHERE 子句添加到 SELECT 语句。WHERE语句请注意,我们在例子中的条件...

2018-04-04 17:42:16 157

原创 Access进阶 主要是一些数据库原理的巩固

一次正规化:纵向寻找重复的数据的记录  e.g 客户编号、姓名二次正规化:找出数据绝对依赖的数据   e.g 商品的基本数据信息三次正规化:数据表中相依字段 不一定是1对1,有可能是1:多的关系   e.g 商品分类,商品代码过度正规化:假性依赖  有可能不是1:1的关系...

2018-03-22 20:46:02 327

原创 pandas 时间序列、绘图、存储文件 date_range()

pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)参数start:string或datetime-like,默认值是None,表示日期的起点。end:string或datetime-like,默认值是No...

2018-03-22 19:08:19 1574

原创 pandas库中shift()、diff()等函数的用法

# Statistic#print (df.mean())# 所有属性的均值 #print (df.var())# 属性的方差 #s = pd.Series([1, 2, 4, np.nan, 5, 7, 9, 10], index=dates)print (s)print (s.shift(2))# 行索引数字未发生改变,值向下移动两位 #print (s.diff())# 不填数字...

2018-03-21 16:08:33 11092

原创 pandas库中concat()、merge()、groupby()、pivot_table()相关用法

#!/usr/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npimport datetimedef main(): dates = pd.date_range("20180301", periods=8) df = pd.DataFrame(np.random.randn(...

2018-03-21 16:06:59 743

原创 panda库中 reindex重新定义索引函数相关用法

#!/usr/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npdef main(): dates = pd.date_range("20180301", periods=8) df = pd.DataFrame(np.random.randn(8, 5), index=da...

2018-03-21 14:47:26 3084

原创 Pandas建立dataframe\ series\ 及相应操作 切片、排序、复制、修改

#!/usr/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npdef main(): # Data Structure# s = pd.Series([i * 2 for i in range(1, 11)]) print (s) dates = pd.da...

2018-03-20 21:22:45 3397

原创 matplotlib——热图hot map contour() 以及图像存储

#!/ usr / bin / env python # - * - coding:utf-8 - * - import numpy as np import matplotlib.pyplot as pltDEF主(): #热图# plt.figure( 1) #建立一个数字# plt.subplot( 331) #3行和3列#的图 ...

2018-03-19 22:26:31 4391

原创 matplotlib figure定义一张大的画布 axex/subplot是子图

#!/ usr / bin / env python # - * - coding:utf-8 - * - import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import axes3ddef main(): #scatter## plt.figure(...

2018-03-19 16:11:44 2701

原创 matplotlib极值图画法 ——polar()

#!/ usr / bin / env python # - * - coding:utf-8 - * - import numpy as np import matplotlib.pyplot as pltdef main()#极性 plt.subplot( 335,极性 =真)N = 20 THETA = np.arange(0,2 * np.pi,2 * np.pi ...

2018-03-19 16:07:10 5512

原创 matplotlib柱状图相关用法——bar()

#encoding = utf-8# import numpy as np将 matplotlib.pyplot导入为 pltfig.add_subplot(3,3,2)n = 10 X = np.arange(n)Y1 =(1 - X / 浮动(N))* np.random.uniform(0.5,1.0,N)Y2 =(1 - X / 浮动(N))* np.random.unifor...

2018-03-19 10:08:20 1132

原创 matplotlib热图绘制——inshow()相关用法

#!/ USR / bin中/ env的蟒 # - * -编码:UTF-8 - * - 进口 numpy的作为 NP进口 matplotlib.pyplot作为 PLT DEF主(): 数据 = np.random.rand( 3, 3) plt.imshow(data,interpolation = 'nearest',cmap = plt.get_cmap('cool'...

2018-03-19 10:00:05 2450

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除