qq_39817865-CSDN博客

原创 power bi中的TREATAS函数！

powerbi函数：TREATAS函数的用法

2022-12-08 14:00:49 468 1

原创对比SQL学powerbi--(4)比如求销售额大于10W的城市个数！

powerbi求销售额大于10W的城市个数！

2022-12-02 17:29:40 552

原创对比SQL学powerbi--（3）图表只显示topN！

powerbi中的topN

2022-12-02 17:18:28 1388 1

原创对比SQL学习power bi--(2)表关联顺序！

powerbi表关联中的避坑指南！！

2022-12-02 17:08:55 338

原创对比SQL学习power bi--(1)分组求和后，再平均！

powerbi快速上手

2022-12-02 16:54:54 964

1.merge-两表关联，当关联多个字段，并且字段名不一致时的做法：test=pd.merge(test1, test2, left_on= [‘商品名称_x’, ‘条码1’],right_on= [‘商品名称_y’, ‘条形码2’],how = ‘outer’)2.关联3张及以上的表的做法之前很多资料都有如何两表merge的方法，然而对多表却很少。这里，用reduce+merge的方法，得以实现。merge multiple data frame :from functools impo

2020-12-12 19:28:57 758

原创为什么要搭建指标体系

2020-11-08 22:32:44 405

原创 python导入数据错误：ParserError: Error tokenizing data. C error: Expected 1 fields in line 3, saw 2

解决方案：https://blog.csdn.net/yj928674542/article/details/75634197

2020-10-12 23:51:05 4460

原创 python和SQL比较

https://pandas.pydata.org/docs/getting_started/comparison/comparison_with_sql.html

2020-09-28 14:50:25 408

原创 pandas时间序列，将int 转换成datetime格式

1.原始时间格式：users['timestamp_first_active'].head()原始结果：0 200903190432551 200905231748092 200906092312473 200910310601294 20091208061105Name: timestamp_first_active, dtype: object错误的转换：pd.to_datetime(sers['timestamp_first_active'])错

2020-09-28 13:56:19 8187 3

原创线上教育数据分析知识总结

线上教育数据分析知识总结：http://www.itongji.cn/detail?type=99991398

2020-04-17 12:01:42 1051

原创 series和DataFrame重大区别

series和DataFrame重大区别series由一维数组和索引构成；DataFrame由多个series构成，只不过这些series共用一个行索引标签。操作上的差别，就是多了一个[]，就有series和DataFrame之分，太不可思议了：train_Survived=train_df['Survived']train_Survived1=train_df[['Surviv...

2020-03-21 08:33:17 635

转载优达学城-机器学习-14监督学习项目-捐助者预测

选择的算法：决策树、集成方法、支撑向量机决策树模型在真实世界中也应用场景在金融方面使用决策树建模分析，用于评估用户的信用、贷款违约率等；在电子商务中，可以根据用户的以往的交易种类、时间、价格建立商品推荐体统等。引用连接：信贷方面的应用电商推荐系统这个模型的优势是什么？决策树易于实现和理解；对于决策树，数据的准备工作一般比较简单；能够同时处理多种数据类型...

2020-03-15 15:04:38 171

原创一定要导入Python的visuals模块

先把这个文件和你要敲代码的文件夹放在一起，然后再导入。import visuals as vs

2020-03-11 08:32:00 2974 5

原创新媒体运营P2笔记-02.新媒体人的三种境界（能力进阶）

1.新媒体人的三层境界：第一层：专业突破--加班到深夜，独上高楼，继续追热点。专业突破要超过70%，知道传播逻辑。（1）内容运营：传播=内容（连接深度-比如分享、收藏数量）+渠道（连接点数，比如发布渠道及质量）+时效（连接速度）。内容的决定权：爆款内容=50%选题（公众号风格风险价值观）+20%标题（初次打开率）+30%泛文案（分享率、收藏率）内容方法：内容=形式+文案+逻...

2019-12-26 10:00:44 374

原创新媒体运营P2笔记-01导论

1.新媒体的困惑：不同公司相同岗位工作内容不一样。2.趋势：运营能力>内容能力；新媒体人再去新媒体化3.案例：比如新世相招聘内容产品主编、教研员；运营岗：增长黑客呀。4.新媒体人再去新媒体化，要求的新媒体运营的能力模块：内容运营：内容生产、内容传播等平台运营：新媒体矩阵、微博、小程序用户增长：内容增长、裂变增长、付费增长等用户运营：社群运营、个人号运营等投放运...

2019-12-26 09:20:06 192

原创苹果股票分析-python时间序列

```# -*- coding: utf-8 -*-import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdef quarter_volume(): data=pd.read_csv("/Users/liyili2/Downloads/shiyanlou/apple.csv",header=0)...

2019-12-11 11:16:45 183

原创如何做好PPT

我们要清楚：PPT是为演示而生的，我们要始终坚持一个原则：图》表〉文字我们要做到图多文字少。那么如何做到呢：1.找出主框架，找出每个大点的要点，再看能不能用图来表示，记住，删删删，不该留的都删了，这是你思想提升的一个过程。2.设计的原则：-对齐对齐对齐；-每一页的颜色不要超过3个；-统一统一统一：相同等级颜色要统一、字号要统一、间距要统一、样式要统一。...

2019-12-11 11:16:08 103

原创华泰人工智能系列之一人工智能选股框架及经典算法简介

1.人工智能含义：本质是以数理模型为核心工具，结合控制论、认知心理学等其它学科的研究成果，最终由计算机系统模拟人类的感知、推理、学习、决策等功能。2.机器学习的对象：是某种客观存在的规律。规律有简单、复杂的。智能投顾学习的是资本市场中投资决策和收益之间的规律。3.机器学习遵循基本的流程：数据获取、特征提取、数据转换、模型训练、模型选择和模型预测。1）数据获取数据获取途...

2019-12-09 21:28:50 1878

原创 02.信用评分建模：案例与操作-04分箱输出需要满足的条件

2019-11-28 17:23:49 63

原创 02.信用评分建模：案例与操作-03卡房分箱实现步骤.

2019-11-28 17:16:11 122

原创梳理一遍数据库知识

2-2（1）-4_创建、调整以及删除表格#1 生成数据表结构CREATE TABLE users( user_id INT PRIMARY KEY, name VARCHAR(20), age INT, city VARCHAR(20), state VARCHAR(20), monthly_active INT #PRIMARY KEY(us...

2019-11-26 15:32:48 244

原创绘图轴的标签以及seaborn和matplotlib区别

1.seaborn绘制boxplot'''使用seaborn方法：'''fig1,axes=plt.subplots(2,1,figsize=(20,16))sns.barplot(x=q1data_top20_f1['city'],y=q1data_top20_f1['_id_nor'],ax=axes[0])axes[0].set_title('知友数量top 20',fontsi...

2019-10-20 12:35:36 2476

原创 python数据清洗值-把一列的年、月、日替换成.

超级快，谁能告诉我为什么可以整列replace？？数据格式如下：大神写的方式：python操作方式：def data_time(df,*cols): for col in cols: df[col] = df[col].str.replace('年','.') print(df[col]) df[col] = df[co...

2019-10-19 20:14:34 1193

原创 10分钟学会用Pandas做多层级索引

参考：https://blog.csdn.net/weixin_42232219/article/details/96408308

2019-10-18 12:03:49 133

原创 pandas和SQL对比

参考：https://blog.csdn.net/weixin_39791387/article/details/81391621https://www.cnblogs.com/niuniuc/p/10490159.htmlhttps://blog.csdn.net/weixin_42147780/article/details/100674967

2019-10-17 19:04:28 264

原创用spyder做数据分析

用spyder做数据分析

2019-10-16 11:23:23 2242

原创 jupyter notebook超级好用的功能

Ctrl+B：打开和关闭测试窗口Shift+Enter：运行代码https://blog.csdn.net/weixin_43593330/article/details/100534641

2019-10-05 17:01:24 322

原创 jupyter notebook主题设置

jt -t gruvboxd -T -N # 这个是设置主题jt -r # 这个是重置，即还原成默认的主题参考网址：https://www.jianshu.com/p/8197845602b1https://blog.csdn.net/weixin_43593330/article/details/100534641...

2019-10-05 16:58:45 414

原创 python数据分析包

2019-10-04 22:30:38 91

原创 numpy.random.rand()和numpy.random.randn区别

参考：https://blog.csdn.net/u012149181/article/details/78913167

2019-10-03 21:44:27 105

原创统计学梳理

概率分布分类分为离散型概率分布和连续型概率分布离散型概率分布的概率函数被称为概率质量函数。连续型概率分布对应的函数称为概率密度函数。离散型概率分布分为二项分布（结果只有2个）、多项分布（结果至少3个）、超几何分布（有限总体中有放回的抽样分布）和泊松分布在实际运用中，只要数据总体的个案数目是样本容量的10倍以上，即N>=10n，就可以用二项分布近似超几何分布。泊松分布...

2019-10-03 10:50:11 132

原创 pandas读取csv数据中文显示乱码

其实，还是编码的问题，修改编码方式为GB18030如下：data = pd.read_csv('sample.csv', encoding='GB18030')参考：https://blog.csdn.net/weicao1990/article/details/81316871...

2019-09-30 11:04:35 1742

原创 Mac UserWarning: findfont: Font family ['SimHei'] not found

问题定位是因为缺少SimHei字体。解决：1.下载字体：http://www.fontpalace.com/font-download/SimHei/2.在终端输入python3,进入python33.输入:import matplotlibmatplotlib.matplotlib_fname()4.复制出来的地址到另一旁,exit() 退出python3：...

2019-09-25 14:40:58 5542 2

转载 jupyter notebook中markdown使用小技巧

https://www.jianshu.com/p/576e3f1049f8

2019-09-24 15:49:29 1796

原创统计学N问？？？

1.统计学怎么产生的？2.统计学是用来解决什么问题的？到底有什么现实意义？他的发展是怎么样，为什么会这么发展？运用和借鉴的原理有哪些，这些原理是怎么回事，为什么可以借鉴。3.统计学为什么会有这么庞大的理论和方法，基于什么原因从一棵枝干分为那么多的枝节，遇到了什么现实问题，需要解决什么问题，人们又是怎么样对现有方法进行改进的，逻辑是什么，可以学习吗？4.所有的统计学方法的原假设和备择假设...

2019-09-23 23:21:47 236

原创统计理论基础框架

2019-09-22 17:55:50 213

原创原假设和备择假设

原假设：我们不希望的结果备择假设：我们希望的结果

2019-09-22 17:29:29 3678

原创解决问题--Using a non-tuple sequence for multidimensional

报错：/anaconda3/lib/python3.7/site-packages/scipy/stats/stats.py:1713: FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`...

2019-09-18 14:27:16 547

空空如也

空空如也