5 安吉尼尔

尚未进行身份认证

我要认证

永远有疑问的代码发烧友

等级
TA的排名 9w+

Categorical类型

一 介绍在数据中,一个列有可能会包含很多重复值,这时会对重复值进行分类。往往在使用过程中会通过unique、value_counts等函数对重复值进行唯一性的提取和重复个数的统计。而还有一类数据类型可以帮助统计对应的值和表示的键。这类数据在系统可以称为维度表,维度表包含了不同值,并将主要观测存储为引用维度的整数键。可以通过如下例子进行展示,在例子代码中,这种按照整数展现的方式被称为分类或者字典编码展现。不同值的数组可以被称为数据的类别、字典或者层级。import numpy as npimport

2020-06-27 14:21:52

Python的文件读取与写入

访问数据往往是使用各种分析工具的第一步,数据文件与数据格式常常有很多种,通过python对数据文件的访问包括对文件的读取和写入,主要总结数据形式包括常用的txt,csv,json格式,Excel格式。Python的文件读取与写入1 读写txt文本1.1 读取txt文件1.2 写入txt2 读写csv文件2.1 读取csv文件2.2 写入csv3 读写json格式数据3.1 读取字符串3.2 转换为字符串4 读写Excel数据4.1 读取excel4.2 写入Excel1 读写txt文本1.1 读取t

2020-05-30 20:41:12

指针的总结

从指针的基本概念可以理解,在计算机中,数据是存储在计算机的存储单元中,每个存储单元都有一个编号,指针就是对应着存储单元的编号,根据指针就可以找到也就是数据存储的地址。1 指针的类型指针的类型是指针本身所具有的类型,一般去掉指针变量名,就是指针的类型。int*p;//指针的类型是int*char*p;//指针的类型是char*int(*p)[3];//指针的类型是int(*)[3]...

2020-04-30 19:41:00

Python时间数据类型

目录1 datetime基本知识点1.1 存储精细度1.2 计算时间差1.3 加减求另一个时间2 日期与字符串的转换2.1 时间类型转为字符串2.2 字符串转为时间数据类型时间类型数据在生活中非常常见,经济、金融、物理等方面都会使用到,在观测数据过程中,对于时间序列数据常常使用的有三种:时间戳 :具体的时刻时间间隔 :由开始和结束的时间戳表示固定的时间区间 :比如说2020年一整年Pyt...

2020-03-31 20:57:06

Endnote使用中的问题总结

使用Endnote过程中遇到两个问题:如何批量录入,加载项每次需打开重新加载,针对以上两个问题,进行学习中的总结一 批量录入Endnote在使用谷歌学术引用文献时,录入的参考文献都是一条一条的,如果有大量的文献需要导入,就要求重复通过Endnote导入,非常不方便。通过实际的实践,有两种方法。1.1 简单批量录入的方法适用性: 适合文献量10个左右,方法比较简单方法: 将谷歌学术导出的...

2020-02-16 11:28:49

Pandas整数索引

在pandas上使用整数索引容易产生歧义,因为它和在列表、元组内构建数据结构进行索引有一点不同。1.整数索引如下代码ser = pd.Series(np.arange(3.))ser[-1]返回的结果为:Traceback (most recent call last): File "G:\soft\anaconda\install\lib\site-packages\IPyth...

2020-01-31 19:02:14

基于R lavaan 进行SEM分析总结

前期对SEM模型的构建以及问卷题项设计工作已经完成,本部分从问卷数据收集以及处理完成后开始分析。一理论部分1.1验证性因子分析验证性因子分析CFA的主要目的在于进行效度验证,它与探索性因子分析有所不同。探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,推断模型的内部结果。而验证性因子分析的主要是决定事前定义因子的模型拟合实际数据的能力,以试图检验...

2020-01-31 16:39:54

smartPLS入门操作学习

最近在使用使用smartPLS软件进行实证分析,奈何在网上有关smartPLS的入门综合学习的帖子实在是少之又少,学习不系统,一路走来,心中不免感慨良多,针对自己在学习中的过程,做一个简单的入门总结。1. SmartPLS介绍1.1 smartPLS是什么smartPLS是一款用于偏最小二乘法进行结构方程建模的统计分析软件,非常灵活好用,一般应用在管理学、组织行为学以及信息系统等领域。...

2019-12-24 22:17:24

Netlogo仿真初步学习总结

Netlogo初步学习总结一 Net logo理解及获得渠道二 软件的初步了解1.初始界面2.界面频繁使用的区域三 一个仿真如何进行(前情概要)1. 仿真世界的构成2. 仿真如何推进四 实战学习—牛吃草的仿真1.项目描述2.主要代码3.界面五 我遇到的问题1 符号的问题2.go按钮的执行与tick一 Net logo理解及获得渠道1.是什么:Net logo是一个系统仿真软件,利用该软件,可以...

2019-11-11 17:24:08

梳理2 伪随机数

实际的代码中往往会使用到随机数,random函数往往具有生成随机数的功能,另外numpy.random模块在python内建的random模块基础上,可以高效生成不同概率分布下的完整样本值数组。所谓伪随机数,是由具有确定性行为的算法根据随机数生成器中的随机数种子生成的样本生成的几个常用的分布函数列表如下:1. 随机种子:seed函数1.1 随机数种子的理解理解:由上文对伪随机数的理解...

2019-11-03 16:47:15

梳理1 Python内建数据结构

1.1元组【理解】:固定长度,不可变对象序列,逗号分隔,圆括号【元组生成】赋值方式:Tup = 2,3,4Tuple函数转化:tup = tuple([2,3,4,5])【元组的操作】元组内部可变对象的修改:+连接元组生成更长的元组元组的拆包(赋值变量进行拆包):普通拆包,嵌套拆包,*rest位置拆包【元组的方法】count方法: a.count(2)1.2列表**【理解】...

2019-10-27 15:19:34

安装endnote和使用endnote的简单几步

一 为什么使用endnote在写论文中,不免会用到文献引用的问题。如果没有接触过endnote,粗糙的方法可以使用word里面自带的引用方式:引用——插入如下图所示,一开始觉得还挺只能,但是有很多缺点就会暴露出来。比如说如果文献特别多不同期刊切换时格式不好统一修改;后期的文献不利于管理;尾注内容还得自己添加等等。如果这个时候你已经开始烦恼这些事情,可以考虑使用endnote。至于endnote对...

2019-07-30 18:42:40

函数式编程中常用的函数(总结)

一 函数式编程理解** 1.函数式编程的含义:**函数式编程是一种编程的基本风格,就是构建程序的结构和元素的方式。函数式编程将计算过程看做是数学函数,也就是可以使用表达式编程。在函数的代码中,函数的返回值只以来传入函数的参数,因此使用相同的参数调用2次就会得到相同的结果。如果说这段话很难理解,我觉得可以这么想,函数式编程就是一种函数,或者是一种结构,在该结构中,将函数和函数的参数都作为参...

2019-07-30 17:23:08

邮件合并功能:使用Excel批量生成word内容

一功能简要介绍1.使用背景:生活中在分发成绩单、请帖、各种证书时,往往要根据excel里面的数据根据固定的word格式填入固定的内容,然后打印出来分发给对应的人,比如说要对公司内的部分员工进行表彰,员工名单有...

2019-06-30 23:12:53

多个Excel表合并成一个Excel表

一使用说明问题描述:往往在进行数据统计分析前,会遇到数据分在不同的表里的情况,这时候就需要将多个表的数据先放到一个表的数据里面,然后再进行分析。比如班级需要汇总每个人的信息,几十人每个人都发了个人的信息表,一个一个表的数据打开粘贴,不仅麻烦,而且还可能出错,这样的做法是最简单粗暴但是很浪费时间的。当然,如果是大批量的数据使用python或者其他语言汇总到一个表里也是可行的,如果是小批量的几百...

2019-06-30 17:38:04

求排名第n的薪水(学习中)

一 题目编写一个 SQL 查询,获取 Employee 表中第 n 高的薪水(Salary)。表的内容是如下:±—±-------+| Id | Salary |±—±-------+| 1 | 100 || 2 | 200 || 3 | 300 |±—±-------+要去从表里面筛选出第n高的薪水,如果表里的内容为空,则返回空值null,例如,当n=...

2019-06-24 21:34:53

一种使用Python计算可达矩阵的简单方法

在进行编码前要简单介绍几个知识点:有向图,邻接矩阵,可达矩阵有向图、邻接矩阵、可达矩阵有向图现实中常常会表示从一个地点到另一个地点的路径,这样的带有从起点到终点的路线表示可以用有向图表示。如下图所示:在该图中,可以看成由地点F1到F2,以及F1到F3,F3到F2的路径。这种有向图也表示两个因素的相互影响关系,再结合上面的有向图,我们可以理解为因素F1对因素F2有影响,对F3也有影响,因...

2019-03-31 18:08:42

pandas读取csv文件

1.导入的包:import pandas as pdimport numpy as np2.读取文件我主要使用的是CSV文件格式,内容为如下:将数据加入到指定路径中,然后进行读文件:def read_csv(path): f = open(path, encoding='utf-8') read_data = pd.read_csv(f) # print(r...

2019-03-04 15:49:56

MySql提取重复邮件

题目大致是这样的:给了一张Person表,表的字段有Id和邮件名称Email,然后从表里面找出重复的邮件。原表是:±—±--------+| Id | Email |±—±--------+| 1 | a@b.com || 2 | c@d.com || 3 | a@b.com |±—±--------+通过Mysql查询语句可以的到的重复表结果为:±--------...

2019-02-07 11:50:58

数据库:筛选出Employee工资高于Manager工资的人员(Mysql)

原题目是这样的:±—±------±-------±----------+| Id | Name | Salary | ManagerId |±—±------±-------±----------+| 1 | Joe | 70000 | 3 || 2 | Henry | 80000 | 4 || 3 | Sam | 60000 ...

2019-02-02 18:53:07

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。