自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(67)
  • 资源 (2)
  • 收藏
  • 关注

原创 箱线图(boxplot)

箱线图的原理介绍,在python中的绘制方法,在R语言中的绘制方法

2023-11-11 18:02:11 481

原创 数据降维(Data Dimensionality Reduction)

介绍了数据降维的概念原理和应用(PCA降维)

2023-11-10 20:52:21 239

原创 一元线性回归(Simple Linear Regression)

一元线性回归,是一种统计分析方法,用于研究一个因变量和一个自变量之间的线性关系。一元线性回归模型通常表示为 y = a*x + b,其中a是斜率,b是截距。其表示的含义是,自变量x每增加一个单位,因变量y平均增加a个单位。一元线性回归是一种强大的统计分析工具,可以用来探索和理解两个变量之间的线性关系。然而,对于非线性关系或其他更复杂的关系时就不适用了,需要其他更复杂的模型,如多元线性回归,逻辑回归,等等。

2023-09-25 12:30:36 1318

原创 数据集相关网站(Open datasets and sources)

国内和国外的各种数据网站,可以查询和下载多种数据集,用于数据分析或者机器学习等。

2023-08-05 17:01:52 376

原创 Class 09 - Data Frame和查看数据

介绍了Dataframe数据格式,以及数据导入后如何查看数据

2023-05-23 13:42:05 541

原创 Class 08 - 数据的读取和保存 & R语言中的管道(pip)功能

上面介绍了如何加载R语言内置的数据集,这些内置的数据集一般都是用来做数据分析的练习来使用的。在实际工作中,分析的数据都是从数据库或者其他地方整理过的数据,大部分都是需要从本地电脑中导入的,那么下面就介绍如何使用readr功能包来读取文件。readr功能包是tidyverse功能包 的一个核心功能包。

2023-05-22 18:25:23 1174

原创 Class 07 - 功能包的安装和 tidyverse 介绍

众多的功能包是使 R语言 在分析数据中表现出色的重要组成部分。本篇介绍R语言中工具包的安装和加载,以及tidyverse功能包的介绍

2023-05-20 19:20:11 2391

原创 Class 06 - 良好的编码习惯(保持代码的可读性)

使用清晰一致的编码风格通常会使你的代码更容易被其他人阅读和理解。

2023-05-19 18:20:48 596

原创 Class 05 - 逻辑运算符and,or,not 和 条件语句 if

R语言中的逻辑运算符可以帮助我们对两个操作数据执行逻辑运算,逻辑运算符可以帮助我们实现复杂的逻辑操作。条件语句是一种用于控制程序流程的语句,它可以根据某个条件来执行特定的操作,或者在满足特定条件的情况下重复执行某些操作。

2023-05-18 19:32:28 2481

原创 Class 04 - 日期时间格式

了解到如何在**R**中使用`tidyverse` 功能包 和`lubridate` 功能包来处理日期和时间类型的数据。

2023-05-17 17:57:48 672

原创 Class 03 - R语言的 Vectors(向量) 与 lists(列表)

你将会了解到R的一些基本概念,包括函数、注释、变量、数据类型、向量和管道。

2023-05-16 21:08:50 1258

原创 Class 02 - R语言&Rstudio的安装

R语言的安装步骤 以及 RStudio的安装步骤

2023-05-15 17:12:05 1041

原创 Class 00 - 学习编程的方法&不同职业所使用的编程语言

其实日常生活中有可能你已经接触到了简单的编程。例如,使用电子表格函数执行计算,对数据进行排序,或者使用SQL告诉计算机如何从数据库中提取数据,把两个或者多个不同的数据表连接。编程甚至更进一步。它为您提供了对数据的最高级别控制。要编程,首先需要了解一门编程语言。我们要学习编程语言的基础知识,以及它们如何帮助您处理数据。

2023-05-10 19:51:15 545

原创 Class 01 - R语言介绍及部分功能演示

如果这是你第一次接触计算机编程,R是一个很好的起点。当我第一次开始学习数据分析时,我也没有编程的背景。不过我是先接触的Python语言,之后再学习的R语言。

2023-05-09 22:30:02 623

原创 爬虫 - QS世界大学排名数据

QS世界大学排名是由教育组织Quacquarelli Symonds(简称QS)每年发布的全球各地大学排名情况的系列排名之一。该排名是根据大学的学术水平、研究质量、国际化程度、教师素质、学生满意度等多项指标综合评估得出的,参考数据来源广泛,包括了全球各大权威研究机构的数据统计和排名情况。QS世界大学排名分为多个子排名,包括综合排名、学科排名、地区排名等。其中,综合排名按照学术水平、教学质量、研究产出、国际化程度等指标对全球大学进行排名,参考数据来源为全球各大权威研究机构的数据统计和排名情况。

2023-05-02 17:00:24 2940

原创 统计学的一些基本概念

统计学是关于数据的一门学问。所有收集而来的数据都需要经过整理、分析才能得出结论,这就是统计学利用数据解决实际问题的全过程。但是你会发现,同一个数据可以使用不同的方法进行分析进而得出不同的结论,不同的数据使用同一种方法进行分析也可以得出不同的结论。如天气预报,不同的预报机构其预报结果不尽相同。而且,由统计分析得出的结论往往还具有不确定性(uncertainty),因为其描述的往往是某件事发生的机会(opportunity),可以用概率(probability)来衡量。

2023-04-02 14:24:40 639

原创 第十二章 - 条件判断(case when 和 if)和视图

条件判断函数 case when 的用法,if 的用法视图(view)的创建和用法

2023-02-24 16:16:40 1461

原创 第十一章 - 模糊匹配(like)、正则匹配(REGEXP)、文本处理函数、时间处理函数

模糊匹配like()的用法,正则匹配REGEXP的用法,文本拼接concat(),文本提取substring(),substring_index()的用法其他常用文本处理函数,常用日期和时间函数等

2023-02-22 18:14:40 1363

原创 第十章 - 窗口函数(rank,row_number,dense_rank)

介绍了窗口函数:rank,row_number,dense_rank,以及 聚合窗口函数:avg() , max() , min() , sum()

2023-02-21 21:55:15 329

原创 第九章 - 多表查询(join,left join 等),合并查询(union & union all),子查询

多表查询(join,left join 等)的使用合并查询(union 和 union all) 的使用介绍

2023-02-21 16:20:47 1047

原创 第八章 - 数据分组( group by , having , select语句顺序)

主要讲解 group by,having的用法select查询语句的执行顺序

2023-02-17 22:26:23 695

原创 第七章 - 聚合函数(count,avg,sum,max,min)和一些数学函数

聚合函数 count ,avg ,sum ,max ,min 的用法还有一些常见的数学函数的用法介绍。

2023-02-17 20:38:26 977

原创 第六章 - 数据过滤where(where与and和or的组合用法)

where的基本用法,where与and和or的组合用法

2023-02-16 15:24:09 902

原创 第五章 - 排序的使用 (order by)

SQL语法,order by的用法

2023-02-16 08:00:00 377

原创 第四章 - 基础查询语句(select,distinct,limit)

基础查询语句select , distinct , limit 的基本用法

2023-02-15 18:30:20 421

原创 第三章 - 初步使用(创建删除和查看数据库)

查看、创建、数据库信息

2023-02-15 16:52:05 37

原创 第二章 - 数据库的链接

如何链接数据库

2023-02-15 13:34:19 33

原创 第一章 - 对数据库和SQL的简单了解

简单的了解什么是数据库。

2023-02-15 11:51:09 244

原创 数据分布 - 直方图&密度图(R语言)

直方图和密度图的应用和R语言代码实现

2022-10-25 17:06:38 2173

原创 折线图(运营数据分析)--python

使用python绘制折线图

2022-07-08 14:48:49 3148

原创 一元线性回归(R语言)

目录一元线性回归一元线性回归建模的大致思路如下:1. 确定因变量与自变量之间的关系1.1 查看变量间有没有相关关系1.2计算相关系数1.3 检验相关系数2.建立模型,并对模型进行估计和检验2.1 回归模型的拟合2.2 计算回归系数的置信区间2.3 绘制拟合图3.利用回归方程进行预测3.1 利用回归方程进行预测3.2 绘制置信带和预测带3.3 计算 x0 = 500 时销售收入的点预测值、置信区间和预测区间4. 对回归模型进行诊断4.1 回归预测值(pre)、残差(res)、标准化残差(zre)4.2 检验线

2022-05-03 19:37:45 11862 2

原创 R语言-假设检验

R语言 假设检验

2022-05-02 23:05:09 5477

原创 例009-不重复的两个数

例009 不重复的两个数1.问题描述给定一个数组a[],其中除了2个数,其他均出现2此,请找到不重复的两个数并返回。2.问题示例给出 a = [1,2,5,5,6,6]返回 [1,2]除1和2外其他数都出现了2次,因此返回[1,2]给出 a = [3,2,7,5,5,7]返回 [2,3]除了2和3其他数都出现了2次,因此返回[2,3]代码实现...

2021-12-21 21:28:08 237

原创 例008-勒索信

例008 勒索信1.问题描述给定一个勒索信内容的字符串和另一个表示杂志内容的字符串,写一个方法拍段能否通过剪下杂志中的内容构造出这封勒索信,若可以,返回True,否则返回False。注:杂志字符串中的每一个字符仅能再勒索信中使用一次。2.问题示例输入: ransomNote = 'aa' , magazine = 'aab'输出: True勒索信的内容可以从杂志内容剪辑而来。3 代码实现# 转码为 ASCII 值后 a=97,b=98,c=99..... z=122 d

2021-12-20 20:42:17 227

原创 例006-下一个更大的数

例006 下一个更大的数1.问题描述两个不重复的数组nums1和nums2,其中nums1是nums2的子集。在nums2的相应位置找到nums1所有元素的下一个更大数字。nums1中的数子x的下一个更大数字是nums2中x右边第一个更大的数字。如果它不存在,则为此数字输出-1。nums1和nums2中的所有数字都是唯一的,nums1和nums2的长度补偿过10002.问题示例输入: nums1 = [4,1,2], nums2 = [1,3,4,2]输出: [-1,3,-1]对于第1个

2021-12-19 18:35:26 201

原创 例007-字符串中的单词数

例例006 下一个更大的数1.问题描述计算字符串中的单词数,其中一个单词定义为不含空格的连续字符串2.问题示例输入:'Hello,my name is John'输出:53.代码实现方法1def countSegments(s): num = 0 for i in range(len(s)): if s[i] != ' ' and (i == 0 or s[i-1]==" "): num += 1 return num

2021-12-19 18:30:44 126

原创 例005-二分查找

例005 二分查找1.问题描述给定一个排序的整数数组(升序)和一个好查找的目标整数target,查找到target第1次出现的下表(从0开始),如果target不存在于数组中,返回-12.问题示例输入数组[1,4,4,5,7,7,8,9,9,10]和目标整数1,输出其所在得位置为0,即第一次出现在第0个位置输入数组[1,2,3,3,4,5,10] 和目标整数3,输出:2,即第一次出现在第2各位置。输入数组[1,2,3,3,4,5,10] 和 目标整数6,输出: -1,即没有出现

2021-12-18 21:30:12 83

原创 例004-相对排名

例004 相对排名1.问题描述根据N名运动员得分,找到相对等级和获得最高分前3名的人,分别获得金牌、银牌、和铜牌。N是正整数,并且不超过10000.所有运动员的成绩都保证是独一无二的2.问题示例输入:[5,4,3,2,1]输出:['Gold Medal','Silver Medal','Bronze Medal','4','5']前3名运动员得分较高,根据得分一次获得金牌,银牌,铜牌,对于后两名运动员,根据分数输出相对等级。3.代码实现def findRelativeRanks(n

2021-12-18 21:25:13 274

原创 例003-旋转字符串

例003-旋转字符串1.问题描述给定一个字符串(以字符数组的形式)和一个偏移量,根据偏移量原地从左向右旋转字符串2.问题示例输入: str = 'abcdefg', offset = 3输出: 'efgabcd'输入: str = 'abcdefg', offset = 0输出: 'abcdefg'输入: str = 'abcdefg', offset = 1输出: 'gabcdef'返回旋转后3.代码实现def rotateStrinig(s,offset):

2021-12-18 21:21:57 276

原创 例002-合并排序数组

例002 合并排序数组1.问题描述合并两个升序的整数数组A和B,形成一个新的数组,新数组也要有序。2.问题示例输入: A= [1] , B = [1]输出: [1,1]返回合并后的数组输入: A = [1,2,3,4], B = [2,4,5,6]输出: [1,2,2,3,4,4,5,6]返回合并后的数组3.代码实现def mergeSortedArray(A,B): i = 0 j = 0 out_array = [] # 比较两个数组的数

2021-12-18 21:17:19 269

QS世界大学排名爬虫代码 - 第三部分

QS世界大学排名爬虫代码 - 第三部分

2023-05-02

QS世界大学排名爬虫代码 - 第二部分

QS世界大学排名爬虫代码 - 第二部分

2023-05-02

QS世界大学排名爬虫代码 - 第一部分

QS世界大学排名爬虫代码 - 第一部分

2023-05-02

SQL案例使用数据-review表

sql教程使用数据集

2023-02-22

SQL案例使用数据-product表

教程案例使用数据集

2023-02-22

SQL演示数据集 - user-profile(用户基本信息)

SQL练习数据简化版

2023-02-20

SQL演示数据集 - raw-sample(样本骨架数据)

SQL练习数据简化版

2023-02-20

SQL演示数据集 - behavior-log(行为数据表)

SQL练习使用数据

2023-02-20

SQL演示数据集 - ad-feature(广告基本信息表)

用于SQL练习使用,

2023-02-20

NFL Big Data Bowl 2023 全部数据集

kaggle数据集,NFL Big Data Bowl 2023 全部数据集, 可以用于机器学习,数据分析等相关练习

2023-02-16

一元线性回归-示范数据

一元线性回归-示范数据

2022-05-03

R语言-假设检验-data

R语言-假设检验-data

2022-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除