自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 资源 (2)
  • 问答 (6)
  • 收藏
  • 关注

原创 SQL练习和解答 9. 使用含有关键字exists查找未分配具体部门的员工的所有信息--exists的使用

题目描述使用含有关键字exists查找未分配具体部门的员工的所有信息。CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hire_date` date NOT NULL,PRIMARY KEY (

2020-06-05 22:29:40 310

原创 SQL练习及解答 9. 获取有奖金的员工相关信息--表的连接

题目描述获取有奖金的员工相关信息。CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hire_date` date NOT NULL,PRIMARY KEY (`emp_no`));CREATE

2020-06-03 23:53:48 560

原创 data camp笔记 python

listA list can contain any Python type. But a list itself is also a Python type. That means that a list can also contain a list!使用Slicing方法来访问list中的元素:list[start, end] : 包括 start, 不包括endlist[:end]: 从0开始到end(不包括end);list[:-1]: 最后一个list[start:] : 从

2020-06-03 22:44:44 498

原创 SQL练习及解答 8.统计salary的累计和running_total--表的连接和子查询

题目描述按照salary的累计和running_total,其中running_total为前N个当前(to_date = '9999-01-01')员工的salary累计和,其他以此类推。 具体结果如下Demo展示。。CREATE TABLE `salaries` ( `emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KE.

2020-06-02 23:43:10 334

原创 SQL练习及解答 5. 查找所有员工的last_name和first_name以及对应部门编号dept_no

题目描述查找所有员工的last_name和first_name以及对应部门编号dept_no,也包括暂时没有分配具体部门的员工(请注意输出描述里各个列的前后顺序)CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`dept_no`));CREA

2020-06-01 22:10:41 452

原创 SQL练习及解答 7. 查找薪水变动超过15次的员工号emp_no以及其对应的变动次数t--having的使用

题目描述查找薪水变动超过15次的员工号emp_no以及其对应的变动次数tCREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`from_date`));select emp_no, count(salary) tfrom salariesg

2020-06-01 22:01:16 512

原创 SQL练习及解答 6. 找所有员工入职时候的薪水情况--表的多条件连接

题目描述查找所有员工入职时候的薪水情况,给出emp_no以及salary, 并按照emp_no进行逆序(请注意,一个员工可能有多次涨薪的情况)CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hir

2020-05-31 23:47:08 277

原创 SQL练习及解答 4. 查找所有已经分配部门的员工的last_name和first_name以及dept_no--表的连接

题目描述查找所有已经分配部门的员工的last_name和first_name以及dept_no(请注意输出描述里各个列的前后顺序)CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`dept_no`));CREATE TABLE `employ

2020-05-29 22:18:20 376

原创 SQL练习及解答 3.查找当前薪水详情以及部门编号--表的连接

题目描述查找各个部门当前(dept_manager.to_date='9999-01-01')领导当前(salaries.to_date='9999-01-01')薪水详情以及其对应部门编号dept_no(请注意输出结果,dept_no列是最后一列)CREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL comment '部门编号',`emp_no` int(11) NOT NULL comment '员工编号',`from_date` d

2020-05-28 21:17:53 317

原创 SQL练习及解答 2. 查找入职员工时间排名倒数第三的员工所有信息--limit m,n的使用

题目描述查找入职员工时间排名倒数第三的员工所有信息,为了减轻入门难度,目前所有的数据里员工入职的日期都不是同一天CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hire_date` date NO

2020-05-27 17:02:04 1580

原创 SQL练习及解答 1. 查找最晚入职员工的所有信息--子查询的使用

题目描述查找最晚入职员工的所有信息,为了减轻入门难度,目前所有的数据里员工入职的日期都不是同一天CREATE TABLE `employees` (`emp_no` int(11) NOT NULL comment '员工编号',`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hire_date`.

2020-05-27 16:45:40 406

原创 leetcodeSQL1179. 重新格式化部门表(难度:简单)--行列转换

部门表 Department:+---------------+---------+| Column Name | Type |+---------------+---------+| id | int || revenue | int || month | varchar |+---------------+---------+(id, month) 是表的联合主键。这个表格有关于每个部门每月收入的信息。月份...

2020-05-26 21:30:47 335

原创 leetcode-SQL 627. 交换工资(难度:简单)--update 的使用

给定一个 salary 表,如下所示,有 m = 男性 和 f = 女性 的值。交换所有的 f 和 m 值(例如,将所有 f 值更改为 m,反之亦然)。要求只使用一个更新(Update)语句,并且没有中间的临时表。注意,您必只能写一个 Update 语句,请不要编写任何 Select 语句。例如:| id | name | sex | salary ||----|------|-----|--------|| 1 | A | m | 2500 || 2 | B | ...

2020-05-25 22:35:09 159

转载 ScreenFlow 9.0.3 中文版 优秀的屏幕录像软件

应用介绍ScreenFlow是macOS系统上的一款老牌录屏软件,不仅仅支持简单的屏幕录制,还包含各种简单和复杂的编辑功能,可以说是制作屏幕录制视频的强大软件。当然,软件非常专业,对于一般用户来说,使用macOS自带的 Quicktime 就可以实现简单的屏幕录制需求了。下载地址:https://share.weiyun.com/5GZL0Ga“Mac应用”已损坏,打不开解决办法https://mp.csdn.net/console/editor/html/106317855转载自:

2020-05-24 17:29:31 861

转载 “Mac应用”已损坏,打不开解决办法

问题说明:通常在非 Mac App Store下载的软件都会提示“xxx已损坏,打不开。您应将它移到废纸篓”或者“打不开 xxx,因为它来自身份不明的开发者”。原因:Mac电脑启用了安全机制,默认只信任Mac App Store下载的软件以及拥有开发者 ID 签名的软件,但是同时也阻止了没有开发者签名的 “老实软件”解决方法:1. macOS Mojave 10.14及以下系统:打开「终端.app」,输入以下命令并回车,输入开机密码回车sudo spctl --master-d

2020-05-24 17:25:46 658

原创 leetcode-SQL 626. 换座位(难度:中等)--奇偶数和case when的使用

小美是一所中学的信息科技老师,她有一张 seat 座位表,平时用来储存学生名字和与他们相对应的座位 id。其中纵列的 id 是连续递增的小美想改变相邻俩学生的座位。你能不能帮她写一个 SQL query 来输出小美想要的结果呢?示例:+---------+---------+| id | student |+---------+---------+| 1 | Abbot || 2 | Doris || 3 | Emer...

2020-05-24 15:09:41 340 1

原创 leetcode-SQL 620. 有趣的电影(难度:简单)--奇数偶数的区别

某城市开了一家新的电影院,吸引了很多人过来看电影。该电影院特别注意用户体验,专门有个 LED显示板做电影推荐,上面公布着影评和相关电影描述。作为该电影院的信息部主管,您需要编写一个 SQL查询,找出所有影片描述为非boring(不无聊)的并且 id 为奇数的影片,结果请按等级 rating 排列。例如,下表 cinema:+---------+-----------+--------------+-----------+| id | movie | descr...

2020-05-22 23:13:16 457

原创 leetcode-SQL 601. 体育馆的人流量(难度:困难)--自表连接

X 市建了一个新的体育馆,每日人流量信息被记录在这三列信息中:序号 (id)、日期 (visit_date)、 人流量 (people)。请编写一个查询语句,找出人流量的高峰期。高峰期时,至少连续三行记录中的人流量不少于100。例如,表 stadium:+------+------------+-----------+| id | visit_date | people |+------+------------+-----------+| 1 | 2017-01-01 |...

2020-05-22 01:17:49 426

原创 leetcode-SQL 595. 大的国家(难度:简单)--OR的使用

这里有张 World 表+-----------------+------------+------------+--------------+---------------+| name | continent | area | population | gdp |+-----------------+------------+------------+--------------+---------------+| Afghanist...

2020-05-19 22:04:21 149

原创 leetcode-SQL 185. 部门工资前三高的所有员工(难度:困难)--排序函数使用(dense_rank())

(这题可联系184题来思考)Employee 表包含所有员工信息,每个员工有其对应的工号 Id,姓名 Name,工资 Salary 和部门编号 DepartmentId 。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+--------------+| 1 | Joe | 85000 | 1 || 2 | Hen...

2020-05-18 23:13:08 238

原创 leetcode-SQL 197. 上升的温度(难度:简单)--表的自连接,datediff()的使用

给定一个 Weather 表,编写一个 SQL 查询,来查找与之前(昨天的)日期相比温度更高的所有日期的 Id。+---------+------------------+------------------+| Id(INT) | RecordDate(DATE) | Temperature(INT) |+---------+------------------+------------------+| 1 | 2015-01-01 | 10 ...

2020-05-18 23:04:48 207

原创 【数据分析】概率/条件概率

例子:A在办公室概率0.75,B在办公室概率0.25,A一周穿红衣服2次,B一周穿红衣服3次,当看到一个穿红衣服的人,那么这个人是谁?(按一天工作5天算)是A且穿红衣概率:0.75* (2/5)是B且穿红衣概率:0.25*(3/5)有人穿红衣的概率:0.75*(2/5)+0.25*(3/5)穿红衣且是A的概率:P(A)=( 0.75* (2/5))/ (0.75*(2/5)+0.25*(3/5))= 67%同理求出穿红衣且是B的概率:P(B)= 33%...

2020-05-17 03:54:42 344

转载 关于Spark

Spark 的使用场景和资源这里有一些关于 Spark 的不同使用场景和资源:数据分析 机器学习 数据流 图形分析什么情况下不需要使用 SparkSpark 就是为处理单台机子无法承载的数据集而生的。但如果你只是处理小数据,那就不需要使用 Spark 了。如果你的数据可以装到一台电脑里,那你可以有很多别的选择去处理数据,比如:AWK- 一个处理文档数据的命令行工具 R- 一个统计计算的编程语言和程序 Python PyData Stack一个包括 pandas matplo...

2020-05-16 04:10:45 128

原创 leetcode-SQL 184. 部门工资最高的员工(难度:中等)-- 排序函数的使用(rank()/dense_rank())

Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+--------------+| 1 | Joe | 70000 | 1 || 2 | Henry | 80000 | 2 || 3...

2020-05-16 00:08:45 271

原创 leetcode-SQL 183.从不订购的客户(难度:简单)--NOT IN的使用

某网站包含两个表,Customers 表和 Orders 表。编写一个 SQL 查询,找出所有从不订购任何东西的客户。Customers 表:+----+-------+| Id | Name |+----+-------+| 1 | Joe || 2 | Henry || 3 | Sam || 4 | Max |+----+-------+Orders 表:+----+------------+| Id | CustomerId |+----+----...

2020-05-14 01:29:07 129

原创 leetcode 196. 删除重复的电子邮箱 / Delete Duplicate Emails--表(行)的删除

编写一个 SQL 查询,来删除Person表中所有重复的电子邮箱,重复的邮箱里只保留Id最小的那个。+----+------------------+| Id | Email |+----+------------------+| 1 | [email protected] || 2 | [email protected] || 3 | [email protected] |+----+------------------+Id 是这个表的主键。例如,在运...

2020-05-12 22:50:49 283

原创 leetcode 182.查找重复的电子邮箱(难度:简单)--having用法

编写一个 SQL 查询,查找Person 表中所有重复的电子邮箱。示例:+----+---------+| Id | Email |+----+---------+| 1 | [email protected] || 2 | [email protected] || 3 | [email protected] |+----+---------+根据以上输入,你的查询应返回以下结果:+---------+| Email |+---------+| [email protected] |+---------+说明:所有电子邮箱都是小写字母...

2020-05-12 01:54:11 369

原创 【数据分析】统计学--期望和均值的区别

假设某一离散变量X的取值范围来自于集合A,A={X1,X2,X3,X4,...XN},对集合A进行可放回抽样M次(参考上节),产生容量为M的抽样数据集S,数据集S的离散变量X的取值为:{X(1),X(2),X(3),...X(M)},X(K)表示第K次可放回抽样的值。变量X期望E(X):抽样数据集S的变量X的均值:期望:变量所有可能取值与其出现概率乘积之和。均值:所有抽样数据变量之和的平均值。辛钦大数定理:辛钦大数定理证明了,若抽样数据的样本量足够大,那么变.

2020-05-11 18:06:02 2266

原创 leetcode 180. 连续出现的数字(难度:中等)-- 多表连接

编写一个 SQL 查询,查找所有至少连续出现三次的数字。+----+-----+| Id | Num |+----+-----+| 1 | 1 || 2 | 1 || 3 | 1 || 4 | 2 || 5 | 1 || 6 | 2 || 7 | 2 |+----+-----+例如,给定上面的 Logs 表, 1 是唯一连续出现至少三次的数字。+-----------------+| ConsecutiveNums |+------...

2020-05-09 19:30:48 165

原创 leetcode 178.分数排名(难度:中等)--dense_rank使用

编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。+----+-------+| Id | Score |+----+-------+| 1 | 3.50 || 2 | 3.65 || 3 | 4.00 || 4 | 3.85 || 5...

2020-05-03 23:54:00 205

原创 leetcode 177. Second Highest Salary / 第N高的薪水(难度:中等)--limit的用法

编写一个 SQL 查询,获取 Employee 表中第n高的薪水(Salary)。+----+--------+| Id | Salary |+----+--------+| 1 | 100 || 2 | 200 || 3 | 300 |+----+--------+例如上述Employee表,n = 2时,应返回第二高的薪水200。如果不存在...

2020-04-24 11:51:54 138

原创 leetcode-SQL 176. Second Highest Salary / 第二高的薪水 (难度:简单)

编写一个 SQL 查询,获取 Employee表中第二高的薪水(Salary)。+----+--------+| Id | Salary |+----+--------+| 1 | 100 || 2 | 200 || 3 | 300 |+----+--------+例如上述Employee表,SQL查询应该返回200 作为第二高的薪水。如果不存在...

2020-04-22 18:09:32 142

原创 leetcode-SQL 262. Trips and Users / 行程和用户(难度:困难)--多表连接和筛选

Trips表中存所有出租车的行程信息。每段行程有唯一键 Id,Client_Id 和Driver_Id 是Users表中 Users_Id 的外键。Status 是枚举类型,枚举成员为 (‘completed’, ‘cancelled_by_driver’, ‘cancelled_by_client’)。+----+-----------+-----------+---------...

2020-04-22 16:22:46 386

原创 【SQL】删除函数delete, truncate, drop区别

delete truncate drop 是否要commit 为DML(data ManipulationLanguage),要commit 为DLL(datadefinelanguage),不用提交,不能回滚 为DLL(da...

2019-11-16 17:29:02 427

原创 【SQL】窗口函数/开窗函数

窗口指一个字段的数据范围, 原则上只能写在SELECT子句中。同时具有分组和排序功能,不减少原表的行数(group by 可能减少原表行数,而partition by 不会)。HQL distribute by & cluster by & order bydistribute by 会把相同的值分配到同一个reduce里;cluster by其实就是distr...

2019-11-16 16:47:18 1393

原创 【SQL】排序函数

1. ROW_NUMBER()排序值相同时序号不同,依次排序且不会重复,注意使用row_number函数时必须要用over子句选择对某一列进行排序才能生成序号。其基本原理是先使用over子句中的排序语句对记录进行排序,然后按照这个顺序生成序号。over子句中的order by子句与SQL语句中的order by子句没有任何关系,这两处的order by 可以完全不同2. RANK()...

2019-11-16 16:05:57 5659

原创 【小练习】SQL-查重

查出重复的学生名NO name 1 JONE 2 LILY 3 TOM 4 LILY 5 TOM 方法一:SELECT nameFROM(SELECT name, count(name) numFROM table) tWHERE num &...

2019-10-25 11:52:03 215

原创 NOTE【数据分析】变量间的关系

1. 不相关:相互间没有线性关系。随机变量 X 和 Y 的相关系数 r(X,Y)=0。2. 独立:若同时发生等于各自发生的乘积,即满足P(AB) = P(A)P(B), 那么A B 互相独立。独立一定不相关,但不相关不一定独立。3. 互不相容:若不能同时发生,则不相容,A∩B= Φ。4. 对立:在互不相容的基础上再加上一个条件,P(A)+P(B)=1,则为对立。有你...

2019-09-30 16:19:42 666

原创 数据分析面试题-随记

1.# 给一个list,里面是str类型的数字,求和。li = ['1','5','7']# 解答:把list转成arr, 把arr中的str元素转成int, 再对arr求和import numpy as nparr = np.asarray(li)number = arr.astype(int)number.sum()2.答:让A先取剩下的宝石需是4的倍数,第...

2019-09-28 23:21:09 133

原创 【机器学习】随机森林

1. 什么是随机森林以决策树作为基学习器,boosting为集成方法的一种监督学习方法。随机森林会随机选择指定数量的属性,再从这些属性中挑选出最优属性进行划分,而传统决策树则是选择最优的属性进行划分。这里的参数k控制了随机性的引入程度。如果k=d(全部属性集),则基决策树的构建=传统决策树构建。如果k=1,基决策树每个节点随机选择一个属性进行划分。一般推荐k=log2d。2. 优缺点...

2019-08-21 02:58:02 469

Python for Data Analysis 2nd Edition(源代码+数据+高清新版)(是新的python3电子版,不是扫描的。)

原版Python for Data Analysis 2nd Edition(源代码+数据+高清新版)(是新的python3电子版,不是扫描的。)

2018-04-22

《python金融大数据分析》《利用python进行数据分析》

《python金融大数据分析》和《利用python进行数据分析》PDF电子完整版

2018-04-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除