自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Zstarling的博客

twinkle, twinkle, little star, how I wonder what you are

  • 博客(64)
  • 资源 (5)
  • 收藏
  • 关注

原创 python-Dataframe的8种小示例

Python 小技巧

2024-02-08 10:28:38 915 1

原创 Python- 分区判断的写法及其5种优化方法

执行以上代码,分别使用了 pd.cut(),np.where(),np.select() 和 apply() 这些方法来统计 col1一列分组后的数据量,各方法的返回值 count1、count2、count3、count4 分别储存在 DataFrame 中。有存在随机的10000个数据,请用Python将判断每个数在哪个区间,并输出,区间分为,小于0,0到50,50到100,100 到1000,1000以上。是Python内置函数,可以用于在遍历一个可迭代的对象时,同时返回一个计数和相应的值。

2024-02-08 09:58:54 940

原创 SQL(COALESCE)

非空值查找及替换COALESCE

2023-12-04 23:33:40 681 1

原创 基于SQL语言的数据库管理系统

常见的SQL数据库管理系统具体区别PLPGSQL和MYSQL的区别

2023-12-04 23:32:26 993

原创 SQL -高阶3

字符串拼接与类型转换最大,最小值,提取日期部分的数值日期截断

2023-12-03 21:47:49 1535 1

原创 python basic3-zstarling

python 基础

2023-12-03 14:42:14 640

原创 python-绘图(主次坐标轴)

【代码】python-绘图(主次坐标轴)

2023-12-03 14:37:34 488

原创 sklearn库简述-zstarling

划分数据集from sklearn.model_selection import StratifiedShuffleSplit 评估模型:用于计算真实值与预测值之间的预测误差from sklearn.metrics import accuracy_score, log_loss _score结尾的函数,返回值越大,效果越好;_loss结尾的函数,返回值越小,效果越好。K近邻分类器集(KNN算法)from sklearn.neighbors import KNeighborsClas

2023-05-25 11:37:54 136

原创 面试题集合1

数据标准化方法有最小-最大标准化、z-score标准化、小数定标标准化、对数变换。最小-最大标准化将数据转换为0到1之间的范围,通过对每个数据点进行以下计算实现:(X-Xmin)/(Xmax-Xmin),其中X表示原始值,Xmin表示数据中的最小值,Xmax表示数据中的最大值。该方法的主要特点是保留了数据的相对大小和顺序关系。z-score标准化将数据转换为均值为0,标准差为1的分布,通过对每个数据点进行以下计算实现:(X-μ)/σ,其中X表示原始值,μ表示数据的平均值,σ表示数据的标准差。

2023-05-25 11:30:23 323 1

原创 Python-pandas的基础函数

【代码】Python-pandas的基础函数。

2023-04-18 12:50:51 112

原创 SQL-日期时间函数

【代码】SQL-日期时间函数。

2023-03-30 23:49:06 82

原创 SQL 三天连续问题

三天连续登录,三天重复出现,三次连续且值大于

2023-03-24 20:51:04 663

原创 MYSQL-高阶2

with在sql语句中定义在group by之后。当需要对数据库数据进行分类统计的时候,往往会用上groupby进行分组。而在groupby后面还可以加入withcube和withrollup等关键字对数据进行汇总。使用 WITH ROLLUP,此函数是对聚合函数进行求和,注意 with rollup是对 group by 后的第一个字段,进行分组计算。count多条件计数,是指满足多条件行的计数,且count统计不计入空值。MySQL是可以支持直接创建字段值,但是牛客不可以,解决方式在下方。

2023-03-12 03:39:18 153

原创 SQL(HIVE)-insert用法

SQL(HIVE)-insert创建表。

2022-11-29 16:28:57 4030

原创 SQL(HIVE -HUE)剔除的三种方式

第四种方法是第三种方法的删减版,但是在hive中会报错,无语法错误。应该是不支持这种写法,至于原因还未找到,若有大佬,请指教。上述三种方法中,一般不建议使用not in。IS NULL 的执行速度最快。

2022-11-16 14:17:49 1272

原创 Python写入EXCEL

pd.ExcelWriter写入open写入方法write与writelines对比表格Dataframe形式的写入for、with 位置对比

2022-07-13 16:08:15 7406

原创 MYSQL--高阶1

文章目录----zstarling----------zstarling------IFNULL函数ifnull(x,y)表示

2022-07-12 16:28:55 74

原创 Linux-操作1(替换文本内容)

Linux字符串替换

2022-07-01 11:21:27 4230

原创 Linux-操作1(去重)

默认升序(ASCII码方式)。-b :数值排序-f:小写转化成大写排序-r:降序排序-u:去重-n:以数值的方式排序-t:设置分隔符()-k:指定列数()uniq: 去重默认删除重复行(重复行只保留一个)。当重复的行并不相邻时,uniq 命令是不起作用的。所以一般与sort连用。-c:去除重复行并记录出现次数(保留重复行)-u:仅显示出现一次的行列(不保留重复行)-d:只保留重复行wc:计数默认显示顺序为行数、字数(单词数)、字节数-w:字数-c:字节数-l:行数-n

2022-06-07 14:04:38 833

原创 SQL-窗口函数

窗口函数

2022-05-28 02:07:22 1487

原创 Python连接SQL与hive

--ZstarlingSQL连接hive连接补充写入方法write与writelines对比表格Dataframe形式的写入for、with 位置对比SQL连接import pymysqldef sql(path): conn = pymysql.Connect(host='36.104.34.123', user='用户名', passwd='密码', db='库名') # 获取游标 cursor = conn.cursor() # 1、从数据库中查询 sql

2022-05-06 23:04:39 1448

原创 SQL函数计算和union

截断平均值写法SELECT b.tag, b.difficulty, -- 去掉最大值与最小值取平均,保留一位小数 ROUND(( SUM( a.score )- MAX( a.score )- MIN( a.score ))/( COUNT( score )- 2 ), 1 ) FROM examination_info b LEFT JOIN exam_record a ON b.exam_id = a.exam_id WHERE b.tag = "SQL" AND b.di..

2022-03-11 16:50:10 227 2

原创 SQL-concat字符串连接

CONCAT和CONCAT_WS的区别:concat 是按左到右的次序依次连接字段值。CONCAT_WS是用第一个字段作为连接符来连接后续字段值。SELECT uid, CONCAT( DATE_FORMAT( start_time, '%Y-%m-%d' ), ':', tag ), CONCAT_WS( ':', DATE( start_time ), ei.tag ) FROM exam_record er JOIN examination_info ei ON er.ex.

2022-03-11 16:35:16 863

原创 SQL(count)

count判断条件计数方式,不能直接在count中用等号=,此时显示的是对是否等于1的结果的计数,并不是等于1时的计数。可以用sum-0-1的方式代替。SELECT uid, sum(IF( submit_time IS NULL, 1, 0 )) `0`, sum(IF( submit_time IS NULL, 0, 1 )) `1`, count( IF ( submit_time IS NULL, 0, 1 )= 1 ) `total` FROM exam_record GROUP

2022-03-11 15:57:50 1435

原创 SQL-索引index

索引创建、删除与使用:create方式创建索引:建表时创建索引CREATE TABLEIF NOT EXISTS user_info_vip ( id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID', uid INT UNIQUE NOT NULL COMMENT '用户ID', nick_name VARCHAR(64) COMMENT '昵称', achievement INT DEFAULT 0 COMMENT '成就值',

2022-02-25 15:51:54 1504

原创 SQL-插入insert四种方式

单条插入INSERT INTO `test`.`exam_record_before_2021`VALUES ( 6, 1001, 9002, '2020-01-02 09:01:01', '2020-01-02 09:21:01', 70 );多条插入INSERT INTO `test`.`exam_record_before_2021` ( `id`, `uid`, `exam_id`, `start_time`, `submit_time`, `score` )VALUES (.

2022-02-24 11:54:50 8059

原创 Python-pivot_table,merge解析

pivot_table

2022-01-12 18:04:50 1611

原创 python-openpyxl(样式设计)

openpyxl

2022-01-11 17:58:21 488

原创 SQL经典1-45题(4个表)-zstarling

Table structure for courseDROP TABLE IF EXISTS `course`;CREATE TABLE `course` ( `Cid` int(11) NOT NULL, `Cname` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL, `Tid` int(11) NULL DEFAULT NULL) ENGINE = InnoDB ..

2021-06-05 18:51:46 128 2

原创 SQL经典1-45题-zstarling

1.查询" 01 “课程比” 02 "课程成绩高的学生的信息及课程分数SELECT * FROM ( SELECT * FROM score sc WHERE sc.Cid = 1 ) AS cid1, ( SELECT * FROM score sc WHERE sc.Cid = 2 ) AS cid2 WHERE cid1.score > cid2.score AND cid1.sid = cid2.sid;1.1查询同时存在" 01 “课程和” 02 "课程的情况.

2021-06-03 22:26:15 283

原创 python basic2-zstarling

basci

2021-05-28 00:55:46 96

原创 python库简介-zstarling

matplotlib.cm是matplotlib库中内置的色彩映射函数。matplotlib.cm语法 matplotlib.cm.色彩即对[数据集]应用[色彩]示例:plt.cm.Set1(catagory)色彩集cmaps = [('Perceptually Uniform Sequential', [ 'viridis', 'plasma', 'inferno', 'magma', 'cividis']), ('Sequential', [.

2021-05-27 18:57:52 426

原创 Git基本操作代码-zstarling

切换分支git checkout maingit checkout basic删除文件git rm * `删除全部文件`git rm 文件名 删除文件夹rmdir 文件夹名新建文件夹touch 文件夹名新建文件mkdir 文件名删除文件或者新建文件直接提交就可以,不需要add查看日志Git log --oneline git log提交操作git commit -m "提交记录"git commit -a -m "提.

2021-05-27 14:40:18 68

原创 数据库三范式原则

2021-05-21 14:37:27 286

原创 Scikit-Learn 三、模型选择与评估

详情见模型选择与评估

2021-04-26 10:39:19 78

原创 scikit-learn 一、监督学习

详情见监督学习

2021-04-26 10:38:26 108

原创 Scikit-Learn 五、数据集转换

详情见数据集转化

2021-04-26 10:38:14 114

原创 Scikit-Learn 二、无监督学习

详情见无监督学习

2021-04-26 10:38:06 102

原创 scikit-learn库

详情见scikit-learn

2021-04-26 10:37:50 46

原创 R-lasso 回归

数据读取data.fl <- read.csv(“D:\important APP\study\R\data1.csv”,header=T, encoding=“UTF-8”)names(data.fl)dim(data.fl)先做一个正常的回归看看效果fit.fl.lm <- lm(Prfmc~., data.fl)summary(fit.fl.lm)对X,Y赋值Y <- data.fl[,18]# extract YX.fl <- model.matrix(P

2021-03-22 23:46:17 1366

scikit-learn.xmind

SK-Learn 流程

2021-04-27

五、数据集转换.xmind

数据的清洗

2021-04-27

三、模型选择与评估.xmind

三、模型选择与评估.xmind

2021-04-27

二、无监督学习.xmind

无监督学习大纲

2021-04-27

一、监督学习.xmind

监督学习大纲

2021-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除