清平乐的技术博客-CSDN博客

原创金融业大数据应用场景

如果能够引入外部数据，还可以进一步加快数据价值的变现。外部数据中比较好的有社交数据、电商交易数据、移动大数据、运营商数据、工商司法数据、公安数据、教育数据和银联交易数据等。大数据在金融行业的应用范围较广，典型的案例有花旗银行利用 IBM 沃森电脑为财富管理客户推荐产品，并预测未来计算机推荐理财的市场将超过银行专业理财师；摩根大通银行利用决策树技术，降低了不良贷款率，转化了提前还款客户，一年为摩根...

2020-04-07 17:05:48 7902 2

原创量化交易主流框架介绍

量化交易主流框架介绍talibtalib的简称是Technical Analysis Library,主要功能是计算行情数据的技术分析指标numpy介绍：一个用python实现的科学计算包。包括：1、一个强大的N维数组对象Array；2、比较成熟的（广播）函数库；3、用于整合C/C++和Fortran代码的工具包；4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包s...

2018-10-15 19:16:46 6023 6

原创 Navicat在分辨率不同的屏幕窗口显示大小不一致问题解决

2.选择【兼容性】-在兼容性页面中选择**“更改高DPI设置”**1.右击navicat图标-属性。

2023-12-05 21:39:28 873

原创 hive进行base64 加密解密函数

【代码】hive进行base64 加密解密函数。

2023-10-18 13:22:03 1314

原创程序员辞职十大原因

很多软件开发者纷纷离职，这并不令人意外。当软件开发人员被迫加班，并且他们对升职加薪或工作的灵活性要求被置之不理时，他们要么悄悄辞职，要么开始寻找新的机会。有些人甚至会选择同时干多份工作来赚更多薪水。即使大型科技公司的裁员在过去一年频频成为新闻头条，很多软件开发人员依然敢于离职，因为他们对科技行业保持乐观态度，并对寻找新工作的能力非常自信。接下来，我们将深入探究软件开发人员离职主要原因，并提出有效策略以降低人才流失的风险。

2023-08-16 16:30:49 538

原创 Windows查看电脑出厂时间

BIOS版本时间大概就是出厂时间。

2023-07-17 09:30:52 569

原创 Pycharm设置Python文件页眉默认信息（作者姓名、创建时间等）

次点击File->Settings->Editor->File and Code Templates->然后选择Python script.后将下列代码复制到右边的框框中，然后选择apply应用，就可以啦。

2023-07-12 01:11:18 489

原创 Python实现操作MySQL【增删改查】

闲话少叙，直接上操作！

2023-07-11 22:43:50 582

原创 Stay hungry.！Stay Foolish！——乔布斯

今天，我们来重温一下乔布斯在斯坦福大学的演讲这是一场富有哲理且热血十足的演讲，他对所有的年轻人说：Stay hungry. Stay Foolish.这是乔布斯一生经验的总结，值得反复听，反复思考。中英文对照翻译Thank you. I am honored to be with you today at your commencement from one of the finest universities in the world. Truth be told, I n

2023-06-11 16:28:45 690 1

原创 DCMM八大模块——数据战略域

数据战略：组织开展数据工作的愿景、目的、目标和原则。包括数据战略规划、战略实施、战略评估。数据战略能力域关注整个组织数据战略的规划、愿景和落地实施，为组织数据管理、数据应用工作的开展提供战略保障，组织的数据战略需要和业务战略保持一致，并且要在利益相关者之间达成一致。

2023-05-29 17:01:58 1008

原创 DCMM简介（数据分析必读）

上周末北京的某评估机构对我们公司进行了DCMM评估模型相关知识的培训工作，收获颇丰，感觉DCMM是一个高大上又是一个对企业和公司非常实用的工具。特整理专栏知识，跟各位童鞋共享。

2023-05-29 15:46:40 391

原创一文读懂ChatGPT

ChatGPT 是⼀种基于深度学习的⾃然语⾔处理技术，它可以⽣成⾼质量的⾃然语⾔⽂本。该技术是由 OpenAI 团队开发，旨在使计算机能够像⼈类⼀样理解和产⽣⾃然语⾔。ChatGPT 使⽤了深度神经⽹络和⾃然语⾔处理技术，通过对⼤量语⾔数据的学习和建模，实现了⾃然语⾔⽣成和对话系统的⾃动化。ChatGPT 的核⼼是⼀个神经⽹络模型，该模型可以根据已有的语⾔数据集⾃动学习语⾔的规律和模式，并使⽤这些知识来⽣成新的⽂本。

2023-05-25 14:16:26 1864

原创 2023中国数字技术算法算力百强榜

智慧应用类企业最多，达37家，以美团为代表；ICT基础设施类和底层智能算法类企业各有17家，分别以华为和网易为代表；计算芯片类企业15家，以联发科为代表；计算网络与平台类企业14家，以腾讯为代表；计算保护类企业5家，以三六零为代表。北京的企业最多，有32家；广州第四，有9家，其中广州黄埔区4家；斑马网络、远景智能、Momenta、平凯星辰、慧智微、杰创智能、瑞松智能、高云半导体、广电五舟、致景科技入围“未来之星企业”上榜企业平均价值1900亿元，上榜门槛260亿元，其中四家企业价值上万亿元。

2023-05-18 16:19:41 482

原创 Presto时间函数

最近项目中用到了Presto，负责后台的搭建和接口开发，Presto部分语法和常用SQL有些区别，特为大家整理如下，避免踩坑。

2023-05-17 15:15:01 1127

原创视频加速播放插件-Global Speed

有时候我们觉得看视频的过程中视频播放的太慢了，希望能够加快一点播放的速度，谷歌浏览器里面有很多有意思的插件。例如Global Speed就可以控制视频播放的速度。

2023-04-28 10:19:30 2848

原创 Python 中使用 Azure Blob 存储

本文介绍如何使用适用于 Python 的 Azure 存储客户端库来上传 blob。你可以上传 blob，打开 blob 流并写入流，或者上传带有索引标记的 blob。Azure 存储中的 Blob 已组织成容器。必须先创建容器，才能上传 Blob。

2023-04-20 08:28:12 328

原创 Hive几个常用数学函数

【代码】Hive几个常用数学函数。

2023-04-03 14:03:39 163

原创一文读懂【数据埋点】

埋点的技术实质，是先监听软件应用运行过程中的事件，当需要关注的事件发生时进行判断和捕获，然后获取必要的上下文信息，最后将信息整理后发送至服务器端。所监听的事件，通常由操作系统、浏览器、APP框架等平台提供，也可以在基础事件之上进行触发条件的自定义（如点击某一个特定按钮）。一般情况下，埋点可以通过监测分析工具提供的SDK来进行编程实现。埋点的业务意义显而易见，即帮助定义和获取分析人员真正需要的业务数据及其附带信息。在不同场景下，业务人员关注的信息和角度可能不同。

2023-02-27 15:41:40 500

原创 MySQL实现row_number排序功能（不用函数）

这篇文章主要介绍了mysql使用自定义序列实现row_number功能,本文分步骤通过实例代码给大家介绍的非常详细，需要的朋友可以参考下

2023-02-27 11:33:50 618

原创 MySQL生成排序序号RN

(select @i:=0) b：每次查询时都会重新排序；如果想要每次查询有累加的效果，可以去掉。

2023-02-27 11:25:02 231

原创【小技巧】Navicat查看数据库密码

打开这个网址：https://tool.lu/coderunner，将如下PHP代码复制进去。找到这行代码 $decode = $navicatPassword->decrypt(‘然后在网页上面执行代码，就可以得到密码了。’这几个字替换为步骤三复制出的的密码。

2022-11-29 10:10:59 1314

原创【好书推荐】《Python编程：从入门到实践（第2版）》

然而，以写入模式（‘w’）打开文件时千万要小心，因为如果指定的文件已经存在，Python将在返回文件对象前清空该文件的内容。for循环是一种遍历列表的有效方式，但不应在for循环中修改列表，否则将导致Python难以跟踪其中的元素。可以方便地下载全书的源代码，此外还给出了第一部分每章的一个PPT，一个全书知识点速查的图，还给出了大部分章节的视频讲解，算是比较用心了。不错的python入门书，第一部分讲基础知识，第二部分讲了三个实际的项目：一个小游戏，一个数据可视化程序，一个网站。

2022-11-03 13:41:18 1052

原创【好书推荐】《华为数据之道》

数据技术要产生实际价值，需要良好的数据治理体系保驾护航。最近华为出版了《华为数据之道》一书，给出了非数字原生企业在数据管理方面的实战经验，特别适合于面临数字化转型的企业管理者、数据从业者。

2022-11-02 16:32:22 896

原创 Presto集群Web UI界面详解

Presto Web UI 可以用来检查和监控Presto集群，以及运行的查询。他所提供的关于查询的详细信息可以更好的理解以及调整整个集群和单个查询。Presto Web UI所展示的信息都来自于Presto系统表.当你进入Presto Web时，你将会看到如同1所示的界面：主要分为上下两部分，上面描述了集群信息，下面是查询列表。...

2022-08-29 16:01:19 2099 2

原创程序员=加班？？掌握时间才能掌握人生

总是有些人一生中有无数作为，而更多的人耗费一生的时间最终换来了不过四个字“死因不详”。

2022-08-09 14:21:34 351

原创【数仓设计】企业数仓为什么要进行分层？（六大好处）

后来随着公司业务的发展，数据的沉淀，数据仓库发展到一定阶段，发现数据的使用杂乱无章，各种业务都是从原始数据直接计算而得。当然你公司数据规模小，非不分层可不可以，当然可以。而且便于维护数据的准确性，当数据出现问题之后，可以不用修复所有的数据，只需要从有问题的步骤开始修复。简单来讲可以这样理解，我们最终给业务诚信的是一能直接使用的张业务表，但是它的来源有很多，如果有一张来源表出问题了，我们希望能够快速准确地定位到问题，并清楚它的危害范围。规范数据分层，开发一些通用的中间层数据，能够减少极大的重复计算。...

2022-08-09 09:15:28 1461

原创 Impala时间函数总结

Impala是基于hive并使用内存进行计算，兼顾数据仓库，具有实时，批处理，多并发等优点。impala元数据都存储在hive的metastore当中，并且impala兼容hive的绝大多数sql语法。所以需要安装impala的话，必须先安装hive，保证hive安装成功，并且还需要启动hive的metastore服务。............

2022-07-27 16:42:29 1094

原创 PPT模板、素材下载网站（纯干货，建议收藏）

清平乐博主精心收集PPT模板，纯干货！

2022-07-06 16:04:03 2196

原创【Python数据分析】matplotlib绘图

matplotlib.pyplot是一个在python中可实现的函数，例如创建图形、在图形中创建创建一个绘图区域、在绘图区域中你那个绘制一些线、在图形中添加标签之类的。

2022-07-05 13:15:36 606

原创【Python数据分析】Pandas中的绘图函数

Pandas中有许多能够利用DataFrame对象数据特点来创建标准图表的高级绘图方法2.柱状图3.饼图4.面积图5.直方图

2022-07-05 11:49:40 514

原创【Python数据分析】Pandas常用操作（二）

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])array([[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11],[12, 13, 14, 15]])

2022-07-05 11:35:46 145

原创【Python数据分析】Pandas常用操作（一）

pandas基于Numpy构建，最初被作为金融数据分析工具使用因此pandas为时间序列分析做了很好的支持。pandas的两种数据结构：Series和DataFrame0 41 72 -53 3dtype: int64RangeIndex(start=0, stop=4, step=1)RangeIndex(start=0, stop=4, step=1)3/1 43/2 73/3 -53/4 3dtype: int64Index([‘

2022-06-21 21:05:06 366

原创【Python数据分析】Numpy常用操作（二）

[ 0.2303069 1.00300936 -0.92357035 0.06525841 0.19994871 -1.403636920.01230236 -0.08950691 -1.13518494]-1.4036369214062031.003009355191414-0.22678593093886062-2.0410733784497457[-1.40363692 -1.13518494 -0.92357035 -0.08950691 0.01230236 0.06525

2022-06-20 16:20:06 151

原创【Python数据分析】Numpy常用操作（一）

二、一维和多维数组1.创建数组（一维、多维）array([6, 7, 8])[[1 2 3 4][5 6 7 8]]dtype(‘int32’)(2, 4)[[1 2 3 4][5 6 7 8]]int64[6. 7.5 8. 9. ]float64array([6, 7, 8, 9], dtype=int64)array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])array([0., 0., 0., 0., 0., 0., 0.,

2022-06-19 20:16:47 371

原创【由浅入深学Python】Python之禅

Python之禅体现了Python语言的设计哲学，其中的观点适用于任何的程序设计中。其实这不仅仅是程序设计的哲学，也是一种人生哲学，一名优秀的程序设计者应该有较深的哲学和人文科学积累。

2022-06-08 09:48:56 2249 2

原创【由浅入深学Python】import 语句的四种用法

import 语句

2022-06-08 09:40:28 1393

原创【由浅入深学Python】面向对象3 模块类和日期时间类

模块也是类，例如pandas模块

2022-06-08 09:31:04 123

原创【由浅入深学Python】面向对象2 类的继承和重写

继承：代码的重用，子类获得父类的全部功能‘Xiaojin’Xiaojin is now sitting重写（overwrite）:如果父类的方法不能满足需求，可以在子类中重写父类的方法‘Xiaoha’Xiaoha is now sitting,My age is 2

2022-06-08 09:21:46 166

原创【由浅入深学Python】面向对象1 类的定义和使用

（1）类是某类事物的统称，对象是实物。例如：动物是一个类，狗和猫是对象。（2）类通过实例化，得到对象（1）类具有属性和方法（2）__init__方法是一个特殊的方法，每次用类创建对象的时候，都会自动运行这个方法。该方法的名称，开头和结尾都各有两个下划线，这是一个约定，避免跟其他普通方法名称冲突（3）参数self是一个指向对象本身的引用，让对象能否访问类中的属性和方法。self是自动传递不需要手动传递，所以在根据类创建对象时，只需要给后面的形参（name,age）提供值。...

2022-06-08 09:17:56 155

原创【由浅入深学Python】函数5 格式化函数

格式化函数

2022-06-08 09:13:50 288

HiveSQL开发指南2021.rar

介绍HiveSQL的相关知识和常用开发代码，实用、便捷。密码qingpingyue01,欢迎下载

2021-12-06

Airflow安装配置和web端插件安装

网络中关于airflow的资料比较少，这里做了一下整理： 1.整理centos7中airflow的安装配置 2.原生airflow默认不支持web端的拖拽实现dag,需要写python脚本，这里我做了一个插件安装说明，可以从网页端实现dag的编写

2020-07-01

数仓规范文档.rar

本文档整理数据仓库搭建过程中的分层结构和数据库、表名、字段命名规范，对数仓开发、大数据开发有重要帮助，欢迎下载。有问题随时博客留言或者私信我。

2020-05-30

navicat 连接oracle 11g驱动包

我的Navicat 版本是Navicat Premium 12 ，最近在windows环境中远程连接新项目的Oracle（11g版本）连接报错。我在之前项目中连接Oracle12是不报错的，也不需要做任何配置，直接选择basic或者TNS连接方式都可以顺利连接，刚开始也很恼火，查了资料后，加载这个驱动就行，最终解决,这里面还有连接hive和mysql的，大家也可以存一下

2020-05-28

陀螺仪调度部署和使用（美云智数）.rar

整理美云智数调度工具部署和使用。美云智数，源自于财富世界500强企业美的集团信息科技，基于先进企业的业务实践，把管理实践软件产品化，为大中型企业提供智能制造、大数据、数字营销、移动办公、身份管理、财务与人力、IT咨询等领域的云产品与解决方案。

2020-05-14

azkaban安装包（web+excutor）

zkaban是一个Hadoop workflow定时调度工具，它解决了多个Hadoop任务单元之间的前后依赖关系。它提供了十分友好的用户界面，使用简单，容易上手。这里为大家提供azkaban2.5调度工具的全套安装包，具体安装步骤可以参考我的博客

2020-03-27

集群搭建手册_CDH5.13.1版.docx

整理企业级Hadoop_CDH集群的搭建步骤和常见问题解决方案，包括环境配置，安装步骤和使用方法，最后将搭建过程中的常见错误做了总结和解释

2020-03-11

TensorFlow.xmind

整理python机器学习常用算法，里面涵盖基础操作，案例解析和注意事项，包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机，TensorFlow等，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day10-决策树与贝叶斯.xmind

整理python机器学习常用算法，里面涵盖基础操作，案例解析和注意事项，包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机、决策树、贝叶斯等，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day9-LinearRegression线性回归与逻辑斯蒂回归.xmind

整理python机器学习常用算法，里面涵盖基础操作，案例解析和注意事项，包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机等，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day8-KNN.xmind

2020-01-13

Day7-pandas-Ⅳ：数据加载与透视表.xmind

整理python数据分析库的重要知识，包括ipython、numpy、pandas（重要，包括3个文档）、scipy包、matplotlib图形绘制,共计7个文档，里面涵盖基础操作，案例解析和注意事项，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day6-matplotlib.xmind

2020-01-13

Day5-Scipy.xmind

2020-01-13

Day4-pandas-Ⅲ.xmind

2020-01-13

Day3-pandas-Ⅱ.xmind

2020-01-13

Day2-pandas-Ⅰ.xmind

2020-01-13

Day1-IPython与Numpy.xmind

整理python数据分析库的重要知识，包括ipython、numpy、pandas（重要，包括3个文档）、scipy包、matplotlib图形绘制,共计7个文档，里面涵盖基础操作，案例解析和注意事项，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

115个Java面试题和答案——终极（下）_ (1).pdf

资料包含115道java常考面试题，共分为两个文档分为上下两册，内容来自北京著名iT培训机构，实战性强，欢迎下载！

2019-06-29

115个Java面试题和答案——终极（上）.pdf

资料包含115道java常考面试题，共分为两个文档分为上下两册，内容来自北京著名iT培训机构，实战性强，欢迎下载！

2019-06-29

机器学习06--线性回归

回归的目的是预测数值型的⽬目标值。最直接的办法是依据输入写出一个目标值的计算公式

2018-11-08

机器学习05--朴素贝叶斯

朴素贝叶斯算法是有监督的学习算法，解决的是分类问题，如客户是否流失、是否值得投资、信用等级评定等多分类问题。

2018-11-08

机器学习09--决策树02

ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征，递归地构建决策树。从根结点(root node)开始，对结点计算所有可能的特征的信息增益，选择信息增益最大的特征作为结点的特征，由该特征的不不同取值建立子节点；再对子结点递归地调用以上方法，构建决策树；直到所有特征的信息增益均很小或没有特征可以选择为⽌止，最后得到一个决策树。

2018-11-08

机器学习03--决策树01

决策树(decision tree)是⼀一种基本的分类与回归方法。流程图就是⼀一个决策树，长方形代表判断模块(decision block)，椭圆形成代表终⽌止模块 (terminating block)，表示已经得出结论，可以终止运行行。从判断模块引出的左右箭头称作为分支(branch)，它可以达到另一个判断模块或者终⽌止模块。

2018-11-08

机器学习03--sklearn手写数字识别

Scikit learn 也简称sklearn，是机器器学习领域的python模块，sklearn包含了了很多机器器学习的方式

2018-11-08

机器学习02--K近邻算法

k近邻法(k-nearest neighbor, k-NN)是1967年年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理理是：存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后，将新的数据的每个特征与样本集中数据对应的特征进⾏行行⽐比较，然后算法提取样本最相似数据(最近邻)的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

2018-11-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

HiveSQL开发指南2021.rar

Airflow安装配置和web端插件安装

数仓规范文档.rar

navicat 连接oracle 11g驱动包

陀螺仪调度部署和使用（美云智数）.rar

azkaban安装包（web+excutor）

集群搭建手册_CDH5.13.1版.docx

TensorFlow.xmind

Day10-决策树与贝叶斯.xmind

Day9-LinearRegression线性回归与逻辑斯蒂回归.xmind

Day8-KNN.xmind

Day7-pandas-Ⅳ：数据加载与透视表.xmind

Day6-matplotlib.xmind

Day5-Scipy.xmind

Day4-pandas-Ⅲ.xmind

Day3-pandas-Ⅱ.xmind

Day2-pandas-Ⅰ.xmind

Day1-IPython与Numpy.xmind

115个Java面试题和答案——终极（下）_ (1).pdf

115个Java面试题和答案——终极（上）.pdf

机器学习06--线性回归

机器学习05--朴素贝叶斯

机器学习09--决策树02

机器学习03--决策树01

机器学习03--sklearn手写数字识别

机器学习02--K近邻算法

机器学习01--机器学习入门知识（数据科学 5 机器学习介绍）

数据分析--matplotlib绘图和可视化

MySQL性能优化之参数配置

机器学习面试题目1

python面试笔试题（现场应聘收集）

笨办法学python

大数据分析---数据规整：聚合和重塑

大数据分析--数据清洗和准备

大数据分析--数据加载、存储

大数据分析---Pandas使用

数据分析2--NumPy

数据分析1--认识大数据工具

Diango从基础到高级

Python面试题整理

空空如也