- 博客(701)
- 资源 (43)
- 收藏
- 关注
原创 金融业大数据应用场景
如果能够引入外部数据,还可以进一步加快数据价值的变现。外部数据中比较好的有社交数据、电商交易数据、移动大数据、运营商数据、工商司法数据、公安数据、教育数据和银联交易数据等。大数据在金融行业的应用范围较广,典型的案例有花旗银行利用 IBM 沃森电脑为财富管理客户推荐产品,并预测未来计算机推荐理财的市场将超过银行专业理财师;摩根大通银行利用决策树技术,降低了不良贷款率,转化了提前还款客户,一年为摩根...
2020-04-07 17:05:48 7897 2
原创 量化交易主流框架介绍
量化交易主流框架介绍talibtalib的简称是Technical Analysis Library,主要功能是计算行情数据的技术分析指标numpy介绍:一个用python实现的科学计算包。包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包s...
2018-10-15 19:16:46 6018 6
原创 Navicat在分辨率不同的屏幕窗口显示大小不一致问题解决
2.选择【兼容性】-在兼容性页面中选择**“更改高DPI设置”**1.右击navicat图标-属性。
2023-12-05 21:39:28 849
原创 程序员辞职十大原因
很多软件开发者纷纷离职,这并不令人意外。当软件开发人员被迫加班,并且他们对升职加薪或工作的灵活性要求被置之不理时,他们要么悄悄辞职,要么开始寻找新的机会。有些人甚至会选择同时干多份工作来赚更多薪水。即使大型科技公司的裁员在过去一年频频成为新闻头条,很多软件开发人员依然敢于离职,因为他们对科技行业保持乐观态度,并对寻找新工作的能力非常自信。接下来,我们将深入探究软件开发人员离职主要原因,并提出有效策略以降低人才流失的风险。
2023-08-16 16:30:49 534
原创 Pycharm设置Python文件页眉默认信息(作者姓名、创建时间等)
次点击File->Settings->Editor->File and Code Templates->然后选择Python script.后将下列代码复制到右边的框框中,然后选择apply应用,就可以啦。
2023-07-12 01:11:18 488
原创 Stay hungry.!Stay Foolish!——乔布斯
今天,我们来重温一下乔布斯在斯坦福大学的演讲这是一场富有哲理且热血十足的演讲,他对所有的年轻人说:Stay hungry. Stay Foolish.这是乔布斯一生经验的总结,值得反复听,反复思考。中英文对照翻译Thank you. I am honored to be with you today at your commencement from one of the finest universities in the world. Truth be told, I n
2023-06-11 16:28:45 689 1
原创 DCMM八大模块——数据战略域
数据战略:组织开展数据工作的愿景、目的、目标和原则。包括数据战略规划、战略实施、战略评估。数据战略能力域关注整个组织数据战略的规划、愿景和落地实施,为组织数据管理、数据应用工作的开展提供战略保障,组织的数据战略需要和业务战略保持一致,并且要在利益相关者之间达成一致。
2023-05-29 17:01:58 1003
原创 DCMM简介(数据分析必读)
上周末北京的某评估机构对我们公司进行了DCMM评估模型相关知识的培训工作,收获颇丰,感觉DCMM是一个高大上又是一个对企业和公司非常实用的工具。特整理专栏知识,跟各位童鞋共享。
2023-05-29 15:46:40 390
原创 一文读懂ChatGPT
ChatGPT 是⼀种基于深度学习的⾃然语⾔处理技术,它可以⽣成⾼质量的⾃然语⾔⽂本。该技术是由 OpenAI 团队 开发,旨在使计算机能够像⼈类⼀样理解和产⽣⾃然语⾔。ChatGPT 使⽤了深度神经⽹络和⾃然语⾔处理技术,通过对⼤量语⾔数据的学习和建模,实现了⾃然语⾔⽣成和对话系统的⾃动化。ChatGPT 的核⼼是⼀个神经⽹络模型,该模型可以根据已有的语⾔数据集⾃动学习语⾔的规律和模式,并使⽤这些知识来⽣成新的⽂本。
2023-05-25 14:16:26 1862
原创 2023中国数字技术算法算力百强榜
智慧应用类企业最多,达37家,以美团为代表;ICT基础设施类和底层智能算法类企业各有17家,分别以华为和网易为代表;计算芯片类企业15家,以联发科为代表;计算网络与平台类企业14家,以腾讯为代表;计算保护类企业5家,以三六零为代表。北京的企业最多,有32家;广州第四,有9家,其中广州黄埔区4家;斑马网络、远景智能、Momenta、平凯星辰、慧智微、杰创智能、瑞松智能、高云半导体、广电五舟、致景科技入围“未来之星企业”上榜企业平均价值1900亿元,上榜门槛260亿元,其中四家企业价值上万亿元。
2023-05-18 16:19:41 480
原创 Presto时间函数
最近项目中用到了Presto,负责后台的搭建和接口开发,Presto部分语法和常用SQL有些区别,特为大家整理如下,避免踩坑。
2023-05-17 15:15:01 1120
原创 视频加速播放插件-Global Speed
有时候我们觉得看视频的过程中视频播放的太慢了,希望能够加快一点播放的速度,谷歌浏览器里面有很多有意思的插件。例如Global Speed就可以控制视频播放的速度。
2023-04-28 10:19:30 2772
原创 Python 中使用 Azure Blob 存储
本文介绍如何使用适用于 Python 的 Azure 存储客户端库来上传 blob。你可以上传 blob,打开 blob 流并写入流,或者上传带有索引标记的 blob。Azure 存储中的 Blob 已组织成容器。必须先创建容器,才能上传 Blob。
2023-04-20 08:28:12 326
原创 一文读懂【数据埋点】
埋点的技术实质,是先监听软件应用运行过程中的事件,当需要关注的事件发生时进行判断和捕获,然后获取必要的上下文信息,最后将信息整理后发送至服务器端。所监听的事件,通常由操作系统、浏览器、APP框架等平台提供,也可以在基础事件之上进行触发条件的自定义(如点击某一个特定按钮)。一般情况下,埋点可以通过监测分析工具提供的SDK来进行编程实现。埋点的业务意义显而易见,即帮助定义和获取分析人员真正需要的业务数据及其附带信息。在不同场景下,业务人员关注的信息和角度可能不同。
2023-02-27 15:41:40 497
原创 MySQL实现row_number排序功能(不用函数)
这篇文章主要介绍了mysql使用自定义序列实现row_number功能,本文分步骤通过实例代码给大家介绍的非常详细,需要的朋友可以参考下
2023-02-27 11:33:50 614
原创 【小技巧】Navicat查看数据库密码
打开这个网址:https://tool.lu/coderunner,将如下PHP代码复制进去。找到这行代码 $decode = $navicatPassword->decrypt(‘然后在网页上面执行代码,就可以得到密码了。’这几个字替换为步骤三复制出的的密码。
2022-11-29 10:10:59 1312
原创 【好书推荐】《Python编程:从入门到实践(第2版)》
然而,以写入模式(‘w’)打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件的内容。for循环是一种遍历列表的有效方式,但不应在for循环中修改列表,否则将导致Python难以跟踪其中的元素。可以方便地下载全书的源代码,此外还给出了第一部分每章的一个PPT,一个全书知识点速查的图,还给出了大部分章节的视频讲解,算是比较用心了。不错的python入门书,第一部分讲基础知识,第二部分讲了三个实际的项目:一个小游戏,一个数据可视化程序,一个网站。
2022-11-03 13:41:18 1049
原创 【好书推荐】《华为数据之道》
数据技术要产生实际价值,需要良好的数据治理体系保驾护航。最近华为出版了《华为数据之道》一书,给出了非数字原生企业在数据管理方面的实战经验,特别适合于面临数字化转型的企业管理者、数据从业者。
2022-11-02 16:32:22 891
原创 Presto集群Web UI界面详解
Presto Web UI 可以用来检查和监控Presto集群,以及运行的查询。他所提供的关于查询的详细信息可以更好的理解以及调整整个集群和单个查询。Presto Web UI所展示的信息都来自于Presto系统表.当你进入Presto Web时,你将会看到如同1所示的界面:主要分为上下两部分,上面描述了集群信息,下面是查询列表。...
2022-08-29 16:01:19 2090 2
原创 【数仓设计】企业数仓为什么要进行分层?(六大好处)
后来随着公司业务的发展,数据的沉淀,数据仓库发展到一定阶段,发现数据的使用杂乱无章,各种业务都是从原始数据直接计算而得。当然你公司数据规模小,非不分层可不可以,当然可以。而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。简单来讲可以这样理解,我们最终给业务诚信的是一能直接使用的张业务表,但是它的来源有很多,如果有一张来源表出问题了,我们希望能够快速准确地定位到问题,并清楚它的危害范围。规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算。...
2022-08-09 09:15:28 1459
原创 Impala时间函数总结
Impala是基于hive并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点。impala元数据都存储在hive的metastore当中,并且impala兼容hive的绝大多数sql语法。所以需要安装impala的话,必须先安装hive,保证hive安装成功,并且还需要启动hive的metastore服务。............
2022-07-27 16:42:29 1089
原创 【Python数据分析】matplotlib绘图
matplotlib.pyplot是一个在python中可实现的函数,例如创建图形、在图形中创建创建一个绘图区域、在绘图区域中你那个绘制一些线、在图形中添加标签之类的。
2022-07-05 13:15:36 605
原创 【Python数据分析】Pandas中的绘图函数
Pandas中有许多能够利用DataFrame对象数据特点来创建标准图表的高级绘图方法2.柱状图3.饼图4.面积图5.直方图
2022-07-05 11:49:40 511
原创 【Python数据分析】Pandas常用操作(二)
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])array([[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11],[12, 13, 14, 15]])
2022-07-05 11:35:46 144
原创 【Python数据分析】Pandas常用操作(一)
pandas基于Numpy构建,最初被作为金融数据分析工具使用因此pandas为时间序列分析做了很好的支持。pandas的两种数据结构:Series和DataFrame0 41 72 -53 3dtype: int64RangeIndex(start=0, stop=4, step=1)RangeIndex(start=0, stop=4, step=1)3/1 43/2 73/3 -53/4 3dtype: int64Index([‘
2022-06-21 21:05:06 365
原创 【Python数据分析】Numpy常用操作(二)
[ 0.2303069 1.00300936 -0.92357035 0.06525841 0.19994871 -1.403636920.01230236 -0.08950691 -1.13518494]-1.4036369214062031.003009355191414-0.22678593093886062-2.0410733784497457[-1.40363692 -1.13518494 -0.92357035 -0.08950691 0.01230236 0.06525
2022-06-20 16:20:06 150
原创 【Python数据分析】Numpy常用操作(一)
二、一维和多维数组1.创建数组(一维、多维)array([6, 7, 8])[[1 2 3 4][5 6 7 8]]dtype(‘int32’)(2, 4)[[1 2 3 4][5 6 7 8]]int64[6. 7.5 8. 9. ]float64array([6, 7, 8, 9], dtype=int64)array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])array([0., 0., 0., 0., 0., 0., 0.,
2022-06-19 20:16:47 370
原创 【由浅入深学Python】Python之禅
Python之禅体现了Python语言的设计哲学,其中的观点适用于任何的程序设计中。其实这不仅仅是程序设计的哲学,也是一种人生哲学,一名优秀的程序设计者应该有较深的哲学和人文科学积累。
2022-06-08 09:48:56 2242 2
原创 【由浅入深学Python】面向对象2 类的继承和重写
继承:代码的重用,子类获得父类的全部功能‘Xiaojin’Xiaojin is now sitting重写(overwrite):如果父类的方法不能满足需求,可以在子类中重写父类的方法‘Xiaoha’Xiaoha is now sitting,My age is 2
2022-06-08 09:21:46 165
原创 【由浅入深学Python】面向对象1 类的定义和使用
(1)类是某类事物的统称,对象是实物。例如:动物是一个类,狗和猫是对象。(2)类通过实例化,得到对象(1)类具有属性和方法(2)__init__方法是一个特殊的方法,每次用类创建对象的时候,都会自动运行这个方法。该方法的名称,开头和结尾都各有两个下划线,这是一个约定,避免跟其他普通方法名称冲突(3)参数self是一个指向对象本身的引用,让对象能否访问类中的属性和方法。self是自动传递不需要手动传递,所以在根据类创建对象时,只需要给后面的形参(name,age)提供值。...
2022-06-08 09:17:56 154
Airflow安装配置和web端插件安装
2020-07-01
navicat 连接oracle 11g驱动包
2020-05-28
陀螺仪调度部署和使用(美云智数).rar
2020-05-14
azkaban安装包(web+excutor)
2020-03-27
集群搭建手册_CDH5.13.1版.docx
2020-03-11
TensorFlow.xmind
2020-01-13
Day10-决策树与贝叶斯.xmind
2020-01-13
Day9-LinearRegression线性回归与逻辑斯蒂回归.xmind
2020-01-13
Day8-KNN.xmind
2020-01-13
Day7-pandas-Ⅳ:数据加载与透视表.xmind
2020-01-13
Day6-matplotlib.xmind
2020-01-13
Day5-Scipy.xmind
2020-01-13
Day4-pandas-Ⅲ.xmind
2020-01-13
Day3-pandas-Ⅱ.xmind
2020-01-13
Day2-pandas-Ⅰ.xmind
2020-01-13
Day1-IPython与Numpy.xmind
2020-01-13
机器学习09--决策树02
2018-11-08
机器学习03--决策树01
2018-11-08
机器学习02--K近邻算法
2018-11-08
机器学习01--机器学习入门知识(数据科学 5 机器学习介绍)
2018-11-08
数据分析--matplotlib绘图和可视化
2018-11-08
MySQL性能优化之参数配置
2018-11-08
python面试笔试题(现场应聘收集)
2018-10-18
笨办法学python
2018-10-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人