自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 superset不同版本安装使用采坑总结(持续更新中)

一一Superset 是一个基于 Python Flask 和 Apache Superset 的数据可视化和探索平台。建议去官方github去探索GitHub网址有时候访问不进去,可以进入。

2024-03-02 14:35:57 1320 1

原创 linux centos7 常用命令 更新2

当你在 CentOS 7(或任何其他 Linux 发行版)上执行关机命令(如或poweroff)时,系统会尝试正常关闭所有运行的服务和进程,然后关闭电源。如果这个过程正常完成,那么理论上你不需要在下次启动时重新启动所有服务。但是,如果你在系统正在关闭的过程中突然拔掉电源,那么可能会出现一些问题。突然的断电可能会导致文件系统的不一致、正在运行的服务未能正常关闭,以及数据库或其他持久性存储的损坏。在这种情况下,下次启动时,系统可能需要进行一些恢复操作,如检查文件系统的一致性(fsck)等。

2024-03-11 12:08:07 386

原创 数据驱动决策:从理论到实践 2

它能够通过收集和分析大量的历史数据,识别出潜在的欺诈行为、异常交易和信用风险,从而及时采取相应的预防和应对措施,有效降低风险发生的概率和影响程度。例如,某保险公司通过运用大数据技术,对历史数据进行分析,预测客户可能发生的理赔风险,提前进行风险评估和调整保险费率,有效地控制了风险。我们以某银行为例,通过对客户交易数据的深度挖掘和分析,发现异常交易模式,及时进行风险提示和采取相应措施,避免了可能的损失。通过收集和分析生产过程中的各种数据,我们可以发现生产过程中的瓶颈和问题,优化生产流程,提高生产效率。

2024-03-08 18:45:34 436

原创 数据驱动决策:从理论到实践

通过对市场数据的分析,企业可以了解竞争对手的优势和劣势,了解目标市场的消费者需求和行为,从而制定更具针对性的战略。希望通过这次分享,我们能更深入地理解数据的重要性,学会如何运用数据来指导我们的决策,从而更好地应对未来的挑战。事实上,我们做的70%的决策都是基于数据的,但数据的准确性对于避免误导性的结论至关重要。在快速变化的市场环境中,我们需要的不仅仅是准确的数据,更需要实时的数据来应对市场的变化。是的,数据在我们生活的方方面面都发挥着重要的作用,而在决策中,数据的力量更是无法忽视。

2024-03-08 18:38:39 1596

原创 linux centos7 常用命令

linux centos7 常用命令 在线学习 ,持续更新

2024-03-07 20:20:11 611

原创 大数据平台体系之API安全应用篇

可以按照目前的api安全分为四大类:用户行为、设备行为、软件行为、实体行为,基于这些行为,业务人员为了确定分析指标,而产生一些确定性规则类的标签,(比如账号每天每小时的流量值统计,大于什么阈值判定为过渡调用数据这些规则)在实际开发标签过程中,该类标签的规则由运营⼈员和数据⼈员共同协商确定,且常根据业务变化和效果反馈进⾏调整。(2)采用基于密度统计的DPEAK算法确定局部密度rho,计算每个样本到密度比它高的点的距离的最小值sigma,找出这个样本周围的样本量很小,但是到比它密度大的点的距离还挺远的异常值;

2024-03-02 18:03:14 545

原创 2021-07-07

请问前辈们Navicat导入向导中字段名行有多级字段怎么对应导入,怎么把字段名不变成数据存储啊?小白一枚,多谢啦表导出到本地后都是表头有二级字段或三级字段,通过navicat导入到centos7 MySQL数据库,导入到数据库就不能对应显示。解决方法一:先通过sql按照新表结构生成结果集,再手工导入到新表中,这样效率会很低。解决方法二:Python先在Excel里面把多级字段拍扁成一维 ,拆开,向左填充,然后插入一行在拼接,把表头数据当做数据记录,而不是当作字段保存,这样一来在导入数据库也不能对应显示,

2021-07-07 17:30:41 75

原创 神经网络关于训练集数据量越大,效果越好的误解

@TOC之前一直想不通为什么训练集为什么一直需要越大越好?通常来说,训练喂的数据越多,预测应该越好吧。最好,用交叉验证确认一下也有可能训练样本量大,数据特征较多,但网络层次太少,特征训练不充分,预测结果变差,这样才对啊。随着慢慢的学习,数据量越大效果越好,这前提是网络提取特征能力不能太差,效果的好坏是有多方面因素的。多方面因素我还没理解透每一方面具体的体现。如有不正确的,还望指教。嘻嘻,学无止境啊...

2019-06-16 21:08:42 19511 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除