一点朱砂傲世风华-CSDN博客

原创 superset不同版本安装使用采坑总结（持续更新中）

一一Superset 是一个基于 Python Flask 和 Apache Superset 的数据可视化和探索平台。建议去官方github去探索GitHub网址有时候访问不进去，可以进入。

2024-03-02 14:35:57 1320 1

原创 linux centos7 常用命令更新2

当你在 CentOS 7（或任何其他 Linux 发行版）上执行关机命令（如或poweroff）时，系统会尝试正常关闭所有运行的服务和进程，然后关闭电源。如果这个过程正常完成，那么理论上你不需要在下次启动时重新启动所有服务。但是，如果你在系统正在关闭的过程中突然拔掉电源，那么可能会出现一些问题。突然的断电可能会导致文件系统的不一致、正在运行的服务未能正常关闭，以及数据库或其他持久性存储的损坏。在这种情况下，下次启动时，系统可能需要进行一些恢复操作，如检查文件系统的一致性（fsck）等。

2024-03-11 12:08:07 386

原创数据驱动决策：从理论到实践 2

它能够通过收集和分析大量的历史数据，识别出潜在的欺诈行为、异常交易和信用风险，从而及时采取相应的预防和应对措施，有效降低风险发生的概率和影响程度。例如，某保险公司通过运用大数据技术，对历史数据进行分析，预测客户可能发生的理赔风险，提前进行风险评估和调整保险费率，有效地控制了风险。我们以某银行为例，通过对客户交易数据的深度挖掘和分析，发现异常交易模式，及时进行风险提示和采取相应措施，避免了可能的损失。通过收集和分析生产过程中的各种数据，我们可以发现生产过程中的瓶颈和问题，优化生产流程，提高生产效率。

2024-03-08 18:45:34 436

原创数据驱动决策：从理论到实践

通过对市场数据的分析，企业可以了解竞争对手的优势和劣势，了解目标市场的消费者需求和行为，从而制定更具针对性的战略。希望通过这次分享，我们能更深入地理解数据的重要性，学会如何运用数据来指导我们的决策，从而更好地应对未来的挑战。事实上，我们做的70%的决策都是基于数据的，但数据的准确性对于避免误导性的结论至关重要。在快速变化的市场环境中，我们需要的不仅仅是准确的数据，更需要实时的数据来应对市场的变化。是的，数据在我们生活的方方面面都发挥着重要的作用，而在决策中，数据的力量更是无法忽视。

2024-03-08 18:38:39 1596

原创 linux centos7 常用命令

linux centos7 常用命令在线学习，持续更新

2024-03-07 20:20:11 611

原创大数据平台体系之API安全应用篇

可以按照目前的api安全分为四大类：用户行为、设备行为、软件行为、实体行为，基于这些行为，业务人员为了确定分析指标，而产生一些确定性规则类的标签，（比如账号每天每小时的流量值统计，大于什么阈值判定为过渡调用数据这些规则）在实际开发标签过程中,该类标签的规则由运营⼈员和数据⼈员共同协商确定，且常根据业务变化和效果反馈进⾏调整。（2）采用基于密度统计的DPEAK算法确定局部密度rho，计算每个样本到密度比它高的点的距离的最小值sigma，找出这个样本周围的样本量很小，但是到比它密度大的点的距离还挺远的异常值；

2024-03-02 18:03:14 545

原创 2021-07-07

请问前辈们Navicat导入向导中字段名行有多级字段怎么对应导入，怎么把字段名不变成数据存储啊？小白一枚，多谢啦表导出到本地后都是表头有二级字段或三级字段，通过navicat导入到centos7 MySQL数据库，导入到数据库就不能对应显示。解决方法一：先通过sql按照新表结构生成结果集，再手工导入到新表中，这样效率会很低。解决方法二：Python先在Excel里面把多级字段拍扁成一维，拆开，向左填充，然后插入一行在拼接，把表头数据当做数据记录，而不是当作字段保存，这样一来在导入数据库也不能对应显示，

2021-07-07 17:30:41 75

原创神经网络关于训练集数据量越大，效果越好的误解

@TOC之前一直想不通为什么训练集为什么一直需要越大越好？通常来说，训练喂的数据越多，预测应该越好吧。最好，用交叉验证确认一下也有可能训练样本量大，数据特征较多，但网络层次太少，特征训练不充分，预测结果变差，这样才对啊。随着慢慢的学习，数据量越大效果越好，这前提是网络提取特征能力不能太差，效果的好坏是有多方面因素的。多方面因素我还没理解透每一方面具体的体现。如有不正确的，还望指教。嘻嘻，学无止境啊...

2019-06-16 21:08:42 19511 4

一点朱砂傲世风华