- 博客(466)
- 资源 (7)
- 收藏
- 关注
原创 基于Zookeeper 简单实现分布式任务协调组件
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。
2024-04-17 05:00:00 464 23
原创 多因子模型的因子分组-聚类分析
由于类同质性是定义一个类的基础,那么不同因子之间在同一个特征空间相似度的衡量对于聚类步骤是很重要的,由于特征类型和特征标度的多样性,距离度量必须谨慎,它经常依赖于应用,例如,通过定义在特征空间的距离度量来评估不同对象的异质性,很多距离度量都应用在一些不同的领域,一个简单的距离度量,如Euclidean距离,经常被用作反映不同因子间的异质性,一些有关同质性的度量,例如PMC和SMC,能够被用来特征化不同因子的概念同质性。聚类或分组同样是一个很重要的步骤,因子基于不同的方法被分到不同的类中。
2024-04-17 00:15:00 643 3
原创 特征选择——互信息量
上一期介绍了决策树模型的生成算法,因个人原因,有关决策树的剪枝算法放在下一期文章。本期介绍分类问题中一个常用的指标——互信息。在之前参加的某数据比赛中,由于对数据背后的业务不太了解,所以特征工程环节大多采取了“暴力”提取的方式,最终特征过多直接导致模型存在过拟合问题。所以赛后总结在做特征工程时就应该考虑特征的取舍问题,主要通过特征与因变量Y之间的相关性分析做出判断。衡量单变量的相关性指标有很多,比如Pearson相关系数、Pearson卡方检验、Fisher得分、互信息等。
2024-04-15 05:00:00 564 27
原创 IOS 短信拦截插件
在使⽤iOS设备的时候, 我们经常会收到10691065开头的垃圾短信, 如果开了iMessage会更严重, 各种乱七⼋糟的垃圾信息会时不时地收到。从iOS11开始, ⼿机可以⽀持恶短信拦截插件了. 我们可以通过该插件添加⼀些规则通过滤这些不需要的信息.
2024-04-15 00:15:00 401 36
原创 多因子模型的因子选取
关于同业指标中性化处理,举个例子,我们可能发现某一个科技类股票的利润,分红,以及股价的涨幅相对于其它行业股票都相当优秀,但是可能在科技行业内就没有那举优秀,甚至表现不如同行业公司,此时我们就需要进行同业指标中性化处理,来消除由于同行业的类似分红政策,资本结构以及营业资产的影响。这里我们所说的信息比率是相对收益率除以非系统性风险,所以当我们在进行因子选择的时候,我们一定不能选取系统性风险模型(例如中国的上证综指,美国的S&P500等等)中的因子,或者是与系统性风险模型中因子有高相关度的因子。
2024-04-14 21:48:25 326 29
原创 Guava里一些比较常用的工具
随着java版本的更新提供了越来越多的语法和工具来简化日常开发,但是我们一般用的比较早的版本所以体验不到。这时就用到了guava这个包。guava提供了很多方便的工具方法,solar框架就依赖了版本,这里稍微介绍下。
2024-04-14 05:00:00 1240 61
原创 IEDA 启动项目时出现 java: java.lang.OutOfMemoryError: GC overhead limit exceeded 异常
软件自身使用的虚拟机是分开的(也就是独立的进程)中增加编译器使用的虚拟机内存[
2024-04-14 00:15:00 270 5
原创 Git以及Gitlab的快速使用文档
上的项目,而不管是谁的;而后者则是你必须是你要克隆的项目的拥有者或管理员,且需要先添加。安装过秳返里略过,一直下一步即可。的时候设置了密码,则需要输入密码的,否则直接是不需要输入密码的。密钥,将密钥添加到远程项目中,则获取到更新,提交代码的权限。这里需要输入密码,最好不要设置直接按回车即可,这样就在。文件的内容粘贴到文本框中。文件,如果文件已经存在,那么你可以跳过步骤。的时候,是不需要输入用户名的,如果配置。的时候是需要验证用户名和密码的;的安装目录下,右键运行。为例,将此项目的代码。
2024-04-13 12:54:32 489 14
原创 多因子模型的数据处理
通常我们希望选取因子的分布尽量呈现正态分布,而金融数据通常呈现右偏分布且具有非负性,所以我们通常采用对数转换来处理我们选取的因子数据。数据处理对于我们多因子建模是非常重要的前期准备工作,好的数据对于我们之后的资产分配,组合建模,回测,归因等都是坚实的保障,所以我们通常在前期花多量时间将原始数据处理成我们所需的数据。● 如果数据有严重的异常值及其他数据问题,我们可以对数据先进行排行,然后对排行后的数据强加一个分布,通常是正态分布,有时也用卡方分布,再进行。我们检验的标准是:先计算经处理数据的偏度。
2024-04-13 12:33:33 1166 80
原创 ⼿机客户端画K线图流程
绘制⼀屏的数据,在画的时候不会把K线数据全部绘制出来,⼀般在可见的范围内绘制⼏个,⽐如。上步处理后,图表控件跑到原有区域的上⽅去了,需要把它移回原有的区域显⽰,图的时候是以屏幕坐标来处理,所以为了⽅便画图需要把屏幕坐标处理成和。这样就能在当前的可见区域看到绘制好可见的图。⽅向的值就可以了,缩放同理。轴上需要⾃动缩放,即在当前可见的。图矩形的坐标,可以使⽤最右边的点。线图数据,接下来处理的是通过处理。线图能滑动和缩放滑动,在上⾯的。,所以需要在第⼀步中⽤到的。来计算当前绘制的第⼀个点的。
2024-04-08 23:44:09 1314 81
原创 Idea 通过 Tomcat 启动项目时出现“错误:找不到或无法加载主类 ecoding”
错误:找不到或无法加载主类 ecoding”时出现了错误,可以查看下该配置是否填写正确;
2024-04-08 23:13:32 331 4
原创 Idea Junit运行 @Test 代码时出现 java.lang.reflect.InvocationTargetException 异常
进行单元测试了,如果有遇到此类问题的可以试一下;我的问题是因为默认的。版本不是我本地安装的。之后,就能够正常使用。
2024-04-07 23:33:11 476 21
原创 spring事务那些事
下面列举了各公司框架使用到的亊务传播部分说明,还有些不常用传播行为,因为实际使用的少,大家在网上了解下就行了。传播行为意义表示当前方法必须运行在一个事务中,如果当前存在一个事务,那么该方法运行在这个事务中,否则,将创建一个新的事务新建事务,表示当前方法必须运行在自己的事务中,如果当前存在一个事务,那么这个事务将在该方法运行期间被挂起表示如果当前事务存在,则方法应该运行在一个嵌套事务中。否则,它看起来和看起来没什么俩样。
2024-04-05 05:00:00 1653 43
原创 Git push 代码时出现 FETCH_HEAD = [up to date] release -> origin/release hint: You have divergent branches
会执行合并,这通常会创建合并提交。因此,默认情况下,从远程拉取并不是一个无害的操作:它可以创建一个以前不存在的新提交。这种行为可能会让用户感到困惑,因为看似无害的下载操作实际上会以不可预测的方式更改提交历史记录。如果您希望仅对您所在的存储库执行此行为,请省略该标志。下来的代码与现有改动的代码进行合并。仅当可以“快进”而不创建新的提交时才会更新您的分支。分支时出现如下错误:意思是你和修改的代码和远程的代码存在冲突,推荐使用。会自动弹出冲突文件,选中后对双方修改的代码进行合并即可。开发分支这个版本的代码再把。
2024-04-03 05:00:00 1467 56
原创 Mac 配置 Maven 后执行 mvn -v 出现 Error: JAVA_HOME is not defined correctly . 错误
没有配置 java 环境变量,或者。我的配置文件如下:供参考。【有的同学可能配置在。
2024-04-03 00:15:00 291 2
原创 Mac 版 IDEA 中配置 GitLab
通过终端输入以下命令来配置用户名和邮箱,这些信息将用于记录你所有的提交历史:也可以通过。,然后按下回车,接着连续按三次回车即可在你的用户目录(一般是。账号或其他远程仓库的账户设置中,就可以开始你的代码托管之旅。回车后,就会新弹出一个终端,然后复制里面的。安装完太大,占用空间,如果不需要安装。按钮,如果安装过则会输出如下信息。的必选装备,而且是免费的。进行验证,输出如下信息表示成功。时,为了验证你的身份通常需要使用。的一个包管理工具,如果未安装。二进制安装,点击下载的。,功能非常强大,是开发。
2024-04-01 05:00:00 2067 95
原创 Mac通过Idea启动Tomcat时出现Cannot run program xxx/catalina.sh 错误
【代码】Mac通过Idea启动Tomcat时出现Cannot run program xxx/catalina.sh 错误。
2024-04-01 00:15:00 364 3
原创 Mac Idea通过 Git 提交代码时出现:Permissions 0644 for ‘xxx/.ssh/id_x‘ are too open.
【代码】Mac Idea通过 Git 提交代码时出现:Permissions 0644 for 'xxx/.ssh/id_x' are too open.
2024-03-26 00:15:00 375 9
原创 MySQL 查询性能优化
如果把查询看作是一个任务,那么它由一些列子任务组成,每个子任务都会消耗一定的时间。如果要优化查询,实际上要优化其子任务,要么消除其中一些子任务,要么减少子任务的执行次数。通常来说,查询的生命周期大致可以按照顺序来看:从客户端到服务器,然后在服务器上进行解析,生成执行计划,执行,并返回结果给客户端。其中“执行”可以认为是整个生命周期中最重要的阶段,其中包括大量为了检索数据到存储引擎的调用以及调用后的数据处理,包括排序、分组等。
2024-03-24 05:00:00 3700 142
原创 npm run build 时出现Build failed with errors
VisualStudio中执行npm run build 时出现如下错误。【3】清空 npm 缓存 npm clean cache -f;【2】删除 package-lock.js 文件;【5】重新执行 npm run build 即可;【4】重新执行 npm -i 下载包和依赖;【1】删除 node_modules包;
2024-03-24 00:15:00 542 5
原创 MySQL 更新执行的过程
最后来对比一下这两种日志:redo是物理的,binlog是逻辑的,redo的大小固定,并且以环状的形式写入数据,数据满的时候需要将 redo日志中擦除数据,并且将擦除的数据持久化到磁盘中。而 binlog以追加日志的形式写入,也就是当日志写到一定大小后,就会切换到下一个,并不会覆盖以前写的日志。
2024-03-23 05:00:00 1998 99
原创 Visual Studio执行 npm -i 时出现 npm ERR! code ERESOLVE npm ERR! ERESOLVE unable to resolve dependency tre
使用节点的先前版本,也就是降低节点版本,因为它有时会导致发生此类错误。包时依赖关系树出现了错误,存在。文件中尝试运行如下命令,先将。配置集旧版,对等值设置为。
2024-03-23 00:15:00 445 3
原创 MySQL 索引的分类和优化
如果存储引擎不支持哈希索引,则可以模拟像 InnoDB 一样创建哈希索引。思路很简单:在 B-Tree 基础上创建一个伪哈希索引,这和真正的哈希索引不是一回事,因为还是使用 B-Tree 进行查找,但是使用 Hash值进行查找而非键值本身。只需要在 WHERE 子句中手动指定使用哈希函数。
2024-03-21 05:00:00 1413 97
原创 ssh: connect to host github.com port 22: Connection timed out
文件中:需要将邮件更换为自己的邮件。测试连接时出现如下错误:通过。【2】将下面内容粘贴到。
2024-03-19 00:15:00 285 4
原创 Explain 关键字
explain关键字可以模拟优化器执行 SQL 查询语句,从而知道 MySQL 是如何处理 SQL 语句的。分析查询语句或表结构的性能瓶颈。执行语句:explain + SQL语句。
2024-03-17 05:00:00 1901 105
原创 node: -max-old-space-size=xxx is not allowed in NODE_OPTIONS
【代码】node: -max-old-space-size=xxx is not allowed in NODE_OPTIONS。
2024-03-17 00:15:00 389 4
原创 Java面试——SQL 语句题
【11】按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩:这里要注意 where 和 on 的区别:on 条件是在生成临时表时使用的条件,它不管on中的条件是否为真,都会返回左(右)边表中的记录。【15】查询不同课程成绩相同的学生的学生编号、课程编号、学生成绩:思路就是先查询一条数据,然后与表中的数据比较相同的成绩,且科目号不相同的数据行,如果大于1则返回当前行即可。【1】查询"01"课程比"02"课程成绩高的学生的信息及课程分数:当对一张表中的一列数据比较时,应当将一张表拆分为两张表;
2024-03-16 05:00:00 1658 55
原创 lerna ERR! yarn install --mutex network:42424 --non-interactive --pure-lockfile exited
在某些情况下,由于权限不足,可能导致安装过程中无法写入必要的文件或目录。流水线环境中可能存在内存、磁盘空间等资源限制,导致安装过程无法完成。确认流水线有足够的资源来执行安装任务。参数要求遵守已有的锁定文件,如果锁定文件损坏或不再适用,则会安装失败。仓库,将依赖包发布到这个仓库,然后在项目中使用这个私有仓库作为依赖源。如果项目中依赖关系有更新或者存在不兼容的变化,可能会导致。如果以上方法都无法解决问题,你可以尝试在本地搭建一个私有的。构建失败,配置文件未调整,之前都可以,现在报错。来安装项目中的所有依赖项。
2024-03-16 00:15:00 366 4
原创 MySQL 事务
当事务不是独立执行时发生的一种现象,例如第一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。主要的语句关键字包括。一个事务的执行不能被其他事务干扰,即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。脏读是指一个事务正在访问数据,并且对数据进行了修改,但是这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
2024-03-15 05:00:00 1223 72
原创 MySQL 开发规范
如果语句中没有设置编码就会遵循表的编码,表的编码不存在时,则遵循数据源的编码,注:字段级编码在导入导出时可能乱码;【9】组合索引可以只使用第一个,或者前两个,或者前几个,不能从第二个开始用,也不能跳着使用。【7】不要从明细表查统计结果,定期统计插入到汇总表:这个做互联网的深有感触,一张表几千万的数据,统计一个数据,性能真心很低。【18】联合查询时,每个表必须加别名,否则系统需要自己生成别名,影响性能。【1】对较长的字符类型,如果需要索引,则建立前缀索引,前缀索引长度控制在20个字符以内,索引不能超过。
2024-03-13 05:00:00 1374 11
原创 CodeReview 规范及实施
你的代码整体结构清晰,逻辑合理,很容易理解。随着业务压力增大,引发代码质量下降,代码质量的下降导致了开发效率的降低,维护成功高等问题,开发效率下降后又加重了业务压力,最终陷入了死亡三角的内耗之中。,因为开发者比你更了解整个系统的业务逻辑和架构,你的意见可能不适合该系统或架构,因此需要友好的交流,让他们知道他们的代码是对的,继续保持,自己则更进一步的了解整个系统和架构,避免第二次犯同样的错误。代码评审是一个学习的机会,通过审查他人的代码,可以学习到新的编码技巧和最佳实践,同时也可以分享自己的知识和经验。
2024-03-11 05:00:00 2315 134
原创 为什么选择 Flink 做实时处理
我们平常开发的Java应用系统时没有状态的。Stom的实现方式。微服务架构将系统拆解成不同的独立服务模块,每个模块分别使用各自独立的数据库,这种模式解决了业务系统拓展的问题,但是也带来了新的问题,那就是业务交易数据过于分散在不同的系统中,很难将数据进行集中化管理,对于企业内部进行数据分析或者数据挖掘之类的应用,则需要通过从不同的数据库中进行数据抽取,将数据从数据库或业务系统中周期性地同步到数据仓库中,然后在数据仓库中进行数据的抽取、转换、加载(ETL),从而构建成不同的数据集市和应用,提供给业务系统使用。
2024-03-10 05:00:00 2629 100
Nginx离线安装所需依赖配置
2024-02-20
java 高级开发 zzx博客链接.xmind
2020-04-06
ojdbc14-10.2.0.4.0.jar包
2017-03-27
ojdbc14-10.2.0.4.0.jar
2017-03-26
企业人事管理论文+源代码
2016-11-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人