8 肥宅_Sean

尚未进行身份认证

中山大学在读,主修数学和计算机(信息与计算科学),辅修金融 微信公众号 肥宅Sean 欢迎关注

等级
博文 533
排名 1k+

软件附带有广告如何消除

简述不少软件都附带有广告,这让我有时候的体验很糟糕。类似于下面的这种操作打开任务管理器找到对应程序名称:比如这次这个是搜狐新闻右键点击它,然后打开文件所在位置再删除这个软件就好了(把原来的广告删掉之后,才能删掉这个软件,之后就没有问题了)...

2019-07-03 09:54:34

PySpark安装和测试

简述先简单把流程过一遍,大家根据自己水平来看就好了。java的版本一定要安装到java8,高版本也不行,低版本也不行。安装Hadoop:http://www.apache.org/dyn/closer.cgi/hadoop/common安装ApachSpark:http://spark.apache.org/downloads.html安装pyspark:pipinstallpy...

2019-07-02 12:16:46

CUR分解算法及Python实现

CUR分解要理解CUR分解,需要先看下SVD分解。SVD理论以及Python实现算法流程给定输入的矩阵A。A=C∗U∗RA=C*U*RA=C∗U∗R随机选r个列构成C和r个行构成R(也可以使用,平方和加权过的行和列(常用))然后选取W矩阵(C和R的交集,也就是被选出来的部分,在C和R中同时出现的A矩阵中的位置。)对W做SVD分解,得到X∑YTX\sumY^TX∑YT对∑...

2019-06-30 16:01:36

SVD理论以及Python实现

SVD将一个矩阵分解为U,V(U,V均为列正交矩阵,即列向量直接内积为0),中间的矩阵为对角阵,元素为奇异值。A[m∗n]=U[m∗r]∗∑[r∗r]∗(V[n∗r])TA_{[m*n]}=U_{[m*r]}*\sum_{[r*r]}*(V_{[n*r]})^TA[m∗n]​=U[m∗r]​∗[r∗r]∑​∗(V[n∗r]​)TSVD计算方式A=U∗∑∗VTAT=V∗∑∗UTA...

2019-06-30 15:04:20

PageRank算法以及Python实现(简洁版)

简述PageRank有点被神化了,其实公式很简单。文章目录简述算法模型定义Flow版本GoogleFormula实现算法主要是分为两种:The‘Flow’formulaTheGoogleformula模型定义很多个网页,直接存在链路关系,设为G,N*N的矩阵这里先只考虑有向无权无环图,即边有方向,且权重都一样,且没有自己到自己的边(环)。N为节点数或者是网页数...

2019-06-29 15:39:07

Python过滤掉numpy.array中非nan数据

代码需要先导入pandasarr的数据类型为一维的np.arrayimportpandasaspdarr[~pd.isnull(arr)]

2019-06-26 20:46:16

CPython教程

CPython-Tutorial-zh中文CPython教程简述Python有时候太慢,如果手动编译C或者是C++来写#include<Python.h>的文件也比较麻烦。CPython无疑是一个比较好的选择。这篇教程是基于https://cython.readthedocs.io/en/latest/src/tutorial/cython_tutorial.html...

2019-06-20 20:53:48

【中文情感分析】SO-PMI算法(HarvestText库的修正以及解析)

简述在最近的RA过程中,需要使用一个库,同时对其的原理需要理解。然后就研究了一些,发现了几个有趣的,其中一个HarvestText中文情感分析。我研究了他的源码后,再结合理论知识发现了这个库在情感分析上的一个很重要的问题。并提交了代码,完成了合并。下面是我的fork后的库https://github.com/Sean16SYSU/HarvestText文章目录简述SO-PMI算法PM...

2019-06-19 21:16:50

【解决办法】No module named 'ahocorasick'

操作pipinstallpyahocorasick-ihttps://pypi.tuna.tsinghua.edu.cn/simple/就好了Python3.6.6(v3.6.6:4cf1f54eb7,Jun272018,03:37:03)[MSCv.190064bit(AMD64)]onwin32Type"help","copyright",...

2019-06-11 21:59:54

c语言或者cpp中位运算的技巧

简述在知乎上看到一个题目,解答很有意思,用的是位运算。这让我觉得位运算有更多的算法可能,但是却还没被我用过。这种东西都是第一次看,觉得挺牛的,第二次,第三次看的时候就觉得没什么了。So,大佬们轻喷。基础涉及到二进制运算,如下:&|^三种运算,分别对应着交,并,异或交:两个对应位都是1,则为1,否则为0并:两个对应位只有一个是1,则为1,否则为0异或:两个对应位相...

2019-06-08 17:55:37

pandas内容像日期的数据如何变成真DataTime,并赋予时间类似的操作

变format:表示str的样式errors:如果出现的bug,那该怎么处理(raise表示出现了就给我爆出来)df['date']=pd.to_datetime(df['date'],format='%Y-%m-%d',errors='raise')常用的format除了上面的还有:%Y/%m/%d%Y年%m日%d…Sort是没问题的按照日期排序先变了之...

2019-06-06 00:09:51

【解决方案】Windows下C盘空间越来越小,空间清理方式

简述相信很多用Windows的人都会遇到C盘内容逐渐变大,导致整个空间的系统剩余空间越来越小。但是清理方式却相当简单解决方案去到路径下:C:\Users\自己的用户名\AppData中间那个是自己的用户名如果不知道用户名:就到特定的文件夹下找到对应的文件夹也行找不到Users文件夹:这个一般都是因为会变成中文显示用户。但实际上文件夹名还是Users然后删除掉Temp(一般量...

2019-06-04 08:23:08

Mallet Java【Windows下配置】(解决Ant安装可能会失败的解决方案)

简述(一般来说,添加环境变量时:除了*_HOME的这些大家自定(根据自己把东西放在了哪个文件夹下),其他的跟我一样也是没问题的)文章目录简述JAVA配置Mallet下载ANT下载ANT配置Mallet配置配置成功JAVA配置根据下面的文章完成了Java配置先【解决方案】“‘javac’不是内部或外部命令,也不是可运行的程序或批处理文件”Mallet下载http://mallet...

2019-06-03 17:13:08

Numpy.array矩阵百分制化(比例化)

简述用途不用说,很常用对于DataFrame的情况,但是操作却截然不同。注意对比。Pandas.DataFrame按行求百分数(比例数)问题假设有数据A>>>Aarray([[0,1,2,3,4],[5,6,7,8,9],[10,11,12,13,14],[15,...

2019-06-02 23:14:39

Pandas.DataFrame按行求百分数(比例数)

简述Motivation一般来说,每个部分的内容数量是较为容易获取的,但比例(百分数)这样的数据是二次数据,这样的操作很常见比例的信息相比于纯粹的数字更体现的整体体系的内部变化迁移的过程Contribution给了实例,follow下就没问题了~Codes导入包的部分,我就不写了哈这里假设每行是属于不同月份的数据>>>dfa...

2019-06-02 23:04:34

Pandas.DataFrame转置

简述Motivationsometimes,换一种获取数据的方式,可以提高数据获取的速度。sometimes,由于预计爬取的数据长度不确定,只能这么先存储起来。sometimes,有个给你的数据就是这样,但是没办法很方便的使用…这些情况下,你可能就会需要遇到DataFrame行列转置的方法。Contribution提供了Pandas.DataFrame的行列转置的方法实验部分...

2019-06-02 22:52:19

【解决方案】VS2017读取文件中文乱码,其他软件打开却没事

简述今天写项目的时候,读取有vscode或者是notepad++,甚至是记事本,打开都没有问题。但是用vs读取文件流输出的时候,就是乱码了。测试过,直接输出中文,是没有问题的。因此问题就确定了是在文件的编码上。(建议各位也像我这么测试下,不然这个解决方案不一定帮得了你)解决方案用记事本打开对应的文件。然后,另存为,发现文件是编码,如果是UTF-8就改为ANSII。反之亦然。然后新...

2019-05-24 17:47:06

【解决办法】torch交叉熵使用时遇到 Dimension out of range

简述其实这个问题我很久以前用pytorch写程序的时候就遇到过这个问题,当时纠结了很久之后最后解决了。当时本来就想来写个东西来记录下避免其他人也遇到这样的问题。但后面我个菜鸡就完全忘记了emmmm展示说明不同于我以往直接给出结论。这次我会通过展示的方式较为详细的讲解下。导入包importtorchimporttorch.nnasnn创造这个损失函数类loss=...

2019-05-19 22:50:36

超松弛迭代法求方法组的解(Python实现)

数值分析题目求方程组{5x1+2x2+x3=−12−x1+4x2+2x3=202x1+−3x2+10x3=2\left\{\begin{array}{c}5x_1+2x_2+x_3=-12\\-x_1+4x_2+2x_3=20\\2x_1+-3x_2+10x_3=2\end{array}\right.⎩⎨⎧​5x1​+2x2​+x3​=−12−x1​+4...

2019-05-19 22:21:21

马科维茨的均值方差模型(MPT)粒子群优化--Python实现

MPTMPT,modernportfoliotheory。现在资产配置理论。理论很简单。假设每个资产的收益率是一个随机变量xix_ixi​。既然是随机变量,当然就会有均值和标准差。如果资产数量不是只有一个的话(一个的话,做什么资产配置),也就是存在有多个随机变量,随机变量之间当然就会有协方差。资产配置的目的就是,找到一种较好的资产配置组合,使得达到预期的收益率的情况下,风险最小。...

2019-05-18 09:29:22
奖章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周上午根据用户上周的博文发布情况由系统自动颁发。