自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

jiangjiane

往者不悔,来者不豫

  • 博客(288)
  • 收藏
  • 关注

原创 pandas多值列拆分成多行

@TOCpandas多值列中一行拆分成多行df = pandas.read_csv(file)其中需拆分列名为seq则df=df.drop([‘seq’], axis=1).join(df[‘seq’].str.split(’ ', expand=True).stack().reset_index(level=1, drop=True).rename(‘seq’))即可欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markd

2022-05-26 14:50:06 3271 1

转载 连续特征的离散化

连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?

2021-10-09 11:24:15 2721

转载 tensordot图解

@[TOC] tensordot图解转载连接:tensordot图解

2021-10-08 16:57:56 2401

原创 安装anconda之后默认进入base

@[TOC] 安装anconda之后默认进入base使用以下命令即可conda config --set auto_activate_base false你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会

2021-07-22 17:00:46 728

原创 Linux执行shell脚本出现:“/bin/bash^M: bad interpreter“

出现该错误说明shell脚本文件是dos格式,即每一行结尾以\r\n来标识,而unix格式的文件行尾则以\n来标识。解决方案:1. vim编辑器 vim 打开文件,执行 :set ff=unix修改格式为unix格式,保存修改即可。2.dos2unix 通过命令行dos2unix修改文件格式。...

2021-05-06 09:32:16 1340

原创 Ubuntu删除ppa

1. 进入源目录:cd /etc/apt/sources.list.d2. 找到要删除的源文件,删掉即可。

2020-11-04 10:00:13 470

原创 cannot open https //centos7.iuscommunity.org/ius-release.rpm. skipping

替换URL:Old URL:https://centos7.iuscommunity.org/ius-release.rpmNew URL:https://repo.ius.io/ius-release-el7.rpm

2020-09-03 11:29:46 2766 2

原创 zip分卷压缩与合并解压

压缩:zip test.zip test.doc //先压缩不然会报错 分卷:zip -s 50m test.zip --out ziptest合卷:cat ziptest.z* > test.zip //利用cat来合卷 解压:unzip test.zip

2020-08-27 19:01:28 7128

原创 清空redis库数据

清除所有库的所有key:flushall清除当前库的所有key:flushdb

2020-08-27 18:53:02 358

原创 MRR-推荐算法评价指标

平均倒数排名(Mean Reciprocal Rank, MRR)是一个国际上通用的对搜索算法进行评价的机制。描述第一个结果匹配,分数为1,第二个匹配分数为0.5,第n个匹配分数为1/n,如果没有匹配的句子分数为0。最终的分数为所有得分之和。数学形式正确检索结果值在检索结果中的排名来评估检索系统的性能。 其中,是用户的个数,是对于第个用户,推荐列表中第一个在ground-t...

2020-08-26 19:44:00 25416 3

原创 vim清空当前文件下所有内容

命令行模式下输入:%d

2020-08-12 14:45:44 1521

转载 笔记本电脑安装Ubuntu系统后设置合上屏幕不休眠

收藏笔记:笔记本电脑安装Ubuntu系统后设置合上屏幕不休眠

2020-08-12 10:40:41 1064

原创 Linux解压命令汇总

Linux平台解压命令汇总: 1、*.tar 用 tar –xvf 解压 2、*.gz 用 gzip -d或者gunzip 解压  3、*.tar.gz和*.tgz 用 tar –xzf 解压  4、*.bz2 用 bzip2 -d或者用bunzip2 解压  5、*.tar.bz2用tar –xjf 解压  6、*.Z 用 uncompress 解压  7、*.tar.Z 用tar –xZf 解压  8、*.rar 用 unrar e解压  9、...

2020-08-05 11:06:54 925

转载 余弦相似度

收藏笔记:原文地址

2020-07-29 20:11:32 215

转载 Python中的__eq__和__hash__

参看知乎文章:谈谈__eq__和__hash__

2020-07-20 20:29:31 669

转载 Python模块collections中函数namedtuple的理解

Python中存储系列数据,比较常见的数据类型有list,除此之外,还有tuple数据类型。相比与list,tuple中的元素不可修改,在映射中可以当键使用。tuple元组的item只能通过index访问,collections模块的namedtuple子类不仅可以使用item的index访问item,还可以通过item的name进行访问。可以将namedtuple理解为c中的struct结构,其首先将各个item命名,然后对每个item赋予数据。例1:coordinate = namedtuple

2020-07-15 18:25:20 338

原创 重置loguru输出:只输出到文本,不向console输出

logger的默认有console输出,即sys.stderr,想要只输出到文本而不输出到console,则关闭sys.stderr即可。直接清理掉之前的handler设置就好,再进一步重置一个,如输出到特征文本:from loguru import logger# Remove a previously added handler and stop sending logs to its sink.logger.remove(handler_id=None) # 清除之前的设置# 设置生

2020-07-14 20:16:37 5420 2

转载 机器学习-常用公开数据集

1.各领域公开数据集下载2.常用公共数据集(中文:点此)

2020-07-11 17:33:24 614

原创 shell中开启conda虚拟环境

eval "$(conda shell.bash hook)"conda activate <env-name>

2020-07-01 14:54:22 2450 2

原创 linux去掉windows下文件中的\r

Unix体系里,每行结尾只有“<换行>”,即“\n”;Windows体系里面,每行结尾是“<换行><回 车>”,即“\n\r”。一个直接结果是,Unix体系下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix下打开的话,在每行的结尾可能会多出一个^M符号。如何去掉windows下文件中的\r?最常用的方法是,转为unix格式编码:在终端下敲命令:$ dos2unix filename其中filename为需要转变的

2020-06-09 09:39:53 1607

原创 pickle序列化python类实例,redis持久化python类实例

当我们想要持久化Python实例的时候,可以使用两种方式进行:1、可以先将对象转成字符串格式再进行保存:使用pickle的dumps,loads,这里需要使用带s的函数,表示中间层是以字符串作为中介的。例如:先创建一个测试类class SomeCustomObject: def __init__(self): pass def func(self): print("test code")将类实例持久化到本地:import pick

2020-06-06 13:35:45 1159

原创 linux端口占用清除

查看端口占用:lsof -i:端口号清除占用该端口的所有进程:sudo kill -9 $(lsof -i:端口号 -t)

2020-06-02 09:54:00 3585

原创 vim删除每行第一个字符

删除每行第一个字符:%s/^.//g

2020-04-29 09:47:25 5201 1

原创 Pandas错误:ValueError: could not convert string to float

原因:部分数值型的列中混入了字符串,将其找出转为浮点数即可。# 把所有列的类型都转化为数值型,出错的地方填入NaN,再把NaN的地方补0# 该操作之后,object的列(列中存储的是string类型)转成了floatdata[col] = data[col].apply(pd.to_numeric, errors='coerce').fillna(0.0) ...

2020-04-02 10:16:08 8041 4

转载 [笔记]更换pip源为国内镜像

更换pip源为国内镜像源:参看这个篇博客。

2020-03-19 13:53:22 273

转载 pandas中pivot_table详解(超详细)

转载笔记备份:https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html

2020-03-05 20:02:55 3336

原创 多版本py对应的pip 升级后, pip2 pip3 与python版本不对应

原因是升级过程中,将所有py低版本pip都卸载了,解决方案:curl https://bootstrap.pypa.io/get-pip.py -o get-pip.pysudo python3 get-pip.py # 先恢复py3sudo python2 get-pip.py # 后恢复py2...

2019-12-30 17:32:52 1489

原创 pip升级之后出现:/usr/bin/pip: No such file or directory

这是因为缓存的问题造成的,解决方案:1.which pip /usr/local/bin/pip2.pip -bash: /usr/bin/pip: No such file or directory3.type pip pip is hashed (/usr/bin/pip) So pip is definintely in /usr/local/bin/pip but i...

2019-12-30 17:30:11 2354

原创 docker删除所有容器/镜像

1. 想要删除容器,则要先停止所有容器(当然,也可以加-f强制删除,但是不推荐):docker stop $(docker ps -a -q)2. 删除所有容器docker rm $(docker ps -a -q)3.删除所有镜像(慎重) docker rmi $(docker images -q)...

2019-12-30 13:23:00 6505

转载 centos6.10-Python3字符编码问题

出错信息:[UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128]解决方案:(1)设置环境变量LANG在linux或Mac上设置环境变量的方式一样,编辑~/.bash_profile文件(’~’指的是用户登录后的默认目录),添加一行:export LANG=...

2019-12-19 10:42:54 381

原创 Pandas中空字符串(非缺失值)处理方法

在使用pandas处理数据时,会遇到这样一个问题:打开文档查看某些列明显有很多是空的,但是在python里用dataframe.info统计出来并不是空的,这是因为excel表里这些数据看起来是空的值,但其实是一个空格,但是用isnull判断是为False的。解决方案:对整张表dataframe替换空格为np.nan,可以使用replace方法通过正则匹配空格,然后替换:...

2019-12-16 11:08:35 5814 1

转载 snap包管理工具实操

Ubuntu中snap包的安装、更新删除与简单使用

2019-12-05 16:40:11 770

转载 [转载]Python在redis中存取DataFrame数据

转载自:Python在redis中存取DataFrame数据1、通过pickle序列化的方式import pandas as pdimport pickleimport redisrs = redis.StrictRedis(host='127.0.0.1')df=pd.DataFrame([range(5)]*5,index=list('HELLO'),columns=lis...

2019-11-23 15:01:41 2734 2

转载 贝叶斯个性化推荐排序优秀博文

刘建平-博客园1、贝叶斯个性化排序(BPR)算法小结2、用tensorflow学习贝叶斯个性化排序(BPR)

2019-11-14 15:35:56 494

转载 推荐系统召回四模型之二:沉重的FFM模型

推荐系统召回四模型之二:沉重的FFM模型来源:知乎作者:张俊林原文链接:推荐系统召回四模型之二:沉重的FFM模型https://zhuanlan.zhihu.com/p/59528983...

2019-11-12 10:32:53 435

转载 推荐系统召回四模型之:全能的FM模型

推荐系统召回四模型之:全能的FM模型来源:知乎作者:张俊林原文链接:推荐系统召回四模型之:全能的FM模型https://zhuanlan.zhihu.com/p/58160982...

2019-11-11 17:11:52 618

原创 SVD优秀博文汇总

1、机器学习之SVD奇异值原理分析及举例2、从SVD到推荐系统3、SVD推荐系统简单案例

2019-11-11 14:50:31 169

转载 大白话中台系统

什么是中台系统?它是如何诞生的?它长什么模样?我们为什么需要它?一串串的问题不禁浮现在我们的脑海,今天我们就带着这些问题,一起走进中台。  1、中台诞生  任何一个软件系统都是通过帮助客户解决问题来实现价值的。针对不同的需求会建立不同的软件项目。  这些软件项目包含客户端的应用和后台管理配置的应用。久而久之就形成了固定的“前台”和“后台”系统,而且大家都在乐此不疲地开发着类似的业务系统...

2019-11-11 10:46:44 13641 2

转载 Python内置hash函数为什么运行两次值不一样

解释一python的字符串hash算法并不是直接遍历字符串每个字符去计算hash,而是会有一个secret prefix和一个secret suffix,可以认为相当于是给字符串加盐后做hash,可以规避一些规律输入的情况显然这个secret前后缀的值会直接影响计算结果,而且它有一个启动时随机生成的机制,只不过,在2.x版本中,这个机制默认是关闭的,前后缀每次启动都设置为0,除非你改了相关...

2019-11-05 11:09:17 5940

原创 彻底解决Matplotlib显示中文问题

1. 查看matplotlib配置文件import matplotlibprint(matplotlib.matplotlib_fname())Out:{your-matplotlib-installed-path}/mpl-data/matplotlibrc2. 下载simhei字体 点击下载simhei字体3. 复制字体文件 将下载的字体文件复制到第一步显示...

2019-11-05 10:50:13 451

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除