自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 pandas处理csv文件

import pandas as pd import random import numpy as np first = pd.read_csv(r"/file",usecols=[1]) first.drop_duplicates(inplace=True) #first = np.ndarray(first[:,0]) #print(type(first)) second = [random.randint(1,10) for i in range(0,1000000)] third = [rando

2020-06-18 22:02:34 181

原创 离散编码问题,LabelEncoder和OneHotEncoder

在id处理与nlp处理中,离散编码的处理比较重要。可以考虑用sklearn库LableEncoder,而涉及到01编码或多重属性编码时用OneHotEncoder import pandas as pd from sklearn.preprocessing import LabelEncoder data=pd.DataFrame({'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]}) for i in data: try: data[i]=L

2020-05-23 18:29:09 230

原创 离散编码问题,LabelEncoder和OneHotEncoder

import pandas as pd from sklearn.preprocessing import LabelEncoder data=pd.DataFrame({'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]}) for i in data: try: data[i]=LabelEncoder().fit_transform(apply(int))#transform操作就是转为数字表示形式。 except:

2020-05-23 15:18:36 295

原创 编码问题

import json import codecs d =dict(name=['书', '书包', '书本'], age=[20,77,9], score=[6,8,88]) f =open('./sentence.txt', 'w') json.dump(d,f) f.close() g=open('./sentence.txt', 'rb') e=json.load(g) print(e) from gensim.models import Word2Vec with codecs.open('./s

2020-05-23 09:47:30 190

原创 队列和栈分别的应用

栈:括号匹配、算符优先算法求表达式的值、表达式的括号匹配问题、迷宫求解、进制转换、计算器、深度优先的非递归遍历、子程序与函数的调用和返回、数字转字符,表达式求值、中断时数据保存和返回。 队列:广度优先层次遍历、进程调度、用户文件访问 ...

2020-05-21 21:31:02 662

原创 pycharm debug

debug中step into、step out显示灰色的原因:①未断点过变量,无变量生成;②数据庞大,需要等待时间;③打开多个文件,需在某文件内部debug。

2020-05-21 13:30:11 265

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除