自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

画地为牢的博客

天行健, 君子以自强不息。

  • 博客(61)
  • 收藏
  • 关注

原创 MySQL常用知识点记录(自用,不断补充)

一、计算1.计算两日期时间差(两种方式)TimeStampDiff():MySQL本身提供的可以计算两个时间间隔的函数语法为:TimeStampDiff(unit,datetime_expr1,datetime_expr2),返回日期或日期时间表达式datetime_expr1 和datetime_expr2the 之间的整数差。https://www.cnblogs.com/jpfss/p/11155908.htmlunit单位有以下几种:FRAC_SECOND 表示间隔是毫秒SEC

2022-03-11 17:10:07 867

原创 mysql8.0 1067 invalid default value for 字段(datetime)

打开mysql,输入SET sql_mode =’’

2022-03-10 21:28:38 1467

原创 ERROR 1054 (42S22): Unknown column ‘‘root’‘ in ‘where clause‘

select host from user where user=‘root’;# 报错改为:select host from user where user=“root”;

2022-02-16 15:57:36 2615

原创 python_pandas_dataframe导出为excel表格,去掉默认索引

df.to_excel("文件名.xlsx",index = False)

2021-09-14 16:43:42 7633

原创 python_pandas_DataFrame:删除缺失值NaN

df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除NaN数据.删除至少缺少一个元素的行:df.dropna()删除至少缺少一个元素的列:df.dropna(axis = 1)等…参考链接:https://blog.csdn.net/qq_43188358/article/details/108335776...

2021-09-14 16:29:53 1699

原创 python_pandas_DataFrame_merge()

用于多个DataFrame的合并merge:通过键拼接列,即按照两个dataframe共有的column进行连接,两个dataframe必须具有同名的column。merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indi

2021-09-14 16:26:46 161

原创 movielens1M数据处理

#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式# ,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中import pandas as pdimport time start = time.perf_counter()filename1 =r'ml-1m\users.dat'filename2 = r'ml

2020-12-02 16:14:10 1304

原创 Anaconda查看安装包的位置和源码

import moduleprint(module.__file__)# 两个下划线# 举例import surpriseprint(surprise.__file__)

2020-11-25 19:09:23 7432

原创 python读取csv文件

df=pd.read_csv(filepath,header=None,encoding="gbk",names=["A","B","C","D","E"], skiprows=1,skipfooter=1,usecols=["A","B","C"],index_col=0,engine="python")

2020-11-11 11:12:58 490

原创 【推荐系统】划分数据集:k折交叉验证KFold()函数

from sklearn.model_selection import KFoldkf = KFold(n_splits = 8, shuffle = False)# n_splits = 8: 划分为8份# shuffle = False 输出是有序的for train_index, test_index in kf.split(data1): # data1就是所用的数据集 print('训练集:{}'.format(train_index)) print('测试集:{}'

2020-11-04 16:56:22 1716

原创 批量调整word中mathtype公式大小

步骤一:打开mathtype,找到大小选项里的定义并打开步骤二:在完整里面更改所需数值大小,确认步骤三:依次点击:预置–公式预置–保存到文件步骤四:回到Word环境中,点击“MathType”菜单中的格式化公式命令步骤五:选择之前设定保存的格式文件确认就好了...

2020-10-26 19:23:03 916 1

原创 【python】对list进行sort排序出现None

错误代码:print(list.sort())# 会输出None正确代码:list.sort()print(list)

2020-10-10 21:55:41 4234

原创 【python】list 嵌套[[[list]]]]

类似于:list = [[1, 2], [2, 3]]或者list = [[[1]]]可以通过这种方法提取:list[0]]

2020-10-10 21:48:14 599

原创 【python】pandas DataFrame数据转为list(‘DataFrame‘ object has no attribute ‘tolist‘)

不可以直接使用tolist(),不然会报错:'DataFrame' object has no attribute 'tolist'正确方式:df.values.tolist()

2020-10-10 18:28:03 10692

原创 【python】pandas.DataFrame选取特定行

>>> df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB', 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2', 'p3'])>>> df p1 p2 p30 GD GX FJ1 SD SX BJ2 HN HB AH3 HEN

2020-10-10 10:36:59 3433

原创 【python】将DataFrame数据写入Excel中

x.to_excel('data.xls') # x为数据名

2020-10-09 22:35:29 6860 6

原创 python将相同ID的字符串进行合并

问题描述"""id value1 A1 B1 C2 D2 E2 F变为:id value1 [A,B,C]2 [D,E,F]pandas怎么把上面的结构变为下面的形式?"""解决方案:import pandas as pdimport numpy as npdata = pd.DataFrame({'id':[1,1,1,2,2,2],'value':['A','B','C','D','E','

2020-10-09 22:11:07 1905

原创 DataFrame按照列索引选取指定列

DataFrame["column"]

2020-10-09 21:42:22 4886 1

原创 word中mathtype公式偏上不对齐问题解决

在网上查阅资料绝大多数都是采用调整段落格式:选中右键当前行->段落->缩进与间距->取消选中“如果定义了文档网格,则与网格对齐”->换行与分页->文本对齐方式:居中对齐但是有第二种情况,就是已经用了第一步的方法之后,原有的公式对齐了,但是新输入的公式又对不齐了:双击公式进入mathtype界面->Ctrl+s更新即可(不用快捷键可以在文件里找到更新选项)...

2020-08-28 11:08:42 16153 2

原创 Anaconda安装texttable

要使用conda安装此软件包,请执行以下操作之一:conda install -c conda-forge texttableconda install -c conda-forge/label/gcc7 texttableconda install -c conda-forge/label/cf201901 texttableconda install -c conda-forge/label/cf202003 texttable官方链接:https://anaconda.org/conda

2020-08-24 12:55:17 1357

原创 TensorBoard No scalar data was found

检查文件保存路径上有没有中文字符不能有中文

2020-08-10 11:11:50 142

原创 ‘tensorboard‘ 不是内部或外部命令,也不是可运行的程序问题解决

需要将tensorboard的路径添加到系统的PATH路径里面1. 首先要的就是找到tensorboard.exe这个程序简单一点,直接到装anaconda的盘里面搜tensorboard找到后进去把路径复制下来2. 添加到系统的环境变量的PATH1、同时按baiWIN+R键,打开du“运行”对话框,输入sysdm.cpl,按回车键打开“系统属性”。2、在系统属性对话框中选择“高级”选项。3、点击“高级”选项卡中的“环境变量 ”。4、点击“新建”添加新的环境变量,点击“编辑”修改环境变量

2020-08-09 22:08:43 2869

原创 Anaconda下安装tensorflow环境与jupyter notebook配置(Win10,亲测有效)

为了安装tensorflow整整折腾了一天,头发都秃了一半,哭死了都,在我锲而不舍的尝试下,终于在jupyter notebook 上成功运行起来了,心疼自己的铁憨憨行为。针对各种报错问题,咱也不懂,大胆猜测原因:没注意到版本匹配问题!!!!!!!!!!下面从头开始(因为我是在云服务器上安装的,所以不方便截图,直接引用了参考文章的图)0. 安装anaconda网址:https://repo.continuum.io/archive/Anaconda3-5.2.0-Windows-x86_64.exe

2020-08-08 16:47:25 1427 1

原创 逻辑回归中的coef

最近看逻辑回归一个线性可分案例的时候看到了如下的代码:coef1 = -theta_final[0, 0] / theta_final[2, 0] coef2 = -theta_final[1, 0] / theta_final[2, 0]然后想了一下,这个两个是决策边界的系数.可以理解为sigmoid函数是原本的一个函数的映射,所以原来函数会有一个决策边界。比如有两个特征X1, X2, 画出来的图如下:这个红线就是决策边界。公式推导:sigmoid:...

2020-07-19 21:34:29 12509 1

原创 【Python】matplotlib新手规范化画图

0. 介绍在matplotlib中,有两种画图方式:plt.figure(): 这是通过matplotlib提供的一个api,这个plt提供了很多基本的function可以让你很快的画出图来,但是如果你想要更细致的精调,就要使用另外一种方法。(虽然教程基本上都是用这种方法,但不适合新手)fig, ax = plt.subplots(): 这个是比较规范的画图方法。指定figure和axes,然后对axes单独操作。下面来介绍这种方法。1. fig,ax = plt.subplots()plt.

2020-07-17 18:37:36 391

原创 Python计算中@的作用

在Python中numpy模块@在矩阵计算中起到乘积的作用。如:from numpy import *a = array([1, 2, 3])b = array([7, 8, 9])b = b.Ta@bOut:50

2020-07-16 09:39:58 399

原创 sqlite3.OperationalError: near “,“: syntax error

检查前面建表语句逗号是否用了中文的气死我了 查了一个多小时的问题

2020-07-06 22:56:57 3481 1

原创 新手试手Python爬虫:豆瓣Top250代码涉及到的知识点以及思路详解(适合新手)

0. 准备工作:进入网址:https://movie.douban.com/top250进入页面之后按F12,出现页面:根据提示Ctrl + R 刷新, 右边页面更新:第一步,鼠标点击最左边开始的地方第二部,点击出现的top250画面更新:将右边拉倒最下面:最下面出现红框的部分等下会用到,复制下来。然后,点击下面的红色方框部分,网页的所有内容都在里面;点击红色箭头的小箭头,可以直接点到自己想要得地方。建议自己摸索下,很简单。后面的代码爬取内容都是从这里找的。1. 代码实现

2020-07-05 21:32:27 943 2

转载 网络爬虫urllib:parse.urlencode()和request.Request()

https://www.jianshu.com/p/4c3e228940c8

2020-07-02 21:29:10 335

原创 TF-IDF算法原理与示例Python代码详解(Python,推荐算法)

0. 算法原理:1. 代码实现:# TF-IDF算法示例'''框架步骤:0.引入依赖 numpy pandas1.数据处理 分割数据 构建词库2.词数统计 统计文档中每个词出现的词数3.计算词频 TF= 词语在文档出现次数/文档总词数 出现次数/总词数4.计算逆文件频率 IDF = log(文档总数N+1)/(文档包含词语数量+1) 5.计算TF-IDF TF*IDF'''# 0. 引入依赖import numpy

2020-07-01 12:40:18 1558 1

原创 K均值(K-means)聚类算法原理与代码详解

0. 算法原理:上述过程简单描述:a: 初始数据b: 选择质点c: 根据质点划分d: 求均值,更新质心点e: 划分f: 更新质心点1. 代码实现:# K means 教程# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 从sklearn中直接生成聚类数据from sklearn.datasets.samples_generator import make_blobs# 1. 数据加载x, y =

2020-06-30 17:08:17 3088

原创 自动提取所需文本(以邮箱和电话号码为例)Python项目程序(代码详解)

0. 代码实现:# python 3# phoneAndEmail.py - Finds phone numbers and email addresses on the clipboard# pyperclip 模块有 copy()和 paste()函数, 可以向计算机的剪贴板发送文本, 或从它接收文本# re模块 正则表达式是对字符串进行操作,正则表达式是对字符串进行模糊匹配,提取自己需要的字符串部分import pyperclip, re# 0. 为电话号码创建一个正则表达式ph

2020-06-29 10:58:15 1071

原创 决策树Gini指数 心脏病例子(附Python代码实现)

0. 介绍Gini index: CART决策树使用“基尼指数”(Gini index)来选择划分属性。数据集D的纯度可用基尼值来度量:直观来看,Gini(D)反映了从数据集D中随机抽取两个样本,其类别标记不一致的概率(二分类)。因此,Gini(D)越小, 则数据集D的纯度越高。总结:Gini指数越大则表示数据越不纯,Gini越小表示数据相对越纯。属性a的基尼指数定义为:于是,我们在选择划分属性时,选择那个使划分后Gini系数最小的属性作为最优划分属性。1. 心脏病例子:收集数据:

2020-06-28 20:56:25 3665 2

原创 K近邻算法(KNN)原理推导与实例代码实现详解(Python)

原理与推导过程:代码实现(sklearn自带数据集, iris鸢尾花):# k近邻算法# 0. 引入依赖import numpy as npimport pandas as pd#这里直接引入sklearn里的数据集, iris鸢尾花from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split # 切分数据集为训练集和测试集from sklearn.metr

2020-06-27 22:08:46 994

原创 sklearn库求解线性回归最小二乘法实例代码(Python,附数据集下载)

代码实现:# 调库求解线性回归最小二乘法# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',')points[0, 0]# 提取points中的两列数据, 分别作为x,yx = points[:, 0]y = points[:, 1]# 用plt

2020-06-27 10:19:00 1203

原创 梯度下降法推导过程与代码实现(Python,一元,附数据集下载)

推导过程:代码实现(以一元为例):# 简单线性回归(梯度下降法)# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据(data.csv)points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',')points[0, 0]# 提取points中的两列数据,分别作为x,yx = points[:, 0]

2020-06-26 19:00:07 581

原创 线性回归最小二乘法求解过程与代码实现(一元,附对应数据下载地址)

求解过程:代码实现:简单线性回归(最小二乘法)# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',') points[0,0]# 提取points中的两列数据,分别作为x,yx = points[:, 0]y = points[:, 1]# 用p

2020-06-26 11:30:02 539

原创 strip() Python

介绍numpy.char.strip() 函数是Python中NumPy字符串函数用法numpy.char.strip() 函数用于移除开头或结尾处的特定字符。示例import numpy as np# 移除开头或结尾处的 a 字符print (np.char.strip('ashok arunooba','a'))# 移除数组元素头尾的 a 字符print (np.char.strip(['arunooba','admin','java'],'a'))运行结果:shok aru

2020-06-21 16:45:44 144

原创 split()函数 splitlines() 函数 Python

介绍:split(),splitlines()是Python中NumPy字符串函数用法:numpy.char.split() :通过指定分隔符对字符串进行分割,并返回数组。默认情况下,分隔符为空格。numpy.char.splitlines():以换行符作为分隔符来分割字符串,并返回数组。示例:numpy.char.split()代码:import numpy as np# 分隔符默认为空格print(np.char.split('I like running?'))# 分隔符为 .

2020-06-21 16:09:12 2265

原创 np.random.rand()与np.random.randn()

np.random.rand()作用:生成[0,1)区间内一个或一组数值,服从均匀分布使用方法:np.random.rand():生成一个[0,1)区间均匀分布的随机数,示例:np.random.rand()Out[7]: 0.7309286434720168np.random.rand(m, n):生成m*n阶矩阵,矩阵内数值为[0,1)区间均匀分布的随机数,示例:np.random.rand(10,1)Out[8]: array([[0.50699708], [

2020-06-20 11:05:10 2053

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除