。画地为牢。-CSDN博客

原创 MySQL常用知识点记录（自用，不断补充）

一、计算1.计算两日期时间差（两种方式）TimeStampDiff()：MySQL本身提供的可以计算两个时间间隔的函数语法为：TimeStampDiff(unit,datetime_expr1,datetime_expr2),返回日期或日期时间表达式datetime_expr1 和datetime_expr2the 之间的整数差。https://www.cnblogs.com/jpfss/p/11155908.htmlunit单位有以下几种：FRAC_SECOND 表示间隔是毫秒SEC

2022-03-11 17:10:07 867

原创 mysql8.0 1067 invalid default value for 字段（datetime）

打开mysql，输入SET sql_mode =’’

2022-03-10 21:28:38 1467

原创 ERROR 1054 (42S22): Unknown column ‘‘root’‘ in ‘where clause‘

select host from user where user=‘root’;# 报错改为：select host from user where user=“root”;

2022-02-16 15:57:36 2615

原创 python_pandas_dataframe导出为excel表格，去掉默认索引

df.to_excel("文件名.xlsx",index = False)

2021-09-14 16:43:42 7633

原创 python_pandas_DataFrame:删除缺失值NaN

df.dropna()函数用于删除dataframe数据中的缺失数据，即删除NaN数据.删除至少缺少一个元素的行：df.dropna()删除至少缺少一个元素的列：df.dropna(axis = 1)等…参考链接：https://blog.csdn.net/qq_43188358/article/details/108335776...

2021-09-14 16:29:53 1699

原创 python_pandas_DataFrame_merge()

用于多个DataFrame的合并merge：通过键拼接列，即按照两个dataframe共有的column进行连接，两个dataframe必须具有同名的column。merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indi

2021-09-14 16:26:46 161

原创 movielens1M数据处理

#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表：评分，用户信息，电影信息。这些数据都是dat文件格式# ，可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中import pandas as pdimport time start = time.perf_counter()filename1 =r'ml-1m\users.dat'filename2 = r'ml

2020-12-02 16:14:10 1304

原创 Anaconda查看安装包的位置和源码

import moduleprint（module.__file__）# 两个下划线# 举例import surpriseprint(surprise.__file__)

2020-11-25 19:09:23 7432

原创 python读取csv文件

df=pd.read_csv(filepath,header=None,encoding="gbk",names=["A","B","C","D","E"], skiprows=1,skipfooter=1,usecols=["A","B","C"],index_col=0,engine="python")

2020-11-11 11:12:58 490

原创【推荐系统】划分数据集：k折交叉验证KFold()函数

from sklearn.model_selection import KFoldkf = KFold(n_splits = 8, shuffle = False)# n_splits = 8: 划分为8份# shuffle = False 输出是有序的for train_index, test_index in kf.split(data1): # data1就是所用的数据集 print('训练集：{}'.format(train_index)) print('测试集：{}'

2020-11-04 16:56:22 1716

原创批量调整word中mathtype公式大小

步骤一：打开mathtype，找到大小选项里的定义并打开步骤二：在完整里面更改所需数值大小，确认步骤三：依次点击：预置–公式预置–保存到文件步骤四：回到Word环境中，点击“MathType”菜单中的格式化公式命令步骤五：选择之前设定保存的格式文件确认就好了...

2020-10-26 19:23:03 916 1

原创【python】对list进行sort排序出现None

错误代码：print（list.sort()）# 会输出None正确代码：list.sort()print(list)

2020-10-10 21:55:41 4234

原创【python】list 嵌套[[[list]]]]

类似于：list = [[1, 2], [2, 3]]或者list = [[[1]]]可以通过这种方法提取：list[0]]

2020-10-10 21:48:14 599

原创【python】pandas DataFrame数据转为list（‘DataFrame‘ object has no attribute ‘tolist‘）

不可以直接使用tolist（），不然会报错：'DataFrame' object has no attribute 'tolist'正确方式：df.values.tolist()

2020-10-10 18:28:03 10692

原创【python】pandas.DataFrame选取特定行

>>> df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB', 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2', 'p3'])>>> df p1 p2 p30 GD GX FJ1 SD SX BJ2 HN HB AH3 HEN

2020-10-10 10:36:59 3433

原创【python】将DataFrame数据写入Excel中

x.to_excel('data.xls') # x为数据名

2020-10-09 22:35:29 6860 6

原创 python将相同ID的字符串进行合并

问题描述"""id value1 A1 B1 C2 D2 E2 F变为：id value1 [A,B,C]2 [D,E,F]pandas怎么把上面的结构变为下面的形式？"""解决方案：import pandas as pdimport numpy as npdata = pd.DataFrame({'id':[1,1,1,2,2,2],'value':['A','B','C','D','E','

2020-10-09 22:11:07 1905

原创 DataFrame按照列索引选取指定列

DataFrame["column"]

2020-10-09 21:42:22 4886 1

原创 word中mathtype公式偏上不对齐问题解决

在网上查阅资料绝大多数都是采用调整段落格式：选中右键当前行->段落->缩进与间距->取消选中“如果定义了文档网格，则与网格对齐”->换行与分页->文本对齐方式：居中对齐但是有第二种情况，就是已经用了第一步的方法之后，原有的公式对齐了，但是新输入的公式又对不齐了：双击公式进入mathtype界面->Ctrl+s更新即可（不用快捷键可以在文件里找到更新选项）...

2020-08-28 11:08:42 16153 2

原创 Anaconda安装texttable

要使用conda安装此软件包，请执行以下操作之一：conda install -c conda-forge texttableconda install -c conda-forge/label/gcc7 texttableconda install -c conda-forge/label/cf201901 texttableconda install -c conda-forge/label/cf202003 texttable官方链接：https://anaconda.org/conda

2020-08-24 12:55:17 1357

原创 TensorBoard No scalar data was found

检查文件保存路径上有没有中文字符不能有中文

2020-08-10 11:11:50 142

原创 ‘tensorboard‘ 不是内部或外部命令,也不是可运行的程序问题解决

需要将tensorboard的路径添加到系统的PATH路径里面1. 首先要的就是找到tensorboard.exe这个程序简单一点，直接到装anaconda的盘里面搜tensorboard找到后进去把路径复制下来2. 添加到系统的环境变量的PATH1、同时按baiWIN+R键，打开du“运行”对话框，输入sysdm.cpl，按回车键打开“系统属性”。2、在系统属性对话框中选择“高级”选项。3、点击“高级”选项卡中的“环境变量 ”。4、点击“新建”添加新的环境变量，点击“编辑”修改环境变量

2020-08-09 22:08:43 2869

原创 Anaconda下安装tensorflow环境与jupyter notebook配置（Win10，亲测有效）

为了安装tensorflow整整折腾了一天，头发都秃了一半，哭死了都，在我锲而不舍的尝试下，终于在jupyter notebook 上成功运行起来了，心疼自己的铁憨憨行为。针对各种报错问题，咱也不懂，大胆猜测原因：没注意到版本匹配问题！！！！！！！！！！下面从头开始（因为我是在云服务器上安装的，所以不方便截图，直接引用了参考文章的图）0. 安装anaconda网址：https://repo.continuum.io/archive/Anaconda3-5.2.0-Windows-x86_64.exe

2020-08-08 16:47:25 1427 1

原创逻辑回归中的coef

最近看逻辑回归一个线性可分案例的时候看到了如下的代码：coef1 = -theta_final[0, 0] / theta_final[2, 0] coef2 = -theta_final[1, 0] / theta_final[2, 0]然后想了一下，这个两个是决策边界的系数.可以理解为sigmoid函数是原本的一个函数的映射，所以原来函数会有一个决策边界。比如有两个特征X1， X2，画出来的图如下：这个红线就是决策边界。公式推导：sigmoid：...

2020-07-19 21:34:29 12509 1

原创【Python】matplotlib新手规范化画图

0. 介绍在matplotlib中，有两种画图方式：plt.figure()：这是通过matplotlib提供的一个api，这个plt提供了很多基本的function可以让你很快的画出图来，但是如果你想要更细致的精调，就要使用另外一种方法。（虽然教程基本上都是用这种方法，但不适合新手）fig, ax = plt.subplots(): 这个是比较规范的画图方法。指定figure和axes，然后对axes单独操作。下面来介绍这种方法。1. fig,ax = plt.subplots()plt.

2020-07-17 18:37:36 391

原创 Python计算中@的作用

在Python中numpy模块@在矩阵计算中起到乘积的作用。如：from numpy import *a = array([1, 2, 3])b = array([7, 8, 9])b = b.Ta@bOut：50

2020-07-16 09:39:58 399

原创 sqlite3.OperationalError: near “，“: syntax error

检查前面建表语句逗号是否用了中文的气死我了查了一个多小时的问题

2020-07-06 22:56:57 3481 1

原创新手试手Python爬虫：豆瓣Top250代码涉及到的知识点以及思路详解（适合新手）

0. 准备工作：进入网址：https://movie.douban.com/top250进入页面之后按F12,出现页面：根据提示Ctrl + R 刷新，右边页面更新：第一步，鼠标点击最左边开始的地方第二部，点击出现的top250画面更新：将右边拉倒最下面:最下面出现红框的部分等下会用到，复制下来。然后，点击下面的红色方框部分，网页的所有内容都在里面；点击红色箭头的小箭头，可以直接点到自己想要得地方。建议自己摸索下，很简单。后面的代码爬取内容都是从这里找的。1. 代码实现

2020-07-05 21:32:27 943 2

转载网络爬虫urllib：parse.urlencode()和request.Request()

https://www.jianshu.com/p/4c3e228940c8

2020-07-02 21:29:10 335

原创 TF-IDF算法原理与示例Python代码详解（Python，推荐算法）

0. 算法原理:1. 代码实现：# TF-IDF算法示例'''框架步骤：0.引入依赖 numpy pandas1.数据处理分割数据构建词库2.词数统计统计文档中每个词出现的词数3.计算词频 TF= 词语在文档出现次数/文档总词数出现次数/总词数4.计算逆文件频率 IDF = log(文档总数N+1)/(文档包含词语数量+1) 5.计算TF-IDF TF*IDF'''# 0. 引入依赖import numpy

2020-07-01 12:40:18 1558 1

原创 K均值(K-means)聚类算法原理与代码详解

0. 算法原理：上述过程简单描述：a: 初始数据b: 选择质点c: 根据质点划分d: 求均值，更新质心点e: 划分f: 更新质心点1. 代码实现：# K means 教程# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 从sklearn中直接生成聚类数据from sklearn.datasets.samples_generator import make_blobs# 1. 数据加载x, y =

2020-06-30 17:08:17 3088

原创自动提取所需文本（以邮箱和电话号码为例）Python项目程序（代码详解）

0. 代码实现：# python 3# phoneAndEmail.py - Finds phone numbers and email addresses on the clipboard# pyperclip 模块有 copy()和 paste()函数，可以向计算机的剪贴板发送文本，或从它接收文本# re模块正则表达式是对字符串进行操作,正则表达式是对字符串进行模糊匹配，提取自己需要的字符串部分import pyperclip, re# 0. 为电话号码创建一个正则表达式ph

2020-06-29 10:58:15 1071

原创决策树Gini指数心脏病例子（附Python代码实现）

0. 介绍Gini index: CART决策树使用“基尼指数”(Gini index)来选择划分属性。数据集D的纯度可用基尼值来度量：直观来看，Gini(D)反映了从数据集D中随机抽取两个样本，其类别标记不一致的概率（二分类）。因此，Gini(D)越小，则数据集D的纯度越高。总结：Gini指数越大则表示数据越不纯，Gini越小表示数据相对越纯。属性a的基尼指数定义为：于是，我们在选择划分属性时，选择那个使划分后Gini系数最小的属性作为最优划分属性。1. 心脏病例子：收集数据：

2020-06-28 20:56:25 3665 2

原创 K近邻算法(KNN)原理推导与实例代码实现详解(Python)

原理与推导过程：代码实现（sklearn自带数据集， iris鸢尾花）：# k近邻算法# 0. 引入依赖import numpy as npimport pandas as pd#这里直接引入sklearn里的数据集， iris鸢尾花from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split # 切分数据集为训练集和测试集from sklearn.metr

2020-06-27 22:08:46 994

原创 sklearn库求解线性回归最小二乘法实例代码（Python，附数据集下载）

代码实现：# 调库求解线性回归最小二乘法# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',')points[0, 0]# 提取points中的两列数据，分别作为x，yx = points[:, 0]y = points[:, 1]# 用plt

2020-06-27 10:19:00 1203

原创梯度下降法推导过程与代码实现（Python，一元，附数据集下载）

推导过程：代码实现(以一元为例)：# 简单线性回归（梯度下降法）# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据（data.csv）points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',')points[0, 0]# 提取points中的两列数据，分别作为x,yx = points[:, 0]

2020-06-26 19:00:07 581

原创线性回归最小二乘法求解过程与代码实现（一元，附对应数据下载地址）

求解过程：代码实现：简单线性回归（最小二乘法）# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',') points[0,0]# 提取points中的两列数据，分别作为x,yx = points[:, 0]y = points[:, 1]# 用p

2020-06-26 11:30:02 539

原创 strip() Python

介绍numpy.char.strip() 函数是Python中NumPy字符串函数用法numpy.char.strip() 函数用于移除开头或结尾处的特定字符。示例import numpy as np# 移除开头或结尾处的 a 字符print (np.char.strip('ashok arunooba','a'))# 移除数组元素头尾的 a 字符print (np.char.strip(['arunooba','admin','java'],'a'))运行结果：shok aru

2020-06-21 16:45:44 144

原创 split()函数 splitlines() 函数 Python

介绍：split()，splitlines()是Python中NumPy字符串函数用法：numpy.char.split() ：通过指定分隔符对字符串进行分割，并返回数组。默认情况下，分隔符为空格。numpy.char.splitlines()：以换行符作为分隔符来分割字符串，并返回数组。示例：numpy.char.split()代码：import numpy as np# 分隔符默认为空格print(np.char.split('I like running?'))# 分隔符为 .

2020-06-21 16:09:12 2265

原创 np.random.rand()与np.random.randn()

np.random.rand()作用：生成[0,1)区间内一个或一组数值，服从均匀分布使用方法：np.random.rand()：生成一个[0,1)区间均匀分布的随机数，示例：np.random.rand()Out[7]: 0.7309286434720168np.random.rand(m, n)：生成m*n阶矩阵，矩阵内数值为[0,1)区间均匀分布的随机数，示例：np.random.rand(10,1)Out[8]: array([[0.50699708], [

2020-06-20 11:05:10 2053

空空如也

空空如也