一道微光-CSDN博客

场景：当我用gitbash从服务器拉取代码时，出现了文件冲突。git pull$ git pullerror: Your local changes to the following files would be overwritten by merge:A3_find_best_k.pyPlease commit your changes or stash them before you merge.刚开始时，A3_find_best_k.py是本地和服务器均相同的文件，但是之后，本地文

2022-04-03 16:40:48 1606 1

原创解决networkx绘图中文乱码，不需要复制ttf文件

文章目录症状解决matplotlib的字体解决常用字体症状字体无法编译报错信息C:\UserPro\python39\lib\tkinter\__init__.py:814: UserWarning: Glyph 24352 (\N{CJK UNIFIED IDEOGRAPH-5F20}) missing from current font.func(*args)图片乱码，其实是字体无法编译解决只需要在调用nx.draw_networkx时指定font_family 即可

2022-03-09 22:01:43 1874

原创使用阿里云服务器搭建简易的git远程仓库实现代码的同步

文章目录初衷一、远程服务器的git仓库配置1、配置git环境2、新建用户，设置密码3、初始化仓库二、本地端访问初衷先聊一下初衷，租了一个阿里云的服务器，同时自己要在多台电脑（不同地点）上开发，因此想要通过git进行代码的同步。所以，使用阿里云服务器作为远程的git代码仓库，另外的电脑进行代码的pull和push. 类似下图，但更简单。由于使用场景的简单，因此参考下面这位博主做了简单的git服务器配置，所以过程会简化很多，被参考的这位博主功力深厚讲的很清楚，有更深需求的可以看看。Ubuntu下搭建

2022-03-07 22:23:44 3042

原创 linux ubuntu删除隐藏文件

出现问题root@iZ2zeje4y6n1vjlueehk2mZ:/home/young_git/projects# rm -rf ./rm: refusing to remove '.' or '..' directory: skipping '.'解决root@iZ2zeje4y6n1vjlueehk2mZ:/home/young_git/projects# rm -rf ./*root@iZ2zeje4y6n1vjlueehk2mZ:/home/young_git/projects# ls

2022-03-07 19:21:30 1039

原创两条命令配置pip，解决pip安装慢 linux和windows均适用

两条命令配置pip，解决pip安装慢 linux和windows均适用方法1方法2实质说明方法1pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simplepip config set install.trusted-host pypi.tuna.tsinghua.edu.cn方法2pip config set global.index-url https://mirrors.aliyun.com/pypi/sim

2022-03-02 17:31:44 1126

原创 networkx的图基础

文章目录关于图方法简要总结小结实例节点边缘属性删除其他图类型参考networkx的官方文档简要梳理图的内容 https://www.osgeo.cn/networkx/tutorial.html一个图的元素有：图graph、节点node、边缘edge、相邻adjacency、度degree. 节点和边缘均是对象，可以包含很多属性，例如名称、权重、颜色等，均以字典格式存储，称为data.>>> data = {1: {2: {'weight': 4.7, 'color': 'blue

2022-03-01 21:28:23 834

原创 scrapy的爬虫使用和例子

文章目录大纲官方文档数据流[¶](https://www.osgeo.cn/scrapy/topics/architecture.html#data-flow)scrapy 初试一个鲜活的例子解析网页声明字段：配置item.py爬取网页解析结果：配置spider数据存储：配置pipelines.py保存结果:创建data目录大纲制作scrapy爬虫一共需要4步，（涉及关键脚本就3个）新建项目（scrapy startproject xxx）：新建一个爬虫项目明确目标（编写items.py）：明确你想

2022-02-12 19:17:13 959

原创 python 虚拟环境创建和配置

python虚拟环境一、安装virtualenv模块二、虚拟环境生成虚拟环境启动查看虚拟环境内的模块快速安装模块三、虚拟环境退出偶然间发现了python虚拟环境的使用，记录一下使用方法。虚拟环境的好处是，可以新建一个开发环境（新文件夹），该环境新安装的包对原有环境不产生影响，并且比其他的集成的IDE更加轻量。一、安装virtualenv模块该功能由一个python包：virtualenv 支持。安装方法可以使用pip实现，在cmd中使用下面命令。D:\projects>pip instal

2022-02-07 17:41:08 1021

原创 git的使用自查指南【会常用的即可】

文章目录git常用命令git配置全流程配置信息克隆和推送代码库的三种方法提交代码拉取代码提醒只看git常用代码便可以实现一个完整的git部署过程。git常用命令########部署# 克隆$ git clone https://coding******.git# 显示所有分支$ git branch -a# 切换branch$ git checkout 分支名 # 关联本地branch 和远程branch$ git checkout -b local_branch [remot

2022-01-07 17:05:37 542

原创 pandas 选中多列，使用apply

总结使用axis参数控制即可axis = 1, 表示一次输入一行；axis = 0, 表示一次输入一列。生成数据import pandas as pdimport numpy as npdf = pd.DataFrame(np.array(range(1,9)).reshape(2,4))df 0 1 2 30 1 2 3 41 5 6 7 8df.columns = ['a','b','c','d']df a b c d0 1 2 3

2021-12-28 17:41:49 1091

原创剪枝，预剪枝，后剪枝

剪枝是为了降低树模型的过拟合。预剪枝PrePrune：预剪枝，及早的停止树增长。通过提前停止树的构造进行剪枝.最大深度：max depth树的棵树、最小分裂的信息增益。信息增益小于一定的阈值后剪枝后剪枝的剪枝过程是删除一些子树，然后用其叶子节点代替，这个叶子节点所标识的类别通过大多数原则(majority class criterion)确定。用最可能的叶子节点来替换该子树。后剪枝首先通过完全分裂构造完整的决策树,允许过拟合,然后采取一定的策略来进行剪枝,常用的后剪枝策略包括:降低错误

2021-11-29 11:35:57 962

原创笔记本的M.2下岗，sata固态的任务交接时，开机无法引导到sata固态的问题

如何在无数次装机失败中重拾信心初衷拦路虎尝试打虎打偏了属于是DiskGinus（NB！）初衷事情是这个样子的，我想把笔记本上的M.2固态硬盘换下来，因为它太热了… 所以需要在新的sata固态上安装系统，然后把M.2固态拔下来。拦路虎使用U盘制作老毛桃PE，将win11系统安装在新的固态上，然后在BIOS中调成新的硬盘启动。ok，这一步可以正常，之后也进入了win11的系统。这时，问题要来了，我把M.2的固态硬盘拔下来了，然后再次打开电脑，结果，进不去系统…尝试打虎打偏了属于是修复引导进

2021-10-31 01:53:27 1994

原创【增删改查表格汇总】python数据类型(字符串、列表、元组、字典、集合)

增删改查数据类型的增删改查列表删查字典删除改查集合运算数据类型的增删改查数据类型字符串列表元组字典集合新建 ’ ’ [1,2], list([1,2]) (1,2),tuple([1,2]) {1:2,3:4},dict([[1,2],[3,4]])，fromkeys(), dict(zip(lst1,lst2)) set([1,2,3,4])增 + * +、append、insert、extend【复制、深、浅拷贝】不可变赋值 add删索

2021-09-04 19:58:11 127

原创 Python的复制、浅拷贝、深拷贝区别和代码说明

Python赋值总结一、概念解读赋值：旧瓶装旧酒浅拷贝：新瓶装旧酒深拷贝：新瓶装新酒二、实例测试测试方法赋值浅拷贝深拷贝赋值、浅拷贝、深拷贝总结赋值: 新建一个原来对象内存地址的引用,对象本身不开辟新的内存空间;浅拷⻉: 新建多个原来对象内一级子元素内存地址的引用,对象本身需要开辟新的内存空间;深拷⻉: 复制原来对象内的所有N级子元素的数据,所有的数据都开辟新的内存空间。一、概念解读赋值：旧瓶装旧酒对于复制的操作,最简单的就是赋值,指的是新建一个对象的引用，新建目标对象与原来的目标对象指

2021-09-04 16:46:59 421 1

原创 pandas 包含字符串

转化为字符串 .strdf[colname].str.contains(“x”)返回bool值提取df[df[colname].str.contains(“x”)]

2021-08-26 11:04:17 1150

原创 sqlalchem 官方文档翻译版

官方文档https://www.osgeo.cn/sqlalchemy/一个博主翻译的上篇https://www.cnblogs.com/iwangzc/p/4112078.html主要包含，连接、配置、回滚、查询、计数等函数中篇https://www.cnblogs.com/iwangzc/p/4114913.html主要包含：外键、子查询、创建关系运算。下篇...

2021-08-26 10:42:41 153

原创 pandas merge\join\concat\append

一个写的比较详细的blogpandas的四种拼接操作补充：两条声明一、搞清拼接时的主键无论是哪种拼接，都要指定一个主键。要么是行，要么是列，要么是行索引、要么是列索引。因此，在进行拼接时首先要搞清楚，拼接的主键是哪个！二、DataFrame以行为单位结构化数据的特点。拼接方法的归属：merge\join\append\concatimport pandas as pd归属方法说明pd.DataFramemerge\join\appendmerge\joi

2021-08-23 10:48:11 67

原创 pandas 统计各列缺失、统计量、列属性

统计各列的缺失print('数据集的缺失情况\n',testrecords.isnull().sum())

2021-08-20 09:58:24 370

原创 python实现sqlalchemy的使用

orm语句和SQL语句的区别sqlAlchemy解读: https://zhuanlan.zhihu.com/p/265224273sqlAlchemy解读：https://www.cnblogs.com/ybjourney/p/11832045.html特点是操纵Python对象而不是SQL查询，也就是在代码层面考虑的是对象，而不是SQL，体现的是一种程序化思维，这样使得Python程序更加简洁易懂。具体的实现方式是将数据库表转换为Python类，其中数据列作为属性，数据库操作作为方法。ab

2021-08-12 19:36:57 4797 1

原创远程服务器后台运行程序--本地可退出登陆依然运行

linux后端运行程序，本地电脑关机也不会停止程序的运行一、后台运行程序二、查看运行的程序的进程1. 直接vim hehe.log2. 采用 tail -f 命令三、如何在服务器的后端结束程序参考文献一、后台运行程序# 终端输入命令nohup python ****.py > hehe.log&其中****.py是你想要运行的python程序，hehe.log是存储的日志文件，我们可以通过查看hehe.log来查看我们的程序的运行情况。注意需要敲击两次回车键。二、查看运行的程序的

2021-07-29 11:31:40 1588

原创离线服务器 pip批量安装 python模块的方法--单个、批量、指定版本

服务器python模块安装离线下载安装包下载单个离线包批量下载离线包 -离线安装安装单个离线包 -批量安装离线包下载linux指定版本的包安装tar包可以实现模块的单个或批量下载和安装。可以实现linux版本的模块下载可以实现模块的指定版本下载。离线下载安装包下载单个离线包pip download -d your_offline_packages <package_name>批量下载离线包 -pip download -d your_offline_packages -r

2021-07-29 11:23:30 2294

原创 xgboost和LightGBM的模型参数寻优的代码---奥图那optuna篇

文章目录XGBoostLightGBM主要给出了xgboost和lightGBM调参的实现代码。这个寻优过程挺快的，可以指定不同的测试集。给定参数的寻优范围可以实现自动寻优。XGBoost主要需要更改的地方：param 中指定搜索的范围**param 将参数传入XGBClassifier设置需要测试的轮数 n_trials# xgboosttrainrecords = pd.read_csv(r"./traindata/traindata_combine.csv",encoding="

2021-07-29 10:49:27 845

原创数据挖掘的个人导包规范--围绕sklearn

文章目录系统基础预处理模型评估寻优系统import osfrom time import timeimport gc # garbage collector?基础import pandas as pdimport numpy as npfrom numpy import loadtxt预处理from sklearn.preprocessing import OneHotEncoderfrom collections import Counterfrom sklearn.util

2021-07-23 11:58:11 50

原创探索性数据分析：统计量表+一图多变量可视化

探索性数据分析导入常用包统计量表可视化导入常用包import osimport numpy as npimport pandas as pdfrom scipy import statsimport matplotlib.pyplot as plt统计量表主要通过计算基本统计量表，检查变量的取值范围、中位数统计量计数最小值最大值平均值中位数标准差偏度峰度x13220.820-1.50y35440.820-1.50

2021-07-23 11:54:57 548

原创数据挖掘基本流程 CRISP-DM --项目实战总结可操作性强

CRISP-DM数据挖掘基本流程数据挖掘的基本流程图CRISP-DMCRISP-DM的实现方法商业理解数据理解数据准备建立模型模型评估结果部署文件夹的内部框架数据挖掘的基本流程图在实际的数据挖掘过程中，基本会经历一下的这些流程（主要参考CRISP-DM的流程，下文有详述。）。其中包含两个小循环和一个大循环。第一个小循环是商业理解和数据理解之间的指标的反复构建和优化。第二个小循环是数据准备和建立模型，主要涉及到对数据的各种变换：清洗、特征筛选、特征生成、数据集成等。一个大循环是指，在结果部署之前

2021-07-23 11:23:17 3078

原创数据分析的描述性的基本统计量python实现

对各个特征计算其基本统计量，以下给出了一个简单的计算程序。分别求解了最小值、最大值、中位数、平均值、标准差、偏度、峰度、缺失值个数。并可以导出到excel中。import osimport numpy as npimport pandas as pdfrom scipy import statsimport matplotlib.pyplot as pltdef basic_desc(data): '''计算某一列的基本统计量：最小值、最大值、中位数、平均值、标准差、偏度、峰度

2021-07-09 09:41:18 814

原创与＜博＞＜客＞＜园＞的梦幻联动

与<博><客><园>的梦幻联动我的地址：https://home.cnblogs.com/u/2431745/

2021-06-16 16:29:05 44

原创本地python使用anaconda内置包之如何添加python的模块搜索路径

文章目录本地python使用anaconda内置包之如何添加python的模块搜索路径一、路径检索顺序二、查看路径三、修改路径的三种方法1. 通过 PYTHONPATH 环境变量修改搜索路径2. 通过 .pth 文件修改搜索路径3. 临时修改模块搜索路径 sys.path本地python使用anaconda内置包之如何添加python的模块搜索路径模块搜索路径的介绍，简言之，import 模块时，python寻找模块的路径。搜索路径sys.path 是解释器搜索某个 module 的所有目录的列表

2021-06-14 16:38:46 1549 1

空空如也

空空如也