自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 收藏
  • 关注

原创 mac pycharm 启动报错 cannot connect to already running ide instance

【代码】mac pycharm 启动报错 cannot connect to already running ide instance。

2024-01-09 14:55:24 2700

原创 使用pandas绘图,并保存,支持中文

pandas 绘图 中文显示,图片保存

2023-12-28 21:50:17 486

原创 minconda配置pycharm的开发环境stepbystep

快速部署python的开发环境

2023-03-01 18:28:05 563

原创 如何更优雅地管理代码和开发--pycharm

代码管理,开发环境配置,代码比对

2022-10-07 17:19:17 323

原创 spark学习索引

spark的RDD、map、reduce、DAG、Transformation、Action的简单理解与总结

2022-09-17 11:20:05 741

原创 java命名规范

java命名规范

2022-06-22 18:58:24 120

原创 java 错误: 找不到或无法加载主类

java第一天:错误: 找不到或无法加载主类

2022-06-22 02:02:31 150

原创 pandas 显示所有列

显示所有列pd.set_option(‘display.max_columns’, None)显示所有行pd.set_option(‘display.max_rows’, None)设置value的显示长度为100,默认为50pd.set_option(‘max_colwidth’,100)

2022-04-08 11:49:01 2127

原创 git 拉取出错: Your local changes to the following files would be overwritten by merge:

场景:当我用gitbash从服务器拉取代码时,出现了文件冲突。git pull$ git pullerror: Your local changes to the following files would be overwritten by merge:A3_find_best_k.pyPlease commit your changes or stash them before you merge.刚开始时,A3_find_best_k.py是本地和服务器均相同的文件,但是之后,本地文

2022-04-03 16:40:48 1606 1

原创 解决networkx绘图 中文乱码,不需要复制ttf文件

文章目录症状解决matplotlib的字体解决常用字体症状字体无法编译报错信息C:\UserPro\python39\lib\tkinter\__init__.py:814: UserWarning: Glyph 24352 (\N{CJK UNIFIED IDEOGRAPH-5F20}) missing from current font.func(*args)图片乱码,其实是字体无法编译解决只需要在调用nx.draw_networkx时指定font_family 即可

2022-03-09 22:01:43 1874

原创 使用阿里云服务器 搭建简易的git远程仓库 实现代码的同步

文章目录初衷一、远程服务器的git仓库配置1、配置git环境2、新建用户,设置密码3、初始化仓库二、本地端访问初衷先聊一下初衷,租了一个阿里云的服务器,同时自己要在多台电脑(不同地点)上开发,因此想要通过git进行代码的同步。所以,使用阿里云服务器作为远程的git代码仓库,另外的电脑进行代码的pull和push. 类似下图,但更简单。由于使用场景的简单,因此参考下面这位博主做了简单的git服务器配置,所以过程会简化很多,被参考的这位博主功力深厚讲的很清楚,有更深需求的可以看看。Ubuntu下搭建

2022-03-07 22:23:44 3042

原创 linux ubuntu删除隐藏文件

出现问题root@iZ2zeje4y6n1vjlueehk2mZ:/home/young_git/projects# rm -rf ./rm: refusing to remove '.' or '..' directory: skipping '.'解决root@iZ2zeje4y6n1vjlueehk2mZ:/home/young_git/projects# rm -rf ./*root@iZ2zeje4y6n1vjlueehk2mZ:/home/young_git/projects# ls

2022-03-07 19:21:30 1039

原创 两条命令配置pip,解决pip安装慢 linux和windows均适用

两条命令配置pip,解决pip安装慢 linux和windows均适用方法1方法2实质说明方法1pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simplepip config set install.trusted-host pypi.tuna.tsinghua.edu.cn方法2pip config set global.index-url https://mirrors.aliyun.com/pypi/sim

2022-03-02 17:31:44 1126

原创 networkx的图基础

文章目录关于图方法简要总结小结实例节点边缘属性删除其他图类型参考networkx的官方文档简要梳理图的内容 https://www.osgeo.cn/networkx/tutorial.html一个图的元素有:图graph、节点node、边缘edge、相邻adjacency、度degree. 节点和边缘均是对象,可以包含很多属性,例如名称、权重、颜色等,均以字典格式存储,称为data.>>> data = {1: {2: {'weight': 4.7, 'color': 'blue

2022-03-01 21:28:23 834

原创 scrapy的爬虫使用和例子

文章目录大纲官方文档数据流[¶](https://www.osgeo.cn/scrapy/topics/architecture.html#data-flow)scrapy 初试一个鲜活的例子解析网页声明字段:配置item.py爬取网页解析结果:配置spider数据存储:配置pipelines.py保存结果:创建data目录大纲制作scrapy爬虫一共需要4步,(涉及关键脚本就3个)新建项目(scrapy startproject xxx):新建一个爬虫项目明确目标(编写items.py):明确你想

2022-02-12 19:17:13 959

原创 python 虚拟环境 创建和配置

python虚拟环境一、安装virtualenv模块二、虚拟环境生成虚拟环境启动查看虚拟环境内的模块快速安装模块三、虚拟环境退出偶然间发现了python虚拟环境的使用,记录一下使用方法。虚拟环境的好处是,可以新建一个开发环境(新文件夹),该环境新安装的包对原有环境不产生影响,并且比其他的集成的IDE更加轻量。一、安装virtualenv模块该功能由一个python包:virtualenv 支持。安装方法可以使用pip实现,在cmd中使用下面命令。D:\projects>pip instal

2022-02-07 17:41:08 1021

原创 git的使用自查指南【会常用的即可】

文章目录git常用命令git配置全流程配置信息克隆和推送代码库的三种方法提交代码拉取代码提醒只看git常用代码便可以实现一个完整的git部署过程。git常用命令########部署# 克隆$ git clone https://coding******.git# 显示所有分支$ git branch -a# 切换branch$ git checkout 分支名 # 关联本地branch 和远程branch$ git checkout -b local_branch [remot

2022-01-07 17:05:37 542

原创 pandas 选中多列,使用apply

总结使用axis参数控制即可axis = 1, 表示一次输入一行;axis = 0, 表示一次输入一列。生成数据import pandas as pdimport numpy as npdf = pd.DataFrame(np.array(range(1,9)).reshape(2,4))df 0 1 2 30 1 2 3 41 5 6 7 8df.columns = ['a','b','c','d']df a b c d0 1 2 3

2021-12-28 17:41:49 1091

原创 剪枝,预剪枝,后剪枝

剪枝是为了降低树模型的过拟合。预剪枝PrePrune:预剪枝,及早的停止树增长。通过提前停止树的构造进行剪枝.最大深度:max depth树的棵树、最小分裂的信息增益。信息增益小于一定的阈值后剪枝后剪枝的剪枝过程是删除一些子树,然后用其叶子节点代替,这个叶子节点所标识的类别通过大多数原则(majority class criterion)确定。用最可能的叶子节点来替换该子树。后剪枝首先通过完全分裂构造完整的决策树,允许过拟合,然后采取一定的策略来进行剪枝,常用的后剪枝策略包括:降低错误

2021-11-29 11:35:57 962

原创 笔记本的M.2下岗,sata固态的任务交接时,开机无法引导到sata固态的问题

如何在无数次装机失败中重拾信心初衷拦路虎尝试打虎打偏了属于是DiskGinus(NB!)初衷事情是这个样子的,我想把笔记本上的M.2固态硬盘换下来,因为它太热了… 所以需要在新的sata固态上安装系统,然后把M.2固态拔下来。拦路虎使用U盘制作老毛桃PE,将win11系统安装在新的固态上,然后在BIOS中调成新的硬盘启动。ok,这一步可以正常,之后也进入了win11的系统。这时,问题要来了,我把M.2的固态硬盘拔下来了,然后再次打开电脑,结果,进不去系统…尝试打虎打偏了属于是修复引导进

2021-10-31 01:53:27 1994

原创 【增删改查 表格汇总】python数据类型(字符串、列表、元组、字典、集合)

增删改查数据类型的增删改查列表删查字典删除改查集合运算数据类型的增删改查数据类型 字符串 列表 元组 字典 集合新建 ’ ’ [1,2], list([1,2]) (1,2),tuple([1,2]) {1:2,3:4},dict([[1,2],[3,4]]),fromkeys(), dict(zip(lst1,lst2)) set([1,2,3,4])增 + * +、append、insert、extend【复制、深、浅拷贝】 不可变 赋值 add删 索

2021-09-04 19:58:11 127

原创 Python的复制、浅拷贝、深拷贝区别和代码说明

Python赋值总结一、概念解读赋值:旧瓶装旧酒浅拷贝:新瓶装旧酒深拷贝:新瓶装新酒二、实例测试测试方法赋值浅拷贝深拷贝赋值、浅拷贝、深拷贝总结赋值: 新建一个原来对象内存地址的引用,对象本身不开辟新的内存空间;浅拷⻉: 新建多个原来对象内一级子元素内存地址的引用,对象本身需要开辟新的内存空间;深拷⻉: 复制原来对象内的所有N级子元素的数据,所有的数据都开辟新的内存空间。一、概念解读赋值:旧瓶装旧酒对于复制的操作,最简单的就是赋值,指的是新建一个对象的引用,新建目标对象与原来的目标对象指

2021-09-04 16:46:59 421 1

原创 pandas 包含字符串

转化为字符串 .strdf[colname].str.contains(“x”)返回bool值提取df[df[colname].str.contains(“x”)]

2021-08-26 11:04:17 1150

原创 sqlalchem 官方文档翻译版

官方文档https://www.osgeo.cn/sqlalchemy/一个博主翻译的上篇https://www.cnblogs.com/iwangzc/p/4112078.html主要包含,连接、配置、回滚、查询、计数等函数中篇https://www.cnblogs.com/iwangzc/p/4114913.html主要包含:外键、子查询、创建关系运算。下篇...

2021-08-26 10:42:41 153

原创 pandas merge\join\concat\append

一个写的比较详细的blogpandas的四种拼接操作补充:两条声明一、搞清拼接时的主键无论是哪种拼接,都要指定一个主键。要么是行,要么是列,要么是行索引、要么是列索引。因此,在进行拼接时首先要搞清楚,拼接的主键是哪个!二、DataFrame以行为单位结构化数据的特点。拼接方法的归属:merge\join\append\concatimport pandas as pd归属方法说明pd.DataFramemerge\join\appendmerge\joi

2021-08-23 10:48:11 67

原创 pandas 统计各列缺失、统计量、列属性

统计各列的缺失print('数据集的缺失情况\n',testrecords.isnull().sum())

2021-08-20 09:58:24 370

原创 python实现sqlalchemy的使用

orm语句和SQL语句的区别sqlAlchemy解读: https://zhuanlan.zhihu.com/p/265224273sqlAlchemy解读:https://www.cnblogs.com/ybjourney/p/11832045.html特点是操纵Python对象而不是SQL查询,也就是在代码层面考虑的是对象,而不是SQL,体现的是一种程序化思维,这样使得Python程序更加简洁易懂。具体的实现方式是将数据库表转换为Python类,其中数据列作为属性,数据库操作作为方法。ab

2021-08-12 19:36:57 4797 1

原创 远程服务器后台运行程序--本地可退出登陆依然运行

linux后端运行程序,本地电脑关机也不会停止程序的运行一、后台运行程序二、查看运行的程序的进程1. 直接vim hehe.log2. 采用 tail -f 命令三、如何在服务器的后端结束程序参考文献一、后台运行程序# 终端输入命令nohup python ****.py > hehe.log&其中****.py是你想要运行的python程序,hehe.log是存储的日志文件,我们可以通过查看hehe.log来查看我们的程序的运行情况。注意需要敲击两次回车键。二、查看运行的程序的

2021-07-29 11:31:40 1588

原创 离线服务器 pip批量安装 python模块的方法--单个、批量、指定版本

服务器python模块安装离线下载安装包下载单个离线包批量下载离线包 -离线安装安装单个离线包 -批量安装离线包下载linux指定版本的包安装tar包可以实现模块的单个或批量下载和安装。可以实现linux版本的模块下载可以实现模块的指定版本下载。离线下载安装包下载单个离线包pip download -d your_offline_packages <package_name>批量下载离线包 -pip download -d your_offline_packages -r

2021-07-29 11:23:30 2294

原创 xgboost和LightGBM的模型参数寻优的代码---奥图那optuna篇

文章目录XGBoostLightGBM主要给出了xgboost和lightGBM调参的实现代码。这个寻优过程挺快的,可以指定不同的测试集。给定参数的寻优范围可以实现自动寻优。XGBoost主要需要更改的地方:param 中指定搜索的范围**param 将参数传入XGBClassifier设置需要测试的轮数 n_trials# xgboosttrainrecords = pd.read_csv(r"./traindata/traindata_combine.csv",encoding="

2021-07-29 10:49:27 845

原创 数据挖掘的个人导包规范--围绕sklearn

文章目录系统基础预处理模型评估寻优系统import osfrom time import timeimport gc # garbage collector?基础import pandas as pdimport numpy as npfrom numpy import loadtxt预处理from sklearn.preprocessing import OneHotEncoderfrom collections import Counterfrom sklearn.util

2021-07-23 11:58:11 50

原创 探索性数据分析:统计量表+一图多变量可视化

探索性数据分析导入常用包统计量表可视化导入常用包import osimport numpy as npimport pandas as pdfrom scipy import statsimport matplotlib.pyplot as plt统计量表主要通过计算基本统计量表,检查变量的取值范围、中位数统计量计数最小值最大值平均值中位数标准差偏度峰度x13220.820-1.50y35440.820-1.50

2021-07-23 11:54:57 548

原创 数据挖掘基本流程 CRISP-DM --项目实战总结 可操作性强

CRISP-DM数据挖掘基本流程数据挖掘的基本流程图CRISP-DMCRISP-DM的实现方法商业理解数据理解数据准备建立模型模型评估结果部署文件夹的内部框架数据挖掘的基本流程图在实际的数据挖掘过程中,基本会经历一下的这些流程(主要参考CRISP-DM的流程,下文有详述。)。其中包含两个小循环和一个大循环。第一个小循环是商业理解和数据理解之间的指标的反复构建和优化。第二个小循环是数据准备和建立模型,主要涉及到对数据的各种变换:清洗、特征筛选、特征生成、数据集成等。一个大循环是指,在结果部署之前

2021-07-23 11:23:17 3078

原创 数据分析的描述性的基本统计量python实现

对各个特征计算其基本统计量,以下给出了一个简单的计算程序。分别求解了最小值、最大值、中位数、平均值、标准差、偏度、峰度、缺失值个数。并可以导出到excel中。import osimport numpy as npimport pandas as pdfrom scipy import statsimport matplotlib.pyplot as pltdef basic_desc(data): '''计算某一列的基本统计量:最小值、最大值、中位数、平均值、标准差、偏度、峰度

2021-07-09 09:41:18 814

原创 与<博><客><园>的梦幻联动

与<博><客><园>的梦幻联动我的地址:https://home.cnblogs.com/u/2431745/

2021-06-16 16:29:05 44

原创 本地python使用anaconda内置包之如何添加python的模块搜索路径

文章目录本地python使用anaconda内置包之如何添加python的模块搜索路径一、路径检索顺序二、查看路径三、修改路径的三种方法1. 通过 PYTHONPATH 环境变量修改搜索路径2. 通过 .pth 文件修改搜索路径3. 临时修改模块搜索路径 sys.path本地python使用anaconda内置包之如何添加python的模块搜索路径模块搜索路径的介绍,简言之,import 模块时,python寻找模块的路径。搜索路径sys.path 是解释器搜索某个 module 的所有目录的列表

2021-06-14 16:38:46 1549 1

原创 描述性统计分析和可视化方法汇总(力求精简)

文章目录一、为什么要描述和可视化1. 统计研究的过程2.描述性统计分析的作用二、如何描述和可视化1. 数据类型是基础2. 单变量分布分析3. 两变量相关性分析4. 多变量交叉相关分析之前学过spss的探索性数据分析,在此分享以下之前学过的方法,重在精简,打开数据描述的思路,若有不清楚的地方,可以在留言区探讨。一、为什么要描述和可视化1. 统计研究的过程2.描述性统计分析的作用描述性统计分析属于整数数据这个环节,它的作用主要有以下几点:描述某变量的分布信息就是它长什么样子、高矮胖瘦,值大的多

2021-04-21 16:47:53 3923

原创 一些比较好用的python内置函数

菜鸟上:https://www.runoob.com/python/python-built-in-functions.html查户口# 哲学:从哪里来? 是什么类型?能干什么?os.__file__ # 显示导入的模块os的所在路径type(object) # 查看类型isinstance('2',str) # 验证数据类型,是否为字符串类的一个实例help('str') # 查看文档,函数参数dir(object) #

2021-04-08 21:19:18 98

原创 python数据可视化的画布、类型、坐标系等参数配置

文章目录python数据可视化作图的步骤1. 导入模块2. 数据3. 画布(pl与plt操作类似)画布个数:figure(n,figsize=(16,16))画布分区:画布切换4. 绘图类型设置坐标系python数据可视化(例子可以看pandas学习笔记)作图的步骤1. 导入模块import numpy as npimport matplotlib.pyplot as plt import pylab as pl2. 数据* 自变量、因变量,多个因变量3. 画布(pl与plt操作

2021-04-08 20:57:34 626

原创 利用python进行数据分析的常用方法

文章目录利用python进行数据分析的常用方法一、回归分析:二、聚类分析:(无监督)三、分类方法:(有监督)表格汇总:常用的sklearn包利用python进行数据分析的常用方法详细代码可参照上一篇文章:https://blog.csdn.net/weixin_43899514/article/details/110671882一、回归分析:类型:线性回归、岭回归、Lasso回归分析步骤导入模块类实例化有时需要传入参数,初始化实例模型拟合.fit模型预测.predi

2021-04-08 20:49:01 334

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除