自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

什么都干的派森

常见工作问题记录

  • 博客(260)
  • 资源 (8)
  • 收藏
  • 关注

原创 Kmeans特征降维方法

用到的数据集:各国发展水平统计信息↓字段解释:country : 国名child_mort : 每1000个婴儿的5年死亡率exports : 人均商品和服务出口,以人均国内生产总值的百分比给出health : 人均卫生支出总额,以人均国内生产总值的百分比给出imports : 人均商品和服务进口,以人均国内生产总值的百分比给出Income : 人均净收入Inflation : 国内生产总值年增长率的测算(通货膨胀率)

2023-11-06 15:11:17 205 17

原创 Vue常用方法汇总【更新中】

https://blog.csdn.net/weixin_43721000/article/details/125017785https://blog.csdn.net/weixin_43721000/article/details/125527254https://blog.csdn.net/weixin_43721000/article/details/123684151https://blog.csdn.net/weixin_43721000/article/details/128629382http

2023-04-11 14:27:39 3668 65

原创 机器学习相关知识点整理【更新中】

如果要在CSDN博客中输入数学公式又不知道那些奇奇怪怪的符号应该怎么写,那么可以参考KaTeX库的文档ps:KaTeX库是一个快速的,为网站呈现 Tex 科学公式 的简单易用的 javascript 库下面整理了一些机器学习相关的常用公式写法,以供参考。

2022-09-17 15:07:53 1615 84

原创 FastAPI使用教程【更新中】

二、模板创建 main.py 文件,内容如下三、启动命令ps:127.0.0.1:8000127.0.0.1:8000/docs【Swagger UI 提供的api文档】127.0.0.1:8000/redoc【ReDoc 提供的api文档】代码调用方法2.指定数据类型的路径参数代码调用方法3.枚举路径参数代码调用方法4.匹配所有路径代码调用方法5.普通传参代码调用方法6.必备参数代码调用....................................

2022-06-27 19:20:29 7089 14

原创 Docker常用命令【更新中】

常用命令一、服务1.启动docker服务2.设置docker服务开机自启动3.关闭docker服务4.禁止docker服务开机自启动二、镜像1.查看镜像列表2.打包镜像3.加载镜像4.创建镜像5.删除所有镜像6.直接从镜像启动容器并进入容器继续执行命令7.打包容器成镜像8.打包镜像成压缩包9.解压镜像压缩包并加载到本地镜像列表三、容器1.查看容器列表及运行状态2.创建并启动容器3.启动已创建的容器4.停止容器5.删除容器6.删除镜像7.打印容器日志8.暂停容器

2022-03-16 11:16:50 6357 18

原创 PySide QWebChannel实现Python与JS双向通信的前后端分离桌面应用

以往开发桌面应用通常都是页面接口一起写,这样开发周期比较长,且页面样式不灵活,如果能把页面交给前端写的话,就可前后端并行开发桌面应用了,并且css语言灵活好用样式丰富。下面介绍一种 Python + vue 的桌面应用开发模式(之前我有讲过另一种也是 python + vue 的桌面应用开发,但那种不能双向通信,详情可参考这篇文章。

2024-04-16 19:14:40 494

原创 Python防止打包后的exe重复执行

pyinstaller打包的exe如果被连续点击的话,会启动多个程序,对于复杂的程序来说,同时运行可能会造成严重的后果,因此需要一个程序锁,保证单次仅启动一个exe。

2024-04-11 16:38:50 1005

原创 Python操作Sqlite的简单封装

二、配置文件utils.config.py三、实现类utils.PostGreOp.py

2024-03-25 17:23:00 684

原创 Python操作PostGre的简单封装

【代码】Python操作PostGre的简单封装。

2024-03-25 16:51:10 131

原创 QWebEngineView无法播放H5中的mp4

查阅资料后发现,对于视频是 m3u8 格式的文件 , QT 安装包自带的 QWebEngineView 是不支持在线解码的,所以播放不了,大致和 html5 视频播放技术的相关版权有关,具体不深究。ps:编译过程需要依赖指定环境,且流程相对复杂,编译时间较长,网上有很多类似的编译方法,可以自行去搜,我就不贴别人的链接了。使用 pyqt、pyside 的 QWebEngineView 编写的浏览器无法播放html页面中的视频。

2024-03-23 12:59:16 87

原创 pandas无法读取/保存xls格式的excel的解决办法

安装 1.5.0 版本的 pandas。安装 xlrd>=2.0.1 的版本。xls xls xls

2024-03-19 17:21:34 273

原创 Python获取本机内外网ip地址

【代码】Python获取本机内外网ip地址。

2024-02-29 10:10:17 42

原创 Fastapi打包exe后无限启动导致死机的解决办法

直接运行 python 脚本不会报错,也不会导致无限启动的问题,不过一旦打包成 exe 就会无限启动子进程。将 fastapi 服务打包成 exe 后双击执行,命令行中不断创建服务导致cpu吃满,最后死机。这样再打包 exe 执行,就不会无限启动子进程撑爆 cpu 啦。fastapi 启动时指定了多个 workers 进程。该方法作用是阻止子进程运行其后面的代码。main 方法下加入这两行代码。

2024-01-18 20:34:31 624 2

原创 Fastapi+Jsonp实现前后端跨域请求

随便找个网页打开控制台,将前端 js 部分复制上去回车,可以看到如下返回结果。

2024-01-18 19:52:40 242

原创 hosts文件修改方法(不重启)

这样访问 rhino.acme.com 域名时,就会直接映射到 102.54.94.97 这个 ip。为了使修改生效,需要 重启 或者 刷新DNS缓存,刷新命令如下 ↓。ip+空格+域名 或者 ip+制表符+域名。

2023-12-16 17:09:02 2546 9

原创 Vue2脚手架搭建+项目基础依赖安装

使用方法可以参考这篇文章。使用方法可以参考这篇文章。使用方法可以参考这篇文章。

2023-12-07 20:35:50 374 5

原创 python pip安装第三方包时报错 error: Microsoft Visual C++ 14.0 or greater is required.

当前安装包依赖 Visual C++,这个东西没法用pip安装需要自己手动安装。这样选择安装即可,记得把安装位置换到系统盘以外的地方(毕竟这玩意有5个G)报错的这段话最后给出了官方下载地址,直接点进去就行,或者点我这个地址。pip install 的时候报错一大堆,其中有这么一段话 👇。

2023-11-25 22:14:45 1795 10

原创 python pdf转txt文本、pdf转json

此方法只能转文本格式的pdf,如果是图片格式的pdf需要用到ocr包,以后如果有这方面需求再加这个方法。

2023-11-24 15:35:43 1049 3

原创 mysql插入富文本表情时报错(1366, “Incorrect string value: ‘\xF0\x9F\x91\x8D\xF0\x9F…’ for column...

mysql当前字符集不支持插入表情,需要修改字符集为。向mysql中插入富文本表情后报错。执行这行命令修改数据表字符集。

2023-11-23 16:05:39 398 10

原创 nvidia-docker部署pytorch服务【GPU工作站】

打印了下面这段输出,说明 nvidia-docker 安装成功了。检查一下宿主机cuda和容器cuda版本是否对应。nvidia-docker 一般容器启动命令如下。安装 nvidia-docker。部署gpu服务的关键参数是。启动一个简单的容器测试一下。参考nvidia官方。centos安装方法。ubuntu安装方法。

2023-11-15 21:42:45 570 11

原创 centos7安装cuda和nvidia-driver

安装步骤如下检查系统有没有cuda支持的GPU检查系统是否支持检查ggc是否安装。

2023-11-15 21:35:42 187

原创 构建Docker基础镜像(ubuntu20.04+python3.9.10+pytorch-gpu-cuda11.8)

ps:创建镜像名为 baseIMG_ub2004py3910pytorchgpucuda118 标签为 latest 的镜像,从当前路径下的 DockerFile 文件打包。下拉选择 Gzipped 包。

2023-11-13 15:51:43 1317 3

原创 centos7 yum安装python3.9时报错【没有可用软件包 python3.9。 错误:无须任何处理】

在 centos 中用 yum 命令安装 python3.9。

2023-11-13 15:00:08 740

原创 Python Fastapi+Vue+JWT实现注册、登录、状态续签【登录保持】

登录路由方法 server_router/admin.py。根路由方法 server_main.py。

2023-11-11 14:15:44 908 2

原创 Vue渲染MarkDown

node.js安装【支持npm命令】可以参考这篇文档 ↓。

2023-11-08 11:13:58 310 1

原创 node.js安装【支持npm命令】

我这边用的是vue2,对应下面这几个node.js的版本应该都行。不配置镜像可能会导致npm下载时间过长或者根本没法下载的情况。选好安装目录,下一步下一步一直点就行了。下载这个 .msi 文件。

2023-11-08 11:13:05 94

原创 Kmeans算法的K值选择技巧【Elbow Method + Silhouette Score Method】

具体来说,Silhouette Score 是一种衡量聚类结果质量的指标,它结合了聚类内部的紧密度和不同簇之间的分离度。这是一种绘制k值范围的平方和的方法。如果此图看起来像一只手臂,则k是选择的类似肘部的值。这是一种根据数据点与彼此相似的其他数据点的聚类程度来评估聚类质量的方法。使用距离公式计算该分数,并且选择具有最高分数的k值用于建模。该值的范围在 -1 到 1 之间,越接近 1 表示数据点聚类得越好,越接近 -1 则表示聚类结果较差。1.紧密度:数据点到同簇其他点的平均距离。上图的最佳值为2,3,4。

2023-10-28 17:21:52 1113 12

原创 Kmeans算法实现目标客户聚类分析【2维特征】

Kmeans是聚类算法中较为简单的一种,简单但实用,有如下优势和缺点:优势算法简单,便于使用(算法仅需要考虑一个分类数量K即可)适合常规数据集(最好是线性可分的数据集)适合不适合缺点K值难以确定(因为是无监督训练,没有标签,所以难以确定最终要聚成几个类,不过还是有一个方法可以尽可能的确定大致的聚类数量,就是通过k值增加时,所有数据点跟其质心的距离平方总和的变化趋势来确定——后续代码中有详细讲解。同时聚类的最终结果还需要人为给出合理的解释,如果解释不通,那这个聚类结果多半没有什么意义)

2023-10-25 00:24:23 242 13

原创 Vue使用Echarts建立知识图谱

【代码】Vue使用Echarts建立知识图谱。

2023-10-19 11:19:06 592 8

原创 KNN实现鸢尾花分类

常规训练的话需要自己去试那个K的值,一般试个 3、5、7、9 就行网格搜索训练可以让机器自己去试这个K的值,训练结束后使用最好的模型预测即可N折交叉验证训练会让训练量提升N倍,但是会最大化的利用已有数据进行训练和验证,一般来说折数多一些训练结果会变好,但也不宜过多,该方法常用在数据量较少或者获取训练数据成本较高的情况。

2023-10-16 09:03:40 213 5

原创 归一化与标准化的区别与实现方法

而不是归一化去解决问题(ps:要把训练集和测试集分开后再分别标准化,否则会将测试集的信息引入到训练集中从而影响训练结果)在需要进行特征缩放的数据集上。

2023-10-11 18:19:15 249 8

原创 Pyhton压缩JS代码

【代码】Pyhton压缩JS代码。

2023-09-18 11:36:05 263 14

原创 python内网环境安装第三方包【内网搭建开发环境】

内网安装第三方包的应用场景,一般是一些需要在没网的环境下进行开发的情况。这些环境一般仅支持本地局域网访问,所以只能在不下载任何第三方包的情况下艰难开发。将当前应用依赖的第三方包提前下载到本地,拷贝到单机环境下安装,但是不能一个个下载安装,那样效率很低,具体参考以下代码,如有更好的办法希望大佬指点。

2023-09-02 18:11:59 2246 32

原创 随机森林的相关理论知识

随机森林是由多个决策树组成的bagging算法,bagging是集成学习的一种,集成学习是有监督学习的一种。

2023-07-31 17:30:25 517 20

原创 sklearn房价预测(随机森林)

任务目标:根据统计在csv中的房屋属性相关数据,预测房屋最终成交价格数据集:《住宅属性数据集》,自取数据集字段解释:这个文件中有字段详细说明↓。

2023-07-07 16:42:09 1102 44

原创 Python获取文件路径的父级目录、文件名、扩展名

【代码】Python获取文件路径的父级目录、文件名、扩展名。

2023-06-27 10:42:11 808 18

原创 pytorch房价预测(线性回归)

任务目标:根据统计在csv中的房屋属性相关数据,预测房屋最终成交价格数据集:《住宅属性数据集》,自取3.数据集字段解释:这个文件中有字段详细说明。

2023-05-24 19:01:31 486 37

原创 pytorch泰坦尼克号幸存者预测(二分类)

任务目标:根据《泰坦尼克号登船人员名单》上的个人信息预测其是否生还数据集:《泰坦尼克号登船人员名单》,自取数据集解释:第一列age ,表示的是年龄(数值数据)第二列cabin,表示客舱号(分类数据 :字符串类型)第三列embarked表示登船港口,S是Southampton南安普顿,C是Cherbourg法国瑟堡,Q是Queenstown爱尔兰昆士敦(分类数据:直接类别)第四列fare,表示船票价格(数值数据)第五列name,表示的是名字(分类数据:字符串类型)

2023-04-28 17:34:49 1301 28

原创 Mysql group by 查询报错 1055 this is incompatible with sql_mode=only_full_group_by

1055 - Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘dkia_quality_db.b.id’ which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

2023-04-28 12:41:47 683 4

原创 pytorch手写数字识别(CNN)

数据集是 MNIST手写数字 数据集,自取网络结构为两层卷积两层线性层# 定义数据读取类 ------------------------------------------ class MNISTDataset(Dataset) : def __init__(self , data_type) : self . data_type = data_type if self . data_type not in [ 'train' , 'test' ] : raise Exception('数据集类型有误。

2023-04-20 16:57:34 447 25

qwebchannel.js

QWebChannel 是 Qt 框架中用于在 Web 页面和 Qt 应用程序之间进行通信的类,python 的pyqt 和 pyside 可以基于 qwebchannel 与 js 进行双向通信

2024-04-16

Vue.js v2.7.16

下载到本地在html头部通过scripts脚本引入,类似这样 <script src="./static/js/vue.js" type="text/javascript"></script> 注意将相对路径配置正确

2024-04-16

【PyQt5.15.13】安卓版重新编译QT支持html5视频播放

将文件中的 Qt5WebEngine.dll 和 Qt5WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide5` 或 `venv\Lib\site-packages\PyQt5` 中)

2024-03-23

【PyQt5.15.13】macOS版重新编译QT支持html5视频播放

将文件中的 Qt5WebEngine.dll 和 Qt5WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide5` 或 `venv\Lib\site-packages\PyQt5` 中)

2024-03-23

【PyQt5.15.13】【windows版】重新编译QT支持html5视频播放

将文件中的 Qt5WebEngine.dll 和 Qt5WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide5` 或 `venv\Lib\site-packages\PyQt5` 中)

2024-03-23

【PyQt6.6.2】安卓版重新编译QT支持html5视频播放

将文件中的 Qt6WebEngine.dll 和 Qt6WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide6` 或 `venv\Lib\site-packages\PyQt6` 中)

2024-03-23

【PyQt6.6.2】macOS版重新编译QT支持html5视频播放

将文件中的 Qt6WebEngine.dll 和 Qt6WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide6` 或 `venv\Lib\site-packages\PyQt6` 中)

2024-03-23

【PyQt6.6.2】【windows版】重新编译QT支持html5视频播放

将文件中的 Qt6WebEngine.dll 和 Qt6WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide6` 或 `venv\Lib\site-packages\PyQt6` 中)

2024-03-23

各国发展水平统计信息(对所有国家发展水平聚类,确定待援助国家,涵盖算法:K-Means、DBSCAN、Hierarchical)

country : 国名 child_mort : 每1000个婴儿的5年死亡率 exports : 人均商品和服务出口,以人均国内生产总值的百分比给出 health : 人均卫生支出总额,以人均国内生产总值的百分比给出 imports : 人均商品和服务进口,以人均国内生产总值的百分比给出 Income : 人均净收入 Inflation : 国内生产总值年增长率的测算(通货膨胀率) life_expec : 如果按照目前的死亡率模式,新生儿的平均寿命是多少年 total_fer : 如果目前的年龄生育率保持不变,每个妇女生育的孩子数量 gdpp : 人均国内生产总值,计算方法是国内生产总值除以总人口

2023-10-28

商场客户信息数据集(201条)

该数据集适合做一些聚类算法的学习,如Kmeans等,数据集包含 性别、年龄、收入、消费等级四个字段,除性别外其余都为数字类型的数据

2023-10-24

住宅属性数据集【房屋价格预测-线性回归】

住宅包括如下属性: SalePrice - the property's sale price in dollars. This is the target variable that you're trying to predict. MSSubClass: The building class MSZoning: The general zoning classification LotFrontage: Linear feet of street connected to property LotArea: Lot size in square feet Street: Type of road access Alley: Type of alley access LotShape: General shape of property LandContour: Flatness of the property Utilities: Type of utilities available LotConfig: Lot configuration .......

2023-05-15

坦尼克号登船人员名单数据集(生还预测 二分类问题)

第一列age ,表示的是年龄 第二列cabin,表示客舱号 第三列embarked表示登船港口,S是Southampton南安普顿,C是Cherbourg法国瑟堡,Q是Queenstown爱尔兰昆士敦 第四列fare,表示船票价格 第五列name,表示的是名字 第六列parch,船上父母数/子女数,不同代的直系亲属数,比如某人和他的女儿及父亲同在这个船上,则他的这个数值就是父母数(1)+子女数(1)=2 第七列passengerId,表示乘船编号 第八列pclass,表示客舱等级,这里有三级,1为一等舱,2为二等舱,3为三等舱 第九列sex,表示性别male为男性,famale为女性 第十列sibsp,表示兄弟姐妹数/配偶数,同一代的直系亲属人数,比如某人和他的弟弟及妻子同在这个船上,则他的这个数值就是兄妹数(1)+配偶数(1)=2 第十一列surverved,表示是否存活,1为生存,2为死亡 第十二列ticket,表示船票编号

2023-04-28

MNIST手写数字 数据集

1. 数据文件 train.csv 和 test.csv 包含手绘数字的灰度图像,从0到9 2.train.csv 有 label, test.csv 没有 3.每幅图像高28像素,宽28像素,总共784像素 4.每个像素都有一个与之关联的像素值,表示该像素的亮度或暗度,数字越大表示越暗 5.该像素值是0到255之间的整数,包括0和255

2023-04-20

squad数据集(qa任务 )

加载方式: from datasets import load_dataset raw_datasets = load_dataset("squad", cache_dir='F:/datasets') # F:/datasets 为数据集下载后的本地目录

2023-03-07

猫狗二分类数据集【训练集+测试集共37500张图】

训练集共25000张,猫狗各12500张,前一半是猫后一半是狗 测试集共12500张,猫狗参半

2022-08-11

500条WAV格式的中文语音数据集,可用于中文语音识别模型的测试集

500条WAV格式的中文语音数据集,可用于中文语音识别模型的测试集,好的一批

2022-07-26

nvidia/stt_zh_citrinet_1024_gamma_0_25 语音识别模型

stt_zh_citrinet_1024_gamma_0_25 语音识别模型,包含中英等16种语言的语音识别,hugface上的模型名叫 nvidia/stt_zh_citrinet_1024_gamma_0_25

2022-07-26

Davlan/bert-base-multilingual-cased-ner-hrl NER命名实体识别模型

huggingface上的Davlan/bert-base-multilingual-cased-ner-hrl命名实体识别模型,包含中英等16种语言的人名、地名、组织识别

2022-07-25

FashionMNIST单通道十分类图片数据集【测试集+训练集】

FashionMNIST这是一个单通道的十分类图片数据集,初学机器学习时的常用数据集,包括了六万张图片的训练集和一万张图片的测试集

2022-07-16

sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 模型

这是一个句子转换器模型,它将句子和段落映射到 384 维密集向量空间,可用于聚类或语义搜索等任务,是 sentence_transformers 库的模型之一,官网下载速度缓慢,容易被墙,下载解压后,可以参考此文章进行模型本地加载 https://blog.csdn.net/weixin_43721000/article/details/125507996

2022-06-30

sentence-transformers/allenai-specter 模型

可用于语义聚合任务中的文本编码器,它将句子和段落映射到 768 维密集向量空间,是 sentence_transformers 库的模型之一,官网下载速度缓慢,容易被墙,下载解压后,可以参考此文章进行模型本地加载 https://blog.csdn.net/weixin_43721000/article/details/125507996

2022-06-28

emnlp2016-2018.json

包含 标题 和 摘要 等信息的数据集,适用于文本分类、相似度计算等任务,资源来自https://sbert.net/datasets/emnlp2016-2018.json,但是被墙了资源不太好找

2022-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除