Renlijuande-CSDN博客

原创 ModuleNotFoundError: No module named ‘scipy.sparse.linalg.eigen.arpack‘； ‘scipy.sparse.linalg.eigen‘

是因为新的scipy包更新了，不能采用。

2023-07-26 02:33:23 1401

原创 YOLOv5 txt标签转图像标签（多个标签)

这样我就能得到对应的图像和txt文件了，然后我需要获得原始图像的大小。这里每一行是一个标签，原始的图片如图所示。这样就能实现所有功能啦！我这里图像和txt的名称是相同的。

2023-05-02 05:36:00 1426

原创 Web of science,scopus,Google scholar的介绍和区别

常见文献数据库的介绍和对比

2022-11-21 23:33:55 8703

原创 texstudio 得到一张清晰的算法图片

textstudio转清晰图片，PDF转eps格式

2022-06-08 18:49:31 731

最近在学习R语言处理缺失值，可是knn的包DMwR2 ，高版本不提供了，尝试很多办法，都失败了。1.将R包下载到本地，然后去R里面安装尝试后放弃，一直不行2.直接在R里面下载安装R包我现在R官网找DMwR2 的链接，然后很快搞定download.file("https://cran.r-project.org/src/contrib/DMwR2_0.0.2.tar.gz","DMwR2_0.0.2.tar.gz")install.packages("DMwR2_0.0.2.tar.gz", re

2021-10-02 04:44:39 2489

原创 python中的随机数

老是忘记各种生成随机数，mark一下1.随机生成一个指定范围内的整数LOW = 0HIGH = 10loc_instance = np.random.randint(LOW, high=HIGH, size=None)即生成一个范围是[0,9]的整数，注意这个地方取不到102.从list中选择指定数量的值columns_list=[1,2,3,4,5]NUM = 2choice_columns = random.sample(columns_list, NUM)即从列表columns

2021-09-30 07:01:51 171

原创 python的一些mark

python的mark1.pandas批量修改某些行的一些列test = [[1,2,3],[1,2,1],[11,2,3]]df = pd.DataFrame(test)print(df)df.iloc[[1,2], 2] = np.nanprint(df)结果：注意：df.iloc[[1,2], 2] = np.nan中[1,2]是列表2.pandas写入数据库不支持NaN(生气！！！找了半天问题)如果你是生成缺失值的数据集的话，绕开df_temp.to_csv(path, h

2021-08-25 04:55:25 517

原创 python 实现的简单的轮盘赌

前言之前写过很多次，后面再用老是要重新写，mark一下轮盘赌算法原理轮盘赌选择法（roulette wheel selection）是最简单也是最常用的选择方法，在该方法中，各个个体的选择概率和其适应度值成比例，适应度越大，选中概率也越大。但实际在进行轮盘赌选择时个体的选择往往不是依据个体的选择概率，而是根据**“累积概率”**来进行选择。轮盘赌选择法的过程如下：（1）计算每个个体的被选中概率p(xi)（2）计算每个部分的累积概率q(xi)（3）随机生成一个数组m，数组中的元素取值范围在0和1

2021-04-21 01:06:06 6028 3

原创常用UCI数据集链接，mark

1.Adulthttp://archive.ics.uci.edu/ml/datasets/Adult2.CMCContraceptive Method Choice Data Set3.Auto MPGhttp://archive.ics.uci.edu/ml/datasets/Auto+MPG4.Irishttp://archive.ics.uci.edu/ml/datasets/Iris5.pima官网没有了，看这里https://blog.csdn.net/jiangmen

2020-12-12 23:54:45 2362

原创 python Dataframe iloc时一直报out-of-bounds 和根据行索引取Dataframe的多行值

今天在用pandas时候遇到了Dataframe的iloc一直报out-of-bounds这个错，这个简单理解就是越界了。1.普通情况举个简单的例子：import pandas as pddataset=[[1,2.222,3,4,5],[2,None,None,None,5],[None,None,3,4,None],[1,2.5661,3,4,5.234]]df=pd.DataFrame(dataset)# 删除df中的一行print("--------原始的df--------")

2020-12-12 14:41:50 10873 1

原创 python pycharm 安装sklearn的坑

之前用anaconda安装过一次python的sklearn模块，就各种问题，今天用pycharm安装也是各种报错，例如这样的：No module named ‘numpy.distutils._msvccompiler’ in numpy.distutils; trying from distutils刚开始查了一下，各种让安装C++的文件，后来就发现了一个良心的网址：https://www.cnblogs.com/TTyb/p/6437459.html突然让半路如python坑的我，茅塞顿开。归根

2020-12-11 12:14:29 26894 2

原创 python 采用pandas的DataFrame实现对数字类型用均值填补和分类类型用众数填补

今天在用python对数据的数字类型用均值填补，分类类型用众数填补，遇到几个坑，mark一下：1.众数需要一列一列的填补2.DataFrame的mode()函数会返回一个series，即多个数需要从中选择一个进行填补，不然会一直填补不上。（我这里是随机选择一个）源码如下"""采用均值和众数将缺失值填补dataset是listcolumns_classification是list,分类类型的位置"""def impute_data_by_mean_or_mode(dataset,column

2020-12-10 18:41:57 2306 1

原创 python DictVectorizer 两个坑(无用字段和数字类型)

功能描述：载入一些数据，然后将其中的字符串转换为数字。注意：我这里使用，是一种one-hot的思想，或者可以理解为词袋或二进制。例如：笔有三类：钢笔、铅笔、毛笔。那么就可以用三位是二进制数来表示，那么钢笔100，铅笔010，毛笔001. 这里有个很明显的缺点，当你的类型很多时，数据就会很稀疏。先看源码：（数据和转换请看我上一篇博文）#判断是否为数字def is_number(s): try: float(s) return True except Va

2020-12-09 18:01:54 311

原创 Python list转DataFrame 出现None列

今天用python将list转为DataFrame时，出现了诡异的一幕，多了一列空列，源代码如下，（数据是UCI的开源数据，下载链接）def load_data(filepath): data= [] with open(filepath) as ifile: for line in ifile: rowList = [] tokens = line.strip().split(' ')#分割为两个空格(这行代码就是

2020-12-09 16:53:18 1522 1

原创 python 将数据集划分为完整数据集和缺失数据集

首先需要用的python包：import pandas as pd然后，正式开始处理数据。1.定义一个数组dataset=[[1,2,3,4,5],[1,2,3,None,5],[1,None,3,4,5],[1,2,3,4,5]]2.将list类型转为pandas的DataFrame类型df=pd.DataFrame(dataset)print(df)3.找到具有缺失值的数据dataset_missing=df[df.isnull().values==True]print(da

2020-12-07 16:35:43 814

原创 Python numpy给自己的mark文件

1.numpy判断nannp.isnan()#返回的是布尔类型2.numpy的两个array拼接（引用自链接）‘+’/‘*’号：两个array对应值相加/相乘>>> aarray(［0, 1, 2], [3, 4, 5], [6, 7, 8］)>>> b = a*2>>> barray(［ 0, 2, 4], [ 6, 8, 10], [12, 14, 16］)1、水平组合&

2020-11-27 10:40:56 131

原创 Python pandas给自己的mark文件

1.pandas: 获取Dataframe的行数和列数返回列数：df.shape[1]返回行数：df.shape[0] 或者：len(df)2.读txt文件data = pd.read_table(file_path,header=None,delim_whitespace=True,encoding='gb2312')说明：#header=None:没有每列的column name，可以自己设定#encoding=‘gb2312’:其他编码中文显示错误#delim_white

2020-11-25 22:46:45 186 2

原创 python读CSV文件

一、《中国卫生健康统计年鉴》是一部反映中国卫生健康事业发展情况和居民健康状况的资料性年刊。本书收录了全国及31个省、自治区、直辖市卫生健康事业发展情况和目前居民健康水平的统计数据以及历史重要年份的全国统计数据。本书为《中国卫生健康统计年鉴》2019卷，收编的内容截至2018年年底。https://www.yearbookchina.com/downsoft-n3019102807.html...

2020-11-11 17:26:22 128

原创写入csv文件，与一个字符一个格子的问题

本文只是为了帮自己mark一下使用包import csv代码def write_excel(path, datas): csvFile2 = open(path,'w',newline='') writer = csv.writer(csvFile2) m = len(datas) for i in range(m): writer.writerow(datas[i]) csvFile2.close()注意：如果写出的csv文件中变成一个

2020-08-31 18:32:06 3859

原创 python根据文件名列表读excel数据

python根据文件名列表读excel数据，并写入csv文件给定一个包括多个文件名的列表（文件列相同），读取数据并拼接在一起。读excel使用的包有import csvimport pandas as pd读excel文件中全部数据def readXlsx_all(path): datas=[] empty_data=[] try: sheet = pd.read_excel(path) df = p

2020-08-31 18:24:01 723

原创 Java使用poi-3.8读取excel

这一段都是无关主题的废话：很久没有写Java了，今天由于要给一些参会人员发短信，想偷懒批量读取客人的电话号码，因此写了个Java程序，自己以前有下poi的jar包。本来想在网上直接找一些源码的，结果都不是很好用，所以就来mark以下，方便自己以后使用。使用的jar包：链接：https://pan.baidu.com/s/1aokOgH1fkHHlzJbKWuz1Dg提取码：vbma请注...

2020-01-01 22:14:08 967 2

原创 nodejs 实现文件下载，文件名包括中文出错

NodeJs中下载文件报错 _http_outgoing_http_outgoing.js:464 throw err; ^TypeError [ERR_INVALID_CHAR]: Invalid character in header content ["Content-Disposition"]代码为var express = require(‘express’);...

2019-06-04 13:32:29 3629 2

原创 MYSQL存储过程 where条件与参数比较失败

今天在调试一个存储过程时，一直有问题，源码如下：BEGIN DECLARE cnt INT DEFAULT 0; DECLARE deId INT DEFAULT 0; SELECT COUNT(1) FROM zabbixdata WHERE `hostid`=hostId INTO cnt; IF cnt >= 10 THEN SELECT id FROM zab...

2019-05-20 17:35:36 502

原创 fullcalendar-4.1.0 事件（events）使用函数时报错

fullcalendar-4.1.0 事件（events）使用函数时报错最近下载使用了fullcalendar-4.1.0版本做事件日历，在events使用函数时一直出错，但是直接给json指就可以，查了很多资料，最后自己看了下源码，是因为参数个数的问题。events: function(start…callback){}之前的版本有传3或4个的参数，但是这个版本只用两个参数events: fu...

2019-05-11 11:42:38 2929 3

Everything-1.3.4.686.x64.rar

Everything是voidtools开发的一款文件搜索工具，官网描述为“基于名称实时定位文件和目录（Locate files and folders by name instantly）”。它体积小巧，界面简洁易用，快速建立索引，快速搜索，同时占用极低的系统资源，实时跟踪文件变化，并且还可以通过http或ftp形式分享搜索。

2020-01-01

poi-3.8.jar读取excel

包含读取excel的五个jar包：xmlbeans-2.3.0.jar、poi-ooxml-schemas-3.8.jar、poi-ooxml-3.8.jar、poi-3.8.jar、dom4j-1.6.1.jar