自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 收藏
  • 关注

原创 python 使用selenium进行网页鼠标点击

from selenium import webdriverimport timefrom selenium.webdriver import ActionChainsdriver = webdriver.Chrome()driver.get(“https://www.baidu.cn”)#定位到需要右击的元素,然后执行鼠标右击操作(例:对新闻标签进行右击)context_click_location = driver.find_element_by_xpath(’//*[@id=“hotsea

2021-11-11 23:15:11 1254

原创 可靠性测试

元件、产品、系统在一定时间内、在一定条件下无故障地执行指定功能的能力或可能性。可通过可靠度、失效率、平均无故障间隔等来评价产品的可靠性。可靠性测试介绍可靠性测试就是为了评估产品在规定的寿命期间内,在预期的使用、运输或储存等所有环境下,保持功能可靠性而进行的活动。是将产品暴露在自然的或人工的环境条件下经受其作用,以评价产品在实际使用、运输和储存的环境条件下的性能,并分析研究环境因素的影响程度及其作用机理。可靠性测试的目的通过使用各种环境试验设备模拟气候环境中的高温、低温、高温高湿以及温度变化等情况,加

2021-11-08 23:38:00 2499

原创 Tableau 实现percentile分类计算功能

新增计算列 B5, B10, 再新增 一个判断B5, B10, char判断列, 加为颜色。实现多维度的percentile自动计算和判断 pass or fail 功能PERCENTILE([Breaking Load 1],.0.05)PERCENTILE([Breaking Load 1],.1)pass or failif([B5]>500 and [B10]>550 and [Char]>650) THEN “pass” ELSE “fail” END...

2021-10-14 22:04:17 918

原创 how JMP JSL auto run

//!Names Default To Here( 1 );dt=open("$SAMPLE_DATA/Big Class.jmp");Oneway( Y( :height ), X( :age ), Box Plots( 1 ), Mean Diamonds( 1 ) );JMP App(Set Name( “Dashboard” ),Set Description( “Four reports arranged in a grid” ),Auto Launch( 1 ),Snap To

2021-10-07 20:24:48 354

原创 panda quantile, group by, summary row to list

import pandas as pdimport numpy as npfunction to get summary list namesdef deleteDuplicatelist(listA):#return list(set(listA))return sorted(set(listA), key = listA.index)FCData=pd.read_csv(r’/Users/samwang/Downloads/BYD FC-Export-ID-115213015836970-2

2021-10-05 13:52:39 166

原创 Tk python 制作 UI. button 和 OptionMenu 相应

tkinter: package for UI designimport tkinter as tkfrom tkinter import *#setup one class.class setupdialog():def init(self):self.root = Tk()self.root.title=“golden factory setup”self.root.geometry(“900x200”) v1 = StringVar() v1.set('python'

2021-09-22 23:46:56 118

原创 RFM 模型 对用户进行数据分析. isnull fillna drop

data_group=pandas.read_csv(r"/Users/JMP/Jmp_data/Python/PDABook/第五章/5.7 RFM分析/RFM分析.csv")print(data_group.head())data_group[‘DealDateTime’]=pandas.to_datetime(data_group.DealDateTime, format=’%Y/%m/%d’)print(data_group[‘DealDateTime’])data_group[‘DateD

2021-09-20 00:31:09 116

原创 python data PDAdata pivot table ,group by, contains, starts with

import pandasimport remystring = “有1.345mm”result = re.search("\d+(.\d+)?",mystring)print(result.group(0))string2 =“Mike John Jack Lind Cara Cindy Lucy Henry Cara”result1 = re.search(“Mike(.+) Cara”, string2)if result1:print(result1.group(1))Mike*

2021-09-19 23:05:33 222

原创 JESD 样本量 选择 可靠性 45 77样本量

主要参考文件JESD47-I Stress-Test-Driven Qualification of Integrated Circuits 集成电路基于压力测试的考核第一阶:了解取样标准从哪份标准可以查询,怎样看抽样数量矩阵表2.1 非气密性封装可靠性的取样数主要在JESD47这份文件中定义,本文参考"I"版本。所谓非气密性封装主要为采用塑封料EMC(Epoxy Molding Compound)的封装,气密性封装主要为陶瓷、金属封装。JESD47主要用于对消费级和工业级的参考,汽车电子、军工等有各

2021-09-08 11:18:01 5972

原创 可靠性培训大纲- Sam Wang

可靠性测试与研发培训大纲Sam Wang质量和可靠性a. 质量b. 可靠性可靠性概念a. 可靠性定义i. 产品ii. 规定的条件iii. 规定的时间iv. 规定的功能b. 可靠性基本术语i. 故障ii. 应力iii. MTBFiv. 失效率v. 维修性vi. 删失数据可靠性常见分布a. 指数分布b. 威布尔分布c. 对数正态分布d. 浴盆曲线可靠性度量指标a. 累积失效概率CDF(Failure)b. 可靠度函数1-CDF(Survival)c. 失效密

2021-08-31 00:15:51 768

原创 scipy.stats.exponweib. a c 参数

scipy.stats.exponweib:scipy包中计算weibull分布的函数。from scipy.stats import exponweib密度函数的格式:exponweib.pdf(x, a, c) = a * c * (1-exp(-xc))(a-1) * exp(-x*c)x(c-1),这个形式很奇怪在官方文档说a和c是shape parameter,扩展的loc和scale参数,exponweib.pdf(x, a, c, loc, scale) = exponweib.pdf(

2021-08-29 21:56:46 673

原创 2021-08-23。weibull可靠性研究

韦伯分布(Weibull distribution) 一般用来统计可靠性或寿命检验时用,例如:预计在有效寿命阶段有多少次保修索赔?预计将在 8 小时老化期间失效的保险丝占多大百分比?在管理科学与工程领域,见到一些学者假定产品的需求为韦伯分布。因为正态分布或者泊松分布过于理想化,韦伯分布相对来说更接近现实一些(从概率密度函数来看,韦伯分布一般具有长尾分布,即右偏分布的特点)。韦伯分布的概率密度函数为:其中, x x x 是随机变量, λ \lambda λ 是比例参数(scale), k k k 是形

2021-08-23 22:28:00 2351

原创 python read dir files and find key words

#!/usr/bin/env pythoncoding:utf-8import osimport refilelist=[]#path = “/Volumes/C/work/veridian/issue/SMP_LAN_DOE/8-3A/”#path = “/Volumes/C/work/veridian/SPC_calibration/data/”path = “/Volumes/C/work/6x/issue/cc_acc/nvt_oqc_repeatdata/”dict = {}un

2021-08-01 22:09:03 201

原创 apple script to 1s screen capture snapshot w/ windowsill

set dFolder to “~/Desktop/screencapture/”do shell script ("mkdir -p " & dFolder)set i to 0repeat 960 times#do shell script ("screencapture " & dFolder & “frame-” & i & “.png”)do shell script ("screencapture -t png -R 80,65,800,800

2021-07-30 09:06:31 81

原创 apple script 打开常用软件

trytell application “System Events”(**)–xxx代表要自己替换的地方,代码只是示例,需要自己修改一下(文件或文件夹名称等),报错的也可以直接删掉以方便运行。#设定用户名set userName to name of current user --启动偏好设置 tell application "System Preferences" activate delay 2 #等待2秒 set current pane to pane "com.app

2021-07-29 00:04:31 557

原创 2021-07-18 Pythan 和 JMP 连接, Python 调用运用程序。

import subprocessapp_path = r’/Applications/JMP Pro 15.app’# subprocess.call(["/usr/bin/open", “-W”, “-n”, “-a”, app_path])subprocess.call(["/usr/bin/open", “-W”, “-n”, “-a”, app_path,"/Library/Application Support/JMP/15/Samples/Data/Big Class.jmp"])#

2021-07-18 11:42:33 747

原创 python xlrd excel file

“”"import xlrddef print_xls(path):data = xlrd.open_workbook(path)table = data.sheets()[0]nrows = table.nrowsbooks = []for i in range(nrows):ss = table.row_values(i)if “Book” in ss:books.append(ss)sum = 0for i,item in enumerate(books):print int

2021-04-14 10:57:34 57

原创 如何使用 pandas 操作 excel 并显示dataframe多行, 全列

-- coding : utf-8 --coding: utf-8import openpyxlimport xlrdimport xlwtfrom xlutils.copy import copyfrom decimal import Decimalimport pandas as pdimport numpy as npimport pprintpprint.pprint()#显示所有列pd.set_option(‘display.max_columns’, None)#显示所

2021-04-14 10:44:51 483 1

原创 python 正则化小数 和 特征之前的数据

#小数 . 之后数mystring = “有1.345mm”result = re.search("\d+(.\d+)?",mystring)print(result.group(0))之前的数据正则化match = re.search(r"(.*) <Sequencer> trace id", data, re.MULTILINE)

2021-04-08 11:58:24 358

原创 python对 excel的操作

-- coding : utf-8 --coding: utf-8import openpyxlimport xlrdimport xlwtfrom xlutils.copy import copyfrom decimal import Decimalimport pandas as pdimport numpy as npdef write_excel(filename,rowNum, columnList,dataList):print(rowNum)workbook = xlrd

2021-04-06 23:06:07 242

原创 python 读取数据

#打开test.txt文本,将里边得文本使用正则表达式筛选出数字那一部分,再存入test1.txt文件中import ref = open(“test.txt”, “r”, encoding=‘utf-8’) #打开test.txt文件,以只读得方式,注意编码格式,含中文data = f.readlines() #循环文本中得每一行,得到得是一个列表的格式<class ‘list’>f.close()

2021-04-06 23:04:54 266 2

原创 python正则化 和 文件 写入.菜鸟教程

#!/usr/bin/env pythoncoding:utf-8import osimport refilelist=[]#path = “/Volumes/C/work/veridian/issue/SMP_LAN_DOE/8-3A/”#path = “/Volumes/C/work/veridian/SPC_calibration/data/”path = “/Volumes/C/work/6x/issue/cc_acc/nvt_oqc_repeatdata/”dict = {}un

2021-04-06 23:00:14 248

原创 python read files last lines 正则化

pythonimport osimport refilelist=[]path = “/Volumes/C/work/veridian/issue/SMP_LAN_DOE/8-3A/”#path = “/Volumes/C/work/veridian/SPC_calibration/calibration_logs/”dict = {}unitID = []temperature = []ggTemperature = []passfail = []flow = “”unitID1

2020-08-05 22:32:36 173

原创 非常强大的PCB电路板维修口诀

非常强大的PCB电路板维修口诀近年来工业设备的自动化程度越来越高,所以各个行业的工控板的数量也越来越多,工控板损坏后,更换电路板所需的高额费用(少则几千元,多则上万或几十万元)也成为各企业非常头痛的一件事。电路板维修作为一门新兴的修理行业,也在迅猛发展。损坏的电路板绝大多数在国内是可以维修的,而且比购买一块新板要节省70%——80%费用,所用时间也比国外定板的时间短的多。下面介绍下电路板维修基础知识。电路板维修操作流量图  几乎所有的PCB电路板维修都没有图纸材料,因此很多人对电路板维修持怀疑态度,虽

2020-07-07 12:26:19 6294 1

原创 sns seaborn 画图 titanic iris dataset

​%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as snssns.set(color_codes=True)np.random.seed(sum(map(ord, ‘regress...

2020-04-06 23:24:32 461

原创 null 数据清洗

survival = pd.read_csv(r’C:\DATA\titanic.csv’)colname = food.columns.tolist()age = survival[‘age’]age_is_null = pd.isnull(age)drop_na_columns = survival.dropna(axis=1)# drop all columns null data...

2020-04-06 15:43:56 239

原创 kfold cross_validate Stratified KFold StratifiedKFold 和 StratifiedShuffleSplit 交叉验证方法

from sklearn.model_selection import train_test_split,cross_val_score,cross_validate # 交叉验证所需的函数from sklearn.model_selection import KFold,LeaveOneOut,LeavePOut,ShuffleSplit # 交叉验证所需的子集划分方法from sklear...

2020-01-29 22:41:55 719

原创 自己记录 渔船 数据 分析

import pandas as pdimport os#usr/bin/python3.4-- coding: utf-8 --df = pd.read_csv(r’E:\machineLearning\data\fishing\hy_round1_train_20200102\0.csv’,encoding=‘utf8’,engine=‘python’)path = r’E:\mac...

2020-01-25 23:21:05 1084

原创 朴素贝叶斯模型

朴素贝叶斯模型,全称为:Naive Bayesian Model,Naive 能翻译为朴素,已经是很高看它了,因为我们知道naive的含义如下:naive: marked by or showing unaffected simplicity and lack of guile or worldly experience;它是简单的,它是缺乏worldly experience的。正如它的名...

2020-01-15 11:39:17 279

原创 机器学习的一些基础问题

参考:http://kubicode.me/2015/08/16/Machine%20Learning/Common-Interview/?from=singlemessage#http://blog.csdn.NET/heyongluoyao8/article/details/49429629http://lib.csdn.Net/article/machinelearning/33798...

2020-01-14 23:40:55 281

原创 使用 Pandas 对机器学习 数据 进行预处理 分类型 进行 连续数据归一化 和 离散数据编码

Pandasread_csv ()df.columns.tolist() #获取所有的列名字df.dtypes.value_counts() # 有多少数据类型统计Select_dtypes 连续数据和离散数据的 分拆str_list = df.select_dtypes(include=[‘object’])print(str_list.columns) #encode...

2020-01-07 15:40:17 640

原创 机器学习的评价方法 Recall Metric ROC

分类问题1.1 混淆矩阵(Confusion Matrix)矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。真正(True Positive , TP):被模型预测为正的正样本。假正(False Positive , FP):被模型预测为正的负样本。假负(False Negative , FN):被模型预测为负的正样本。真负(True Negative , TN):被模型...

2020-01-06 16:49:31 1133

原创 遍历文件夹 并 copy 文件 程序

import osimport sysimport timefrom shutil import Errorfrom shutil import copystatfrom shutil import copy2图片所处的绝对路径,其中r表示去掉python的内部转义PicPath = r’E:\images’CopyPath = r’E:\images\backup’根据传参判断...

2019-12-27 15:16:22 137

原创 遍历文件夹读取JPG文件,并处理 短横线,书横线

import osimport imutilsimport cv2import pytesseractimport redef get_text(gray): # get page number information from the head, then fill it by 255image_text = gray[:180, :400]text_iamge = pytes...

2019-12-27 15:12:31 140

原创 使用sklearn的cross_val_score 迭代 寻找K-means 参数

from sklearn import datasets #自带数据集from sklearn.model_selection import train_test_split,cross_val_score #划分数据 交叉验证from sklearn.neighbors import KNeighborsClassifier #一个简单的模型,只有K一个参数,类似K-meansimpor...

2019-12-14 22:28:40 344

原创 特征数据清洗 编码 标准化

特征工程是机器学习的第一步,涉及清理现有数据集、提高信噪比和降低维数的所有技术。大多数算法对输入数据有很强的假设,当使用原始数据集时,它们的性能可能会受到负面影响。另外有些特征之间高度相关,在其中一个特征提供了足够的信息之后,与之相关的其他特征往往无法提供额外的信息。这时我们就需要了解如何减少特征数量或者仅选择最佳特征。一、scikit-learn数据集scikit-learn提供了一些用于...

2019-12-13 14:43:20 393

原创 机器学习模型 特征选择 方法汇总 线性,随机森林,

特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”,由此可见其重要性。但是它几乎很少出现于机器学习书本里...

2019-12-13 14:18:36 1513

原创 重要 线性回归的特征选择 根据 P值, SelectKBest(识别哪些feature选中), SelectPercentile 迭代选择

在特征选择中,最适合在探索阶段使用的就是过滤式的方法,比如方差阈值法和单变量选择法。在上一篇文章中我们介绍了如何在sklearn中使用方差阈值法,那么今天我们就进一步介绍更加实用、有效的单变量选择法。sklearn中的单变量选择法单变量选择法的主要思路是根据某些统计检验的方法分别对每个变量进行检验,得到一组分数、p-value数据,然后我们排序选择分数最高(或p-value最小等)的那些特征。...

2019-12-13 14:07:46 3300

原创 线性回归的特征筛选方法

https://zhuanlan.zhihu.com/p/61224180在特征选择中,最适合在探索阶段使用的就是过滤式的方法,比如方差阈值法和单变量选择法。在上一篇文章中我们介绍了如何在sklearn中使用方差阈值法,那么今天我们就进一步介绍更加实用、有效的单变量选择法。sklearn中的单变量选择法单变量选择法的主要思路是根据某些统计检验的方法分别对每个变量进行检验,得到一组分数、p-v...

2019-12-13 00:08:53 4291 1

转载 回归 特征 选择 方法

作者:Data Insights链接:https://zhuanlan.zhihu.com/p/61223950来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。一、特征选择的重要性机器学习过程中,特征选择是非常重要的一步。可以说,选到了合适的特征,那么模型的训练就成功了一半。一方面,遗漏掉重要特征肯定是我们无法接受的,这会导致我们的模型拟合能力不足;另一方...

2019-12-12 23:59:37 2183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除