3 热爱学习的栾宝宝

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 9w+

在真实数据集上的随机森林模型参数调优

搞机器学习的人,都会有自己偏爱的某种算法,有的喜欢支持向量机(SVM),因为它公式表达的优雅和可利用方法实现的高质量;有的人喜欢决策树,因为它的简洁性和解释能力;还有人对神经网络非常痴狂,因为它解决问题的灵活性(一般在超大规模的数据集上,使用神经网络,效果会好于其他所有的机器学习算法)。但是就我本人而言,我最喜欢的算法是随机森林,理由如下:通用性。随机森林算法可以应用于很多类别的模型任务。它们可以很好的处理回归问题,也能对分类问题应付自如,多分类和二分类都可以,一个能当三个用呢! 随机森林算法很难被打

2020-06-29 15:47:27

列表随机平分为两个列表

avg = len(reference_files) / float(2) out = [] last = 0.0 while last < len(reference_files): out.append(reference_files[int(last):int(last + avg)]) last += avg normals0 = out[0] n...

2020-06-29 09:11:57

创新创业活力指数设计

南京江北新区行业的创新创业活力指数设计一、 研究背景二、 代码解读1. 数据清洗1.1 数据标注# 根据产业图谱划分为三大产业df_gs.loc[ df_gs.产业图谱.isin(['生物医药', '科技金融', '生物医药 / 科技金融']) == False, '产业图谱'] = '集成电路'df_gs.loc[ df_gs.产业图谱.isin(['生物医药 / 科技金融']) == True, '产业图谱'] = '生物医药'1.2 对非存续企业进行分离#.

2020-06-19 17:03:15

Tensorflow的C++部署系列(九):Eigen Tensor详解【一】

1.Eigen Tensor详解【一】tensorflow 的C++ api 中采用了Eigen的Tensor ,因此本文仔细探究一下Eigen 库Tensor的始末。Tensor(张量) 是多维数组,元素通常是标量,但也支持复杂的元素(如字符串)见:https://eigen.tuxfamily.org/dox-devel/unsupported/eigen_tensors.html一 不同类型Tensor的构造方式#include "./eigen/unsupported/E..

2020-06-08 16:40:21

Tensorflow的C++部署系列(八):c++接口加载模型推理单张图片

近期在进行模型设置过程中,遇到了加载双计算图时,模型运算出错的情况。在搜集相关资料过程中,发现网上冲浪时候,教程基本只有MNIST的预测。对一个tensorflow流程进行记录。tensorflow的官网上提供很详细的python教程,也确实很好用。但是,应用软件产品大多用c/c++写的。所以,大部分的应用都是用python来训练模型,得到训练好的模型后. 用c++调用tensorflow模型进行推理。通过收集资料,总结了方法.1. 使用python训练模型,并保存模型a.训练并保存模型

2020-06-07 20:10:43

Tensorflow的C++部署系列(七):网络搜集的代码整理

整理C++的tensorflow代码。1. 对张量的值进行观测。/* * inference4beginer.cpp * Copyright (C) 2017 fisherman */#include <tensorflow/core/public/session.h>#include <tensorflow/core/platform/env.h>#include <tensorflow/core/framework/tensor.h>#inc

2020-06-04 18:32:28

Tensorflow的C++部署系列(一):环境配置

tensorflow作为一个著名的开源深度学习框架,其在python平台的神经网络模型搭建、训练和测试等是很齐全的,但其在C++端的设计方面性能相对较差。在实际工程中,C++项目具有更省时的优点,因此基于C++的tensorflow的开发是很重要的。一些比较知名的网络模型,例如yolo-v3系列等的C++代码较为全面,一定程度属于定制的。然而对于一些自己编写的网络模型的支持方面,我们往往需要自己来配置环境。坦白说,笔者在配置环境方面花费了很多时间,参考了很多优秀的资料,但最后都不尽如意。作为一个小白

2020-05-24 22:54:27

环境配置

一、查看计算机位数1.右键点击桌面左下角的开始按钮。2.在弹出菜单中,选择“运行”菜单项,输入“dxdiag”,点击“确定”。3.打开DirectX诊断工具窗口,也可看到当前系统的位数。二、C4966错误在Visual Studio2015使用Boost库的时候,出现如下错误:error C4996: ‘std::copy::_Unchecked_iterators::_Deprecate’: Call to ‘std::copy’ with parameters that may be uns

2020-05-24 11:12:16

图像由png格式转eps格式的两个可行方法

论文编写时需要考虑图像的清晰度,如果用latex,生成eps文件是个好的方法。有两个简单方法可以生成eps图像。方法1: python plt方法生成import cv2a = cv2.imread('filename.png')plt.imshow(a)plt.savefig('a.eps', format='eps', dpi=1000)方法2: 在线网站,在线转换。网站链接:https://cloudconvert.com/png-to-eps操作步骤: 上传pn.

2020-05-23 10:32:27

基于Python的SVDD代码实现 ---- 月牙数据的支持向量边界求解

SVDD算法的相关学习笔记参考这篇博客:https://blog.csdn.net/sterben25/article/details/79106351在此之前,我写一个关于使用SVDD算法进行鸢尾花分类的代码和博客,然而该方法并没有使用核函数,来体现支持向量方法的优越性,因此,本博文用于记录算法使用核函数后,并对月牙数据进行一个支持向量边界求取。可视化结果如下图所示:月牙数据如下所示:from sklearn import datasetsX,y = datasets.make..

2020-05-19 00:10:55

VS2015 工程迁移遇到的错误记录 2020-05-15

1. 出现错误: SDK error解决方案:右键“解决方案”,选择“重新生成解决方案”,按照自己的电脑,选择SDK,即可排除该错误。2. 出现错误: error C4996: 'std::copy::_Unchecked_iterators::_error C4996: 'std::copy::_Unchecked_iterators::_Deprecate': Call to 'std::copy' with parameters that may be unsafe - thi..

2020-05-15 22:13:12

转载 - 几种表面缺陷检测数据集

1、德国DAGM 2007的数据集总共十类图像,有训练集和测试集,几种样例如下:官方网址:https://hci.iwr.uni-heidelberg.de/node/3616网盘下载:链接:https://pan.baidu.com/s/1CHrH1tZ-B6kvi8U7--isaw提取码:47jo2、钢材表面缺陷这个数据集是东北大学一个老师收集的,分为三个数据...

2020-04-24 10:15:41

2017-12-16 机器视觉表面缺陷检测综述

机器视觉表面缺陷检测综述转载自:http://www.cjig.cn/html/jig/2017/12/20171202.htm#top《中国图像图形学报》Tang B, Kong J Y, Wu S Q . Review of surface defect detection based on machine vision[J]. Journal of Image and Graph...

2020-04-22 16:11:20

损失函数SSIM的Pythorch实现

结构相似性指数(structural similarity index,SSIM), 出自WangZhou的论文,用于度量两幅图像间的结构相似性。和被广泛采用的L2 loss不同,SSIM和人类的视觉系统(HVS)类似,对局部结构变化的感知敏感。SSIM分为三个部分:照明度、对比度、结构pytorch代码实现SSIM值越大代表图像越相似,当两幅图像完全相同时,SSIM=1。所以作为...

2020-04-06 17:25:23

度量学习相关的知乎参考工作

1. 基于对抗的度量学习链接:https://zhuanlan.zhihu.com/p/577557222. 用正确方法对度量学习算法进行基准测试链接:https://zhuanlan.zhihu.com/p/986982583. 采用深度度量学习进行异常检测链接:https://zhuanlan.zhihu.com/p/1137909154. 深度迁移学习链接:ht...

2020-04-06 09:00:50

单类分类器 - SVDD算法(Python)

SVDD试图学习一个包含单类样本点的超球边界,该边界既要满足包含足够多的的点,又要使得球体的半径要足够多的的少,而这两点往往又比较矛盾,因此,SVDD算法在这两个要求之间寻找一个人为的均衡。网络上相关SVDD算法的解读,包括论文和概念,但是SVDD的方法代码在matlab库中的案例相对较多,而在python库中相对较少,更多的相关于OneClassSVM的代码,可参照sklearn的svm算法...

2020-03-28 11:33:56

数据图像切割方法记录

图像裁切,PIL图像库有一个函数,即:image.crop((p1, p2, p1+w, p2+h))一个自动剪切存储的代码如下:from glob import globcarpet_ng1 = glob('database/carpet/test/co*/*.png')[:2]carpet_ng2 = glob('database/carpet/test/cu*/*.p...

2020-03-20 11:30:00

python: turtle绘制有趣的小图像合集

白天停电停网了一天后,又遇到一些事情心情难过,白天看到一些有趣的图像,是用python的turtle库画图。晚上来电了后,也不想学习了,就看网上一些教程学习画图。1. 飞机import turtle#太阳turtle.color('red')turtle.penup()turtle.goto(250,200)turtle.pendown()turtle.begin_f...

2020-03-20 00:06:52

xz文件解压缩与压缩

最近使用了一个数据集,数据集公布方用.xz文件形式压缩的数据,碰巧现在用的是Mac笔记本,对linux解压相对友好,即使用如下解压缩方法,亲测有效。xz -z 要解压的xz文件该方法也可以加入一个-k参数,调节解压率。创建xz文件暂时没有需求,不记录,可参考CSDN文章。tat.xz文件如何解压。解压后为tar文件,mac默认解压方法可以解压缩。...

2020-03-19 11:22:09

matplotlib作点线图技巧 - 学习记录

1. 图表的legend()的位置:https://www.cnblogs.com/IvyWong/p/9916791.htmlplt.legend(loc=8)2. matplot的坐标轴刻度尺寸。plt.tick_params(labelsize=15)3. matplotlib的横纵轴label的尺寸。 font1 = {'family': 'Time...

2020-03-16 09:53:36

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 分享学徒
    分享学徒
    成功上传1个资源即可获取