自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(185)
  • 收藏
  • 关注

原创 【机器学习】机器学习基础

一、机器学习概述1、机器学习算法的判别依据 —— 数据类型离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高它们的精确度。连续型数据:变量可以在某个范围内任取一数,即变量的取值可以是连续的,如长度、时间、质量值等,这类整数通常是非整数,含有小数部分。注:离散型是区间内不可分,连续型是区间内可分。数据的类型将是机器学习模型不同问题不同处理的依据。机器学习算法的分类1、监督学习(预测):可以由输入数据中学到或建立一个模型,

2020-12-08 15:56:46 290

原创 【机器学习】特征工程——数据降维

特征工程定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。内容:主要有三部分:  1、特征抽取  2、特征预处理  3、数据的降维数据降维机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的)。f可能是显式的或隐式的、线性

2020-11-25 17:00:37 560

原创 【机器学习】特征工程—— 特征预处理

特征工程定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。内容:主要有三部分:  1、特征抽取  2、特征预处理  3、数据的降维特征预处理特征预处理:通过特定的统计方法(数学方法)将数据转换成算法要求的数据。1、包含内容数值型数据:标准缩放,包括归一化、标准化、缺失值类别型数据:one—hot编码时间类型:时间的切分2、sklearn特征处理API:sklearn.preprocessing一、归一化1、特点通过对原始

2020-11-25 16:33:39 467

原创 JetBrain注册学生免费帐号方法

首先,进入学生免费注册的官方网站。网站地址:https://www.jetbrains.com/student/点击Apply now出现下图。我们选择UNIVERSITY EMAIL ADDRESS进行注册,填写个人信息然后确认。确认后,跳转到Thank you页面,上面说已经给注册邮箱发送了邮件。稍等片刻即可去查看邮件。在到这一步时,我遇到点小问题,一直没有收到官方发来的邮件。后来才发现邮件是被邮件网关拦截了没有发送到我的邮箱里面。要解决也比较简单,在邮箱中更改一下设置即可。具体步骤就是在

2020-11-19 16:40:31 5384

原创 【机器学习】特征工程 —— 特征抽取

特征工程定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。内容:主要有三部分:  1、特征抽取  2、特征预处理  3、数据的降维数据集数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据

2020-11-17 15:34:03 696

原创 【Python】正则表达式

正则表达式:用于描述一种字符串匹配的模式。它可用于检查一个字符串是否含有某个子串,也可用于从字符串中提取匹配的子串,或者对字符串中匹配的子串执行替换操作。Python正则表达式支持在Python的交互解释器中先导入re模块,然后输入re.__all__命令,即可看到该模块所包含的全部属性和函数。import reprint(re.__all__)[‘match’, ‘fullmatch’, ‘search’, ‘sub’, ‘subn’, ‘split’, ‘findall’, ‘findit

2020-11-03 16:28:45 384 1

原创 【Python】matplotlib.pyplot绘图不显示中文解决方案

今天使用matplotlib.pyplot绘制折线图时,出现图表中文字不显示的问题。同时会报错:RuntimeWarning: Glyph 20540 missing from current font.font.set_text(s, 0.0, flags=flags)解决方案需添加一行显示中文标签的代码:plt.rcParams['font.sans-serif'] = ['SimHei']字体选择:字体对应名称黑体SimHei微软雅黑Microsoft

2020-10-22 10:05:43 14495 8

原创 【Python】图形界面编程 —— 布局管理器

Grid布局Grid把组件空间分解成一个网格进行维护,即按照行、列的方式排列组件,组件位置由其所在的行号和列号决定: 行号相同而列号不同的几个组件会被依次上下排列,列号相同而行号不同的几个组件会被依次左右排列。使用Grid布局的过程就是为各个组件指定行号和列号的过程,不需要为每个网格都指定大小,Grid布局会自动为它们设置合适的大小。程序调用组件的grid()方法就进行Grid布局,在调用grid()方法时可传入多个选项,该方法支持的选项有:ipadx:指定组件在x方向(水平)上的内部留白ip

2020-10-13 20:22:37 928

原创 pip安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))

今天安装pygame时出现了一点小问题,在cmd中输入pip install pygame时出现了如下问题:经过百度,发现是数据源有问题,要更换python的pip源。国内几个pip源如下:阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban) http://pypi.douban.com/simple/清华大学 https://pypi.tuna.t

2020-10-13 14:45:58 554 1

原创 【Python爬虫】国家药品监督管理总局中基于中华人民共和国化妆品生产许可证相关数据爬取

需求爬取国家药品监督管理总局中基于中华人民共和国化妆品生产许可证相关数据。代码import requestsimport jsonif __name__ == '__main__': # 批量获取不同企业的id值 url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 1

2020-10-13 10:51:11 3068 1

原创 【Python爬虫】豆瓣电影

需求爬取豆瓣电影分类排行榜中的电影详情数据。分析进入豆瓣电影分类排行榜 - 喜剧片页面,可以发现该页面向下滚动刷新,是进行局部刷新的,可以通过ajax实现。打开开发者工具,找到url、User-Agent,数据包的请求方式以及数据包响应数据的类型。可以看到请求方式是get,响应数据类型是json,所以使用requests.get()方式发起请求,使用json()方法获取相应对象。因为页面是可以刷新获取更多电影信息的,我们需要进行动态参数处理。在数据包的Headers框中的最下方有五个参数,它们就

2020-10-13 09:51:02 495

原创 【Python爬虫】破解百度翻译

需求破解百度翻译分析指定url进入百度翻译页面,打开开发者工具,在页面上随便翻译一个单词,我们可以看到页面是进行局部刷新的,可以通过ajax实现。点击开发者工具中的Netowrk,我们可以看见出现了一堆的包发起请求 我们可以通过开发者工具看到请求方式为GET,所以我们使用requests.get()方法。获取响应数据 从下图可知,内容的类型为text/html,所以我们使用 .text,返回字符串形式的响应数据。持久化存储代码import requestsimport jsoni

2020-10-13 09:30:38 773 2

原创 【Python爬虫】简易网页采集器

需求爬取搜狗指定词条对应的搜索结果页面。分析我搜索的词条为“哈利波特”,其url为 “https://www.sogou.com/web?query=哈利波特”(这是简洁处理过的,实际后面的一些参数省略了,不影响)。但为了能实现搜索不同的词条,我设置了动态参数kw,将其分装到字典中。当我们使用get方法发出请求时,请求所对应的url的参数就可以用params赋值。代码import requestsif __name__ == "__main__": # UA伪装:将对应的User-Ag

2020-10-12 21:00:32 388

原创 【Python爬虫】爬取搜狗首页的页面数据

分析1、指定url首先进入搜狗搜索页面,指定url,并进行UA伪装。UA就是User-Agent,UA伪装就是让爬虫对应的请求载体身份标识伪装成某一款浏览器。因为门户网站的服务器会检测对应请求的载体身份标识,如果检测到请求的载体身份标识为某一款浏览器,就说明该请求是一个正常的请求。但是,如果检测到请求的载体身份标识不是基于某一款浏览器的,则表示该请求为不正常的请求(爬虫),服务器就很有可能会拒绝该次请求。我们进入到搜狗搜索页面,打开开发者工具(鼠标右击,点击“检查”即可),点击Network,刷新页

2020-10-12 20:45:47 3438

原创 【LeetCode】两数之和

题目描述给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]代码方法一:直接使用双重for循环,遍历每一个元素,找出能与该元素相加得到目标值target的值。class Solut

2020-09-24 14:46:47 147

原创 【Java】计算一个字符串中每个字符出现次数

思路分析使用Scanner获取用户输入的字符串创建Map集合,key是字符串中的字符,value是字符的个数遍历字符串,获取每一个字符使用获取到的字符,在Map集合中判断key是否存在遍历Map集合,输出结果代码import java.util.HashMap;import java.util.Scanner;public class Test { public static void main(String[] args) { Scanner sc = new Scanne

2020-09-23 19:28:12 387

原创 【LeetCode】盛最多水的容器

题目描述给你 n 个非负整数 a1,a2,…,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器,且 n 的值至少为 2。示例:输入:[1,8,6,2,5,4,8,3,7]输出:49代码class Solution {public: int maxArea(vector<int>&

2020-09-22 09:00:09 182

原创 【Java】斗地主案例

题目描述按照斗地主的规则,完成洗牌发牌的动作。具体规则:使用54张牌打乱顺序,三个玩家参与游戏,三人交替摸牌,每人17张牌,最后三张留作底牌。案例分析准备牌牌可以设计为一个ArrayList<String>,每个字符串为一张牌发牌看牌...

2020-09-20 17:21:21 191

原创 【Java】接口多态的综合案例 —— 笔记本电脑

题目描述进行描述笔记本类,实现笔记本使用USB鼠标、USB键盘USB接口,包含打开设备功能,关闭设备功能笔记本类,包含开机功能、关机功能、使用USB设备功能鼠标类,要实现USB接口,并具备点击的方法键盘类,要实现USB接口,具备敲击的方法注:该案例只是为了便于理解接口和多态,所以案例里面的功能不会具体实现。代码//USB接口public interface USB { public abstract void open(); //打开设备 public abstract void

2020-09-18 20:46:24 281

原创 【Java】群主发普通红包

思路解析发红包的逻辑:三要素:返回值类型:ArrayList<Integer>方法名称:send参数列表:1、总共发多少红包 int totalMoney 2、分成多少份 int countpublic ArrayList<Integer> send(int totalMoney, int count) { //...}发红包的逻辑:三要素:返回值类型:void方法名称:receive参数列表:ArrayList<Integer&gt

2020-09-18 09:45:25 532

原创 【Java】常用API —— static静态

static关键字如果一个成员变量使用了static关键字,那么这个变量就不再属于对象自己,而是属于类,多个对象共享同一份数据。//Student.javapublic class Student { private int id; private String name; private int age; static String room; private static int idCounter = 0; //学号计数器,每当new了一个新对象的时候,计数器++

2020-09-17 16:21:55 229

原创 【Java】常用API —— String类

java.long.String类代表字符串。API当中说,Java程序中的所有字符串字面值(如:“abc”)都作为此类的实例实现。其实就是说,程序当中所有的双引号字符串,都是String类的对象(就算没有new,也照样是)字符串的特点:1、字符串是常量,它们的值在创建之后不能更改2、正是因为字符串不可改变,所以字符串是可以共享使用的3、字符串效果上相当于char[]字符数组,但是底层原理是byte[]字节数组创建字符串的3+1种方式三种构造方法:public String(); 创建一个空

2020-09-17 10:46:49 152

原创 【Java】常用API —— ArrayList类

ArrayList是长度可变的数组。注意:对于ArrayList集合来说,直接打印得到的不是地址值,而是内容。如果内容为空,得到的是空的中括号。import java.util.ArrayList;public class DemoArrayList { public static void main(String[] args) { // TODO Auto-generated method stub ArrayList<String> list = new ArrayLis

2020-09-16 20:41:13 158

原创 【Java】常用API —— Random类

Random类用来生成随机数。Random的使用方法导包import java.util.Random;创建Random r = new Random();使用无参数:获取一个随机的int数字(范围是int所有范围,有正负两种),int num = r.nextInt()带参数:获取一个随机的int数字(参数代表了范围,左闭右开区间),int num = r.nextInt(n) 实际范围:[0,n)import java.util.Random;public class Demo

2020-09-16 20:20:27 207

原创 【Java】常用API —— 匿名对象

匿名对象即没有名字的对象,就是只有右边的对象,没有左边的名字和赋值运算符。它的格式为new 类名称();我们通过下面这个例子来了解一下//Person.javapublic class Person { private String name; private int age; public Person() { } public Person(String name, int age) { this.name = name; this.age = age

2020-09-16 20:07:16 111

原创 【Java】常用API —— Scanner类

Scanner类的功能:可以实现键盘输入数据到程序当中Scanner(引用类型)的一般使用步骤:导包import 包路径.类名称 如果需要使用的目标类,和当前类位于同一个包下,则可以省略导包语句不写。注意:只有java.long包下的内容不需要导包,其他的包都需要import语句创建类名称 对象名 = new 类名称()使用 对象名.成员方法名()获取键盘输入的一个int数字:int number = sc.nextInt();获取键盘输入的一个字符串,String

2020-09-16 19:47:24 161

原创 【C++】浅析AVL树(高度平衡树)

AVL树的概念二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,俩位俄罗斯的数学家G.MAdelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而...

2020-05-01 21:24:58 609

原创 【C++】浅析二叉搜索树

二叉搜索树的概念二叉搜索树又称二叉排序树,它或者是一个空树,或者是具有以下性质的二叉树:若它的左子树不为空,则左子树上所有节点的值都小于根节点的值若它的右子树不为空,则右子树上所有节点的值都大于根节点的值它的左右子树也分别为二叉搜索树二叉搜索树操作1、二叉搜索树的查找2、二叉搜索树的插入插入的具体过程如下:a. 树为空,则直接插入b. 树不空,按二叉搜索树性质查找插入...

2020-04-23 21:39:12 171

原创 【C++】STL之树形结构的关联式容器 ----- set和multiset

set一、set的介绍set文档介绍set是按照一定次序存储元素的容器。在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序set容器通过key访问单个元素的...

2020-04-12 11:29:34 215

原创 【数据库】关系数据库

一、关系数据结构及形式化定义关系数据库系统是支持关系模型的数据库系统。1、关系关系模型的数据结构非常简单,只包含单一的数据结构——关系。在用户看来,关系模型中数据的逻辑结构是一张扁平的二维表。关系模型的数据结构虽然简单却能够表达丰富的语义,描述出现实世界的实体以及实体间的各种联系。也就是说,在关系模型中,现实世界的实体以及实体间的各种联系均用单一的结构类型,即关系来表示。1、域(doma...

2020-04-11 19:34:47 1457

原创 【C++】STL之树形结构的关联式容器 ----- map和multimap

根据应用场景的不同,STL总共实现了两种不同结构的管理式容器:树形结构和哈希结构。树形结构的关联式容器主要有四种:map、set、multimap、multiset。 这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。关联式容器STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式...

2020-04-10 23:28:31 286

原创 【C++】智能指针

为什么需要智能指针?首先我们先分析一下下面这段程序有没有什么内存方面的问题。void _MergeSort(int* a, int left, int right, int* tmp){ if (left >= right) return; int mid = left + ((right - left) >> 1); _MergeSort(a, left, mi...

2020-04-09 20:57:44 147

原创 【C++】异常

C语言传统的处理错误的方式传统的错误处理机制:**终止程序,如assert。**缺陷:用户难以接受。如发生内存错误,除0错误时就会终止程序。**返回错误码。**缺陷:需要程序员自己去查找对应的错误。如系统的很多库的接口函数都是通过把错误码放到error中,表示错误。C标准库中setjmp和longjmp组合。实际中C语言基本都是使用返回错误码的方式处理错误,部分情况下使用终止程序处理...

2020-04-06 14:50:53 191

原创 【数据库】数据库系统的结构

数据库系统模式的概念模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及型的描述,不涉及具体的值。模式的一个具体值称为模式的一个实例。同一个模式可以有很多实例。模式是相对稳定的,而实例是相对变动的。数据库系统的结构数据库系统的内部结构 — 模式结构从数据库管理系统角度看,数据库系统通常采用三级模式结构,是数据库系统的内部结构。数据库系统的外部结构 — 体系结构从数据库最终用户角...

2020-04-05 12:55:05 1165

原创 【数据库】数据模型

数据模型是对现实世界数据特征的抽象。 也就是说数据模型是用来描述数据、组织数据和对数据进行操作的。数据模型是数据库系统的核心和基础。数据模型的简单定义:能表示实体类型及实体间联系的模型称为“数据模型”。两类数据模型数据模型的种类很多,目前被广泛使用的可分为两种类型。第一类是概念模型,第二类是逻辑模型和物理模型。第一类概念模型,也称信息模型,它是按用户的观点来对数据和信息建模,主要用于数据...

2020-04-05 11:51:30 1869

原创 【数据库】数据库系统绪论

数据库的四个基本概念数据(data)数据是数据库中存储的基本对象。描述事物的符号记录称为数据。数据的含义称为数据的语义,数据与其语义是不可分的。数据库(DB)DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB中的数据按一定的数据模型组织、描述和存储,具有较小冗余度、较高的数据独立性和易扩展性,并为各种用户共享。概括地讲,数据库数据具有永久存储、有组织和可共享三个基本特点。...

2020-04-04 16:41:59 848

原创 【C++】多态常见面试问题

1. 什么是多态?答:多态,通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。其中多态又分为动态多态和静态多态。静态多态:在程序编译期间确定了程序的行为。动态多态:在程序运行期间,根据具体拿到的对象确定程序的具体行为,调用具体的函数2. 什么是重载、重写(覆盖)、重定义(隐藏)?答:重载:指函数名相同,返回值可以不同,但形参列表(参数个数或类型或...

2020-04-04 14:09:41 503

原创 【C++】多态的原理

虚函数表//这里常考一道笔试题:sizeof(Base)是多少?/* 这里 sizeof(Base) = 8。 int类型4个字节 + virtual中含一个指针:4个字节 = 8个字节 (无论有几个虚函数,只有一个指针,指针指向虚函数表)*/class Base{public: //若不加virtual,则sizeof(Base) = 4,此时不计算函数大小 virtual...

2020-04-03 13:32:12 171

原创 【C++】多态

多态的概念多态的概念:通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。举个栗子:比如买票这个行为,当普通人买票时,是全价买票;学生买票时,是半价买票;军人买票时是优先买票。多态的定义及实现1、多态定义的构成条件多态是在不同继承关系的类对象,去调用同一函数,产生了不同的行为。 比如Student继承了Person,Person对象买票全价,Stud...

2020-04-01 19:59:14 178

原创 【C语言】从键盘输入一个字符串,将小写字母全部转换成大写字母,然后输出到一个磁盘文件“test”中保存。输入的字符串以 !结束。

#include <stdio.h>#include <stdlib.h>int main(){ FILE *fp; int i = 0; char str[100], filename[100]; if ((fp == fopen("test", "w")) == NULL) { printf("cannot open the file\n"); ...

2020-03-28 21:15:36 9634 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除