自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 商品销售关联分析

商品销售关联分析导入相关库读取数据数据编码使用算法进行关联运算导入相关库import pandas as pd from mlxtend.frequent_patterns import apriori,association_rulesfrom mlxtend.preprocessing import TransactionEncoder读取数据#显示所有列pd.set_option('display.max_columns',None)#导入数据f=r'D:\purchase.csv

2021-05-18 15:55:47 1039 1

原创 爬虫学习-task4

实战大项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容#模拟登录丁香园import time,requestsfrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysfrom lxml import etreedef login(): browser = ...

2019-05-17 21:33:46 158

原创 爬虫学习-task3

了解seleniumselenium是一个用于Web应用程序测试的工具,支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等selenium常用的查找元素方法:find_element_by_namefind_element_by_idfind_element_by_xpathfind_ele...

2019-05-16 01:01:30 171

原创 爬虫学习task2

学习beautifulsoupBeautifulSoup库是解析、遍历、维护“标签树”(例如html、xml等格式的数据对象)的功能库查看网页源代码,通过BeautifulSoup能帮助我们解析网页并获取内容。BeautifulSoup[Tag,Name,Attributes,NavigableString,Comment]]from bs4 import BeautifulSou...

2019-05-13 21:16:52 118

原创 爬虫学习task1

http协议的get与post请求get请求1.get请求参数直接拼接url,且只能通过url编码2.get请求能自动缓存3.get请求可回退4.get请求能完整地保留在浏览器的历史记录里5.get请求产生的url可被当书签收藏6.get请求传送的参数有长度限制使用requests用get方法向https://www.baidu.com/发出一个请求,并将其返回结果输出。...

2019-05-11 13:12:34 106

原创 任务3 - 决策树算法梳理

信息论基础熵:度量样本集合纯度最常用的指标,是对所有可能发生的事件产生的信息量的期望。假设当前样本集合D的第k类样本比例为Pk(k=1,2,3,…,|y|),则D的熵定义为联合熵:样本类别越多,状态数也就越多,熵就越大,混乱程度就越大。当样本类别为均匀分布时,熵达到最大,且 0≤Ent(D)≤logn。将一维随机变量分布推广到多维随机变量分布,则其联合熵 (Joint entropy...

2019-04-03 21:07:25 655

原创 任务2 - 逻辑回归算法梳理

逻辑回归与线性回归的联系与区别联系:逻辑回归是在线性回归模型的基础上取对数,使模型更逼近y值,是广义线性回归的一个特例。形式上,两者都是线性回归。区别:逻辑回归是已求取的输入空间对输出空间的非线性映射,而线性回归是线性映射。逻辑回归多用于分类,线性回归多用于预测逻辑回归针对非连续变量,线性回归针对连续变量2、 逻辑回归的原理逻辑回归是用线性回归模型对数的预测结果逼近真实标记的对...

2019-04-01 17:40:50 333

原创 线性回归算法梳理1

机器学习的一些概念有监督学习、无监督学习根据数据是否拥有标记信息,学习任务可以分为有监督学习和无监督学习。有监督学习:用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预测未知样本,此种方法称为有监督学习。分类(离散)和回归(连续)属有监督学习;无监督学习:根据类别样本(没有被标记)的训练样本解决模型识别中的各种问题。聚类属无监督学习泛化能力学得模型应...

2019-03-30 00:36:23 183

原创 MySQL 实战 - 复杂项目

项目十

2019-03-04 21:57:12 131

原创 MySQL 实战

数据导入导出将Excel文件导入MySQL表【数据库】-【导入】-【导入外部数据】-【开始新工作】-下一步-【excel】-下一步2-【从数据源拷贝表】-下一步-选择需要导入的表-下一步3,即可sqlyog MySQL导出表到Excel文件【导出】-打开Excel-将文件拖入excel即可项目七: 各部门工资最高的员工(难度:中等)...

2019-03-03 21:59:04 343

原创 MySQL 基础 (三)- 表联结

字符拼接(concatenate)例:将表中列名1与 (列名2)拼接在一起,并按列名1 排序SELECT CONCAT(列名1,’ (’,列名2, ’ )’)FROM 表名ORDER BY 列名1;MySQL别名列别名给原列衍生出来的一列赋予名字select … AS 新列名from 表名;联结(join)例:在表1,表2 中 检索 表1中的列2,表2中的...

2019-03-02 17:41:26 125

原创 MySQL 基础 (二)- 表操作

MySQL表数据类型字符串类型数值数据类型日期和时间数据类型用SQL语句创建表创建新表设定列类型 、大小、约束CREATE TABLE 新表名(列名1 类型(n) NOT NULL(或null),列名2 类型(n) NOT NULL,… … …);设定主键1.创表时,可在约束后面添加 primary key2.ALTER TABLE ...

2019-03-01 14:56:04 150

原创 DAY2-MySQL查询语句

SQL:结构化查询语言,能从数据库中读写数据的方法。MySQL:关系型数据管理系统查询语句 SELECT FROM从一个表或多个表中检索信息select 列名from 表名;去重语句SELECT DISTINCT 列名from 表名;前N个语句SELECT 列名FROM 表名LIMIT n;从第n行起的n行数据SELECT 列名FROM ...

2019-02-28 21:51:38 102

原创 DAY1 数据库基础

MySQL之前已经安装,故不赘述。数据库定义数据库定义(database)数据库是保存有组织的数据的容器。关系型数据库关系型数据库是由二维表及其之间的联系所组成的一个数据组织,最典型的数据结构是表优点:1、易于维护:都是使用表结构,格式一致;2、使用方便:SQL语言通用,可用于复杂查询;3、复杂操作:支持SQL,可用于一个表以及多个表之间非常复杂的查询。缺点:1、读写...

2019-02-26 15:13:35 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除