自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Siumai's Blog

噫...

  • 博客(217)
  • 收藏
  • 关注

原创 [n, h, w, c]转[n, c, h, w]

由于Pytorch默认图片数据格式为[n, c, h, w]、rgb,因此若数据集为[n, h, w, c]格式时需要进行转换:# 为便于处理,先转为numpy数组x = np.array(trainset['train_set_x'])x.shape, type(x)# ((1080, 64, 64, 3), numpy.ndarray)x = x.transpose([0, 3, 1, 2])x = t.as_tensor(x)x.size()# torch.Size([1080, 3

2020-08-12 17:27:31 1629

原创 Python爬虫常用库(三)selenium

一、声明浏览器对象from selenium import webdriveroption = webdriver.ChromeOptions()option.add_argument("--headless")'''Chrome无头模式'''browser = webdriver.Chrome(options = option)二、访问页面 Chrome().get(url...

2020-08-12 11:46:54 275

原创 Ubuntu个人美化方案

一、安装gonome-tweak-toolsudo apt-get install gnome-tweak-tool二、安装chrome-gnome-shellsudo apt-get install chrome-gnome-shell三、在浏览器中打开https://extensions.gnome.org/extension/19/user-themes/,并打开网页右侧的按钮四、在添加链接描述中选择喜欢的拓展插件安装,本人安装了dash to dock。五、安装arc主题# 安装a

2020-07-28 12:11:37 257

原创 Ubuntu路径

~为家目录./为当前目录/为根目录

2020-07-28 11:23:44 495

原创 深度学习一般工作流程

一、定义问题,收集数据集。注意确保数据集特征丰富程度足以作出预测二、定义模型预测性能指标如:平衡分类问题常用精度、接受者操作特征曲线下面积;不平衡分类问题常用精度和召回率;标量回归常用平均绝对误差(MAE)等等。三、确定模型评估方式如:留出法、K折交叉验证、乱序重复K折交叉验证四、数据预处理预处理目标:1、特征值为张量数据2、特征取值较小(0-1区间或正负1区间)3、特征非异质数据4、特征缺失处理为0五、搭建模型1、确定激活函数、损失函数问题类型输出层激活函数损失函数

2020-06-09 18:25:39 3682 2

原创 模型评估:训练、验证、测试

一、数据集的划分(一)学习目标在理想情况下,通过机器学习,我们希望可以获得一个拥有出色泛化能力的模型。即能够在前所未见的数据样本上举一反三,正确分析预测。(二)假设1、全部数据集作为训练集只要选取模型适当,在若干轮迭代轮次后一定能够得到在训练集上性能优越的模型。但其泛化能力不得而知。2、划分为训练集和测试集增加了测试集部分,在训练集上训练模型,在测试集上评估模型并作为泛化能力的指标。但总是基于同一个测试集进行参数调整,即使可以进一步得到在测试集上表现优秀的模型,但模型在测试集上过拟合不可避免(

2020-06-09 15:44:34 3446

原创 Ubuntu18.04+tensorflow2.1.0+pytorch1.5环境搭建

一、安装ubuntu18.04 LTS(一)下载ubuntu系统映像Ubuntu 18.04.4 LTS (Bionic Beaver)(二)制作系统安装盘推荐工具:rufus(三)系统安装注意:一定将bios设置中安全启动选项关闭!(四)后续1、ubuntu更换阿里云镜像源2、二、深度学习环境搭建(一)GPU环境搭建参考Tensorflow官方GPU配置指南进行搭建。1、卸载旧显卡驱动及相关组件# 终端输入:sudo apt-get purge nvidia*sudo ap

2020-06-08 12:28:33 1311

原创 jupyter notebook使用技巧

1、代码自动补全(1)安装库python -m pip install jupyter_contrib_nbextensions(2)执行jupyter contrib nbextension install --user --skip-running-check(3)配置进入jupyter notebook;在Nbextensions中勾选Hinterland和Table of Contents(4)按Tab使用自动补全2、简单方法(函数)功能提示(1)编写函数,括号留白(2)

2020-05-27 16:55:03 207

原创 解决Ubuntu18下Fcitx无法super+space切换

设置-设备-键盘->禁用"切换至上个输入源"“切换至下个输入源”

2020-04-30 18:25:58 1139

原创 深度神经网络中的梯度检验与Inverted dropout实现

import numpy as npimport matplotlib.pyplot as pltimport scipy.io as siodef load_dataset(): data = sio.loadmat("/home/yan/下载/datasets/data.mat") return data["X"].T, data["y"].T, data["Xval"...

2020-04-22 13:29:33 212

原创 PAT A 2019.9 7-4 Dijkstra Sequence (30分)

一、题目概述验证给定的K个序列是否为Dijkstra序列二、思路对于每个序列,执行dijkstra算法求得单元最短路径距离。若为Dijkstra序列,则序列中元素按照该距离非降序排列。三、代码#include <cstdio>#include <vector>using namespace std;#define INF 0x7FFFFFFFint ma...

2020-04-20 11:12:09 256

原创 PAT A 2019.9 7-3 Postfix Expression

一、题目概述依据给定语法树,输出后缀表达式二、思路对语法树后序遍历输出单元数据。注意:单枝树按照先序NLR顺序输出数据三、代码#include <iostream>#include <vector>#include <string>using namespace std;vector<int> lchild(21), rchild...

2020-04-20 10:49:54 123

原创 PAT A 2019.9 7-2 Merging Linked Lists (25分)

一、题目概述给定非空单链表L1, L2,知其一结点数时另一链表的两倍或以上。要求将短链表逆置,插入长链表。二、代码(PAT暂未收录,不保证正确)#include <cstdio>#include <vector>#include <algorithm>using namespace std;struct node{ int data, add...

2020-04-19 13:07:46 402

原创 PAT A 2019.9 7-1 Forever (20分)

一、题目概述存在整数A, 满足以下条件:1、A共K位2、A各位数字和为m3、A + 1各位数字和为n4、m和n的最大公因数为大于2的素数要求:依据给定K和m,输出所有满足条件的n和A。输出按照n和A升序二、思路设A各位数字之和为m,则A + 1各位数字之和n有以下可能:1、A末尾数字不是9,显然:n = m + 12、A尾部有k位连续的9:n = m + 1 - k * 9归...

2020-04-19 12:43:06 180 1

原创 吴恩达Course 1 - 神经网络和深度学习 - 第四周作业 - 深层神经网络

一、爬取百度图片数据集import requestsimport jsonbase_url = "http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=" \ "result&queryWord=%E7%8C%AB&amp...

2020-04-16 18:01:28 591 2

原创 爬取百度图片450张猫图片

import requestsimport jsonbase_url = "http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=" \ "result&queryWord=%E7%8C%AB&cl=2&lm...

2020-04-13 21:32:20 620

原创 吴恩达Course 1 - 神经网络和深度学习 - 第三周作业 - 带有一个隐藏层的平面数据分类

import numpy as npimport matplotlib.pyplot as pltimport timedef load_planar_dataset(): np.random.seed(1) m = 400 # number of examples N = int(m/2) # number of points per class D = ...

2020-04-11 23:45:43 248

原创 吴恩达Course 1 - 神经网络和深度学习 - 第二周作业 - 具有神经网络思维的Logistic回归

import numpy as npimport matplotlib.pyplot as pltimport h5py载入数据集函数:载入数据集;返回train_x, train_t, test_x, test_y, ;def load_dataset(): train_set = h5py.File("/home/yan/下载/assignment/datasets/trai...

2020-04-06 21:23:42 226

原创 爬取百度云500张验证码图片

from selenium import webdriverfrom selenium.webdriver.common.by import Byimport timeimport requestsdef save(url, path): response = requests.get(url) with open(path, 'wb') as img: ...

2020-04-03 17:56:24 763

原创 CSS选择器

选择器例子例子描述CSS.class.intro选择 class=“intro” 的所有元素。1#id#firstname选择 id=“firstname” 的所有元素。1**选择所有元素。elementp选择所有 < p > 元素。1element,elementdiv,p选择所有 < div &g...

2020-04-03 17:05:38 124

原创 Python爬虫常用库(三)pyquery

一、初始化(一)html代码初始化from pyquery import PyQuery as pqhtml = '''<div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="link2....

2020-04-01 15:55:56 171

原创 Python爬虫常用库(三)beautifulsoup

一、解析库解析器使用方法优势劣势lxml HTML解析库Beautifulsoup(markup, “lxml”)速度快、文档容错能力强需要安装C语言库lxml XML解析库Beautifulsoup(markup, “xml”)速度快、唯一支持XML的解析器需要安装C语言库html5libBeautifulsoup(markup, “html5...

2020-03-28 12:56:46 227

原创 Python爬虫常用库(二)正则表达式

一、测试站点:正则表达式在线工具二、语法模式描述^匹配字符串的开头$匹配字符串的末尾。.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。[…]用来表示一组字符,单独列出:[amk] 匹配 ‘a’,‘m’或’k’[^…]不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。re*匹配...

2020-03-25 09:46:50 163

原创 Python网络爬虫实战练习:爬取豆瓣图书信息

一、注意事项1、文件名尽量使用英文,避免出现编码问题2、含中文的文件写入,注意标注编码,如:with open(r"C:\Users\10335\Desktop\response.txt", 'w', encoding = "utf-8") as f: f.write(html) f.close()3、若长时间得不到输出,考虑正则表达式的构造是否捕捉效率不高二、代码实现...

2020-03-24 14:46:05 841

原创 技巧:机试常用算法

一、素数判断:1、直接判断 o(n^1/2)bool isprime( int n ){ if( n < 2 ) return false; for( int i = 2; i <= sqrt(n); ++i ) if( n % i == 0 ) return false; return true;...

2020-03-22 10:55:15 498

原创 Python爬虫常用库(一)urllib、requests

一、urllib1、请求 urillib.reques.urlopen(url = url, data = post_data, [time_out]*)(1)get类请求from urllib import requestresponse = request.urlopen("http://www.baidu.com")print(response.read().decode("utf...

2020-03-20 15:43:58 334

原创 PAT A 1073 Scientific Notation (20分)

### 一、题目概述输出给定依照科学计数法规范表示的数字### 二、思路数符:若为'-'则直接输出'-';有效数位:仅将数字部分保存为字符串;阶码:保存为整形;小数点及是否补零的确定:(1)阶码e < 0:数字串前补|e|个'0',下标1处插入小数点'.';(2)阶码0 <= e < 数字有效位数 - 1数字串下标1 + e处插入小数点'.'(3)阶码e >= 数字有效位数字串尾补e - 数字有效位 + 1个'0'### 三、代码```cpp#include <cstd

2020-03-20 11:10:28 89

原创 PAT A 1068 Find More Coins (30分)

一、题目概述依据给定钱币面值,找出总金额恰为给定M的最小钱币组合。二、思路将货币面值降序排序;构造降维动态规划数组dp[],dp[j]为总面值和不多于j的最大总面值和,i从1至N迭代,每次求出前i个货币的dp值。最终若dp[M] != M,即无法找到总面值恰为M的钱币组合,无解。若有解,根据数组ans[i][j]记录的更新情况输出最小组合。三、代码#include <cstd...

2020-03-18 15:19:58 103

原创 技巧:C/C++常用库函数

一、map相关1、map定义时添加参数 less<>/greater<>可以设置map内排序为升降序;2、map.find(val)返回迭代器,失败是迭代器指针指向map.end()二、algorithm库1、max(a, b), min(a, b), abs(val)2、swap(a, b)3、reverse(it1, it2)逆转序列4、sort(it1,...

2020-03-08 14:44:58 203

原创 PAT A 1132 Cut Integer (20分)

一、题目概述略;二、思路利用好< string >中的substr()函数。注意:除数为0输出"No"。三、代码#include <iostream>#include <cstdlib>#include <string>using namespace std;int main(){ int N; cin >...

2020-02-17 13:33:36 95

原创 PAT A 1124 Raffle for Weibo Followers (20分)

一、题目概述依据给定转发用户名单及抽奖机制,筛选中奖者。抽奖机制:第S个用户为第一个中奖用户, 之后每N个用户为中奖用户。二、思路设当前用户是第i个转发用户, 第S个用户是首个中奖用户,则若(i - S)是N的非负整数倍,则当前用户中奖(若非已中奖用户)。若当前用户中过奖,令S加一即可实现跳过。用map作为存储已中奖用户名单的数据结构,判断用户是否已经中过奖。三、代码#include...

2020-02-16 10:30:24 173

原创 PAT A 1121 Damn Single (25分)

一、题目概述升序输出无配偶或配偶未出席的客人ID。二、思路略;三、代码#include <cstdio>#include <vector>#include <algorithm>using namespace std;int main(){ int N, M; vector<int> spouse(100000, ...

2020-02-15 17:13:14 110

原创 PAT A 1119 Pre- and Post-order Traversals (30分)

一、题目概述判断给定先序、后序遍历序列是否可以唯一确定一个二叉树,并输出所确定的二叉树的中序遍历序列。二叉树不唯一时,构造可确定的任一二叉树中序序列。二、思路判断是否可以唯一确定:二叉树先序序列的第二个元素是左子树的根元素(若有左子树),后序序列的倒数第二个元素是右子树的根元素(若有右子树)。当先序第二、后序倒数第二个元素相同时可知,该元素即可为左子树的根元素,也可为右子树的根元素,二叉树不...

2020-02-15 16:33:36 158

原创 PAT A 1118 Birds in Forest (25分)

一、题目概述依据给定信息,求解:(1)树的数量;(2)鸟的数量;(3)判断任两只鸟是否在同一个树上。信息受以下规范约束:(1)每张照片上的鸟都在同一棵树上(可能有多张照片描述同一棵树);(2)鸟编号连续,从1开始,且所有鸟都在照片中出现。二、思路(1)输入的同时统计鸟的数量。(2)鸟和照片作为结点构造无向图,则每个连通分量就是一棵树,树的数量即连通分量数。(3)为判断鸟是否属于同一...

2020-02-15 15:29:19 111

原创 PAT A 1117 Eddington Number (25分)

一、题目概述依据给定骑行记录计算Eddington number——E。E满足在N条记录中,有E天骑行超过E公里。二、思路按值降序排序,E取最后一个dist[i] > i的i。三、代码#include <cstdio>#include <vector>#include <algorithm>using namespace std;int ...

2020-02-15 14:44:25 98

原创 PAT A 1115 Counting Nodes in a BST (30分)

一、题目概述依据给定数据序列构造BST,并求出BST底部两层结点数。二、思路1、经典的二叉排序树按序插入构造;2、层序遍历统计底部两层结点数底部两层结点数。三、代码#include <cstdio>#include <vector>#include <queue>#include <algorithm>using namespac...

2020-02-15 13:12:49 90

原创 PAT A 1114 Family Property (25分)

一、题目概述依据给定个人房产信息、家族信息,统计:1、家族数量(有任一种血缘关系即属于同一家族);2、各家族的:家族代表(全家最小ID)、家族成员数、家族平均房产数、家族平均房产面积。二、思路无向图dfs统计。set作为数据结构存储所有id,实现id升序遍历,则家族遍历起点即家族代表id(最小号id)。三、代码#include <cstdio>#include &lt...

2020-02-15 12:52:04 98

原创 PAT A 1113 Integer Set Partition (25分)

一、题目概述略二、思路排序即可三、代码#include <cstdio>#include <vector>#include <algorithm>using namespace std;int main(){ int N, diff = 0; scanf("%d", &N); vector<int>...

2020-02-15 12:16:08 102

原创 PAT A 1112 Stucked Keyboard (20分)

一、题目概述依据给定串,及按键卡住的判定标准,输出可能卡住的按键,及正常输出的串。按键卡住的判定:若按键卡住,则每次输出都会输出k次。即该按键连续出现的次数一定是k的倍数。二、思路字符串以连续的字符段为单位处理时,有一种好用的方式:下标i从1到串尾+1位迭代,每次迭代处理前一位字符(str[i - 1]),可以正确处理到每个字符,不会漏掉易于出错的末尾字符处理。1、找出肯定没卡住的按键:...

2020-02-15 11:18:17 103

原创 PAT A 1111 Online Map (30分)

一、题目概述求解两条路径:1、源点、汇点间最短距离路径,若路经距离相同,选择耗时更短者。2、源点、汇点间耗时最短路径,若路径耗时相同,选择路线上结点更少者。二、思路两次Dijkstra算法。代码量较大,注意不要出错。三、代码#include <cstdio>#include <vector>using namespace std;#define INF...

2020-02-14 17:56:32 145

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除