自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(347)
  • 资源 (2)
  • 收藏
  • 关注

原创 Windows Server搭建SAN存储服务(iSCSI)

一、Windows Server 安装这里在VMware虚拟机中安装windows server2016,具体步骤参考链接:https://www.cnblogs.com/hjq111/p/13791443.html二、存储服务配置参考链接如:https://www.jianshu.com/p/cc75ef97efcb 或https://blog.51cto.com/sxleilong/1342740、https://blog.csdn.net/blvyoucan/article/detai..

2020-12-07 15:28:14 5511 1

原创 Linux Server中搭建NAS存储服务(一)

在一些情况下,一台主机用户可以像使用本机的文件系统一样使用远程机的文件系统,这种功能通过共享文件实现。共享文件系统不能用于存储和管理磁盘数据,只是定义了文件在网络上传输时的组织格式和传输协议。所以一个文件从网络的一端到另一端需要进行两次转换,分别发生在进入网络和离开网络的时候。在网络环境下,通过FTP实现了在不同操作系统的主机之间相互传输文件,为集群中的多台实际服务器共享同一台物理存储设备。对于共享文件系统的实现通常有NFS和Samba,其中NFS主要用于Linux/Unix平台下,而Samba用于将L

2020-11-30 16:58:44 5102 2

原创 Windows Server搭建SAN存储服务(一)

目前,实现云环境中数据的高效存储是云计算提供服务的基本要求。云计算和云存储已经成为提供信息和在线功能的首选方法。云计算和云存储已经成为解决普通IT问题和挑战的热门话题。以数据中心网络为基础的分布式存储是构建云计算的物理实体。通常熟知的存储设备是和计算机主板I/O接口(如IDE、SCSI)相连接的硬盘,由本机操作系统负责读写及管理,这是传统的数据存储技术,称为DAS(直接附加存储)。如果添加网络,可以实现文件共享,这是基于局域网(IP)的文件共享设备,能消除对多个文件服务器的需求。存储作为云计算提供I

2020-11-27 10:04:07 5076

原创 Vmware环境搭建

为什么用虚拟机1)一些老的开发软件没有办法在当前系统下运行,需要使用虚拟机。2)比如测试工作需要在单独的系统上运行,但是,目前没有现成的条件,可以建立虚拟机将电脑变成多台运行。Vmware安装1、下载Vmware可以在官网下载,用下面链接也可。一般下载最新版本,目前是Vmware16版本。下载链接:https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html2、安装步骤..

2020-11-26 16:36:50 284

原创 云计算架构与分析

从系统架构层面讲,云计算是由服务和管理两大部分组成的。只有真正理解云计算基础结构才能充分考虑整个平台的延展性和可扩充性,从而帮助用户以最小的成本来搭建具有高度伸缩性的平台。云计算的总体架构在服务方面,,主要提供用户基于云的各种服务为主,共包含3个层次:软件即服务(Saas),这层作用将应用主要以基于Web的方式提供给客户; 平台即服务(Paas),这层作用是将应用开发和部署平台作为服务提供给用户; 基础架构即服务(Iaas),这层作用将各种底层的计算(比如虚拟机)和存储等资源作为服务提供

2020-11-25 21:37:49 2845

原创 云计算认识与了解

云计算的基本概念1)维基百科定义:云计算将IT相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet获取需要的服务。2)中国云计算网定义:云计算是分布式计算、并行计算和网络计算的发展,或者说是这些科学概念的商业实现(服务计算)。3)综上,“云”定义:云是一个包含大量可用虚拟资源(例如硬件、开发平台以及I/O服务)的资源地。这些虚拟资源可以根据不同的负载动态地重新配置,以达到更优化的资源利用率。这种资源池通常由基础设施提供商按照

2020-11-25 19:14:41 977

原创 Openstack介绍

它是什么?1、是Rackspace和NASA共同发起的开源项目。一系列开源软件项目的组合,这些项目是松耦合的关系,可以独立安装、启动、停止,只有在必要的时候通信,扩展性较好,但是安装、配置比较复杂。2、基础设施资源的系统管理平台。用户按需以扩展方式获取所需资源,有效地管理CPU、内存、磁盘等资源。功能组件介绍如下在上述参考模型中,分为五个不同层次,表示层、逻辑控制层、资源管理层、集成层、管理层。每一层包含不同的功能模块。资源管理层:计算资源管理模块、存储资源管理模块、网络资源管理模块

2020-11-11 17:00:18 382 1

原创 RDDs介绍

Driver program:包含程序的main()方法,RDDs的定义和操作。 管理很多节点,称作为executors。如下图展示,SparkContext:Driver program通过SparkContext对象访问Spark。 SparkContext对象表示和一个集群的链接。 在Shell中SparkContext自动创建,即sc。RDDs:Resilient distributed datasets (弹性分布式数据集,简写RDDs)。 RDDs并行的分布在整个集群

2020-11-08 20:39:31 1835

原创 Spark介绍

它是什么?Spark 是一个快速且通用的集群计算平台。它的特点Spark是快速的:因为它扩充了流行的Mapreduce计算模型,是基于内存的计算。当有大量数据计算时,存放数据要么在硬盘上要么内存中,在硬盘上需要大量输入输出消耗大,而后者更快些。 Spark是通用的:它的设计容纳了其他分式系统有的功能,批处理(hadoop),迭代式计算,交互查询和流处理(Storm)等。优点是大大较低了维护成本。 Spark是高度开放的:它提供了Python,Java,Scala,SQL的API和丰富的内置库。

2020-11-07 16:48:59 906 1

转载 各种相似度计算的python实现

https://blog.csdn.net/u013393647/article/details/46754055?fps=1&locationNum=4

2018-11-06 20:01:04 2712 1

转载 python实现聚类质量评估指标(兰德系数、互信息、轮廓系数)

转载:http://blog.sina.com.cn/s/blog_13ec735f50102x6ay.html

2018-11-06 19:52:06 5946

原创 对tensorflow模型 (非线性模型)保存、加载模型,重建网络结构、喂入保存模型的新数据实现步骤

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:use_model.py# 作 者:孔云#问题描述:# coding:utf-8import tensorflow as tfimport numpy as npfrom scipy.sparse import dok_matriximport scipy....

2018-09-12 13:42:22 612

原创 NMI 代码实现步骤

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:nmi.py# 作 者:孔云#问题描述:计算算法聚类结果与ground truth的相似度# coding:utf-8#A是标准聚类结果,B是算法聚类结果 from sklearn import metricsimport numpy as npdef ope...

2018-09-12 13:17:12 5574 4

原创 python3读取文件指定几行,并写入另一个文件

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:readfile.py# 作 者:孔云#问题描述:将一个文件数据读取前几行,写入另一个文件# coding:utf-8import numpy as npimport csvfile_path='.\blogCatalog-groups.txt'path='....

2018-09-12 12:49:11 19992 3

原创 网页爬虫实例(三)-提交关键词搜索结果

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:justForTest.py# 作 者:孔云#问题描述:搜索关键词提交,获得搜索结果# coding:utf-8import requestskv={'wd':'pyhton'}#构造键值对,表明搜索的关键词是pythonr=requests.get("http:...

2018-04-28 20:09:04 1560 1

原创 网页爬虫实例(二)-页面出现意外错误

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:justForTest.py# 作 者:孔云#问题描述:访问亚马逊网页,出现意外错误,解决办法是修改网页http的头部# coding:utf-8import requestsr=requests.get("http://www.amazon.cn/gp/produ...

2018-04-28 19:46:40 523

原创 python爬取京东网页商品实例(一)

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:justForTest.py# 作 者:孔云#问题描述:打开京东页面,选取一个商品,复制当前页面链接,pyhton语言爬取京东网页商品# coding:utf-8import requestsurl="http://item.jd.com/2967929.html"...

2018-04-28 18:51:36 1284

原创 网页爬虫解决乱码

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:justForTest.py# 作 者:孔云#问题描述:网络爬虫解决乱码# coding:utf-8import requestsurl="http://www.baidu.com"r=requests.get(url)print("使用编码:",r.encod...

2018-04-28 18:30:09 524

原创 MNIST 数据集输出手写数字识别准确率

实现手写体 mnist 数据集的识别任务,共分为三个模块文件,分别是描述网络结构的前向传播过程文件(mnist_forward.py)、 描述网络参数优化方法的反向传播 过 程 文 件 (mnist_backward.py )、 验 证 模 型 准 确 率 的 测 试 过 程 文 件(mnist_test.py)。 前向传播过程文件(mnist_forward.py) '''在前向传播过程中,需...

2018-04-25 16:53:07 6627 3

原创 Tensorflow 框架搭建神经网络(五)

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:test.py# 作 者:孔云#问题描述:搭建网络实现。反向传播:训练模型参数,在所有参数上用梯度下降,使 NN 模型在训练数据上的损失函数最小。#损失函数(loss): 计算得到的预测值 y 与已知答案 y_的差距。#损失函数的计算有很多方法,均方误差 MSE 是比...

2018-04-18 16:57:32 320

原创 Tensorflow 框架搭建神经网络(四)

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:test.py# 作 者:孔云#问题描述:利用placeholder实现输入定义#coding:utf-8#两层简单神经网络(全连接)import tensorflow as tf#定义输入和参数#用placeholder实现输入定义 (sess.run中喂一组...

2018-04-17 21:59:29 244

转载 拉普拉斯特征图降维及其python实现

这种方法假设样本点在光滑的流形上,这一方法的计算数据的低维表达,局部近邻信息被最优的保存。以这种方式,可以得到一个能反映流形的几何结构的解。步骤一:构建一个图G=(V,E),其中V={vi,i=1,2,3…n}是顶点的集合,E={eij}是连接顶点的vi和vj边,图的每一个节点vi与样本集X中的一个点xi相关。如果xi,xj相距较近,我们就连接vi,vj。也就是说在各自节点插入一个边eij,如果X...

2018-04-16 23:46:11 4161 2

转载 降维方法:Laplacian Eigenmaps (拉普拉斯特征映射)——拉普拉斯矩阵

拉普拉斯矩阵Laplacian matrix 的定义谈到机器学习中的降维技术,可能大多数了解一点机器学习的朋友都知道PCA,今天为大家介绍一种新的降维方法——拉普拉斯特征映射拉普拉斯矩阵(Laplacian matrix)),也称为基尔霍夫矩阵, 是表示图的一种矩阵。给定一个有n个顶点的图G=(V,E) ,其拉普拉斯矩阵被定义为:L=D-W其中D为图的度矩阵,W为图的邻接矩阵。(不知道度矩阵和邻接...

2018-04-16 23:15:43 8971

原创 Tensorflow 框架搭建神经网络(三)

神经网络的参数: 是指神经元线上的权重 w, 用变量表示, 一般会先随机生成这些参数。生成参数的方法是让 w 等于 tf.Variable,把生成的方式写在括号里。神经网络中常用的生成随机数/数组的函数有: tf.random_normal()                            生成正态分布随机数tf.truncated_normal()                    ...

2018-04-15 12:36:50 385

原创 Tensorflow 框架搭建神经网络(二)

计算图(Graph): 搭建神经网络的计算过程,是承载一个或多个计算节点的一张图,只搭建网络,不运算。 神经网络的基本模型是神经元,神经元的基本模型其实就是数学中的乘、加运算。 我们搭建如下的计算图: 在上述图中,x1、 x2 表示输入, w1、 w2 分别是 x1 到 y 和 x2 到 y 的权重, y=x1*w1+x2*w2。由程序代码实现上述计算图: import tensorflow as...

2018-04-15 11:54:22 336

原创 Tensorflow 框架搭建神经网络(一)

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:test.py# 作 者:孔云#问题描述:实现 Tensorflow 的加法import tensorflow as tf #引入模块a=tf.constant([1.0,2.0]) #定义一个张量等于[1.0,2.0]b=tf.constant([3.0...

2018-04-15 11:19:02 317

原创 Python 类与对象的使用

# Copyright (c)2018, 东北大学软件学院学生# All rightsreserved# 文件名称:test.py# 作 者:孔云#问题描述:Python类与函数class Animals(): #语法规定,在类里定义函数,函数第一个参数必须是self def breathe(self): print (" breathing") ...

2018-04-15 11:00:46 553 1

转载 二叉树相关练习题

一、二叉树1、用递归方法实现二叉树的先序、中序、后序遍历class TreeToSequence {public:          void preOrder(TreeNode* root,vector<int> &pre) {         if (!root)             return;         pre.push_back(root->val)...

2018-03-31 09:56:41 250

转载 推荐算法的Python实现(样例代码)

基于ItemCF算法#!/usr/sbin/env python# -*- coding:utf-8 -*-import math# ItemCF算法def ItemSimilarity(train): C = dict() N = dict() for u,items in train.items(): for i in items.keys(...

2018-03-30 17:28:51 1174 2

原创 婚姻匹配算法

/*Copyright (c)2018, 东北大学软件学院学生 * All rightsreserved * 文件名称:a.cpp * 作 者:孔云 *问题描述:参考注释*/#include <iostream>#include <cstdlib>using namespace std;...

2018-03-30 10:04:32 3307

原创 字符串加密

/* Copyright (c)2018, 东北大学软件学院学生 * All rightsreserved * 文件名称:a.cpp * 作 者:孔云 *问题描述:输入字符串加密*/#include <iostream>using namespace std;int main(){ string str; c...

2018-03-14 20:47:17 224

转载 mysql常用命令整理

SQL执行一次INSERT INTO查询,插入多行记录 insert into test.person(number,name,birthday) values(5,'cxx5',now()),(6,'cxx6',now()),(7,'cxx7',now()); 1、说明:创建数据库 CREATE DATABASE database-name 2、说明:删除数据库 drop database db...

2018-03-08 10:31:35 198

转载 【HTTP】Fiddler(三)- Fiddler命令行和HTTP断点调试

一. Fiddler内置命令。上一节(使用Fiddler进行抓包分析)中,介绍到,在web session(与我们通常所说的session不是同一个概念,这里的每条HTTP请求都成为一个session)界面中可以看到Fiddler抓取的所有HTTP请求.而为了更加方便的管理所有的session, Fiddler提供了一系列内置的函数用于筛选和操作这些session(习惯命令行操作linux的童鞋应...

2018-03-07 12:27:24 135

转载 【HTTP】Fiddler(二) - 使用Fiddler做抓包分析

上文中已经介绍了Fiddler的原理和软件界面。本文主要针对Fiddler的抓包处理。Fiddler抓取HTTP请求。抓包是Fiddler的最基本的应用,以本博客为例,启动Fiddler之后,在浏览器中输入http://blog.csdn.net/ohmygirl 键入回车之后,在Fiddler的web session界面捕获到的HTTP请求如下图所示: 各字段的详细说明已经解释过,这里不再说明。...

2018-03-07 12:26:19 366

转载 【HTTP】Fiddler(一) - Fiddler简介

1.为什么是Fiddler?抓包工具有很多,小到最常用的web调试工具firebug,达到通用的强大的抓包工具wireshark.为什么使用fiddler?原因如下:a.Firebug虽然可以抓包,但是对于分析http请求的详细信息,不够强大。模拟http请求的功能也不够,且firebug常常是需要“无刷新修改”,如果刷新了页面,所有的修改都不会保存。b.Wireshark是通用的抓包工具,但是比...

2018-03-07 12:24:54 145

转载 HTTP协议基本了解

原文特点支持C/S(客户/服务器)模式简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST等等,每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。灵活:HTTP允许传输任意类型的数据对象,正在传输的类型由Content-Type加以标记无连接:无连接的含义是限制每次连接只处理一个请求。服...

2018-03-02 22:15:10 728

转载 堆优化的迪杰斯特拉算法 - 社交网络图中结点的“重要性”计算

这是一道来自PAT的算法与数据结构的练习题。原题链接:7-36 社交网络图中结点的“重要性”计算。借这道题讲讲堆优化的迪杰斯特拉算法怎么写。首先解读下题目,题目很长啊,不过有用的话就一句:结点v​i的“紧密度中心性”Cc(v​i​​)数学上定义为v​i到其余所有结点v​j(j≠i) 的最短距离d(v​i,v​j)的平均值的倒数。因此,这是个最短路问题,而且图中可能存在环。数据规模:点N<10...

2018-03-02 10:35:59 280

转载 复杂网络社区划分方法综述

摘 要:复杂网络在现实网络表现为多种形式,本文将从2002年以来经典社区划分方法入手,对复杂网络社区划分的研究现状进行一个综合简单的描述和概括,试图为社区划分研究描绘出一个较为全面和清晰的轮廓,为该领域的后续研究提供有益的参照。  关键词:复杂网络;社区划分;形式;综述   中图分类号:TU984.12 文献标识码:A 文章编号:1674-7712 (2014) 12-0000-02

2018-01-30 20:04:17 9331

原创 python:动态路由的Flask程序

# Copyright (c)2018, 东北大学软件学院学生 # All rightsreserved # 文件名称:a.py # 作 者:孔云 #问题描述:from flask import Flaskapp=Flask(__name__)@app.route('/')def index(): return 'Flask Web

2018-01-25 16:18:36 1875 1

原创 初识pyhton程序中路由和视图函数

# Copyright (c)2018, 东北大学软件学院学生 # All rightsreserved # 文件名称:a.py # 作 者:孔云 #问题描述:from flask import Flaskapp=Flask(__name__)@app.route('/')def index(): return 'Flask Web

2018-01-25 11:21:05 284

社交网络数据集

可以用于复杂网络学习,网络结构研究,如社团划分发现等

2018-05-04

推荐算法(MovieLens-RecSys-master)

项亮所著的《[推荐系统实践](https://book.douban.com/subject/10769749/)》一书是非常优秀的推荐系统入门书籍,但书中只描述了单步的计算如何实现,缺乏一个完整的示例来展示推荐系统从建立数据集到评估模型的整个过程,初学者学起来容易迷茫,因此我基于Movielens 1M数据集分别实现了User Based Collaborative Filtering(以下简称UserCF)和Item Based Collaborative Filtering(以下简称ItemCF)两个算法,包含“切分训练集与测试集-训练模型-推荐-评估”一整套流程,可以帮助初学者更快速地理解推荐系统中的协同过滤算法。 程序最终给出的是Precision、Recall、Coverage、Popularity四项衡量模型质量的指标,而具体的电影推荐结果并未保留,如果需要此部分数据可自行修改代码。

2018-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除