自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(69)
  • 资源 (2)
  • 收藏
  • 关注

原创 maven仓库操作手册

2020年9月19日 yangjingying(rose)搭建maven私人服务器背景回顾下maven的构建流程,如果没有私服,我们所需的所有jar包都需要通过maven的中央仓库或者第三方的maven仓库下载到本地,当一个公司或者一个团队所有人都重复的从maven仓库下载jar包,这样就加大了中央仓库的负载和浪费了外网的带宽,如果网速慢的话还会影响项目的进程。简介私服是在局域网的一种特殊的远程仓库,目的是代理远程仓库及部署第三方构件。有了私服之后,当 Maven 需要下载jar.

2020-10-27 14:50:22 435

原创 004 CLASSPATH环境属性

1.作用默认情况下,类都是从当所在的目录中进行加载的,如果要想改变加载的目录,就使用CLASSPATH。设置CLASSPATH:SET CLASSPATH=路径一旦设置之后,不管在哪个磁盘下,只要解释java程序都跑到同一个目录之中。但所有程序都跑到同一个目录下是不方便开发的,最好是在当前所在路径下加载类,那么就可以将CLASSPATH设置为:“.”。SET CLASSPATH=.即使此处没有设置CLASSPATH,它也是默认从当前所在路径之中加载类。在以后的开发之中,有可能在你安装一些程序

2020-10-27 14:47:08 292

转载 这是一份通俗易懂的知识图谱技术与应用指南

从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。 对于读者,我们不要求有任何AI相关的背景知识。目录: 概论 什么...

2019-12-13 16:13:44 493

原创 从零构建一个简单的知识图谱全过程

最近要用到知识图谱,听刘焕勇老师说知识图谱可以很简单也可以很复杂,看你想了解到什么程度,我想理解到写进毕设里能过就行。。。最近比较忙,有空更新。。。...

2019-12-11 23:00:57 2621

原创 web自动化测试第一天

文章目录1.认识自动化测试1.1 什么是自动化测试?1.2 了解为什么要进行自动化测试?1.3 掌握自动化测试的分类(*)1.4 web自动化测试的使用条件和场景1.5 自动化测试工具的优缺点1.6 自动化测试的前景和发展方向2.元素的定位2.1 为什么要学习定位元素?2.2 环境及工具2.3 css选择器2.4 xpath 路径表达式创建时间:2019.10.21预计完成时间:10分钟1...

2019-10-22 08:48:26 204

原创 Linux常用命令netstat

netstat列出系统上所有的网络套接字连接情况1. 列出所有连接netstat -a 列出所有连接Recv-Q,Send-Q指网络接收队列和发送队列2. 只列出 TCP 或 UDP 协议的连接netstat -at 列出 TCP 协议的连接 (同时显示了 IPv4 和 IPv6 的连接)netstat -au 列出 UDP 协议的连接 (同时显示了 IPv4 和 IPv6 ...

2019-10-13 11:14:22 341

原创 调度算法

文章目录1.调度的概念2.进程调度方式2.1 非剥夺调度式2.2 剥夺式调度方式3.调度的基本准则3.1 CPU利用率3.2 系统吞吐量3.3 周转时间3.4 等待时间3.5 响应时间4.调度算法4.1 调度的层次4.2 调度算法1 先来先服务调度(FCFS)2 短作业优先调度(SJF)3 优先级调度4 高响应比调度5 时间片轮转调度6 多级反馈队列调度算法(集合了前几种算法的优点)1.调度的概...

2019-10-04 09:50:30 519

原创 场景法

场景测试方法我们申请一个项目,需先提交审批单据,再由部门经理审批,审核通过后由总经理来最终审批,如果部门经理审核不通过,就直接退回。每个事件触发时的情景便形成了场景。而同一事件不同的触发顺序和处理结果形成事件流场景法:通过运用场景来对系统的功能点或业务流程进行描述,从而提高测试效果的一种方法。场景法一般包含基本流和备用流,从一个流程开始,通过描述经过的路径来确定的过程,经过遍历所有的基本流...

2019-09-27 19:13:11 320

原创 用等价类划分方法编写测试用例

完成一个页面的测试Step1、分析需求中包含多少个独立功能判断独立功能的标准:1.功能名是一个动词2.不可继续往下分割3.包含三要素:输入、处理、输出因此上图的网易邮箱注册界面有五个功能点:(1)输入邮箱地址(2)输入密码(3)输入确认密码(4)输入验证码(5)打√同意“服务条款”和“隐私权相关政策”Step2、分别针对每个独立...

2019-09-26 20:01:07 6040

原创 测试用例概述

1.测试流程2.测试用例的定义3.测试用例的目的4.测试用例的特性5.测试用例的编制要素6. 测试用例的设计原则1.测试流程需求分析--测试需求--测试计划--测试方案--测试用例--执行测试--测试报告2.测试用例的定义测试用例(Test Case)是为特定的目的而设计的一组测试输入、执行条件和预期的结果,以便测试某个程序路径或核实是否满足某个特定需求。...

2019-09-23 23:04:31 545

原创 Linux常用命令grep

所有的类linux系统都会提供一个名为grep(global regular expression print,全局正则表达式输出)的搜索工具。grep命令在对一个或多个文件的内容进行基于模式的搜索的情况下是非常有用的。模式可以是单个字符、多个字符、单个单词、或者是一个句子。当命令匹配到执行命令时指定的模式时,grep会将包含模式的一行输出,但是并不对原文件内容进行修改。例1 在文件...

2019-09-23 19:51:14 151

原创 Linux基础知识

1 操作系统2 操作系统分类2.1 桌面操作系统2.2 服务器操作系统2.3 嵌入式操作系统2.4 移动设备操作系统3 操作系统发展史4.1linux发行版本(也叫gnu/linux发行版)4.2常见的发行版本4.3 linux应用领域4.4 常用linux命令4.4.1 cd 切换文件夹(目录)4.4.2 pwd 查看当前目录,在倒数第一、第二切换...

2019-09-23 15:52:34 329

原创 python基础知识

1.list中添加新元素http://blog.sina.com.cn/s/blog_b2f983a50102yqzu.htmlappend(a)只能在末尾 添加insert(i,a)在指定位置添加extend(a,b)可以一次添加多个元素2.python3 list、tuple(元组)、str之间的相互转换list()方法是把字符串str或元组转成数组tuple()方法是把字符串...

2019-07-20 11:13:24 812

转载 什么是拓扑结构、拓扑结构图

什么是拓扑结构?  首先我们来解释一下拓扑的含义,所谓“拓扑”就是把实体抽象成与其大小、形状无关的“点”,而把连接实体的线路抽象成“线”,进而以图的形式来表示这些点与线之间关系的方法,其目的在于研究这些点、线之间的相连关系。表示点和线之间关系的图被称为拓扑结构图。拓扑结构与几何结构属于两个不同的数学概念。在几何结构中,  我们要考察的是点、线之间的位置关系,或者说几何结构强调的是点与线所构...

2019-06-29 09:35:15 1621

原创 图卷积网络知识汇总

1.图卷积网络知识汇总:https://mayi1996.top/2019/03/14/%E5%9B%BE%E7%BD%91%E7%BB%9C/2.图卷积网络到底怎么做,这是一份极简的Numpy实现:https://www.jiqizhixin.com/articles/2019-02-20-123.快速了解GCN:https://blog.csdn.net/u011537121/...

2019-06-16 11:19:08 363

原创 最全中文停用词表

本文将github上包括哈工大停用词、四川大学机器智能实验室停用词、百度停用词、中文停用https://github.com/goto456/stopwords以及最全中文停用词表(1893)https://blog.csdn.net/shijiebei2009/article/details/39696571进行整合得到新的中文停用词表,总共2462个为止纵然all例如[④e...

2019-06-13 19:19:17 34363 9

转载 写科技论文的诀窍

吴军:写科技论文的诀窍最近有位读者给我留言说:吴老师,我们定您的专栏大部分都是研究生,想请问您写论文的窍门?我猜想他现在面临研究生毕业写论文的难题了,因此把问题提出来。这个问题带有普遍性,因此我不妨把我的经验告诉大家。不过在讲怎么写论文之前,先要说两件事。首先是对这个留言本身作一个评论。这位读者找到了很多人的痛点,就是在书面表达中所遇到的困难。不过,我这个专栏的读者中,是否像他所说...

2019-06-10 09:26:35 213

转载 The Illustrated Transformer

The Illustrated TransformerDiscussions: Hacker News (65 points, 4 comments), Reddit r/MachineLearning (29 points, 3 comments)Translations: Chinese (Simplified), KoreanWatch: MIT’s Deep Learni...

2019-06-10 09:22:13 331 4

转载 详解Transformer

1.概述 在介绍Transformer模型之前,先来回顾Encoder-Decoder模型中的Attention。其实质上就是Encoder中隐层输出的加权和,公式如下:将Attention机制从Encoder-Decoder框架中抽出,进一步抽象化,其本质上如下图:以机器翻译为例,我们可以将图中的Key,Value看作是source中的数据,这里的Ke...

2019-05-20 17:28:12 668

转载 机器学习:期望风险、经验风险与结构风险之间的关系

在机器学习中,通常会遇到期望风险、经验风险和结构风险这三个概念,一直不知道这三个概念之间的具体区别和联系,今天来梳理一下:要区分这三个概念,首先要引入一个损失函数的概念。损失函数是期望风险、经验风险和结构风险的基础。损失函数是针对单个具体的样本而言的。表示的是模型预测的值与样本真实值之间的差距。比如对于某个样本<Xi,Yi>,其真实的值为Yi,而我们的模型选择决策函数为f,那么...

2019-05-17 09:40:29 278

转载 损失函数、目标函数、代价函数

链接:https://www.zhihu.com/question/52398145/answer/209358209首先给出结论:损失函数和代价函数是同一个东西,目标函数是一个与他们相关但更广的概念,对于目标函数来说在有约束条件下的最小化就是损失函数(loss function)。举个例子解释一下:(图片来自Andrew Ng Machine Learning公开课视频)上面...

2019-05-17 09:21:18 165

转载 交叉熵

一直以来对交叉熵懵懵懂懂,比如交叉熵是啥,能干啥,它为什么能这么做,之前也看了好多关于它的描述,还是迷糊,直到我看到了一篇知乎上的解答。链接:https://www.zhihu.com/question/65288314/answer/244557337通用的说,熵(Entropy)被用于描述一个系统中的不确定性(the uncertainty of a system)。在不同领域熵有不...

2019-05-16 22:49:44 3907

原创 用Tensorflow搭建神经网络

一、神经网络的基本框架1.层数(1)input layer 接受信息的神经层,负责传递信息(2)output layer 是信息在神经元中传递和中转,分析和权衡,输出结果,(3)hidden layer 负责信息的加工处理2.神经网络实质:梯度下降 Gradient DescentOptimation : Newton's method ,Least Squares ...

2019-04-04 14:49:05 2704

原创 调python代码遇到的问题

调python代码遇到的问题1.return _message.default_pool.AddSerializedFile(serialized_pb) TypeError: expected bytes, str found解决方法:serialized_pb = b'字符串内容' 或者"字符串".encode('utf-8')2.ModuleNotFoundError: No mo...

2019-04-04 14:46:04 3041 1

原创 对话系统评价指标Vector Extrema python代码实现

Vector Extrema另一种在句子级向量上计算相似度的方法是向量极值法。通过筛选词向量的每一维来选择整句话中极值最大的一维作为这个句子的向量表示: 公式中d代表词向量中的维度;是w的词向量中第d维。当然想要更准确的表达两个回复的相似度,仅计算向量极值是不够的,还需要...

2019-04-01 15:16:20 708 1

原创 对话系统评价指标Embedding Average python代码实现

Embedding Average向量均值法是通过句子中的词向量计算一个句子特征向量的方法,通过对句子中每一个词的向量求均值来计算句子的向量。这种方法在除对话系统之外的很多NLP领域内都应用过(例如计算文本相似度的任务),公式中表示句子r中所有词组的词向量均值: ...

2019-04-01 11:00:29 1994 4

原创 对话系统评价指标Greedy Match代码实现

Greedy Matching贪婪匹配方法是基于词级别的一种矩阵匹配方法,在给出的两个句子r和r^,每一个词w∈r都会经过词向量转换后变为词向量ew,同时与r^中的每一个词序列w^∈r^的词向量ew^最大程度进行余弦相似度匹配,最后得出的结果是所有词匹配之后的均值:首先要去glove官网https://nlp.stanford.edu/projects/glove/下载训练好的英...

2019-03-31 22:05:59 1351 5

原创 pycharm不以pytest方式运行,想要切换回普通模式运行的方法

有时候系统会以pytest的形式运行,如果不想以这种方式运行,换回普通模式,那么就点击画圈圈那里的白色三角行点击Edit configurations点击“-”出现如下图,点击python点击左上角的“+”,选择Python查找你所需要执行的文件所在的目录点击ok在Name那里写文件名点击右下角的o...

2019-03-03 21:16:48 13097 3

原创 学习tensorflow遇到的问题

1.tensorflow.python.framework.errors_impl.permissiondeniederror /path permission denied 问题的解决方式在Linux环境中运行python程序时可能会出现上述问题,解决问题的办法就是将你的路径改为绝对路径,例如:‘/path/to/MNIST_data/’改为:"/home/yangjy/path...

2019-03-03 15:39:34 13622 6

原创 Ubuntu下安装pytorch

1.环境:Ubuntu16.04, anaconda3,cuda92,在pytorch官网https://pytorch.org/找到跟你版本对应的命令:然后在终端输入命令:发现报出下面的错:解决办法是:可以先清空存储在当地已破损的包,这步不是必须的用命令: conda clean --packages --source-cache --i...

2019-03-03 15:17:26 3507

原创 SEQ2SEQ模型原理

这是我看过对经典的SEQ2SEQ模型原理和加入注意机制的SEQ2SEQ模型原理解释得最透彻的一个blog,英文写的,有生动的图片展示,让人理解起来更容易,而且附有tensorflow代码实现的链接,相信你看完都可以自己写个seq2seq程序了。附上博客链接:https://jalammar.github.io/visualizing-neural-machine-translation-mec...

2019-01-29 15:24:02 204

原创 tf.app.flags

网上已经给出很多怎么使用和设置参数,怎么输出参量和值,看下面链接应该很容易就懂https://blog.csdn.net/lyc_yongcai/article/details/73456960#commentBox可是一次遍历FLAGS中所有的参量和值的网上给的说法却很少,有的话就是用字典的形式一次性输出FLAGS中所有的key和value,不用每个变量都单独print出来,看链接htt...

2019-01-11 17:18:56 243 1

原创 论文中整理的零碎知识点

1.熵信息熵:量化信息,小概率事件但信息量大比如月食,大概率事件信息量小比如太阳每天都从东方升起,所以采取在概率p前加一个log,再添负号,就满足前面的要求了,而这是针对单个个体,对-logp求期望Ex~p(-logp)是描述总体的信息量。维基百科的解释:在信息论中,熵(英语:entropy)是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量。这里,“消息”代表...

2019-01-10 15:54:46 808

原创 python基础知识二

1.python中的三个读read(),readline()和readlines()我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整...

2019-01-10 15:53:22 575

转载 python的lambda

lambda是Python编程语言中使用频率较高的一个关键字。那么,什么是lambda?它有哪些用法?这里,我们通过阅读各方资料,总结了关于Python中的lambda的“一个语法,三个特性,四个用法,一个争论”。 一个语法在Python中,lambda的语法是唯一的。其形式如下: lambda argument_list: expression其中,lambda是Pyth...

2019-01-10 15:52:14 105

原创 python基础知识一

1.list中添加新元素 http://blog.sina.com.cn/s/blog_b2f983a50102yqzu.htmlappend(a)只能在末尾 添加insert(i,a)在指定位置添加extend(a,b)可以一次添加多个元素 2.python3 list、tuple(元组)、str之间的相互转换list()方法是把字符串str或元组转成数组tuple(...

2019-01-10 15:50:39 721

原创 anaconda prompt 切换python 版本

1.在anaconda prompt 切换python 版本默认3.6activate py2.7 切换 2deactive 切回默认 2.安装包 直接在prompt 输入 3.找不到解释器,要在相应的安装包所在的anaconda文件夹下找  4....

2019-01-10 15:49:31 4366

原创 关于使用gpu跑程序的问题

针对Python3.6的本人之前一直使用cpu版本的tensorflow,发现神经网络程序运行很慢,于是开始下载gpu版本的tensorflow。查看usr/local/发现有一个cuda-8.0,cuda-9.0文件夹,Ubuntu环境下已经安装好cuda的环境,所以直接下载tensorflow-gpu。本人下载的是1.4.0版本的与cpu版本的一样,但是运行程序报错了,大概说的是我强行...

2019-01-10 15:39:22 5260 2

原创 如何通俗理解BLEU

1.以下是原文的链接https://www.aclweb.org/anthology/P02-1040.pdf2.下面这个是我从网上发现比较能够容易理解的说法https://blog.csdn.net/wwj_748/article/details/796860423.bleu不止可以用来做机器翻译的评估指标,还可以用在语言模型,自动摘要等。https://cloud.tenc...

2018-12-18 15:27:31 415

原创 安装MongoDB

1. 去官网直接下载最新版的mongodbhttps://www.mongodb.com/download-center/community下载zip,不要下载msi的,那样安装快一点2. 在跟bin目录同级的目录创建data文件夹,data下面继续创建db文件用来存储数据3. 在系统变量的path添加monggodb的bin路径4.在cmd或powershell输入mongo...

2018-11-13 14:45:34 87

数据分析师练手的企业数据

笔者提供的数据是一位数据分析师工作上处理的真实数据,对于数据分析师入门来说是非常好的练习题材,可以用来练习excel和vba

2018-08-23

机器学习实战源代码python3

涵盖机器学习主要算法的实战代码,每个算法都有具体项目和全部源码。

2018-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除