自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xin.wang的博客

努力奋斗,创造美好明天!

  • 博客(213)
  • 收藏
  • 关注

原创 利用反射简单模拟Spring的控制反转(Ioc)和依赖注入(DI)

利用反射简单模拟Spring的控制反转(Ioc)和依赖注入(DI)1.配置文件(.properties)中配置要扫描的包:#扫描page对象的包init.pageobj.Package = ec.qa.autotest.ui.admin.portal.pageobject,ec.qa.autotest.ui.common.action,ec.qa.autotest.ui.supplier.portal.pageobject2.代码实现:自定

2015-12-08 17:23:14 2315 1

原创 基于webdriver的web UI自动化测试框架(系统架构+测试脚本应用架构)

基于webdriver的web UI自动化测试框架(系统架构+测试脚本应用架构)自动化测试系统及应用架构

2015-12-08 16:32:10 13580 28

转载 java list中删除元素用remove()报错的fail-fast机制原理以及解决方案

原文:https://blog.csdn.net/lululove19870526/article/details/70808903java list中删除元素用remove()报错的fail-fast机制原理以及解决方案现在有一个list,有6个元素,值分别是1、5、5、8、5、10,现需要删除值为5的元素第一种import ja...

2019-04-29 15:27:59 1554

转载 更新数据时,是先删除缓存再更新DB,还是先更新DB再删除缓存?

当数据出现变化的时候,DB和redis的一致性就显得非常重要!结论:并发的情况下,主要是看场景,和代价,进行选择。目前有两种(基本思路)策略:1.先删除缓存再更新DB结论:产生脏数据的概率较大(若出现脏数据,则意味着再不更新的情况下,查询得到的数据均为旧的数据)比如:两个并发操作,一个是更新操作,另一个是查询操作,更新操作删除缓存后,查询操作没有命中缓存,先把老数据读出来后放到...

2019-04-15 18:04:43 6269

原创 NLP+条件随机场实现解析PRD文档输出测试用例

17年的一个质量团队的算法竞赛题目,要求每个质量团队(测试开发工程师团队)通过算法实现将 PRD文档解析成测试用例,经过大量咨询BU甚至集团的算法大神后,技术栈定格在了 NLP(自然语言处理)结合条件随机场(算法)来解析无图PRD(PRD有一定规则)通过在线算法模型输出测试用例,基本流程:1,要求PRD编写一个功能点一句自然语言(有且只有个一个规则);设计测试用例基本结构为 :P...

2019-03-07 14:25:36 1036 1

转载 关于BIO和NIO的理解

转自:https://www.cnblogs.com/zedosu/p/6666984.html摘要: 关于BIO和NIO的理解最近大概看了ZooKeeper和Mina的源码发现都是用Java NIO实现的,所以有必要搞清楚什么是NIO。下面是我结合网络资料自己总结的,为了节约时间图示随便画的,能达意就行。 简介:BIO:同步阻塞式IO,服务器实现模式为一个连接一个线程,即客户...

2019-02-27 15:57:25 2552

转载 B树在存储中的作用和优点

1.http://blog.csdn.net/ch18255112191/article/details/48246939 B树的增加删除节点的原理2.http://blog.csdn.net/xrymibz/article/details/72420607    机械硬盘的工作原理我们知道,机械硬盘耗费时间最多的地方在于寻道地址。在数据结构中,如果我们采用二叉树存数数据,那么频繁的增加和...

2018-12-03 14:36:27 2232

转载 微服务优点缺点

转自:https://blog.csdn.net/varyall/article/details/78905332微服务架构采用Scale Cube方法设计应用架构,将应用服务按功能拆分成一组相互协作的服务。每个服务负责一组特定、相关的功能。每个服务可以有自己独立的数据库,从而保证与其他服务解耦。 耦合是指两个或两个以上的体系或两种运动形式间通过相互作用而彼此影响以至联合起来的现象。...

2018-11-26 16:24:45 2831

转载 HashMap中是如何形成环形链表的

导读:经过前面的博客总结,可以知道的是,HashMap是有一个一维数组和一个链表组成,从而得知,在解决冲突问题时,hashmap选择的是链地址法。为什么HashMap会用一个数组这链表组成,当时给出的答案是从那几种解决冲突的算法中推论的,这里给出一个正面的理由:1,为什么用了一维数组:数组存储区间是连续的,占用内存严重,故空间复杂的很大。但数组的二分查找时间复杂度小,为O(1);数组的特点是:...

2018-11-09 12:21:35 903

转载 使用JMAP dump及分析dump文件

转自:https://www.cnblogs.com/0616--ataozhijia/p/4136312.html其中jmap是java自带的工具查看整个JVM内存状态 jmap -heap [pid]要注意的是在使用CMS GC 情况下,jmap -heap的执行有可能会导致JAVA 进程挂起查看JVM堆中对象详细占用情况jmap -histo [pid]导出整个JVM ...

2018-11-09 11:48:01 28100

转载 JVM性能调优

来源:https://www.cnblogs.com/csniper/p/5592593.html   一、JVM内存模型及垃圾收集算法 1.根据Java虚拟机规范,JVM将内存划分为:New(年轻代) Tenured(年老代) 永久代(Perm)  其中New和Tenured属于堆内存,堆内存会从JVM启动参数(-Xmx:3G)指定的内存中分配,Perm不属于堆内存,...

2018-10-26 14:17:26 180

转载 数据库事务的四大特性以及事务的隔离级别

本篇讲诉数据库中事务的四大特性(ACID),并且将会详细地说明事务的隔离级别。  如果一个数据库声称支持事务的操作,那么该数据库必须要具备以下四个特性:⑴ 原子性(Atomicity)  原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚,这和前面两篇博客介绍事务的功能是一样的概念,因此事务的操作如果成功就必须要完全应用到数据库,如果操作失败则不能对数据库有任何影响。⑵ 一...

2018-10-25 17:31:49 135

转载 Java机器学习库ML之六关于模型迭代训练的思考

我遇到的场景是:样本集有5000万条,接近5个G,那么这样的样本集一次导入训练,我放着一天一夜都没跑出结果,机器性能还特别好,是64位linux有128G内存。针对这样的情况,我想到的是两种思路:1)将样本集分割然后来迭代训练模型,这个对模型结果理论上是没有影响的,一次导入样本集训练,和多次导入样本多次训练同一个模型,最终模型结果应该是一致的;模型保存的针对训练集所训练出来的参数,如y=a...

2018-10-10 17:59:04 1278

转载 Opensearch架构及引擎原理

原文出自:https://blog.csdn.net/fxq8866/article/details/79648204   感谢!开放搜索(OpenSearch)是一款结构化数据搜索托管服务。特点:单应用亿级别文档搜索 ,毫秒级别查询延迟 ,万级别QPS数据的导入与查询导入:实时数据进入import子系统的数据导入模块,之后经过格式转换和数据解析进入到结构化存储系统,然后被impo...

2018-07-24 11:52:04 877

转载 ClassLoader工作机制

转自:https://www.cnblogs.com/xujian2014/p/5551153.html一、ClassLoader概念  ClassLoader是用来动态的加载class文件到虚拟机中,并转换成java.lang.class类的一个实例,每个这样的实例用来表示一个java类,我们可以根据Class的实例得到该类的信息,并通过实例的newInstance()方法创建出该类的一个对象,...

2018-06-25 15:27:00 371

转载 less入门教程

什么是LESSCSSLESSCSS是一种动态样式语言,属于CSS预处理语言的一种,它使用类似CSS的语法,为CSS的赋予了动态语言的特性,如变量、继承、运算、函数等,更方便CSS的编写和维护。LESSCSS可以在多种语言、环境中使用,包括浏览器端、桌面客户端、服务端。语言特性快速预览:变量:变量允许我们单独定义一系列通用的样式,然后在需要的时候去调用。所以在做全局样式调整的时候我们可能只需要修改几...

2018-05-17 15:00:03 1566

转载 Websocket原理及使用场景

WebSocket的使用场景社交聊天、弹幕、多玩家游戏、协同编辑、股票基金实时报价、体育实况更新、视频会议/聊天、基于位置的应用、在线教育、智能家居等需要高实时的场景由轮询到WebSocket1 轮询客户端和服务器之间会一直进行连接,每隔一段时间就询问一次。客户端会轮询,有没有新消息。这种方式连接数会很多,一个接受,一个发送。而且每次发送请求都会有Http的Header,会很耗流量,也会消耗CPU...

2018-04-15 17:07:04 1933

转载 javascript三种创建对象的方式

javascript是一种“基于prototype的面向对象语言“,与java有非常大的区别,无法通过类来创建对象。那么,既然是面象对象的,如何来创建对象呢?一、通过”字面量“方式创建。方法:将成员信息写到{}中,并赋值给一个变量,此时这个变量就是一个对象。例如: var person = (name:'dongjc', work:function() {console.log('write co...

2018-03-09 16:10:49 339

转载 浅谈ECMAScript和JavaScript的关系

1、ECMAScript是JavaScript的规格,JavaScript是ECMAScript的一种实现,在日常场合,这两个词是可以互换的。JavaScript的创造者Netscape公司,将JavaScript提交给国际标准化组织ECMA,希望这种语言能够成为国际标准,后来ECMA发布标准文件的第一版(ECMA-262),规定了浏览器脚本语言的标准,并将这种语言称为ECMAScript。该标准...

2018-02-28 11:48:09 1273 1

转载 用 Python 写爬虫时应该注意哪些坑

1. 添加user-agent,header。避免一开始就被屏蔽掉。推荐用urllib2,requests(最近才用这个,发现很好用)2. 编码用utf-8,本地存储的时候用codes.open 来保存中文字符3. lxml解析的速度要比beautifulsoup快的多4. 如果beautiful和lxml都不能抓到你想要的网页内容,就的用最原始的方法---正则表达式,所以玩爬虫,正则

2018-01-10 17:21:18 1480

转载 聂再清:人工智能是为了帮助人,而不是代替人

新华网北京11月29日电 以“跨界融合、协同创新”为主题的“2017中国机器人产业发展高峰论坛”今天上午在北京全国政协礼堂成功举行。本届论坛由工信部指导,新华网协同迪曼机器人共同举办,邀请众多专家学者及相关行业数百家企业参与,共同探讨智能机器人跨界融合新话题,共绘中国机器人发展新蓝图。    阿里人工智能实验室北京研发中心负责人聂再清博士在论坛上发表了主题演讲。以下为主要内容实录:   

2017-12-01 15:24:01 463

转载 前端安全之XSS攻击

前端安全之XSS攻击XSS(cross-site scripting跨域脚本攻击)攻击是最常见的Web攻击,其重点是“跨域”和“客户端执行”。有人将XSS攻击分为三种,分别是:1. Reflected XSS(基于反射的XSS攻击)2. Stored XSS(基于存储的XSS攻击)3. DOM-based or local XSS(基于DOM或本地的XSS攻击)

2017-11-10 17:53:50 280

转载 Redis与Memcached的区别

Redis与Memcached的区别传统MySQL+ Memcached架构遇到的问题  实际mysql是适合进行海量数据存储的,通过Memcached将热点数据加载到cache,加速访问,很多公司都曾经使用过这样的架构,但随着业务数据量的不断增加,和访问量的持续增长,我们遇到了很多问题:  1.MySQL需要不断进行拆库拆表,Memcached也需不断

2017-08-02 14:56:03 457

转载 数据归一化和两种常用的归一化方法

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:一、min-max标准化(Min-Max Normalization)也称为

2017-07-26 13:39:52 617

转载 MySQL DATE_SUB() 函数

定义和用法DATE_SUB() 函数从日期减去指定的时间间隔。语法DATE_SUB(date,INTERVAL expr type)date 参数是合法的日期表达式。expr 参数是您希望添加的时间间隔。type 参数可以是下列值:Type 值MICROSECONDSECONDMINUTE

2017-07-18 14:18:23 742

转载 感知机模型学习笔记及Python实现

最近刚接触李航博士的《统计学习方法》,还是挺赞的一本书,特别适合机器学习初学者的入门。里面主要阐述机器学习中的几大经典模型的理论方面,包括感知机、kNN、决策树、朴素贝叶斯、逻辑回归、SVM等。下面我结合自己的理解先介绍下感知机及其学习算法,然后通过Python实现这一模型并可视化处理。1. 感知机模型  感知机模型如下f(x)=sign(w⋅x+b)  其中, x

2017-06-21 11:17:20 2111

翻译 如何(高效)判断数据是否线性可分

很多机器学习分类算法,比如支持向量机(SVM),的介绍都说了假设数据要是线性可分。如果数据不是线性可分的,我们就必须要采用一些特殊的方法,比如SVM的核技巧把数据转换到更高的维度上,在那个高维空间数据更可能是线性可分的(Cover定理)。现在的问题是,如何判断数据是线性可分的?最简单的情况是数据向量是一维二维或者三维的,我们可以把图像画出来,直观上就能看出来。

2017-06-20 09:51:05 9448

转载 算法 - 隐马尔可夫模型

几个常用机器学习算法 - 隐马尔可夫模型1先引入一个知乎上看到的例子:假设你的手中有三个不同的骰子。 第一个是我们平常都能见到的骰子(称其为D6),6个面,每个面(1,2,3,4,5,6)出现的概率是1/6; 第二个有4个面(称其为D4),每个面(1,2,3,4)出现的概率是1/4; 第三个有8个面(称其为D8),每个面(1,2,3,4,5,6,7,8)出现的概

2017-06-16 15:56:08 821

转载 8个经过证实的方法:提高机器学习模型的准确率

8个经过证实的方法:提高机器学习模型的准确率摘要:本文分享了 8 个经过证实的方法。这些方法用来改善模型的预测表现。它们广为人知,但不一定要按照文中的顺序逐个使用。导语:提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改善。你会觉得无助和困

2017-06-16 14:10:07 2805

转载 什么是xss盲打

什么是xss盲打?        盲打只是一种惯称的说法,就是不知道后台不知道有没有xss存在的情况下,不顾一切的输入xss代码在留言啊,feedback啊之类的地方,尽可能多的尝试xss的语句与语句的存在方式,就叫盲打。       “xss盲打”是指在攻击者对数据提交后展现的后台未知的情况下,网站采用了攻击者插入了带真实攻击功能的xss攻击代码(通常是使用script标签引

2017-06-15 19:20:57 4834

转载 java获取System.out输出内容

ByteArrayOutputStream baoStream = new ByteArrayOutputStream(1024);PrintStream cacheStream = new PrintStream(baoStream);PrintStream oldStream = System.out;System.setOut(cacheStream);//不打印到控制台Sy

2017-06-01 13:27:41 5728

转载 【自然语言处理】句法分析 (syntactic parsing) 在 NLP 领域的应用是怎样的?

转自:https://zhuanlan.zhihu.com/p/26812190句法分析 (syntactic parsing) 在 NLP 领域的应用是怎样的?忆臻7 天前文章整理自郭江师兄问题回答(被收录于知乎编辑推荐)!已取得师兄授权!@jiangfeng原问题如下:opinion extraction system,i

2017-05-16 18:51:14 5407 1

转载 数据挖掘-推荐算法入门

寻找相似用户 1.曼哈顿距离:计算速度快,对于Facebook这样需要计算百万用户之间的相似度时就非常有利最简单的距离计算方式是曼哈顿距离。在二维模型中,每个人都可以用(x, y)的点来表示,这里我用下标来表示不同的人,(x1, y1)表示艾米,(x2, y2)表示那位神秘的X先生,那么他们之间的曼哈顿距离就是:我们就可以把结果最小(距离最近)的结果最推荐给

2017-05-15 15:28:36 675

转载 推荐算法之皮尔逊算法

皮尔逊公式前言在很多推荐算法的地方,涉及到了很多关于数学的公式,如果简单的应用这些公式,那当然较为的简单,当如果有真正的理解这些公式里面隐含着的道理那就要下一定的苦功夫。我们这里不从皮尔逊的公式讲起,我们从物物的推荐开始。问题这里以音乐的推荐为例子,对于音乐的推荐很多人都在做,比较好解释清楚。给你一首歌曲让你推荐10首相识的歌曲。推荐的数据来源是这样

2017-05-15 15:24:57 9464

原创 Chrome 插件开发遇到的一些坑

1、不通过Chrome Web Store直接安装Chrome插件(Extension)我们之前开发网摘Chrome插件时,不需要通过Chrome Web Store,直接在网站上提供网摘插件的链接,用户点击就可以安装。后来,Chrome改为必须通过Web Store才能安装插件。我们找到了一个Hack的方法,在Chrome Extensions窗口,直接将下载至本地的网摘插件文件

2017-05-10 10:32:15 4603

转载 浅析Docker架构、原理及实例配置演示

介绍 Docker是一个为开发人员和系统管理员开发、迁移和运行应用程序的平台。应用程序通过Docker打包成Docker Image后,可以实现统一的方式来下载、启动、扩展、删除和迁移,这样方便了应用程序的部署和运维。本文将介绍Docker的主要组件、系统架构和工作原理,并实例演示Docker的一些简单操作。 更多信息   

2017-04-27 14:24:00 466

转载 JAVA8 十大新特性详解

“Java is still not dead—and people are starting to figure that out.”本教程将用带注释的简单代码来描述新特性,你将看不到大片吓人的文字。一、接口的默认方法Java 8允许我们给接口添加一个非抽象的方法实现,只需要使用 default关键字即可,这个特征又叫做扩展方法,示例如下:复制代码代码如下:

2017-04-26 16:04:42 497

转载 JAVA8新特性下的接口和抽象类的异同

Java中,抽象类和接口有相似的地方。下面我们就来细说说接口和抽象类的异同。首先是相同的地方:1. 接口和抽象类都能定义方法和属性。2. 接口和抽象类都是看作是一种特殊的类。大部分的时候,定义的方法要子类来实现3. 抽象类和接口都可以不含有抽象方法。接口没有方法就可以作为一个标志。比如可序列化的接口Serializable,没有方法的接口称为空接口。没有抽象方法

2017-04-26 15:38:07 4024 3

转载 hbase 获取cell 中各个版本的数据

Hbase中的cell 是按版本来存储的,每个cell都有各种版本的数据,所以当update一个cell中的数据的时候,其实是网cell的末尾追加一个版本的数据,而update之前的数据依然是存在的,这和insert一个新的数据没有任何的区别,每个family都可以设置每个cell要保留的版本数量,默认是3,由VERSIONS决定。 当使用get或者scan命令查看数据时候,如果没有指定版本数

2017-04-24 16:35:01 9504 2

转载 那么问题来了:我们为什么要选择 Hbase?

Apache HBase是一个高性能、面向列、可伸缩的开源分布式NoSQL数据库,基于google三大论文中的《Bigtable:一个分布式的结构化数据存储系统》,它是Google Bigtable的开源实现。用户使用它能够在廉价的PC server上搭建大规模的结构化存储集群;因为Hbase是构建在hadoop之上,具有很好的横向扩展能力。此图来源于cloudera

2017-04-21 11:29:55 6371

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除