自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Po Rui的专栏

机器学习,实时搜索

  • 博客(76)
  • 资源 (12)
  • 收藏
  • 关注

原创 开源大模型发展汇总

经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。MOSS 是一个支持中英双语和多种插件的开源对话语言模型, moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100/A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。自训练模型的初衷起源于,上面3个问题。

2023-07-14 14:51:24 1161 1

原创 读书记录(三)

2022:《启示录2-打造优秀的产品团队》 Marty Cagan,Chris Jones 著, 蒋楠 译一本介绍产品的书,听同事说不错,借来看看。内容上无太多收获,偏“术”层面,介绍了一些实现好产品的团队该有的特征,以及通过一些成名产品主管的献身说法来做例证产品经理应该具备的5个知识:用户和客户知识 数据知识 行业和领域知识 业务和公司知识 产品运营知识产品经理应该具备的4个流程方法:产品探索方法 产品优化方法 产品交付方法 产品开发流程提出了一个亚马逊产品实践方

2022-03-02 15:00:52 372

原创 设计模式-- 依赖倒置DIP(例解-从编码到服务级解耦)

原定义:高层模块不应该依赖低层模块,两者都应该依赖其抽象;抽象不应该依赖细节,细节应该依赖抽象(High level modules shouldnot depend upon low level modules.Both should depend upon abstractions.Abstractions should not depend upon details. Details should depend upon abstractions)其核心思想是:要面向接口编程(IOP),而不是面向

2021-10-26 17:16:46 458

原创 技术详设文档化的重要性

优秀详设能达到的效果让不了解这个项目的人通过文档能完整的了解整个事件(项目),包括:项目的前因后果(问题域);准备怎么做,为了表述清楚怎么做,通常按技术相关维度度展开(解决方案域);配套我们的解决方案,可能会存在什么样的风险。详设的现实意义1.为了我们自己详设要求我们做之前是想清楚了的,这里的清楚包括:a. 问题空间(需求)想清楚。从用户、产品角度去想,想的比产品多,才有能力拒绝需求(拒绝需求也是一种能力)。觉得产品提的就这样,出了问题也不管我的事?no, no, no, 关老大的事了,

2021-10-25 22:12:53 585

转载 【架构案例-依赖倒置】循环依赖解耦

一、循环依赖有哪些首先我们要讲清楚什么是循环依赖,以及循环依赖的在程序设计层面、软件产品设计层面、顶层架构设计层面上可能出现的场景。从概念模型上讲,只要两个或多个元素产生相互依赖关系,就可以看成产生了循环依赖:上图是两个依赖关系正确的示例:A元素正常工作依赖于B元素的正常工作,或者A元素的正常工作依赖于B、C、D元素的正常工作。这里的A、B、C、D四个元素可以指代四段代码,也可以指代一个业务系统中四个功能模块,还可以指代顶层架构设计中的4个独立工作的业务系统。循环依赖在逻辑层面上是一个有

2021-10-20 20:49:49 997

原创 DDD如何设计落地?(库存,产品账示例)

一.背景本文预算管控服务建设作为一个DDD设计的例子介绍,目标是是呈现一次DDD设计的过程,为了减少绘图和描述的工作量,文中会对预算管控业务需求和功能做简化。请重点关注设计的流程,这是我们想传达的重点,忽略设计细节的合理性。另外,对于预算管控服务来讲,不一定要用DDD来进行分析设计,基于传统的数据驱动就完全可以满足需求,但作为介绍DDD实施过程,预算管控是一个不错的例子(不需要画太多的图)。在这里我们不讨论什么类型项目合适DDD,可以参考:大致的共识为复杂度高的业务适合DDD。而复杂...

2021-06-12 22:20:26 23232 10

原创 微服务设计模式(系列)-分布式事务(Saga模式)

这里写自定义目录标题SagaSaga每个Saga由一系列sub-transaction Ti 组成每个Ti 都有对应的补偿动作Ci,补偿动作用于撤销Ti造成的结果可以看到,和TCC相比,Saga没有“预留”动作,它的Ti就是直接提交到库。Saga可能的行为T1, T2, T3, …, TnT1, T2, …, Tj, Cj,…, C2, C1,其中0 < j < nSaga的 恢复策略backward recovery,向后恢复,补偿所有已完成的事务,如果任一子事务失败

2020-05-26 12:08:48 1008

翻译 微服务设计模式(系列)-微服务拆分

软件模式-微服务拆分:按业务能力分解微服务场景基于业务分解的原则场景如果你正准备将你的单体架构(Monolithic architecture)应用改造为微服务架构,并希望使用微服务架构将应用程序构造为一组松耦合的服务。那么第一个要面对的问题就是如何进行服务的拆分。上图展示了微服务的架构优势,主要包括两方面:简化测试并允许独立部署将工程组织结构化为一组小型(6-10名成员)的自治团队,每个团队负责一个或多个服务这些好处不会自动得到保证。相反,它们只能通过合理的服务分解为实现。服务必须足够

2020-05-25 19:49:37 482

原创 技术管理哪些事(三)落实“以人为本”的管理

许多思想和理念都是耳熟能详的,说起来人人都能理解和认同。但往往这些“简单的事”,能做好的却很少。所以说,知易行难。本次就想从执行的角度谈谈。为什么“以人为本”的思想重要人力资本论认为:人力资源是一切资源中最主要的资源 在经济增长中,人力资源作用大于物资资本作用 人力资本的核心是提高人口质量,教育投资是人力投资的主要部分同时,知识型工作在我们日常工作中的占比越来越大,而考虑到知识型...

2019-08-13 20:21:39 339

原创 技术管理那些事(二)“人剑合一”的团队

离上次整理过去大半年了,今天重拾笔记。上次谈了对于“管理的进阶”的看法,这次谈谈团队的状态。什么是“人剑合一”作为团队的管理者(TL),需要带领整个团队,是选择目标、指引方向的 “人”,而整个团队就像管理者手中的“剑”。挥剑的过程,就是管理者调动团队去完成一个目标的过程,而团队行动的响应力、执行结果的好坏就是衡量团队管理质量的标杆。在这个过程中,无疑,目标的选择、管理、甚至“包装”,对团队...

2019-08-10 19:37:29 572

原创 技术管理那些事(一)管理的进阶

算是阶段性总结记录一下个人对于技术团队管理的一点思考。在此之前我所涉及团队管理相关的工作场景还不算单一,所以这里是对多种场景的一些汇总思考。团队管理能力与专业技能是两条平行的技能线。作为过来人,相信大家都很重视自己的专业技能提高,但当角色转变为TL后,我们对于管理技能的重视程度又如何?就我观察到的而言,大多数是将其放在次要位置的。不管是因为重视程度不够,还是缺少指导,我认为这是国内普遍的现象(...

2018-12-02 21:44:13 3091

翻译 From URL to Interactive(四)---从var到及时编译(Var to JIT)

这是《From URL to Interactive》系列文章的第一篇《Server to Client》。《From URL to Interactive》是个引子就不译了,文章主要基于windows自带的浏览器Eage为基础介绍现代浏览器对HTML从请求、链接、加载、解析、渲染、交互的过程。分阶段介绍:From URL to Interactive(一)---从服务器到客户端(Server...

2018-12-01 15:04:01 305

翻译 From URL to Interactive(三)---从大括号到像素(Braces to Pixels)

这是《From URL to Interactive》系列文章的第一篇《Server to Client》。《From URL to Interactive》是个引子就不译了,文章主要基于windows自带的浏览器Eage为基础介绍现代浏览器对HTML从请求、链接、加载、解析、渲染、交互的过程。分阶段介绍:From URL to Interactive(一)---从服务器到客户端(Server...

2018-11-29 21:24:15 610

翻译 From URL to Interactive(二)---从标签到DOM(Tags to DOM)

这是《From URL to Interactive》系列文章的第一篇《Server to Client》。《From URL to Interactive》是个引子就不译了,文章主要基于windows自带的浏览器Eage为基础介绍现代浏览器对HTML从请求、链接、加载、解析、渲染、交互的过程。分阶段介绍:From URL to Interactive(一)---从服务器到客户端(Server...

2018-11-19 19:42:11 339

翻译 From URL to Interactive(一)---服务器到客户端(Server to Client)

最近想比较系统的关注一下国外的技术博客。顺带将一些文章翻译下。这是《From URL to Interactive》系列文章的第一篇《Server to Client》。《From URL to Interactive》是个引子就不译了,文章主要基于windows自带的浏览器Eage为基础介绍现代浏览器对HTML从请求、链接、加载、解析、渲染、交互的过程。分阶段介绍:From URL to...

2018-11-18 22:48:47 388

原创 读书记录(二)

2018《终极智能》阿米尔-侯赛因 赛迪研究院专家组 译对《未来简史》有些相似的类容,大多是初级介绍,科普性概述,和个人观点的陈述。之前我对于人工智能还是很担忧的,是属于禁止派的,看完后有所改变。确实人类无法阻止智能的进步,总有机构或个人会私下做相应的研究,与其让小部分人躲在角落偷偷研究而不被外界知道,还不如让所有人都产于,让整个产业更透明化。另外一个有意思的观点是认为,整个人类社会...

2018-10-28 20:46:05 586

原创 web 动态随机验证码图片生成【最新】

随机图片校验码验证码生产包,用于生产动态图片校验码,验证码图片生成

2016-10-18 15:34:38 3222 2

原创 Jenkins tomcat自动部署脚本

强制关闭tomcat进程,并拷贝包并重新启动tomcat: export JAVA_HOME=/yougo/java echo ‘尝试关闭tomcat…’ sh bin/shutdown.sh; tom_pid=ps -ef|grep group-new|grep -v grep| awk '{print $2}' #如果tom_pid长度不为零 not-zero

2016-09-13 12:35:59 3757

原创 jenkins+git+ maven 配置注意事项(坑)

jenkins+git+ maven 配置注意事项最近需要配置一套jenkins环境,将手上的一个项目整合。配置过程中遇到一些坑,以前也遇到过但没有记录下来,现在想不起具体原因,所以又把所以的坑踩了一遍花了大概半天时间。这次准备把问题点都记录一下。以下描述可能不完全准确,因为有些部分是我的猜测,并未深入确认,仅作为解决问题的实际方案描述。全局配置项(Global Tool Configuration

2016-09-13 12:26:23 3196

转载 塞缪尔《青春》

YOUTH[1] Samuel UllmanYouth is not a time of life; it is a state of mind; it is not a matter ofrosy cheeks, red lips and supple knees; it is a matter of the will, aquality of the imagi

2014-09-10 17:54:18 1205

转载 交互设计工具现状[1]

原文:https://medium.com/@pasql/the-state-of-interaction-design-tools-f755c6515368The state of Interaction Design toolsThe current state of tools is decent, but how they fit together is less than

2014-06-26 20:27:18 1036

原创 类加载器泄露(tomcat ) 文章收集

专家访谈:Tomcat 7的内存泄漏保护http://developer.51cto.com/art/201006/204956.htm

2014-04-14 11:29:51 812

原创 什么事SVM中的VC维

年 9 月 23 日在机器学习里我们常常看到这样的说法:一般而言,VC维越大, 学习能力就越强,学习也越复杂;可以通过VC维计算学习风险的上界。但进一步对VC维的介绍却不多,例如,VC维是什么?如何计算VC维?等根据百度百科:VC维(Vapnik-Chervonenkis Dimension)的概念是为了研究学习过程一致收敛的速度和推广性,由统计学理论定义的有关函数集学习...

2013-09-23 20:45:35 3325

翻译 Hash 函数的现状,2012

看到一篇介绍hash的文章不错,所以翻译了一下。原文:http://blog.reverberate.org/2012/01/state-of-hash-functions-2012.html经典的非加密hash函数在最近几年取得了迅速的发展,最近搜索相关信息,高兴的发现又有前沿的hash函数发布了,虽然离上一次看到新hash函数的时间才半年或一年。非加密hash函数以一个

2013-09-22 19:54:43 2177

转载 数据分析与挖掘的企业应用路在何方(谈分水岭)

-----------前言---------近期有不少朋友感言数据分析和挖掘应用的商业价值问题,一是说数据分析和挖掘在企业,如果只有知识发现,知识应用没有搞起来,企业还是没有体会到数据的价值;二是说数据分析和挖掘,是否看在多么牛的互联网巨头工作的背景,还是要有扎实的数据变现能力? 第一个问题,还得从第三方数据分析服务,与企业内部数据分析分开来说,否则没有意义。第二个问题,就

2013-09-02 19:24:05 1282

原创 读书记录(一)

由于文章太长,现分贴记录突然发现记录下自己曾经读过的书, 也是很有意义的事, 也许某天会惊讶于这张list。如果你无意间也看到这篇文章,也请你也记下自己的成长历程吧。更早:《编译器和链接器》《Effective C++》《More Effective C++》《Essential c++》《 Effective STL》《C++ Template》《Inside...

2013-08-23 14:26:17 1718

原创 [代码] 如何处理添加和删除文档请求

who got updateRequest first?the answer is SolrDispatchFilter. let's look a graph first:1.  .doFilter receive any update request first.  doFilter will choice a right core for this request.

2013-07-05 21:04:11 1267

原创 [代码]solrcloud中 SolrCore 初始化

SolrCore init   The main procedure list as above.1. initListeners() : the listeners is defined in the solrconfig.xml. for defaute there are tow seaerch listeners:listener

2013-07-05 20:59:20 2014

原创 [代码] solrcloud/solr4.0的启动步骤

This page show the major procedures in the progress of Solr4.0  startup  SolrDispatchFilter.init(FilterConfig config) init the CoreContainer firstly.   public void init(FilterCon

2013-07-05 20:53:52 1497

原创 SolrCloud Transaction Log 是如何工作的?

本内容由我的同事Hans Tan 提供,在此感谢Hans 分享如下内容WHY TRANSACTION LOG?A transaction log records all operations performed on an Index between two hard commitsEach hard commit starts a new transaction log be

2013-07-05 20:47:38 2118

原创 SolrCloud Capability Test

solrcloud 测试的一些中间产物。原记录在内部wiki上,现share出来environment|                SolrCloud servers:  X.X.X.251, X.X.X.252, X.X.X.253.     each with Mem:16G CPU:8 core 2.57GHz;                zook

2013-07-05 20:37:10 1498

原创 SolrCloud Performance 测试(query-fetch)

由wiki粘过来,稍微改了下格式。还是有点乱,将就看看,主要看数据Base on the the SolrCloud Performance Test. and ElasticSearch Performance Test, we see that the search performance of solrcloud is not as good as we expected com

2013-07-05 17:37:00 1539

原创 Solr4.0(SolrCloud) & ElasticSearch(ES) 比较(三):查询方式(query_then_fetch)

this article provide by my co-worker Miles LiElasticSearch VS Solr in searching1 Solr is slower than ElasticSearch in searching through testing. We try to find root cause.  The following

2013-07-05 17:16:12 3519 1

原创 各种开源搜索引擎

C/C++语言: Zettair、lucy、XMLSearch、Omega、Xapian(支持多语言)、Swish++、 Swish—E、SphinxJava:Lucene(相关项目支持多语言)、solr、elasticsearch、Katta 、MG4J(Managing Gigabytes for Java)、Egothor、OpenSearchServer、HSearch、campa

2013-07-04 17:50:01 3604 1

原创 SolrCloud Architecture 架构

本文图片由我的同事  邓晓涛整理,再此感谢他为大家提供了solrcloud的一个overhead picture

2013-07-01 16:04:40 1995

原创 请在 64位 系统上使用 lucene MMapDirectory

本文引用自 http://blog.thetaphi.de/2012/07/use-lucenes-mmapdirectory-on-64bit.html文章从如下几个方面介绍了为什么我们需要使用 MMapDirectory来管理索引文件1. 什么是虚拟内存及其工作原理2. 为什么RAMDirectory or NIOFSDirectory 不是索引管理的最佳选择3

2013-07-01 15:12:48 2474

原创 Solrcloud/solr4.0/solr4.2/solr4.3/solr4.x (实时搜索)NRT及commit 相关问题

http://www.tnove.com/?p=331    本文主要介绍solr4.0 之后使用NRT的方法和需要的配置,同时介绍下commit相关的一些命令的使用效果NRT 1     为了使用NRT ,我们需要配置solrconfig.xml。其中两个地方需要修改     a.   600000 false        这里需要将hard

2013-06-28 14:55:39 3029

原创 Eclipse + Tomcat7.0(jsvc) 进行远程debug

http://www.tnove.com/?p=313背景:     最近需要对一个分布式项目进行debug,在本地部署分布式环境始终还是不够理想。所以决定使用remote debug功能。      开发环境:eclipse       应用部署环境为:jdk7.0 、tomcat7.0 使用jsvc启动(特殊需要,本应用必须使用jsvc)操作:

2013-04-23 19:45:31 2439

原创 数据挖掘:Top 10 Algorithms in Data Mining(七)AdaBoost

Adaboost 是boosting算法的变形,全称为adaptive boosting(自适应增强)。该方法主要是通过多个弱分类器的集合来使得分类误差达到足够小。理论上通过adaboost方法可以使得分类误差为0。但我们知道通常情况下训练分类器误差为0时会过拟合。       关于boosting算法参考《Boosting Foundations and Algorithms》以及wik

2013-03-03 13:06:41 1561

原创 数据挖掘:Top 10 Algorithms in Data Mining(六)PageRank

Pagerank因google的快熟发展并提供高质量搜索结果而受到广泛关注。Pagerank的主要目标是评价网页的重要程度,并以此作为网页的排名依据。算法主要参考网页被引用的数量,及引用者的权威性。参考下面的简单的网页引用模型: 首先我们需要一个合适的数据结构来表示这个网络结构。这涉及到图的表示,我们在数据结构课程中学过,常用的方法是邻接矩阵法和链接法。实际中不会单独的只使用某一种

2013-03-03 12:59:36 1517

2020最新Scrum官方培训PPT(Mick-Cohn).ppt

scrum官方ppt,scrum master培训使用材料。中文翻译版。由敏捷联盟发起人Mike Cohn 提供

2020-09-14

序列化测试-java

对几个序列化器的简单对比代码。主要是jdk自带序列化器,kryo,fastjson

2019-02-24

人工智能实验 C++ 蚁群算法/遗传算法解背包问题

人工只能实验 c++ 蚁群算法 遗传算法 解 背包问题

2010-05-26

bmp 求直方图 MFC

bmp 求直方图 MFC bmp显示等

2010-05-26

jpeg jpg解码 C++

jpeg jpg 解码 C++源码 主程序只有1个cpp文件,非常简结

2010-05-26

K-mean算法 C++ 源码

一个简单的C++实现的k-mean算法实现

2010-05-26

OpenGL 库(包括辅助库)

opengl完整库包括 gl.h, glu.h, glaux.h, glut.h,opengl.h, glu32.lib, glaux.lib, opengl32.lib,glu32.dll, glaux.dll, opengl32.dll

2010-05-26

Exceptional+C++(中文版)[1].侯捷.pdf

侯捷翻译,pdf格式,C++、c程序员必看数之一

2009-04-08

图形图像文件格式大全(PDF)

图形图像的格式讲解。包括矢量和非矢量图像,图像学编程

2009-04-08

《高质量C++编程》

《高质量C++编程》是一本对程序员非常有用的书,不关是初级,还是高级的,如果你不知道其中的规则,那只能说明你不是一个好程序员

2008-11-13

一个Sinifer源码

是一个和sinifer一样的数据包抓包和嗅探程序,控制台的 思路清晰,方法简单

2008-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除