自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(22)
  • 资源 (7)
  • 问答 (1)
  • 收藏
  • 关注

原创 推荐系统算法架构

本文介绍了推荐系统算法架构的四个阶段:召回、粗排、精排和重排。每个阶段都有不同的模型和优化目标,以提供个性化服务。召回阶段利用用户或物品的特征或行为数据来筛选候选物品;粗排阶段利用用户或物品的特征或行为数据来构造排序特征并优化排序模型;精排阶段利用用户或物品的特征或行为数据以及多媒体数据如图片、视频、音频等来构建更丰富和更复杂的排序模型;重排阶段利用用户或物品的特征或行为数据以及业务逻辑或策略来定义规则或奖励函数并更新排序结果。

2023-03-17 14:49:15 338 1

转载 企业邮箱被反垃圾邮件联盟封了的方法

企业邮箱被反垃圾邮件联盟封了的方法当邮件发送方服务器的IP被国际反垃圾邮件组织屏蔽后解除封锁的步骤首先要做的事:1、所做测试均在问题服务器上进行。2、确认问题服务器的IP(或整个IP段)不在SBL、RBL、CBL中     关于国际黑名单查询,您可以在这里:http://www.dnsstuff.com/tools/ip4r.ch?ip=(您的IP)  或http://

2015-08-29 10:58:28 4328

原创 urllib.error.URLError urlopen error unknown url type: https

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-08-28 04:42:44 5385

原创 终于完成搬家,可以自娱自乐到底

<br /> 虽然wordpress的后台控制很丰富,实在忍受不了国内的访问速度。正好解决了micolog导入的问题,终于把这儿的文档全部更显到了google上,新的地址 http://ad-research.appspot.com。以后主要在这儿更新了。<br /><br />再也不用忍受 CSDN上的广告!<br />再也不用忍受龟速的wordpress!<br />百度空间,QQ空间也都是浮云……<br />我真正可以自娱自乐了

2010-11-04 16:23:00 813

原创 GAE部署时urllib2.py错误解决办法

<br />Google App Engine Launcher出问题,点击 Deploy 后却发现不能正常工作啦,囧啊,报的错误如下:<br /> 2010-06-16 16:32:27,427 ERROR appcfg.py:1568 An unexpected error occurred. Aborting. <br />Traceback (most recent call last):<br />  File "C:/Program Files/Google/google_appengine/g

2010-10-24 23:43:00 1843

原创 Kappa Statistic

<br />Kappa statistic 这个指标用于评判分类器的分类结果与随机分类的差异度。(Kappa is a measure of agreement normalized for chance agreement.)         P(A) - P(E)<br />> K = -----------<br />>       1 - P(E)> Where P(A) is the percentage agreement (e.g., between your classifier and<b

2010-10-24 01:52:00 3605

原创 Hashtable和HashMap

Hashtable是Dictionary的子类,HashMap是Map接口的一个实现类。 自 Java 2 平台 v1.2 以来,Hashtable类已经改进为可以实现 Map,因此它变成了 Java Collections Framework 的一部分。与新集合的实现不同,Hashtable 是同步的。由迭代器返回的 Iterator 和由所有 Hashtable 的“collection 视图方法”返回的 Collection 的 listIterator 方法都是快速失败 的:在创建 Iterat

2010-10-22 10:37:00 967

原创 Ubuntu 下 Eclipse 不能启动

发现启动不了, /usr/lib/eclipse下修改eclipse.ini,发现没有 xjzhou:eclipse$ cat eclipse.ini 如下所示 -startup plugins/org.eclipse.equinox.launcher_1.0.201.R35x_v20090715.jar --launcher.library plugins/org.eclipse.equinox.launcher.gtk.linux.x86_1.0.200.v20090520

2010-10-22 10:35:00 2736

原创 Linux - Awk 用法

<br /><br />0.Awk 有三个不同的版本awk,nawk 和gawk,未作特别说明,一般指gawk。<br />1.Awk语言的最基本功能是在文件或字符串中基于指定的规则来分解抽取信息,也可以基于指定的规则来输出数据。完整的awk脚本通常用来格式化文本文件中的信息。<br />2.三种方式调用awk<br />1)  awk [option] ‘awk_script’ input_file1 [input_file2…]<br />awk的常用选项option有:<br />-F fs:使用fs

2010-10-21 15:28:00 1613

原创 Linux - Grep 命令

<br />grep时使用最广泛的命令之一,用来对文本文件内荣按行进行模式匹配查找。啊如果找到匹配模式的行,grep将打印包含模式的行。<br />Grep有三种变形:Grep:标准grep命令主要讨论此格式。Egrep:扩展grep,支持基本及扩展的正则表达式Fgrep:快速grep,允许查找字符串而不是一个模式。这里的快速并不是速度快<br />Grep的用法<br />1)      grep Usage: grep [OPTION] regular_expressions [filename1 …]

2010-10-21 15:11:00 1763

原创 Numerical Example of K-Means Clustering

The basic step of k-means clustering is simple. In the beginning we determine number of cluster K and we assume the centroid or center of these clusters. We can take any random objects as the initial centroids or the first K objects in sequence can also se

2010-10-20 15:57:00 817

原创 Euclidean distance vs Pearson correlation vs cosine similarity?

Pearson correlation and cosine similarity are invariant to scaling, i.e. multiplying all elements by a nonzero constant. Pearson correlation is also invariant to adding any constant to all elements. For example, if you have two vectors X1 and X2, and your

2010-10-20 15:17:00 1641

原创 IE9 常用快捷方式

IE9 Beta2试用了下,确实感觉速度超过firefox,尤其讨厌firefox第一次启动的时候真是慢。顺便记录下几个快捷键,唯一遗憾的是没有 VimperatorCtrl+L/Alt+D 直接将光标转到地址栏Ctrl+E 指定地址栏进行搜索,或者问号和空格Ctrl+S 网页另存Ctrl+W 关闭当前标签页Ctrl+T  打开一个新的标签页

2010-10-20 10:36:00 1033 1

原创 去掉PHP的一些警告

<br />因为删除了mysql,发现会引起很多警告,如下<br />PHP Warning:  PHP Startup: Unable to load dynamic library '/usr/lib/php5/20090626+lfs/gd.so' - /usr/lib/php5/20090626+lfs/gd.so: cannot open shared object file: No such file or directory in Unknown on line 0<br />PHP Warn

2010-10-19 21:23:00 2834

原创 常用的Java功能代码

1、String 和 int 互转 //integer to numeric string   String a = String.valueOf(2); //string to an int  int i = Integer.parseInt(a); //numeric 2、在Java中将Array转换成Map 1: import java.util.Map; 2: import org.apache

2010-10-17 22:33:00 715

原创 string的隐式转换,以及sizeof, strlen

问题来源:http://cxwangyi.blogspot.com/2010/05/hadoop-pipes-is-incompatible-with.html 关键部分截取如下: In your mapper you have the line:       context.emit("", "apple/norange/0banana/tpapaya"); The signature for the emit method is:       TaskContext::emit(co

2010-10-17 18:13:00 838

原创 The Efficiency of AWK Associative Array

仅做参考,转自:http://cxwangyi.blogspot.com/2010/05/efficiency-of-awk-associative-array.html I did a little experiment comparing C++ STL map with AWK associative array in counting word frequency of large text files. The result is astonishing: AWK associative arr

2010-10-17 18:03:00 704

原创 Memory Footprinting Using “top”

<br />转自:http://cxwangyi.wordpress.com/2010/10/14/memory-footprinting-using-top/<br />王流斌教我的办法:<br />一种监控进程内存使用方法:<br />top -b -n 30 -d 1 | grep 18241 > mem_stat.txt &<br />30:采样次数<br />1:间隔时间<br />18241:进程号

2010-10-17 17:57:00 781

原创 Hadoop Streaming和Pipes理解

原始问题的引出见:http://bbs.hadoopor.com/viewthread.php?tid=542 在论坛里搜索了下,发现了两篇利用C/C++编写mapreduce的文章.如下: http://bbs.hadoopor.com/thread-256-1-1.html http://bbs.hadoopor.com/thread-420-1-2.html 一. 其中,利用stream的文章中提到,利用stream编写mapreduce程序,其reduce任务要等到所有map

2010-10-16 21:52:00 11274 4

原创 HDFS 简介

一、HDFS HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文件、同时写和任意的文件修改,则并不是十分适合。 目前HDFS支持的使用接口除了Java的还有,Thrift、C、FUSE、WebDAV、HTTP等。HDFS是以block-sized chunk组织其文件内容的,默认的block大小为64MB,对于不足64MB的文件,其会占用一个block,但实际上不用

2010-10-16 21:34:00 1026

原创 How MapReduce Works

从Live Space –> wordpress –> 到这儿, 先测试一下功能,转一篇文章, http://blog.endlesscode.com/2010/06/24/how-mapreduce-works/ 一、从Map到Reduce MapReduce其实是分治算法的一种实现,其处理过程亦和用管道命令来处理十分相似,一些简单的文本字符的处理甚至也可以使用Unix的管道命令来替代,从处理流程的角度来看大概如下: 简单的流程图如下: 对于Shuffle,简单地说就是将Map的输出通过一定

2010-10-16 21:25:00 1126

原创 Generating Random Variables from Distributions

 Generating Random Variables from DistributionsGeneral Methods for Continuous DistributionsTransformation: only suitable for the distribution function F(x) whose inverse F^(-1) i

2007-05-04 13:30:00 985

Practical Recommender Systems (Python) - 2019.pdf

关于推荐系统从算法到工程,架构的一本综合书,详细介绍了如何开发一个使用的推荐系统,2019年最新版。 英文介绍: Practical Recommender Systems explains how recommender systems work and shows how to create and apply them for your site. After covering the basics, you’ll see how to collect user data and produce personalized recommendations. You’ll learn how to use the most popular recommendation algorithms and see examples of them in action on sites like Amazon and Netflix. Finally, the book covers scaling problems and other issues you’ll encounter as your site grows.

2019-05-23

MQ2008.rar (LETOR 4.0)

MQ2008.rar is hosted on OneDrive, and we cannot get the link. I google it and found it.

2019-04-19

Practical Python and OpenCV(3rd Edition)

This version of the book was published on 21 August 2016. Books like this are made possible by the time invested by the authors. If you received this book and did not purchase it, please consider making future books possible by buy- ing a copy at https://www.pyimagesearch.com/practical- python-opencv/ today.

2018-01-19

Java 快速查询手册

Java 快速查询手册,打印出来很方便随时看看

2010-01-19

Debugging Applications

My hope is that the information in this book will help you learn how to write your applications with fewer bugs in the first place—and that when you are required to debug, you can do it much faster.

2007-12-25

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除