12 人生偌只如初见

尚未进行身份认证

学历代表过去,财力代表现在,学习力代表将来,所见所闻改变一生,不知不觉断送一生。

等级
TA的排名 1w+

Python学习笔记-gRPC

gRPC概述gRPC是一款高性能、开源的 RPC 框架,产自 Google,基于 ProtoBuf 序列化协议进行开发,支持多种语言(Golang、Python、Java等)。gRPC对HTTP2.0协议的支持使其在 Android、IOS 等客户端后端服务的开发领域具有良好的前景。gRPC 提供了一种简单的方法来定义服务,同时客户端可以充分利用HTTP2.0 stream的特性,从而有助于节...

2020-01-21 14:27:08

推荐系统笔记-08-在线基于内容召回排序

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.4kafka-2.12-2.4.0zookeeper-3.5.6spark-streaming-kafka-0-8_2.11:2.4.42、相关表结构HBasealter 'multiple_recall', {NAME=>'online', TTL=...

2020-01-10 14:13:32

推荐系统笔记-07-离线特征数据集

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关表结构HBasecreate 'ctr_user_features', 'cf'create 'ctr_article_features', 'cf'HiveCREATE EXTERNAL TABLE T_CTR_USER_FEATURES(US...

2020-01-08 14:53:41

推荐系统笔记-06-CTR排序模型LR

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关Python实现# -*- coding:utf-8 -*-import osimport sysimport numpy as npfrom datetime import datetimeBASE_PATH = os.path.dirname(os...

2020-01-04 19:07:14

推荐系统笔记-05-用户基于内容召回集

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关表结构HBasealter 'multiple_recall', {NAME=>'content', TTL=>2592000, VERSIONS=>9999}3、相关Python实现# -*- coding:utf-8 -*-...

2019-12-30 16:53:47

推荐系统笔记-04-用户基于ALS模型召回集

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关表结构HBasecreate 'multiple_recall', {NAME=>'als', TTL=>2592000, VERSIONS=>9999}create 'history_recall', {NAME=>'chann...

2019-12-30 14:50:29

推荐系统笔记-03-用户画像

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关表结构HiveCREATE TABLE T_USER_OP_LOG(USER_ID BIGINT,ARTICLE_ID STRING,CHANNEL_ID INT,OP_TYPE INT COMMENT '1 display 2 click 3 col...

2019-12-29 17:19:10

推荐系统笔记-02-文章相似计算

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关表结构HIVECREATE TABLE T_ARTICLE_VECTOR(ARTICLE_ID STRING,CHANNEL_ID INT,VECTOR ARRAY<DOUBLE>)COMMENT 'article vector tabl...

2019-12-27 14:26:48

推荐系统笔记-01-文章画像

1、相关环境hadoop-2.10.0hive-3.1.2hbase-2.2.2spark-2.4.42、相关Hive表结构CREATE TABLE T_CHANNEL(ID BIGINT,EN_NAME STRING,CH_NAME STRING)COMMENT 'channel table'ROW FORMAT DELIMITED FIELDS TERMI...

2019-12-27 14:07:28

Python学习笔记-Spark操作Hive

为了用Spark支持Python,Apache Spark社区发布了一个工具PySpark。PySpark在线安装:pip install -U -i https://pypi.tuna.tsinghua.edu.cn/simple pysparkPySpark离线安装:下载地址:https://pypi.org/project/wheel/#fileswheel-0.33.6...

2019-12-19 10:31:30

Python学习笔记-HBase操作

服务器环境Thrift安装下载地址:http://mirrors.hust.edu.cn/apache/thrift/tar -xzvf thrift-0.13.0.tar.gz./configure --with-cpp --with-boost --with-python --without-csharp --with-java --without-erlang --without...

2019-12-18 16:38:15

学习笔记-Supervisor进程管理

Supervisor是一个进程管理工具,当进程中断的时候Supervisor能自动重新启动它。可以运行在各种类unix的机器上,supervisor就是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启。- supervisord运行 Supervisor 时会启动一个进程 supervisord,它负责启动所管理...

2019-12-17 16:25:14

Activiti学习笔记-整合SpringBoot与简单使用

Activiti版本:7.1.0.M3.1Spring Boot 版本:2.1.1.RELEASE相关依赖如下:<!-- Activiti依赖包 --><dependency> <groupId>org.activiti</groupId> <artifactId>activiti-engine</a...

2019-09-24 19:28:55

知乎上40个有趣回复,很精辟

01.交朋友的标准是什么?出世的智者,入世的强者,或者正常而阳光的普通人。02.有哪些可以令人清醒的句子?你多学一样本事,就少说一句求人的话。03.做哪些事情可以提升生活品质?定期扔东西。04.结婚以后两个人在一起最重要的是什么?就当这婚还没结。05.把学费拿来念书还是环游世界更合适?为什么?在没有充分的知识作为前提的情况下,即使行了万里...

2019-09-15 14:26:21

ElasticSearch学习笔记-Vector向量搜索记录

在Elasticsearch 7.0中,ES引入了高维向量的字段类型:dense_vector存储稠密向量,value是单一的float数值,可以是0、负数或正数,dense_vector数组的最大长度不能超过1024,每个文档的数组长度可以不同。sparse_vector存储稀疏向量,value是单一的float数值,可以是0、负数或正数,sparse_vector存储的是个非嵌套类型的...

2019-09-10 14:33:38

Python学习笔记-gensim初识Word2Vec、Doc2Vec

安装依赖工具包:pip install -U gensim安装过程中出现已经安装过的工具包冲突可以uninstall或删除Lib目录下相关包或使用:pip install -U gensim --ignore-installed scipyWord2Vec、Doc2Vec原理可以参考链接:https://blog.csdn.net/mpk_no1/article/details...

2019-09-08 16:21:10

ElasticSearch学习笔记-邻近匹配搜索记录

ElasticSearch版本:elasticsearch-7.3.0环境准备:curl -H "Content-Type: application/json" -XPUT 'http://192.168.0.1:9200/article/' -d '{ "settings": { "analysis": { "analyzer": { "shi...

2019-09-04 19:02:06

ElasticSearch学习笔记-ngram、中文拼音、简繁体搜索记录

ElasticSearch版本:elasticsearch-7.3.0ElasticSearch相关插件安装可以参考:https://blog.csdn.net/fighting_one_piece/article/details/100183135ElasticSearch服务上创建Mappingcurl -H "Content-Type: application/json" ...

2019-09-03 14:58:42

ElasticSearch学习笔记-插件安装记录

HEAD插件安装官方地址 https://github.com/mobz/elasticsearch-head2.x.x 版本:bin/plugin installmobz/elasticsearch-head5.x.x、6.x.x、7.x.x版本:gitclonegit://github.com/mobz/elasticsearch-head.gitcdela...

2019-09-01 14:46:35

Python学习笔记-ElasticSearch操作

安装:pip install -U elasticsearch (Successfully installed elasticsearch-7.0.3)ElasticSearch版本:elasticsearch-7.3.0Python操作代码如下# -*- coding:utf-8 -*-import osimport sysfrom elasticsearch impor...

2019-08-22 21:05:52

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 红花
    红花
    子板块内专家分月排名榜第一
  • 黄花
    黄花
    子板块内专家分月排名榜第二