自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(108)
  • 资源 (17)
  • 问答 (4)
  • 收藏
  • 关注

原创 【置顶】目录

CSDN主页:https://blog.csdn.net/jianbinzheng 简书主页:https://www.jianshu.com/u/44d44b6eecc3 github:https://github.com/PancakeCard 其中,CSDN用于系统记录、简书用于零散的、github…其实还只是个账号 下面是节选的相对系统的文章。。。主要还是方便我自己看。。。...

2018-05-07 16:12:01 330

原创 【Uplift】特征选择篇

https://zhuanlan.zhihu.com/p/363866684【Uplift】特征选择篇文章目录【Uplift】特征选择篇Filter方法F-filter和LR-filterBin-Based方法Embed方法特征过滤的效果个人理解本文主要参考论文《Feature Selection Methods for Uplift Modeling》介绍Uplift Modeling中的特征筛选问题,主要包括”Filter方法“和”Embed方法“。具体实现参考CausalML源码。做好特征选择

2021-04-11 00:22:00 1081

原创 【Uplift】评估方法篇

https://zhuanlan.zhihu.com/p/363082639文章目录线上评估方法离线评估方法Uplift decile chartsCumulative uplift/gainUplift Curve & AUUCQini Curve & Qini Coefficient补充,AUUC和Qini的另一种口径和标准的预测方法不同,由于”反事实“的存在,并没有真实的uplift标签,因此uplift模型无法在样本维度上进行评估。但如果有随机试验采集的数据,则可以用平均水平来评

2021-04-08 00:38:01 3112

原创 【Uplift】建模方法篇

https://zhuanlan.zhihu.com/p/362788755文章目录概述The Class Transformation MethodMeta-Learning MethodS-LearnerT-LearnerX-LearnerR-LearnerTree-Based MethodUplift-Tree分裂步骤NormalizationApplicationPruning补充:CausalML中可视化图的解释CausalForestCTSNN-Based,DragonNet参考文献概述有

2021-04-07 01:02:11 1301

原创 【Uplift】模拟数据篇

https://zhuanlan.zhihu.com/p/362411150【Uplift】模拟数据篇文章目录【Uplift】模拟数据篇模拟数据集的组成模拟数据集示例[2]R-Learner论文中的4种模拟,也是CausalML中用的,回归A.复杂的组成,简单的因果B.随机试验C.复杂的结果,简单的倾向,固定的因果D.Treat变量与Control变量无关的[3]Feature Selection论文中的模拟数据集,分类[1]CTS论文中的模拟数据集,回归增量建模对数据要求相对严格,尤其是要用于评估模

2021-04-05 15:46:05 691

原创 【Uplift】参考资料篇

https://zhuanlan.zhihu.com/p/358582762博客等腾讯广告-uplift广告增效衡量说明https://e.qq.com/ads/adfaq/delivery/tool/08/https://morketing.com/detail/4704一文读懂Uplifthttps://mp.weixin.qq.com/s/FOVggFduHKeDr3jidcmqgA基本是综述论文翻译一遍滴滴:DiDi Food中的智能补贴实战漫谈https://mp.w

2021-04-04 23:35:27 891

原创 【Uplift】因果推断基础篇

https://zhuanlan.zhihu.com/p/362311467文章目录Uplift与因果推断相关、因果、辛普森悖论因果图基本结构前门、后门准则基本假设关键指标倾向性得分、Matching等增量建模面临的问题符号、名词定义梳理参考文献Uplift与因果推断因果推断(Causal Inference)研究如何更加科学识别变量间的因果关系,是Uplift Modeling的理论基础。在通常的预测任务中,我们拟合的实际是Y与X的相关关系,X甚至可以是Y的结果,如GDP和发电量之间可能有一系列复

2021-04-04 23:31:27 4527

原创 【读论文】餐厅配送范围生成-美团外卖

https://zhuanlan.zhihu.com/p/362152545餐厅配送范围生成-美团外卖Delivery Scope: A New Way of Restaurant Retrieval for On-demand Food Delivery Servicehttps://dl.acm.org/doi/10.1145/3394486.3403353概述:外卖场景中,为每个餐厅划定服务范围,并提供检索能力。其中划定的范围要求覆盖高需求区域、考虑供应能力、合理距离内;沿路不分割地块

2021-04-03 22:58:10 310

原创 【花式GIS】QGIS加地图服务

QGIS有加载WMS、WMTS、WFS,以及XYZ形式的瓦片等地图服务的能力,通常可以作为空间数据的底图一起可视化出来。本文列举一些例子记录QGIS如何使用地图服务,具体包括:XYZXYZ的链接获取WMTS服务,以Mapbox为例天地图(XYZ和WFS)插件推荐URL列表:XYZ参考:http://openwhatevermap.xyz/高德参考:https://blog.csdn.net/ldlzhy1984/article/details/81015180https://blo

2021-03-02 00:45:18 1390 1

原创 【NLP】经典文本匹配算法

文章目录Jaccard相似度Levenshtein编辑距离SimhashTF-IDFBM25其他文本匹配主要是将两段文本进行相似度计算,以选择最匹配的内容,如搜索场景下选择相似的内容、问答场景下在问题库中匹配最相近的问题并返回对应的回答等。也可延伸用于序列形式的匹配,如地址匹配、路径序列等。本文主要整理一下经典的文本匹配/相似度计算算法,包括Jaccard相似度、Levenshtein编辑距离、Simhash、TF-IDF、BM25。Jaccard相似度参考链接:https://en.wikiped

2021-02-08 02:09:29 2722

原创 【笔记】Python自然语言处理实战

文章目录《Python自然语言处理实战》概述NLP基础中文分词规则分词正向最大匹配法(Maximum Match Method, MM法)逆向最大匹配法(Reverse Maximum Match Method, RMM法)双向最大匹配法(Bi-direction Matching method)统计分词N元模型(n-gram model)隐马尔可夫模型(HMM)其他词性标注命名实体识别关键词提取算法TF-IDF算法TextRank算法LSA/LSI/LDALSA/LSI算法LDA算法实践部分句法分析其他T

2021-01-31 23:37:27 1419

原创 【每周论文】20210117-eleOFCT_CompactETA_DTInf

文章目录Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery1. 概述2. Challenge3. 外卖订单生命周期4. 问题定义5. 特征工程5.1 订单信息5.2 聚合特征5.3 菜品特征5.4 烹饪时间特征5.5 供需特征5.6 外卖员特征5.7 基于ETA的配送时间特征5.8天气特征6. 模型7. 实验评述CompactETA: A Fast Inference System for Travel Time Predi

2021-01-17 21:43:54 465 2

原创 【每周论文】20210110-BusTr_ConSTGAT_HetETA

文章目录BusTr: Predicting Bus Travel Times from Real-Time Traffic1. 概述2. 本文与历史工作的区别3. 具体方法4. 训练细节5. 实验对比评述ConSTGAT: Contextual Spatial-Temporal Graph Attention Network for Travel Time Estimation at Baidu Maps1. 概述2. Contribution问题定义:略4. 特征5. 模型结构6. 实验评述HetETA:

2021-01-17 21:27:04 576

原创 【论文笔记】BusTr,基于实时交通数据的公交旅行时间预测

文章目录BusTr,基于实时交通数据的公交旅行时间预测1. 概述2. 本文与历史工作的区别3. 具体方法3.1 数据(样本)构造3.2 样本示例3.3 特征3.3.1 全局特征:full-trip上下文特征3.3.2 原子公共特征:空间特征3.3.3 路段的附加特征3.4 模型结构4. 模型训练4.1 Spatial input ablation4.2 Feature selection4.3 其他5. 实验5.1 和DeepTTE对比5.2 特征消融实验5.3 泛化实验6. 其他评述BusTr,基于实时

2021-01-16 21:38:21 717 1

原创 【统计学习方法】学习笔记-第3章-k近邻法

(知乎:https://zhuanlan.zhihu.com/p/314613894)k近邻法(k-nearest neighbor,k-NN)是一种基本分类和回归方法(这里讨论分类),对于新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式预测。k近邻不具有显式的学习过程,是利用训练数据对特征空间进行划分,作为分类模型。k近邻法的三个基本要素——k值选择、距离度量、分类决策规则。3.1 k近邻算法【算法3.1(k近邻法)】当k=1时的特殊情况,称为最近邻算法。3.2 k近邻模

2020-11-27 02:09:34 331 3

原创 【统计学习方法】学习笔记-第2章-感知机

【统计学习方法】学习笔记-第2章-感知机感知机(perceptron)是一种二分类的线性分类模型,对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型。感知机的学习就是基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,得到线性划分的分离超平面。模型:f(x)=sign(w⋅x+b)f(x)=\text{sign}(w\cdot x+b)f(x)=sign(w⋅x+b)策略:极小化损失函数L(w,b)=−∑xi∈Myi(w⋅xi+b)L(w,b)=-\sum_{x_i \in M}y

2020-11-23 03:17:32 153 1

原创 【统计学习方法】学习笔记-第1章-统计学习及监督学习概论

【知乎:https://zhuanlan.zhihu.com/p/305028771】【统计学习方法】学习笔记-第1章-统计学习及监督学习概论1.1 统计学习统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。统计学习也称为统计机器学习(statistical machine learning)赫尔伯特·西蒙(Herbert A.Simon)对“学习”的定义:如果一个系统能够通过执行某个过程改进它的性能,这就是学习统计

2020-11-21 23:04:47 268

原创 【笔记】《编写高质量Python代码的59个有效方法》

文章目录第一章 用Pythonic方式来思考1. 确认Python版本2. 遵循PEP8风格指南3. 了解bytes、str、unicode的区别4. 用辅助函数取代复杂表达式5. 了解切割序列的方法6. 单次切片操作内,不要同时指定start、end、stride7. 用列表推导(list comprehension)来取代map和filter8. 不要用含有两个以上表达式的列表推导9. 用生...

2019-05-02 23:58:08 667

翻译 混合密度模型Mixture Density Networks

翻译并简化自:http://blog.otoro.net/2015/11/24/mixture-density-networks-with-tensorflow/?tdsourcetag=s_pctim_aiomsgnotebook地址:http://otoro.net/ml/ipynb/mixture/mixture.html简单的数据拟合(用TF)我们首先快速构建一个神经网络来拟合...

2019-01-19 19:28:11 10426 4

原创 【论文笔记】A Neural Representation of Sketch Drawings

谷歌的论文,基于seq2seq+VAE编码并生成手绘序列https://arxiv.org/pdf/1704.03477.pdf本文主要是论文的概述翻译,记录文章目录1.Introduction2.Related Work3.方法3.1 数据集3.2 Sketch-RNN1.Introduction生成模型的发展:GANs(Generative Adversarial Networ...

2019-01-15 16:22:12 1650 1

原创 【深度学习】序列问题系列(0)——概述

目前深度学习的基础结构包括DNN、CNN、RNN、GNN等。DNN为多层前向神经网络,为最基础的全连接形态;CNN为卷积神经网络,适合处理图像问题,或其他具有“平移不变性”的问题,如图像分类、物体识别等;RNN为循环神经网络,适合处理序列问题,或其他与上下文环境相关的问题,如文本预测、情感分类、机器翻译、路径预测等;GNN为图神经网络,适合处理图结构问题,也能看做是图像、序列等的更一般化结...

2018-12-29 15:04:33 375 1

原创 【论文笔记】Structural Deep Network Embedding

Structural Deep Network Embeddinghttps://www.kdd.org/kdd2016/papers/files/rfp0191-wangAemb.pdf本文介绍图嵌入的一种方法——SDNE,用深度神经网络来做图嵌入,以下主要摘录论文以及记录一点个人理解。摘要network embedding,是为网络中的节点学习出一个低维表示的方法。目的在于在低...

2018-10-30 18:30:33 4805

原创 Jaccard相似度

https://en.wikipedia.org/wiki/Jaccard_indexhttps://blog.csdn.net/qq_26710805/article/details/79855226杰卡德系数(Jaccard Index),也称Jaccard相似系数(Jaccard similarity coefficient),用于比较有限样本集之间的相似性与差异性。如集合间的相似性...

2018-09-29 01:18:52 3898

原创 HMM隐马尔科夫模型

对HMM做概述,主要摘抄自《统计学习方法》,概率计算为主,对学习和预测算法暂时忽略。 最后补充一些HMM在地图匹配上的应用1.HMM定义和理解隐马尔可夫模型(Hidden Markov Model),标注问题,生成模型。 定义:隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序...

2018-09-17 17:50:04 404

原创 快速风格迁移

风格迁移是CV的一个应用,通过融合风格图片和内容图片,实现图片的风格变换,“人人都是艺术家” 最早在论文《A Neural Algorithm of Artistic Style》中提出,但是这种方法是用“训练”的思想来做风格迁移,每次都要单独训练,速度很慢 快速风格迁移由《Perceptual Losses for Real-Time Style Transfer Super-...

2018-09-05 23:18:35 8877 3

原创 【论文笔记】FaceNet: A Unified Embedding for Face Recognition and Clustering

FaceNet: A Unified Embedding for Face Recognition and Clustering https://www.sentiance.com/2018/05/03/loc2vec-learning-location-embeddings-w-triplet-loss-networks/ 本篇主要是用于人脸识别的“三重损失”——triplet...

2018-08-21 21:37:37 471

原创 LINE

LINE: Large-scale Information Network Embedding概述LINE是一种Graph Embedding的方法,在非NN的方法中是比较好的。LINE的提出:考虑到因式分解的方法只适用于无向图、且只考虑一阶的相似关系;而DeepWalk方法没有明确表现出维持了什么特征。所以LINE实现了可用于有向无向图、有权无权,以及维持了局部和全局结...

2018-08-08 18:09:48 349

原创 图因式分解GraphFactorization

Distributed Large-scale Natural Graph Factorization Graph Embedding Techniques, Applications, and Performance: A Survey综述里的描述 博客上LLE、拉普拉斯特征图的资料不少,但是Graph Factorization的很少,也可能是名字太普通了。。。只能自己...

2018-08-02 17:56:54 3019 1

原创 【GIS】geohash原理与实现

参考:https://www.cnblogs.com/LBSer/p/3310455.html https://en.wikipedia.org/wiki/Geohash引子考虑一个问题,如何搜索某点附近一定范围内的满足要求的公交站。 (截了个高德的图、并不知道高德地图后台如何搜索的。。。)无脑思路:把所有的公交站和当前位置都算距离筛选简单思路:把当前城市/附近行政...

2018-07-31 21:36:43 3158

原创 谱聚类

https://www.cnblogs.com/pinard/p/6221564.html谱聚类(Spectral Clustering),对数据分布适应性强,效果优秀,计算量小。概述由图论演化而来,在聚类中广泛应用。 将所有样本看做点,点之间用边连接,近的权重大,远的权重小。 通过对数据点切图实现聚类,使类间权重和小,类内权重和大。无向权重图结点的度表示与它相...

2018-07-27 15:44:15 408

原创 拉普拉斯矩阵/特征映射

https://www.jianshu.com/p/87057397a070 https://blog.csdn.net/v_july_v/article/details/40738211 https://blog.csdn.net/yujianmin1990/article/details/484204831.拉普拉斯矩阵(Laplacian Matrix)表示图的...

2018-07-26 22:42:13 5820 1

原创 局部线性嵌入LLE

[1]https://www.cnblogs.com/pinard/p/6266408.html [2]Graph Embedding Techniques, Applications, and Performance: A Survey 主要参考和图片来源[1]局部线性嵌入(Locally Linear Embedding,LLE),一种重要降维方法,与PCA、LDA相比...

2018-07-25 23:03:26 848

原创 奇异值分解SVD

主要参考https://www.cnblogs.com/pinard/p/6251584.html, https://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html奇异值分解(Singular Value Decomposition,SVD),用于降维算法的特征分解、推荐系统、NLP...

2018-07-25 11:57:10 1101

原创 信息熵、交叉熵、相对熵

【直观详解】信息熵、交叉熵和相对熵熵,热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。信息熵,描述信源的不确定度。信息熵越大,越无序,越随机,信息量(的期望)越大,要消除不确定性所需信息量越大。考虑把信息量存储下来需要多大空间/存储代价 (用存储空间表示信息熵(不确定性越高所需存储空间越大))举例:表示天气情况的P=[p1,p2,p3,p4]P...

2018-07-23 11:46:05 455

原创 【论文笔记】Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction

https://arxiv.org/pdf/1802.08714 本文的目的是出租车需求预测,特点在于结合了时间、空间、语义三方面的信息,深度学习模型前言简单来说,本文综合了时间、空间、语义三个方面预测需求量。 空间:local CNN,强调了邻近空间相似,较远的位置参与训练之间会有负作用 时间:使用比较传统LSTM来做 语义:使用“区域图”的边来表达...

2018-07-11 11:39:06 3097

原创 【笔记】Loc2Vec: Learning location embeddings with triplet-loss networks

这是个博客的笔记。。。 https://www.sentiance.com/2018/05/03/loc2vec-learning-location-embeddings-w-triplet-loss-networks/ https://www.jiqizhixin.com/articles/2018-06-25-5概述场地映射算法的目标是根据位置测量数据,推测用户...

2018-07-10 20:34:53 1419

原创 【论文笔记】Graph Embedding Techniques, Applications, and Performance: A Survey

https://arxiv.org/pdf/1705.02801.pdf 这篇论文列举了目前graph embedding算法,将其分为“因式分解”、“随机游走”、“深度学习”三类,在不同的任务上评估其效果,最后提了点发展方向前言图在生物蛋白质结构、社交网络、词共现网络中应用图分析任务可以分为: - 节点分类(随机游走、提特征) - 链路预测(相似性方法、最大似然...

2018-07-07 17:20:21 4246

原创 【GIS】地图与投影

我们的目标是:把“地球”变成“地图”地球和地图坐标系统地理坐标系投影坐标系统地图投影常见的投影或坐标系统WGS84墨卡托(Mercator)投影UTM投影(与高斯克吕格)兰伯特(Lambert)投影Web墨卡托投影其他投影(火星、百度及其他)参考地球和地图地球:近似球体,极半径略短、赤道半径略长,北极略突出、南极略扁平,近似梨形的...

2018-05-08 16:41:39 10342

原创 【笔记】《程序设计导论 Python语言实践》

摘录于2017年10月6日终于算完了,趁着十一草草看完,性价比不高不低吧,有些困惑的问题得到了解决所以还是很值得的,尤其是可变变量那块。数据结构和算法一章最为粗糙,计划换本专门的书看。记录一些程序设计/Python中的新知识或比较重要的理念目录第一章 程序设计的基本原色第二章 函数和模块第三章 面向对象的程序设计第四章 算法和数据结构目录...

2018-05-07 12:59:36 1957

原创 【笔记】《Web全栈工程师的自我修养》

摘录,于2017年1月21作者博客:http://yuguo.us/“全栈”翻译自full-stack,表示为了完成一个项目,所需要的一系列技术的集合。服务器、数据库、服务器端编程语言、HTML、CSS、JavaScript等组合为Web栈(Web-Stack)。最常用的Web栈——LAMP(Linux-Apache-MySQL-PHP)整体解决方案:服务器给予Linux...

2018-05-07 12:49:47 515

《Python数据可视化编程实战》配套文件

《Python数据可视化编程实战》配套的源码、文件等

2017-03-16

《python数据分析》配套代码和数据

《python数据分析》(python data analysis),作者【印尼】Ivan Idris,翻译:韩波。配套的python代码和数据

2017-03-16

arcpy函数chm

arcgis的python开发包arcpy的帮助文档

2017-03-15

迅雷极速版安装包

迅雷极速版的安装包,目前官网已经停更,用着挺舒服的。

2017-01-22

C#AE二次开发投影变换的GP实现.zip

ArcEngine二次开发实现投影变换,C# VS2010 AE10.2 ,使用时修改地址即可

2016-11-28

彭罗斯阶梯STL模型文件

彭罗斯阶梯(Penrose stairs)是一个有名的几何学悖论,指的是一个始终向上或向下但却走不到头的阶梯,可以被视为彭罗斯三角形的一个变体,在此阶梯上永远无法找到最高的一点或者最低的一点。 3D打印用的STL文件。有趣的3D打印小物件。

2016-11-19

统计学习方法.pdf

统计学习方法教材的PDF版,网上下的,机器学习等需要用到

2016-07-23

ArcGIS10.2破解

用于破解ArcGIS10.2Desktop的工具,包括keygon和lisence文件替换

2016-03-26

Access_JDBC30.jar

jdk8将jdbc-odbc桥删除,所以要连接access数据库要用微软提供的jar包,有50次访问的限制。

2016-03-24

GIS软件工程——课程总结

GIS软件工程课结课,C# AE二次开发,从成果系统中抽取一部分代码块做出简单介绍,能够提供一些AE开发的编程思路,比较适合有些AE基础的朋友学习。涉及WebBrowser访问网页,GDB文件加载方法,openfiledialog使用,shp文件、mxd文件使用,地图输出,放大缩小漫游全图,图层移动,鹰眼,GP工具,照片查询,绘图量算,以及Messagebox用于调试查错的方法。

2015-09-22

ArcEngine专题图制作

利用AE制作专题图的样例展示,包括点符号、线符号、面符号、文本符号。比较全面,面符号如简单填充符号、线填充符号、点填充符号、渐变色填充符号、图片填充符号、多层填充符号等。

2015-04-10

C#进行操作Word操作

C#操作word文档。包括创建、保存、文字、图片、表格、页眉、页脚等。其中表格还包括边框,合并单元格,插入图片。其他操作必须先创建word。代码块都有,具体应用需要修改。

2015-04-08

C#ArcEngine二次开发 鹰眼

使用C#进行ArcEngine二次开发,鹰眼的实现的源程序,希望对大家有帮助

2015-01-03

GIS软件工程(C#+AE 课程总结

GIS软件工程结课,C#+AE二次开发,从成果系统中截取了部分代码块,适合有一定AE基础的朋友学习,能够提供一些编程思路。设计Geodatabase文件的打开,shp文件打开的标准/简单方法,mxd文档操作,地图输出图片,放大缩小蛮有全图,图层操作,鹰眼,GP工具,照片查询,绘图,量算,专题图符号以及MessageBox用于调试查错的使用方法">GIS软件工程结课,C#+AE二次开发,从成果系统中截取了部分代码块,适合有一定AE基础的朋友学习,能够提供一些编程思路。设计Geodatabase文件的打开,shp文件打开的标准/简单方法,mxd文档操作,地图输出图片,放大缩小蛮有全? [更多]

2015-01-03

MAPGIS进行校正

利用MAPGIS进行几何校正,虽然不如arcgis方便,但有时必不可少

2014-11-28

ArcGIS3D符号库制作过程

描述了在ArcGIS中制作3D符号的过程,主要用于ArcScene 和 ArcGlobe里

2014-11-28

虚拟光驱virtualdrivemaster

主要用于打开iso格式的文件,先打开虚拟光驱软件,再载入映像。

2014-11-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除