飞翔的七彩蜗牛-CSDN博客

原创 GCF:在线市场异质治疗效果估计的广义因果森林

在线市场异质治疗效果估计的广义因果森林

2024-01-09 18:59:24 982

转载智能营销决策&大模型 AIGA（AI Generated Action）

1.0 时代以在线经营、基于数据统计和经验判断的数字经营为主，而同时 1.0 时代更多是从领域数据、有监督学习等 AI 技术出发，2.0 时代则将从生成式 AI 大模型、多模态技术以及对数据的更有效运用等新变化出发。除了进一步重塑和改变商业场景之外，2.0 时代将深刻影响商家经营方式、消费者购物体验等。

2023-12-08 18:20:14 313

转载广告智能决策技术的演进之路学习

雄关漫道真如铁，而今迈步从头越。历经阿里妈妈技术同学们坚持不懈的努力，在自动出价决策技术上，从推动经典强化学习类算法在工业界大规模落地，到持续革新提出Offline RL-based Bidding、Online RL-based Bidding等适应工业界特点的新算法，再到提出AIGB迈入生成式Bidding的新时代；

2023-12-03 22:12:42 138

诸如Uber、Lyft、Doordash、滴滴等公司的业务模式均是在下提供相应的供需匹配，因此此种业务模式在进行往往会面对因而带来的网络效应即同一时空下，用户的需求会共享同一批运力池。如果简单对用户进行随机分流，那么对实验组用户的策略不仅会影响实验组本身，同时也会影响对照组下的其他用户，进而天然违背了A/B/N实验下的即实验组个体不会影响对照组个体。因此为了更好的在下进行科学合理的实验，Doordash采用了，即在同一空间下，以及连续时间分片，实验组对照组轮转生效，主要如下：1. 在进行。

2023-11-26 22:21:52 160

原创 SingleTreePolicyInterpreter

EconML库包括策略可解释性工具，如SingleTreePolicyInterpreter，它考虑了干预成本和干预效果，以识别哪些客户可以带来盈利的简单规则。干预通常是有成本的：激励用户成为会员可能会有成本（例如提供折扣）。因此，我们目标是想知道哪些客户的的参与可以最大限度地提高利润。

2023-11-19 22:35:46 348

原创编写单元测试

所以，在上述代码中，"t" 代表测试对象，用于执行断言并记录测试结果。6. 检查测试结果：运行完成后，系统将显示每个测试用例的执行结果，包括通过的用例和失败的用例。4. 编写测试用例：在测试函数中，编写一系列测试用例，每个测试用例都是一个独立的函数调用，用于验证待测试函数的不同方面和边界条件。在Go语言中，当声明一个变量时，如果没有显式赋值，那么变量将被赋予其类型的默认零值。是一个测试对象的指针，用于执行断言和记录测试结果。2. 导入测试所需的包：在测试文件的开头，导入所需的包，包括。等），默认零值是0。

2023-11-12 19:04:52 474

原创 SCIP求解速度加速

实际使用中遇到scip求解速度慢，需要加速或者牺牲一定的精度换取时间。

2023-11-02 11:04:23 510

原创 [2021]不确定成本下的处理分配

我们考虑学习如何最优分配成本不确定的治疗方法的问题，并可能因治疗前协变量而异。如果我们需要优先考虑访问不同患者用于不同数量的时间的稀缺资源，或者在营销中，如果我们想要针对公司成本取决于使用折扣多少折扣，则该设置可能出现在医学中。在这里，我们推导出预算约束下的最佳治疗分配规则的形式，并提出了一种实用的基于随机森林的方法，使用来自随机试验的数据或更广泛地说，未混淆的数据来学习治疗规则。

2023-10-29 22:30:03 199

翻译因果效应估计:最新进展、挑战与机遇

因果关系自然广泛应用于科学的各个学科，发现变量之间的因果关系并估计感兴趣的因果效应。推断因果关系最有效的方法是进行随机对照试验，将参与者随机分配到治疗组或对照组。由于进行了随机研究，对照组和治疗组之间唯一预期的区别是正在研究的结果变量。然而，在现实中，随机对照试验总是耗时且昂贵。此外，在大多数随机对照试验中还需要考虑伦理问题，这基本上限制了它的应用。因此，观测数据提供了一种诱人的捷径，而不是随机的受控试验。观察数据是由研究人员简单地观察没有干扰的受试者获得的。

2023-10-22 19:36:06 112

原创线性回归模型进行特征重要性分析

线性回归是很常用的模型；在局部可解释性上也经常用到。

2023-10-13 18:36:24 1007

原创未知非参数需求和有限价格变动的动态定价

企业不断创新，引入新的产品，以便在快速变化的商业环境中竞争和更好地定位自己。每年，数十亿美元投资于产品创新和新产品启动(Willemot et al. 2015)。不幸的是，并非所有新产品启动都成功。特别是Willemot等人(2015)指出，每年市场上推出的总新产品中有近15%是不成功的，并在生命周期结束时从货架上起飞。事实上，最近的一项调查指出，超过72%的新产品不能满足其收入目标和属性，如定价失败(Carmichael 2014, Huang et al. 2007)。

2023-09-24 17:56:43 138

原创安装pyscipopt

Conda会自动安装SCIP，因此所有内容都可以通过单个命令安装：GitHub - scipopt/PySCIPOpt: Python interface for the SCIP Optimization Suite pyscipopt使用优化 | 手把手教你用Python调用SCIP求解最优化模型 - 知乎手把手教你用Python调用SCIP求解最优化模型_python scip编程_刘兴禄的博客-CSDN博客运筹学修炼日记：TSP中两种不同消除子环路的方法及callback实现（Pytho

2023-09-10 21:21:05 577

原创二分类问题使用rmse训练会是什么结果

通常情况下，使用均方根误差（RMSE，Root Mean Square Error）来训练二分类问题可能并不是最优选择，因为RMSE通常用于衡量连续值的预测误差，而不是分类问题。二分类问题更常用的衡量标准是交叉熵损失（Cross-Entropy Loss）或对数损失（Log Loss）。

2023-08-30 20:20:51 155

原创 CausalEGM安装使用

根据观察数据，推断治疗的因果效应对于许多科学和工程问题至关重要，并引起了各个领域的巨大兴趣。了解因果关系的最有效方法是进行随机对照试验（RCT）。然而，RCT 耗时、昂贵且普遍性存在问题。相比之下，观察性研究可以提供有价值的证据并检查“现实世界”环境中的效果。在现实世界的应用中，由于混杂因素引入的选择偏差，治疗通常不是随机分配的。准确估计因果效应涉及处理混杂因素，这可能会影响治疗和结果。未能针对混杂效应进行调整可能会导致估计偏差和错误结论。

2023-08-29 18:14:36 195

原创 CausalEGM：通过编码生成建模的通用因果推理框架

鉴于观察数据，对治疗因果效应的推论对于许多科学和工程问题至关重要，并引起了广泛的兴趣。例如，(1) Zhang et al.(2017)研究了药物对个性化医疗健康结果的影响;(2) Panzzia和Presbitero(2014)评估了政府公共政策的有效性;(3) Kohavi和Longbotham(2017)进行了A/B测试，为商业公司选择更好的推荐策略。从历史上看，许多数据集的小样本大小阻碍了通过传统亚组分析有意义地探索治疗效果。在大数据时代，数据积累激增。

2023-08-27 18:16:50 290

原创 econml介绍

EconML是一个通过机器学习方法从观察数据中估计heterogeneous treatment effects的Python包。该软件包是的一部分，目的是将最新的机器学习方法与计量经济学结合，从而实现复杂因果推断问题的自动化。机器学习最大的promise之一是在许多领域实现决策的自动化。许多数据驱动的决策场景的核心问题是对heterogeneous treatment effects的估计，也即：对于具有特定特征集的样本，干预对输出结果的causal effect是什么？

2023-08-20 21:37:17 708

原创 econml双机器学习实现连续干预和预测

即使使用随机实验数据，DML方法仍然需要考虑一些因素，例如样本大小、特征的选择和处理、模型的选择和调参等。如果实验设计得当，并且随机化合理，那么通过DML训练的模型可以更好地捕捉因果关系，从而获得更准确的效应估计。因此，使用随机实验数据进行DML训练可能会在某些情况下获得更好的效果，但并不是绝对的规律。在应用DML方法时，仍然需要根据实际情况进行数据分析、模型选择和验证，以确保获得准确和可靠的因果效应估计。请注意，实际情况中的数据可能更加复杂，您可能需要根据您的数据和问题来适当选择的模型和参数。

2023-08-09 20:28:15 1811 1

原创观测数据建模

观测数据 / 样本空间覆盖均匀psm。

2023-08-06 21:00:13 310

原创多臂治疗规则的 Qini 曲线（Stefan Wager）

Qini 曲线最初是在营销文献中提出的 [Radcliffe, 2007]，绘制了当我们改变预算时处理对治疗最响应的单位的平均策略效应。然后，我们可以通过评估在一系列不同预算级别进行的成本效益练习来量化治疗目标的价值。Qini 曲线已在各种实际应用中采用，以评估受资源约束的处理目标规则的经验性能。二元处理下类似的指标的理论性质，以及曲线摘要下面积的扩展，最近受到了许多作者对统计文献中的关注，包括Imai和Li[2023, 2022]，Sun等人[2021]和Yadlowsky等人[2021]。

2023-07-30 17:30:17 451

原创完美匹配：一种简单的神经网络反事实推理学习表示方法

从观测数据估计个体治疗效果1(ITE)是许多领域的一个重要问题。例如，在医学中，我们有兴趣使用过去治疗的人的数据来预测哪些药物会导致新患者更好的结果 [1]。同样，在经济学中，一个潜在的应用程序将是确定某些作业程序将基于过去作业培训程序的结果的有效性。由于两个原因，来自观测数据的ITE估计是困难的：首先，我们从未观察到所有潜在的结果。如果患者接受了治疗她的症状的治疗，我们从未观察到如果患者在同一情况下规定了潜在的替代治疗，会发生什么。

2023-07-16 21:43:32 490

原创 DESCN：用于个体治疗效果估计的深度全空间交叉网络

个体层面的因果推理是一种预测分析技术，用于估计单一或多种治疗的个体治疗效果(ITE)。该技术具有广泛的应用，例如识别对患者最有效的药物”，并针对个性化保险产品优化交叉销售 [5]。在电子商务领域也很受欢迎，因为利润驱动的业务，如代金券分布和目标广告。在本文中，我们专注于 ITE 估计任务，其中仅存在单个处理（即处理或未处理3）。该技术具有广泛的应用，例如识别患者最有效的药物 [8]，并针对个性化保险产品优化交叉销售 [5]。它在电子商务领域也很受欢迎，作为利润驱动的业务，如凭证分发和目标广告。

2023-07-09 22:41:18 660

原创使用显式特征的在线交互感知提升网络（EFIN）

作为在线营销的关键组成部分，提升建模旨在准确捕捉不同处理激发不同用户的程度，例如优惠券或折扣，也称为个体治疗效果 (ITE) 的估计。在实际业务场景中，治疗选项可能众多且复杂，不同处理之间可能存在相关性。此外，每个营销实例也可能具有丰富的用户和上下文特征。然而，现有的方法在充分利用对特定处理敏感的处理信息和挖掘特征方面仍然不足。在本文中，我们提出了一个显式特征交互感知提升网络（EFIN）来解决这两个问题。

2023-07-02 22:15:23 622

原创 pandas学习笔记

pandas 是基于NumPy的一种工具，该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。一维数组，与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型，字符串、boolean值、数字等都能保存在Series中。

2023-06-18 23:35:48 563

原创 TensorHouse仓库介绍

TensorHouse 是用于企业运营的参考机器学习和优化模型的集合：营销、定价、供应链等。该项目的目标是为工业、研究和教育目的提供基线实施。

2023-06-18 20:56:26 317

原创因果推断18--估计个体治疗效果：泛化界和算法CRF（个人笔记）

对动作因果影响进行预测是许多领域中的一个核心问题。例如，决定哪种药物会对患者带来更好的结果的医生；政府决定谁将从资助的工作培训中受益最多；或者决定哪个研究计划最能使特定学生受益的教师。在本文中，我们专注于根据观察数据进行这些预测的问题。观察数据是包含过去动作、他们的结果以及可能更多上下文的数据，但没有直接访问产生动作的机制。例如，我们可以访问患者（上下文）、他们的药物（动作）和结果的记录，但我们没有完全了解为什么将特定动作应用于患者。

2023-06-11 21:22:54 1206

原创因果推断17--基于反事实因果推断的度小满额度模型学习笔记

对于仅有观测样本的情况，无法直接获取treatment->outcome的因果关系，我们需要借助必要的手段切断covariates到treatment的后门路径。首先通过X预测T，与真实的T作差，得到一个T的残差，然后通过X预测Y，与真实的Y作差，得到一个Y的残差，预测模型可以是任何ML模型，最后基于T的残差和Y的残差进行因果建模。期望额度可以理解为模型学习到的连续性倾向额度，使得混淆变量C和额度T之间的关系能够断开，转换成∆T与Y的因果关系学习，从而对∆T下Y的分布进行较好的刻画。

2023-06-04 18:13:18 1477 1

原创强化学习笔记

DDQN稍作改变，将状态评估过程中，先根据ANN1选择最大Q（s_）对应的action，然后再根据选定的action的位置索引到target_model的Q(s_,a)对上，从而选出Q值（实际这个Q值在target_model这边可能并不是最大值）。即所有训练数据过一遍，如果数据有300条，把数据分成了3个batch，batch_size是300 / 3 = 100，3个batch都跑完，即跑了三个iteration，就是一个epoch。这样就可以更直观地看出训练过程中的趋势，从而判断训练的好坏。

2023-05-28 22:49:39 924

原创对话到行动:通过行动级生成构建面向任务的对话系统

最近，直接输出适当的自然语言响应或API调用的端到端生成方法在面向任务的聊天机器人中得到了深入研究[2,5,9,16,22]，并被证明对现实世界的业务有价值，特别是售后客户服务[1,7,8,13,14,19,21,24,25]。基于生成的方法基于大规模预训练的语言模型[10,11]，具有架构更简单和拟人化交互的优势。尽管取得了重大进展，但我们发现这些令牌级生成方法在实际场景中存在以下两个限制。1. 令牌级生成方法的可靠性有限，这对面向任务的工业对话系统至关重要。

2023-04-24 19:38:19 470

原创预算约束下营销效果优化的端到端框架（快手）

向消费者提供奖励(如现金奖励、折扣、优惠券)是在线平台获取新用户、增加用户参与度、提高平台收益的有效途径[2,3,9,20,21,32,37,38,40,41]。例如，在淘宝[37]中提供优惠券以增加用户活跃度，在Booking[9]中提供促销以提高用户满意度，在快手[2]中使用现金奖励来刺激用户留存，在Uber[40]中使用促销来鼓励用户开始使用新产品。尽管有效，但这些营销活动可能会产生高成本，因此在实际场景中总预算通常是有限的。

2023-04-24 19:30:44 698

原创因果推断16--市场营销中资源分配问题的直接异质因果学习（美团）

营销是提高用户粘性和平台收益的最有效机制之一。因此，各种各样的营销活动被广泛地运用在许多网络平台上。例如，freshppo中易腐产品的降价被用来促进销售(Hua et al. 2021)，淘宝交易中的优惠券可以刺激用户活动(Zhang et al. 2021)，快手视频平台中的激励措施可以提高用户留存率(Ai et al. 2022)。尽管增加了收益，但营销活动也会消耗大量的营销资源(如预算)。因此，由于数量有限，只有部分个人(如商店或商品)可以被分配营销待遇。

2023-04-16 23:05:31 1003

原创因果推断14--DRNet论文和代码学习

估计个体在不同程度的治疗暴露下的潜在反应，对于医疗保健、经济学和公共政策等几个重要领域具有很高的实际意义。然而，现有的从观察数据中估计反事实结果的学习方法要么专注于估计平均剂量-反应曲线，要么局限于只有两种没有相关剂量参数的治疗方法。在这里，我们提出了一种新的机器学习方法，用于学习反事实表示，用于使用神经网络估计具有连续剂量参数的任意数量治疗的单个剂量-反应曲线。

2023-04-09 14:34:10 1072 1

原创强化学习1--基础知识（个人笔记）

强化学习是一种机器学习方法，能够使智能体通过与环境交互，学习如何做出最优决策以获取最大化的奖励。有广泛的应用领域，包括机器人、游戏、自然语言处理等，具有很高的研究和商业价值。基本组成部分包括智能体、环境、状态、动作、奖励和策略。其基本原理是通过不断调整策略，最大化期望的长期累积奖励；另外强化学习相较于其他机器学习方法的优势在于其可以处理非固定环境下的复杂任务，并且能够学习到长期的行为模式。

2023-03-26 22:32:18 1484

转载机器学习在美团配送系统的实践：用技术还原真实世界学习笔记

美团外卖日订单量超过2400万单，已经占有了相对领先的市场份额。美团配送也构建了全球领先的即时配送网络，以及行业领先的美团智能配送系统，智能调度系统每小时路径计算可达29亿次。如何让配送网络运行效率更高，用户体验更好，是一项非常困难的挑战，我们需要解决大量复杂的机器学习和运筹优化等问题，包括ETA预测，智能调度、地图优化、动态定价、情景感知、智能运营等多个领域。过去三年来，美团配送AI团队研发效果显著，配送时长从一小时陆续缩短到30分钟，并且还在不断提升，我们也希望通过AI技术，帮。

2023-03-20 22:39:03 1108

原创即时配送的订单分配策略：从建模和优化（学习笔记）

美团配送智能调度系统在应用之后，取得了非常不错的应用效果。下图说明了在订单结构比较类似的两个白领区域上的A/B测试结果。中关村配送站在5月6日切换了派单模式和相应的算法，大望路配送站的调度策略维持不变。可以看出，在切换后，中关村的平均配送时长有了2.9分钟的下降，严重超时率下降了4.7个百分点（相比较对比区域）。同时，在更广泛的区域上进行了测试，结果表明，在体验指标不变的前提下，新策略能够降低19%的运力消耗。换言之，原来5个人干的活，现在4个人就能干好，所以说，智能调度在降低成本上价值是很大的。

2023-03-14 23:11:27 1289 1

原创为什么基于树的模型在表格数据任务中比深度学习更优

这是一篇非常有趣的论文，虽然深度学习在文本和图像数据集上取得了巨大进步，但它在表格数据上的基本没有优势可言。论文使用了 45 个来自不同领域的数据集进行测试，结果表明即使不考虑其卓越的速度，基于树的模型在中等数据（~10K 样本）上仍然是最先进的。特征提取（Detect）、特征描述（Descriptor）、特征匹配（Match）的通俗解释_match descriptor_女王の专属领地的博客-CSDN博客。

2023-03-14 23:09:59 133

原创因果推断15--GRFlift: GMV约束下多重处理的提升模型

许多科学领域的核心问题之一是确定一个行为如何影响结果，也就是说，确定一个行为是否有因果效应或治疗效应。这是科学研究和许多学科应用中的一个基本问题。在商业中，流行的研究是，电子商务公司为了制定成功的商业战略，会重点研究广告的植入或对用户的奖励是否会给他们带来利益。相应的方法是因果推断(CI)，即确定改变一个变量(例如，治疗)的值是否会影响另一个变量(例如，结果)的值[15,22]。CI的基本方法称为隆起建模[26]。隆升建模在市场营销和保险领域的成功最初引起了人们的注意。

2023-03-14 18:51:34 688

原创因果推断12--dragonnet论文和代码学习

我们从观察数据中考虑因果效应的估计。在随机对照试验(RCT)昂贵或不可能进行的情况下，观察数据往往很容易获得。然而，从观察数据得出的因果推断必须解决(可能的)影响治疗和结果的混杂因素。未能对混杂因素进行调整可能导致不正确的结论。为了解决这个问题，医生除了收集治疗和结果状态外，还收集协变量信息。如果协变量包含所有混杂变量，则可以确定因果效应。我们将在“无隐藏混淆”的背景下贯穿全文。

2023-03-09 16:33:34 2154 1

原创推荐系统1--Deepfm学习笔记

假设我们有两种 field 的特征，连续型和离散型，连续型 field 一般不做处理沿用原值，离散型一般会做One-hot编码。离散型又能进一步分为单值型和多值型，单值型在Onehot后的稀疏向量中，只有一个特征为1，其余都是0，而多值型在Onehot后，有多于1个特征为1，其余是0。将Wide & Deep 部分的wide部分由人工特征工程+LR 转换为FM模型，避开了人工特征工程；FM模型与deep part共享feature embedding。因为线性模型有个致命的缺点：无法提取高阶的组合特征。

2023-03-05 18:47:22 813

原创因果推断10--一种大规模预算约束因果森林算法（LBCF）

向用户提供奖励(例如亚马逊的优惠券，优步的折扣和抖音的视频奖金)是在线平台用来提高用户粘性和平台收入的常用策略。尽管这些营销激励已被证明是有效的，但如果使用不当，会产生不可避免的成本，并可能导致低ROI(投资回报)。另一方面，不同的用户对这些激励措施的反应不同，例如，有些用户从未在没有优惠券的情况下购买某些产品，而另一些用户则无论如何都会购买。因此，如何在预算限制下为每个用户选择合适的激励(即待遇)是一个具有重大现实意义的重要研究问题。在本文中，我们称这种问题为预算约束的治疗选择问题。

2023-02-26 17:30:57 1873

原创因果推断7--深度因果模型综述（个人笔记）

因果关系概念在人类认知中起着重要的作用。在过去的几十年里，因果推理在许多领域得到了很好的发展，如计算机科学、医学、经济学和其他工业应用。随着深度学习的发展，它越来越多地应用于对反事实数据的因果推断。通常，深度因果模型将协变量的特征映射到表示空间，然后设计各种目标函数来无偏估计反事实数据。与现有机器学习中因果模型的研究不同，本文主要对深层因果模型进行了概述，其核心贡献如下:1)总结了多剂量治疗和连续剂量治疗下普遍采用的相关指标;2)我们从发展时间轴和方法分类角度对深层因果模型进行了全面概述。

2023-02-19 21:34:39 4633 1

FCHD预训练模型

空空如也