qq_27206435-CSDN博客

原创 Excel单元格使用xlwings包调用python函数的公式，截取子网页（标题）的试验问题求助CSDN

Excel单元格使用xlwings包调用python函数的公式，截取子网页（标题）的试验问题求助CSDNPython 环境：python3.7 的conda上的py3环境Excel 2010Excel单元格布置D114='http://mp.weixin.qq.com/s?__biz=MzU2MTgxNTE1Nw==&mid=2247484671&idx=2&sn...

2020-01-09 21:00:38 930

原创批量截取序列网页的局部网页元素，生成子网页的html代码

批量截取序列网页的局部网页元素，生成子网页的html代码批量截取子网页.py 的全部源码，适应性修改有说明用于大批量的资源链接拷贝到Excel表，集中后可分类排序规整。生成子网页文件a.html，可本地打开此网页，拷入Excel表格，主列取得资源标题和链接，以及其他列。from bs4 import BeautifulSoupimport requestsimport co...

2019-11-04 20:49:34 254

原创数据时代做好知识主人-自创文章

学校学知识打基础架构.企业通信息连四面八方.社会用数据开洞天福地倡导：数据时代做好知识主人**，通过标签阅读的杠杆方式，抓要目提纲领，盯细节通关联，掌握知识方便高效，解放学习力和思考力，激活创造力。数字的解读：±正负数，认识极性，有助于定性的认识事物性质。事物间的差别比较至少要有两种不同性质才能识别，极性，一般都指的是二极，（也有三极，甚至多极），二极足以划分出事物了。...

2019-01-25 05:00:32 164 1

原创解决pdf不能打印,不能注释,不能修改,不能保存等文档限制

解决pdf不能打印,不能注释,不能修改,不能保存等文档限制pdf下载的文件可能保存不完整，305页的只下载了298页，阅读的宝贵批注因为文档不完整而无法保存，出现109等号错误PDF“文档无法保存，读取本文档时出现问题（109）”这时可以使用文件菜单的拆分文档命令，页数选取完好的页数，拆分命令会按照这个页数一批批的做拆分。保存拆分出来的前面完好的（298页）文档，就可以用pdf正常打开，能保存编辑...

2018-07-09 17:46:34 6527

转载 Py3上的调试问题 AttributeError: module 'types' has no attribute 'ListType'求解

Py3上的调试问题

2017-12-06 21:46:41 5566

关于公司——公司成长的三个阶段，子公司和分公司.md

本文为转摘的普及商事知识的笔记.md档，可以得到一些常识性的认知。从商业角度看，公司的最终目标无非就是赚钱，持续的赚钱，持续的赚更多的钱。为此划分了公司成长的三个阶段：产品阶段，规模扩张阶段，持续经营阶段，提出了每个阶段的重点任务。持续赚钱，要有壁垒，能持久地掌握稀缺资源。重视科技的反稀缺性。公司的扩张涉及设立子公司和分公司的优点。以上内容本文做了简要归纳。

2019-12-16

数据分析体系是什么？该怎么搭建？.md

到底数据分析体系是什么？似乎经常看到的，只有AARRR五个字母，又语焉不详。到底怎样才算是建了个体系？今天我们系统解答一下。本文为细心整理的.md笔记，做了摘记概括。 **搭建数据分析体系常犯错误**是丢失重点、目标，陷入指标细节；贪大求全的使用同一套指标而不加以区分职责。 **数据分析要旨**在于解释数据背后的业务含义，找到**对业务有用的价值点**。 **数据分析体系**能**更有效率**的支持业务，把数据报表、专题报表串起来，有层次展现，应用到业务中。**有节奏、有主次、有顺序的展现**数据。 **搭建数据分析体系的基本思路**：明确服务对象即针对的需求方负责人；明确工作目标，量化目标，可以计算目标和现状的差距；监督业务走势，发现问题苗头；了解业务行动，分解业务细节，找到数据可以帮助的价值点；行动之后，复盘行动结果，事后总结出普遍的经验。优秀的业务能力永远稀缺，不可复制。复盘的意义：把明显的作死行为总结出来，避免普通人犯错。 **数据分析体系不是一成不变，也需要迭代升级，提升专业水准的要求**：坚守目标，迭代方法，积累经验。固定通用产品、临时个体专题。 **回到出发点，重视业务需求**：从业务中来，到业务中去；用专业的方法服务个性化需求 ### 精彩段子： **数据的优势，不是直接生产出超人的创意，而是事后总结出普遍的经验**。**优秀的业务能力永远是稀缺资源，是不可复制的**。但通过数据分析复盘，可以**把明显的作死行为总结出来，避免普通人犯错**。 **数据的作用：长期积累的业务方经验，（基于普遍意义）为遇到的问题提供思路。** **做业务从来不怕失败，怕的是败的不明不白**。

2019-12-13

数据分析，怎么做才能有前瞻性.md

有同学问：领导总让做“**有前瞻性**”的分析，不要说那些“**大家都知道**的事”。可到底什么是前瞻性？有时候明明写了预计未来情况，可还是被批判为：没啥前瞻性。真不知道咋办了。——今天系统解答一下。通过细致的分析，看到深层次问题，讲出来没人知道的惊天秘密，听起来多厉害。本文经过细心整理为.md档，可以获知：真正的前瞻性，是定性预测而建数据模型详细计算，是定量预测; 本文重点如下：影响因素的分类标准为：可辨识程度，注意影响方式和前瞻性高低

2019-12-13

区块链：一场信任革命——技术原理.md

区块链：一场信任革命——技术原理.md，比较浅易介绍区块链概念和技术原理的科普短文。本文笔记做了详细的书签和粗体、下划线规整，以便对照纲目快速阅读。内容讲解很精当也很好懂。

2019-12-06

产业互联网本质是对100万亿GDP的重新解构.md

产业互联网的**本质**究竟是什么？产业互联网**最大的机会**在哪儿？产业互联网下的**投资逻辑**与消费互联网下的投资逻辑是否存在巨大差异？带着这些疑问，产业家邀请**盛景网联董事长、盛景嘉成母基金创始合伙人彭志强**与我们聊了聊他所理解的产业互联网。本文是钛媒体文章的.md摘记，内容较深较新，需要多读几遍才能领会深意。

2019-12-03

大数据技术发展趋势，大数据常用技术有哪些？.md

大数据技术的背景、历程和发展趋势，带有综述总结性质。大数据需要的编程语言，常用的技术，常识性介绍。.md档整理

2019-12-02

知识图谱从哪里来：实体关系抽取的现状与未来.md

清华大学刘知远老师和学生韩旭、高天宇所写的关于知识图谱相关的介绍。机器之心获授权转载，此文为.md笔记加注，便于迅速理解消化当前研究进展。沿着实体关系抽取需要进一步探索的四个主要方向，介绍这四个方面的发展现状和挑战，以及一些思考和努力。

2019-12-02

5种小型设备上深度学习推理的高效算法.zip

5种小型设备上深度学习推理的高效算法.md 移动电话等小型边缘设备上实现的嵌入式系统的深度学习应用的部署、训练和运用越发变得困难，因为运算速度和资源利用（存储、传输）受到硬件限制。由此提出有效地进行推理的最先进算法：修剪神经网络，深度压缩，数据量化，低阶近似，训练三元量化。本.md笔记做了消化整理和标签标注，加注按字和粗体及下划线，其余忠实原文，个别适应结构调整有断行。过程主要有：剪枝和重训练网络，修剪和再训练。很多细节不能一一罗列，需要下沉阅读。附博客摘记也如法做了整理：剪枝算法：有效神经网络的权值和连接学习附论文：学习有效神经网络的权值和连接（Learning both Weights and Connections for Efficient Neural Networks） 1411.4229 微软（亚洲）研究院关于对非线性卷积网络的高效精确近似值的论文《Efficient and Accurate Approximations of Nonlinear Convolutional Networks》 fpga16-cnn 清华大学CNN研究人员的论文《CNN的嵌入式FPGA平台的深入研究（Going Deeper with Embedded FPGA Platform for CNN）》

2019-12-02

这三个博弈论新趋势，正深刻影响深度强化学习.md

目前，大多数 DRL 模型事实上还停留在传统的博弈论层面，例如**纳什均衡或零和游戏**等。但随着DRL的发展，传统博弈论方法已经逐渐呈现出不足之处，而同时则有一些新的博弈论方法被纳入到人工智能的程序当中。雷锋网公众号介绍三种深刻影响 DRL 的「新」博弈论方法：平均场博弈（Mean Field Games，MFG）；随机博弈（Stochastic games）；进化博弈（Evolutionary Games，EGT）。本文是对公众号介绍文章的消化再整理：标注按字者，加注标签；关键地方，有粗体和下划线。适合快速而较系统的了解博弈发展状况的读者。

2019-12-01

2019年泵业行业薪酬设计方案.pdf

本篇为薪酬网数据部整理编撰的行业薪酬设计案例（未必是具体的行业，但可参考借鉴），经过了目录标签化和重点词的下划线整理，以方便阅览，有利于了解一般的薪酬设计原则和规律，用人部门和职场人士职业规划，可资借鉴。本文主要介绍薪酬设计的指导思想和原则（3P定薪，3E公平理念；薪酬体系系统规范，职序、层级确立薪酬水平；能力成长得到薪酬的认可；业绩导向；控制成本，确保可持续发展），薪酬策略的制定（调整体现三公：内部、外部公平，人员与岗位公平；依据人才档次、薪酬水平和成本压力；调整的对象包括水平，结构，要素；时机包括普调（根据效益）和临调（根据个体绩效））。本文分别论述了薪酬的水平、结构和制度设计，绩效制度设计，给出了岗位薪酬设计模板，附加了薪酬调查报告，调研方法、口径和名词解释。薪酬设计是建立现代薪酬管理制度的前提和重要组成部分，是公司人力资源管理中最核心的内容，关系到公司的经营管理以及长远的发展。薪酬设计是对个人劳动价值的具体体现。合理的薪酬设计能充分调动员工的工作热情，激发其才能的发挥，使其获得满足感、荣誉感，进而更好地促进公司的发展壮大。

2019-11-18

如何做好知识型员工的激励.md

此文做了目录大纲和要点粗体标记，内容上较完整的探讨了知识型员工的激励问题，有利于职业规划参考。关于知识型员工的定义，国内外管理专家对知识型员工的激励因素做过的调查研究，知识型员工的激励因素按：总结为薪酬福利、工作挑战性、工作自主性、个体成长性、个体荣誉感。马斯洛的五级需求分别有这五种激励因素满足：薪酬福利满足生理需要，工作自主性满足安全需求，个体荣誉感满足归属感和爱的需要，个体成长性（工作挑战性）满足尊重和自我实现的需要。做好以下几方面的激励因素设计，提升知识型员工的工作积极性：知识型员工薪酬体系的设计，分为经营者和其他员工；实施参与式管理；做好员工尊重感管理（设立奖项，榜样激励，情感激励）。

2019-11-18

开源正在吞噬软件业？看开源的7大理念.md

本文分析了开源的7大理念，有助于读者更好理解**开源的本质要素**，这些理念为“完全自主”、“高度开放”、“自发自治”、“自下而上”、“自由竞争”、“赢在声誉”、“社区赋能”。从中可理解：程序员自主可控，项目方向自由开放，用户的四大自由，即运行、修改、发布，出售，自由即不需要任何人许可。开源软件不受美国出口管制（EAR），软件公开可获取条件下的不受EAR管制，如果涉及加解密技术就必须要求加解密技术本身也要公开可获取。社区自发自治组织，提供有领导、维护、提交、使用和贡献五者角色。传统项目和开源项目的组织特点，可描述如层级化的大教堂模式和扁平化的大集市模式。开源的世界在自下而上的发展，都体现在技术上（单个产品项目）、生态上（开源软件之间）以及发展成就上。开源世界鼓励自由竞争，软件在竞争，个人也在竞争，竞争发现优胜者，给与声誉、权力和市场回报。开源可以获得项目发展、能力增长、回馈社会、自我实现，声誉。声誉对个人和企业都有好处，直接的，无形的；项目成长，市场份额，人才。开源发展依赖于社区，社区赋予开源软件的生命，社区力量的壮大，除了个人贡献，更多的依赖企业的贡献，也有利于企业降低维护代价，更多

2019-11-09

批量截取子网页.zip

提供批量截取子网页.py的全部源码，py3运行，适应性修改有说明 - 用于大批量的资源链接拷贝到Excel表，集中后可分类排序规整。 - 生成子网页文件a.html，可本地打开此网页，拷入Excel表格，主列取得资源标题和链接，以及其他列。

2019-11-04

朱松纯：走向通用人工智能——从大数据到大任务.md

北京智源人工智能研究院主办的 2019 北京智源大会，第一天的主论坛上，美国加州大学洛杉矶分校的朱松纯教授带来了《走向通用人工智能：从大数据到大任务》的主题演讲，并提出了任务是智能中心的观点。这是AI科技大本营（ID:rgznai100）整理后的阅读摘记md档。主要内容有三：两种AI范式之争：“大数据”对“大任务”。以任务为中心的智能。如何构建“大任务”训练与测试平台？观点新颖。例如，理解小数据、大任务，从根本任务出发，可以根本不需要数据

2019-11-02

简历写作中的STAR原则.md

简历写作中的STAR原则，即Situation（情景）、Task（任务）、Action（行动）和Result（结果）四个英文单词的首字母组合。百度百科有不少解说。本文选摘两篇，学习融合，取其要义，加上本人理解而得，旨在融汇思路，助力简历的项目经验写作。实际中有需加强这方面的写作能力训练的人士，可共享共勉。本文的主要论述有：概念定义，各项（术语）解释，总体的概括解释，举例说明，目的效果说明，简历写作的借鉴模块（强调一下能力概括，让人发掘闪光点），写作要点（模块化STAR，结合具体能力要求）。

2019-09-26

图卷积神经网络的变种与挑战.zip

半监督图卷积神经网络(Semi-GCN)对原始的GCN进行了约束与简化，也因此诞生了诸多研究方向。GraphSAGE首先归纳出了Neighbor Aggregate模式；GAT将Attention机制引入到了GCN当中；GeniePath尝试将GCN的层次做深。本次讨论将主要介绍semi-GCN之后的这些变体与它们之间的联系，以及当前GCN研究当中的问题与挑战。高扬，中国科学院信息工程研究所硕博二年级在读。本压缩包即其分享的整理，除了ppt外，也包括图片pictures和md档。

2019-09-23

吴文俊：不朽的数学人生，照耀人工智能发展之路.zip

吴文俊：不朽的数学人生，照耀人工智能发展之路.md,纪念这位大师！吴文俊先生纪念网站的主要资源，打好标签的几篇主要pdf著作包：（王世强）数理逻辑与范畴论应用，几何定理机器证明的基本原理（初等几何部分）（吴文俊），计算机科学中的范畴论陈意云，强对偶定理证明，数学丛书.-.[现代数学基础丛书].[非线性代数方程组与定理机器证明].（吴文俊），数学原理（第一卷)分为集合论、范畴论、范代数和模型论戴均著，吴文俊论数学机械化著述全集，吴文俊与数学机械化_纪志刚-论文，张量（理论和应用）（郭仲衡）

2019-09-22

吴文俊：不朽的数学人生，照耀人工智能发展之路.md

2019.09.17 中国人工智能学会原名誉理事长、中国科学院院士吴文俊获“人民科学家”国家荣誉称号的新闻报道。回顾大师不朽的数学人生，了解成就：吴类（拓扑学示性类及示嵌类）和吴公式，古代数学的算法和可计算性分析，开创崭新的**数学机械化**领域，提出 **用计算机证明几何定理的“吴方法”**,成为**自动推理领域**的先驱。哥德尔的不完备性定理昭示了数学真理的探索永无止境，没有囊括一切真理的公理系统存在。真理的发展和认识是无穷的。不完备恰好预留了真理发展的空间。欧几里得几何的公理体系由于不包含初等数论，所以是完备的。吴文俊先生为了弘扬中国数学构造性算法化的传统，将数学（特别是代数几何）与计算机科学相结合，开创了机器几何定理证明的方向，只手擎天地推动了**数学机械化**的发展。列举的两个应用例子，可以大略知晓基于吴方法的自动几何定理定理证明大致步骤，机器人路径规划一类的逆向运动学问题（inverse kinematics）所需要求解的多项式方程组可以使用吴方法。吴方法属于人工智能的符号主义流派。吴方法为人工智能的**符号计算**提供了**坚实的理论基础和高效的算法**，特别是**算法的每一步骤都可以被人类透彻理解**，它**代表了智能中严密清晰的逻辑思维层面**，和**连接主义中概率模糊的感性直觉层面互补**。

2019-09-21

5G NSA（非独立组网）和SA（独立组网）是什么？有什么不同？三分钟看懂.md

5G除了极致移动带宽（eMBB）外，还定义了两个场景 mMTC（海量机器互联）和 uRLLC（超低延时通信）。5G 是未来大势所趋，但 4G 仍是主流。据相关咨询公司预测，在 2020 年，4G 将承载全球 88% 的流量，即使到了 2025 年，4G 用户数仍然占据 50% 到60% 。因此，和 4G 不同，业界对 5G 的投资都会比较谨慎，希望能投石问路，循序渐进。这一切也反映在了 3GPP 对 5G 的架构标准化的进程上。在最早冻结的 5G NSA（非独立组网）下，5G 无法单独工作，仅仅是作为 4G 的补充，分担 4G 的流量。本文针对 5G 的网络架构，在 3GPP TSG-RAN 第 72 次全体大会上提出的 8 个选项，一一作了分析，给出了5G组网演进路径两种：一步到位的土豪方式（节省投资）和循序渐进（最低风险）的方式。最后形象给出了5G之花（还有三片绿叶：谱效、能效、成本）。

2019-09-20

数据产品诸葛io.zip

数据产品诸葛io，主要收录官网的主要资源目录，全部是md档，很便于阅览，另收录八大数据分析模型。时间2019.08.19。

2019-08-19

泵知识大全 ‖ 纯干货.zip

泵知识大全 ‖ 纯干货，为泵入门知识的md读物，适合通览阅读。

2019-08-16

一起捋一捋机器学习分类算法.zip

一起捋一捋机器学习分类算法.md，摘自某公众号的文章，简单捋一下。对核函数概括较细。

2019-08-16

终于把时间序列分析的关键点全讲清楚了！

时间序列分析的关键点

2022-12-26

NLP算法面试必备！史上最全！PTMs：NLP预训练模型的全面总结.md

**预训练模型(Pre-trained Models,PTMs)**的出现将NLP带入了一个全新时代。2020年3月18日，**邱锡鹏老师**发表了**关于NLP预训练模型的综述《Pre-trained Models for Natural Language Processing: A Survey》**[[1\]](https://zhuanlan.zhihu.com/p/115014536#ref_1)，这是一篇**全面的综述**，**系统**地对PTMs进行了**归纳分类**。知乎上发表的本文以此篇综述论文为主要参考，通过借鉴不同的归纳方法进行总结，同时也**整合**了专栏之前已经介绍过的《[nlp中的词向量对比](https://zhuanlan.zhihu.com/p/56382372)》和《[nlp中的预训练语言模型总结](https://zhuanlan.zhihu.com/p/76912493)》**两篇文章，以QA形式对PTMs进行全面总结归纳**。本文是.md笔记档

2020-04-08

模块化、反事实推理、特征分离，「因果表示学习」的最新研究都在讲什么？.zip

本文精选了几篇**因果表示学习**领域的最新文献，并细致分析了不同方法的基本架构，希望能帮助感兴趣的你对**因果学习应用于机器学习**的方向和可能一探究竟。提取模块化结构（Learning modular structures）反事实推理（Counterfactual）平衡因果表示学习收录了此文补充引用的文章图灵奖得主Judea Pearl：机器学习的理论局限性与因果推理的七大特性最后，本.md笔记收录了丁鹏老师的因果推断简介连载文章

2020-04-08

ICLR 2020 Bengio 一作论文：因果机制、元学习与模型泛化如何产生关联？.zip

Yoshua Bengio 等人基于学习器适应新分布的速度提出一种元学习因果结构，假设新分布由干预、智能体动作以及其它非稳态（non-stationarity）导致的稀疏分布变化引起，由此得出“正确的因果结构选择会使学习器**更快地适应修改后的分布**”。该假设的研究将“适应修改后分布的速度”作为元学习的目标，表明“这可用于决定两个观测变量之间的因果关系”。研究结论的价值即特点和优势发现是，分布变化无需对应标准干预，学习器不具备关于干预的直接知识。因果结构可通过连续变量进行参数化，并以端到端的形式学得。研究探讨了想法的如何应用，来满足“独立机制以及动作和非稳态导致的机制内微小稀疏变化 ”的假设。

2020-04-08

二值神经网络（Binary Neural Networks）最新综述.md

知乎转引的此文介绍了来自北京航空航天大学刘祥龙副教授研究团队的最新综述文章 **Binary Neural Networks: A Survey**，合作者包括中国电子科技大学的宋井宽教授和意大利特伦托大学计算机系主任 Nicu Sebe 教授。在阅读基础上，做了.md的笔记。摘要如下：神经网络二值化能够**最大程度地降低模型的存储占用和模型的计算量**，将神经网络中**原本 32 位浮点数参数量化至 1 位定点数**，**降低了模型部署的存储资源消耗，同时极大加速了神经网络的推断过程**。但二值化会不可避免地导致**严重的信息损失**，其**量化函数不连续性也给深度网络的优化带来了困难**。近年来许多算法被提出致力于解决上述问题，并取得了令人满意的进展。在本文中，我们对这些方法进行了全面的总结和概括，主要分为**直接量化的朴素二值化方法**，以及使用**最小化量化误差**、**改善网络损失函数和减小梯度误差**等技术的**改进二值化方法**。本文还调研了二值神经网络的**其他实用方面**，例如**硬件友好的设计和训练技巧**。然后，我们对**图像分类，目标检测和语义分割**等不同任务进行了**评估和讨论**。最后，本文展望了**未来研究可能面临的挑战**。

2020-04-02

华为深度学习框架MindSpore正式开源：自动微分不止计算图.md

今年的华为开发者大会 HDC 2020 上，除了**昇腾、鲲鹏等自研芯片硬件平台**之外，最令人期待的就是**深度学习框架 MindSpore 的开源**了。今天上午，华为 MindSpore **首席科学家陈雷**在活动中宣布这款产品正式开源，我们终于可以在开放平台上一睹它的真面目。本文是根据机器之心报道的MindSpore 的开源介绍而整理的.md笔记作为一款支持**端、边、云独立/协同的统一训练和推理框架，华为希望通过这款完整的软件堆栈，实现**一次性算子开发、一致的开发和调试体验**，以此帮助开发者实现**一次开发，应用在所有设备上平滑迁移**的能力。三大创新能力：新编程范式，执行模式和协作方式由**自动微分、自动并行、数据处理**等功能构成开发算法即代码、运行高效、部署态灵活**的**特点**，三层核心：从下往上分别是**后端运行时、计算图引擎及前端表示层**。最大特点：采用了业界最新的 **Source-to-Source 自动微分**，它能**利用编译器及编程语言的底层技术**，进一步**优化以支持更好的微分表达**。主流深度学习框架中主要有**三种自动微分技术，才用的不是静态计算图、动态计算图，而是基于**源码**转换：该技术源以**函数式编程框架**为基础，以**即时编译（JIT）**的方式**在中间表达（编译过程中程序的表达形式）上做自动微分变换**，支持**复杂控制流场景、高阶函数和闭包**。 MindSpore 主要概念就是张量、算子、单元和模型其代码有两个比较突出的亮点：计算图的调整，动态图与静态图可以一行代码切换；自动并行特性，我们写的串行代码，只需要多加一行就能完成自动并行。

2020-04-02

清华开源深度学习框架计图，开源超级玩家再进阶.md

清华大学计算机系图形实验室宣布开源一个全新的深度学习框架： Jittor，中文名计图。 Jittor 是一个采用元算子表达神经网络计算单元、完全基于动态编译（Just-in-Time）的深度学习框架。创新的元算子和统一计算图。元算子在保证易用性的同时，能够实现更复杂、更高效的操作。而统一计算图则是融合了静态计算图和动态计算图的诸多优点，在易于使用的同时，提供高性能的优化。本文介绍了其特性、超越 Pytorch的性能，背后的研发团队。为便于阅读而整理为此篇.md笔记

2020-03-24

实操！数据分析人必须要会的模型：波士顿矩阵！.md

以波士顿矩阵和安索夫矩阵为例，介绍数据分析基础思维的矩阵思维，即二元关系思维。用Excel演示。来源是“数据分析不是个事儿”的微信公众号文章，做了简单标记的md档。

2020-03-24

原来Transformer就是一种图神经网络，这个概念你清楚吗？.md

现为**南洋理工大学助理研究员的 Chaitanya Joshi 将为读者介绍图神经网络和 Transformer 之间的内在联系**。具体而言，作者首先介绍 **NLP 和 GNN 中模型架构的基本原理**，使用公式和图片来加以联系，然后讨论怎样能够推动这方面的进步。本文由智察机器人利用深度学习和知识图谱等技术, 从海量信息中自动发现并生成。共享此文前做了md标注，以期充分消化理解此文。

2020-03-18

出自陶大程、叶杰平老师等大牛之手的 GAN 详细综述.rar

出自陶大程、叶杰平老师等大牛之手的 GAN 详细综述，包括论文 A Review on Generative Adversarial Networks：Algorithms, Theory, and Applications，和对微信公众号分享的综述的整理的md笔记档，适合自学收藏。

2020-03-11

BeautifulSoup.zip

近日实际学习和使用爬虫的python工具BeautifulSoup的精选资料包，全部是整理的.md笔记档，目录结构清晰，特分享以供爬虫学习、使用者速学速查之便，共有三份文档： Beautiful Soup 4.4.0 文档，最新的文档，作参考手册用，现查现用。 Python爬虫之Beautiful Soup用法-简书，总结得比较到位，适合概念迅速消化自学，推荐，另附有DOM的百度百科解释。本文做了重点摘清。 BeautifulSoup使用find，find_all 实际用的较多的函数，注意的常见问题。

2019-12-27

REST API.md

REST是设计分布式网络服务或API时遵循的架构原则以及设计风格, 前后端分离最佳实践的开发标准或规范。本文为资料收藏的.md笔记，选取比较重要的资料，收集了以下内容：重要概念介绍，如前述的第2-第4个关键词。 REST API的优点：缓存Cache提高响应性能，本身的“无状态”和“扩展性”，不需要额外的资源发现机制 REST 、DO、RPC之间区别对比 REST与CORBA、SNMP、SOAP比较腾讯开放平台REST API 示例通过URL来设计系统结构，抽象的是资源，而不是对象、过程，完成的是用户接口 REST API的开发框架介绍:JSR-311,REST Web

2019-12-25

深度学习的实现与发展——从神经网络到机器学习.md

**深度学习（Deep Learning）**是建立在**计算机神经网络理论和机器学习理论**上的**系统科学**，它使用建立在复杂的机器结构上的**多处理层**，结合**非线性转换**方法算法，对**高层复杂数据模型**进行抽象。本文笔记收获以下重点： “深度学习是**建立在深度结构神经网络上的复杂思维模式机器学习**”的认识(**按：重点认知**)。 **RBM 的结构比BM 的网络拓扑结构更简单**，因为**各层内部神经元之间没有连接**，很大程度上**提高了网络训练与学习的效率**。构造**深度置信网络（DBN）**时都是**先构造出RBM，再将某些RBM 堆栈起来得到DBN**。目前（**按：重点**）**关于数据表示，有局部表示、分布表示和稀疏分布表示**。那么是否有**新的表示思路来更新数据模型**，如**加入不同的稀疏惩罚对RBM 和EA 训练进行改进**。 **特征提取**，范例有高斯伯努利模型；算法研究关注自适应的特征提取和自动编码机制；泛化结构不仅包括树、图结构，还要更多;预训练和判别微调方法还有待进一步改进和提升 **学习可控性** 是机器学习需要关注的一个问题，即**到底赋予机器多少权限和思维能力**。**机器学习的最大隐患**—“**学习失控**”。

2019-12-24

《麻省理工科技评论》年度中国科技青年英雄榜发布！35位入选者涵盖全球最前沿科学与技术.md

从 1999 年开始，每一年《**麻省理工科技评论**》都会选出一批 35 岁以下最具有创新性与影响力的科学家、科研工作者、科技创业者，他们是： **发明家（Inventors）** **创业家（Entrepreneurs）** **远见者（Visionaries）** **人文关怀者（Humanitarians）** **先锋者（Pioneers)** 2017 年**《麻省理工科技评论》协同中国地区独家合作伙伴 DeepTech 一道将榜单落地中国，正式推出《麻省理工科技评论》中国区“35 岁以下科技创新 35 人”**。今年是《麻省理工科技评论》创刊 120 周年，第三届“35 岁以下科技创新 35 人”中国榜单在 2019 年 12 月 14 日的 EmTech China 全球新兴科技峰会揭晓**。《麻省理工科技评论》2019 年中国“ 35 岁以下科技创新 35 人”获奖者名单（按姓名首字母排序）本文.md档收录了媒体的介绍报道，重点是梳理入榜者的主要研究成果，加以归纳。

2019-12-16

Vaex——一个开源的DataFrame库，它可以对表格数据集进行可视化、探索、分析，甚至机器学习

**Vaex是一个开源的DataFrame库**，它可以对表格数据集进行**可视化、探索、分析，甚至机器学习**，这些数据集和你的硬盘驱动器一样大。**它可以在一个n维网格上每秒计算超过10亿（10^9）个对象的平均值、和、计数、标准差等统计信息**。可视化使用直方图、使用直方图、密度图和3D立体渲染进行可视化。为此，**Vaex采用了内存映射、高效的外核算法和延迟计算等概念来获得最佳性能（不浪费内存）**。本文是上述介绍的.md笔记档，为一个刚好超出RAM范围（如50GB甚至500GB的数据集）的数据集做分析，又不能破费成本的设置一个集群， Vaex作为一个开源的DataFrame库，带来了解决方案！例子是使用纽约市出租车的数据集。

2019-12-14

国产数据库年终大盘点！.md

**去“IOE”**这个概念，最早由王坚院士在刚刚加入阿里时提出，其目标是**将IBM 的小型机、Oracle数据库、EMC存储设备从阿里的IT体系中去除，代之以自主研发的系统**。随着**国产云计算服务水平**的不断发展，**国外厂商的小型机和存储，已经不多见**，**不过IOE中的O也就是Oracle、DB2等国外厂商的数据库，还依旧在我国市场大行其道**。本文带大家一起来盘点一下**国产数据库的发展现状**。此文为.md笔记金融级高可用融合OLTP和OLAP 标准SQL、事务与NoSQL的分布式存储相结合的JSON标准存储格式多产品线的数据库（对标Oracle）海量数据的时序数据库对标MySQL 涉及存储，查询，索引，高可用，事务，批处理，并发，访问冷热，时序

2019-12-14

数据爬虫怎么治？最新研究报告：强调场景化治理.md

在CIS 2019网络安全创新大会上，上海数据治理与安全产业发展专委会秘书处与赛博研究院联合发布的《数据爬取治理》研究报告。本.md笔记档，简单消化基础上，做了文字转化和节段标签标注，旨在方便自助查询和理清思路。

2019-12-04

2019年企业数据生产力调研报告.md

帆软数据应用研究院对2019帆软第二届数据生产力大赛的参赛企业进行了调研，形成的本次调研报告。从**价值定位、工作状态、专业能力和价值体现**四个方面分析参赛企业的数据应用现状，分析获奖企业的领先优势（数据应用普及率和数据应用成熟度）和因素（主要在人，团队配合和专业能力）。本文是.md笔记，对要点一一清点，标注粗体和打好节段目录标签，以便迅速掌握报告结构，了解当前情势。对报告写作有结构化思维的训练意义。

2019-12-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 Excel单元格使用xlwings包调用python函数的公式，截取子网页（标题）的试验 问题求助CSDN

原创 批量截取序列网页的局部网页元素，生成子网页的html代码

原创 数据时代做好知识主人-自创文章

原创 解决pdf不能打印,不能注释,不能修改,不能保存等文档限制

转载 Py3上的调试问题 AttributeError: module 'types' has no attribute 'ListType'求解

关于公司——公司成长的三个阶段，子公司和分公司.md

数据分析体系是什么？该怎么搭建？.md

数据分析，怎么做才能有前瞻性.md

区块链：一场信任革命——技术原理.md

产业互联网本质是对100万亿GDP的重新解构.md

大数据技术发展趋势，大数据常用技术有哪些？.md

知识图谱从哪里来：实体关系抽取的现状与未来.md

5种小型设备上深度学习推理的高效算法.zip

这三个博弈论新趋势，正深刻影响深度强化学习.md

2019年泵业行业薪酬设计方案.pdf

如何做好知识型员工的激励.md

开源正在吞噬软件业？看开源的7大理念.md

批量截取子网页.zip

朱松纯：走向通用人工智能——从大数据到大任务.md

简历写作中的STAR原则.md

图卷积神经网络的变种与挑战.zip

吴文俊：不朽的数学人生，照耀人工智能发展之路.zip

吴文俊：不朽的数学人生，照耀人工智能发展之路.md

5G NSA（非独立组网）和SA（独立组网）是什么？有什么不同？三分钟看懂.md

数据产品 诸葛io.zip

泵知识大全 ‖ 纯干货.zip

一起捋一捋机器学习分类算法.zip

终于把时间序列分析的关键点全讲清楚了！

NLP算法面试必备！史上最全！PTMs：NLP预训练模型的全面总结.md

模块化、反事实推理、特征分离，「因果表示学习」的最新研究都在讲什么？.zip

ICLR 2020 Bengio 一作论文：因果机制、元学习与模型泛化如何产生关联？.zip

二值神经网络（Binary Neural Networks）最新综述.md

华为深度学习框架MindSpore正式开源：自动微分不止计算图.md

清华开源深度学习框架计图，开源超级玩家再进阶.md

实操！数据分析人必须要会的模型：波士顿矩阵！.md

原来Transformer就是一种图神经网络，这个概念你清楚吗？.md

出自陶大程、叶杰平老师等大牛之手的 GAN 详细综述.rar

BeautifulSoup.zip

REST API.md

深度学习的实现与发展——从神经网络到机器学习.md

《麻省理工科技评论》年度中国科技青年英雄榜发布！35位入选者涵盖全球最前沿科学与技术.md

Vaex——一个开源的DataFrame库，它可以对表格数据集进行可视化、探索、分析，甚至机器学习

国产数据库年终大盘点！.md

数据爬虫怎么治？最新研究报告：强调场景化治理.md

2019年企业数据生产力调研报告.md

空空如也

原创 Excel单元格使用xlwings包调用python函数的公式，截取子网页（标题）的试验问题求助CSDN

原创批量截取序列网页的局部网页元素，生成子网页的html代码

原创数据时代做好知识主人-自创文章

原创解决pdf不能打印,不能注释,不能修改,不能保存等文档限制

数据产品诸葛io.zip