baidu-liuming-CSDN博客

转载广告基本术语

1、CPC(Cost Per Click) ，每点击成本，是一种点击付费广告，根据广告被点击的次数收费。2、CPM(Cost Per Mille) ，每千人成本，是一种展示付费广告，只要展示了广告主的广告内容，广告主就为此付费。3、OCPC(optimization cost per click)，目标转化出价功能，采用更科学的转化率预估机制的准确性，可帮助广告主在获取更多优质流量的同时提高转化完成率。4、CVR(Conversion Rate)，转化率，是一个衡量CPA广告效果的指标，简言之就是用户

2021-05-16 21:18:41 811

转载 python中初始化二维数组

Python中初始化一个5 x 3每项为0的数组，最好方法是：multilist = [[0 for col in range(5)] for row in range(3)]没错，那我们初始化一个二维数组时，是否可以这样做呢：multi = [[0] * 5] * 3其实，这样做是不对的，因为[0] * 5是一个一维数组的对象，* 3的话只是把对象的引用复制了3次，比如，我修改multi[0][0]：multi = [[0] * 5] * 3multi[0][0] = 'Love Chin

2021-03-29 15:54:58 788

转载【Python 模块学习】NumPy中的维度(dimension)、轴(axis)、秩(rank)的含义

NumPy的时候，其中最重要的就是学习它的 ndarray 对象，它是多维度的同数据类型的数组。这个和Python自带的列表有较大的区别，列表中的元素类型是可以不相同的，如一个列表中，它可以包含数字、字符、字符串等，而在数组中，它的数据类型是相同的，如都是整型或者浮点型。为什么Python中已经有了列表之后，在NumPy中还要引进一个数组对象呢？有以下三点可以作为参考，但在本文中不做具体描述：数组对象可以去掉元素间运算所需的循环，使一维向量更像单个数据设置专门的数组对象，经过优化，可以提升这类应用.

2021-03-16 20:30:13 1212

转载 flatten层的作用

flatten是用来对数组进行展平操作的，首先我们假设有一张灰度图片，这个图片只有3x3个像素点，分别是从1到9，我们对其进行flatten操作。首先它会把每1行进行分开，然后用第2行接在第1行后面，形成一个新的数组1，2，3，4，5，6，最后再把第3行的7，8，9接在新生成的数组后面形成最终的数组。接下来我们来验证一下我们的猜想。首先导入numpy包，用它来创建一个3x3的二维数组a，并将a打印出来。灰色图片是一维的，对其flatten：我们可以看到，经过flatten操作之后，本来3行的数

2021-03-15 13:03:38 12495

原创深入理解transformer源码

推荐博客：深入理解transformer源码

2021-03-15 12:48:48 125

原创 RNN & LSTM

最近重温RNN，将比较好的博客和做的实例记录下：RNN & LSTM原理：RNN实例：

2021-03-15 12:44:22 62

转载 TensorFlow的reduce_sum()函数

官方解释：import tensorflow as tf# 交叉熵评估代价cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1]))上面是TensorFlow官方文档中的函数解释。其实在reduce_sum()中，是从维度上去考虑的（感觉这个Matlab中数据的概念比较像）调用 reduce_sum(arg1, arg2) 时，参数arg1即为要求和的数据，arg2有两个取值分

2021-03-15 12:40:25 188

原创 CNN卷积神经网络

最近重温CNN，对原理细节重新推敲了一遍，网上有很多博客讲解的不错，在此做个总结。博客CNN原理，推荐七月的这一篇：CNN笔记：通俗理解卷积神经网络全连接层的作用：CNN 入门讲解：什么是全连接层（Fully Connected Layer）?这个知乎专栏写的很不错：卷积神经网络（CNN）入门讲解按照官方教程实现的实例：卷积神经网络（CNN）实例使用keras实现卷积神经网络定义CNN结构class CNN(tf.keras.Model): def __init__(self):

2021-03-15 12:26:41 340 1

转载 python 不以科学计数法输出

文章目录numpy不以科学计数法输出numpy不以科学计数法输出pandas不以科学计数法输出,最大显示无省略号行列【10*10】print不以科学计数法输出numpy不以科学计数法输出numpy不以科学计数法输出np.set_printoptions(suppress=True)pandas不以科学计数法输出,最大显示无省略号行列【10*10】pd.set_option('display.max_columns', 10, 'display.max_rows', 10,'display.flo

2021-03-15 11:43:36 2332

转载 python的with关键字

文章目录前沿格式原理自定义类应用场景前沿with表达式其实是try-finally的简写形式。但是又不是全相同。格式"""格式with context [as var]: pass"""其中的context是一个表达式，返回的是一个对象，var用来保存context表达式返回的对象，可以有单个或者多个返回值。with open('1.txt') as f: print(f.read()) print(f.closed)表达式open(‘1.txt’)返回是一

2021-03-15 10:51:26 125

转载 Linux系统下一次性杀掉相同名称的进程的方法

2021-02-08 20:43:25 482

转载 shell-判断指定文件中是否包含指定的字符串

来自百度grep "prod" /home/admin/gitrep/otp/otp-webapp-api/src/main/webapp/WEB-INF/web.xml > /dev/nullif [ $? -eq 0 ]; then echo "Found!"else echo "Not found!"fi修改后的if [ `grep -c "prod" /home/admin/gitrep/otp/otp-webapp-api/src/main/webapp/WEB

2021-02-05 17:03:56 4103 2

转载 Python的MRO

Python的MRO即Method Resolution Order（方法解析顺序），即在调用方法时，会对当前类以及所有的基类进行一个搜索，以确定该方法之所在，而这个搜索的顺序就是MRO。在Python2.3之前，MRO的实现是基于DFS的，而在Python2.3以后MRO的实现是基于C3算法（我这里两种算法的具体实现都不详述）。C3算法最早被提出是用于Lisp的，应用在Python中是为了解决原来基于深度优先搜索算法不满足本地优先级，和单调性的问题。本地优先级：指声明时父类的顺序，比如C(A,B)，

2021-01-25 19:15:12 123

转载理解Python中super()

1.单继承在单继承时，super().init()与Base.init()是一样的。super()避免了基类的显式调用。代码如下：Base.init()class Base(object): def __init__(self): print 'Create Base'class A(Base): def __init__(self): Base.__init__(self) print 'Create A'A()# 测试结

2021-01-25 19:01:43 127

转载 Jupyter notebook选择conda环境

服务器上配置有多个conda的Python环境，在使用jupyter notebook时需要使用其中的一个环境，但是其默认还是使用系统python环境，因此需要解决这个问题.解决方案其实很简答，参考这个帖子.首先，安装nb_conda_kernels包:conda install nb_conda_kernels然后在新建notebook时选择相应的环境：另外还可以对已经存在的notebook更换环境：问题解决！...

2021-01-25 16:00:50 274

转载 ssh省去重复输入密码

背景介绍why很多公司都使用静态密码+动态密码的方式登陆跳板机，某些还会强制一个动态密码只能登陆一次，于是我们面临着等一分钟才能登陆一次跳板机，很不方便。本文介绍一种在本机的设置，免除每次输入密码的方法。方法how此时我们打开ssh客户端/shell命令行，根目录下有.ssh目录，进入。新建一个config文件，编辑内容如下1：Host *ControlPersist yesControlMaster autoControlPath ~/.ssh/master-%r@%h:%pCompres

2021-01-21 17:26:03 265

转载 python生成uuid的方法

UUID（Universally Unique Identifier）是通用唯一识别码，在许多领域用作标识，比如我们常用的数据库也可以用它来作为主键，原理上它是可以对任何东西进行唯一的编码的。作为新手一看到类似varchar(40)这样的主键就觉得有点蒙圈了，字符串型也不能自增啊，这里就应该应用UUID了。数据库一般都有自己的办法生成UUID，但虽然可以用，但这玩意考虑到可读性和有点坑的长度还是尽量不要用这玩意做主键···咳，有点跑题··· 下面就简单说明一下

2020-12-28 22:02:06 1012

转载 tf.argmax()解析

tf.argmax(input,axis)根据axis取值的不同返回每行或者每列最大值的索引。这个很好理解，只是tf.argmax()的参数让人有些迷惑，比如，tf.argmax(array, 1)和tf.argmax(array, 0)有啥区别呢？这里面就涉及到一个概念：axis。上面例子中的1和0就是axis。我先笼统的解释这个问题，设置axis的主要原因是方便我们进行多个维度的计算。比如：test = np.array([[1, 2, 3], [2, 3, 4], [5, 4, 3],

2020-12-07 20:20:45 154

转载 tensorflow中 tf.reduce_mean函数

tf.reduce_mean 函数用于计算张量tensor沿着指定的数轴（tensor的某一维度）上的平均值，主要用作降维或者计算tensor（图像）的平均值。reduce_mean(input_tensor, axis=None, keep_dims=False, name=None, reduction_indices=None)第一个参数input_tensor：输入

2020-12-07 19:43:38 164

转载 tf.placeholder() is not compatible with eager execution的解决方法

最近安装了TensoFlow2.0及以上的版本都发现啊出现这个问题：RuntimeError: tf.placeholder() is not compatible with eager execution.这是因为在运行tf.compat.v1.placeholder(dtype, shape = None, name = None)的时候急切执行了这条语句，但是我们一般都是在一个Session前先去定义placeholder，但是不会去执行，然后再在Sesion上下文管理器中去传入我们的数据，

2020-12-07 18:43:01 978

转载 Hive json字符串解析

在做数据测试时，会遇到数据库表里字段类型为json 的情况，而我们可能只关注该字段中的各别内容的信息，如下content{“测试内容1”:14,“测试内容2”:1,“测试内容3”:2}比如我们只需要测试内容2、测试内容3 对应的 value 值。方式一：get_json_object()select get_json_object(content,'$.测试内容2') as Testcontent from testTableName;-- 执行结果为 1selectget_jso

2020-09-24 17:39:42 334

转载 Hive条件判断

hive中可能会遇到根据判断不同值，产生对应结果的场景，有三种实现方式：IF( Test Condition, True Value, False Value )COALESCE( value1,value2,… )CASE Statement事例及说明IF( Test Condition, True Value, False Value )该语法只能用来判断单个条件，例如： select pd, if(ps_t='常年',1,0) as pt, ps_t f

2020-09-24 17:33:12 960

转载 [Hive基础]-- 替换指定字符串的函数

1、转换函数select cast(substring(‘2016-06-05 00:00:00.0’,1,10) as int);结果—》201606052、替换函数select cast(substring(regexp_replace(‘2016-06-05 00:00:00.0’, ‘-’, ‘’),1,8) as int);结果–》20160605

2020-09-24 17:00:45 1246

转载 python提取字符串中的数字

python 提取一段字符串中去数字ss = “123ab45”方法一：filterfilter() 函数用于过滤序列，过滤掉不符合条件的元素，返回由符合条件元素组成的新列表。该接收两个参数，第一个为函数，第二个为序列，序列的每个元素作为参数传递给函数进行判，然后返回 True 或 False，最后将返回 True 的元素放到新列表中。str.filter:如果字符串只包含数字则返回 True 否则返回 False。filter(str.isdigit, ss)别处copy的filter的用法

2020-08-08 18:53:35 6565

转载 linux shell中 if else以及大于、小于、等于逻辑表达式介绍

在linux shell编程中，大多数情况下，可以使用测试命令来对条件进行测试，这里简单的介绍下，比如比较字符串、判断文件是否存在及是否可读等，通常用"[]"来表示条件测试。注意：这里的空格很重要。要确保方括号的空格。笔者就曾因为空格缺少或位置不对，而浪费好多宝贵的时间。if …; then…elif …; then…else…fi[ -f “somefile” ] ：判断是否是一个文件[ -x “/bin/ls” ] ：判断/bin/ls是否存在并有可执行权限[ -n "var"]

2020-07-31 17:33:28 272

转载 python二维数组操作

二维数组的初始化n = 3m = 3dp = [[0] * n] * mdp[0][1] = 1print dp# output:# [[0, 1, 0], [0, 1, 0], [0, 1, 0]]上面这段代码是想修改二维数组第1行第2列的数，可是居然三列都改了……https://www.cnblogs.com/woshare/p/5823303.html看了woshare的博客后，豁然开朗了matrix = [array] * 3……也就是说matrix = [array]

2020-06-08 20:14:38 743

原创 spark相关

Spark性能调优篇一之任务提交参数调整Spark之RDD

2020-05-28 16:40:58 130

原创 python pickle

Python中的Pickle操作（pkl文件解释）

2020-05-28 13:11:18 140

原创 python的map和filter函数

map()：https://www.runoob.com/python/python-func-map.htmlfilter()：https://www.runoob.com/python/python-func-filter.html

2020-05-28 10:39:26 217

原创 python list实现队列和栈功能

添加：队列和栈都是从尾部/顶部添加元素：则直接使用append()即可删除：list的pop函数，默认pop()删除列表的最后一个元素，符合栈的模式 list.pop(idx) 删除列表第idx个元素，则pop(0)，就是删除队列头部元素获取长度：len获取栈顶元素：list[-1]获取队列头部元素: list[0]...

2020-04-21 21:20:03 1064

转载 python中的urlencode与urldecode

文章目录一、urlencode二、urldecode当url地址含有中文，或者参数有中文的时候，这个算是很正常了，但是把这样的url作为参数传递的时候（最常见的callback），需要把一些中文甚至’/'做一下编码转换。所以对于一些中文或者字符，url不识别的，则需要进行转换，转换结果如下：一、urlencodeurllib库里面有个urlencode函数，可以把key-value这样的键...

2020-04-21 20:33:06 3362

转载 python获取Pandas列名的几种方法

获取DataFrame虽然是一个比较简单的操作，但是有时候到手边就是写不出来，所以在这里总结记录一下：1.链表推倒式data = pd.read_csv('data/Receipt code January minute trading volume.csv')print([column for column in data])#打印结果['COUNT', 'SUCC', 'FAIL'...

2020-04-21 19:50:45 2437

转载 HADOOP中使用SHELL判断HDFS文件是否存在

在linux文件系统中，我们可以使用下面shell脚本判断：if [ ! -f "$file" ];then echo "文件不存在"fiif [ ! -d "$file" ];then echo "路径不存在"fi同样hadoop内置了提供了判断某个文件是否存在的命令hadoop fs -test-d 判断是否是目录-e 判断是否存在-f 判断是否是个文件-s...

2020-04-21 19:42:10 389

转载 [bash]删除文件中含特定字符串的行

删除文件中含特定字符串的行[bash]:sed -e ‘/abc/d’ a.txt // 删除a.txt中含"abc"的行，但不改变a.txt文件本身，操作之后的结果在终端显示sed -e ‘/abc/d’ a.txt > a.log // 删除a.txt中含"abc"的行，将操作之后的结果保存到a.logsed ‘/abc/d;/efg/d’ a.txt > a....

2020-04-21 18:49:45 2964

转载 python，dataframe，如何判断某列元素为空，或者判断某个值为空

1.判断某列元素为空print(train[‘列名’].isna())那么将会输出一系列 True 和False，代表对应结果，True表示当前值为空2.判断某个值为空print (np.isnan(train[‘列名’][0]))输出True 或者False...

2020-04-09 21:02:26 15078

转载 pandas:填充缺失值

当数据中存在NaN缺失值时，我们可以用其他数值替代NaN，主要用到了DataFrame.fillna()方法，下面我们来看看具体的用法：1.先来创建一个带有缺失值的DataFrame:import pandas as pdimport numpy as npdf=pd.DataFrame(np.random.randn(5,3),index=list('abcde'),columns=['...

2020-04-09 20:59:27 4553

转载【Python数据分析】Pandas按行遍历Dataframe

Pandas按行遍历Dataframe的方法主要有两种：iterrows()和itertuples()，具体用法如下：# 构建数据集import pandas as pdimport numpy as npN = 20dataset = pd.DataFrame({ 'date': pd.date_range(start='2016-01-01',periods=N,freq...

2020-04-09 20:34:33 5683

转载 linux下的shell运算（加、减、乘、除）

((i=$j+$k)) 等价于 i=`expr $j + $k`((i=$j-$k)) 等价于 i=`expr $j - $k`((i=$j*$k)) 等价于 i=`expr $j \* $k`((i=$j/$k)) 等价于 i=`expr $j / $k`Let expressions 执行一个或多个表达式。表达式中的变量前不必有$.如果表达式...

2020-04-05 23:57:55 3416

转载 Linux: split命令详解

文章目录split语法选项实例split可以将一个大文件分割成很多个小文件，有时需要将文件分割成更小的片段，比如为提高可读性，生成日志语法split（选项）（file）PREFIX选项-b：值为每一输出档案的大小，单位为 byte。-C：每一输出档中，单行的最大 byte 数。-d：使用数字作为后缀。-l：值为每一输出档的列数大小。PREFIX:代表前导符，可作为切割...

2020-04-05 23:43:28 1150

原创互联网广告出价模式

基础出价篇：http://www.jintiankansha.me/t/u4TQ5ZyBig

2020-03-25 00:02:14 179

3天完整速记-2017世界互联网大会

空空如也