3 baidu-liuming

尚未进行身份认证

机器学习 深度学习 大数据 自然语言处理 linux python shell hive 算法

等级
TA的排名 1w+

互联网广告出价模式

基础出价篇:http://www.jintiankansha.me/t/u4TQ5ZyBig

2020-03-25 00:02:14

Python-lambda用法

1.一个语法在Python中,lambda的语法是唯一的。 其形式如下:lambda argument_list: expression其中,lambda是Python预留的关键字 ,argument_list和expression由用户自定义。具体介绍如下。1. 这里的argument_list是参数列表,它的结构与Python中函数(function)的参数列表是一样的。 具体来说,a...

2020-03-22 17:36:13

linux父子进程问题

1、前言之前在看《unix环境高级编程》第八章进程时候,提到孤儿进程和僵尸进程,一直对这两个概念比较模糊。今天被人问到什么是孤儿进程和僵尸进程,会带来什么问题,怎么解决,我只停留在概念上面,没有深入,倍感惭愧。晚上回来google了一下,再次参考APUE,认真总结一下,加深理解。2、基本概念我们知道在unix/linux中,正常情况下,子进程是通过父进程创建的,子进程在创建新的进程。子进程的...

2020-03-22 13:27:51

同步和异步的区别

同步:可以理解为在执行完一个函数或方法之后,一直等待系统返回值或消息,这时程序是出于阻塞的,只有接收到返回的值或消息后才往下执行其他的命令。异步:执行完函数或方法后,不必阻塞性地等待返回值或消息,只需要向系统委托一个异步过程,那么当系统接收到返回值或消息时,系统会自动触发委托的异步过程,从而完成一个完整的流程。同步,就是实时处理(如打电话),比如服务器一接收客户端请求,马上响应,这样客户端可以...

2020-03-22 13:11:36

linux uniq命令整理

uniq 对排序好的内容进行去重语法:uniq [-cdu][-f<栏位>][-s<字符位置>][-w<字符位置>][--help][--version][输入文件][输出文件]选项:-c或--count 在每列旁边显示该行重复出现的次数-d或--repeated 仅显示重复出现的行-f<栏位>或--skip-fields=<栏位...

2019-12-28 22:49:25

python str转dict

两种方法捷径eval(str)user = "{'name' : 'jim', 'sex' : 'male', 'age': 18}"type(user)<type ‘str’> b=eval(user) b{‘age’: 18, ‘name’: ‘jim’, ‘sex’: ‘male’}type(b)<type ‘dict’>关于eval()的...

2019-12-23 21:30:23

VIM和sed 替换字符串方法

目录VIM替换字符串方法1. 基本替换2.可以使用 # 作为分隔符,此时中间出现的 / 不会作为分隔符3. 文件中删除^M4. 其它技巧sed命令替换字符串VIM替换字符串方法1. 基本替换:s/str1/str2/ 替换当前行第一个str1为str2 :s/str1/str2/g 替换当前行所有str1为str2 :n,$s/str1/st...

2019-12-22 23:25:22

二叉树遍历

前序遍历的循环写法:树的遍历一般需要栈结构,因为栈结构有“先进后出”的特点# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None# self.righ...

2019-12-01 19:40:54

python数据分析之pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

1 引言Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用。本文主要介绍Pandas的几种数据选取的方法。Pandas中,数据主要保存为Dataframe和Series是数据结构,这两种数据结构数据选取的方式基本一致,本文主要以Dataframe为例进行介绍。  在Dataframe中选取数据大抵包括3中情况:  ** 1)行(列)选取(单维度选取):d...

2019-11-03 21:50:51

pandas按行按列遍历Dataframe的几种方式

遍历数据有以下三种方法简单对上面三种方法进行说明:iterrows(): 按行遍历,将DataFrame的每一行迭代为(index,Series)对,可以通过row[name]对元素进行访问。 itertuples():按行遍历,将DataFrame的每一行迭代为元祖,可以通过row[name]对元素进行访问,比iterrows()效率高。iteritems():按列遍历,将Data...

2019-11-03 21:22:07

python enumerate() 函数

描述enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。语法以下是 enumerate() 方法的语法:enumerate(sequence, [start=0])参数sequence – 一个序列、迭代器或其他支持迭代对象。start – 下标起始位置。返回值返回 enume...

2019-11-03 20:46:07

【解决办法】read_csv()第一列作为index

简述在之前读取csv文件的时候,发现第一列被读到了dataframe的column中了,而不是读到了index中,查阅完文档后得到解决。解决办法index_col : int or sequence or False, default NoneColumn to use as the row labels of the DataFrame. If a sequence is give...

2019-11-03 20:30:50

SQL时间戳与日期转换

(1)日期转为时间戳UNIX_TIMESTAMP(‘2015-04-29’,‘yyyy-MM-dd’)(2)时间戳转为日期FROM_UNIXTIME(‘1430236800’,‘yyyy-MM-dd’)sql查询使用时可将两函数中第一个参数替换为相应的字段名称...

2019-10-13 23:14:23

Python MD5加密详解以及多次加密的坑

在python中可以使用hashlib这个库来使用MD5加密:import hashlib在使用MD5加密的使用要注意加密内容的编码格式:import hashlib //导入hash库函数md5_object = hashlib.md5() //创建一个MD5对象md5_object.update(b'admin') //添加去要加密的...

2019-09-16 17:25:42

SQL函数--substr()

substr()函数1、作用:用来截取数据库某个字段中的一部分。2、语法:substr(string,start,length) string参数:必选。数据库中需要截取的字段。 start参数:必选。正数,从字符串指定位子开始截取; 负数,从字符串结尾指定位子开始...

2019-09-16 17:06:17

python列表和字符串的三种逆序遍历方式

列表的逆序遍历a = [1,3,6,8,9]print("通过下标逆序遍历1:")for i in a[::-1]: print(i, end=" ")print("\n通过下标逆序遍历2:")for i in range(len(a)-1,-1,-1): print(a[i], end=" ")print("\n通过reversed逆序遍历:")for i in r...

2019-09-16 17:03:06

如何检查python中的值是否为nan?

float(‘nan’)是Nan不是一个数字,我该如何判断一个值为nan,有什么简单的方法么?使用math.isnan()来进行判断>>> import math>>> x=float('nan')>>> math.isnan(x)True...

2019-07-31 21:31:38

markdown中输入空格

半方大的空白: 或 全方大的空白 或 不断行的空白格 或 

2019-07-28 21:05:13

linux 随机抽取文件中N行

1.shell命令直接用shuf -n5 t.txt > L则随机在t.txt 中抽取5列 到L中2.awkawk 'BEGIN{srand()} {print rand()"\t"$0}' input_file | sort -nk 1 | head -n line_num | awk -F "\t" '{print $2}'3.pythonimport randomimp...

2019-07-28 21:01:39

linux top 命令各字段含义

top 字段含义列名含义PID进程 IDUSER进程所有者的用户名PR任务优先级NI nice 值数值越小表示优先级越高,数值越大表示优先级越低VIRT进程使用的虚拟内存总量,单位:kb。VIRT=SWAP+RESRES进程使用的、未被换出的物理内存大小,单位:kb。RES=CODE+DATASHR共享内存大小,单位:kb...

2019-07-28 20:55:48

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。