无敌策哥-CSDN博客

原创 linux中如何使用Cgroups限制某一个进程使用cpu的最大百分比

首先安装Cgroups （不多说了）进行配置进入cgroups的默认路径 /sys/fs/cgroup/创建一个资源分配的组cgcreate -g cpu:/gwc（gwc为用户名）这是/sys/fs/cgroup/cpu/下会有一个名字是gwc的文件夹进入gwc文件夹echo 50000 > /cgroup/cpu/gwc/cpu.cfs_quota_us （50000表示5...

2018-12-22 15:04:39 2557

原创 nginx加uwsgi配置python web框架flask（实测）

1.安装nginx 参考网址 https://www.cnblogs.com/angellating/p/6479876.html里面的这两个命令不要运行（我运行了，结果阿里云崩了，连不上了）rpm -qa pcre 如果没有显示说明没有安装反之安装过rpm -e --nodeps pcre 删除pcre2.安装uwsgi 直接pip就好了3.配置文件nginx下的n...

2018-12-19 19:35:05 439

原创在阿里云部署flask接口，外网无法访问问题解决

1：修改阿里云防火墙打开官网，控制台，自己的服务器，点防火墙，然后添加规则，开放端口（5000）2：ssh连接服务器修改防火墙连接centos7服务器systemctl start firewalld.servicefirewall-cmd --zone=public --add-port=5000/tcp --permanentsystemctl restart firewal...

2018-12-19 15:51:36 3315 4

原创 webDriver的安装和使用

webDriver的安装查看谷歌浏览器的版本去http://npm.taobao.org/mirrors/chromedriver/下载浏览器版本对应的chromeDriver，notes.txt文件中有写到对应版本，注意查看将下载好的chromeDriver解压好复制到谷歌浏览器安装目录，并未谷歌浏览器添加环境变量打开pycharm 使用pip下载selenium模块创建driver...

2018-09-28 14:00:28 61361 2

原创 pyspider的一些简单应用

pyspider不要框架获取部分网页内容url = "https://www.creditchina.gov.cn/xinxigongshi/shipinanquanjianduchoujian/jieguoxiangqing/index.html?id=62335&dataType=1"# # print("aaaaaa")# # html =...

2018-09-28 13:48:55 596

原创 flume大全，，，配置和相关实例

flumeagent 结构flume运行的核心是agent。flume以agent为最小的独立运行单位， flume有三个核心组件 - source 是数据的收集端，负责将数据捕获后进行特殊的格式化，将数据封装到事件(event)里，然后将事件推入Channel中 - source类型 - netcat source 监控某个端口将流经端口的每一个文本行数据作...

2018-09-10 23:23:39 235

原创 hbase加载数据的方式以及与其他组件hive等集成

hbase与其他组件集成hbase与MapReduce集成设置HBase、Hadoop环境变量(hbase目录下) export HBASE_HOME=/opt/modules/hbase-0.98.6-hadoop2 export HADOOP_HOME=/opt/modules/hadoop-nn 设置Hadoop_classpath环境变量HADOOP_CLA...

2018-09-10 23:10:10 580

原创 hbase java api

hbase java api前期准备在src/main下新建resource文件夹在pom.xml添加下面内容<properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <hbase.version>0.98....

2018-09-10 23:08:29 175

原创 hbase shell 命令

hbase shell 命令list 查看存在哪些表scan “表名称” 插卡某个表某个列中所有数据create ‘people’,’info1’,’info2’ 创造表并指定列簇put put ‘people’,’10001’,’info1:age’,’20’ people是表名，10001是rowkeycount ‘people’ 查看表中有多少行get ‘peop...

2018-09-10 23:06:43 1548

原创 hbase安装和配置（完全分布式）

hbase安装与配置(完全分布式)解压安装包启动hdfs启动zookeeper修改配置文件hbase-env.sh export JAVA_HOME=/opt/modules/jdk1.7.0_79 export HBASE_MANAGES_ZK=falsehbase-site.xml <configuration><!-...

2018-09-10 23:05:37 331

原创 hive进阶，以及hive处理日志文件实例，数据倾斜处理等hive进阶内容

hive进阶case-when-then-else select id,name,age1, case when age1 < 18 then ‘小屁孩’ when age1 >=18 then ‘成年人’ else ‘aa’ end as age222222 from person;hive server2配置<property&gt...

2018-09-10 22:24:25 1044

原创 hive相关语句及打jar包运行范例等

hive的语句查看表在hdfs上的目录 show create table 表名设置reduce个数 set mapred.reduce.tasks=4;创建内部表并指定分隔符create table person(name STRING,age INT)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';映射文件(内部表) ...

2018-09-07 17:07:34 2425 1

原创 hadoop集群多namenode配置

多namenode配置规划：bigdata01.com bigdata02.com bigdata03.comnamenode namenodedatanode datanode datanode两个HDFS集群联盟部署：在[bigdata01] $ cp -ra...

2018-09-07 17:05:58 8513

原创 hadoop集群的yarn ha配置,亲测

YARN HA部署yarn-site.xml文件：  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value...

2018-09-07 17:04:40 3364 1

原创 namenode的ha配置，亲测

namenode的ha配置一、Namenode HA部署：目标：防止单个Namenode宕机以后,整个HDFS集群无法访问规划： bigdata01.com bigdata02.com bigdata03.com Namenode Namenode datanode datanode datanode jour...

2018-09-07 17:03:29 2762 1

原创分布式hadoop搭建，自己测试成功过，很详细

分布式hadoop集群分布服务器功能规划 node-1 ：namenode,datanode,nodemanager,historyserver node-2:resourcemanage,datanode,nodemanager node-3:datanode，nodemanager，secondarynamenode具体命令#在node-1上$ bin/hdfs na...

2018-09-07 17:01:23 1403

原创 hive相关配置

hive的配置Hive部署版本 0.13.1 1、安装JDK 2、安装Hadoop 确保Hadoop可以正常使用(上传文件、运行jar) 3、安装Hive “` tarzxf/opt/softwares/apache−hive−0.13.1−bin.tar.gztarzxf/opt/softwares/apache−hi...

2018-09-07 16:58:36 263

原创伪分布式hadoop集群搭建

hdfs的配置hadoop-env.sh文件 export JAVA_HOME=/opt/modules/jdk1.7.0_67core-site.xml文件  <property> <name>fs.defaultFS</...

2018-09-07 16:57:32 273

原创 python爬虫相关

基础知识点python格式化python格式化数字格式化 python print("{:.2f}".format(3.1415926))#设置两位小数 print("{:.2%}".format(0.25))#百分比 print("{:^10}".format("aaaaa"))#居中 print("{:<10}".format("aaaaa")

2018-09-07 16:48:13 289

原创 linux进阶命令，ssh讲解，文件如何最简单上传下载，shell命令等进阶命令与更深了解linux

linux补充命令reboot重启halt 关机ps命令（查看当前进程）ps -ef| grep ssh(查看ssh的相关进程)chown命令 chown [-R] 账号名称文件/目录（R表示递归）chmod r读写权4 w写入权2 执行权1 chmod 777 -R xxx（文件或者目录）（用户，组，其他可读可写可执行）ps查看进程jps查看java进程set命令查看环境...

2018-09-07 11:20:35 319

原创 python爬虫基础及实例---代码经过实测

requests模块发送get，post请求response = requests.get(url)response = requests.post(url,data={请求体的字典})response的方法response.text 该方法经常会出现乱码，出现乱码使用response.encoding=”utf-8”response.content.decod...

2018-09-07 11:09:05 63278

大数据小白