2 栗子ma

尚未进行身份认证

暂无相关简介

等级
TA的排名 7w+

【maven】使用eclipse自带的Maven插件,修改repository的默认位置

【原文链接】https://blog.csdn.net/qq_20565303/article/details/60480247 1、查看相关是否可建Maven工程:将eclipse打开后新建工程在other里面可以找到maven2、查看默认Maven插件的配置:1)我们可以可以点击Window下的Preferences,然后找到Maven,点击installations,可以...

2019-02-25 11:16:07

【Flume】通过Hue提交Oozie SSH Action用命令启动Flume脚本报错Unable to find java executable.

【背景】在配置好Flume后,在控制台通过flume-ng agent --conf /* --conf-file /* --name agent Dflume.root.logger=INFO,console命令启动Flume Agent没有问题。但是将这个命令通过Oozie SSH Action运行的时候却发现,Sink的目录没有结果文件,且ps -ef | grep flume也没有Flum...

2018-12-13 15:43:01

【Oozie】SSH Workflow报错之Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

【问题】添加workflow,拖拽一个ssh,user and host填写USER@HOST,ssh command填写一个最简单的ll命令,保存,submit,报错:Caused by: java.io.IOException: Not able to perform operation [ssh -o PasswordAuthentication=no -o KbdInteractiveD...

2018-12-12 18:25:14

【Oozie】解决通过Hue界面提交Oozie Workflow和Coordinator时区问题的三个步骤

【问题一】Hue界面中显示提交Coordinator和Workflow的时间和真正的时间不匹配【背景】提交Coordinator的时候是下午五点,但是界面上显示的是凌晨1点,判断是时区问题【解决】打开Cloudera Manager的页面,打开Hue服务的页面,点击配置,搜索time会出现timezone的配置,将洛杉矶时区改成Asia/Shanghai【注意】没有Asia/Beiji...

2018-12-11 17:49:23

【CDH】Error: JAVA_HOME is not set and could not be found.

错误一:hdfsdfs-mkdir-p/flume/mysqlPermissiondenied:user=root,access=WRITE,inode="/":hdfs:supergroup:drwxr-xr-x这些类似的权限问题都属于同类问题,他是我说我们的执行Hadoop命令的用户没有,执行权限。刚开始我想解决问题的思路是,将当前用户授权。(这种想法是不正确的,不...

2018-12-06 16:23:13

【Oozie】CDH是如何通过Hue提交Oozie定时任务的?

【原文链接】https://www.cnblogs.com/mr-ivan/p/6593550.html 提交oozie定时作业 1、进入hue界面,点击workflows工作流,编辑workflows。 2、点击create创建工作流。 3、本文以hive2作业sql任务为例,拖拽hive2到action区域。 4、例子是为车次表每天定时添加指定分...

2018-12-05 18:33:41

【MySQL】CentOS7安装MySQL7并更改初始化密码

1、官方安装文档http://dev.mysql.com/doc/mysql-yum-repo-quick-guide/en/2、下载 Mysql yum包http://dev.mysql.com/downloads/repo/yum/下载到本地再上传到服务器,或者使用wget 直接下载wget http://repo.mysql.com/mysql57-communit...

2018-12-05 18:26:07

【MySQL】Error “No package mysql-server available” while Installing mysql

【原文链接】https://www.techietown.info/2017/07/error-no-package-mysql-server-available-while-installing-mysql-server/Mysql is a popular open source relational database management system (RDBMS). It is wi...

2018-12-05 18:04:23

【网络营销】CPA、CPS、CPM、CPT、CPC 是什么

【原文链接】https://www.a-edm.com/cpa.html 网络营销之所以越来越受到重视一个主要的原因就是因为“精准”。相比较传统媒体的陈旧广告形式,网络营销能为广告主带来更为确切的效果与回报,更有传统媒体所没有的即时互动性。很多企业借助于精准的网络营销成为人尽皆知的知名品牌。众多的成功案例吸引着更多的企业计划投入到网络营销中的大潮中来。那么我们在做网络营销前应该要了解哪些基...

2018-11-01 14:15:22

【Sqoop】Export data into RDBMS using Sqoop 及其调优

【原文链接】https://hadoopjournal.wordpress.com/2017/08/15/export-data-using-sqoop/ We can export data from HDFS into an RDBMS table using the Sqoop export tool. The target table must already exist in t...

2018-10-31 17:31:03

【SQL】SELECT col, COUNT(DISTINCT other_col) FROM tab GROUP BY col的两种写法

To count distinct values inside of a GROUP BY, use the following.SELECT col, COUNT(DISTINCT other_col) FROM tab GROUP BY colThe same result can be achieved without using the DISTINCT keyword, as ...

2018-10-26 13:46:42

【Shell】别把&和nohup混为一谈, 根本不是同一个东西好不好 ------ 聊聊./a.out & , nohut ./a.out , nohup ./a.out &的区别

【原文链接】https://blog.csdn.net/stpeace/article/details/76389073 在第一家公司工作的时候, 我认识了&,在第二家公司工作的时候, 我认识了nohup, 这就是渊源。 随后, 我就一直糊涂用他们, 但并不懂这两个东西。 网上很多地方是乱扯, 瞎复制, 为什么不自己实践一下呢? 看个小程序:int main (){ in...

2018-09-25 15:37:06

【产品】推荐系统的冷启动和评论推荐

【原文链接】http://www.woshipm.com/pd/818285.html 推荐系统的冷启动本篇文章是写给产品经理看的,所以说,我们不讨论算法,只说方法。冷启动在整个推荐系统中,是一个非常重要而又非常难的一件事情,推荐系统一般都需要在大量的数据基础过后才能比较准确的进行推荐,而一个新用户刚使用APP的冷启动可能直接决定着这个用户还会不会使用下去,所以冷启动是一件至关重要...

2018-08-27 18:19:40

【特征工程】机器学习中离散型特征的处理 —— 独热码 (one-hot)

【原文链接】https://www.cnblogs.com/daguankele/p/6595470.html 1、什么是独热码  独热码,在英文文献中称做 one-hot code, 直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制,更加详细参加one_hot code(维基百科)。在机器学习中对于离散型的分类型的数据,需要对其进行数字化比如说性别这一...

2018-08-15 14:14:45

【爬虫】Scrapy 中利用 XPath 丢弃所有跟 footer 相关的内容

【前言】利用 Scrapy 爬取网站文字的时候发现,footer 中的 Copyright 等文字会影响后续分词的效果,因此决定将网页的 HTML 中有关 footer 的内容都丢弃。以下是不排除 footer 中内容的时候拿到网页的所有文本内容:response.selector.xpath('//*[not(self::script or self::style or self::tit...

2018-08-03 16:11:55

【XPath】语法、Axes、操作符

【原文链接】https://www.w3schools.com/xml/xpath_syntax.asp XPath SyntaxXPath uses path expressions to select nodes or node-sets in an XML document. The node is selected by following a path or steps....

2018-08-03 15:09:33

【SEO】Meta Keywords: 是什么?怎么用?

【原文链接】https://www.wordstream.com/meta-keyword Meta Keywords are a specific type of meta tag that appear in the HTML code of a Web page and help tell search engines what the topic of the page is. M...

2018-08-02 16:51:37

【SEO】Meta Descriptions 对于 SEO 的重要性

【原文链接】https://www.wordstream.com/meta-description 元描述 (有时也称为元描述属性或标签) 是一种 HTML 元素。It describes and summarizes the contents of your page for the benefit of users and search engines. 虽然元数据对 SEO 排名不像...

2018-08-02 15:54:21

【HTML】meta 标签

【原文链接】https://www.w3schools.com/tags/tag_meta.asp 【前言】最近把500个网页除了<script>和样式的标签以外的文本内容爬取下来,然后利用Hierarchical Clustering进行了分类。...结果就像skr粑粑一样(如下图),太不准了。利用jieba分词后,提取出来的文档集让人不禁感叹,介skr什么鬼(如下文)。领导...

2018-08-02 14:56:04

【爬虫】Scrapy 爬取excel中500个网址首页,使用Selenium模仿用户浏览器访问,将网页title、url、文本内容组成的item保存至json文件

创建含有网址首页的excel文件host_tag_网站名称_主域名_子域名.xlsx编辑读取excel文件的工具类项目FileUtils新建项目FileUtils编辑file_utils.py# -*- coding: utf-8 -*-"""Created on Thu Jul 26 10:42:49 2018@author: Administrator"...

2018-08-01 14:09:44

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!