自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Devin

行者常至,为者常成;千里之行,始于足下;不忘初心,砥砺前行!

  • 博客(201)
  • 收藏
  • 关注

原创 mysql Install/Remove of the Service Denied!错误的解决办法

在windos 的cmd下安装mysql解决办法:打开cmd.exe程序的时候选择“用管理员身份打开”。在mysql的bin目录下面执行: mysqld --install

2020-11-17 22:12:19 2035

原创 IK分词器安装与测试

1、下载IK分词器https://github.com/medcl/elasticsearch-analysis-ik/releases2、解压到ES的plugins内3、重启ESIK分词器加载成功!4、使用kibana测试IK分词器有两种算法,ik_smart和ik_max_word,其中ik_smart为最少切分,ik_max_word为最细力度切分。以下使用kibana进行测试。如果分词有误,可通过配置添加字典,引入正确的分词。重启ES

2020-11-01 16:35:29 1148

原创 Kibana安装

了解ELK1、下载https://www.elastic.co/cn/downloads/kibana版本要与ES保持一致!2、启动https://localhost:5601汉化修改配置文件重启kibana成功!

2020-11-01 15:39:46 318

原创 win7 neo4j 3.4.0 install-service,start 报错

1,从官网https://neo4j.com/ 及http://www.we-yun.com/index.php/blog/releases-56.html 下载的neo4j 3.4.0Community安装及启动服务会报错,其实任何一个命令都报一个相同的错误,导致neo4j install-service,neo4j start 都报错:2,原因%NEO4J_HOME%\bin\Neo4j-Management\Get-Neo4jPrunsrv.ps1 文件有问题: swit...

2020-11-01 10:02:22 334

原创 IMP-00010: 不是有效的导出文件, 标头验证失败 IMP-00000: 未成功终止导入

原因:备份的dmp文件版本和需要导入的oracle数据库版本不一致。1、查看目标库版本2、修改备份的dmp文件版本号,使其与目标库版本对应,如下3、重新导入即可

2020-10-28 10:43:03 4986

原创 ORA-22992:无法使用从远处表选择LOB定位器

使用dblink从远程数据库向本地数据库 INSERT数据时,因远程表中含有BLOB字段,在SELECT 和 INSERT INTO操作时,报"ORA-22992: 无法使用从远程表选择的 LOB 定位器"错误,通过创建临时表并从临时成功把数据插入到目的表中。1、创建一张临时表table_tempcreate global temporary table table_temp as select * from t1 where 1=22、将原始表中的数据insert到临时表中。如果要复制多个原

2020-06-04 15:42:08 342

原创 oracle ora-01652在表空间扩展问题解决方式

解决方式如下:sqlplus / as sysdba;登录select * from dba_data_files ;使用该条语句可以查看当前库中有多少表空间并且DBF文件的存储位置找到相应的DBF文件使用下面的sql进行扩展alter database datafile 'D:\ORACLE_TABLESPACE\ORCL_DATA.DBF' autoextend on next 50M maxsize unlimited;这条sql的意思是 修改dbf文件 默认每次增加50M 无

2020-05-14 10:12:41 262

原创 oracle11g客户端访问oracle12c服务端,报ora-12514错误

解决方法:在sqlnet.ora中新增配置SQLNET.ALLOWED_LOGON_VERSION_SERVER=11 SQLNET.ALLOWED_LOGON_VERSION_CLIENT=11sqlplus / as sysdba 登录,修改相应用户密码;以scott为例:alter user scott identified by scott;查看PASSWORD_VERSIONS,多了一个 10Gselect username, account_status,...

2020-05-12 08:56:35 1799

原创 oracle—插入或更新

MERGE INTO T T1 USING (SELECT '1001' AS a,2 AS b FROM dual) T2 ON ( T1.a=T2.a) WHEN MATCHED THEN UPDATE SET T1.b = T2.b WHEN NOT MATCHED THEN INSERT (a,b) VALUES(T2.a,T2.b);插入或更新T表...

2020-04-29 14:40:55 3911

原创 Windows Server 2012 R2 服务器密码忘记问题

解决方法:1.准备好一张和当前Windows server 2012R2系统版本和位数相近(最好相同)的系统镜像光盘或者ISO文件。2.通过BIOS设置系统从光盘启动。出现安装系统的画面,点击下一步,“现在安装”。3.点击“修复计算机”4.C盘是系统盘,点击下一步,如果安装的系统和使用的系统光盘或者镜像的版本和位数匹配的话,会出现“系统恢复选项”5.点击“命令提示符”,将出现具...

2020-04-21 16:40:52 15238 1

原创 Oracle—使用JDBC导入Clob类型数据

package nio;import java.io.Writer;import java.sql.Connection;import java.sql.PreparedStatement;import java.sql.ResultSet;public class Test2 { public static Connection conn = ConnectionU...

2020-04-17 09:30:52 593

原创 Oracle自定义函数(UDF)使用

Oracle自定义函数的语法如下:create or replace function 函数名(参数1 模式 参数类型)return 返回值类型as变量1 变量类型;变量2 变量类型;begin 函数体;end 函数名;参数的模式有3种:(如果没有注明, 参数默认的类型为 in.)in: 为只读模式, 在函数中, 参数的值只能被引用, 不能被改变; out: 为...

2020-02-24 10:07:16 2329

原创 oracle 字符串操作

1、替换TRANSLATE(string,from_str,to_str)返回将(所有出现的)from_str中的每个字符替换为to_str中的相应字符以后的string。TRANSLATE 是 REPLACE 所提供的功能的一个超集。如果 from_str 比 to_str 长,那么在 from_str 中而不在 to_str 中的额外字符将从 string 中被删除,因为它们没有相应...

2020-02-19 13:28:28 1285

原创 随机种子——random_state

random_state是一个随机种子,是在任意带有随机性的类或函数里作为参数来控制随机模式。当random_state取某一个值时,也就确定了一种规则。random_state可以用于很多函数,我比较熟悉的是用于以下三个地方:1、训练集测试集的划分 2、构建决策树 3、构建随机森林1、划分训练集和测试集的类train_test_split  随机数种子控制每次划分训练集和测试集...

2020-01-03 09:49:57 3372

原创 neo4j for mac 图数据库 安装

1、官网下载安装包2、解压,cd 到bin目录下,启动命令:neo4j start3、浏览器:http://localhost:7474/默认账户/密码: neo4j / neo4j修改密码安装成功!...

2019-12-11 08:31:28 928

原创 Spark的三种提交方式(基于IDEA)

0、创建了一个Maven工程将一些暂时无关的文件和文件夹删除掉,主要有 main\java, main\resources 和 test 这三个; 将Scala的框架添加到这个项目中,方法是在左侧栏中的项目名称上右键菜单中点击Add Framework Support…,然后在打开的对话框左侧边栏中,勾选Scala前面的复选框,然后点击确定即可(前提是上文中所述步骤都已正确走通,否则你很有可...

2019-12-01 21:10:22 546

原创 namenode无法启动,There appears to be a gap in the edit log. We expected txid 10323, but got txid 10324.

namenode进程中出现如下报错信息There appears to be a gap in the edit log. We expected txid 10323, but got txid 10324.原因:namenode元数据被破坏,需要修复解决:在两个namenode上执行hadoop namenode -recover选择c,一般就OK了...

2019-11-27 08:59:44 347

原创 回收DBA权限

查看哪些用户拥有DBA权限select * from dba_role_privs where granted_role='DBA'注意:执行这一条语句需要执行者本来就要有DBA权限另外如果要是想收回某用户的DBA权限则执行:revoke dba from user_Name...

2019-11-25 16:30:35 1840

原创 CentOS6.5安装图形界面(Gnome)

使用网络安装yum groupinstall "Desktop"yum groupinstall "X Window System"yum groupinstall "Chinese Support"yum groupinstall "Font"startx如果安装过anaconda,可能会出现“could not connect to session bus”错误,是由于~/...

2019-11-25 08:51:24 527

原创 利用MR中文分词完成倒排索引

步骤1、map分词item1 --> [(token1,weight1),(token2,weight2),(token3,weight3)]item2 --> [(token1,weight1),(token4,weight4),(token5,weight5)]2、map_inverted,转换为以token为keytoken1 --> (item1,w...

2019-11-16 11:23:28 354

原创 基于MR进行批量分词

一、结巴分词1、支持三种分词模式:  (1)精确模式:试图将句子最精确的切开,适合文本分析。  (2)全模式:把句子中所有可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。  (3)搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。2、支持繁体分词3、支持自定义词典4、结巴分词的实现原理主要有一下三点:(1)基于Trie树结构实...

2019-11-14 16:42:15 265

原创 TFIDF——python

提取关键词现在有一篇长文《中国的蜜蜂养殖》,用计算机提取它的关键词。1、词频:如果某个词很重要,它应该在这篇文章中多次出现。我们进行"词频"(Term Frequency,缩写为TF)统计。2、停用词:结果你肯定猜到了,出现次数最多的词是----"的"、"是"、"在"----这一类最常用的词。它们叫做"停用词"(stop words),表示对找到结果毫无帮助、必须过滤掉的词。3、I...

2019-11-13 09:14:28 224

原创 MR 全局排序——多reducer

在数据量大的情况下,使用单reducer进行全局排序的方式明显效率较低,可次采用多reducer的方式。map_sort.py在map中进行分桶,分桶方式自定。#! /usr/bin/pythonimport sysbase_count = 10000try: for line in sys.stdin: ss = line....

2019-11-12 17:25:44 571

原创 MR 全局排序——单reducer

利用MapReduce框架完成上述全局排序,将怎样来处理呢?我们知道,map的输出结果是键值对的形式,框架先将一行行的键值数据分区,同一个分区的数据聚集在一起,每个分区内的数据按照key排序,然后每个分区内的数据会被分发到对应的reduce处理,最后reduce输出结果,这个过程叫shuffle。依据此,设定一个reduce task,即强制把map输出的结果都分到一个分区中,也就交给了一个red...

2019-11-12 16:29:50 568

原创 Linux中安装Anaconda

在Linux下安装Anaconda下载安装包,链接https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 安装bash Anaconda3-5.3.1-Linux-x86_64.sh然后一直点击Enter键就可以同意许可条款后,设置软件安装路径。默认安装到【家目录】下,也可以更改目录。安装完成,重启终端,输入python命...

2019-11-04 21:47:34 191

原创 Hadoop-streaming

Hadoop为MapReduce提供了不同的API,可以方便我们使用不同的编程语言来使用MapReduce框架,而不是只局限于Java。你可以用任何语言来编写MapReduce程序,只要该语言可以往standard input/output上进行读写。streamming是天然适用于文字处理的(text processing),当然,也仅适用纯文本的处理,对于需要对象和序列化的场景,hado...

2019-10-31 08:40:08 209

原创 开启Hadoop/Yarn的日志监控功能,解决web端查看日志时的Java.lang.Exception:Unknown container问题

解放方法:yarn的日志监控功能默认是处于关闭状态的,需要我们进行开启,开启步骤如下:一、在yarn-site.xml文件中添加日志监控支持该配置中添加下面的配置:<property> <name>yarn.log-aggregation-enable</name> <value>true</value>...

2019-10-31 00:06:13 869 1

原创 在分布式集群上作业:org.apache.hadoop.yarn.exceptions.YarnException: Unauthorized request to start contai解决

原因: namenode,datanode时间同步问题解决办法:设置时间同步在每个节点上执行:yum install ntp -yntpdate -u 时间服务器地址时间服务器地址可采用以下其一:ntp1.aliyun.comntp2.aliyun.comntp3.aliyun.comntp4.aliyun.comntp5.aliyun.comntp6....

2019-10-30 23:57:24 289

原创 oracle安装问题:关于Oracle Database Configuration Assistant 失败

先跳过,安装完成后,配置监听,运行“Database Configuration Assistant ”,再次安装即可。

2019-10-23 15:07:52 3318

原创 oracle安装问题:关于Oracle Net Configuration Assistant失败

直接跳过,安装完成后再配置监听即可。

2019-10-23 14:59:55 1426

原创 oracle安装问题:关于Oracle ORA-12541:TNS:无监听程序

从开始菜单中打开“Oracle Net Configuration Assistance”,选择“监听程序配置”,如下图所示,点击下一步。 选择“重新配置”,如下图所示,点击下一步。 选择监听程序,如下图所示,选择协议,一般默认就好,点击下一步。 选择端口号,如下图所示,点击下一步。 ...

2019-10-23 14:56:30 817

原创 ORACLE 表空间管理

sqlplus / as sysdba--创建普通数据表空间(前提是目录已存在)create tablespace tbs1 datafile 'C:\ORADATA\DATAFILE\tbs1.dbf' size 100M extent management local segment space management auto;col file_name format ...

2019-09-29 10:12:23 130

原创 通过java代码创建索引库

<dependencies> <dependency> <groupId>org.elasticsearch</groupId> <artifactId>elasticsearch</artifactId> <version>5.6.8</ve...

2019-09-25 23:28:47 1615

原创 Elasticsearch 集群部署

1、复制es的安装文件,注意,将其中的data目录删除。以本机三个节点为例。2、配置每个节点添加配置信息:node1配置信息:cluster.name: my_ES_clusternode.name: es_node1network.host: 127.0.0.1http.port: 9201transport.tcp.port: 9301discovery.z...

2019-09-25 21:45:22 111

原创 oracle表分区详解

从以下几个方面来整理关于分区表的概念及操作:表空间及分区表的概念 表分区的具体作用 表分区的优缺点 表分区的几种类型及操作方法1.表空间及分区表的概念表空间:  是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。分区表:当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区...

2019-09-23 17:46:26 96

原创 ORACLE 添加、删除、修改字段

1、添加列语法:alter table tablename add (column datatype [default value][null/not null],….);实例:-- 添加一个字段ALTER TABLE userADD (username VARCHAR2(40) DEFAULT '无名氏');--同时添加多个字段ALTER TABLE userADD(...

2019-09-20 11:03:20 373 1

原创 ORA-00257 archiver error.归档日志空间不足处理方法

--sqlplus登录sqlplus 用户名/密码@数据库实例名称 as sysdba--查看使用率select * from V$FLASH_RECOVERY_AREA_USAGE;--找到recovery目录show parameter recover --找到文件夹,进入后手动删除文件,可保留最近3天。--开始-运行--命令窗口输入 rman target 用户...

2019-09-20 10:36:34 144

原创 ElasticSearch 7.x 默认不在支持指定索引类型

ElasticSearch 7.x 默认不在支持指定索引类型在elasticsearch7.x上执行:put es_test{ "settings":{ "number_of_shards" : 3, "number_of_replicas" : 0 }, "mappings":{ "book...

2019-09-07 16:47:23 1263

原创 Elasticsearch 安装

注:Elasticsearch 需要 Java 8 环境,在安装Elasticsearch之前先安装好JDK。Windows版1.1、下载访问官网的下载地址:https://www.elastic.co/downloads/elasticsearch,windows版的下载ZIP格式的。1.2、解压解压下载的压缩包,如解压到了D盘根目录,会出现D:\elasticsearch-...

2019-09-06 00:46:57 129

原创 Pandas——groupby()

import pandas as pdimport numpy as npgroupby的基础操作In [2]: df = pd.DataFrame({'A': ['a', 'b', 'a', 'c', 'a', 'c', 'b', 'c'], ...: 'B': [2, 8, 1, 4, 3, 2, 5, 9], ......

2019-08-08 10:38:52 240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除