4 足下小欣

尚未进行身份认证

暂无相关简介

等级
TA的排名 67w+

R包中文文本挖掘chinese.misc的中文说明

转载:https://github.com/githubwwwjjj/chinese.misc中文文本分析方便工具R包chinese.misc的中文说明很多人都问过的问题:(1)哪里有更多介绍?——请看极其详细的英文手册http://mirrors.ustc.edu.cn/CRAN/web/packages/chinese.misc/chinese.misc.pdf——如果您尚不了解如...

2018-12-15 09:32:34

json、数组、map相关的hive函数

hive-third-functions参考文献:https://github.com/aaronshan/hive-third-functions/blob/master/README-zh.md简介hive-third-functions包含了一些很有用的hiveudf函数,特别是数组和json函数.注意:hive-third-functions支持hive-0.11.0或更高...

2018-12-14 11:02:22

HIVE 数组

1、只获取文本中的字母,汉字和数字,剔除标点和特殊符号>selectregexp_replace('assseewfew@@@###$%%.....~~~京津冀123','[[^0-9a-zA-Z\\u4e00-\\u9fa5]]','')>assseewfew京津冀1232、获取字符串a首次在字符串b中出现的位置>selectlocate('123','12...

2018-12-12 00:31:52

基于R语言的Kaggle案例分析-泰坦尼克号

背景泰坦尼克号由位于北爱尔兰贝尔法斯特的哈兰·沃尔夫船厂兴建,是当时最大的客运轮船,由于其规模相当一艘现代航空母舰,因而号称“上帝也沉没不了的巨型邮轮”。在泰坦尼克号的处女航中,从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,计划横渡大西洋前往美国纽约市。但因为人为错误,于1912年4月14日船上时间夜里11点40分撞上冰山;2小时40分钟后,即4月15日凌晨02点20分,船裂成...

2018-12-12 00:25:03
勋章 我的勋章
    暂无奖章