5 悟乙己

尚未进行身份认证

心如花木,皆向阳而生!

等级
TA的排名 282

nvidia-rapids︱cuGraph(NetworkX-like)关系图模型

RAPIDS cuGraph库是一组图形分析,用于处理GPU数据帧中的数据 - 请参阅cuDF。 cuGraph旨在提供类似NetworkX的API,这对数据科学家来说很熟悉,因此他们现在可以更轻松地构建GPU加速的工作流程官方文档:rapidsai/cugraphcuGraph API Reference支持的模型:文章目录1 安装与背景1.1 安装1.2 背景2 简单的demo3...

2020-02-25 21:56:02

nvidia-rapids︱cuML机器学习加速库

cuML是一套用于实现与其他RAPIDS项目共享兼容API的机器学习算法和数学原语函数。cuML使数据科学家、研究人员和软件工程师能够在GPU上运行传统的表格ML任务,而无需深入了解CUDA编程的细节。 在大多数情况下,cuML的Python API与来自scikit-learn的API相匹配。对于大型数据集,这些基于GPU的实现可以比其CPU等效完成10-50倍。 有关性能的详细信息,请参阅...

2020-02-25 21:38:59

nvidia-rapids︱cuDF与pandas一样的DataFrame库

cuDF(https://github.com/rapidsai/cudf)是一个基于Python的GPU DataFrame库,用于处理数据,包括加载、连接、聚合和过滤数据。向GPU的转移允许大规模的加速,因为GPU比CPU拥有更多的内核。笔者觉得,对于我来说一个比较好的使用场景是,代替并行,在pandas处理比较慢的时候,切换到cuDF,就不用写繁琐的并行了。官方文档:1 Docs »...

2020-02-25 21:12:29

NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10

随着新版本的推出,RAPIDS 迎来了其推出一周年纪念日。回顾所经历的一年,RAPIDS团队就社区对该项目的关心和支持表示衷心的感谢。此前,RAPIDS获得了其首个BOSSIE奖。非常感谢各位的支持!RAPIDS团队将继续推动端对端数据科学加快发展,达到新高度。文章目录RAPIDSRAPIDS定义rapids背景资料RAPIDS核心库更新cuDFcuML 和 XGBoost从cuML 训练到...

2020-02-25 19:55:30

statsmodels︱python常规统计模型库

之前看sklearn线性模型没有R方,F检验,回归系数T检验等指标,于是看到了statsmodels这个库,看着该库输出的结果真是够怀念的。。文章目录1 安装2 相关模型介绍2.1 线性模型2.2 离散选择模型(Discrete Choice Model, DCM)2.3 非参数统计2.4 广义线性模型 - Generalized Linear Models2.5 稳健回归——Robust R...

2020-02-18 10:37:11

聚类 | Map-Equation多级网络聚类模型——InfoMap

受苏神的《最小熵原理(五):“层层递进”之社区发现与聚类》启发,拿来做词聚类,看苏神的贴出来的效果蛮好,就上手试了试,感觉确实不错。最新的v1.0版本还有专门网站:https://mapequation.github.io/infomap/1 简单的理论Infomap 的双层编码方式把群组识别(社区发现)同信息编码联系到了一起。一个好的群组划分,可以带来更短的编码。所以,如果能量化编码长度...

2020-02-07 16:34:56

微信对话开放平台智能对话模块的几个亮点

微信AI首席科学家牛成公布了最新开放方案,并重磅宣布全面开放各层次 NLP 能力。具体说来,微信 AI 迈出了“三大步”:以硬件合作为核心的智言小微硬件开放平台 2.0 正式亮相; 公开以对话开放能力为核心的微信对话开放平台; 全面开放以自然语言处理能力为核心的 NLP 基础技术平台。参考:微信9年:张小龙指明方向,微信AI全面开放NLP能力今天公开课上隆重介绍了...

2020-01-10 08:30:00

电商智能写作:京东AI闪电智能写作引擎

京东也在电商智能写作领域做了非常多的工作,而且也与阿里妈妈创意中心一样,有试用界面,也接受API调用与商务合作。京东之前也有李白写作平台(在线:https://libai.jd.com/...

2020-01-06 09:13:56

电商智能写作:阿里妈妈创意中心智能文案引擎

本篇为电商智能写作第一篇,笔者跟踪电商智能写作领域有些日子了,目前已知有成型电商智能写作产品的有:阿里的阿里妈妈(还有其他的几篇该领域的论文,不知道有木有做成产品使用起来),京东AI闪电,宝尊电商等。其中,又以阿里妈妈创意中心这个产品 + 技术 + 论文 + 代码 + 专利都齐全的,所以开篇来说。阿里妈妈一键生成电商营销文案这个是阿里妈妈创意中心,智能文案的试用界面,可以看到用户可以输入...

2019-12-29 22:44:29

智能视频生成:阿里系的诸多成果

阿里因为特有的大平台流量,在各种智能内容生成上都涉足较多,而且公之于众的成果颇多。9月26日,阿里巴巴在杭州云栖大会上首次公布了人工智能调用规模:AI每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,已经成为中国最大的人工智能公司。阿里还首次披露人工智能的完整布局,在AI芯片、AI云服务、AI算法、AI平台、产业AI的进展。阿里首...

2019-12-22 11:43:56

AI智能内容创作的几个方面

昨天刚好看到CSDN有要开通付费专栏(定价有点不合理啊),我就在想有啥好写。。刚好最近的研究方向就是KG +智能写作,而且大大小小的智能内容创作产品、技术也一直在关注,于是就想做个小小搬运匠,看看能不能把相关的内容整理、搬运一下。智能写作可能比较偏重文字创作,内容创作可能就更加宽泛了一些,不仅仅是文字,还有:图片、大热的视频、音乐等载体。现在对于内容创作的需求也是越来越大,很多个...

2019-12-19 08:42:00

平民级NER︱pycrfsuite的介绍与应用

1 前言不知道哪篇文献中提及到了NER的几款最、最、最常见模型:从图中可以看到,其实CRF和BiLSTM-CRF效果差距不大,本身能省事儿就省事儿的原理,用简单的CPU就可以跑的,pycrfsuite非常符合。这个开源项目medical_ner_crfsuite已经说得蛮清楚了,而且代码+数据也开源了,笔者就不赘述了。除了pycrfsuite,还有sklearn_crfsuite也是同样...

2019-12-05 21:52:30

【介绍】GNES ——"Pythonic"的直观方式快速构建神经搜索框架

来自腾讯AI Lab肖涵(肖涵博士,腾讯AI Lab GNES项目组负责人)大神的开源项目,非常赞:GNES Flow。GNES Flow让你通过“Pythonic”的直观方式快速构建神经搜索框架,将GNES架构中的各个微服务搭积木一样组织起来。它支持可视化,多进程/线程/DockerSwarm/K8s后台。GNESFlow和GNES的关系就如同Keras和Tensorflow一样,它为不熟...

2019-10-24 11:44:56

python | 关键词快速匹配检索小工具 pyahocorasick / ahocorapy

AC自动机是多模式匹配的一个经典数据结构,原理是和KMP一样的构造fail指针,不过AC自动机是在Trie树上构造的,但原理是一样的。官方github:https://github.com/WojciechMula/pyahocorasick/文章目录1 安装2 使用3 案例1 安装This module is written in C. You need a C compiler i...

2019-09-29 17:04:58

python | 高效统计语言模型kenlm:新词发现、分词、智能纠错

之前看到苏神【重新写了之前的新词发现算法:更快更好的新词发现】中提到了kenlm,之前也自己玩过,没在意,现在遇到一些大规模的文本问题,模块确实好用,前几天还遇到几个差点“弃疗”的坑,解决了之后,就想,不把kenlm搞明白,对不起我浪费的两天。。kenlm的优点(关于kenlm工具训练统计语言模型):训练语言模型用的是传统的“统计+平滑”的方法,使用kenlm这个工具来训练。它快速,节省内存,...

2019-09-27 09:40:22

pyRedis - 操作指南:增/删/改/查、管道与发布订阅功能

文章目录1 redis docker 部署与安装2 py - redis的使用2.1 redis的连接2.2 常规属性查看2.3 STRING 字符串的操作1 redis docker 部署与安装参考:一文教你如何通过 Docker 快速搭建各种测试环境首先拉取 Redis 镜像, 这里我选择的是 redis:alpine 轻量级镜像版本:docker pull redis:alpine...

2019-08-19 22:42:33

pyMongo操作指南:增/删/改/查/合并/统计与数据处理

文章目录1 mongodb安装1.1 下载 MongoDB 镜像1.2 运行 MongoDB 镜像1.3 添加管理员账号1.4 用新创建的 root 账户连接,测试一下2 可视化界面Robo 3T3 pymongo增删改查3.1 数据库连接3.2 建表collection3.3 文档插入与删除关于Unicode编码的字符串注意点3.4 数据更新update3.5 数据替换replace3.6 查...

2019-08-15 17:22:02

PySpark︱pyspark.ml 相关模型实践

文章目录1 pyspark.ml MLP模型实践9 spark.ml模型评估 MulticlassClassificationEvaluator1 pyspark.ml MLP模型实践官方案例来源:https://spark.apache.org/docs/latest/api/python/pyspark.ml.html#pyspark.ml.classification.Multilay...

2019-07-26 10:06:22

gensim-fast2vec改造、灵活使用大规模外部词向量(具备OOV查询能力)

本篇是继 极简使用︱Gemsim-FastText 词向量训练以及OOV(out-of-word)问题有效解决 之后,让之前的一些旧的"word2vec"具备一定的词表外查询功能。还有一个使用场景是很多开源出来的词向量很好用,但是很大,用gensim虽然可以直接用,如果能尽量节省一些内存且比较集中会更好,同时如果有一些OOV的功能就更好了,于是笔者就简单抛砖引玉的简单写了该模块。譬如以下这些大...

2019-05-31 11:46:38

极简主义︱使用Turicreate进行快速图像分类迁移训练与预测(六)

apple开源机器学习框架turicreate内容非常广阔,本篇介绍冰山一角的图像相似,极简主义的代表!!!!github:https://apple.github.io/turicreate/docs/api/generated/turicreate.SFrame.html首篇博客:python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame...

2019-05-22 14:11:22

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 技术圈认证(专家版)
    技术圈认证(专家版)
    博客专家完成年度认证,即可获得
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。