6 Rnan-prince

尚未进行身份认证

我要认证

不能决定太阳几点升起,但可以决定自己几点起床。你不能控制生命的长度,但可以增加生命的宽度。别嫉妒别人的成功,在你看不见的时候,他们流下了你想象不到的汗水。与其羡慕,不如奋斗!与君共勉!

等级
TA的排名 1w+

AutoML综述

论文地址:https://arxiv.org/abs/1810.13306。AutoML出现原因机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML视图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。使用AutoML 的好处市场潜力巨大:到根据Gartner 的数据,2022年,RPA相关的集成运用,将会以每年40%的速度增长。这是为什么这两年即使在资本市场降温的情况下,头.

2020-08-02 16:09:53

PyTorch深度学习入门

PyTorch是什么?这是一个基于Python的科学计算包,其旨在服务两类场合:替代numpy发挥GPU潜能 一个提供了高度灵活性和效率的深度学习实验性平台Pytorch安装官网有安装方法:https://pytorch.org/get-started/locally/conda install pytorch torchvision cpuonly -c pytorch或pip install torch==1.6.0+cpu torchvision==0.7.0+cpu -

2020-07-30 02:05:24

Docker入门

什么是Docker首先来介绍一下什么是Docker,Docker是早于2013年发布的开源项目,它借助操作系统的虚拟化技术来实现应用间的资源隔离,从而应用能更加快速方便地打包和部署在任何地方。根据官网描述,Docker是一个借助容器进行开发,部署和运行应用的工具,通俗来说,Docker容器好比一个集装箱一样,里面存放了应用所需要的文件和依赖,这种把应用标准化的过程被叫做为“容器化”。Docker适合做什么对于开发人员来说,容器技术为应用的部署提供了沙盒环境,开发者可以在独立的容器运行和管理.

2020-07-21 08:09:24

vim编辑器常用命令

撤销u 撤销上一步的操作Ctrl+r 恢复上一步被撤销的操作linux的vi编辑器中如何查找内容(关键字)按下”/“键,这时在状态栏(也就是屏幕左下脚)就出现了 “/” 然后输入你要查找的关键字敲回车就可以了。找到相关文字以后:(1)按下小写n,向下查找(2)按下大写N,向上查找跳转gg : 跳转到文件头Shift+g : 跳转到文件末尾vim跳转到指定行:ngg/nG (跳转到文件第n行,无需回车)例跳转到123行:123gg :n (跳转到文件第n行,需要回.

2020-07-19 22:10:26

Git版本控制

安装和配置Git 安装首先,我们必须安装 Git 才能使用它!这里分 Linux 和 Windows 来演示:在 Linux 上安装 Gitsudo yum install git在 Windows 上安装 Git直接在https://git-scm.com/downloads里面,下载最新版的 Git,默认安装就可以了。安装完成后,在开始菜单里找到Git->Git Bash,点击后出现一个类似命令行窗口的东西,就说明 Git 安装成功。Git 配置可以保存 G.

2020-07-16 23:57:01

Linux 常用文本处理 sed awk

sed 命令的使用概述sed是stream editor的简称,也就是流编辑器。它一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。使用语法sed [option] ‘command’ input_file其中option是可选的,常用的option有如下几种:-n

2020-07-14 00:51:18

python unittest --- 单元测试框架

unittest单元测试框架是受到 JUnit 的启发,与其他语言中的主流单元测试框架有着相似的风格。其支持测试自动化,配置共享和关机代码测试。支持将测试样例聚合到测试集中,并将测试与报告框架独立。为了实现这些,unittest通过面向对象的方式支持了一些重要的概念。测试脚手架test fixture表示为了开展一项或多项测试所需要进行的准备工作,以及所有相关的清理操作。举个例子,这可能包含创建临时或代理的数据库、目录,再或者启动一个服务器进程。测试用例一个测试用例是一个独立的测试单元...

2020-07-13 23:54:31

python - 并发和多线程

1启动和停止线程 threadingthreading 库可用来在单独的线程中执行任意的python 可调用对象。要实现这一要求,可以创建一个 Thread 实例并为它提供期望执行的可调用对象。from threading import Thread, Eventimport time# Code to execute in an independent threadimport timedef countdown(n): while n > 0: pri..

2020-07-12 23:18:09

python - 协程异步IO(asyncio)

什么是协程,为什么要使用协程?由于GIL的存在,导致Python多线程性能甚至比单线程更糟。GIL: 全局解释器锁(英语:Global Interpreter Lock,缩写GIL),是计算机程序设计语言解释器用于同步线程的一种机制,它使得任何时刻仅有一个线程在执行。即便在多核心处理器上,使用 GIL 的解释器也只允许同一时间执行一个线程。于是出现了协程(Coroutine)这么个东西。协程: 协程,又称微线程,纤程,英文名Coroutine。协程的作用,是在执行函数A时,可以随时中断,去执

2020-07-12 16:53:15

Linux - 系统性能监控

重点讨论一些有助于监视系统整体性能的工具。当理解了工作负荷的系统整体性能特征之后,还可以使用这组工具标识出哪些特定进程是整体工作负荷的性能瓶颈。在许多情况下,系统监视工具有助于推动系统调优工作,使得关键的性能瓶颈得到极大减少或消除;另一些情况下,这些工具只是准确识别出为了改进工作负荷整体性能和吞吐率,有哪些应用或进程需要调优、重新配置,或者在极端情况下进行算法修改。本章将着重分析许多可以为下列内容提供有用信息的工具:整体系统CPU利用率。 内存利用率。 磁盘I/O的利用率和延迟。 网络利用率。

2020-07-12 00:42:41

Linux - 内核机制

1、Linux内核体系结构首先讨论Linux内核的体系结构,包括内核的职能、内核的组织结构和模块、内核提供的服务以及进程管理等。内核的职能内核(也称为操作系统)有如下两个主要作用:与系统的硬件设备进行交互并对其加以控制。 为应用程序提供运行环境。某些操作系统允许应用程序直接访问硬件设备,但这种能力目前已经很少见。类UNIX操作系统向应用程序隐藏了所有的低层硬件细节。应用程序如果希望使用某个硬件资源,就必须向操作系统发出请求。操作系统对该请求进行评估,并在请求有效时代表应用程序与硬件设备进

2020-07-11 23:59:32

知识图谱入门 【九】- 知识问答

知识问答简介问答系统的历史如下图所示:可以看出,整体进程由基于模板到信息检索到基于知识库的问答。基于信息检索的问答算法是基于关键词匹配+信息抽取、浅层语义分析。基于社区的问答依赖于网民贡献,问答过程依赖于关键词检索技术。基于知识库的问答则基于语义解析和知识库。根据问答形式可以分为一问一答、交互式问答、阅读理解。一个经典的测评数据集为QALD,主要任务有三类:多语种问答,基于Dbpedia 问答基于链接数据 Hybrid QA,基于RDF and free text data知识问答

2020-07-10 19:13:17

知识图谱入门 【八】- 语义搜索

语义搜索简介什么是语义搜索,借用万维网之父Tim Berners-Lee的解释 “语义搜索的本质是通过数学来拜托当今搜索中使用的猜测和近似,并为词语的含义以及它们如何关联到我们在搜索引擎输入框中所找的东西引进一种清晰的理解方式,不同的搜索模式之间的技术差异可以分为:对用户需求的表示(query model) 对底层数据的表示(data model) 匹配方法(matching technique)以前常用的搜索是基于文档的检索(document retrieval )。信息检索(IR)支持

2020-07-10 19:07:04

知识图谱入门 【七】- 知识推理

知识推理任务分类所谓推理就是通过各种方法获取新的知识或者结论,这些知识和结论满足语义。其具体任务可分为可满足性(satisfiability)、分类(classification)、实例化(materialization)。可满足性可体现在本体上或概念上,在本体上即本体可满足性是检查一个本体是否可满足,即检查该本体是否有模型。如果本体不满足,说明存在不一致。概念可满足性即检查某一概念的可满足性,即检查是否具有模型,使得针对该概念的解释不是空集。上图是两个不可满足的例子,第一个本体那个是...

2020-07-09 23:45:48

知识图谱入门 【六】- 知识融合

知识融合简介知识融合,即合并两个知识图谱(本体),基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。需要确认的是:等价实例 等价类/子类 等价属性/子属性一个例子如上图所示,图中不同颜色的圆圈代表不同的知识图谱来源,其中在dbpedia.org中的Rome 和geoname.org的roma是同一实体,通过两个sameAs链接。不同知识图谱间的实体对齐是KG融合的主要工作。除了实体对齐外,还有概念层的知识融合、跨语言的知识融合等工作。这里值得一提的.

2020-07-08 23:59:23

知识图谱入门 【五】- 知识存储

图数据库简介图数据库源起欧拉和图理论(graph theory),也称为面向/基于图的数据库,对应的英文是Graph Database。图数据库的基本含义是以“图”这种数据结构存储和查询数据。它的数据模型主要是以节点和关系(边)来体现,也可以处理键值对。它的优点是快速解决复杂的关系问题。Apache JenaJena 是一个免费开源的支持构建语义网络和数据连接应用的Java框架。下图为Jena的框架:其中,最底层的是数据库,包含SQL数据库和原生数据库,其中SDB用来导入SQL数据库,

2020-07-08 23:57:35

sweetviz - 1行代码实现Python数据分析

这是一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现数据集可视化、分析与比较。不仅根据性别、年龄等不同栏目纵向分析数据,每个栏目下还有众数、最大值、最小值等横向对比。所有输入的数值、文本信息都会被自动检测,并进行数据分析、可视化和对比,最后帮你进行数据总结。sweetviz支持Python 3.6+和Pandas0.25.3+环境,配置好环境后,使用万能的pip下载安装包:pip install sweeetziv但有一个条件需要注意:swee

2020-07-08 08:44:03

知识图谱入门 【四】- 知识挖掘

知识挖掘知识挖掘是指从数据中获取实体及新的实体链接和新的关联规则等信息。主要的技术包含实体的链接与消歧、知识规则挖掘、知识图谱表示学习等。其中实体链接与消歧为知识的内容挖掘,知识规则挖掘属于结构挖掘,表示学习则是将知识图谱映射到向量空间而后进行挖掘。实体消歧与链接实体链接的流程如上图所示,这张图在前一章出现过,那里对流程进行了简要说明。此处对该技术做进一步的说明。示例一: 基于生成模型的 entity-mention 模型该模型的流程如上图所示,文字表述为: 我们有两..

2020-07-07 23:59:57

知识图谱入门 【三】- 知识抽取

知识抽取的概念知识抽取,即从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱。大体的任务分类与对应技术如下图所示:知识抽取的子任务命名实体识别 检测: 北京是忙碌的城市。 [北京]: 实体 分类:北京是忙碌的城市。 [北京]: 地名 术语抽取 从语料中发现多个单词组成的相关术语。 关系抽取 王思聪是万达集团董事长王健林的独子。→→[王健林] <父子关系> [王思聪] 事件抽取 例如从一篇新闻报道中抽取出事件发生是触发词...

2020-07-07 23:57:31

学做网络爬虫【四】- 动态HTML

Selenium 库里有个叫 WebDriver 的 API。WebDriver 有点儿像可以加载网站的浏览器,但是它也可以像 BeautifulSoup 或者其他 Selector 对象一样用来查找页面元素,与页面上的元素进行交互 (发送文本、点击等),以及执行其他动作来运行网络爬虫。

2020-06-30 21:17:41

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。