自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 leetcode-445_AddTwoNumbersII

leetcode-445_AddTwoNumbersII标签(空格分隔): 数据结构, leetcode上代码#!/usr/bin/env python # encoding: utf-8 """链表加法需要用栈记录下两个链表,然后把结果放进list,最后再生成链表@author: zkjiang@time: 2019/5/16 14:38You are given ...

2019-05-16 14:42:22 205 1

原创 leetcode-230_KthSmallestElementinaBST

上代码#!/usr/bin/env python # encoding: utf-8 """找出一颗二叉搜索树第K大的值思路可以用中序遍历,第K个输出的结果就是第K小的值Given a binary search tree, write a function kthSmallest to find the kth smallest element in it.Note:You ...

2019-05-14 18:17:59 200

原创 TFIDF解释与简单实现

TFIDF介绍本文所讲的所有例子均为一下例子corpus = [["我","a","e"],["我","a","c"],["我","a","b"]]TFIDF全程叫做term frequency–inverse document frequency,翻译过来可以叫做文本频率与逆文档频率指数, TFIDF就是为了表征一个

2019-02-02 14:59:31 23146 5

原创 隐马尔科夫

隐马尔科夫(HMM)简介隐马尔科夫可以用于序列标注问题,比如分词过程,假设分词按照BEOS过程,在这里,隐马尔科夫就是从隐马尔科夫模型生成隐藏状态序列基本参数初始概率向量π:就是我一开始分别是B、E、O、S的概率如{”B“:0.6,“S”:0.4}状态转移概率A:就是我从其中一个隐状态到达另一个隐藏状态的概率,如:当前为B,则下一个字符是E的概率是0.8观测概率矩阵B:就是...

2019-01-31 13:43:02 351

原创 Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Network

标签(空格分隔): 自然语言处理简介在简单的神经网络上就能达到较好的效果即使不用神经网络,也能达到较好的效果相关工作一开始的时候人们会把简单问句简化成一个结构化的问句最近的一个数据集已经成为了知识图谱上的问答基线本文并不认为人们已经充分探索了baseline方法论本文将QA问题分为四个部分:实体识别、实体链接、关系预测、证据整合github:https://g...

2019-01-08 10:55:02 542 2

原创 最大频率分词的一些测试结果

基于动态规划的最大频率分词写在前面基于动态规划的最大频率分词是一种比较简单的分词方法,jieba分词就用了这种分词方法(当然还有HMM)博主对该分词方法做了一下简单的测试测试数据集选的是微软的分词测试集和清华的分词测试集两个测试集都有一定的训练数据和测试数据基本情况如下:数据集训练集数量测试集数量微软869243985清华19056194...

2019-01-06 16:38:23 402

原创 TextCNN图示

TextCNN图示标签(空格分隔): 自然语言处理论文地址https://www.aclweb.org/anthology/D14-1181图示下图分了四部分,从左到右分别是a,b,c,d,我们分开解释a, 就是输入的文本,假设最大文本长度是100,词向量维度是300,所以a(输入文本)的维度是100 * 300b,进行卷积,利用的不同大小(2 * 300,3300,4300...

2018-12-19 10:39:33 783

原创 # Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Netwo

# Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks标签(空格分隔): 自然语言处理简介在简单的神经网络上就能达到较好的效果即使不用神经网络,也能达到较好的效果相关工作一开始的时候人们会把简单问句简化成一个结构化的问句最近的...

2018-12-18 14:02:07 655

原创 Chinese NER Using Lattice LSTM

文章目录Chinese NER Using Lattice LSTM论文链接文章主旨简介论文模型基于字符的模型基于词的模型Lattice模型CRF吹逼时刻(实验效果)Chinese NER Using Lattice LSTM标签(空格分隔): 自然语言处理论文链接https://pan.baidu.com/s/1FVzPt8yKe2e5PYcEs5wMpwhttp://xueshu...

2018-12-09 12:01:45 1228

原创 NELL框架

文章目录Never-Ending LearningAbstractIntroductionRelated WorkNerer-Ending-Learning举个例子,永动学习机NELL的学习问题实证评估最后讨论优势劣势缺陷#信息抽取(Nell框架论文)标签(空格分隔): 自然语言处理Never-Ending LearningAbstractIntroduction机器学习作为AI的一...

2018-12-07 16:24:35 4015

原创 HMM的维特比算法的一个实际例子

HMM的维特比算法的一个实际例子标签(空格分隔): 自然语言处理用一个分词的HMM的例子做个解释任务:将“我来到苏州”分词理想结果【“我”,“来到”,“苏州”】定义参数要定义的参数主要有:状态参数、结果参数、初始化参数、转移概率、发射概率状态参数:这里就是每个字符的状态,我们采用简单的“BES“标记,如果一个字符作为一个词的开头则为B,如例子中的”来“,”苏“;如果一个字符...

2018-11-26 20:32:16 2773 1

原创 FastText

FastText标签(空格分隔): 自然语言处理FastTextFastText 论文链接https://pan.baidu.com/s/1032UerrzaZbJGjb3-PavoA综述FastText不是一种特殊的机构,而是一种思想,就是为了更快的求得结果。用于文本分类的FastText(pytorch)class FastText(BasicModule): ...

2018-11-22 16:37:54 440

转载 LSTM

LSTM标签(空格分隔): 自然语言处理说说lstm(转https://www.cnblogs.com/wangduo/p/6773601.html?utm_source=itdadao&utm_medium=referral)该文作者信息作者:wangduo出处:http://www.cnblogs.com/wangduo/本博客中未标明转载的文章归作者wangduo和博客...

2018-11-22 16:16:13 8504

原创 LDA主题模型实战

导入相关的包https://github.com/lda-project/lda 这里有lda包的文档,我也是参考的这个文档来的!import numpy as npimport lda X = lda.datasets.load_reuters()X.shape(395, 4258)这里说明X是395行4258列的数据,说明有395个训练样本vocab = lda....

2018-11-22 10:59:28 4377 1

原创 putty的使用

putty的使用putty可以实现的功能连接远程服务器将远程端口进行本地windows映射putty连接过程putty的设置打开putty --> 点击Session --> 在Host Nane那里输入你要连接的服务器ip,在右边的Port那里输入你要连接的端口号点击Connection --> 在Seconds between keepali...

2018-10-23 14:43:35 670

原创 自然语言中的分词(一)分词的基本背景

自然语言中的分词(一)分词的基本背景序言:最近了解了一下分词的知识、所以前来总结一下目前只要包括分词的背景介绍分词的理论方法介绍几种常见分词工具的分词方法超详细实现常见的分词方法分词的基本问题汉语分词基本会遇到以下三类问题:分词规范问题歧义词问题未登录词问题分词规范问题这主要是因为人们对分词的标准难以统一,难以量化,虽然国家出台过规范...

2018-10-22 22:54:32 698

原创 LongestCommonPrefix

LongestCommonPrefix标签(空格分隔): 数据结构package java_algorithm;public class LongestCommonPrefix{public String longestCommonPrefix(String[]strs){ if(strs==null||strs.length==0)return""; ...

2018-09-18 22:46:45 175

原创 数据结构

Container With Most Water标签(空格分隔): 数据结构class Solution(object): def maxArea(self, height): """ :type height: List[int] :rtype: int """ if len(height) == 0...

2018-09-17 22:47:59 100

原创 寻找最长子字符串

寻找最长子字符串标签(空格分隔): 数据结构寻找一个字符串的最长子字符串package java_algorithm;import java.util.HashMap;import java.util.HashSet;import java.util.Map;import java.util.Set;public class LongestSubstring { ...

2018-09-04 21:44:34 608

原创 查看文件夹的大小

查看文件夹的大小标签(空格分隔): linuxdu -h –max-depth=1

2018-08-28 15:08:14 253

原创 mongo正则中的非

mongo正则中的非标签(空格分隔): mongomongo匹配正则中的非,就是匹配不包含某个字段的东西“mention”:{“regex":"((?!镇|乡).)∗regex":"((?!镇|乡).)∗regex":"^((?!镇|乡).)*”} 这里匹配的是不包含镇或者乡的字符...

2018-08-28 13:03:47 1498

原创 mongo索引性能

mongo索引性能标签(空格分隔): mongohttps://www.cnblogs.com/c-abc/p/6023824.html测试mongo索引性能有索引,每个值都是唯一值 "executionStats" : { "executionSuccess" : true, "nReturned" : 1, ...

2018-08-28 09:47:43 647

原创 mongo索引性能

mongo索引性能标签(空格分隔): mongohttps://www.cnblogs.com/c-abc/p/6023824.html测试mongo索引性能有索引,每个值都是唯一值 "executionStats" : { "executionSuccess" : true, "nReturned" : 1, ...

2018-08-28 09:40:56 452

原创 在mongo中选择列表的前N个或者后N个

在mongo中选择列表的前N个或者后N个标签(空格分隔): mongodb.getCollection(‘entity_info’).find( { }, {“attr_attr_value”: {“$slice”: 3 } }) db.collection.find( { field: value }, { array: {$slice: count } } );T...

2018-08-27 13:44:44 688

原创 数据库备份迁移

数据库备份迁移标签(空格分隔): mongo参考链接 http://www.runoob.com/mongodb/mongodb-mongodump-mongorestore.html数据库备份 mongodump -d raw_data -o /data/mongo d 备份的数据库 -0 数据备份路径数据库还原mongorestore -h 192.168.10...

2018-07-26 18:46:12 746

原创 mongo删除一列

mongo删除一列标签(空格分隔): mongodb.entity_info.update({},{$unset:{‘father’:”}},false, true) entity_info:表名 father:字段

2018-07-20 15:52:10 3279

原创 关于python的路径

关于python的路径标签(空格分隔): python获得python的路径import osimport sysdef a(): print(os.path.realpath(__file__)) # 获得当前文件路径,包含该文件名字 dirname = os.path.dirname(os.path.realpath(__file__)) # 获得...

2018-07-13 08:51:50 156

原创 Linux截屏

Linux截屏标签(空格分隔): Linuxgnome-screenshort -a

2018-06-24 12:44:54 2195 1

原创 Tensorflow源码分析--angle()

Tensorflow源码分析–angle()标签(空格分隔): Tensorflow设输入为[x + y*j]返回角度值,该角度为aegtan(x,y),注意,返回的是角度值import tensorflow as tfx = tf.constant([1 + 10000j])y = tf.constant([1])z = tf.constant([1 + 1j])se...

2018-06-20 12:48:42 923 1

原创 Tensorflow源码分析--add_n()

Tensorflow源码分析–add_n()标签(空格分隔): Tensorflow这个和之前的add()函数很像,只是它可以通过列表的方式输入多个Tensorimport tensorflow as tfx = tf.constant([1,3])y = tf.constant([3,2])sess = tf.Session()print(sess.run(tf.ad...

2018-06-20 12:30:45 1315

原创 Mongo备份

Mongo备份标签(空格分隔): Mongo**sudo mongodump -h localhost:27017 -d raw_data -o /mongo_data * -h 你的mongo地址 * -d 要备份的数据库名字 * -o 你要备份的路径(我用的是linux)...

2018-06-19 15:35:15 119

原创 Tensorflow源码分析--add()

Tensorflow源码分析–add()标签(空格分隔): Tensorflow注释返回两个tensor的加和 Returns x + y element-wise.NOTE: Add supports broadcasting. AddN does not. More about broadcastinghereArgs: x: A Tensor. M...

2018-06-19 14:39:27 1166 1

原创 Tensorflow源码分析--add()

Tensorflow源码分析–add()标签(空格分隔): Tensorflow注释返回两个tensor的加和 Returns x + y element-wise.NOTE: Add supports broadcasting. AddN does not. More about broadcastinghereArgs: x: A Tensor. M...

2018-06-19 13:01:18 719 1

原创 Tensorflow源码分析--accumulate_n

Tensorflow源码分析–accumulate_n标签(空格分隔): Tensorflow例子:import tensorflow as tfx = tf.constant([[1,2],[3,4]])y = tf.constant([[1,2],[3,4]])result = tf.accumulate_n([x,y])sess = tf.Session()pr...

2018-06-18 14:02:56 1765

原创 知识抽取(1)

知识抽取(1)标签(空格分隔): 知识图谱知识抽取结构化数据非结构化数据信息抽取 难点:结果的准确性和覆盖率 *子任务: 基于触发词的Patteern 基于依存句法分析的Pattern LTP(哈工大自然语言处理平台) 优点 小规模数据容易实现 构建简单 缺点 特定领域模板需要专家 可移植性差一些 难以...

2018-06-18 11:20:32 874

原创 Tensorflow源码分析--tf.abs()

Tensorflow源码分析–abs标签(空格分隔): Tensorflowtf.abs()import tensorflow as tfx = tf.constant([[-2.25 + 4.75j], [-3.25 + 5.75j]])sess = tf.Session()print(sess.run(tf.abs(x)))>>>[[5.2559...

2018-06-15 17:25:01 4410

原创 找到一个子节点的所有父节点

找到一个子节点的所有父节点标签(空格分隔): python初衷是为了找到一个子节点的所有父节点#!/usr/bin/env python# -*- coding:utf-8 -*-''' @Project: EntityLink@Create Date: 下午5:23@AuthOr: zkjiang@Description:'''dict = {"A":"B...

2018-06-14 18:47:58 3475

原创 linux下连接ssh

linux下连接ssh标签(空格分隔): Linuxlinux下连接sshssh 用户名@IP地址

2018-06-14 14:30:15 310

原创 Linux 下pycahrm不能输入中文的问题

Linux 下pycahrm不能输入中文的问题标签(空格分隔): Pycharm参考博客https://blog.csdn.net/sinat_37623490/article/details/72991119

2018-06-13 18:27:06 383

原创 jena的安装

jena的安装标签(空格分隔): 数据库(mongo,jena,,,)基本参考一下链接 https://zhuanlan.zhihu.com/p/33224431 注意要点 * 注意重新开始启动要杀死原来进程 * 需要java环境 * 需要配置conf文件的...

2018-06-13 17:08:46 1881

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除