自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(80)
  • 收藏
  • 关注

原创 【极简】基于BERT的实体识别,并在旧版docker上部署

基于BERT的NERBERT实体识别Usage数据思路相比run_classifier.py的修改其他事项Docker-Nvidia17.12.1-ce正常运行gajanlee代码已开源github如有帮助,欢迎star如有问题,欢迎IssueBERT实体识别实体识别是一个序列输出模型,所以与分类模型略有不同实体标签有顺序关系,加入CRF层准确率会提升最小文件run_ner.py对配置文件进行抽取,减少命令行的参数量Usage把run_ner.py放在bert目录下使用pr

2020-06-02 18:53:43 703

原创 Latent Dirchlet Allocation in action

LDA in actionLatent Direchlet Allocation关于公式推导可以看LDA数学八卦和Parameter estimation for text analysis,代码中的公式标号来自于后文。toy codehttps://github.com/gajanlee/toys/tree/master/toy_lda如何实现1. 数据转换LDA 是词袋模型,所以...

2019-09-11 22:29:41 342

原创 神经网络与限制波尔兹曼机

目录神经网络的前世今生前言反向传播限制波尔兹曼机RBM人工神经网络HopField网络波尔兹曼机RBM深度置信网络(Deep Belief Networks)Todo List神经网络的前世今生前言网络上对波尔兹曼机讨论甚少,所以本文是对RBM的一个简介。Geoffrey Hinton 被称为"深度学习之父"与"神经网络先驱",他的主要贡献包括反向传播算法、受限波尔兹曼机、深度置信网络、对...

2018-10-29 21:18:57 1026

原创 apt-get误卸载重新安装及gym[all]安装

apt-get 误卸载aptitude 能够解决依赖问题,比apt更强大安装apt注:安装方法:dpkg -i *.debE: 无法找到获取软件包的渠道 /usr/lib/apt/methods/http 所需的驱动程序。解决方法: 此时已经无法使用自助找包下载了,所以需要下载transports-http依赖 网址:http://ftp.hk.de...

2018-07-10 18:01:45 7369 1

原创 Golang template 高级问题

Golang template 常见问题————不解决随意可以百度的问题template 语法{{with .Var}} 在下文可以用{{.}}判断相等用 {{eq .x .y}}获取数组长度 {{len .papers}}判断数组长度为0 {{eq (len .papers) 0}}template 自定义函数FuncMaps如果是ParseFiles,则tem...

2018-05-17 17:34:09 4324

原创 mongodb + Golang及Model设计

Mongodb安装略操作启动后台服务程序mongod # 如果是默认的数据路径需要root权限, 可以修改数据存储位置。进入命令行mongo>>> show databases # 列出数据库>>> use {database_name} # 切换db指针到某个数据库>>>...

2018-04-25 14:44:49 1411

原创 pyTorch安装失败

pip 安装失败pip install torch出现Memory错误,我的电脑是64位ubuntu+4G RAM,不知道为什么会错误,在32G电脑上安装正常。建议:放弃这种安装方法。conda 安装速度慢放弃,换清华源仍没有改善。源码编译:安装cmakesudo apt install cmake从github上递归克隆。git clon...

2018-04-13 11:31:22 2943 1

原创 tensorflow 知识过程

# Tensorflow note基本用法起始节点c = tf.Constant(tf.int32, shape=[None, 1], name="Constant")v = tf.Variable(...) # 运行中被更新p = tf.placeholder(...)shape[None, 784] # None代表第一纬度不确定,视输入而...

2018-03-11 18:29:11 248

原创 TIKA Server笔记

TIKATika下载server.jarhttp://tika.apache.org/download.html下载server版,需要java运行环境。注:JAVA9默认缺少server运行所需要的xml.bind包,需要另行解决,JAVA8无问题。dockerdocker pull logicalspark/docker-tikaserver # only on initial down

2017-12-15 23:53:18 2315

原创 Django实现CAS+OAuth2

CASSolution使用CAS作为认证协议。A作为主要的认证提供方(provider)。A保留用户系统,其余系统如xxx/www不保留用户系统,即Provider的实现在A。实现步骤 xxx 选择登录,跳转到LMS的认证界面,CAS读取数据库进行认证,redirect到xxx的界面并且附带ticket在url中,在浏览器中存入Cookie。xxx得到ticket后向CAS发送ticke

2017-12-14 17:39:53 1881 2

原创 django实战oauth2 provider/consumer和google oauth2详解

Oauth2 DjangoPart IInstallpip install django-oauth-toolkit django-cors-middlewaresource/config/setting.pyINSTALLED_APPS += ( 'django_extensions', 'debug_toolbar', 'oauth2_provider',

2017-11-05 11:25:12 2830

原创 从零开始深度学习搭建神经网络(二)

参考资料:coursera的AndrewNG deeplearning.ai课程github: https://github.com/Lee-Jiazheng/My_neural_network.git中的hidden_func.py中通过上一次的学习,我们已经能够完成一个简单的神经网络,但如此简单的神经网络在进行学习的时候准确率有限,因为每一次学习都相当于在图中分割一刀,

2017-09-06 11:56:25 912

原创 知乎爬虫(一)

项目github地址:https://github.com/Lee-Jiazheng/zhihu_spider知乎作为一个内容平台,有大量的新奇内容值得我们爬取,承受前人诸多知识,所以也写点东西为初学者提供一个学习的途径。 爬虫,就是在一张大网上不断地爬取信息,刚开始我们只有一个小点,也称为种子,从这个点逐步扩张,成为一只大网,所以爬虫就是一张结网的蜘蛛。所以我们先到知乎的发现页,

2017-09-05 15:03:05 9944 1

原创 从零开始深度学习搭建神经网络(一)

人工智能不神秘,会一点加减乘除就够了。对于神经元来说,当神经受到刺激的时候,会释放神经递质传给下一个神经元,不同程度的刺激对下一个神经元释放的神经递质的量也不同,所以模仿这个过程建立神经网络:当输入一个数据x的时候,模拟输入一个外界刺激,经过处理后,输出的结果为f(x),把这个f(x)传给下一个神经元,逐步求解,最终输出一个值z,与给定的值进行对比(有监督学习),根据结果调整每个的神经元内

2017-09-04 17:43:03 6752 1

原创 intellij配置maven+SSM+redis(三)

下面展示各个java类的编写实例:1、controller包下的user包中的UserController,简单实现登录注册功能。@Controllerpublic class UserController { @Value("#{userManager}") private IUserService userService; @RequestMapping

2017-08-15 20:37:30 731

原创 intellij配置maven+SSM+redis(二)

至此springMVC已经配置完毕了,由于项目中需要使用mybatis,所以需要spring来集成mybatis,可以获取一定的好处。首先来看一下我们正常流程使用mybatis访问数据库时,SqlSessionFactoryBuilder builder = new SqlSessionFactoryBuilder();SqlSessionFactory factory = buil

2017-08-15 20:07:12 1554

原创 intellij配置maven+SSM+redis(一)

SSM就是spring+springMVC+mybatis,redis是一个键值对数据库,运行在内存中,可以提供缓存,如果查询内容不发生变化,则没有必要再次访问数据库。使用maven可以方便快捷地管理项目的jar包,而不需要手动下载添加。一、创建一个Maven项目,maven是一个jar包管理工具,可以简单地在pom.xml添加即可在项目中添加依赖库,不必在网上下载后引入jar包。

2017-08-12 00:02:01 3284

原创 python3编码转换

网络上的其余博客关于python3的编码转换不计其数,说两个我的坑。首行添加   #ecoding:utf-8,因为网络上大部分采用utf-8编码,爬虫方便。当print(str)显示仍为'\xaa\xaa'后,看一下前面是否为b,如果为b可以decode()后,再print就可以正常显示了,如果str类型无法decode。type(xxx)可以查看类型

2017-07-25 00:17:06 634

翻译 社区问答服务的问题难度估计模型——周期竞争模型RCM

心得:本文主要描述在问答系统中如何估计一个问题的难度,并给相应的专业用户进行匹配的问题。后文中解决了冷启动问题(没人回答的问题)的难度估计问题,建成RCM模型。在最后由于进行难度分类,所以能够根据文本描述抽取,来判断文本描述中的关键词难度等级。我认为问答社区可以作为自动问答系统的语料库,所以如何对问答社区(如百度知道、知乎、Stack Overflow)进行信息抽取和分类显得很重要,如果能够有效地

2017-06-26 20:08:06 1453

原创 蓝牙模块HC-05与51单片机的连接

一.实验结果手机安装HC-PDA-ANDROID.apk软件后,开启系统。手机打开蓝牙可以搜索到蓝牙芯片并可以连接,连接码为1234。系统开启后数码管全0,继电器低电平,LED灯不亮。手机连接到系统后,扫描二维码,得到一串数字后,输入该串密码,得以解锁继电器。输入密码,支持断点续传密码,如本次输入“123”,再次输入“456”,即可完成输入“123456”。输入错误可以选择按键S5清空输入

2017-06-07 14:09:11 48361 7

原创 python实现三元语言模型与输入法推荐

 语言模型的作用是在大量的训练样例中,给出一个句子求出概率,其中应用的技术有平滑、 统计语言模型。 假设S表示某一个有意义的句子,由一连串特定顺序排列的词w1、w2、w3、...、wn组成,利用条件概率公式,能够得到:P(S)=P(W1,W2,W3,...,Wn)=P(W1)P(W2|W1)P(W3|W1,W2)…P(Wn|W1,W2,…,Wn-1)P(W1)    —— ...

2017-05-21 11:39:28 5819 9

原创 JAVA WEB前端入门和总结

自WEB推出服务器模式后,web从未熄火,本文为新入门小白总结。开发WEB应用前端,HTML+CSS+JS。平台:myeclipse。编写html文件的软件:sublime text3。 HTML,一堆文本标签,但以一个网页的经验来看,大部分都是通过div+css的属性构造出大块的框架后,进行编写css类。在实践中获取的经验,通过开发者工具直接修改属性,可以方便观看修改后的结果

2017-05-14 23:36:37 5508

原创 勒让德符号的说明及作用

Legendre符号的用途  一、     二次剩余勒让德符号的提出的意义是判断一个数是否是模n的二次剩余,所以研究勒让德符号之前应该了解一下二次剩余。存在x使x的平方与a MOD (p)就称a为模p的二次剩余,其中p为素数,a>0且a通过勒让德符号和雅可比符号可以判定二次剩余是否存在。二、     勒让德符号勒让德符号可以计算当p为素数的情况的二次剩余判别问题,而

2017-04-12 22:42:19 20917 1

原创 查找的方式

一、静态查找:1、顺序表:顺序查找2、有序表:这般查找3、(比较难)静态树表:构建静态最优查找树(Static Optimal Search Tree),但有效率的方式是次优查找树(Nearly Optimal Search Tree)。用途:查找各元素的概率不同时,找到一个权值和最小的树,递归构建树。注意:在构建的时候,有可能出现被选为根节点的关键字的权值比与它相邻的关键字的

2017-04-04 21:52:59 463

原创 UWP之使用StreamSocket建立聊天室

一、了解Socket编程Socket就是在两个端口之间建立管道连接来传输数据。二、SocketStream使用流程由于聊天室基于C/S模型,所以需要Client客户端与Server模型,在两个UWP之间是不能进行Socket通信的,所以测试的时候可以写在同一个UWP内。建立TCP的连接。客户端:public async Task Start() {

2017-04-03 00:03:58 1212 1

原创 UWP编写快递查询

在UWP中,未见WebClient,如果使用.NET framework4.5以上的话,就可以使用HTTPClient进行更方便的网络访问。在本次项目中,选择“快递100”网站进行爬取。首先随便查询一个快递,在F12开发人员工具中,可以发现请求的url为http://www.kuaidi100.com/query?type={0}&postid={1}", com, Expre

2017-03-28 20:23:24 1681

原创 Longest Symmetric String (25) 与Manacher算法

求最长回文子串问题。数据量比较小,可以进行暴力破解。但有一种更好的算法,Manacher 算法。详见:https://segmentfault.com/a/1190000003914228题目代码:#include "iostream"#include "vector"#include "string"#include "cstring"#include "

2017-03-26 22:17:06 310

原创 排序算法总结

排序算法总结: 排序方法平均时间最坏情况辅助存储简单排序O(n2)O(n2)O(1)快速排序O(nlogn)O(n2)O(logn)堆排序O(nlogn)O(nlogn)O

2017-03-23 23:23:06 388

原创 基数排序

基数排序(Radix Sorting) 一、多关键字的排序:基数排序的应用主要在于多关键字的排序,例如对数字进行排序,可以将个位置为最次要关键字,最高位为首要关键字。进行排序。MSD(Most Significant Digitfirst)法,进行最高位优先排序。LSD(Least SignificantDigit first)法,进行最低位优先。二、链式基数排序:早在

2017-03-23 13:45:21 454

原创 交换排序之堆排序

选择排序 选择排序(Selection Sort)的基本思想是:第i趟在剩余的n-i+1中选择第i小的记录。其中最简单的事简单选择排序(Simple Selection Sort)。 一、 简单选择排序:如上文所述。Void SelectionSort(intL[]){       For(i=1; I {       J = 从i到L.length中选择最

2017-03-22 21:15:47 870

原创 交换排序

交换排序共包含两种算法,冒泡排序和快速排序一、冒泡排序(Bubble Sort)是一种最简单的排序算法,将第一个记录和第二个记录的关键字进行比较,若为逆序,则进行交换,然后继续向后移动进行比较,以此类推,直至第n-1个记录和第n个记录的关键字进行过比较为止,这个过程称为第一趟冒泡排序。第二趟排序对前n-1个记录进行同样操作。值得注意的是,冒泡排序的结束条件是“在一趟排序过程中没有进行过

2017-03-21 21:36:23 432

原创 UWP新建窗口

首先放入一个button,设置点击事件。1、显示新视图: CoreApplicationView newView = CoreApplication.CreateNewView();显示新视图2、跟踪新视图的 Id。 稍后使用此选项来显示视图。int newViewId = 0;3、在新线程上,填充窗口。await newView.Dispatche

2017-03-21 15:45:19 2594

原创 Pop Sequence (25)

分析:重复入栈过程。其他分析:如果栈的容量为5,那第一个比较的数字必然不大于5,否则会爆栈,所以可以设置一个index,把index~待检测的数值之间的数字全部入栈,如果爆栈就不符合要求。代码:#include "iostream"#include "vector"#include "string"#include "cstring"#include "queu

2017-03-21 13:59:28 344

原创 String Subtraction (20)

注意:字符串输入可能会有空格,用getline(cin, string);代码:#include "iostream"#include "vector"#include "string"#include "cstring"#include "queue"#include "map"#include "cstdio"#include using namespace

2017-03-21 13:30:16 299

原创 Find Coins (25)

思路:500个面值,哈希存储即可。注意从1开始算的话,注意M-i>500的情况。代码:#include "iostream"#include "vector"#include "string"#include "cstring"#include "queue"#include "map"#include "cstdio"#include using namespace

2017-03-21 13:22:21 259

原创 插入排序

Sorting大体共分五类:1、插入排序2、交换排序3、选择排序4、归并排序5、计数排序本文介绍插入排序:一、直接插入排序(Straight Insertion Sort)需要一个监视哨,一般设在0位置处。大意:        先把第i个位置的元素放入监视哨(i从2开始,i那么 第i-1个数赋值给第i个,并且从i-2开始,直到r[0](待排序的数

2017-03-20 21:07:10 187

原创 Consecutive Factors (20)

暴力求解。#include "iostream"#include "vector"#include "string"#include "cstring"#include "queue"#include "map"using namespace std;int main(){ int N; while (cin >> N) { int max = 1; int s

2017-03-20 18:57:01 242

原创 The Dominant Color (20)

在20分内算是比较有难度了,可能也是思考比较绕弯。想不到存两个数据的数组形式,只好又创建一个。800*600也比较大,不用存储。#include "iostream"#include "vector"#include "string"#include "cstring"#include "queue"#include "map"using namespace std;

2017-03-19 19:50:55 295

原创 Is It a Binary Search Tree (25)

题目分析:1、要求根据给出的数字建立二叉树2、看看给出的数字序列是不是先序遍历,是则给出后序遍历3、看看给出的数字序列是不是镜像的先序遍历,是则给出镜像的后序遍历注意地方:手写解题的时候,要注意镜像是左边大于等于根节点,右边小于根节点,完全镜像。遍历方法:1、先序:根节点,左儿子调用递归,右儿子调用递归2、中序、后序类似void PreOrd

2017-03-18 22:37:56 405

原创 用UWP编写音乐播放器

一、首先是设计界面:     <Page x:Class="MusicUWP.MainPage" xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation" xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml" xmlns:local=

2017-03-18 20:01:38 3220

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除