自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

原创 写Acknowledgement的时候,latex日志出现警告

latex中写acknowledgement的时候报错

2023-08-01 20:59:02 947

原创 Spring期刊模板中,引用Appendix中的表格时,页面显示正确但链接跳转错误

appendix中引用 Table A1,生成pdf后。appendix中显示Table A1,正确,但是点击Table A1以后,页面跳转到Table1.Appendix中有Table A1, Table A2, Table A3。正文中有Table1,Table2, Table3.添加完以后点击测试,发现问题解决了。

2023-07-23 15:53:48 301

原创 pycharm远程链接服务器配置

pycharm远程连接GPU

2023-01-19 15:17:32 1406 1

原创 【笔记】Hierarchically-Refined Label Attention Network for Sequence Labeling

这篇文章对传统的序列标注模型(BiLSTM-CRF,BiLSTM-softmax)进行了更改,采用注意力机制来辅助reference,提高精确度和速度。本文设计了一个LAN神经网层,如图所示,一共有2层,每层包含一个BiLSTM 的编码层 和一个 标签注意力inference 层。inference层,计算标签同编码层输出的注意力权重,然后同编码层输出隐层拼接后,在作为输入进入到第二个LAN层。CRF属于Log-Linear模型范畴,参数估计时,前向传播和后向传播通常用维特比算法求解,时间复杂度太高

2022-09-22 14:46:46 211

原创 【Matlab】check for incorrect argument data type or missing argument in call to function ‘resample‘

when I execute code:sig=resample(sig,44100,fs);the error occurs.check for incorrect argument data type or missing argument in call to function 'resample'The error reason:Signal Processing Toolbox is needed for Resample function.So, make sure your M

2022-05-27 19:22:00 1172

原创 Some problems in pipenv and torch and cuda

As Chinese input app doesn’t installed in my computer, so I write this passage in English.Some logs encountered related to the incompatibility between torch and CUDA :Log1:/home/supercomputer/Downloads/Dr.VOT/.venv/lib/python3.7/site-packages/torch/cuda

2022-05-06 15:03:03 484

原创 tf-idf-算法实现

1.读取文档2.构建corpus3.创建term-document incidence矩阵4.创建tf-idf矩阵from nltk.tokenize import word_tokenizeimport numpy as npimport mathdef read_file(doc_list): file_map = {} for doc in doc_list: f = open("/content/" + doc, "r") line.

2021-07-19 10:30:59 168

原创 haskell-函数证明-数学归纳法

用数学归纳法证明:第一题:-- 問題[1]Definition:-- 空 加 列表 | 列表 加 列表A1: [] ++ ys =ys for all ysA2: (x : xs) ++ ys = x : (xs ++ ys) for all x, xs, ysTheorem:xs ++ [] = xs for all list xs.Proof.We show the claim by structureal induction on xs.Base case:If xs = .

2021-07-17 22:49:36 219

原创 haskell-生成幻方算法实现-魔方阵

上下左右对角线相加为n的矩阵```haskell-- prefix 可以看作有一个窗口,这个窗口可以容纳该list个元素,窗口向前移动prefix [] = [[]]prefix (x : xs) = [] : [(x : y) | y <- prefix xs]-- 解题思路-- prefix (3 : 2,1) = prefix [] : [(3 : [], [2], [2,1])]-- prefix [3] = [[], [

2021-07-14 23:12:15 159 2

原创 haskell-列表元素去重实现

- 去重nub :: Eq a => [a] -> [a]nub [] = []nub (x : xs) | x `elem` xs = nub xs | otherwise = x : nub xs-- >>> nub [3,11,2,2,3,3]-- [11,2,3]--nub1 :: Eq a => [a] -> [a]nub1 [] = []nub1 (x : xs) | x `elem` (nub1 xs)

2021-07-12 13:33:18 297

原创 haskell-幂集合实现

-- power 列出某一个数组的所有组合,包含空 冪集合power :: [a] -> [[a]]power [] = [[]]power (x : xs) = power xs ++ [ (x : ys) | ys <- power xs]-- 解题思路-- power [] = [[]]-- power [1] = [[] [1]]-- power [1,2] = [[], [1], [2], [1,2]]-- power [1,2,3] = [[], [1], [2

2021-07-12 13:32:09 142

原创 haskell-zip-unzip函数实现

-- unzip 将map的key和value分别取出放到2个list中myUnzip :: [(a, b)] -> ([a], [b])myUnzip [] = ([], [])myUnzip ((x, y) : zs) = (x : xs, y : ys) where (xs, ys) = myUnzip zs-- myUnzip1 :: [(a, b)] -> ([a], [b])-- myUnzip1 [] = []-- myUnzip1 (x, y) : ys

2021-07-12 13:30:22 173

原创 haskell-排列组合实现-超详细解释

-- 先实现prefix函数,prefix 可以看作有一个窗口,这个窗口可以容纳该list个元素,窗口向前移动prefix [] = [[]]prefix (x : xs) = [] : [(x : y) | y <- prefix xs]-- 解题思路-- prefix (3 : 2,1) = prefix [] : [(3 : [], [2], [2,1])]-- prefix [3] = [[], [3]]-- prefix .

2021-07-12 13:01:58 355

原创 Haskell-动态规划-硬币问题求解

coin :: Int -> [Int] -> [Int]coin money [] = []coin money (c :cs) | money - c >= 0 = maxLength (c:[] ++ coin (money - c) cs) (coin money cs) | otherwise = coin money csmaxLength :: [Int] -> [Int] -> [Int]max

2021-07-06 00:15:30 110

原创 Haskell-细胞自动机-wireworld-实现

-- name: Wang Yao-- id: s2110025-- acknowledgements: Li Hanyuan, LI RUIZHI-- reference: -- https://github.com/bergsans/cellular-automaton-in-haskell/blob/main/wireworld/WireWorld.hs-- https://github.com/bradrn/cellular-automata-- https://github.com/b

2021-07-06 00:11:12 313

原创 自然语言处理-HMM-维特比算法推导句子词性

维特比算法在HMM解决的是Inference/decoding 问题。即:给定一句话以后,推导 出来每个单词的词性是什么下面做一道题来练练手:画出该句子的词格图:代码实现:import numpy as npinput_lattice = ['Noun', 'Verb', 'Adj']input_word = ['coffee', 'takes', 'free']input_transition_probability = [[0.4, 0.5, 0.1],

2021-06-30 22:10:55 198

原创 贝叶斯优化-最大似然估计函数参数化(2/3)

假设由样本数据:D={(x1, y1), (x2, y2)….(xn,yn)} yi = 1,2,3由上面的得到词库V= {今天,上午,下雨,明天,时,在家}x1 = (1, 1, 1, 0, 0, 0) 属于R|V|x2 = (0, 2, 0, 1, 0, 0) 属于R|V|x3 = (0, 0, 1, 0, 1, 1) 属于R|V|由朴素贝叶斯可得最大似然函数为:先求一下X1的概率得:代入最大似然估计函数得:接下来我们需要引入参数,来最大化函数,求出参数。构建词库矩阵θ、和先

2021-06-27 15:02:18 272

原创 贝叶斯优化-硬币问题得最大似然估计(1/3)

1.最大似然估计是机器学习领域最为常见的用来构建目标函数的方法,他的核心思想是根据观测到的结果来预测其中的未知参数。即已知样本为D最大似然估计通过最大化P(D|θ)来求解未知参数θ。最大似然估计-硬币问题的最大似然估计假设有不均匀的硬币,抛了6次,得到的结果如下D={正,反,反,正,正,正},现在根据结果来估计θ(硬币抛出正面的概率)。首先需要最大化P(D|θ):P(D|θ) = P(正,反,反,正,正,正|θ)由于硬币正面反面是独立的所以可以得到下面的公式:P(D|θ) = P(正|θ) *

2021-06-27 11:52:09 1194

原创 朴素贝叶斯-垃圾邮件判断-加一平滑处理-详细解释

朴素贝叶斯-垃圾邮件分类器代码实现参考上一篇文章本篇文章主要详细的讲解一下采用朴素贝叶斯对垃圾邮件进行判断的过程。1.先熟悉一下朴素贝叶斯公式:即:2.判断一封邮件是否为垃圾邮件可以简化为如下概率问题:①、P(垃圾|邮件内容): 一个邮件内容为垃圾邮件的概率。②、P(正常|邮件内容): 一个邮件内容为正常邮件的概率。3.先熟悉一下单词概率计算方法:例子:下图中:①、蓝色区域代表正常邮件②、橙色代表垃圾邮件③、假如每封邮件10个词汇。④、红色邮件代表:邮件中出现了几次“购买”词汇

2021-06-26 17:40:43 1700 3

原创 SunTone/Up-方法学介绍

SunTone方法学包括2个方面:1.面向对象软件开发过程2.Java EE架构方法学的最佳实践:1.用于驱动2.系统性质量驱动3.以架构为中心4.迭代和增量5.基于模型解释:1.用例驱动:在项目启动之初确定用例,之后以用例为主线贯穿开发过程–用例:系统高级别的功能–用例使用者称为参与者(Actor)2.系统性质量驱动:根据用户需求中的系统性质量,来决定系统架构服务质量:Qos- quality of service性能,吞吐量,灵活性等。系统质量:-一个系统所有QoS的组

2021-06-25 18:44:35 155

原创 机器学习-线性回归求解-从目标函数到最小二乘法

图1为线性回归目标函数求解图2,3,为线性回归求解,最小二乘法推导

2021-06-25 01:59:05 173

原创 机器学习-线性回归-身高体重关系预测

基于上一篇机器学习-根据身高体重画图练习, 本篇采用回归模型,拟合身高和体重的数据,并且可以根据给定的身高预测体重。# 引用sklearn库,其中包含线性回归模块from sklearn import datasets, linear_model# 把数据拆分成训练集和测试集from sklearn.model_selection import train_test_split# 引用 numpy库,做科学计算import numpy as np# 引用matplotlib库,主要用来

2021-06-24 23:25:48 5181

原创 机器学习-根据身高体重画图

import numpy as npimport matplotlib.pyplot as plt# 第一列身高,第二列体重data = np.array([[152, 51], [156, 53], [160, 54], [164, 55], [168, 57], [172, 60], [176, 62], [180, 65], [184, 69], [188, 72]])# 将体重和升高得值取出存入xy轴中x, y = data[:, 0].reshape(

2021-06-24 19:44:52 744

原创 自然语言处理-句子生成词网格

做个小练习图1.图2.把下面的句子转化为词网格このひとことで元気になった。方法:1.根据图1把每一个词分割为单个字,然后根据上面的图查表,看看该词是否存在,如果不存在,则增加字的长度,继续在上图种查找该词。2.对单词进行词性标注。根据图2,判断词汇之间是否能够互相到达。经过上述1,2步骤得到下面的词网格图。...

2021-06-24 18:37:35 260

原创 架构方法学-软件开发过程介绍

方法学分为阶段(4),工作流(7),活动和产物四部分软件开发包含7个工作流1.需求收集2.需求分析3.架构4.设计5.实现6.测试7.部署模型是对某个实体(如建筑)或系统(如软件)的抽象概念化为什么要建模:①、可视化新的或现有的系统②、与项目干系人进行决策沟通③、记录每个OOSD工作流中的决策④、定义系统的结构(静态):序列图,泳道图等等和行为(动态):通讯图,协作图元素⑤、使用模板构建软件解决方案所有跟项目有关的人,都叫做项目干系人。软件设计:就是把项目干系人的思维模

2021-06-24 17:05:28 123

原创 自然语言处理-词向量表示

上一篇文章:自然语言处理-文本表示-one-hot-编码 中讲了 文本独热编码的表示方法。对该篇文章中的计算结果进行文本相似度的计算。计算方法参考这篇文章:自然语言处理-文本相似度计算计算词汇之间得欧式距离得:根号2计算余弦相似度得:0可见通过one hot编码得到的词汇向量是无法通过欧氏距离和余弦相似度来评估文本的相似度的。原因是由于one hot编码得到的举证为稀疏矩阵,0较多。解决方案:采用词向量的方式对文本进行表示,词向量举证为稠密矩阵,维度较少,计算效率高,关于训练词向量,将会写在后面的章

2021-06-21 11:32:56 224

原创 haskell-归并排序

-- 有序数组合并merge' :: Ord a => [a] -> [a] -> [a]merge' [] [] = []merge' [] x = xmerge' x [] = xmerge' (x : xs) (y : ys) | x < y = x : (merge' xs (y : ys)) | otherwise = y : (merge' (x : xs) ys)-- 分割数组 split_1 [x_1,

2021-06-21 11:17:51 328

原创 自然语言处理-文本相似度计算

文本相似度计算有一下2种方式:1.欧式距离通过计算两个句子的向量距离来判断两个句子的相似度。距离越来说明相似度越小,距离越小说明相似度越大。缺点:例:给定两组向量,x1 = (1,1,1),y1=(3,3,3)和 x2=(2,1,-1), y2=(0,-1,1).通过计算发现x1,y1的欧氏距离和x2,y2的欧式距离一样。但是x1和y1更加相似,是因为欧氏距离在计算的过程中没有考虑到向量的方向。 如果2个向量相似,需要考虑到它们的方向是否也是相似的。2.余弦相似度计算相似度:d = s1 ·

2021-06-20 23:47:11 651 2

原创 自然语言处理-文本表示-one-hot-编码

如何通过向量化的方式表示单词 ①、采用独热编码的方式,对词汇进行编码如何表示句子 ②、Boolean vector:先对句子进行分词,然后按照词典中的向量对句子中的词汇是否出现,进行编码。该方法的缺点:只记录了句子中的词汇是否出现,并没有记录词汇出现的次数,也没有考虑到一个单词的重要性。 ③、Count vector:先对句子进行分词,然后按照字典中的向量对句子中的词汇出现次数进行编码。 ④、TF-IDF向量表示:句子中并不是出现的越多的单词就越重要的。公式:tfidf(w) = tf(d, .

2021-06-20 22:53:05 945

原创 自然语言处理-文本处理-单词纠错-选择最好的候选词汇

本篇文章基于上一篇 自然语言处理-文本处理-单词改写实现。前一篇主要写了一点有关根据单词编辑距离来计算相似单词集合的问题。下面开始通过概率模型来从相似单词集合中寻找到最有可能的单词。例如:当用户输入单词officr的时候,我们候选词集合中右office和official,但是通过计算,可能会发现office的可能性更大一些。例:假设用户输入错误的字符串为source_word : s,我们需要找到最合适的单词纠错后的字符串target_word : t。也就是说需要满足。t^ = argmax P(

2021-06-20 19:34:47 322

原创 haskell-foldl和foldr函数实现

-- myFoldl 给定一个函数,参数a,和数组b,a按照函数规则分别对b进行处理,得到amyFoldl :: (a -> b -> a) -> a -> [b] -> amyFoldl f e [] = emyFoldl f e (x : xs) = myFoldl f (f e x) xs-- myFoldr 给定一个函数,参数a,和数组b,数组b从后往前一次对a进行函数指定的操作-- myFoldr :: (a -> b -> b) ->

2021-06-20 18:41:01 262

原创 haskell- map和filter函数实现

- map-- 取一个函数和list作为参数,遍历该list,将每个元素带入函数进行计算,得到一个新的listmyMap :: (a -> b) -> [a] -> [b]myMap f [] = []myMap f (x : xs) = f x : myMap f xs-- filter-- 取一个函数和list作为参数,遍历该list,将每个元素带入函数进行计算,为true的情况,获取该元素,形成新的listmyFilter :: (a -> Bool) -&gt

2021-06-20 18:39:50 517

原创 haskell-将列表分为奇数(左)和偶数(右)列表

-- split homework 4/5split :: [Int] -> ([Int],[Int])split [] = ([],[])split [x] | (x `mod` 2 == 1) = ([x],[]) | otherwise = ([], [x])split x = (oddlist x, evenlist x)oddlist :: [Int] -> ([Int])oddlist [] = []oddlist (x : xs) | (x `

2021-06-20 18:35:49 414

原创 haskell-递归实现合并两个有序列表

-- 有序数组合并merge' :: Ord a => [a] -> [a] -> [a]merge' [] [] = []merge' [] x = xmerge' x [] = xmerge' (x : xs) (y : ys) | x < y = x : (merge' xs (y : ys)) | otherwise = y : (merge' (x : xs) ys)解释一下:传入两个列表都为空的时候,返回空

2021-06-20 18:25:11 371

原创 自然语言处理-文本处理-单词改写实现

按照上一回的操作,python-编辑距离算法 ,直接循环词库里面的每一个单词,然后计算出用户输入的单词和词库中每个单词之间的编辑距离,这种方法,消耗太大,不建议使用,但是可以转变思路进行如下计算:①、可以根据用户输入,生成编辑距离为1,2等的字字符串②、然后对词库进行过滤(生成出来的字符串可能不在词库里面,所以需要把不在词库中的词汇过滤掉)③、从中选择出最好的候选词汇,关于如何选择出最好的候选词汇,将会在下一章节中进行讲解。def gen_edit_distance_1(word): """

2021-06-20 00:19:49 456 6

原创 图像信息处理特论-第一讲入门篇练习

1.下面是最近学习图像处理的入门代码,调用opencv的包,对图片进行简单处理。import numpy as npfrom matplotlib import pyplot as plt# file = open('\TA\Week 1-20210615file.txt', 'w')# file.write('hello word \n')# file.write('this is our new text file \n')# file.write('this is our new tex

2021-06-19 17:00:51 66

原创 逻辑回归-L1,L2正则比较

import numpy as npnp.random.seed(12)# 生成正负样本各100个num_sample = 100# 20乘20的矩阵rand_m = np.random.rand(20, 20)cov = np.matmul(rand_m.T, rand_m)# 通过高斯分布生成样本x1 = np.random.multivariate_normal(np.random.rand(20), cov, num_sample)x2 = np.random.multivaria

2021-06-19 16:40:46 1377

原创 自然语言处理-斯坦福CS224第一讲python代码实现

# txt文件google 或者 百度import matplotlib as matplotlib # this is used as mathmatic packageimport notebook as notebook # graphic packageimport numpy as np# Get the interactive Tools for Matplotlibimport matplotlib.pyplot as pltimport warningswarnings

2021-06-19 11:29:23 132

原创 逻辑回归二分类-利用贝叶斯公式判断邮件是否为垃圾邮件

# spam.csv训练样本可以百度或者google一下import pandas as pdimport numpy as npimport matplotlib.mlab as mlabimport matplotlib.pyplot as plt# read data from the datasetdf = pd.read_csv("C:\\ai_work_space\dataset\spam.csv", encoding='latin')# read 5 rows of the

2021-06-19 11:21:02 390

原创 机器学习-逻辑回归算法实现

import matplotlibimport numpy as npimport matplotlib.pyplot as plt# 随机生成样本数据,正类和负类各5000个样本数据np.random.seed(12)num_sample = 5000# x1, x2为5000行2列的数组, 2维, x1,均值u在x轴和y轴的为0,0点,方差是否可以理解为在x轴和y轴分别为以点[1, 0.75], [0.75, 1]附近x1 = np.random.multivariate_normal(

2021-06-19 11:17:02 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除