自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (5)
  • 收藏
  • 关注

原创 Your python3 install is corrupted. Please fix the ‘/usr/bin/python3’ symlink

解决将Ubuntu 16.04 LTS 升级到 18.04 LTS的时候,出现Python的symlink定位问题。确定python版本,把版本重指向:sudo ln -sf /usr/bin/python3.6 /usr/bin/python

2022-04-19 18:06:54 3013

原创 Move Files from Ubuntu to Windows 7 (Ubuntu和windows文件共享方法)

The newest Unbuntu system is Version 11.10 until 2012-3-2.Sometimes, you want to move files from your VirtualBox’s virtual machines to a Windows 7 host or vice versa, but how?  It’s simple really!

2012-03-02 11:31:37 1425

转载 LCA问题:求二叉树中任意两个节点的最近公共祖先

问题描述:英语:Given an arbitrary binary tree, propose amethod to determine the first common ancestor of 2 randomly selected nodes in the tree中文:求二叉树中任意两个节点的最近公共祖先也称为LCA问题(Lowest Common Ancestor)。其实这道问题是许多面

2012-01-03 10:44:51 5368

原创 Machine Translation Useful Links: Techniques, Toolkits, Videos (机器翻译中的有用链接:相关技术、工具和视频)

Machine TranslationUseful Links: Techniques, Toolkits, Videos TianLiang2011-12-2 There are some useful links about the machine translation research field, which you can refer for your resear

2011-12-02 18:39:08 5681 4

原创 The study record of Regular Expression 正则表达式学习笔记

Regular expressions are the key to powerful, exible, and efŒcient text processing. Regular expressions themselves, with a general pattern notation almost like a mini programming language, allow you t

2011-11-22 19:16:12 1246

原创 undefined reference to `gzopen' 'gzwrite' and 'gzclose'

There is one problem puzzled me two days when I compile the newest Moses download fromhttp://www.statmt.org/moses/The decoder is carried out very well, while compiling the SCRIPS directories, here c

2011-11-19 16:54:30 10083 2

原创 Some useful links of Statistical Machine Translation (SMT) 统计机器翻译的有用链接

There are some links that I have collected from the Internet, maybe they are useful for some students or researchers in the Machine Translation field!ConfrenceACL Anthology » D09 ACL2012 CIC

2011-11-19 16:39:21 2439

原创 计算数组中最大值、最小值和平均值的方法(The methods of calculating the maximum, minimum and average of a array )

计算一个数据的最大值最小值和平均值是很常用的方法,最近因为要用到这些方法,特总结如下,因为较常见,具体的分析方法就不提供了:/*********************************************Get the maximum of the input values*******************************//********************

2011-10-30 18:56:58 2941

原创 对各种数据类型进行排序 sort any type data

通常要是闲一组数据的排序要创建一个函数,而实现另外一组类类型的数据排序时又要创建一个函数,但是如果使用函数模板就可以通过一个函数来实现。本实例将通过函数模板实现不同类型数据的排序。函数模板的声明方式如下:template 下面给出一个具体的函数:/******************************************* Sort any tpye arr

2011-10-30 18:52:19 1730

原创 Levenshtein Distance Levenshtein 编辑距离——一种相似度的计算方法

/********************************************* Levenshtein Distance Algorithm *******************************//************************************************************************************

2011-10-30 18:44:47 1442

原创 运行于Windows中的GIZA++( GIZA++ working inWindows Platform)

摘 要:Linux环境中,大部分基于短语的统计机器翻译系统可以很方便的利用GIZA++训练得出的词语对齐结果。然而,对于许多习惯在Windows系统中从事科学研究的科研工作者却享受不到这种便利。虽然我们可以使用Cygwin或者虚拟机在Windows系统下模拟Linux系统,但是有时这样来回的切换很不方便。本文主要是想和大家分享一下我们如何在Windows系统中使用GIZA++进行词语对齐的一些经验

2011-10-30 18:21:07 6689 6

原创 Moses运行过程记录---Moses结果和评测(四)

接下来的是Moses运行的结果和评测部分,具体的运行过程如下:1. Copy the executable program moses to ~/scripts-20100126-0922/training/model.2. Make a input file containing the sentences that wanting to be translated ~model/i

2011-02-25 11:59:00 4143 12

原创 Moses运行过程记录---Moses语言模型和翻译模型构建(三)

This time I want to translate English to Chinese, so I choose Chinese as a language model.Go to the directory:/home/tianliang/mosesdecoder/srilm/bin/i686-gcc4, we will use the “ngram-count” to build a

2011-02-25 11:53:00 4147 4

原创 Moses运行过程记录---Moses软件的安装(二)

(1)Install GIZA++ and mkclsSince I have installed GIZA++ and mkcls in my computer, I won't give the full process here. You can refer to the last report about running GIZA++.One you should do before

2011-02-25 11:47:00 6456 1

原创 Moses Running Process and Steps :Moses运行过程记录---Moses运行前的准备(一)

----------------------------------------------------------------------The Records of Running MosesUniversity of Macau2010-1-27------------------------------------------------------------

2011-02-25 11:42:00 3103 2

原创 Word-based统计机器翻译中的常见异常情况总结及处理方法!

<br />附录1(Appendix A)(异常情况处理)<br /> <br />     这里将给出运行过程中出现的问题,当你尝试运行的时候,如果出现下面这些情况,可以作为参考以便改正。<br />u  当进行编译单词分类工具mkcls的时候,在这个操作系统下将会出现下面的情况:<br />tianliang@ubuntu:~/research/giza-pp$ cd mkcls-v2 <br />tianliang@ubuntu:~/research/giza-pp/mkcls-v2$ make <b

2011-02-09 16:49:00 3351 4

原创 GIZA++运行情况记录和结果对比

这篇文章主要详细记录了GIZA++的运行报告,所使用的语言模型为CMU-Cam_Toolkit-v2,解码器使用的是isi-rewrite-decoder-r1.0.0a,使用的操作系统是Ubuntu9.10 ,gcc 的版本是G++4.4.1.都是比较新的运行环境,有需要的学习者可以参考。有不明白的可以留言。其中文中参考的论文为刘洋老师的《利用现有软件构建统计机器翻译系统》。

2010-11-13 12:34:00 5151 27

原创 GIZA++运行详细报告

这篇文章主要详细记录了GIZA++的运行报告,所使用的语言模型为CMU-Cam_Toolkit-v2,解码器使用的是isi-rewrite-decoder-r1.0.0a,使用的操作系统是Ubuntu9.10 ,gcc 的版本是G++4.4.1.都是比较新的运行环境,有需要的学习者可以参考。有不明白的可以留言。其中文中参考的论文为刘洋老师的《利用现有软件构建统计机器翻译系统》。

2010-02-09 12:41:00 16038 39

转载 Numerical Example of K-Means Clustering(K-Means聚类算法的简单例子)

 The basic step of k-means clustering is simple. In the beginning we determine number of cluster K and we assume the centroid or center of these clusters. We can take any random objects as the initi

2009-11-20 21:02:00 2151

原创 澳门一周形迹!

来到澳门大学已经一周多了,总体感觉还是不错的。  初来澳大,一切都是很新奇,她是建立在澳门最高的山岗上,或者可以说整个山区都让她给占了。所以你不必担心缺少运动,这里稍微走动就是爬山,而我就是住在澳大的山顶上的一座新建成的宿舍楼——东亚楼上。每天都得爬山来回实验室和宿舍,更何况我住在十层楼!(当然这里全部都是电梯)  澳大的生活费很高,除了进口的化妆品要比内地的便宜外,其他的生活用品我还没有

2009-09-17 10:23:00 1286 2

原创 进军CSDN!

今天才注册CSDN,不过最早接触它可不是现在,早在上大二的时候 就经常使用它。现在澳门大学读研,对他的需求越来越高了,以前使用同学的号,现在感觉自己也需要注册一个,开始吧。我会下载这里我需要的东西,同时也会分享自己存在的好的材料。

2009-09-17 09:53:00 661 1

English tokenization

Moses中自带的英文分词,大家可以下载使用处理英文的分词,具体的使用命令就是tokenizer.perl example.txt

2012-02-06

isi-rewrite-decoder-r1.0.0a-linux解码器

这是基于短语的统计机器翻译的解码器部分,由于原网站不再更新所以不再提供下载链接,这里给个备份,大家需要的可以使用,使用的方法我在博客中http://blog.csdn.net/tianliang0123/article/details/5301847 有说明

2011-10-24

线性代数 同济大学 高等教育出版社

《工程数学线性代数》第四版仍由同济大学应用数学系骆承钦教授修订。这次修订保持第三版的编写体系,增加了一些解说性的文字,使论述更通俗易懂,还调整增加了部分例题和习题,其中有些选自研究生入学考试的试题。 全书内容分为:行列式、矩阵及其运算、矩阵的初等变换与线性方程组、向量组的线性相关性、相似矩阵及二次型、线性空间与线性变换等六章,各章均配有一定数量的习题,书末附有习题答案。其中一至五章符合教育部颁发的工科本科线性代数课程教学基本要求,教学时数约34学时,第六章较多地带有理科的色彩,供对数学要求较高的专业选用。

2009-10-30

高等数学(第五版)同济大学出版社

高等数学(也称为微积分,它是几门课程的总称)是理、工科院校一门重要的基础学科。作为一门科学,高等数学有其固有的特点,这就是高度的抽象性、严密的逻辑性和广泛的应用性。抽象性是数学最基本、最显著的特点--有了高度抽象和统一,我们才能深入地揭示其本质规律,才能使之得到更广泛的应用。严密的逻辑性是指在数学理论的归纳和整理中,无论是概念和表述,还是判断和推理,都要运用逻辑的规则,遵循思维的规律。所以说,数学也是一种思想方法,学习数学的过程就是思维训练的过程。人类社会的进步,与数学这门科学的广泛应用是分不开的。尤其是到了现代,电子计算机的出现和普及使得数学的应用领域更加拓宽,现代数学正成为科技发展的强大动力,同时也广泛和深入地渗透到了社会科学领域。因此,学好高等数学对我们来说相当重要。然而,很多学生对怎样才能学好这门课程感到困惑

2009-10-30

Principles of Distributed Database Systems

In the Second Edition of this best-selling distributed database systems text, the authors address new and emerging issues in the field while maintaining the key features and characteristics of the First Edition. The text has been revised and updated to reflect changes in the field. This comprehensive text focuses on concepts and technical issues while exploring the development of distributed database management systems (DBMS). Principles of Distributed Database Systems presents distributed database systems within the framework of distributed data processing in general, rather than as a problem in isolation.   NEW TO THIS EDITION   The relationship of distributed DBMSs with the new networking technologies is discussed.   The query processing/optimization chapters now focus on techniques employed in commercial systems and include new algorithms such as randomized search strategies.   Discussion of advanced transaction models and workflows has been added to the transaction management chapters.   Full chapters are devoted to parallel DBMSs and distributed object DBMSs.   Current issues are discussed in a new chapter, including sections on data warehousing, world wide web and databases, push-based technologies, and mobile DBMSs.   General interoperability issues and distributed object platforms such as OMA/CORBA and DCOM/OLE have been added to the multidatabase systems chapter.   这本书的第三版将于2010年出版,目前在Amazon的网站上已经有简介。 

2009-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除