1 罗思洋

尚未进行身份认证

拼了命做自己。

等级
TA的排名 4w+

Java文本处理12-找出文本最长句与最短句并计算方差

1、任务简介在分句完成后我们可以统计出每一个句子的长度(指句子包含的汉字数),在此基础上我们可以找出最长的句子和最短的句子,并且可以计算出句子长度的方差,本节任务的第一个程序是将结果打印出来,第二个程序是将结果保存到一个指定文本文档中。2、基本任务和代码(1)任务11)任务内容找出文本的最长句和最短句,并计算出文本的句长方差,将结果打印到黑屏幕上。2)具体思路(1)首先需要使用In...

2019-02-24 20:33:29

Java文本处理11-根据句长进行排序

1、任务简介本节任务是在上面任务的基础之上进行的,在分句完成后,我们可以根据句子的长短(这里指句子的汉字数)对句子进行排序输出,本节的第一个程序是根据TreeMap的Key值进行升序排序,第二个程序是根据TreeMap的Value值进行降序排序(关于TreeMap的排序方法在《Java文本处理6-统计文本中汉字的出现次数(降序排序)》中已经有所涉及)。2、基本任务和代码(1)任务11)任...

2019-02-24 11:17:10

Java文本处理10-计算文本平均句长

1、任务简介本节任务是计算文本平均句长,可以再上一节任务《Java文本处理9-计算文本句子数》的基础上来进行,并且还需要使用到《Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等》里面关于计算文本总字数的相关方法。2、基本任务和代码1)具体思路(1)首先需要使用InputStreamReader类和BufferedReader类实现文本的读取,由于我使用的文本文档均为utf-...

2019-02-20 13:23:19

Java文本处理9-计算文本句子数

1、任务简介本节任务是计算文本中的句子数,并且对于句子数的划分标准为“。” “!”和“?”三种符号。2、具体任务和代码1)具体思路(1)首先需要使用InputStreamReader类和BufferedReader类实现文本的读取,由于我使用的文本文档均为utf-8编码,所以还需要指定编码格式为utf-8;(2)然后需要定义一个空的字符串变量,在对文本逐行读出后将读出的内容追加到该空...

2019-02-19 21:38:50

Java文本处理8-统计文本中汉字的信息熵

1、任务简介本节任务是在上一节任务《Java文本处理7-查询文本中单个汉字的信息熵》的基础上统计文本中每一个汉字的信息熵,关于信息熵计算的方法在上一节任务中已经阐述过了,本节的第一个程序是将结果打印出来,而第二个程序是将结果保存到一个指定文本中。2、基本任务和代码(1)任务11)任务内容统计指定文本中每一个汉字的信息熵,然后将统计结果打印出来。2)具体思路关于具体思路使用到了上两节...

2019-02-15 18:11:56

Java文本处理7-查询文本中单个汉字的信息熵

1、任务简介本节任务的目的是编写一个Java程序,用于求取文本文档中某一指定汉字的信息熵,该任务可以基于《Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等》及《Java文本处理4-查询文本中汉字或字符串的出现次数》来进行。2、信息熵的计算关于信息熵的概念我们在《信息论》这门课程中已经学习过了,信息熵具有确定性、非负性、对称性、连续性等许多重要性质,所以我们在计算它的时候要保证...

2019-02-03 21:22:15

Java文本处理6-统计文本中汉字的出现次数(降序排序)

1、任务简介本节任务是在上一次任务《Java文本处理5-统计文本中汉字的出现次数(乱序)》的基础上统计文本中汉字的出现次数并实现降序排序,第一个程序将结果打印出来,而第二个程序将结果保存到一个指定文本中。2、基本任务和代码(1)任务11)任务内容统计指定文本中每一个汉字的出现次数实现降序排序,并将结果打印出来。2)具体思路(1)首先需要使用InputStreamReader类和Bu...

2019-02-03 19:19:17

Java文本处理5-统计文本中汉字的出现次数(乱序)

1、任务简介本节任务是编写一个Java程序,可以统计指定文本中每一个汉字的出现次数,第一个程序将结果打印出来,而第二个程序将结果保存到一个指定文本中。2、基本任务和代码(1)任务11)任务内容统计指定文本中每一个汉字的出现次数,并将结果打印出来。2)具体思路(1)与之前的处理方法一样,首先需要使用InputStreamReader类和BufferedReader类实现文本的读取,由...

2019-01-30 18:35:25

Java文本处理4-查询文本中汉字或字符串的出现次数

1、任务简介本节中我们需要编写一个Java程序,使得它可以查询文本中某一汉字或字符串的出现次数,并且文本和字符串可以由用户指定,我使用原版《西游记》的文本进行此次操作,具体方法如下文所述。2、基本任务和代码1)具体思路(1)首先需要使用InputStreamReader类和BufferedReader类实现文本的读取,由于我使用的《西游记》为utf-8编码,所以还需要指定编码格式为utf...

2019-01-29 23:18:23

Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等

1、任务简介本节中我们需要编写一个Java程序,使得它可以统计文本行数、字符数、字节数、汉字、数字、字母及其它符号的数量。本文分为两个程序进行讲解,第一个程序首先实现文本行数、字符数及字节数的统计,然后在第一个程序的基础上实现第二个程序,第二个程序在包含第一个程序功能的基础上实现对汉字、数字、字母的统计。2、基本任务和代码(1)任务11)任务内容实现文本行数、字符数及字节数的统计。2...

2019-01-25 19:00:29

Java文本处理2-字符加斜杠、空格

1、任务简介在上一节中对原版《西游记》进行文本处理后得到了一个不含空行的文本文档,在此基础上我需要在文本的每一个字符后分别添加斜杠/和空格,具体操作见下文。2、基本任务和代码(1)任务11)任务内容在文本的每一个字符后添加斜杠/。2)具体思路(1)对于读取文档的方法以及InputStreamReader类、OutputStreamWriter类、BufferedReader类、Bu...

2019-01-20 12:35:58

Java文本处理1-删除空行

1、任务简介有时候我们从网上下载的文本中会有一些空行,这会对我们做文本行数及字符串的统计造成影响,所以就需要对文本进行预处理来删除空行,从而得到没有空行的文本,本次任务就对空行删除程序的编写进行讲解。2、基本任务和代码1)具体思路(1)首先需要读取一个含有空行的txt文档,在java中读取文件的方法有很多种,例如:1、以字节为单位读取文件,常用于读二进制文件,如图片、声音、影像等文件;2...

2019-01-19 21:42:58

Windows远程桌面实现物理机访问控制虚拟机3-Nginx及Natapp发布网页

1、任务简介昨天的博客中讲解了使用Tomcat发布静态网页的方法,今天就来学习使用Nginx发布静态网页的方法。目前国内的许多主流网站,例如京东、百度、淘宝等都是用Nginx作为其服务器,所以在学习Tomcat之余对其进行学习可以扩展自己的知识面。本次任务在虚拟机中使用Nginx服务器部署完网页之后,可以使用物理机查看该网页,若再使用Natapp实现内网穿透之后,还可以使用外网设备通过指定网址访...

2019-01-11 17:29:56

Windows远程桌面实现物理机访问控制虚拟机2-Tomcat发布网页

1、任务简介昨天的博客中已经讲解了如何使用物理机远程控制虚拟机,那么今天的博客就讲解物理机远程控制虚拟机发布网页,该部分内容仍是前期任务中接触过的知识,所以仍有必要温习一下。2、前期准备1)物理机通过Windows远程桌面访问虚拟机的方法参见我昨天的博客《Windows远程桌面实现物理机访问控制虚拟机1-连接方法》;2)发布网页可以使用Tomcat或者Nginx,今天我使用Tomcat来...

2019-01-10 15:18:42

Windows远程桌面实现物理机访问控制虚拟机1-连接方法

1、任务简介上周末的团队会议中,老师要求我们学会使用Windows远程桌面实现物理机访问控制虚拟机,该任务我在老师布置的前期任务中已经接触过,但是当时我的物理机是Win8系统,并且完成时间较早,故许多细节已经遗忘了,所以现在我使用Win10系统的物理机重新对该任务进行操作,进而加深自己的认识和理解。2、前期准备1)我的迅即系统为Win7,关于虚拟机软件VMware及Win7系统的安装可以参...

2019-01-09 15:37:50

VMware虚拟机安装Linux(Ubuntu)简介

1、任务简介由于本学期学习的《嵌入式系统设计》课程需要我们使用Linux系统进行程序的设计,但是大部分同学使用的系统都是Windows系统,所以在虚拟机下安装Linux就变得十分必要了,故我撰写这篇博客给大家提供一些安装上的引导。2、准备工作1)关于VMware虚拟机的下载和密钥可以参考我之前的博客:点此查看,下载完成后首先要安装并激活虚拟机;2)常用的Linux操作系统有Ubuntu、...

2018-12-06 15:20:07

Python爬虫2-翻译小程序

1、简介本次博客分享的内容为基于有道在线翻译实现一个实时翻译小程序,本次任务是参考小甲鱼的书《零基础入门学习Python》完成的,书中代码对于当前的有道词典并不适用,使用后无法实现翻译功能,在网上进行学习之后解决了这一问题。2、前置工作1)由于有道在线翻译是“反爬虫”的,所以在编写该程序的时候需要使用到User-Agent,通过使用request模块中的headers参数,对它进行适当的设...

2018-10-23 21:42:54

Python爬虫1-获取指定网页源码

1、任务简介前段时间一直在学习Python基础知识,故未更新博客,近段时间学习了一些关于爬虫的知识,我会分为多篇博客对所学知识进行更新,今天分享的是获取指定网页源码的方法,只有将网页源码抓取下来才能从中提取我们需要的数据。2、任务代码Python获取指定网页源码的方法较为简单,我在Java中使用了38行代码才获取了网页源码(大概是学艺不精),而Python中只用了6行就达到了效果。Pyt...

2018-10-22 21:23:29

Python元组操作

1、任务简介我在之前的博客《Python列表(“数组”)操作》中讲解了Python列表的一些主要操作方法,由于元组与列表有许多相同之处,所以今天就把元组的操作也讲解一下。元组与列表最大的区别就在于你可以任意修改列表中的元素,可以任意插入或者删除一个元素,而在元组中这些都是不可以的,但是我们有其他的方法来实现这些,具体的操作方法会在后文中讲解。注:本博客所有代码均在IDLE下完成。2、元组...

2018-10-06 14:13:24

Python列表(“数组”)操作

Python列表:一个“打了激素的数组”1、任务简介首先,我们需要明确的一点就是Python是没有数组这一概念的,也正是基于这一特点我才打算撰写这篇博客,但是Python中有一种比数组还要厉害的东西——列表,它的功能比数组更加强大,所以把它称为“打了激素的数组”。关于Python列表的讲解可以查看菜鸟教程,但是我认为本博客的讲解比教程更易于理解,可以让初学者一看就懂。注:本博客所有代码均在...

2018-09-29 16:39:54

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!