自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 项目实训第十五周(6.7-6.13)[前端搭建,项目完成]

项目已经接近尾声,正确率经过训练已经突破九成。模型间的磨合也基本完成,准备进行前端页面的搭建。通过vue+springboot搭建的网页,实现在线评阅和批量上传的评阅功能。但是只能把环境配在本地,还不能实现上线。几张页面截图如下:在这里插入图片描述...

2021-06-11 14:45:18 70

原创 项目实训第十四周(5.31-6.6)

这一周,是项目实训的尾声,我们都有了属于自己的模型,并且能够给出得分。我将在这一篇继续阐述我是如何实现我的上一张图片的。首先,文本预处理,生成关键词,生成词典。以关键词作为项,通过转换为简单合取式,自己组成一句话作为规则,然后调用esim,得到最终的结果。这里,就不再进行模型的赘述。...

2021-06-11 14:44:06 63 1

原创 项目实训第十三周(5.24-5.30)

在我们每个人都有一定的工作量的情况下,我们去找了老师,说明了我们目前的弱分类器组成情况。但是我们的弱分类器好像和老师理解的不是一个事物。我们认为,弱分类器只是一些使用数据不足,或者模型粗糙的导致的正确率不高,分类效果不好的一种分类器。但是老师给我们提出了三级分类器结构。这里的弱分类器,是作用范围小,但是足够精确的一类分类器,跟我们自己的理解完全不同。老师的三级分类器是这样的:第一级,要求输入一段文本,要能判断这是概念性的说明还是具体的例子;第二级输入文本和关键词,判断关系。第三级利用关键词,组成query,

2021-06-11 14:43:27 71

原创 项目实训第十二周(5.17-5.23)[多MLP弱分类器投票机制]

在这一周,我们小组明确了分工,决定个人研究个人的模型。鉴于去找学长,学长给出了弱分类器的概念,所以我们决定分开试一试。现在又两种思路,一个是继续复现李东进学长论文,另外一个就是去研究弱分类器。我们小组完成了分工。陈宇轩同学选择继续思路一,不断复现和再优化。而剩下的我们三个就开始对弱分类器进行研究,互不干预,齐头并进。我选择了先尝试简单的基于多MLP的弱分类器的研究。这是我在过程中的理解:首先,我学习了pytorch的相关的层数设置,包括线性层,loss函数的使用,参数的保存与模型加载等基本操作。在这基础

2021-06-11 14:40:43 241 1

原创 项目实训第十一周(5.10-5.16)[基于关键词的文本数据清洗]

在经过一个五一小长假,我们得到了极大的休整。我们在一起商量的时候,碰撞出一些火花,对第二种思路产生了极大的影响。按照项目实训第五周的设想,我们要得到具体的问题,然后在对问题进行回答。这中间给人一种感觉,问什么我要先生成问题成文本,但是在对生成的文本进行回答时还需要把文本转变成变量呢?其实道理很简单,可以认为这样操作具有极高的可解释性。但是鉴于学长给我们指出可以不用管什么方式,甚至说根本不需要生成问题,就可以完成分类的操作,就是我们真正想要的东西。就好比我们去隔间洗澡,衣服也脱了,发现淋浴头坏了,我们要换个隔

2021-06-11 14:38:34 219 1

原创 项目实训第十周(5.3-5.9)

本周相对轻松,由于是五一假期,所以工作相对停滞。我们选择一起做第一种方法的优化。其中一种方法,就是扩大数据量,扩大训练的数量,按照常理,将会使正确率有所提高。但是在实际操作中,我们发现模型的loss在0.9后就很难向下降了。但是最开始的loss不过2左右,这么看来效果并不是很好。这里我们将在小长假后继续研究。...

2021-06-11 14:37:28 48 1

原创 项目实训第九周(4.26-5.2)

这一周又是确定大方向的一周。我们先找了老师,汇报了我们的情况。老师了解了我们情况,提出了建议,建议我们做一些更为创新的东西出来,并期望我们能捡起之前的思路继续执行。但是由于第一种思路的困难性,老师给我们找来一位博士生给我们指导,我们团队听取了学长的建议。学长说的比较抽象,他指出,我们一方面可以通过QA问答系统进行模型创新,也就是利用问题生成的方式,在对问题进行回答来评判出得分。另一方面,不管采取什么措施,只需要达到一个区分的效果,方式不重要,这需要我们自己设计。我们在经过上面的过程后,重新对我们的工作进行

2021-06-11 14:36:50 53 1

原创 项目实训第八周(4.19-4.25)

项目实训第八周(4.19-4.25)第八周,我们工作已经基本完善,准备好接受中期检查。首先,我们内部统一了博客标准,定位每人至少五篇。并且再次跟学长学姐沟通,最后确立了的第一种实验思路的可行性。最终定位为基础复现李东进学长的互注意力机制。组内统一了实现思路,认为编码使用bert,代替双向LSTM的编码过程。互注意力机制中关于考生答案与参考答案的相互注意方面,我们完全复刻论文模型,拿到处理后的文本向量。与论文不同,我们没有再过一次双向LSTM进行信息的再处理,而是直接进入MLP,输出结果。经过大量训练,采

2021-06-11 14:36:26 85 1

原创 项目实训第七周团队及个人进展汇报[互注意力机制的复现]

项目实训第七周(4.12-4.18)时间紧迫,我们小组决定先一起做一个论文上的模型复现以达到中期检查的要求。我们选择的李东进学长的论文,他的论文中的一个模型大体描述如下:文本分为考生答案与参考答案。首先,他采用双向LSTM进行编码,编码完成后进行互注意力下的双向考量。拿到的结果作为下一步的输入,进入另外一个双向LSTM网络进行进一步的信息提取,提取后得到的向量拼接,进入MLP,然后进行softmax操作,输出得分。为了更清楚的考到这个过程,我把过程图放在下面。我们的实现并没有完全按照学长的论文进行,我

2021-06-11 14:35:01 115

原创 项目实训第六周团队及个人进展汇报

项目实训第六周时间:4.5-4.114月6日,我们团队一起再一次去找学长和学姐。这次我们对上周的思路进行了进一步的明确,在仔细思考如何具体实现上遇到了许多问题。按照我们的分工,两个人思路聚集在问题生成方面,我们实验了当前已经有的模型。对于完整的能够实现从输入中文,到输出中文的模型,是在难以寻找。大部分模型还是基于英文的处理,而对中文的实用性极低。加上如果采用完整的模型,很难看清楚实现细节。由于模型很好的封装性,我们很难拿到完整的源代码,只能简单的调用,这里是一个关键问题。对于后半部分,拿到问题后在进行筛

2021-04-20 21:19:18 80

原创 项目实训第五周团队及个人进展汇报

第五周(3.29-4.4)本周我们主要召开了两次会议。第一次会议是在3.29,会议内容考虑了具体的问题生成的处理办法。经过我们资料的查询,由于现在的许多模型在这方面上都是以英文作为输入进行问题的生成,那么这就带给我们两个思路,一是采用翻译的方法,在输入前把文本转译成英文,得到输出后,再把得到的问题翻译成中文;二是直接学习现有的使用中文处理的方法,全部过程不涉及英文。当然,第二种方法有第二种方法的局限,就是中文处理的不如英文好,技术相对来说没有那么成熟。但是,最直接的方便一些,所以我们想采用直接使用中文的

2021-04-04 17:31:35 102

原创 项目实训第四周团队及个人进展汇报

第四周(3.22-3.28)我们团队在这周去找了老师,请求老师给我们思路和思考学习方向。在这一周的时间里,我们一共找了两次老师(由于我脚崴了,没能参与具体过程)。第一次,我们团队在交流了上周自己自学的部分论文的思路及收获的基础上的结论,我们拿到了自己团队的“猜测”思路。然后我们拿着自己的思路与老师进行沟通,验证自己的思路是否正确。但是老师所给的思路与我们自己搜索的资料截然不同。老师给出了一下几个名词:伴随网络、图、逻辑、攻击样本,引导我们按照这几种思路中的一种进行思考。老师还给我们了一位学姐的援助。学姐给

2021-04-03 19:16:18 89

原创 项目实训第三周团队及个人进展汇报

第三周小组进行了一次会议的召开。本次会议的召开主要是根据第一次找老师的时候老师给我们的方向讲解,自己搜索了一些相关方面的论文进行自学,以便我们能在相关领域入门。共计搜索了一下内容:https://baijiahao.baidu.com/s?id=1607697774799696077这是一篇关于机器学习的文章,内容主要是基于深度学习CNN的短文本相似度计算方案。https://www.ixueshu.com/h5/document/994906362d7885de4704b2e6960cfd5631

2021-04-01 20:10:02 96

原创 项目实训第二周团队及个人进展汇报

项目实训第二周团队及个人进展汇报第二周在进行完答辩之后,我们又开了集体会议。会议主要结合答辩时候老师询问的问题,对我们的项目进行进一步的研究方向的确定。将由原本的短文本语义分析改为智能评卷系统,目标更为精确。按照计划,我们将在第三周进行第一次资料搜索与讨论,好让我们对问题有更好的理解。其中,我在第二周主要是修改了立项书,并考虑了后面一周的大体规划,第二周是预准备阶段,后面几周将开展前期的资料搜索,数据集的取得等问题的探索。...

2021-04-01 19:53:13 117

opencv-3.4.10可能缺少的配置文件(boostdesc-bgm-bi.i、boostdesc-bgm-hd.i等等)

经常会有在进行opencv配置时,看似cmake成功,但是在make时报错,缺少文件。大家可以根据CMakeDownloadLog.txt查看下载丢失的内容,后面紧跟着网址,进去后复制粘贴成文件,再放回缺少文件的位置即可。 # connect to :: port 443 failed: Connection refused # Failed to connect to raw.githubusercontent.com port 443: Connection refused 本文件可避免无可视化界面去打开进行复制粘贴,总共包含十个文件,可有效避免大家自己复制的麻烦之处。

2023-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除