Element简-CSDN博客

原创 Task2 中文预训练模型泛化能力挑战赛

目录赛题描述及数据说明代码实践Step 1:环境准备Step 2：数据读取1) 数据集合并2)标签编码3) 数据信息查看Step 3: 数据分析（EDA）1) 子句长度统计分析2)统计标签的基本分布信息Step 4: 预训练模型选择Step 5: 模型构建1) 切分数据集（Train,Val）进行模型训练、评价2) 构造输入bert的数据格式3) 模型搭建4) 模型训练5) 输出结果赛题描述及数据说明大赛地址：https://.

2021-02-25 22:45:36 557

原创 task1 中文预训练模型泛化能力天池赛

目录1 目的2 背景2.1 个人配置2.2 赛题要求2.3 本机跑通Baselinepytorch配置3 准备环节4 模型训练过程5 Docker提交5.1 Docker安装5.2 本机Docker推送1 目的根据Datawhale大佬们提供的baseline训练模型，并通过docker的方式提交到天池比赛，真的太不容易了。2 背景2.1 个人配置操作系统：mac2.2 赛题要求赛事信息：天池-&..

2021-02-21 23:29:25 260

原创优质课堂教学的十项特征及衡量指标

优质课堂教学的十项特征及衡量指标，老师请看过来！作为老师，怎样上课才最棒？这里面有没有那些考核的标准或者依据呢？今天分享这篇好文，希望对各位老师能有所参考：优质课堂教学的十项特征一、清晰的课堂教学结构1.过程明了，目标明确，内容清晰；2.师生角色分配清楚，师生双方协商好规则、程序及自由空间。二、高比例的有效学习时间1.时间安排得当，守时；2.拨冗去繁，日程安排有节奏。三、促进学习的课堂气氛1.互相尊重，互相...

2020-12-29 11:04:32 434

原创 Matplotlib中文与负号显示不出的问题

解决方式一：修改配置文件(1)找到matplotlibrc文件（搜索一下就可以找到了）(2)修改：font.serif和font.sans-serif，我的在205,206行font.serif: SimHei, Bitstream Vera Serif, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, P

2020-11-17 16:39:11 399

原创排序搜索计数及集合操作

排序搜索计数及集合操作目录1.numpy.sort(a[, axis=-1, kind=‘quicksort’, order=None])2.numpy.argsort(a[, axis=-1, kind=‘quicksort’, order=None])3.numpy.lexsort(keys[, axis=-1])4.numpy.partition(a, kth, axis=-1, kind=‘introselect’, order=None) 5.搜索num...

2020-10-31 22:16:03 161

转载 2020-10-27

目录一摘要1 )写博客的担心2)自己的经历二写博客的好处1)没写博客的原因2)最初的想法3)最后的好处三总结一摘要1 )写博客的担心今天来谈谈,写博客对我的益处,说起写博客,其实我写博客的时间不长,也就10来个月时间;之前工作的时候,看到同事每天晚上写博客,当时觉得很奇怪,就觉得写这个东西,非常浪费时间,自己知道的好的技术或者是好的技术解决思路,如果分享出去,不是被别人学去了吗等等一系列问题.2)自己的经历等写了一段时间博客时,慢慢发现,.

2020-10-27 18:27:23 154

原创 Numpy 数学函数及逻辑函数

目录一、向量化和广播二、数学函数算数运算numpy.addnumpy.subtractnumpy.multiplynumpy.dividenumpy.floor_dividenumpy.power三、三角函数numpy.sinnumpy.cosnumpy.tannumpy.arcsinnumpy.arccosnumpy.arctan四、逻辑函数真值测试numpy.allnumpy.any数组内容¶numpy.isnan

2020-10-27 11:01:48 2103 12

原创教学设计八大部分

教学设计八大部分说课说出教学设计的内容一、教材分析二、学情分析三、教学目标四、教学重点及难点五、教学方法及手段、学习方法六、教学过程（包括教学环节及教学活动设计）七、板书设计八、教学效果预测与反思说课说出教学设计的内容教学设计一般时长为15分钟，内容包括一节课45分钟，可以是专业课程或公共课程。在我的理解中：老师=写剧本+表演，不仅要自己懂也要学生懂。学习同样也是一个内化、迁移的过程。一、教材分析说明为什么选用此书、此书的优势、为.

2020-09-13 18:32:53 33384

原创 eclipse自动填写提示代码设置(syso:system.out.println())

eclipse自动填写提示代码设置(syso:system.out.println())windows->preferences->java->editor->content assist2. 在目录树上选择"Java——Editor——Content Assist"，在右侧的"Auto-Activation"找到"Auto Activation triggers for java"选项;3. 在"Auto Activation triggers for java"选项中，

2020-09-08 10:45:07 473

原创作为高校老师，该如何兼顾教学与科研？

摘要通过对南昌大学16位教师的深度访谈,采用质性分析方法,从知识与性格两个维度出发,讨论了二者对高校教师教学与科研工作乃至职业发展的作用关系。研究结果表明:高校教师在教学与科研工作中均有知识与性格的显著表现;教师的职业发展依赖于教学与科研,而教学与科研本身既可能是矛盾冲突关系也可能是相辅相成关系,关键在于教师的平衡与协调;教师的知识与性格之间存在着相互转化机制,二者的共同作用有利于促进教师职业发展。由此,以教师职业发展为目标,基于知识与性格融合的视角,提出高校教师知性管理理论,包括管理框架与基本逻辑,为

2020-09-08 10:31:52 3250

原创写论文的方法

目录1、搜集以下的源头所提供的latex或者word基础格式模板：2、一定要认准了论文的框架结构：3、去网上搜，论文的写作语句，我给出几个URL给你：4、做实验，塞内容5、找你实验的主题的那些较新论文，看看怎么抽取一些reference出来1、搜集以下的源头所提供的latex或者word基础格式模板： SCI期刊：IEEE的子期刊（NLP的）,ACM,等会议：ACL,COLING,NAACL等中文：中文信息学报，软件学报，计算机...

2020-05-28 17:03:33 765

原创 15章规则学习

15.1基本概念规则学习是从训练数据中学习一组能用于对未见示例进行判别的规则。规则可分为两类：命题规则和一阶规则命题规则由原子命题和逻辑连接词构成简单陈述句。一阶规则基本成分是能描述事物的属性或关系的原子公式，能够表达复杂的关系，也被称为关系型规则命题规则是一阶规则的特例，一阶规则的学习比命题规则复杂。15.2 序贯覆盖一般有两种策略：自顶向下：从比较...

2019-08-22 22:37:01 1429

原创 Tssk9 第10章降维与度量空间

1. 章节主要内容本章的主要内容是降维与度量学习，这是机器学习领域很重要的一块内容。在进入具体的介绍之前，对降维与度量学习不清楚的小伙伴们其实可以尝试从字面意思上理解一下降维与度量学习是干什么的，而它们又与机器学习有什么关系。我相信看过科幻小说的人，应该都对降维度打击这个概念不陌生吧，在某些科幻小说中，生活在更高维度的外星人可以通过降低自己的维度来打击低纬度的生命体，而这种方式的打击由于带...

2019-08-10 13:57:31 706

原创 Task11第12章计算学习理论

1. 章节主要内容机器学习理论（computational learning theory）研究的是关于通过“计算”来进行“学习”的理论，即关于机器学习的理论基础，其目的是分析学习任务的困难本质，为学习算法提供理论保证，并根据分析结果指导算法设计。这章内容相对比较抽象，它关注的更多是算法能产生的数据与结果之间的映射与实际映射的贴近程度和稳定程度，而不是具体的算法的优劣。这是一个在更高层面审...

2019-08-10 13:52:49 862

原创 Task12第13章半监督学习

1. 章节主要内容在前边的学习过程中，我们知道了监督学习和无监督学习的区别。前者是在标注好了的训练集上训练学习器，并用训练好的学习器去对新的样本进行预测，朴素贝叶斯、决策树、神经网络等都属于这类机器学习算法。后者是在未标注的数据集上根据数据本身的分布情况来对数据进行分类，各种聚类算法就是这类的机器学习算法。从上边的定义来看，一个机器学习算法“监督”与否取决于用来计算的数据有无被“标注”好！...

2019-08-10 12:51:19 882

原创 Task14学习第15章规则学习

目录第15章规则学习模型15.1 基本概念15.2 序贯覆盖15.3 剪枝优化15.4 一阶规则学习15.5 归纳逻辑程序设计（ILP）15.5.1 最小一般泛化（LGG）15.5.2 逆归结15.6 阅读材料第15章规则学习模型15.1 基本概念“规则”通常指语义明确，能描述数据分布隐含的客观规律或领域概念，可写成“若..则..”。与...

2019-08-10 12:22:16 381

原创学习第14章概率图模型

机器学习的核心思想就是根据已知的内容去推测未知的内容，然后在已知和未知之间建立起联系，这个联系就是机器学习中的各种模型！这和我们的经验系统很像，在第一章中的挑西瓜的例子就是我们利用经验系统来把西瓜的可观测外观信息（根蒂、花纹、声响）和未知信息（是否是好瓜）建立起联系的结果。说回本章的内容，一种建立已知信息与未知信息联系的方法是对未知信息的概率分布进行推测。概率模型（probabilistic ...

2019-08-10 12:17:46 1380

原创 28 | 如何合理利用assert？

1.什么是assert?在python中assert是debug的一个好工具，主要用于测试一个条件是否满足，如果满足则什么也不做，相当于执行了pass语句，如果测试条件不满足，便会抛出异常AssertionError，并返回具体的错误信息。具体用法：assert_stmt ::= "assert" expression ["," expression]简单形式asser...

2019-07-29 00:05:25 208

原创 27 | 学会合理分解代码，提高代码可读性

1.缩进规范python的缩进其实可以写多种，tab,双空格，四空格，和Tab混合，而PEP8请选择四个空格的缩进，不要使用Tab,更不要用Tab和空格混用。第二个注意的是，每行最大长度限制在79个字符。...

2019-07-18 09:01:31 202

原创 26 | 活都来不及干了，还有空注意代码风格？！

对编程规范的信仰1.每个语言都有专门和委员会2.每个语言相应的编程规划群3.每一个代码提交，都类似于Git里的diff4.有大量的开发自动化工具。统一的编程规范为什么重要1.阅读者的体验——编程者的体验——机器的体验《8号python增强规范》《Google python风格规范》http://google.github.io/styleguide/pyguide....

2019-07-17 21:58:51 152

原创胶囊网络

目录第一章 - 前戏王1.1 物体姿态1.2不变性和同变性1.3全连接层1.4卷积神经网络第二章 - 理论皇2.1 胶囊定义2.2 神经元类比2.3 工作原理2.4 动态路由2.5 网络结构第三章 - 实践狼3.1 帆船房子...

2019-07-13 22:40:32 1558 11

原创 20 | 揭秘 Python 协程

1. 一个爬虫的例子import timedef crawl_page(url): print('crawling {}'.format(url)) sleep_time = int(url.split('_')[-1]) time.sleep(sleep_time) print('OK {}'.format(url))def main(urls):...

2019-07-11 21:46:49 221

原创二分类项目

解决思路整体上采用迁移学习来训练神经网络，使用InceptionV3结构，框架采用keras.具体思路：读取图片数据，保存成.npy格式，方便后续加载标签采用one-hot形式，由于标签隐藏在文件夹命名中，所以需要自行添加标签，并保存到.npy文件中，方便后续加载将数据分为训练集、验证集、测试集使用keras建立InceptionV3基本模型，不包括顶层，使用预训练权重，在...

2019-07-04 11:19:30 374

原创 RGB通道转为灰度图

import cv2import osimport numpy as npimg_dir ='' #文件路径img_names = sorted(os.listdir(img_dir))for i in range(len(img_names)): img = cv2.imread(img_dir +img_names[i],0) new_img = np.arra...

2019-07-03 15:02:15 299

原创深度文本匹配在智能客服中的应用

目录一. 深度文本匹配的简介1.文本匹配的价值2.深度文本匹配的优势3.深度文本匹配的发展路线二. 智能客服的简介1.智能客服的应用背景2.智能客服的核心模块 FAQ 库的构建语义召回相似度模型模型更新三. 深度文本匹配在智能客服中的应用1.为什么使用深度文本匹配2.怎么样使用深度文本匹配深度...

2019-07-02 23:32:12 1053 1

原创快速入门深度学习五步法

作为一个程序员，我们可以像学习编程一样学习深度学习模型开发。我们以 Keras 为例来说明。我们可以用 5 步 + 4 种基本元素 + 9 种基本层结构，这 5-4-9 模型来总结。5步法：1. 构造网络模型2. 编译模型3. 训练模型4. 评估模型5. 使用模型进行预测4种基本元素：1. 网络结构：由10种基本层结构和其他层结构组成2. ...

2019-07-02 23:14:23 1595 1

原创 task8 第九章聚类

1. 章节主要内容“聚类”（clustering）算法是“无监督学习”算法中研究最多、应用最广的算法，它试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”（cluster）不同的簇分布代表着聚类算法对这组数据集观测的不同角度，比如在不同属性上进行分类会导致聚类算法将西瓜划分为：“有籽瓜簇” “无籽瓜簇”，”浅色瓜簇” “深色瓜簇”，甚至“本地瓜簇” “外地瓜簇”等类...

2019-07-02 22:18:30 2129

原创 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 论文研读

主要结构仍是 Transformer Input: a. WordPiece embeddings b. learned positional embeddings, up to 512 tokens。 c. 增加了一个特殊的 token: [CLS], 用于分类任务。这个token的deep feature用于分类任务。 d. Sentence pairs, 两个句子合成一句，并用一个...

2019-07-02 20:48:06 141

转载智能问答

应用场景智能问答机器人火得不行，开始研究深度学习在NLP领域的应用已经有一段时间，最近在用深度学习模型直接进行QA系统的问答匹配。主流的还是CNN和LSTM，在网上没有找到特别合适的可用的代码，自己先写了一个CNN的（theano），效果还行，跟论文中的结论是吻合的。目前已经应用到了我们的产品上。原理参看《Applying Deep Learning To Answer Selecti...

2019-07-02 16:36:18 336

原创 elmo调试

模型代码主要包括以下几个部分:1.构建word embedding; 2.构建word_char embedding的准备; 3.语言模型介绍(双向lstm模型)。2.1 构建word embedding 注意：在ELMo语言模型中，无论是word embedding还是word_char embedding都是在模型中一起训练和更新的！只需要为词汇表中每一个词定义为相同维度的变量...

2019-06-25 21:11:20 660

原创 16 | 值传递，引用传递or其他，Python里参数是如何传递的？

1. 什么是值传递和引用传递值传递，通常就是拷贝参数的值，然后传递给函数里的新变量，这样，原变量和新变量之间互相独立，互不影响。#include <iostream>using namespace std; // 交换 2 个变量的值void swap(int x, int y) {int temp;temp = x; // 交换 x 和 y 的值 x = y;...

2019-06-23 21:51:08 260

原创 Task7 第八章集成学习

目录1.学习器的概念2.Boosting（AdaBoost算法）3.学习器的组合策略（averaging、voting、Stacking）4.如何度量学习器之间的“多样性”5. 基础知识1.学习器的概念集成学习就是说将多个 “单个学习器（Individual Learner）”用某种策略来结合起来，组成一个“学习委员会（committee）”，使得整体的泛化性能得到大大...

2019-06-23 16:21:28 1097

原创任务1 -Deep contextualized word representations

论文链接https://arxiv.org/pdf/1802.05365.pdfELMO 是 Embeddings from Language Models 的缩写，即语言模型的词向量表示，也是利用了深度上下文单词表征，该模型的优点：（1）能够处理单词用法中的复杂特性（比如句法和语义）（2）这些用法在不同的语言上下文中如何变化（比如为词的多义性建模）。1、论文动机？2、 ...

2019-06-20 09:22:32 175

原创 Keras中predict()方法和predict_classes()方法的区别

1 predict()方法当使用predict()方法进行预测时，返回值是数值，表示样本属于每一个类别的概率，我们可以使用numpy.argmax()方法找到样本以最大概率所属的类别作为样本的预测标签。2 predict_classes()方法当使用predict_classes()方法进行预测时，返回的是类别的索引，即该样本所属的类别标签。以卷积神经网络...

2019-06-20 09:21:55 2992 2

原创 visualization

1.导包2.加载模型3.读预测出来的结果列表与数组4.循环遍历1024*1024图片的切不小图5.得出混淆矩阵。

2019-06-19 09:41:27 332

原创 test.py

1.导包2.加载模型3.读数据，遍历所有文件夹中的图片，resize为64*64

2019-06-19 09:38:51 360

原创 test

1.导包2.读取数据表3.判断预测标签与真实数据标签是否相同，若相同清晰+1，否则模糊+14.得出混淆矩阵。

2019-06-19 09:06:33 102

原创 Xception网络

1.导包2.读数据3.数据划分(训练集、测试集)4.模型加载

2019-06-19 08:41:54 268

原创 15 | Python对象的比较、拷贝

目录1.回顾2.深拷贝3.总结4.思考1.回顾在前面的课中，已经学许多python对象比较和复制的例子if a == b: ...这里的l2就是l1拷贝得到的。l1 = [1, 2, 3]l2 = list(l1)l2是l1的浅拷贝(shallow copy)还是深拷贝(deep copy)呢？a == b是比较两个对象的值相等，...

2019-06-18 22:44:48 599

原创 14 | 答疑（一）：列表和元组的内部实现是怎样的？

目录1.列表和元组的内部实现2.为什么在旧哈希表中，元素会越来越稀疏。3.有关异常的困扰4.关于多态和全局变量的修改1.列表和元组的内部实现答：它和list相似，本质也是一个array,但是空间大小固定，不同于一般array,python的tuple做了许多优化，来提高在程序中的效率。如，当tuple的大小不超过20时，python就会把它缓存在内部的一个fre...

2019-06-18 22:04:59 331

空空如也

空空如也