5 herosunly

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 1w+

大咖论赛——阿里云天池TOP选手不得不说的那些事儿

  我是安全恶意程序检测的冠军,我和几个大佬一起分享了一些入门比赛和提高比赛成绩的方法, 可点击回放链接学习 ,或者复制https://live.csdn.net/room/broadview2006/tkVYVbSb到浏览器中学习。

2020-09-25 10:09:01

达观杯文本智能信息抽取挑战赛 四到十名队伍分享

文章目录1. 第四名 whoaido(徐恒)1.1 团队简介1.2 算法思路1.2.1 BiLSTM+CRF1.2.2 BERT1.2.3 预训练对比1.3 总结1. 第四名 whoaido(徐恒)1.1 团队简介团队名称:whaido团队成员:卢凌云就职公司:太平洋保险集团最终成绩:三等奖  团队主要成员目前就职于太平洋保险集团,主要从事NLP相关技术的研究及创新项目的孵化,致力于将人工智能技术服务于保险行业。团队研究及应用主要涉及意图识别、文本分类、文本相似度、命名实体识别及知识图谱等

2020-09-23 17:42:37

达观杯文本智能信息抽取挑战赛 前三名队伍分享

文章目录1. 第一名 tonyxu(徐恒)1.1 最终提交方案概览1.2 整体框架与预处理1.3 单模型实现细节1.3.1 FastText+Glove模型1.3.2 Glove+BigramGlove1.3.3 FlairEmbedding&Elmo1.3.4 Bert Base & Bert Large1.3.5 XLnet Base & XLnet Large1.3.6 融合权重选择1.4 总结1.5 自然语言处理类比赛方法总结1. 第一名 tonyxu(徐恒)1.1 最终

2020-09-23 16:46:15

matplotlib使用汇总

  画图之前首先要设置画布(figure)对象,使得后面的图形输出在这块规定了大小的画布上,其中参数figsize设置画布大小。# 得到画布对象plt.figure(figsize=(width, height)) # unit is inch(英寸)# 绘制子图,其中index是从1开始计算plt.subplot(nrows, ncols, index, **kwargs) # 将画布分为nrows*ncols个子区域, index表示第N个子区域设置坐标轴的起始和终止值plt.xlim

2020-07-21 15:47:50

Tensorflow简要介绍

TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性

2020-07-17 16:40:33

贪心算法和动态规划的区别与联系

1. 联系都是一种推导算法都是分解成子问题来求解,都需要具有最优子结构2. 区别贪心:每一步的最优解一定包含上一步的最优解,上一步之前的最优解则不作保留。动态规划:全局最优解中一定包含某个局部最优解,但不一定包含前一个局部最优解,因此需要记录之前的所有的局部最优解贪心:如果把所有的子问题看成一棵树的话,贪心从根出发,每次向下遍历最优子树即可(通常这个“最优”都是基于当前情况下显而易见的“最优”);这样的话,就不需要知道一个节点的所有子树情况,于是构不成一棵完整的树。动态规划:动

2020-07-08 11:38:13

使用区间来简化代码思考

  Leetcode中移动零(https://leetcode-cn.com/problems/move-zeroes/)和快速排序的最初版本,本质上都可以使用区间来简化代码。  首先以移动零为例,假设两个循环变量分别为jjj和iii(假设j<=ij<=ij<=i),则[0,...,j][0,...,j][0,...,j]中均为非零元素(区间1),而[j+1,...,i−1][j+1,...,i-1][j+1,...,i−1]均为零(区间2)。其中i是从最开始滑到最后一个元素的。  

2020-07-06 16:40:34

Leetcode最大和最小子序和

class Solution: def maxSubArray(self, nums: List[int]) -> int: if len(nums) == 0: return 0 global_max = nums[0] step_max = nums[0] if len(nums) == 1: return global_max for i in range

2020-06-09 14:53:37

代码思路标准流程

  首先引入几个基本概念。fff代表指定的函数。每一步(step)和每一轮(round)。假设为二重循环,则外层循环一次代表走一轮,而内层循环一次代表走一步。如果是一重循环,则循环一次代表走一步。  以冒泡排序为例,假设冒泡排序为函数fff,则表达式即为f(x1,x2,…,xn)f(x_1,x_2,\dots,x_n)f(x1​,x2​,…,xn​)。为了更好的理解复杂的情况,我们先理解最简单的情形:假设只包括单个元素时:f(x1)=x1f(x_1)=x_1f(x1​)=x1​假设元素个数为2个时:

2020-06-09 10:17:12

Leetcode学习

1. 刷题方法  自顶向下 VS 自底向上。两种方法各有优劣。那怎么才能达到最好的学习效果呢?  入门时使用自底向上的学习方法,以玩游戏为例,了解了基本的游戏规则,然后就先玩起来,在玩的过程中逐渐熟悉。但这样的玩法,必然会在一定阶段遇到瓶颈,问题的本质在哪里,那如何解决呢?  深入时再对对应的章节采用自顶向下的学习方法。比如通过阅读算法的参考书籍,如图解算法、算法(第4版)。1.1 第一遍(第一次梳理思路,可依赖)  自己独立思考,理解题意,明确边界条件。基础薄弱(刷题少于100道)的同学,思考时

2020-06-01 16:47:09

Dism++: 好用的Windows 系统优化工具

  下载地址为https://download.csdn.net/download/herosunly/12411581。1. 垃圾回收一下子清理了10G的C盘空间,真的是好用!

2020-05-12 13:05:45

gensim使用汇总

1. unable to import ‘smart_open.gcs’, disabling that modulepip install smart_open==1.10.0

2020-05-08 10:35:48

免费好用的流程图软件yed

  最好用的就是一键自动排版,真的是赞,后续再补充具体内容。链接为:https://www.yworks.com/products/yed

2020-04-28 10:47:35

pandas使用汇总

1. 取label和API序列  如何取出该数据集中每个file_id对应的label的api_sequence,其中每个fild_id包括多个api:df = pd.read_csv('data.csv')  由于label后续要进行fancy indexing操作,所以我们要把label转换成np.array,而API序列后续会经过特征提取,所以表示成list of list即可。...

2020-04-26 17:12:26

Python易错点总结

Python没有代码块作用域。

2020-04-26 13:52:33

scikit-learn使用汇总

1. 分类器1.1. 逻辑回归  Logistic regression在sklearn中有不同的实现方式,即solver{‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’, ‘saga’}, default=’lbfgs’,其中当solver为‘sag’或者‘liblinear’时,需要指定随机种子(The seed of the pseudo random ...

2020-04-26 10:34:32

word2vec资源整理和思考

综合:https://www.cnblogs.com/fengyubo/p/10387311.html博客:http://jalammar.github.io/illustrated-word2vec/代码:https://towardsdatascience.com/an-implementation-guide-to-word2vec-using-numpy-and-google-shee...

2020-04-25 17:09:35

A Neural Probabilistic Language Model阅读笔记

123

2020-04-22 17:09:59

CountVectorizer参数学习

指定vocabulary,此时tokenizer/token_pattern/stop_words/max_df等都无效,即和分词有关的参数都无效。可以看到最终生成的词典只有我们参数中指定的a/他/喜欢  为什么会这样呢?我们去研究一下源代码(sklearn/feature_extraction/text.py):  其中CountVectorizer中的fit_transform的源...

2020-04-20 15:28:36

常用Linux命令安装

1. locate

2020-04-15 15:02:29

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 分享王者
    分享王者
    成功上传51个资源即可获取