自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (8)
  • 收藏
  • 关注

原创 使用transformers库中的convert_pytorch_checkpoint_to_tf,转换pytorch的bert模型成TF格式

可以使用convert_pytorch_checkpoint_to_tf.py将pytorch版本的 bert模型转换为TF版本的bert模型,不过需要注意的是需要将程序进行一定的修改:原始代码: model = BertModel.from_pretrained( pretrained_model_name_or_path=args.model_name, state_dict=torch.load(args.pytorch_model_path),

2021-12-28 10:34:34 1550

原创 python多个列表对应项相加并且除以同一个数——Numpy的使用

import numpy as npa = [1,2,3]b = [2,3,4]c = [3,4,5]l1 = np.sum([a,b,c], axis = 0)print(l1)l1 = l1 / 200.0print(l1)l1 = list(l1)print(l1)结果为:[ 6 9 12][0.03 0.045 0.06 ][0.03, 0.045, 0.06]

2020-10-27 15:16:36 2068

原创 pycharm调试报错,this application failed to start because。。。。。

在当前环境中安装pyQt5这个包,解决了问题pip install pyQt5-ihttp://pypi.douban.com/simple--trusted-hostpypi.douban.com

2020-07-29 15:31:42 2562 4

原创 DataFrame的ix方法

关于Pandas——loc、iloc、ix 函数区别和用法,可见博客:https://blog.csdn.net/u012736685/article/details/86610946这里只是码一下, ix方法是包含首尾的,示例如下:print(data_set1[['Value']].ix[0:3, :])其输出为: Value0 2.8140251 2.7829552 2.7259733 2.794768共四行...

2020-05-20 10:14:47 6419

转载 micro和macro F1 score 的区别——转自网络

上述回答来源于网址——http://sofasofa.io/forum_main_post.php?postid=1001112讲解的很详细,码一下

2019-06-17 16:44:41 1090

原创 解决Win10系统电脑使用耳机听歌、看视频、看网页只有伴奏背景音没有人声的方法

突然就遇到了这个问题,查了好久好多办法都试了终于让我找到一个可行的方法,Mark一下——http://www.ilovext.com/jc/win10/117.html亲测有效

2019-05-27 13:39:50 9984 2

转载 keras-contrib包安装以及kerasBi_LSTM

keras-contrib 安装:(pip install git+https://www.github.com/farizrahman4u/keras-contrib.git)码一下,学习学习  原文见:https://blog.csdn.net/qq_16912257/article/details/78969966

2018-12-10 19:57:24 2612 3

原创 Python数据挖掘学习——鸢尾花分类、OneR算法

《Python数据挖掘入门与实践》第一章内容,实现一个简单的分类处理,实现OneR算法。OneR算法的思路很简单,它根据已有的数据中,具有相同特征值的个体最可能属于哪个类别进行分类。OneR也就是One Rule的缩写,即“一条规则”,表示我们只选取特征中分类效果最好的一个作为分类的依据。虽然这个算法十分的简单,但是在很多真实数据集上却有着不凡的表现。算法首先遍历每个特征的每个取值,对于每个特...

2018-12-10 14:50:07 1761

原创 Python数据挖掘学习——亲和性分析

最近了解了一些Python数据挖掘方面的内容,主要学习了《Python数据挖掘入门与实践》这本书的内容,在这里对书中的内容以及我遇到的一些问题进行整理。数据挖掘旨在让计算机根据已有的数据作出决策。数据挖掘的第一步一般是创建数据集,数据集主要包括:(1)样本:表示真实世界中的物体(2)特征:描述数据集中样本学习的第一步接触的就是亲和性分析,亲和性分析是通过样本个体之间的相似度确定...

2018-12-10 13:39:00 787

原创 NetworkX(1)——可视化测试篇

这一系列博客是用来总结使用NetworkX包来进行网络图可视化的学习过程,首先第一篇是使用NetworkX来生成随机网络结构的可视化展示,属于基本操作。示例学习于余本国老师的书。代码如下:import matplotlib.pyplot as pltimport networkx as nxG = nx.random_geometric_graph(200,0.125)pos = ...

2018-11-26 14:29:34 2294

原创 matplotlib可视化初体验

这篇博客主要是总结一下最近进行的matplotlib可视化实验,内容主要来自于官方文档的实例。(1)首先最简单的——圆形散点图:import matplotlib.pyplot as pltimport numpy as np#绘制一个圆形散点图t = np.arange(1, 10, 0.05)x = np.sin(t)y = np.cos(t)#定义一个图像窗口plt....

2018-11-26 10:53:35 463

原创 国际旅行人数预测——使用LSTM

时间序列问题增加了输入变量之间的序列依赖性,这样大大提升了模型的复杂程度。LSTM是循环神经网络的一种,可以成功地训练架构非常复杂的深度学习模型,用于处理时间序列问题。LSTM对输入数据的尺度十分敏感,特别是使用sigmoid(这是默认的)或者tanh作为激活函数的时候。下面代码中使用Scikit-Learn中的MinMaxScaler预处理类对数据集进行归一化处理,将数据缩放到0——1。...

2018-11-09 15:47:33 3364 4

原创 国际旅行人数预测——使用多层感知器

这个例子是使用多层感知器来处理时间序列问题,例子来源于魏贞原老师的书。数据集使用的是国际旅行旅客人数数据集(international-airline-passengers)数据集下载:国际旅行旅客人数数据集(international-airline-passengers)利用matplotlib,我们先看一下实际数据的变化趋势。之后构建一个仅有一个隐藏层的多层感知器模型,并...

2018-11-05 15:44:28 1882 1

原创 训练过程中使用学习率衰减

随机梯度下降算法的性能与学习率有着直接的关系,这是因为学习率决定了参数移动到最优值时的速度。如果学习率过大很可能会越过最优值,如果学习率过小,优化的效率可能过低,收敛时间极长。那么一个很好的解决方案就是学习率衰减——即学习率随着训练的进行逐渐衰减。在训练过程开始时,使用较大的学习率,这样就能快速收敛;随着训练过程的进行,逐渐降低学习率,这样有助于找到最优解。目前两种较为流行的学习率衰减方法...

2018-11-05 15:14:14 9558 2

原创 在训练过程中加入Dropout

Dropout是在训练过程中,随机地忽略部分神经元——也就是说,在正向传播的过程中,这些被忽略的神经元对下游神经元的贡献效果暂时消失,在反向传播中,这些神经元也不会有任何权值的更新。Dropout的思想的出现,主要是为了解决过拟合的问题。虽然说采用组合方法,也就是训练多个模型,能够在一定程度上解决过拟合的问题,但是会带来非常大的时间开销,而Dropout可以很好的解决这个问题。在Keras...

2018-11-05 14:52:13 13909

原创 模型训练过程初步可视化

在训练深度学习模型时,Keras提供了对训练历史的默认回调方法——History回调。它记录了每个epoch的训练指标,包括有损失、准确度(分类问题),以及评估数据集的损失和准确度(这需要设置)。训练过程中的信息可以从训练模型的fit()函数的返回值获取。度量标准存储在返回对象的历史成员的字典中。"""将模型训练过程可视化"""from keras.models import Sequen...

2018-11-03 16:23:59 3371

原创 Keras保存与加载模型(JSON+HDF5)

在Keras中,有时候需要对模型进行序列化与反序列化。进行模型序列化时,会将模型结果与模型权重保存在不同的文件中,模型权重通常保存在HDF5文件中,模型的结构可以保存在JSON或者YAML文件中。后二者方法大同小异,这里以JSON为例说明一下Keras模型的保存与加载。from sklearn import datasetsimport numpy as npfrom keras.mod...

2018-10-31 17:08:37 11201

原创 利用Scikit-Learn为模型自动调参

通过Keras的包装类,借助Scikit-Learn的网格搜索算法评估神经网络模型的不同配置,并找到最佳评估性能的参数组合。在Scikit-Learn中的GridSearchCV需要一个字典类型的字段作为需要调参的参数,默认采用3折交叉验证的方法来评估算法。这里有四个参数需要调参,因此会产生4*3个模型。代码如下:"""通过Scikit-learn中的GridSearchCV进...

2018-10-31 16:37:30 1487

原创 K-Fold

这里码一下如何使用K折交叉验证来评估模型。KerasClassifier和KerasRegressor类使用参数build_fn,指定用来创建模型的函数的名称。因此这里必须定义一个函数,并通过函数来定义深度学习模型,编译并返回它。这里便是定义了create_model()函数。from keras.models import Sequentialfrom keras.layers im...

2018-10-31 15:29:37 575

原创 Keras多分类实例:鸢尾花

鸢尾花数据集具有4个数值型输入项目,并且数值具有相同的尺度,输出项目是鸢尾花的三个子类。这里使用的是Scikit-Learn中提供的数据集,省略了数据预处理的过程,如果在UCI上面下载的话要使用Pandas中的read_csv()函数导入数据,并使用Scikit-Learn的LabelEncoder将类别文本编辑成数值。这里的实例部分出自于魏贞原老师的书。from sklearn i...

2018-10-31 15:09:09 5418 3

原创 Keras多层感知器:印第安糖尿病人诊断

实例中使用的是Pima Indians Diabetes数据集,数据集有八项属性和对应输出:(1)怀孕次数(2)2小时口服葡萄糖耐量实验中血浆葡萄糖浓度(3)舒张压(4)三头肌皮褶皱厚度(5)2小时血清胰岛素(6)身体质量指数(7)糖尿病谱系功能(8)年龄(9)是否是糖尿病第九项是我们的输出层。数据集下载:数据集下载地址下面代码:from ke...

2018-10-29 18:42:54 1219 1

原创 Python 关于整除以及负数取余遇到的问题

  最近在编码的过程中,在整除以及取余的时候遇到了一些比较迷的问题,这里码一下这些问题,以备日后查看。在Python3中,除法有 “/” 以及 “//” 两种,这两个有着明显的区别,具体区别看代码:print(12//10)print(12/10)这两行代码的输出如下:11.2这结果的差别显而易见。当被除数是负数的时候又是令一种情况:print(-12/1...

2018-10-18 10:49:33 15217 6

沈阳公交地铁数据.zip

沈阳公交地铁网络数据,多层网络,可用于社团发现链路预测等研究

2019-08-01

Youtube social network and ground-truth communities.zip

YouTube部分关注信息,属于社交网络,复杂网络数据集,带有groundtruth,可以进行复杂网络分析和研究的实验

2019-08-01

Brazil_airport_network.txt

巴西机场复杂网络数据集,可以用于复杂网络相关研究,社团发现、链路预测等等

2019-08-01

international-airline-passengers.zip

国际旅行旅客人数数据集——international-airline-passengers CSV格式的,数据中包含有文件尾信息,在导入数据时需要适当删除,可以进行机器学习的训练

2019-08-01

机器学习实战:基于Scikit-Learn和TensorFlow文档+数据+代码综合.zip

《机器学习实战:基于Scikit-Learn和TensorFlow》这本书的PDF和数据代码,学习机器学习以及tensorflow的入门书籍,必读!!压缩包没有密码。请放心下载学习,加油!

2019-07-10

《Python数据挖掘入门与实践》第一节商品购买数据集

《Python数据挖掘入门与实践》第一章亲和性分析例子中的商品购买数据集。 这个例子中采用商品购买的一个数据集,商品共有:面包,牛奶,奶酪,苹果,香蕉这几种。 这里每个特征都有且只可能有0或者1两个值——表示是否购买该商品,而非购买的数量。

2018-12-10

国际旅行旅客人数数据集(international-airline-passengers)

这是国际旅行旅客人数数据集——international-airline-passengers CSV格式的,数据中包含有文件尾信息,在导入数据时需要适当删除

2018-11-05

Pima Indians Diabetes数据集

印第安糖尿病人数据集,原始网站(UCI)上面的链接失效了。

2018-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除