自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(104)
  • 资源 (1)
  • 收藏
  • 关注

原创 transformer的自注意力模型如何实现自注意力

所有参考来自以上的文章,简单来说,要实现自注意力,就得去完成 自己点乘自己的操作,然后得到的结果就能够通过调整矩阵参数完成训练了。简单来说,构造了三个矩阵 ,这三个矩阵就是为了完成自己点乘自己的操作。

2024-03-20 14:23:03 138

原创 python 异步编程

函数时,协程会暂时挂起,事件循环可以继续处理其他协程,同时等待指定的睡眠时间过去后,再恢复执行该协程。是 Python 标准库中的函数,用于在同步代码中暂停执行一段时间。在这段时间内,事件循环仍然可以处理其他协程或任务。函数时,当前线程会被阻塞,无法执行其他任务,直到指定的睡眠时间过去。是在异步代码中使用的函数,用于在协程中暂停执行一段时间。只是暂停当前协程的执行,并允许事件循环去处理其他协程。是在不同上下文中使用的两个不同的睡眠函数。关键字来暂停协程的执行,其中。在异步代码中,可以使用。

2024-03-14 10:47:52 360

原创 关于利用talib.macd函数计算macd指标与同花顺不一致的问题

当我们利用talib计算macd指标时,发现talib计算出的macd指标与同花顺等行情软件计算的指标不一致,原因在于计算macd指标时,需要初始化第一天的ema12、ema26、diff、dea。而当我们用talib.MACD计算macd指标时,使用的历史行情一般是某段行情,并不是从开盘开始计算,eam12=eam26初始化为我们取的第一天的行情,diff和dea初始化为0。那么diff是 价格变化的一次导数,(需要除以价格),那么与dea是更加慢的线。那么macd就是类似导数了。

2023-11-18 17:33:28 630

原创 windows 如何安装cuda pytorch gpu

第一步看看看看自己的显卡编号,看看自己的geforce有没有被识别比如说nvidia-smiSun Apr 9 18:34:56 2023+-----------------------------------------------------------------------------+| NVIDIA-SMI 517.13 Driver Version: 517.13 CUDA Version: 11.7 ||----------------

2023-04-09 18:58:49 354

原创 pytorch 的GPU性能优化

最近在训练一个图片分类器,GPU使用率一直没到100% ,甚至只是一些波峰尖刺。后来排查了一些问题。这种情况 大概率就是 CPU的数据在往GPU搬运的时候出现了瓶颈,优化方法1 预取数据 多线程2 大规模映射顺序读3 把数据搬运到ssd最后用了3解决问题,当你的盘太慢的时候,最好的方法就是换到ssd上...

2021-12-21 11:57:03 333

原创 道道杂思1

今天换了工位,好消息是我终于有了自己的柜子,但在这之前必须请师傅这个柜子的锁撬开。我还是很期待这已经尘封多年的柜子里会有什么宝贝,因为据上一个坐在这的同事说,从他开始坐在这个位置起,这个柜子就锁上了,这个柜子尘封了至少5年的时光。柜子里面有什么呢?几本笔记本,其中一本记了几页工作的计划,还有一些公司当年的内刊。我草草翻了一下他的笔记,发现这个人做的事情也许跟我现在并无不同。再翻了一下内刊,里面当然就是当年的一些明星产品,和领导们是怎么努力奋斗去完成这些产品的。我突然意识到,假如我不能积累一些

2021-09-13 20:14:44 114

原创 并发数据库读写问题

最近出了一个bug。我的十几台服务器,会同一时间起一个调度,这个调度会在同一时间访问数据库,造成高并发。解决方法就是:在这个启动脚本前加一个随机时间的sleep 。这样就能避免同一时间的读的问题各位觉得呢 有什么好的建议可以提供给我num=`expr $RANDOM % 100`echo $numsleep $num...

2021-09-01 13:30:20 222

原创 关于互信息与规则系统

构建规则系统的时候,有时候面临要精简规则的需求 比如说10万条正则中,就必须精简。这时候可以用系统中规则间的互信息去计算 规则相关性。假如想用严苛的手段,那就是条件概率。 p(A|B)=p(A,B)/p(B)=1 时 ,表明B包含A 则,去掉A的规则即可互信息参看别的博文...

2021-08-26 11:41:12 50

原创 删除掉github 提交记录

不小心把密码提交到github怎么办?1.切换到新的分支 git checkout --orphan latest_branch缓存所有文件(除了.gitignore中声名排除的) git add -A提交跟踪过的文件(Commit the changes) git commit -am "commit message"删除master分支(Delete the branch) git branch -D master5.重命名当前分支为mast

2021-03-31 19:37:19 100

原创 2021-02-03 如何在git中加ssh key

git clonePermission denied (publickey).fatal: Could not read from remote repository.Please make sure you have the correct access rightsand the repository exists.处理这个错误如何生成ssh keycd ~/.sshssh-keygen -t rsaYour identification has been sav...

2021-02-03 10:38:37 99

原创 mysqld got signal 11 调试

Version:'5.6.31'socket:'/data/mysql_data/mysql.sock'port:3306MySQLCommunityServer(GPL)07:27:57UTC-mysqldgotsignal11;Thiscouldbebecauseyouhitabug.Itisalsopossiblethatthisbinaryoroneofthelibrariesitwaslinkedagains...

2020-07-02 19:55:32 625

转载 python 动态爬虫使用

原文链接 :https://www.cnblogs.com/sky-x2017/p/selenium1.htmlhttps://www.cnblogs.com/sky-x2017/p/selenium1.htmlfrom pyvirtualdisplay import Displayfrom selenium import webdriverdisplay = Display(visible=0, size=(800, 600))display.start()driver =..

2020-06-28 09:58:01 284

原创 pandas 使用学习

#读文件data = pd.read_csv('data.csv')df = pd.read_csv(filename,encoding='utf-8')#写文件df2.to_csv("shundeformat.csv",index=False,columns=['idcard_hash','imei_hash','phone_hash','qq_hash','detail_hash...

2020-02-13 17:14:56 84

转载 Linux Shell多进程并发以及并发数控制

1. 基础知识准备1.1. linux后台进程Unix是一个多任务系统,允许多用户同时运行多个程序。shell的元字符&提供了在后台运行不需要键盘输入的程序的方法。输入命令后,其后紧跟&字符,该命令就会被送往到linux后台执行,而终端又可以继续输入下一个命令了。比如:sh a.sh &sh b.sh &sh c.sh &这三个命令就会...

2020-02-10 17:21:30 227

转载 Word2vec 学习

https://blog.csdn.net/mr_tyting/article/details/80091842这个是非常经典的word2vect 的论文翻译另外一个作者的 写的非常详细https://www.jianshu.com/p/a1163174ebafhttps://www.jianshu.com/p/ed15e2adbfad这个是重要的举措ne...

2020-02-02 00:47:07 155

转载 tensorflow 学习(一)

准备转载 几篇文章 原文链接:https://www.cnblogs.com/wanyu416/p/8954098.html一、Tensorflow基本概念  1、使用图(graphs)来表示计算任务,用于搭建神经网络的计算过程,但其只搭建网络,不计算  2、在被称之为会话(Session)的上下文(context)中执行图  3、使用张量(tensor)表示数据,用“阶...

2020-01-30 22:29:01 110

转载 RSA加密、解密、签名、验签的原理及方法

https://www.cnblogs.com/pcheng/p/9629621.html一、RSA加密简介  RSA加密是一种非对称加密。可以在不直接传递密钥的情况下,完成解密。这能够确保信息的安全性,避免了直接传递密钥所造成的被破解的风险。是由一对密钥来进行加解密的过程,分别称为公钥和私钥。两者之间有数学相关,该加密算法的原理就是对一极大整数做因数分解的困难性来保证安全性。通常个人保存...

2020-01-07 10:58:32 146

原创 如何离线搜索安装包

http://vault.centos.org/6.5/updates/x86_64/Packages/这个网站。。解决你一些问题http://vault.centos.org/6.7/os/x86_64/Packages/你也可以在这里找到一些内容 希望能帮助到你...

2019-10-08 16:40:09 115

原创 特征使用

一些特征选择的技巧https://www.jianshu.com/p/8edf4d159d4cxgb不适合高维特征的特点https://www.zhihu.com/question/267934807为什么实际的数据处理中使用 树的集成学习模型(更符合实际数据情况)https://blog.csdn.net/leadai/article/details/78579708...

2019-08-19 00:55:50 238

转载 Meta Path 定义

原文地址:https://blog.csdn.net/hy_jz/article/details/78862226Meta Path 是2011年 Yizhou Sun etc. 提出的 http://www.morganclaypool.com/doi/abs/10.2200/S00433ED1V01Y201207DMK005, 针对异质网络中的相似性搜索。Meta Path 是一条...

2018-10-24 11:13:12 9783

转载 openmp for调度

原文地址 :https://www.cnblogs.com/xudong-bupt/p/3622101.htmlOpenMP中任务调度主要针对并行的for循环,当循环中每次迭代的计算量不相等时,如果简单地给各个线程分配相同次数的迭代,则可能会造成各个线程计算负载的不平衡,影响程序的整体性能。如下面的代码中,如果每个线程执行的任务数量平均分配,有的线程会结束早,有的线程结束晚: 1...

2018-10-23 11:47:03 535

原创 word2vec 初尝试

先贴结果:与竞争相似的词市场竞争 0.906346678734日趋激烈 0.874940693378激烈 0.850416898727争夺 0.807645440102十分激烈 0.80338871479价格战 0.788535356522白热化 0.782474756241同质化 0.769148826599价格竞争 0.750348031521日益加剧 0.74926...

2018-08-05 20:36:31 159

原创 kmeans初试

kmeans 初步使用,识别一个安全的项目中许多账号中的恶意账号。特征是账号的一些行为,使用时长、浏览次数、在线时长等等。在一个非常小的数据集上做,结果是非常不理想,原意是想让它把浏览过某个网页的账号筛选出来,结果就是没有成功地聚类了。也很简单,因为kmeans的距离计算把每个向量的贡献都看成一样,使用欧式距离作为分类标准,那么对于归纳后的向量和一些初始化向量并不适用了。1.关于分...

2018-08-02 13:22:47 221

转载 循环神经网络你需要知道的几个基本概念

原地址 https://www.imooc.com/article/23821 1.1 为什么有了全连接神经网络和CNN还需要RNN?我们通过前两篇博文知道了全连接神经网络和卷积神经网络的基本工作原理,这两种网络结构的层与层之间是全连接或部分连接的,但在每层之间的节点是无连接的,这样的网络结构并不能很好的处理序列数据。当我们要建立一个模型来预测句子的下一个单词是什么时,结合n-gram...

2018-07-29 17:02:07 4467

原创 tensorflow 学习中的函数

第一部分来自官方minist数据集的例子 简单的函数操作能抽象化我们的代码和思维 一 tf.nn.softmax_cross_entropy_with_logits的用法在计算loss的时候,最常见的一句话就是tf.nn.softmax_cross_entropy_with_logits,那么它到底是怎么做的呢?首先明确一点,loss是代价值,也就是我们要最小化的值 tf....

2018-07-29 16:01:03 212 1

原创 tf conv2d 函数 和CNN实现

tf.nn.conv2d函数 ,在tf技术解释与实践中解释的很清楚。尤其是参数。现在还是来总结一下。tf.nn.conv2d是TensorFlow里面实现卷积的函数,参考文档对它的介绍并不是很详细,实际上这是搭建卷积神经网络比较核心的一个方法,非常重要tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, n...

2018-07-22 23:52:03 6687

原创 第一个梯度下降算法 am

import numpy as npX = 2*np.random.random((6,3))-1print XW0 = np.array([[12],[2],[4]])print W0Y=np.dot(X,W0)w = 2*np.random.random((3,1))-1print wfor  j in xrange(1,6000):    l= np.dot(X,w)  ...

2018-07-11 23:57:19 248

原创 再学机器学习gridsearch网格搜索

GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算法:拿当前对模型影响最大的参数调优,直到最优化;再拿下一个影响最大的参数调优,如此下去,直到所有的参数调整完毕。这个方法的缺点就是可能会...

2018-05-01 22:47:00 1413

原创 kaggle titianic 全纪录

准备入门机器学习了 先从kaggle的 titianic 算法开始做起https://blog.csdn.net/qifuchenluo/article/details/67655388https://blog.csdn.net/qifuchenluo/article/details/67655388https://blog.csdn.net/liufang0001/article/details...

2018-04-01 01:02:59 383

原创 python numpy sum 操作

原文地址https://blog.csdn.net/rifengxxc/article/details/75008427keepdims主要用于保持矩阵的二维特性import numpy as npa = np.array([[1,2],[3,4]])# 按行相加,并且保持其二维特性print(np.sum(a, axis=1, keepdims=True))# ...

2018-02-25 00:03:25 705 2

转载 逻辑回归梯度下降法详解

原文地址 http://blog.csdn.net/lookqlp/article/details/51161640引言逻辑回归常用于预测疾病发生的概率,例如因变量是是否恶性肿瘤,自变量是肿瘤的大小、位置、硬度、患者性别、年龄、职业等等(很多文章里举了这个例子,但现代医学发达,可以通过病理检查,即获取标本放到显微镜下观察是否恶变来判断);广告界中也常用于预测点击率或者转化率(cvr/ctr),例如...

2018-02-22 23:38:39 775

原创 mysql too many open files 错误解决

项目中有一个拷贝大量表格的需求。其中有一个错误:Out of resources when opening file 'p_82.MYD' (Errcode: 24 - Too many open files)打开文件太多了????然后看了一下show global status like 'open_%';+--------------------------+-----

2018-02-06 13:04:16 2426

转载 关于Qlearning

先转载一篇吧,这篇倒是简明扼要的说出了增强学习的基本概念和几个最重要的公式我们来看一下 1 增强学习是什么那就是要能获取尽可能多的reward。没有目标,控制也就无从谈起,因此,获取reward就是一个量化的标准,reward越多,就表示执行得越好。每个时间片,Agent都是根据当前的观察来确定下一步的动作。每次的观察就作为Agent的所处的状态state,因此

2018-01-02 23:55:11 1755

转载 手动计算Q-Learning的一个实例

http://blog.csdn.net/suozqwp/article/details/44175555http://blog.csdn.net/suozqwp/article/details/44175283

2017-11-23 00:13:58 835

原创 安装 python3.5

用安装包下载安装然后出错了x80070005 结果需要删除杀毒软件

2017-07-01 12:24:06 606

原创 正则式总结

选择用圆括号将所有选择项括起来,相邻的选择项之间用|分隔。但用圆括号会有一个副作用,是相关的匹配会被缓存,此时可用?:放在第一个选项前来消除这种副作用。其中 ?: 是非捕获元之一,还有两个非捕获元是 ?= 和 ?!,这两个还有更多的含义,前者为正向预查,在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串,后者为负向预查,在任何开始不匹配该正则表达式模式的位置来匹配搜索字符

2017-06-15 16:20:52 208

转载 怎么给linux加环境变量

脑中必不可少的就是操作系统。而Linux的发展非常迅速,有赶超微软的趋势。这里介绍Linux的知识,让你学好应用Linux系统。比如要把/etc/apache/bin目录添加到PATH中,方法有三: 1.#PATH=$PATH:/etc/apache/bin 使用这种方法,只对当前会话有效,也就是说每当登出或注销系统以后,PATH 设置就会失效 2.#vi /etc/pro

2017-06-15 16:13:47 332

原创 布隆过滤器

布隆过滤器 的一个好处就是可以一个bit表示一个数据,下面有一个python的开源库https://axiak.github.io/pybloomfiltermmap/ref.html 构造函数:class pybloomfilter.BloomFilter(capacity : int, error_rate : float, filename : string)这个fi

2017-02-05 18:50:14 343

原创 mysql 菜鸟优化

应用场景一:有一张很大的数据表,表的数据条数以亿计,每条数据有一个id进行标示,我们想要提取出一批指定id的数据(以百万计),怎么进行加速呢。1.首先先将指定id的数据放入数据库中,”load data local infile filename into tabletablename”其中数据放在/tmp的文件夹下,将数据表建为内存表,“create table tablename ()engi...

2017-02-05 17:36:10 250

原创 linux 操作

ls -s dir1 dir2绝对路径 dir1 为原始目录 ,dir2为想要创建的目录 ,事先不需要创建假如删除了dir2 对 dir1没有任何影响rm -rf dir2但是删除 dir2里面的内容,则会影响dir1rm -rf dir2/ 危险的操作

2016-12-08 17:11:39 277

opengles 简单示例

非常实用的opengles示例 简单易于修改 由C语言编写,原来是在windows下的,但是经过修改之后也很容易在别的平台运行

2015-12-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除