自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 问答 (1)
  • 收藏
  • 关注

原创 BERT词向量的特性

BERT 词向量的特性

2023-01-19 15:38:38 216

原创 chrome插件 自动点击页面元素 自动填入内容

chrome 插件实现自动点击、自动填写内容。

2022-12-28 16:47:45 4841

原创 Excel 表格删除重复数据

Excel 表格删除重复数据

2022-11-11 15:57:25 657

原创 Selenium ActionChains 循环使用失效,dict fromkeys初始化等小提示

易错点

2022-05-07 14:08:21 1344

原创 QtWebEngine automation 自动化操作

早期版本的 QtWebkit github 上有 Cisco 的 automation 开源项目。Qt 后来采用的 QtWebEngine 我搜了很多英文网页也没有成熟框架。只有通过其他方法曲线解决了。1、记住鼠标点位(电脑屏幕取点工具),用 pyautogui 去点击。2、分析网络协议。使用工具 ecapture ,只能在 linux 下运行。3、在加载的页面里,打开调试窗口,输入JavaScript 代码。4、图像识别,paddleOCR 识别文字效果很好,再结合 opencv 检测文.

2022-04-24 11:03:27 5313

原创 如何理解注意机制中经常提到的键、查询和值 ?

本文探讨了transformer中的注意力机制的直觉。

2022-01-12 20:28:07 3619

原创 百度智能云NLP的使用及文本相似度

百度智能云API 接口的使用应该说是很方便的。但是网上代码资源不多,还有运行不了的代码,误导了我很久。在此发文一篇,分享2021年12月30日可运行代码,并实现了对比两段事件描述相似度的功能。import json,requests,os,refrom openpyxl import load_workbookfrom time import sleepimport numpy as npAPIKey='*****'SecretKey='*****'#创建请求urldef get_A

2021-12-30 18:09:28 1269

原创 Faster-RCNN 入门(也包含 Fast RCNN 的技术)

本文集合了 Faster-RCNN 的关键技术,了解 CNN 以后就可以看本文。SelectiveSearch目标检测物体的候选框是如何产生的?  如今深度学习火热的今天,RCNN/SPP-Net/Fast-RCNN等文章都会谈及bounding boxes(候选边界框)的生成与筛选策略。那么候选框是如何产生,又是如何进行筛选的呢?其实物体候选框获取当前主要使用图像分割与区域生长技术。区域生长(合并)主要由于检测图像中存在的物体具有局部区域相似性(颜色、纹理等)。目标识别与图像分割技术的发展进一

2020-07-11 10:42:00 938

原创 chrome 插件--B站自动发弹幕

chrome 插件实现自动点击、自动填入内容。

2020-07-11 09:48:20 3691 3

原创 微信小程序加载动画

补充一下这篇文章 里的第二个例子的代码。wxml 文件:<view class="tui-loading-row"> <view class="tui-loading-cell"> <!--第一个动画,省略,见原文章--> </view> <view class="tui-loading-cell"> <view class="circle-line-spin" > <tex...

2020-06-10 20:10:04 1977

原创 Ubuntu 安装 Android Studio 全过程记录(2020年1月)

不同时期,不同版本安装方法也不同。这是我在2020年1月的安装过程。版本 lubuntu 18 + jdk8_202 + Android Studio 3.5.31.安装jdk先下载 jdk8 地址:下载 jdk下载完以后运行安装:sudo update-alternatives --install "/usr/bin/java" "java" "/jdk/jdk...

2020-02-22 20:31:06 3362

原创 wxPython Grid 表格控件的使用

因工作原因使用了一下 wxPython。总的来说不推荐。我的观点是干什么事情,要用那个领域最成熟的库,比如桌面软件,用 C#、Qt。不流行的的 wx 有 bug,参考文档少。下面贴出我的代码。这个代码展示了 Grid 的使用,可以“增删改”,按列排序,隐藏某一列的显示(就像在 Excel 里为了看东西方便)。界面设计可以先用 wxFormBuilder 设计好,把代码 copy 过来。有些问题不好...

2020-01-12 16:05:29 8101

原创 对 Capsule Network 的理解

先推荐一篇对胶囊网络讲解很详细的 文章。Capsule Network 很重要的是解决了如果一张图片中,鼻子眼睛的位置是错的,如何识别出它不是一张脸的问题。那么我们来思考一下它为什么有这个能力?在最后一层的 10*16 矩阵中,假设 16 个数代表鼻子或者眼睛中的一个东西,那么两个数对调,模型结果会变化吗?不会。因为后边接的是全连接网络,和普通的 CNN 没什么区别,你把这 16 个数全打...

2019-12-21 11:08:43 505

原创 SQL语句创建视图为什么不能用order by

很多地方都没解释清楚这个问题,有代表性的就是这个博客。论坛上有人解释了,但是年代久远,我这里把它捞出来。答主是这位。内容如下:创建排序视图的企图本身就是错误的,因为视图表示一个表,而表是不会对行排序的。众所周知,在SQLServer2000中追求排序视图的开发人员会利用貌似系统漏洞的一个技巧。利用这个漏洞可以创建一个非常可笑的视图,在该视图中,指定TOP100PERC...

2019-10-30 10:52:14 5887

原创 内存分页管理FIFO中的belady现象

看了很多讲belady现象的文章,包括英文网页,都用的是下面一个例子:第一行是页面访问顺序,接下来几行是内存中的页面,第二行是最先进入内存的,空白就是运行初期还没有页面进入。但是仔细看就发现,多的那一次其实就是加载的时候多的,因为4页的要加载4页,当然多一次中断。后边正常运行,显然是4页的有优势。我不明白就这么点微弱的劣势为何会专门命名,好像很重要一样。当然这个微弱劣势可以被放...

2019-10-11 19:28:14 1575 2

原创 文法和语言的形式描述 词法分析 - 编译原理

先解释几个单词便于记忆。在 G(V_N, V_T, P, S) 中非终结符 nonterminal symbol终结符 terminal symbol产生式 production接下来我以正则表达式为实例来解释编译原理的一些东西,因为编译原理太过抽象,初学者没有实例可以类比,难于理解。我只解释难理解的一部分,还需要对照书本来看。非终结符是可推导的:比如正则表达式中 *,+ 这些,可以代...

2019-10-10 21:06:31 1679

翻译 超宽深度网络和神经正切核 Ultra-Wide Deep Nets and Neural Tangent Kernel (NTK)

(也发布在at CMU ML.)作者:Wei Hu and Simon Du机器学习的传统观点认为,在训练误差和泛化差距之间要进行谨慎的权衡。模型的复杂性存在一个“最佳点”,因此模型(i)足够大,可以实现合理良好的训练误差,而模型(ii)足够小,可以泛化差距-测试误差和训练误差之间的差-可以控制。较小的模型会产生较大的训练误差,而使模型变大则会导致较大的泛化差距,两者都会导致较大的测试误...

2019-10-05 19:27:37 4348

原创 自动操作软件 获取软件按钮内容 UIAutomation 软件自动化测试(我的一点补充)

近期玩了下 UIAutomation。C# 中有 UI Automation 库,C++可以看msdn的Accessibility。这两个东西网上能找到的东西太少了,只能自己看微软的官方文档。我把我的一些代码段贴到下面,希望能帮助需要的人。Python有个库 UIAutomation,就是封装微软提供的 UIAutomation,网上有一些资料。但是这个库的作者说没有准备文档,所以需要的人自己...

2019-09-22 13:30:13 6113

翻译 如何用Python编写拼写校正器(拼写检查器)

2007年的一个星期,两位朋友(迪恩和比尔)独立告诉我,他们对谷歌的拼写纠正感到惊讶。输入类似[speling]的搜索,Google会立即显示结果: spelling。我认为Dean和Bill是高度成熟的工程师和数学家,他们对这个过程的运作方式有很好的直觉。但他们没有,并且想到它,为什么他们应该知道迄今为止他们的专长?我认为他们和其他人可以从解释中受益。工业强度的纠正器的全部细节非常复杂(你可...

2019-09-15 08:15:05 1105 2

原创 python文件路径有空格和tkinter canvas加载图片的处理

汇总一下今天解决这个问题的一些方法:import subprocesssubprocess.call(['C:\\Temp\\a b c\\Notepad.exe', 'C:\\test.txt'])这是可以带参数的一种。subprocess.run(['C:\Program Files\Common Files\microsoft shared\ink\TabTip.exe'],s...

2019-09-12 20:31:24 629

翻译 发现贝叶斯的乐高积木

原文:https://towardsdatascience.com/https-medium-com-hankroark-finding-bayesian-legos-part1-b8aeb886afba照片来源:FrédériqueVoisin-Demery / Flickr(CC BY 2.0)我有一个很好的朋友Joe,本周路过他家时我顺便造访了他家。像平常一样,我们聊了天气...

2019-05-20 17:01:23 326

翻译 GAN与自动编码器:深度生成模型的比较

原文:https://towardsdatascience.com/gans-vs-autoencoders-comparison-of-deep-generative-models-985cf15936ea想把马变成斑马吗?制作DIY动漫人物或名人?生成对抗网络(GAN)是您最好的新朋友。“Generative Adversarial Networks是过去10年机器学习中最有趣的想法。...

2019-05-20 17:01:05 5568

原创 python3装饰符@学习及实现函数输入参数的类型检查

在网上看了几篇文章,要么解释不清,要么代码运行不了。综合几篇文章,排完代码的坑,分享一下。不带参数的单一使用先声明这段代码我没运行,因为比较简单,看看就行了。def spamrun(fn): def sayspam(*args): print("spam,spam,spam") fn(*args) return sayspam@spa...

2018-12-03 10:26:58 655

原创 vim如何将另一个文件的特定行粘贴到本文件

我不喜欢用vi开多个文件,因为那会挤压我的屏幕空间。我一般在多终端中运行多个vi。这样为了跨终端粘贴,只能依靠终端的命令。      vi可以将linux命令执行结果粘贴到特定位置:一、将命令结果插入文件:     运行 :r!command , command命令的结果插入光标下一行            :nr! command,  command命令的结果插入n行后。二、...

2018-11-30 09:19:00 3214

原创 对cifar10.py中两个地方的理解

import tensorflow as tfw = tf.constant(1.0)b = tf.constant(4.0)def myGraph(w,b): tf.add_to_collection("loss",w) tf.add_to_collection("loss",b) w=tf.add(w,1.0) b=tf.add(b,1.0) ...

2018-11-29 19:42:42 125

原创 对于ResNet残差网络的理解和思考

增加网络层数却导致更大的误差, 如下图。 这种deep plain net收敛率十分低下。原因:观察这张图可以看出,训练过程中两者的下降模式是差不多的,只不过56-layer的图像更“高”。也就是起点不好:初始化的时候,他需要生成56层随机数,结果能好吗?之所以这样能解决退化问题,我认为是,跨层连接降低了被跨层的重要性。深度可以提高准确率,却降低了泛化能力。使用更多的卷积核,降低深度,泛化会更好?...

2018-06-28 19:46:21 2135

原创 tensorflow手册cifar10.py(alexnet,卷积神经网络)的一些理解

以下只写一些我花了点时间才理解的东西:       1、卷积tf.nn.conv2d()函数的理解:它其中有第二个参数是[filter_height, filter_width, in_channels, out_channels]。代码中第二次卷积,输入是64,输出也是64。他的意思是本层的每个卷积核都要对之前生成的64个图同时进行卷积。之前生成的64个特征图已经对一些简单特征进行了提取,这时再...

2018-06-26 19:29:27 492

原创 python list.append()的机制

l=[]s="525234543254"l.append(s)s="11952"l.append(s)#------------------------d={}d["000"]="111"l.append(d)d["000"]="222"l.append(d)这段程序的运行结果表明,append()的是内存地址,而不是说元素再复制一份....

2018-05-05 10:10:16 3044

原创 python+selenium分析javascript生成的网页

这两天时间都花在了爬取一个视频站点上。那个视频站点是后台生成的object对象,发送给前端,让前端用flash播放器播放。我要把他的内容偷到我的网页上来。开始想分析视频地址,可是它的地址是转码过的,而且还是javascript生成的,太费劲。后来一想,直接把他的&lt;object&gt;对象的代码贴过来不就可以了。接下来就要解析那些网页。我的服务器上装的还是win server 2003.昨天找...

2018-05-04 21:40:46 561

原创 在网页中显示PDF文档

网上的代码总有很多用不了的。我就贴上我试过可以用的。win7 64bit+chrome1.jquery.media.js&lt;script type="text/javascript" src="/thinkphp/public/js/jquery-1.8.3.min.js"&gt;&lt;/script&gt; &lt;script type="text/javascript" src=...

2018-04-05 19:08:14 4968

原创 python 3 urllib.request.urlopen()源码分析

最近爬取一个网页,这个网页的html文件获取很快,但是附带的javascript、css、图片等获取非常慢,有些甚至无法获取。最终会抛出超时或者无法获取的异常。我被迫看了一下urlopen()的源码,试图将程序在获取网页的过程中,在抛出异常之前,缓存在内存里的内容找出来。我现在没有源码,大概凭记忆写一下源码的流程。创建request类,里边有url、协议等一些信息。创建OpenerDirector...

2018-04-04 17:24:10 990

原创 tensorflow入门过程中遇到的坑(mnist数据集)

最近学习tensorflow,使用mnist数据集。数据的导入我都是自己写的代码,结果遇到一些问题,花了大半天才解决。1.最开始我用python自带的struct类,按unsigned int读取数据,在训练过程中,权重W很容易就变成了一堆NaN。后来才发现,输入的数据必须归一化。因为我们在随机生成W的时候,给他设置的变化范围本身就不大。如果输入数据都是[0,255],很容易越界。关于数据归一化,...

2018-04-02 10:54:38 2948

原创 关于卷积神经网络该如何理解的一些思考

最近思考了一下关于“卷积神经网络”该如何去理解的问题。很多文章说,越到后边的卷积层,就会有组合多个特征的能力。但是我们每个卷积层不是有很多卷积核吗,每个卷积核不是滤波器吗,前几层把特征都滤掉了。怎么得到的如下所示的图?后来我想到可以这样理解:假设一个卷积核可以过滤出横线,而且过滤效果非常好,那么图像经过它之后应该就变成一堆长短不一的横线。假设一个卷积核可以过滤出竖线,而且过滤效果非常好,那么图像经...

2018-03-28 19:19:15 496 1

原创 javascript图片轮播代码的一点解析

今天使用了这个网页的代码。把这些代码直接贴在一个空记事本里是可以的,但在转移到自己的网页中出了点问题,用一下午的时间解决,积累了些经验。原网页代码如下: JS幻灯代码 window.onload = function () { flag = 0; obj1 = document.getElementById("slider"); obj2 =

2018-02-05 20:13:44 3357

原创 关于thinkphp文件上传问题

最近用thinkphp做网站,发现关于thinkphp相关“坑”的网络资源太少了。我来做点贡献。  这几天做的一个页面,前端大概长这样。遇到了上传文件一旦大于10m,就上传失败。修改了php.ini和apache的配置,问题依旧。后来发现以下代码中   $request = Request::instance();   $request->param(true);

2018-02-02 16:43:44 393

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除