自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

算法人生

ml/dl/qt相关内容

  • 博客(89)
  • 收藏
  • 关注

原创 nuitka编译python使用总结

nuitka编译python

2023-03-16 14:10:49 314

原创 pybind11使用总结(依赖python3.7版本)

c++主进程动态加载so库,so库中加载py函数,py同时可调用so中函数

2022-11-17 11:19:05 1294

原创 gitlab搭建问题

gitlab搭建问题

2022-11-05 10:32:31 291

原创 conda环境使用

conda环境使用

2022-10-30 22:32:55 277

原创 C++提高编程

C++提高编程本阶段主要针对C++泛型编程和STL技术做详细讲解,探讨C++更深层的使用1 模板1.1 模板的概念模板就是建立通用的模具,大大提高复用性例如生活中的模板模板的特点:模板不可以直接使用,它只是一个框架模板的通用并不是万能的1.2 函数模板C++另一种编程思想称为 泛型编程 ,主要利用的技术就是模板C++提供两种模板机制:函数模板和类模板1.2.1 函数模板语法函数模板作用:建立一个通用函数,其函数返回值类型和形参类型可以不具体制定,用一个虚拟的类

2022-05-15 16:30:37 213

原创 C++核心编程

C++核心编程本阶段主要针对C++面向对象编程技术做详细讲解,探讨C++中的核心和精髓。1 内存分区模型C++程序在执行时,将内存大方向划分为4个区域代码区:存放函数体的二进制代码,由操作系统进行管理的全局区:存放全局变量和静态变量以及常量栈区:由编译器自动分配释放, 存放函数的参数值,局部变量等堆区:由程序员分配和释放,若程序员不释放,程序结束时由操作系统回收内存四区意义:不同区域存放的数据,赋予不同的生命周期, 给我们更大的灵活编程1.1 程序运行前​ 在程序编译后,生成了ex

2022-05-15 16:14:08 129

原创 C++基础入门

C++基础入门1 C++初识1.1 第一个C++程序编写一个C++程序总共分为4个步骤创建项目创建文件编写代码运行程序1.1.1 创建项目​ Visual Studio是我们用来编写C++程序的主要工具,我们先将它打开1.1.2 创建文件右键源文件,选择添加->新建项给C++文件起个名称,然后点击添加即可。1.1.3 编写代码#include<iostream>using namespace std;int main() { cout <&

2022-05-15 16:05:54 206

原创 Python面试总结

主要是自己面试前抱下佛脚用

2022-02-23 10:10:40 1122

原创 Celery学习总结

一 概念1.1、celery是什么:Celery 简介 - Celery 中文手册Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。一个简单的解释:1.2Celery的架构Celery包含如下组件:1. Celery Beat:任务调度器,Beat进程会读取配置文件的内容,周期性地将配置中到期需要执行的任务发送给任务队列。2. Celery Worker:执行任务的消费者,通常会在多台服务器运行多个消费者.

2022-02-21 16:39:42 423 1

原创 c++安装mongo依赖

1、cmake 安装apt install cmake2、mongo-c-drive安装 #下载1.71.1版本的压缩包wget https://github.com/mongodb/mongo-c-driver/releases/download/1.17.1/mongo-c-driver-1.17.1.tar.gz#解压压缩包tar zxvf mongo-c-driver-1.17.1.tar.gz#进入目录cd mongo-c-driver-1.17.1mkdir cmake-.

2021-12-15 17:02:33 1598

原创 配置Tensorflow不打印log

使用一下命令:export TF_CPP_MIN_LOG_LEVEL=2

2021-12-15 16:59:05 2341

原创 github加速

在git处增加以下处理即可:**github.com.cnpmjs.org**

2021-12-15 16:56:54 128

原创 安装bcolz遇到报错解决

Q: error: command 'gcc' failed with exit status 1 ---------------------------------------- ERROR: Failed building wheel for bcolzA: export DISABLE_BCOLZ_AVX2=true

2021-12-15 16:55:25 1152 4

原创 linux挂载分区

linux挂载分区解决方法

2021-12-15 16:50:52 1331

原创 jupyter远程访问服务器docker环境

具体步骤如下:0、docker环境安装不赘述,注意要配置端口:docker container run -it -d -v 宿主机目录:容器目录-p 0.0.0.0:6661:6661 --network=bridge --shm-size 4G --name=容器名 镜像id /bin/bash1.先进入python环境,安装:pip install jupyter-lab2.在服务器那边要先安装jupyter,参考https://blog.csdn.net/zz22306..

2021-09-18 11:23:59 480

转载 Python_任意文件中获取项目的绝对路径

1、要知道项目根目录是什么:project_name = "InterfaceTest_project"curPath = os.path.abspath(os.path.dirname(__file__))rootPath = curPath[:curPath.find(project_name+"/")+len(project_name+"/")]2、拼接根目录和文件目录:firedir='{}reports/mypies'.format(rootPath) #文件目录搞定!.

2021-09-16 10:29:46 288

原创 scrapy爬虫入门,问题总结(持续更新)

只是为了记录自己使用中遇到的一些问题,方便查找。1.创建项目: scrapy startproject ****(项目名)2.创建爬虫: scrapy genspider 爬虫名 网站域名 注意: 1、爬虫名不要与项目名重合 2、域名要准确,是允许爬的域3.分析网站: 提取数据: 1、正则表达式 2、xpath 3、css4.运行爬虫: scrapy crawl 爬虫名 .

2021-01-31 17:00:05 115

原创 利用正则表达式快速给字典加引号,变为json格式,超简单~

1、如下图有类似的拷贝文件:Sec-Fetch-Site: same-siteUser-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 11_1_0) AppleWebKit/***(KHTML, like Gecko) Chrome/***如果想转变为json格式,即需要在key和value上都加入双引号:’Sec-Fetch-Site‘: ’same-site‘,’User-Agent‘: ’Mozilla/5.0 (Macintosh;

2021-01-25 23:58:57 787

原创 .ipynb文件转换为.py文件

方法一:如下截图:在编辑的窗口下,选择[File]-->[Download as]-->[Python(.py)]就可以啦,是不是很简单呢?也可以看到,可以保存为其他格式,便于各种阅读的需要哦~方法二:除了上述的操作,还可以用命令形式: 在写好的.ipynb文件的最后新建一个cell,代码如下,执行后,在当前目录下会生成一个同名的.py文件,这个module可以在其他.ipynb中被import。这样可能产生一个小小的问题就是:转化出的.py文件中会保留这段代码...

2021-01-06 21:42:30 1681

原创 Linux shell脚本命令汇总(不断更新)

Shell 是什么?Shell 指一种应用程序,它提供了一个界面 用户通过这个界面访问操作系统内核的服务 Shell 脚本(shell script) 用shell 编写的脚本程序。 shell 通常都是指 shell 脚本 Linux的精髓:将多个程序(命令)组装成大型程序, 而Shell 就是最好粘合剂 Shell的优点 简单、高效、易维护、随写随用 Shell 开发流程:需求分析...

2020-04-19 11:48:01 1509

原创 Mongodb安装及使用命令

mac上用brew安装:brew install mongodb 如果你现在就启动mongo你并不会成功,如下:Failed to connect to 127.0.0.1:27017, reason: errno:61 Connection refusedError: couldn't connect to server 127.0.0.1:27017 (127.0.0.1), conne...

2020-04-12 15:09:45 829

转载 Git常用命令(转)

Git常用命令及方法大全下面是我整理的常用 Git 命令清单。几个专用名词的译名如下。Workspace:工作区 Index / Stage:暂存区 Repository:仓库区(或本地仓库) Remote:远程仓库本地分支关联远程:git branch --set-upstream-to=origin/beta beta一、新建代码库...

2020-04-12 11:14:05 131

原创 Linux常用命令汇总(不断更新)

总结一些自己常用的linux命令,以防忘记找着省点时间;PATH环境变量以及常⽤快捷键echo $PATH查看当前环境变量 export PATH=$PATH:/home/ubuntu/ 临时设置环境变量,当前会话有效 ~/.bashrc⽂件最末添加命令设置环境变量,然后重启shell,或者source ~/.bashrc,永久有效 tab可以补全命令 whereis 查找命令所在...

2020-04-09 07:48:18 241

原创 nlp paper:【第4篇】基于神经网络的机器翻译(NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE)

1. 简述你理解的机器翻译?机器翻译又称为自动翻译,就是利用计算机将一种自然语言转换为另一种自然语言的过程。机器翻译经历了基于规则的翻译-基于统计的翻译-基于神经网络的翻译。2. 简述你学习到的神经机器翻译过程?基于神经网络的机器翻译:是通过学习大量成对的语料让神经网络自己学习语言的特征,找到输入和输出之间的关系。核心思想:端到端(end-to-end or seque...

2020-02-12 10:46:21 1088

原创 cv paper:【第2篇】AlexNet

1、试着说明一下Top-5 top-1 的区别early-stop点?这里top-5和top-1指的是分类是否准确的一个阈值,比如大分类可以为车,而车则可以有自行车,轿车,公交车等等。top-5的阈值相对更大,因此错误率也更低。top-5错误率是指测试图像的正确标签不在模型认为的五个最可能的便签之中。2、概括一下如何找到深度模型训练过程中的early-stop点神经网络处理图像分类?...

2019-12-01 21:33:29 192

原创 nlp paper:【第3篇】句和文档的分布式表示学习(Distributed Representations of Sentences and Documents)

一、传统的几种句向量学习方法的缺点?传统句向量表示主要有bag-of-words和bag-of-ngram-words,缺点主要是无法学习语义信息和顺序信息。二、总结词向量的概念以及其学习到语义和语法特征的含义?词向量就是用向量表示词的信息,传统的one-hot、n-gram只有词的统计信息,而通过语言模型学习到的词向量则是通过上下文来表示对应词向量,就能学习到语义和语法特征。三、...

2019-10-14 08:20:10 179

原创 nlp paper:【第2篇】基于神经网络的词向量(Efficient Estimation of Word Representations in Vector Space)

1. 简述几种你了解的词向量?①离散表示主要有:one-hot、Bag of Words、TF-IDF②分布式表示有:基于矩阵的分布表示(主要有Glove模型、共现矩阵、SVD分解等等)和基于神经网络的分布表示(主要有word2vec、NNLM、RNNLM、elmo、bert等等)2. 简述分布式词向量的优点?优点:1⃣️利用上下文信息进行词的表示可以计算语义相似性、2⃣...

2019-10-08 07:58:59 327

原创 pytorch入门(二)词向量简介及负例采样实现代码

以下是我的学习笔记,以及总结,如有错误之处请不吝赐教。离散表示:one-hot表示、bag of words(TF-IDF)、N-gram;问题:无法衡量词向量之间的关系、词表维度随着语料库增长膨胀、数据稀疏问题、各种度量(距离、或与非)都不适合。分布式表示(用一个词附近的其他词来表示该词):word2vec、word-embedding。skip-gram:模型特性:无隐...

2019-09-01 10:22:47 2496 1

原创 pytorch入门(一)深度学习入门及pytorch相关demo

以下是我的学习笔记,以及总结,如有错误之处请不吝赐教。什么是深度学习?深度学习是机器学习的一个分支领域:它是从数据中学习表示的一种新方法,强调从连续的层(layer)中进行学习,这些层对应于越来越有意义的表示。深度学习中的深度指的并不是利用这种方法所获取的更深层次的理解。什么是神经网络?人工神经网络(artificial neural network,缩写ANN),简称神经网络...

2019-08-29 16:50:51 735

原创 算法刷题(7)

题目一:假定你使用SVM学习数据X,数据X里面有些点存在错误。现在如果你使用一个二次核函数,多项式阶数为2,使用惩罚因子C作为超参之一。 当你使用较大的C(C趋于无穷),则:A仍然能正确分类数据B不能正确分类C不确定D以上均不正确解析:正确答案是:A,采用更大的C,误分类点的惩罚就更大,因此决策边界将尽可能完美地分类数据。参考 题目二:假设你训练...

2019-02-19 11:38:24 674

原创 算法刷题(6)

题目一:如果将数据中除圈起来的三个点以外的其他数据全部移除,那么决策边界是否会改变? A会B不会解析:正确答案是: B,决策边界只会被支持向量影响,跟其他点无关。 题目二:关于SVM泛化误差描述正确的是A超平面与支持向量之间距离BSVM对未知数据的预测能力CSVM的误差阈值解析:正确答案是: B,统计学中的泛化误差是指对模型对未知数...

2019-02-17 21:50:11 785

原创 算法刷题(5)

题目一:关于 ARMA 、 AR 、 MA 模型的功率谱,下列说法正确的是( )AMA模型是同一个全通滤波器产生的BMA模型在极点接近单位圆时,MA谱是一个深谷CAR模型在零点接近单位圆时,AR谱是一个尖峰DRMA谱既有尖峰又有深谷解析:正确答案是:D,具体参考https://blog.csdn.net/d07qs2kxkh0kksxex/article...

2019-02-16 11:16:12 960

原创 数据结构课程:图论

图基础:定义:描述事物之间的关系。 包括:节点集V={V1,V2......,Vn},边集合E={e1,e2,......,em},其中ei=(vi,vi‘) G=&lt;V,E&gt; 包括有向图和无向图 空间复杂度一般为:O(n+m)或O(n2) 主要应用包括:邻接矩阵,邻接表 图的存储结构:  1、邻接矩阵表示法:  如果 第 1个点和第 3个点 相连则 matrix...

2019-02-12 17:27:52 475

原创 算法刷题(4)

题目一:基于统计的分词方法为()A正向最大匹配法B逆向最大匹配法C最少切分D条件随机场解析:答案(D)分词主要分为三类:第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来进行词性标注,以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂,基于语法和规则的分词法所能达到的精确度远远还不能...

2019-02-11 08:55:10 421

原创 算法刷题(3)

问题一:对于线性回归,我们应该有以下哪些假设?1. 找到离群点很重要, 因为线性回归对离群点很敏感2. 线性回归要求所有变量必须符合正态分布3. 线性回归假设数据没有多重线性相关性A1 和 2B2 和 3C1,2 和 3D以上都不是解析:答案: D第1个假设, 离群点要着重考虑, 第一点是对的第2个假设, 正态分布不是必须的. 当然...

2019-02-10 00:06:35 1589

原创 数据结构课程:算法初步

算法主要学习的问题:穷举:求N个数的全排列、八皇后问题 分而治之:二分查找、归并排序 贪心:最小生成树Prim,Kruskal 动态规划:背包、士兵路径复杂度是算法的核心问题,主要分为时间和空间,使用大O记号(忽略系数)。时间:指占用内存字节数 空间:指空间可以在利用 时空可以互换,通过Hush表主要有以下几个常见取值:O(1):基本运算,加减乘除,取模,寻址 O(lo...

2019-02-08 16:24:49 202

原创 算法刷题(2)

题目一:对应GradientBoosting tree算法, 以下说法正确的是:1. 当增加最小样本分裂个数,我们可以抵制过拟合2. 当增加最小样本分裂个数,会导致过拟合3. 当我们减少训练单个学习器的样本个数,我们可以降低variance4. 当我们减少训练单个学习器的样本个数,我们可以降低biasA2 和 4B2 和 3C1 和 3D1 和 4解析:答案: C...

2019-02-07 23:39:43 749

原创 算法刷题(1)

问题一:当在文本数据中创建一个机器学习模型时,你创建了一个输入数据为 100K 的文献检索词矩阵(document-term matrix)。下列哪些纠正方法可以用来减少数据的维度——1. 隐狄利克雷分布(Latent Dirichlet Allocation)2. 潜在语义索引(Latent Semantic Indexing)3. 关键词归一化(Keyword Normalizat...

2019-02-06 21:39:30 1759

原创 NLP课程:Encoder-Decoder框架、Attention、Transformer、ELMO、GPT、Bert学习总结

Encoder-Decoder框架:可以把它看作适合处理由一个句子(或篇章)生成另外一个句子(或篇章)的通用处理模型。对于句子对&lt;Source,Target&gt;,我们的目标是给定输入句子Source,期待通过Encoder-Decoder框架来生成目标句子Target。Encoder顾名思义就是对输入句子Source进行编码,将输入句子通过非线性变换转化为中间语义表示C:...

2019-01-31 11:52:48 9378

原创 算法刷题:股神

题目:有股神吗?有,小赛就是!经过严密的计算,小赛买了一支股票,他知道从他买股票的那天开始,股票会有以下变化:第一天不变,以后涨一天,跌一天,涨两天,跌一天,涨三天,跌一天...依此类推。为方便计算,假设每次涨和跌皆为1,股票初始单价也为1,请计算买股票的第n天每股股票值多少钱?解法:解此题目的关键在于找出天数n和当天的每股股票的价值money的关系,通过如下表罗列对比我们...

2019-01-04 00:07:07 645

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除