自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

DanyHgc的博客

转载阿里推荐算法：BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transform

阿里推荐算法：BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer注意：1.bert用在推荐系统中，将用户的历史序列看做是词序列。2.测试时，将序列的最后一个item进行maskedAbstract：根据用户历史的行为信息，对用户动态的偏好衍变进行建模，是对推荐系统产生的巨大挑战。现有算法使用序列神经网络，只能从左向右，利用单向信息进行建模。尽管这些放大得到了很

2021-10-04 20:30:20 976

转载阿里手淘猜你喜欢Swing算法介绍

**.阿里手淘猜你喜欢Swing算法介绍**Swing算法原理比较简单，是阿里早期使用到的一种召回算法，在阿里多个业务被验证过非常有效的一种召回方式，它认为 user-item-user 的结构比 itemCF 的单边结构更稳定。Swing指的是秋千，例如用户 u uu 和用户 v vv ，都购买过同一件商品i ii，则三者之间会构成一个类似秋千的关系图。若用户 u 和用户 v 之间除了购买过 i 外，还购买过商品 j ，则认为两件商品是具有某种程度上的相似的。也就是说，商品与商品之间的相似关系

2021-08-22 11:18:33 1099

转载音频处理工具SOX详解

这里写自定义目录标题前言一、简介二、基本使用三、音频效果前言SoX（即 Sound eXchange）是一个跨平台（Windows，Linux，MacOS 等）的命令行实用程序，可以将各种格式的音频文件转换为需要的其他格式。SoX 还可以对输入的音频文件应用各种效果，也支持在大多数平台上播放和录制音频文件。一、简介SoX 可以读取和写入常见格式的音频文件，并在此过程中选择性的加入一些声音...

2019-06-19 18:01:13 5382 1

转载 java 获取指定时间点(定时)

使用Calendar.getInstance()不仅能获取当前的时间，还能指定需要获取的时间点，在项目应用中达到定时的作用，下面是常用的一些指定时间点使用：public class Test1 { public static void main(String[]args){ System.out.println("时间为：\n"+getDate1()+"\n"+getD...

2019-01-23 15:05:06 7220

原创如何理解DeepFool算法

首先：DeepFool是白盒攻击算法概述生成对抗样本的基本思路，大体可以分为白盒攻击和黑盒攻击，区别在于黑盒测试把模型当做黑盒，只能输入样本获得预测结果，白盒在黑盒的基础上还可以获取模型的参数、梯度等信息。本文将介绍白盒攻击中最有名的DeepFool算法。DeepFool基本原理我们做攻击，一个很好的问题就是，我们究竟对原始图像做了多大修改就可以欺骗AI模型呢？换个说法就是，如何尽量少的修...

2019-01-03 19:36:21 4216 1

转载怎么理解倒排索引

渣翻译的例子之一。英文原名Inverted index，大概因为 Invert 有颠倒的意思，就被翻译成了倒排。但是倒排这个名称很容易让人理解为从A-Z颠倒成Z-A。个人认为翻译成转置索引可能比较合适。一个未经处理的数据库中，一般是以文档ID作为索引，以文档内容作为记录。而Inverted index 指的是将单词或记录作为索引，将文档ID作为记录，这样便可以方便地通过单词或记录查找到其所在的文档...

2018-04-09 22:25:07 849

转载 comments of word2vec code

// Create binary Huffman tree using the word counts // Frequent words will have short unique binary codes void CreateBinaryTree() { // min1i is the first son, and min2i is the second son; poin...

2018-03-08 19:47:53 336

转载 Google News Personalization: Scalable Online Collaborative Filtering里 LSH详解

从文档相似度计算看LSH（Locality Sensitive Hashing） Minhash衡量两个用户之间的相似度可以用他们的交集来表示，也被称为Jaccard 相似度用户uj看过的新闻对于用户ui来说有s(ui,uj)的吸引力。在计算的时候，可以使用LSH来缩减数据规模，其中LSH的思想就是相近的数据在哈希过程中更有可能产生冲突，具体解释如下：我们来看一个寻找相似文档问题，给...

2018-03-08 17:25:28 749

转载 mac本 chrome jsonView插件安装实用教程

1、打开 https://github.com ；2、搜索 jsonView 链接：https://github.com/search?utf8=%E2%9C%93&q=jsonview；3、选择需要的插件（可以选gildas-lormeau/JSONView-for-Chrome）；4、点击【Download Zip】，插件下载完成，解压缩到相应目录（D:\Download\...

2018-02-11 14:00:50 7164 1

转载推荐算法有两种准确度评价指标：

1、预测准确度：比如MAE，RMSE2、分类准确度：分类准确度定义为推荐算法对一个产品用户是否喜欢判定正确的比例。因此 ,当用户只有二元选择时 ,用分类准确度进行评价较为合适。因此，想要用准确率和召回率评价推荐算法，必须将评分分为两部分，高于某个评分，表示喜欢，低于这个评分，表示不喜欢。准确率和召回率：准确率定义为系统的推荐列表中用户喜欢的产品和所有被推荐产品的比率:，准确...

2018-02-11 13:58:58 1969

转载推荐算法有两种准确度评价指标：

1、预测准确度：比如MAE，RMSE2、分类准确度：分类准确度定义为推荐算法对一个产品用户是否喜欢判定正确的比例。因此 ,当用户只有二元选择时 ,用分类准确度进行评价较为合适。因此，想要用准确率和召回率评价推荐算法，必须将评分分为两部分，高于某个评分，表示喜欢，低于这个评分，表示不喜欢。准确率和召回率：准确率定义为系统的推荐列表中用户喜欢的产品和所有被推荐产品的比率:，准确

2018-01-10 16:01:35 11538

原创 SQL left join on 和right join on 举例说明

A left join B 的连接的记录数与A表的记录数同A right join B 的连接的记录数与B表的记录数同 A left join B 等价B right join Atable A:Field_K, Field_A1 a3 b4 ctable B:Field_K, Field_B1 x2

2018-01-08 15:51:42 1598

转载 sql语句中left join、inner join中的on与where的区别

1 .WHERE子句中使用的连接语句，在数据库语言中，被称为隐性连接。INNER JOIN……ON子句产生的连接称为显性连接。（其他JOIN参数也是显性连接）WHERE 和INNER JOIN产生的连接关系，没有本质区别，结果也一样。但是！隐性连接随着数据库语言的规范和发展，已经逐渐被淘汰，比较新的数据库语言基本上已经抛弃了隐性连接，全部采用显性连接了。2 .无论怎么连接，都可以用join子句

2018-01-08 15:32:28 859

转载 mysql union和union all 的用法

UNION 操作符用于合并两个或多个 SELECT 语句的结果集。UNION 内部的 SELECT 语句必须拥有相同数量的列。列也必须拥有相似的数据类型。 union 是对数据进行并集操作，不包括重复行，同时进行默认排序用法:SELECT column_name(s) FROM table_name1UNIONSELECT column_name(s) FROM table_na

2018-01-08 11:57:22 500

转载举例讲解协同过滤中相似度的计算方式

协同过滤中相似度的计算很有技巧性，下面对比几种计算的方式。假设输入的Item-User矩阵为：设用户共有M个，Item共有N个，在本例子中，M=3,N=4M=3,N=4。矩阵中为空的元素代表对应的用户对Item没有行为，也可以认为该用户对该Item的评分为0.一、用二维数组依次计算这种方式的实现步骤如下：1、遍历User，依次取出U1,U2,U3U1,U2,U3。当取到U1

2018-01-05 10:42:05 6892

原创举例理解推荐算法GBDT

GBDT(Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regression Tree)，是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力（generalization)较强的算法。近些年更因为被用于搜索排序的机器学习模型而引起大家关注。举个年龄预测问题

2017-12-27 16:56:27 5157

原创电影推荐算法实例代码

```# -*- coding=utf-8 -*-import mathimport sysfrom texttable import Texttable## 使用 |A&B|/sqrt(|A || B |)计算余弦距离###def calcCosDistSpe(user1,user2): avg_x=0.0 avg_y=0.0 for key in u

2017-12-27 16:31:31 4661 7

转载协同过滤推荐算法实例代码

什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF)，首先想一个简单的问题，如果你现在想看个电影，但你不知道具体看哪部，你会怎么做？大部分的人会问问周围的朋友，看看最近有什么好看的电影推荐，而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。换句话说，就是借鉴和你相关人群的观点来进行推

2017-12-27 11:34:21 16269 5

原创什么是推荐算法和主要方法

在现今的推荐技术和算法中，最被大家广泛认可和采用的就是基于协同过滤的推荐方法。标题 ##1. 什么是推荐算法推荐算法最早在1992年就提出来了，但是火起来实际上是最近这些年的事情，因为互联网的爆发，有了更大的数据量可以供我们使用，推荐算法才有了很大的用武之地。最开始，所以我们在网上找资料，都是进yahoo，然后分门别类的点进去，找到你想要的东西，这是一个人工过程，到后来，我们用google，直接搜索

2017-12-27 11:16:15 5309

翻译全面理解ADMM算法

以下是长期研究ADMM（ Alternating Direction Method of Multipliers ）后对ADMM算法的一些总结，包括其他人观点：一、解决约束问题：ADMM( Alternating Direction Method of Multipliers) 算法是机器学习中比较广泛使用的约束问题最优化方法，它是ALM算法的一种延伸，只不过将无约束优化的部分用块坐标下降法（blo

2017-12-24 16:59:17 54284

翻译 Hadoop与Spark的区别

有以下四个不同：1. 解决问题的层面不一样Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储，意味着您不需要购买和维护昂贵的服务器硬件。同时，Hadoop还会索引和跟踪这些数据，让大数据处理和分析效率达到前所未有的高度。Spark

2017-12-22 17:22:43 639

翻译什么是CVR，CTR,CPC，CPA，ROI?

CVR (Click Value Rate): 转化率，衡量CPA广告效果的指标CTR (Click Through Rate): 点击率CPC (Cost Per Click): 按点击计费CPA (Cost Per Action): 按成果数计费CPM (Cost Per Mille): 按千次展现计费PV (Page View): 流量ADPV (Advertisement Page View

2017-12-18 11:27:12 17200

转载 CTR预估的几种方式

1.CTR预估CTR预估是计算广告中最核心的算法之一，那么CTR预估是指什么呢？简单来说，CTR预估是对每次广告的点击情况做出预测，预测用户是点击还是不点击。具体定义可以参考 CTR. CTR预估和很多因素相关，比如历史点击率、广告位置、时间、用户等。CTR预估模型就是综合考虑各种因素、特征，在大量历史数据上训练得到的模型。CTR预估的训练样本一般从历史log、离线特征库获得。样本标签相对容易，用户

2017-12-11 20:46:55 23921

转载 caffe卷积输入通道如何到输出通道详解

问题：10个卷积核，得到10个feature map，那么输入图像为RGB三个通道呢，输出就为 30个feature map 吗，答案肯定不是的，输出的个数依然是卷积核的个数。可以查看常用模型，比如lenet 手写体，Alex imagenet 模型，每一层输出feature map 个数就是该层卷积核的个数。1、一通道多个卷积核卷积过程2、多通道的多个卷积核下图展示了在四个通道上

2017-09-01 17:38:13 6151

转载 Alternating Direction Method of Multipliers -- ADMM 怎么理解

定义：Alternating Direction Method of Multipliers（ADMM）算法并不是一个很新的算法，他只是整合许多不少经典优化思路，然后结合现代统计学习所遇到的问题，提出了一个比较一般的比较好实施的分布式计算框架。在了解ADMM之前，需要了解它的前身，对偶上升法（Dual Ascent）和增强拉格朗日乘子法（Augmented Lagrangians and the M

2017-07-24 11:53:16 5936 2

转载 6. ZigZag Conversion leetcode

The string "PAYPALISHIRING" is written in a zigzag pattern on a given number of rows like this: (you may want to display this pattern in a fixed font for better legibility)P A H NA P L S I I GY

2017-07-23 12:16:49 273

转载 array vector 和string

string string s对象的定义和初始化以及读写 string s1; 默认构造函数，s1为空串 string s2(s1); 将s2初始化为s1的一个副本 string s3(“valuee”); 将s3初始化一个字符串面值副本 string s4(n,’c’); 将s4 初始化为字符’c’的n个副本 cin>>s5; 读取有效字符到遇到空格 getl

2017-07-23 12:06:12 321

原创 template模板使用规则 C++

定义：什么是类模板一类类一个类模板（也称为类属类或类生成类）允许用户为类定义一种模式，使得类中的某些数据成员、默写成员函数的参数、某些成员函数的返回值，能够取任意类型（包括系统预定义的和用户自定义的）。如果一个类中数据成员的数据类型不能确定，或者是某个成员函数的参数或返回值的类型不能确定，就必须将此类声明为模板，它的存在不是代表一个具体的、实际的类，而是代表着一类类。 A.首先要定

2017-07-21 17:02:01 595

转载 C++ inline内联函数使用规则

inline函数的作用定义：内联函数避免频繁调用函数对栈内存重复开辟所带来的消耗，但是不能包含复杂的结构控制语句例如while、switch，并且内联函数本身不能直接调用递归函数(自己内部还调用自己的函数)。在C++中，为了解决一些频繁调用的小涵数大量消耗栈空间或者是叫栈内存的问题，特别的引入了inline修饰符，表示为内联函数。　　可能说到这里，很多人还不明白什么是栈空间，其实栈空间就是指放

2017-07-21 16:52:50 788

转载如何理解等错误率(EER, Equal Error Rate)？

在语音vad和KWS任务中，经常用到EER，怎么正确理解EERFR定义：在一批本该全部正确(TRUE)的列表中出现几个没识别出正确的语音，这个就是错误拒识FR(False Rejection)，是Miss的；FA定义：在一批本该全部错误(Flase)的列表中出现了几个没识别出错误的语音，就是错误的语音被认为对了，FA(False Acceptance)，是Flase Alarm的。各自

2017-07-20 16:35:24 18770

转载卷积神经网络(CNN)学习笔记1：基础入门

卷积神经网络(CNN)学习笔记1：基础入门概述卷积神经网络(Convolutional Neural Network, CNN)是深度学习技术中极具代表的网络结构之一，在图像处理领域取得了很大的成功，在国际标准的ImageNet数据集上，许多成功的模型都是基于CNN的。CNN相较于传统的图像处理算法的优点之一在于，避免了对图像复杂的前期预处理过程（提取人工特征等），

2017-07-20 12:07:26 411

转载 C++中箭头-> 双冒号：：点号.操作符区别

C++ 箭头-> 双冒号:: 点号.操作符区别首先介绍一下C++中的结构。对于一个结构来说，struct MyStruct { int member_a; };如果有个变量MyStruct s，那么使用其中的成员元素时可以用s.member_a = 1;如果采用指针方法访问，比如MyStruct * ps，那么同样的访问

2017-07-19 12:05:13 935

翻译 kaldi的triphone训练详解

Triphone 以单音素模型为输入训练上下文相关的三音素模型 #triphonesteps/train_deltas.sh --boost-silence 1.25 --cmd "$train_cmd" 2000 10000 data/mfcc/train data/lang exp/mono_ali exp/tri1 || exit 1;train_deltas.sh中的相关配置如下：sta

2017-07-17 16:37:47 4344

转载 Kaldi 入门train_mono.sh详解

Kaldi 入门详解 train_mono.sh 是音素训练脚本，下面详细介绍各个功能：这部分是训练用参数，调用mono.sh时可以通过 –name value的方式改变这些参数.[code]nj=4 并行个数 cmd=run.pl 处理程序 scale_opts=”–transition-scale=1.0 –acoustic-scale=0.1 –self-loop-scale=0

2017-07-17 15:56:14 4823 1

转载 kaldi tutorial 中文翻译

kaldi教程 pdf.id transition-id ,tree ali对齐

2017-07-17 15:05:43 1184 1

转载 kaldi的语音识别数据timit例子详解

本文将以 kaldi 中 timit 的例程来看整个 run.sh 脚本的执行过程。数据准备请先进入 kaldi\egs\timit\s5\ 这个目录。运行环境由于 kaldi 可以在本地运行，也可以在 Oracle GridEngine 上运行，因此，请修改 cmd.sh。如果你是在本地运行，请输入export train_cmd="run.p

2017-07-17 11:50:47 9846 1

转载神经网络激活函数sigmoid relu tanh 为什么sigmoid 容易梯度消失

什么是激活函数为什么要用都有什么sigmoid ，ReLU， softmax 的比较如何选择1. 什么是激活函数如下图，在神经元中，输入的 inputs 通过加权，求和后，还被作用了一个函数，这个函数就是激活函数 Activation Function。2. 为什么要用如果不用激励函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出

2017-06-28 17:08:27 17223 1

原创小白入门C++ 继承多态函数重载

概念:继承和多态继承可以把父类的所有功能都直接拿过来，这样就不必重零做起，子类只需要新增自己特有的方法，也可以把父类不适合的方法覆盖重写；有了继承，才能有多态。在调用类实例方法的时候，尽量把变量视作父类类型，这样，所有子类类型都可以正常被接收；虚函数是面向对象编程实现多态的基本手段。它是面向对象程序设计中的一个重要的概念。只能适用于指针和参考的计算机工程运算。当从父类中继承的时候，虚函数和被

2017-06-28 13:59:44 1007

转载 Python 读取WAV音频文件画频谱

import wave import struct from scipy import * from pylab import * #读取wav文件，我这儿读了个自己用python写的音阶的wav filename = '1.wav' wavefile = wave.open(filename, 'r') # open for writing

2016-12-17 15:08:14 5273

转载 CNN反向传播公式推导

《Notes on Convolutional Neural Networks》一、介绍这个文档讨论的是CNNs的推导和实现。CNN架构的连接比权值要多很多，这实际上就隐含着实现了某种形式的规则化。这种特别的网络假定了我们希望通过数据驱动的方式学习到一些滤波器，作为提取输入的特征的一种方法。本文中，我们先对训练全连接网络的经典BP算法做一个描述，然后

2016-12-06 19:33:05 5180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Danni_hgc CSDN认证博客专家 CSDN认证企业博客

码龄7年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

18万+: 周排名

166万+: 总排名

28万+: 访问

: 等级

2160: 积分

67: 粉丝

80: 获赞

21: 评论

499: 收藏

私信

关注

热门文章

分类专栏

C 2篇
C++ 6篇
linux 1篇
C++ 图像 3篇
python 语音 1篇
神经网络 2篇
kaldi 5篇
leetcode-C 1篇
机器学习 3篇
推荐算法 13篇
大数据 4篇
常用工具 1篇
对抗攻击 1篇
java 1篇
语音识别 1篇

最新评论

如何理解DeepFool算法
Wht_xz: 有地方好像缺了？那个距离公式和下面的没显示
kaldi的语音识别数据timit例子详解
weixin_42340743: -bash: gmm-copy: command not found，请问为什么会出现这样的情况？
协同过滤推荐算法实例代码
科学养猪的程序猿: 感谢，好用，主要问题是python2.x和python3.x之间的区别，简单调一下就可以
音频处理工具SOX详解
普通网友: 博主的文章很棒呀，只是有个问题想请教博主，可以留个联系方式吗？
电影推荐算法实例代码
qq_42696575: 麻烦问一下楼主，就是能不能问一下你这个数据集里面有多少个数据，25个电影数据怎么弄，还有怎么跑十遍得出不一样的结果，能不能加个Q交流一下啊，谢谢大佬（q：848247747）

最新文章

提示

确定要删除当前文章？

取消删除