3 Robert_Gordon

尚未进行身份认证

我要认证

怕什么真理无穷,进一寸有一寸的欢喜!

等级
TA的排名 21w+

leetcode--双指针

这道题的思路是使用双指针:i代表从数组最左边的元素进行遍历,如果该字母不是元音字母的话,继续遍历(i++),直到遇到元音字母为止,然后进行交换。j代表从数组最右边的元素进行遍历,同样的若数组中的尾字母不是元音字母的话(j–),继续遍历,直到遇到元音字母为止,进行交换。代码:class Solution {public: string reverseVowels(string s) { int i=0,j=s.length()-1; while(i<j) {.

2020-09-05 16:51:18

力扣刷题——移动元素

力扣中关于移动元素的算法题。1. leetcode——27题,移动元素。这道题看到之后有两种思路。1、第一种思路其实很简单,就是遍历数组中的元素,将其与目标值进行比较看是否相等,若相等的话,我们可以通过c++中的erase()函数对其进行删除。class Solution {public: int removeElement(vector<int>& nums, int val) { for(int i=0;i<nums.

2020-08-31 20:43:09

Re-Weighted Discriminatively Embedded K-Means for Multi-View Clustering

RDEKM这篇论文的创新点:提出一个多视图最小绝对残差模型。原来的多视K均值聚类的方法是采用非负矩阵分解,如公式所示:其聚类性能数据异常值的很大影响。基于此本论文提出一个多视最小绝对残差的模型,其中WkW_kWk​表示的是一个投影矩阵,对高维数据进行降维,避免维度诅咒。在模型中残差∥.∥F\left \| . \right \|_F∥.∥F​没有进行平方,所以可以减少离群值的影响,并具有很好的鲁棒性。目标函数为:其中...

2020-08-01 17:01:08

Binary Multi-View Clustering(基于二进制的多视图聚类)

本篇论文是一篇关于二进制的多视聚类文章,用于处理大规模的多视数据集。1、首先对多视数据进行哈希编码本论文在第v个视图的数据中随机选取m个样本或者通过k-mean算法直接生成m个子簇中心amva_m^{v}amv​来表达这个视图的数据分布,然后计算xsvx_s^vxsv​于amva_m^{v}amv​的核函数。之后乘上对其进行降维,并通过sgn()符号函数得到第v个视图的哈希矢量。2、学习一个统一的哈希矢量因为是多视图学习,所以一共有M个视角的哈希矢量hsvh_s^vhsv​,从中学习一个统一的

2020-08-01 16:29:37

[KDD 2019] K-Multiple-Means(K多均值聚类)

原文作者链接本次描述地这篇论文是《K-Multiple-Means: A Multiple-Means Clustering Method with Specified K Clusters》,这是一篇关于多原型聚类地文章。众所周知,K-means是一种非常流行地聚类方法,使用一个质心对每一类的数据进行建模,在大多数的数据分布中能取得很好的效果。但是对于双月牙形这种非凸图案,得到的聚类结果很差。由此作者提出了一种新的多原型聚类的方法——KMM(K多均值聚类)。不同于以往的原型聚类方法(层次聚类),即先

2020-08-01 16:04:59

matplotli线条类型、颜色

本文由以下链接转载:http://www.cnblogs.com/darkknightzh/p/6117528.html参考网址:http://stacko...

2020-06-23 12:31:50

自适应近邻的多视图聚类

多视图聚类  对最近看的论文的一个总结。Multi-View Clustering and Semi-Supervised Classification with Adaptive Neighbours(MLAN)  聂飞平将单一视图的CAN推广到多视聚类,即MLAN。  单视CAN聚类的目标函数为:推广到多视聚类MLAN:其中wvw_vwv​是每个视图的权重,这里的权重是自动分配,不需要添加参数。 我在这里理解wvw_vwv​参数的含义是将距离的平方开根号,减少离群点的重要性,不知道我理解

2020-06-11 13:10:22

自适应近聚类(Clustering and Projected Clustering with Adaptive Neighbors)

  在谱聚类中,构造邻接矩阵时,对于每个边的权重需要用高斯核函数来构造,对此需要调节参数σ\sigmaσ,嗯嗯…我们知道调参是一件很无意义的事情,鲁棒性不是很好。那么如何解决这个问题?  聂飞平大佬14年提出了自适应近邻构造图的方法(CAN),Clustering and Projected Clustering with Adaptive Neighbors,接下来我们简单的介绍一下CAN方法。  该算法的含义很简单:“距离较小的数据点成为邻居的可能性较大”这一先验知识的前提下,引入了概率邻居,在

2020-06-11 10:52:29

谱聚类算法(Spectral Clustering)的简单介绍

  谱聚类(spectral clustering)是广泛使用的聚类算法,数据分布的适应性很强,(对于非簇状分布的数据也能起到很好的效果)聚类效果也很优秀,同时聚类的计算量也小很多,被大家广泛使用。1、谱聚类概述  谱聚类的基本思想很简单,利用从数据中得到的特征矩阵实现聚类,依靠两个部分完成聚类工作,第一个部分为图的构造,第二个部分对构造好的图,诱导出拉普拉斯矩阵并做特征分解,求特征向量,将数据嵌入到特征向量空间,进而实现聚类。  在介绍谱聚类之前先简单的回顾下图论和拉普拉斯矩阵的有关知识。2、图论

2020-06-11 09:24:41

csdn转载别人博客

参考博客原址 http://blog.csdn.net/bolu1234/article/details/51867099转载CSDN博客步骤:1、CSDN博客页面右键,点击【检查】...

2020-05-03 22:24:46

去重

package com.duking.hadoop; import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hado...

2020-04-19 22:19:38

eclipse使用wordcount

package org.apache.hadoop.example;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoo...

2020-04-19 21:34:18

机器学习初探之logistic回归

正文  在前面我们知道,感知机对数据进行分类是生成一个超平面(在二维世界中是一条直线),这个超平面可以将图中的两类点区分开。如下图所示:  但是感知机存在一个很重要的问题,那就是它是一个硬分类,我们只用sign(w*x+b)输出的+1和-1来判断点的类别。如下图所示:这么简单的判别方式真的会很有效吗?  虽然我们已经程序测试过正确率很高,但总是让人有点担心是否在很多情况下都能很好地工...

2020-03-11 14:44:30

机器学习初探之朴素贝叶斯优化

一、前言  在上篇文章中,讲解了朴素贝叶斯的基础知识。本篇文章将在此基础上进行扩展:二、拉普拉斯平滑  上篇文章提到过,算法存在一定的问题,需要进行改进。那么需要改进的地方在哪里呢?利用贝叶斯分类器对文档进行分类时,要计算多个概率的乘积以获得文档属于某个类别的概率,即计算p(w0|1)p(w1|1)p(w2|1)。如果其中有一个概率值为0,那么最后的成绩也为0。我们拿出上一篇文章的截图。...

2020-03-10 11:11:25

机器学习初探之朴素贝叶斯分类

一、 前言  朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。在讲解朴素贝叶之前,我们首先推导一下贝叶斯公式。二、贝叶斯公式推...

2020-03-09 23:49:16

python中元组(tuple)和列表(list)的区别

一、前言  想必大家都知道,在Python数据类型中有两个对象:元组 tuple 和列表 list 。  它们的写法和用法都十分相似,傻傻分不清楚。可能有的同学就会疯狂的去网上查找它们之间的区别了,可是查到的无外乎有以下几种说法:  list 是可变的对象,元组 tuple 是不可变的对象!  由于 tuple 不可变,所以使用 tuple 可以使代码更安全!等等 …  下面我们来分析l...

2020-03-09 10:54:05

CSDN美化编辑

Markdown 常用技巧: 2015/12/...

2020-03-08 12:27:22

机器学习初探之感知机

监督学习  我么们知道机器学习就是让机器跟人类一样去学习东西。我们人类是怎样去学习呢?简单的说,就是有老师传授我们知识,带着我们学习(比如说带领我们认识世界上的各种动物,如、熊猫、老虎、猫咪和小狗)。然后呢,通过不断的学习和总结,我们形成了自己的知识架构(即对这些动物能够进行很好的判别),当我们去动物园参观动物时能够知道这些动物的名字。  如下图所示:  其实机器学习和人类的学习方式一样。只...

2020-03-08 12:14:49

机器学习处探

总结研一上学期机器学习的知识。参考的书目为《统计学习方法》《机器学习》《机器学习实战》(老师讲的实在好烂)。  机器学习分为监督学习、半监督学习、非监督学习和强化学习这四种。如图所示:1、监督学习  监督学习是利用已标记的有限训练数据集通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射。监督学习要求训练样本的分类标签已知,分类标签的精确度越高,样本越具有代表性,...

2020-03-06 22:04:41

二叉树的遍历(先序、中序、后序)

二叉树的遍历分为以下三种:1、先序遍历:遍历顺序为【根左右】2、中序遍历:遍历顺序为【左根右】2、中序遍历:遍历顺序为【左右根】所谓的先序遍历中的【根左右】是什么意思呢?即:(1)访问根节点;  (2)先序遍历左子树;  (3)先序遍历右子树。  举个例子,看下图这个树的前序遍历:ABDEGHCF中序遍历:DBGEHACF后序遍历:DGHEBFCA层次遍历:ABCDEFG...

2020-02-28 21:24:36

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。