自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(64)
  • 收藏
  • 关注

原创 源码部署Milvus(三)成功解决vscode调试milvus源码时间超时问题!

在配置 VSCode 的以调试 Go 程序时,通常不需要专门配置gdb相关的设置。Go 通常使用delve作为其主要的调试工具,而不是gdb。delve提供了更好的 Go 语言支持,包括对goroutines和channels的支持,以及更好的集成到 Go 的类型系统中。

2024-01-16 17:01:39 645 1

原创 源码编译部署篇(二)源码编译milvus成功后如何启动standalone并调试成功!

由于Milvus官方文档只提及如何使用docker安装部署Milvus,关于源码安装方式篇幅较少,因此,我整理撰写了如何通过源码编译方式成功安装Milvus,详见此篇。之所以选择这种复杂的安装方式,可以调试源码进而熟悉Milvus如何搭建整个框架支持AI上层应用功能。根据上篇步骤部署虽然可以成功,然而,我却不能成功启动Milvus服务,这个问题困扰了一两天,现在终于得以解决并能成功调试Milvus源码。接下来,分为三个部分介绍如何启动和成功调试。

2024-01-07 21:13:31 1411

原创 源码编译部署篇(一)成功安装Milvus!零基础Ubuntu部署安装Milvus教程

网上可参考的Milvus源码安装教程资料太少,且不全,会缺少很多依赖安装,导致最后编译安装会遇到很多问题,在此,整理自己源码编译安装的全过程,方便日后查看。

2024-01-02 15:17:34 1799 3

原创 WalMiner插件之xlog解析恢复使用教程

WalMiner插件主要有两个功能,在此记录一下第二个功能数据页挽回(坏块修复),学习一下关于这块的使用方法,方便日后回顾。

2023-05-25 11:25:11 779

原创 PG安装使用walminer插件教程

每个目录中都有makefile文件,执行make && make install。将walminer源码目录放进此路径下,进入walminer目录。查看当前PG库所安装的插件名称。

2023-05-24 20:01:24 366

原创 PG15.3.0源码编译安装日志插件pgbadger(上)

今天就先到这里,目前进度是成功安装好pgbadger,但还存在一些问题没有弄明白,如pgbadger具体使用用法等,如根据csv如何对应打开html?注:我忘记我之前是什么操作导致/usr/local/pgsql/data/log/下有log日志了,等我想起来再更新。下载地址:https://github.com/darold/pgbadger/releases。说明文档:https://github.com/darold/pgbadger。回到第一个日志窗口看最新日志,找到报错信息如下,最后解决。

2023-05-22 15:30:49 668

原创 成功解决静态链接库无法yum安装问题!usr/lib64/python2.7/site-packages/pycurl.so undefined symbol crypto_num_locks

今天在测试pg分析日志记录时发现无法显示网页,查资料发现未安装httpd等依赖库,于是安装的时候报以下错误,查找许多资料终于找到解决办法,特此记录。

2023-05-22 13:44:18 720 1

原创 安装编译PostgreSql15.3.0

使用/usr/local/pgsql/data作为数据库的数据目录。解压或下载后计入postgres目录。创建数据存放目录并设置权限。切换至postgres用户。

2023-05-21 18:25:38 796

原创 梳理数据库系统概述(一)

概念层提供了数据库的总体视图,描述数据库里存储什么数据以及数据之间的来呢西,包含所有实体、属性和联系,数据上的约束,数据的语义信息,并检查保持数据的一致性和完整性,安全信息等。内部层也是内模式层,或被称为物理存储组织,定义了物理数据的存储位置和组织结构,包含了存储记录的定义、数据字段(或属性)、索引和散列模式等,而外部结构可以分为集中式结构、客户/服务器结构和分布式结构。数据库系统的目标是存储数据,简化对数据的访问,给用户提供一个抽象的数据视图,从而隐藏数据存储和维护的具体细节。

2023-05-21 14:29:45 84

原创 vscode调试mysql5.7.37教程

前一篇用的是launch,这一篇更改为attach。

2023-05-15 16:27:53 264

原创 使用gdb调试openGauss5.0.0 入门篇

使用gdb调试,若在vscode中一般用attach比launch好,所以需要查看进程号,二也是方便查看数据库是否成功启动。关于gdb调试相关使用方法自行查找资料,后期有需要输出一份常用命令总结指南。

2023-05-15 13:23:18 283

原创 openGauss5.0.0在vscode成功调试

之前在虚拟机上编译成功过,但今天启动数据库的时候出现权限错误问题,我重新删除了data文件夹,重新初始化启动数据库还是不成功,后来对报错文件进行赋权,成功解决!

2023-05-14 14:06:38 484

原创 vscode编译mysql-boost-5.7.37如何设置Cmake:configuration以及成功debug教程

这里注意一下,我是一开始就预先在自己的虚拟机上编译完成了一遍,所以这里即使再编译一次也是很快完成,所以这篇博客的目的重在已经预先在自己的虚拟机上成功编译安装好源码后,如何通过vscode远程连接服务器来进行debug操作的(毕竟vscode方便看源码噻~)这里注意miDebuggerPath位置一定要正确,我当时报错原因是我的服务器没有安装gdb,所以显示路径不正确。3. 编辑launch.json。方法有三,我是第一种方法成功。

2023-05-14 10:09:37 534

原创 《Knowledge graph completion via complex tensor factorization》理论(下)

该文献涉及的数学理论总结

2022-09-24 00:37:41 515

原创 文献笔记1:《Knowledge Graph Completion via Complex Tensor Factorization》理论(上)

总结论文

2022-09-24 00:23:55 527

原创 02 Linux常用命令总结

linux 常用命令总结

2022-09-23 21:13:06 190

原创 02 高精度算法笔记(只有模板,暂未刷题版)

高精度加减模板

2022-09-23 17:08:25 401

原创 01 二分查找算法笔记及刷题题解

自己总结的笔记,自用

2022-09-23 16:37:32 91

原创 移除停用词篇

停用词把数据转换成计算机能理解的过程就是预处理过程。其中,预处理的主要形式就是过滤掉无用的数据。在自然语言处理中,无用的数据就是停用词(stop words)停用词有哪些?具体来说,在英文中的停用词就如a/an/the/in etc命令行查看停用词列表import nltkfrom nltk.corpus import stopwordsprint(stopwords.words("english"){‘ourselves’, ‘hers’, ‘between’, ‘your

2022-04-19 19:22:44 570

原创 成功解决Django中报错 ImportError: cannot import name ‘path‘

使用Django,报错ImportError: cannot import name ‘path’原因是版本1.X不支持,得升级到2.X我的版本是:1.11.3# 查看django版本号django-admin --version升级命令 pip install --upgrade django升级成功至3.2.13重新启动!!!最后成功...

2022-04-13 13:00:37 2076

原创 成功解决 ValueError: Not a TBLoader or TBPlugin subclass: <class ‘tensorboard_plugin_wit.wit_plugin_load

使用TensorBoard,查看默认图的可视化,输入以下命令,报错input: tensorboard --logdir="./tmp/summary"ValueError: Not a TBLoader or TBPlugin subclass: <class 'tensorboard_plugin_wit.wit_plugin_loader.WhatIfToolPluginLoader'>解决方案进入Anaconda prompt ,激活tensorflow可以先conda

2022-04-09 16:46:31 2031 2

原创 成功解决 Cannot feed value of shape (256, 18) for Tensor ‘movie_categories:0‘, which has shape ‘(?, 1)‘

这个bug困扰了我一天,最后在stack overflow上看到解决的办法,并且成功解决!特此记录一下首先这个问题出现的原因是:我喂养的数据的形状是(256,18),但实际需要的形状是(?,1),不匹配,需要统一。我先按照这个思路修改我的代码先贴上原来报错的代码 # 模型保存 saver = tf.train.Saver() for epoch_i in range(num_epochs): # 将数据集分成训练集和测试集,随机种子不固定 train_

2022-04-06 14:13:54 594

原创 汇总PageRank写得不错的博客链接

PageRank比较清晰,易理解,有算法优缺点很全面,包括马尔科夫链叙说起,可反复看有源码+图代码解说PR算法可参考,代码图文并茂,手写画图

2022-03-25 11:48:03 101

原创 【成功解决并安装tensorflow】记录遇到过的坑

我来更新啦!今天搞了一个上午,好几小时,呜呜呜~————————————————————————我最终在spyder上测试我安装成功的版本是2.8.0,如下图所示记录安装流程吧~首先你得有Anaconda,python环境等,这些我就跳过,直接上重点!我安装的是tensorflow 的python环境版本是3.6,一开始安装的是3.7,后来3.5,都会报错。(别问,我也不知道!)conda create --name tensorflow python=3.6 【注】环境在cmd或

2022-03-20 17:00:16 2267

原创 成功解决安装tensorflow,安装进度1/4,爆红一大片且有很多File出现timed out

之前安装几次(CPU),tensorflow总是出现一大片红。自己发现其中一个原因是python版本和tensorflow不对应。tensorflow 2.0.0 得和python3.5~3.7对应,我之前的版本是3.8.5,会出现不兼容情况,报错。一、解决1. 起因——超时2. 成功解决pip --default-timeout=100 install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple写上默认超时100,使用清

2022-03-20 14:06:12 2903

原创 李航统计学习——第二章感知机(上)

第一章主要介绍了学习方法的三要素:模型、策略、算法这章主要介绍感知机1 从模型来理解感知机概念感知机是一个二分类的线性分类模型。无论是机器学习还是深度学习,按着三要素走(模型->策略->算法)模型本质还是假设空间(Hypothesis Space):所有可能的条件概率分布或决策函数。而假设空间(模型)是由参数空间决定的。【补】假设空间是所有可能决策函数的集合;而每个决策函数由一个参数向量决定;参数空间:所有可能的参数向量组成的空间举个例子:线性y=wTx+by=w^Tx+b

2022-03-11 17:58:41 829

原创 图嵌入综述整理(上)

通过近段时间的学习,自己发现无论基于多层图一般方法还是基于随机游走,还是模糊,所以这次查阅了相关资料,其中有包含随机游走的介绍。1 为什么引入图?我们身处的世界关系都可以建模为图的结构,用图的节点或节点属性表示真实网络系统中的实体或实体标签,用图中的边表示真实网络中的实体关系。因此,通过图嵌入方法可以提高效率等优势。2 图的特点海量高维稀疏异构复杂动态图嵌入是一种图表示学习方法,需要将高维向量映射到低维空间。3 图嵌入问题及定义【图嵌入】将图的节点或边映射到一个低维的向量空间

2022-03-11 10:33:46 4554 4

原创 个性化推荐综述总结

1、推荐系统目的推荐系统是通过分析提取出用户的历史偏好数据,并结合用户之间的偏好关系以及项目与项目的相似程度,推测出目标用户可能喜欢的物品并将其推荐给用户。2、推荐系统解决的问题信息超载现象。信息超载(Information overload)指信息接收者或处理者所接收的信息远远超出其信息处理能力。3、主流的推荐算法主要分为四类,即基于内容推荐、协同过滤推荐、基于深度学习推荐以及混合推荐。这里放上思维导图分类更为直观。4、总结各个算法的思想(算法步骤)基于内容推荐算法【算法思想】通过

2022-03-08 16:55:05 1370

原创 RecWalk: Nearly Uncoupled Random Walks for Top-N Recommendation (上) 用于 Top-N 推荐的近乎解耦的随机游走

论文出处:Athanasios N Nikolakopoulos and George Karypis. Recwalk: Nearly uncoupled random walks for top-n recommendation. In WSDM, pages 150–158, 2019.2019年【摘要】随机游走模型优点:可以捕获丰富的交互网络,用于TOP-N推荐利用项目之间的间接关系,降低稀疏性的影响缺点:易受到用于个性化推荐的K步分布范围限制因此,本篇论文提出了RE

2022-03-03 19:21:20 253

原创 创建好Maven无法创建scala文件

出现此类问题,多半是还没有安装Scala等相关包。先下载Scala下载好,添加Scala的sdk创建Scala目录,更换为源目录即可创建scala文件

2021-12-29 13:13:23 1012

原创 Maven 报错|dependencyManagement和dependencies的区别

报错 找不到依赖“xxx not found”如果你的pom文件里写的依赖有depedencyManagement,那么各种解决办法都试过了还未解决的话,可以试试把depedencyManagement暂时去掉。dependencyManagement和dependencies的区别denpendecies自动引入声明在denpendecies里的所有依赖,并默认被所有的子项目继承。如果项目中不写依赖项,则会从父项目继承(属性全部继承)声明在父项目dependencies里的依赖项。depen

2021-12-28 17:26:22 148

原创 IDEA 报错 Cannot connect to the Maven process. If the problem persists, check the jdk.

Maven项目,导入依赖爆红。出现此错误,可能是因为jdk版本太高,不兼容。解决办法:

2021-12-28 16:01:13 2521

原创 回归模型基本介绍(一)

机器学习三步骤:1.选择合适的模型 2.模型评估(损失函数) 3.最佳模型(梯度下降)回归模型线性回归模型一元线性回归多元线性回归非线性回归模型最小二乘法定义线性回归:给定数据集D={(x1,y1),(22,y2),...,(xm,ym)}{\{(x_1,y_1),(2_2,y_2),...,(x_m,y_m)}\}{(x1​,y1​),(22​,y2​),...,(xm​,ym​)},其中xi=(xi2;...;xid),yi∈R{x_i = (x_{i2};...;x

2021-12-21 11:47:30 665

原创 机器学习介绍

机器学习介绍机器学习可以分为问题和模型(解决的方法)。问题又可以分为有监督学习和无监督学习。而有监督学习主要分为两大类:分类和回归问题。那么如何区分分类和回归问题呢?最大区别在于预测结果。若预测结果是连续值,那就属于回归问题;若属于离散问题,属于分类问题。一个重要的点:无论什么模型,一般都需要经过三个步骤:为假设函数设定参数,代入模型,计算得到预测值将预测值代入损失函数,计算出一个损失值通过得到的损失值,利用梯度下降等凸优化方法,不断调整假设函数的参数,使得损失值最小。...

2021-12-13 20:14:52 876

原创 matplotlib解决中文问题|pyplot在pycharm写法

1. Matplotlib解决中文问题加入即可成功显示import matplotlib as mplmpl.rcParams['font.sans-serif'] = ['SimHei']#SimHeri是中文字体名称mpl.rcParams['axes.unicode_minus'] = False2. pyplot 在pycharm的写法正常在python3里写:import matplotlib.pyplot as plt但我在pycharm这样导入,不出来图所以,更改成:f

2021-11-24 19:35:15 596

原创 Numpy基础

4.0 学习目标目标了解Numpy预算速度上的优势知道Numpy的数组内存块风格知道Numpy的并行化运算应用机器学习、深度学习各种框架的基础库4.1 Numpy的优势1 numpy什么是Numpy?Numpy是一个开源的python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。使用ndarray存储对象来处理多维数组,该对象是一个快速而灵活的大数据容量。2 ndarray如何创建?np.array()3 Numpy的优势是什么?

2021-11-01 21:59:51 406

原创 机器学习基础——入门级笔记

一、机器学习概念1.1 定义机器学习(ML)主要研究计算机系统对于特定任务的性能,逐步进行改善的算法和统计模型。通过输入海量训练数据对模型进行训练,从而对输入的数据进行预测或分类。1.2 机器学习的过程二、机器学习主要分类&无监督学习2.1 主要分类分为有监督学习:给予数据与正确的结果,类似提供习题册和正确答案。无监督学习:提供数据不提供正确答案。强化学习:仅仅是通过与环境交互获取延迟返回2.2 无监督学习采用一组仅包含输入的数据,通过寻找数据中的内在结构来进行样本点

2021-10-26 19:07:25 309

原创 推荐系统简介

一、推荐系统概述1.1 推荐系统的目的解决如何从大量信息中找到自己感兴趣的信息。让用户更快更好的获取到自己的内容让内容更快更好的推送到喜欢它的用户手中让(网站)更有效的保留用户资源1.2 推荐系统基本思想利用用户和物品的特征信息,给用户推荐哪些具有用户喜欢的特征的物品。利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品。利用和用户相似的其他用户,给用户推荐哪些和他们兴趣爱好相似的其他用户喜欢的物品。推荐系统数据分析推荐物品或内容的元数据,例如关键字,分类标签,基因描述等;

2021-10-26 18:33:14 203 2

原创 滴滴项目(下篇)Superset数据可视化

继续完善之前的项目——Sqoop数据导出+Superset数据可视化进度之前已经安装完sqoop、创建完表,搭建好数据仓库。在分析完核心指标之后,我们需要将指标数据导出到mysql数据库中,便于后续的应用,比如结果指标的可视化。Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。Hadoop生态系统包括:HDFS、Hive、Hbase等RDBMS体系包括:Mysql、Oracle、DB2等Sqoop可以理解为:“SQL 到

2021-10-13 10:52:46 455

原创 第一章 绪论(上)

[学习方法]下足了功夫,弄清了概念,做好了作业,自然会取得好成绩。机器学习?机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。因此,机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。有了学习算法-> 提供经验数据给算法-----> 产生模型; 在面对新的情况时(预测),模型会给我们提供相应的判断。小结:机器学习是利用经验来改善系统自身的性能。机器学习研究内容是从数据中产生”模型“的算法,即研究学习算法。此算法必须依赖于数据。

2021-10-11 16:47:44 61

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除