自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(77)
  • 收藏
  • 关注

原创 大模型LLM与agent

最近,基于LLM强大的意图识别能力,采用LLM作为控制中心,调用各种垂直领域的小模型,这一研究方向比较热门,即大模型的agent应用。

2024-03-14 14:47:54 330

原创 docker 网络

【代码】docker 网络。

2024-02-06 10:33:05 347 1

原创 图表征模型研究

图表征对于知识图谱是很重要的,如何将图进行embedding,并输入到深度学习模型中,是一个热点问题。

2024-01-04 09:33:17 558

原创 k8s实践

k8s作为分布式集群部署方案,是一个主流的部署方案。

2023-11-10 10:43:44 279

原创 windows环境打包

将Python脚本运行依赖的第三方包进行打包,以便部署到新环境。

2023-07-12 10:14:46 151

原创 docker cron

centos docker crontab使用说明。

2023-06-21 10:17:02 639

原创 django HTTPS访问

最近开发的一个django项目要求必须通过安全检测,必须采用https访问,因此,进行https相关的学习。

2023-02-24 13:44:39 406 1

原创 中标麒麟-部署

中标麒麟部署

2022-12-12 13:44:52 897 1

原创 nebula 应用

在nebula中常用到GET SUBGRAPH查询,获取某一节点的N跳子图,获取子图结果后,如何进行后续的计算也是一个问题。

2022-10-20 16:35:00 460

原创 nebula graph调研

但数据同步还是不错的,对于有es基础的用户而言,可以直接使用es本身的查询功能,更强大,而不必受限于nebula graph。通过listener插件可以将storage中存储的节点和边,同步到es引擎中。nebula graph的索引不用于查询加速,仅用于点和边的定位。但是基于es创建的全文索引,使用限制非常多,几乎没有实际应用价值。使用lookup和match查询语法之前必须创建索引。............

2022-08-30 15:02:29 480

原创 vue打包

前端的vue开发完成后,需要打包为dist供后台使用,此处需要写一个自动打包的脚本。

2022-08-24 10:34:53 352

原创 tigerGraph 实践

由于tigergraph是闭源的,需要自行向官网申请安装包:https://www.tigergraph.com.cn/,此处安装包如下图

2022-06-23 15:27:25 408 1

原创 neo4j与Mysql的数据迁移

neo4j和mysql之间进行数据的相互迁移通过apoc插件和mysql 的jdbc工具即可实现,由于neo4j是4.0.4版本,下载的插件版本如图。将插件复制到neo4j的plugins目录,重启neo4j服务。采用如下命令即可从mysql中向neo4j写数据。...

2022-06-22 09:28:44 507

原创 neo4j 源码学习

neo4j是maven风格的java工程,学习编译其源码需要搭建如下2个环境:Maven和IntelliJ IDEAMaven是一款服务于Java平台的自动化构建工具。Maven 作为 Java 项目管理工具,它不仅可以用作包管理,还有许多的插件,可以支持整个项目的开发、打包、测试及部署等一系列行为。安装参考文档:https://blog.csdn.net/tirster/article/details/123418269IDEA 全称 IntelliJ IDEA,是java语言开发的集成环境,可以对Ja

2022-06-16 19:31:17 532

原创 neo4j 社区版主从集群

由于neo4j企业版太贵了,想研究一下通过neo4j社区版搭建主从的方案

2022-06-06 13:38:39 4816 1

原创 gremlin图查询插件

gremlin是一个通用的图查询插件,尽管在neo4j上可以使用Cypher语言进行查询,但我仍想调研一下通过gremlin查询neo4j。

2022-05-24 08:44:35 594

原创 linux redis集群搭建

由于一些项目中需要快速的根据id获取该条记录的所有信息,因此需要采用k-v结构的redis数据实现。1.配置host<IP1> master.redis.com master<IP2> node01.redis.com node01<IP3> node02.redis.com node022.gcc环境配置gcc版本需要5.3以上,这里配置版本:9yum -y install centos-release-sclyum -y install devtoo

2022-04-15 09:41:27 1015

原创 数据库组件迁移

由于服务器搬迁的原因,时不时会进行数据库的一些整体迁移操作1. mysql通过mysqldump命令实现。# 迁出mysqldump -u root -p questionDB > questionDB.sql# 迁入create database questionDBsource questionDB.sql2. es迁移安装Node和Npm,安装包下载地址:https://nodejs.org/en/download/解压,并创建软链接sudo ln -s /opt/nod

2022-04-14 16:50:11 491

原创 neo4j与es结合

1. es插件es插件下载地址:https://github.com/neo4j-contrib/neo4j-elasticsearch/releases这里下载3.5.6版本的插件,将插件复制到neo4j的plugins目录下docker cp neo4j-elasticsearch-3.5.6.jar neo4j_es:/opt/neo4j/plugins2.

2022-04-12 16:57:44 3520 1

原创 shell编程

xshell是操作linux服务器的一个常用工具,sh脚本可以方便的处理一些工作。shell脚本可以以.sh结尾(或者php等其它后缀表示),比较常用的是bash。bash需要在第一行指定解释器,当然不指定也可以,但是不指定的话,运行时需要指定/bin/sh XX.sh#!/bin/bash1. 语法基础1.1 变量sh脚本的变量一般会加上{}for skill in Ada Coffe Action Java; do echo "I am good at ${skill}Script

2022-03-09 17:10:00 770

原创 源代码执行

在2台配置基本一致的服务器上执行同一文件,执行目的是:从es中查询某一数据,执行效率分别为:4.5s,1.1s,比较好奇源代码的执行效率为什么差异这么大。1. 编译型的执行原理编译型语言:Cc语言源代码如何被计算机执行:https://zhuanlan.zhihu.com/p/721390662. 解释型的执行原理解释型语言:Java、Python、R…3. cpu利用率采用top命令查看2台机器的cpu使用情况,发现耗时高的服务器cpu使用满了,top命令可以看到总体的系统运行状态和cp

2022-02-25 10:12:09 871

原创 django 中间件

最近有个需要用prometheus对django服务的接口进行监控的任务,由于接口比较多,写装饰器比较麻烦,因此,研究了中间件的用法1. 编写monitor.middleware编写一个middleware.py文件,内容如下:from django.http import HttpResponsefrom django.utils.deprecation import MiddlewareMixinfrom django.views import Viewfrom prometheus_cli

2022-02-17 09:46:45 466

原创 docker课程笔记

最近也用了不少docker了,还是蛮好奇容器的原理的。1. docker隔离与边界1.1 进程程序,即数据和代码本身的二进制文件,执行程序时,它就从磁盘上的二进制文件,变成了计算机内存中的数据、寄存器里的值、堆栈中的指令、被打开的文件,以及各种设备的状态信息的一个集合,这个一个计算机执行环境的总和,被称为进程。1.2 容器容器技术的核心功能,就是通过约束和修改进程的动态表现,从而为其创造出一个“边界”。Cgroups 技术是用来制造约束的主要手段,而 Namespace 技术则是用来修改进程视图的

2022-01-14 13:58:51 280

原创 networkx实践

最近研究知识图谱相关的构建与推理应用,一个坑的问题在于neo4j中可以存储图数据,查询与可视化也做得不错,但是计算功能比较弱,而neo4j的查询结果不能直接导入networkx进行计算,需要根据查询结果构建图ε=(´ο`*)))1. networkx创建图G.add_node(node)G.add_edge(link[0], link[1])2. networkx常用计算获取节点/边列表 G.nodes() G.edges()获取节点的度/入度、出度(有向图)G.degree(

2022-01-07 09:42:32 447

原创 docker Swarm

这个需求的起源是,算法需要与MySQL数据库交互,部署镜像后发现,当mysql的ip发生变化时,算法文件就要相应的修改mysql的访问ip,觉得这样很麻烦,所以调研了一下。1. docker swarm 网络

2021-12-28 16:49:51 747

原创 PCR框架实践

最近做的一个项目,希望将前端接口调用与后台的算法分离,当算法进行升级更新的时候,前端无需调整,为此,计划使用pcr框架来实现二者的通信。1. PCR结构如图所示,灰色框部分由pcr的框架进行实现。2. demo示例python可以通过如下方式实现rpyc框架。安装rpyc:pip3 install rpyc==5.0.1client.py,客户端:import rpycfrom threading import Threadimport randomdef call_prc(i):

2021-12-02 17:26:41 978

原创 so文件编译

项目交付的时候,为了加密源码,将py文件编译为.so文件。1. 单个py文件编译单个文件的编译方法如下,在setup.py文件中编写下列代码,使用命令:python3 setup.py build_ext,执行编译命令from Cython.Build import cythonizefrom distutils.core import setupimport ospath = ''files = os.listdir(path)source_files = []for i in fil

2021-12-02 10:00:58 2408

原创 docker应用实践

由于项目部署的现场环境通常为离线环境,因此需要将项目打包为docker文件,便于部署。1. docker安装yum install docker -y设置自启动systemctl start dockersystemctl enable docker2. 制作包含中文语言环境和python3服务的基础centos镜像此处采用dockerfile文件进行制作,首先拉取一个原始的centos7镜像。docker pull docker.io/centos:7编写dockerfile文件的

2021-11-17 10:18:52 1853

原创 ES应用实践

1. 索引1.1 创建索引通过curl命令curl -H "Content-Type: application/json" -X PUT '<IP>:9200/index1' -d '{ "settings" : { "index" : { # 配置分片数,分片数多时查询速度快,一般分片数与节点数一致 # 分片数只能在索引创建时配置,创建后不可修改 "number_of_shards" :

2021-11-12 14:28:16 2539

原创 python 启动cmd命令

最近有个项目要求通过flask接口调用一个任务命令,可以通过如下方式实现,但是该方法只能返回一个执行状态,无法获取该命令执行的详细日志。import oscmd = 'python3 ...'val = os.system(cmd)因此,获取详细日志可采用以下的方法,该方法可以将cmd命令打印的logging日志回传。import subprocesscmd = 'python3 ...'(status, uploadRes) = subprocess.getstatusoutput(c

2021-10-27 10:36:16 816

原创 flask镜像

1. 制作镜像制作基础centos+python3的镜像# centos镜像docker pull docker.io/ansible/centos7-ansible# 进入容器docker run -tid --name neo4j_container --privileged=true -t docker.io/ansible/centos7-ansible /usr/sbin/initdocker exec -it neo4j_container /bin/bash# 基础环境安装

2021-10-21 14:29:48 580

原创 spark课程学习笔记

1.1 简介spark以RDD(弹性分布式数据集)为基本的数据结构,并定义了RDD相关的基本操作:Map、Filter、flatMap、groupByKey和Union等。spark第一次启动时需要把数据载入到内存,之后的中间结果保存在内存中,避免从硬盘进行读写,因此后期的迭代计算速度很快,速度是spark的最大优势。在任务(task)级别上,spark的并行机制是多线程模型,同一节点上的任务以多线程的方式运行在一个JVM进程中,可以带来更快的启动速度、更高的CPU利用率,以及更好的内存共享。spar

2021-10-13 13:46:13 143

原创 线程ip使用

1. 安装与配置config执行以下命令,安装dotnet环境:sudo yum install libunwind libicu -ysudo rpm -Uvh https://packages.microsoft.com/config/centos/7/packages-microsoft-prod.rpmsudo yum install dotnet-sdk-3.0 -y# 检查版本dotnet --version配置config# 将购买的用户名、密码输入[config]TID

2021-10-08 14:44:13 116

原创 数据分析平台

1. 爬虫程序数据的定时获取是平台的基础:采用mysql存储原始数据采用ES作为数据查询的搜索引擎采用logstash将mysql数据迁移更新到ES中采用supervisor维护各项组件服务的执行采用cronsun维护数据分析服务的执行1. 1 数据爬虫——>MySQL从网上定时抓取数据后,进行一系列的字段解析处理,转为结构化的数据存入mysql数据库中。项目:spider_by_realtime依赖服务:民航:海关# Linux--64版本geckodriver

2021-09-26 10:39:58 81

原创 flask+swagger

由于写完flask接口后,需要向前端提供swagger接口文档,因此需要自动生成swagger文档。1. 安装flask-restplus采用如下命令安装flask-restpluspip install flask-restplus==0.13.0安装完成后导入包时报错,这是因为新版的werkzeug中该模块导入发生了变化,需要手动修改下cannot import name 'cached_property'…/site-packages/werkzeug/init.py 文件中,添加:

2021-08-24 14:27:21 2602

原创 python连接oracle

最近对接的项目甲方使用了oracle数据库,因此需要学习下oracle的连接1. 客户端准备下载如下三个文件(官网):http://www.oracle.com/technetwork/topics/linuxx86-64soft-092277.html解压后生成目录:设置软连接cd /opt/oracle/instantclient_11_2ln -s libocci.so.11.1 libocci.soln -s libclntsh.so.11.1 libclntsh.so配置环境

2021-07-19 19:00:51 535

原创 ES+mysql的数据迁移

由于mysql数据量大时,like查询几乎无法使用,因此采用搜索引擎ES执行like查询。1. ES安装1.1 升级java到1.8yum -y install java-11-openjdkmv /etc/alternatives/java /etc/alternatives/java.bak# 此处根据实际情况修改新版本java的位置ln -s /usr/lib/jvm/java-11-openjdk-11.0.11.0.9-1.el7_9.x86_64/bin/java /etc/alte

2021-07-09 14:43:03 712

原创 centos 安装python 3.6

1. 安装依赖yum install -y libffi-devel zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gcc make2. 下载python包# 存放安装包的路径cd /opt/installwget https://www.python.org/ftp/python/3.7.0/Python-3.7.0.tgz# 解压tar -zxvf Pytho

2021-06-30 14:28:00 81

原创 socks防pb

https://blog.csdn.net/shlhhy/article/details/117926433

2021-06-18 14:37:08 99

原创 linux运维命令

Linux服务器管理的常用命令。1. 权限管理给某个文件夹赋予不同的权限,每个文件都可以针对三个粒度,设置不同的rwx(读写执行,421)权限chmod -R 777 /opt/data-manager2. 内存管理free查看具体的每个进程的内存占用情况top根据每个进程id查看进程的具体任务ps -ef|grep <pid>...

2021-06-16 10:15:30 168

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除