自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 资源 (2)
  • 收藏
  • 关注

原创 C语言-头插法-尾插法建单链表

C语言单链表1、单链表定义链表是通过一组任意的存储单元来存储线性表中的数据元素,这些存储单元可以是连续的也可以是不连续的。为了建立起数据元素之间的关系,对于每个数据元素除了存放数据元素自身的信息外,还必须有包含的指示该元素直接后继元素存储位置的信息,这两部分信息组成一个结点,即每个结点都有至少包括两个域,一个域存储数据元素信息,称为数据域,另...

2020-02-19 11:20:20 6162 6

原创 python实现居中的杨辉三角

先来看一下普通的杨辉三角,代码和输出是长成这样def YangHui(n): print([1]) line = [1,1] for i in range(2,n): r = [] for j in range(0,len(line) - 1): r.append(line[j] + line[j + 1]...

2019-11-01 17:58:39 7714 4

原创 AI工程师在linux上常用命令集合

AI工程师在linux上面的常用命令

2022-09-17 10:11:21 705 1

原创 python实现后台启动命令,并实时监控输入输出写入到日志文件中

python实现后台启动命令,并实时写入日志文件中

2022-09-17 09:47:20 1299 1

原创 python 通用函数 持续更新(1、判断文件夹是否存在,不存在则新建 2、递归列出某文件夹底下所有固定格式结尾的文件 3、加载yml文件...)

1、接收文件夹路径,如果不存在则新建2、接收文件路径,递归列出底下所有固定格式结尾的文件3、接收yml文件路径,读取该yml文件,返回字典格式4、判断是否为文件 5、判断是否为tar.gz文件 6、解压tar.gz文件 到目标文件夹下面7、将path_read目录下面的文件复制到path_write目录下面,保留path_read的目录结构8、删除给定目录...

2022-07-06 11:46:14 258

翻译 rasa 以知识图谱为基础的action

本文翻译自:https://rasa.com/docs/action-server/knowledge-bases仅供学习参考。1、为什么要引入知识图谱?答曰:在对话中,用户的输入并不总是某些对象的名字,而是用第几个或者它之类的引用话术,那么我们就需要跟踪这些对象信息,以便解析为用户所理解的正确对象;并且用户还可能希望在对话中获得对象的详细的信息,比如《黑客帝国》的主演有谁?那么由于对象的信息非常多变,如果采取硬编码工程量太大,所以rasa提供了集成知识库来应对此挑战;要使用此集成,可以创建从Ac

2021-07-02 16:23:56 1469

原创 Ubuntu 操作记录5-14

仅做记录,仅作记录究其原因,yum是基于Python2.x写的,但是安装了Python3.x以后将软连接指向了3.x,所以报错。修复:安装Python2.7.2以后是新的错误没有rpm模块ubuntu一般用apt-get,不用yumubuntu的软连接一般放在/usr/bin下面,注意修改前最好备份一般在linux上面修改东西,不要用rm -rf, 宁愿改名,否则难以恢复cuda & python安装在/usr/local系统文件/etc/profile,修改这里的应用到全局

2021-05-14 15:22:46 95

原创 conda删除虚拟环境

上午查了许多方法都是conda remove -n your_env_name --all反正我是都不成功后面改成> conda env remove --name your_env_name遂成功

2021-04-14 17:21:28 122639 21

原创 vscode配置远程开发&免密登录

1、首先在本机安装ssh在cmd输入ssh,出现下面信息代表安装成功2、vscode安装 Remote - SSH 插件3、连接远程主机vscode点击左下角绿色的按钮选择Remote-SSH: Connect to Host… -> +Add New SSH Host…按照格式输入即可,@前面的是用户名,后面是主机的IP输入完,会弹出一个config的文件,它已经在本地的C:\Users\David.ssh下面创建了一个配置文件第一个host是本地窗口的名字,

2021-04-14 14:25:30 1217 4

原创 fastapi 上传excel文件并保存到本地

该方法的弊端:先要pd.read_excel后在pd.to_excel,如果excel文件过大则可能会消耗很多时间。'''上传&训练'''@router.post("/upload", summary = "上传数据文件,租户ID,模型ID")async def upload(tenantId : str, modelId : str, excel : UploadFile = File(...)): ''' 用户上传数据文件(excel),租户ID,还有模型ID\n

2021-04-07 10:05:57 1705 2

原创 FastAPI 返回图像

记录一下,我在网上找了好久都不太管用# 返回图片@app.post("/downloadfile2/")async def download_files_stream(): file_like = open('as.png', mode="rb") return StreamingResponse(file_like, media_type="image/jpg")

2021-02-22 16:55:31 5571 7

原创 neo4j安装算法插件-GDS

1、这里选用的是 Neo4j Graph Data Science 简称GDS2、Github 地址: https://github.com/neo4j/graph-data-science根据你所安装的neo4j版本选择对应的GDS版本为什么选用GDS ,因为Neo4j Graph Data Science是Neo4j官方提供的一套图算法库,它用来代替之前的Graph Algorithm算法库,适合Neo4j 4.0以上版本使用。并且是一直有人在维护,更新安装1、下载好对应版本的jar包以

2021-01-27 15:23:55 3414 1

原创 neo4j-admin import

1、数据源csv,数据库是没有用过的,或者是空的2、3、节点文件文件可以有ID和LABEL作为属性如果要通过import来创建关系,每个节点必须有一个唯一的ID , ID将会在创建关系时中找到适合的节点4、Example电影节点第一列movieId:ID是唯一标识,后面要用来创建关系最后一列的:LABEL是创建标签,多个用:分隔演员节点第一列也是unique的,后面创建关系的时候会用上最后一个存关系的csv第一个:START_ID用来匹配起点,:END_ID匹配终点

2021-01-27 15:01:21 1324

原创 docker打包Python项目

前期准备:·docker·Python步骤:1、项目结构如下docker_test├── Dockerfile├── myapps│ └── hello_world.py└── requirements.txtrequirements.txt是Python运行环境配置,可以在你当前目录下键入:pip freeze > requirements.txt即可导出相关库的信息myapps里面放你的程序我这里演示导入了numpy和pandas,如果能成功运行代表镜像创建成功,并

2020-12-08 18:11:01 3899 1

原创 python深度学习-电影评论分类:二分类问题

1、加载IMDB数据集使用IMDB数据集,包含50000条严重两极分化的评论。下面的代码会加载IMDB数据集(第一次运行时会下载大约80mb的数据,所以会有一些慢)from keras.datasets import imdb# num_wwords = 10000 保留训练数据中前10000个最常出现的单词 (train_data,train_labels),(test_data,test_labels) = imdb.load_data(num_words = 10000)prin

2020-10-24 10:55:50 885 4

原创 KMeans聚类python编程实现

Kmeans算法介绍基本原理伪代码聚类结果评估编程实现封装,KMeansCluster_Class.py# -*- coding: utf-8 -*-"""Created on Mon May 4 16:26:05 2020@author: Hja@Company:北京师范大学珠海分校@version: V1.0@contact: [email protected] 2018--2020@software: Spyder@file: KMeansClust..

2020-06-02 10:32:38 1219 7

原创 python编程实现贝叶斯分类

贝叶斯的思想比较简单,网上阐述也很详细,这里就不赘述了。这里只是简单的说一下编程的思路首先明确我们要实验的内容,实现贝叶斯分类,那么要想编程实现,你必须对贝叶斯分类有足够的了解。而贝叶斯分类的过程并不难,总的来说就是,有了一些训练数据,当来了一条测试数据,首先根据训练数据计算先验概率,比如有17条训练数据,8条好瓜,9条坏瓜,那么P(好瓜) = 8 / 17,坏瓜以此类推。紧接着计算后验概率...

2020-05-04 11:43:22 5579

原创 python爬虫实战-bs4爬取2345电影

抓取的原理也比较简单,不过多解释了,代码注释的也比较清楚参考: Python网络爬虫实战(第二版)# -*- coding: utf-8 -*-"""Created on Thu Apr 16 14:20:20 2020@author: hja"""from bs4 import BeautifulSoupimport urllib.requestimport codecs...

2020-04-23 15:09:34 1944 3

原创 Python实现knn

以前使用knn都是调用sklearn包里面的程序,这次自己尝试编写一下程序,如果有不足之处还望大家指点~首先knn的原理其实很简单,先给模型训练数据,接着来一条测试数据,就去与所有训练数据计算距离,选出距离最小的k条(k近邻,k最好为奇数,避免不好决策的问题),看这k条数据最多的类标,然后将测试数据的类标取为该类标。废话不多说,直接上代码,注解都写得十分清楚了# -*- coding: ut...

2020-04-14 14:52:28 577

原创 修改hadoop临时文件目录

这个/export/servers/hadoop-2.7.4是hadoop的安装目录

2020-04-08 17:07:50 770

原创 西瓜书-模型评估与选择Friedman检验python实现

冗长的定义。。计算Tf的函数在最底下,目前只实现了计算Tf,后续的有时间补上import numpy as npdata = np.array([[1,2,3],[1,2.5,2.5],[1,2,3],[1,2,3]])#书上的数据def Friedman(n,k,data_matrix): ''' Friedman检验 参数:数据集个数n, 算法种数k,...

2020-03-22 22:06:41 4539 1

原创 anaconda 添加清华镜像 pip的时候出现Retrying

第一步:打开anaconda Prompt输入conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/con...

2020-03-01 23:09:10 479

原创 C语言-指针与数组

前面已经介绍了指针的基本知识,现在我们将指针与数组结合起来运用。我们都知道,C语言中定义的数组,在内存中的地址是连续的,比如定义了一个数组int a[5]那么a[5]的首地址可以用a或者&a[0]表示如果我们创建一个指针p,并将p指向数组a的首地址int *p;p=&a[0];//数组a的首地址为&a[0]或a,将p指向数组a的首地址 那么接下来要对数组a...

2020-02-17 10:51:25 378

原创 C语言-指针初识

有人说:指针是C语言最大的优势之一也有人说:指针是C语言的灵魂但总的来说,不掌握指针就是没有掌握C语言的精华。说了这么多废话,我们来看看指针到底是什么吧。指针的定义指针是一个值为内存地址的变量说说个人理解:其实指针也是一个变量,和你用int 定义一个变量a一样,都只是一个变量。说到这里就要提一下,C语言的变量和python的变量在内存中的存储方式不一样。比如C语言中定义一个整型变量...

2020-02-13 19:54:17 177

原创 python编程-2.编写程序,输出所有由1,2,3,4这四个数字组成的素数,并且每个数字在素数中只出现一次。

#data用于存储在一定范围内的素数data = set()for n in range(1234,4321,1): if n % 2 ==0: continue for i in range(3,int(n ** 0.5) + 1,2): if n % i == 0: break else: da...

2020-01-05 22:39:23 12832

原创 python __name__属性的作用

我们通常在看别人写的py程序或者阅读其他的书籍,会在一段代码前面看到这么一行代码,那么这行代码到底有什么用?我分享一下我的看法。首先看书上的介绍:除了可以再开发环境或命令提示符环境中直接运行,任何python程序文件都可以作为模块导入并使用其中的对象,这也是实现代码复用的重要形式。通过python程序的__name__属性可以识别程序的使用方式,每个python脚本在运行时都会有一个__n...

2020-01-03 22:38:07 2577 1

原创 R语言学习-定义组合数函数

最近在写R语言期末报告的时候遇到一道写组合数函数的题目,还是挺有意思的,就跟大家分享一下,希望能对你有帮助~内容为两大部分,分别是阶乘组合数接下来看看题目要求在脑海里第一反应就是,先温习一下阶乘,是的,先把阶乘函数定义出来,组合数就很简单了。阶乘阶乘函数有很多种实现的办法,这里使用递归的方法实现函数就一个参数n,当n等于0或者等于1时,结果为1,当n小于0时,我们定义函数会报错。...

2019-12-19 17:00:21 2502

原创 python 机器学习 预处理和主成分分析(PCA)

预处理和主成分分析(PCA)目的:学会对数据进行预处理与缩放学会使用PCA进行降维初步了解相关参数要求:基于乳腺癌数据集完成以下任务:1、乳腺癌数据的特征值有多少?2、写出数据变换的一般步骤3、将数据进行StandardScale,MinMaxScaler和RobustScaer转换4、在第三步骤的基础上,选择两个主成分,三个主成分利用LinearSVC分别器,求不同情况下的...

2019-11-17 13:20:31 1538

原创 R语言学习记录-4

#估计二重积分f = function(x,y){ temp = exp( - (x + y)^2) return (temp)}mc2 = function(n,f){ x = runif(n) y = runif(n) sum(f(x,y))/n}#取1000个均匀随机数进行验证,可得mc2(1000,f)#计算二重积分(exp(4) - exp(3)) * (...

2019-11-14 15:10:52 1067

原创 python 类和实例

"""面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同。"""#通常,如果没有合适的继承类,就使用object类,这是所有类最终都会继承的类。class Student_1(object): passbart =...

2019-11-13 11:30:35 192

原创 python-机器学习-决策树实现

# -*- coding: utf-8 -*-"""Created on Sat Nov 9 10:42:38 2019@author: asus""""""决策树目的:1. 使用决策树模型2. 了解决策树模型的参数3. 初步了解调参数要求:基于乳腺癌数据集完成以下任务:1.调整参数criterion,使用不同算法信息熵(entropy)和基尼不纯度算法(gini)...

2019-11-09 15:04:12 656 1

原创 R语言学习记录-3

#最大值和最小值分布f1 = function(x)#串联系统{pg = pgamma(x,2,0.01)dg = dgamma(x,2,0.01)5 * dg * (1 - pg)^4}f2 = function(x)#并联系统{pg = pgamma(x,2,0.01)dg = dgamma(x,2,0.01)5 * dg * (pg)^4}G = function...

2019-11-07 15:13:00 332

原创 python实现猜数游戏

"""猜数游戏"""import randomdef CaiShu(): """猜数游戏""" num = random.randint(1,101)#生成随机数 count = 0#计数器,控制输入次数 print("[1,100] guess game, you have five chances") while True: ...

2019-11-04 20:29:59 824

原创 python递归调用实现整数的因数分解

# -*- coding: utf-8 -*-"""Created on Mon Oct 21 21:16:27 2019@author: asus""""""递归调用实现整数的因数分解"""##from random import randint#总的来说,else是for、while、try语句中‘没毛病’时才执行,#而在if..else语句中是if语句判断为假(有...

2019-11-01 09:00:28 2392

原创 requests爬虫实践:TOP250电影数据

# -*- coding: utf-8 -*-"""Created on Mon Oct 28 21:10:15 2019@author: asus""""""requests爬虫实践:TOP250电影数据"""#import save_data#自己编写的保存列表文件模块import requestsfrom bs4 import BeautifulSoupdef ...

2019-11-01 08:57:02 246

原创 R语言学习记录-2

#学习如何构造R函数#难度提升#构造统计分布#避免命名冲突#例如,定义函数f01为参数为a的指数分布的密度函数,#定义f02为该指数分布的分布函数,取a=1/5,进行计算,#可以看出,三种计算结果基本一致.f01 = function(x,a){a * exp(-a * x)}f01(5,1/5)f02 = function(x,a){1 - exp(-a * x)}c = 3...

2019-10-31 15:07:24 238 1

原创 在Anaconda中下载安装工具包

如题,如果你只是在cmd的窗口下载安装了工具包,在anaconda中要修改搜索路径才能使用你安装的工具包,那么如何直接在anaconda中安装工具包呢?比方说,要安装Scrapy这个包,输入:pip install Scrapy检查conda中有没有这个工具包可以输入:conda list Scrapy显示这个即代表安装成功要查看conda中的所有工具包,输入:conda ...

2019-10-20 10:30:55 1415 1

原创 R语言学习记录-1

#导入数据,path为路径path = 'C:\\Users\\Administrator\\Desktop\\Demo.csv'data = read.csv(path,header = T)head(data)summary(data)apply(data,2,sum)apply(data,2,var)attach(data)#将每一列赋给一个向量,向量名为列名Adetach...

2019-10-17 14:52:45 428

原创 python之关键字in作用在字典与集合时比作用在列表快的多

如题测试代码如下import randomimport time#创建列表x1 = list(range(10000))#创建元组x2 = tuple(range(10000))#创建集合x3 = set(range(10000))#创建字典x4 = dict(zip(range(10000),range(10000)))#创建一个0-9999的随机数r = random...

2019-10-12 12:28:34 1507 2

原创 Spyder中导入新安装的模块

最近在学习遗传算法,用到了国内某大学研发的工具包geatpy,在Idle中可以正常导入此模块,但是在Spyder中一导入就报错,是Spyder搜索路径的问题。那么怎么办呢?下面以我要导入的geatpy为例子首先要知道安装好的geatpy路径,win + R输入cmd,输入python,再导入geatpy,导入后再输入geatpy.__path__就可以看到该工具包的路径,接着打开S...

2019-10-04 11:32:00 6261

基于Python的红楼梦文本分析.zip

stopwords-master:停用词 Dream_of_the_Red_Kmeans.py :基于python实现红楼梦聚类分析的主程序 Dream_of_the_Red_Mansion.txt : 红楼梦txt KMeansCluster_Class.py :自己编写的KMeans程序 Red_Mansion_Dictionary.txt : 红楼梦人物名,辅助分词

2020-05-20

数据挖掘—ID3算法实现

ID3算法最早是由罗斯昆(J. Ross Quinlan)于1975年在悉尼大学提出的一种分类预测算法,算法的核心是“信息熵”。ID3算法通过计算每个属性的信息增益,认为信息增益高的是好属性,每次划分选取信息增益最高的属性为划分标准,重复这个过程,直至生成一个能完美分类训练样例的决策树。 决策树是对数据进行分类,以此达到预测的目的。该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。 决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决策结点代表一个问题或决策,通常对应于待分类对象的属性。每一个叶子结点代表一种可能的分类结果。沿决策树从上到下遍历的过程中,在每个结点都会遇到一个测试,对每个结点上问题的不同的测试输出导致不同的分支,最后会到达一个叶子结点,这个过程就是利用决策树进行分类的过程,利用若干个变量来判断所属的类别。

2019-11-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除