自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 问答 (5)
  • 收藏
  • 关注

原创 箱线图画法详解:颜色、标签、大小等

一、定义箱线图,又称箱型图或盒式图。包含了统计学中的分位数、均值、极值等统计量,不仅能够分析不同类别数据的平均水平差异,还能揭示数据离散程度、异常值、分布差异等。二、输入输入是列表形式的数据,以下是我的输入,也可以自己定义或用random随机生成。import csvimport pandas as pdimport matplotlib.pyplot as pltfile_in = open('D:/emotion_analysis_data/cleaned/vs_box.csv', '

2021-03-24 10:44:33 16673

原创 最全数据集:NLP、物体检测、图像识别等

一、只要注册并登录即可下载各个领域的数据集人工智能数据集:物体检测、图像识别等多领域二、NLP数据集:该NLP项目包含情感分析、文本分类、文本分配、文本摘要、机器翻译、等 10 大类一百多个数据集。地址:GitHub地址...

2021-03-16 14:24:09 344

原创 除了缺少点创意,GPT-3 写出了及格的大学毕业论文,只需 20 分钟

除了缺少点创意,GPT-3 写出了及格的大学毕业论文,只需 20 分钟

2021-03-12 17:35:09 365

原创 ‘utf-8‘ codec can‘t decode bytes in position 4093-4094: unexpected end of data

在使用input函数输入时,遇上报错’utf-8’ codec can’t decode bytes in position 4093-4094: unexpected end of data试过网上很多解决方法都不行,最后只能用try捕捉异常跳过。发生此错误的原因,可能是和文本内容有关,最好的解释可以参考:转载...

2021-03-12 17:12:49 1089

原创 从文本合成图像

OpenAI祭出120亿参数魔法模型!从文本合成图像栩栩如生,仿佛拥有人类的语言想象力

2021-03-12 16:35:43 175

原创 各类资源积累

丰富预训练模型和算法涵盖CV、NLP、Audio、Video主流四大品类,支持一键预测、一键服务化部署和快速迁移学习语音合成(文本转语音)link:papercode:code语音识别(语音转文本)1.https://blog.csdn.net/chengyq116/article/details/106577887https://github.com/gentaiscool/end2end-asr-pytorch2.https://blog.csdn.net/chinatelecom08/

2020-12-03 10:08:39 165

原创 常用功能代码记录

常用功能代码记录人民币大写转阿拉伯数字阿拉伯数字转成大写人民币判断8位数字字符串是否为合法的日期格式阿拉伯数字转成中文数字(10以内,非人民币)求最大、最小日期:['20181229', '20211229', '32101123']纠正字符,变成正确的想要的字符,例如把'E'变成原本的'三'人民币换成标准格式(12,555,000)判断各种字符所属类型(汉字、数字、字母、小写大写字母等)人民币大写转阿拉伯数字'''人民币大写转阿拉伯数字'''CNY_TABLE = {u'零': 0, u'壹'

2020-11-30 09:18:02 121

原创 超级棒的语义分割模型:在诸如证件分割、车牌分割上小模型表现效果已经够用

U2NET最近做项目遇到的超级棒的语义分割模型!附预训练模型在诸如证件分割、车牌分割上小模型表现效果已经够用

2020-10-09 17:33:32 284

转载 5个NLP代码库

来源于:每个人都应该知道的5个NLP代码库1. SpacyspaCy 是Python中比较出名,专门用于自然语言处理的库。它有助于实现最先进的效率和敏捷性,并拥有活跃的开源组织积极贡献代码。加分项:与所有主要的深度学习框架很好地结合,并预装了一些出色且有用的语言模型由于Cython支持,速度相对较快使用spaCy最适合做的事情词性(POS)标注:这是给单词标记制定语法属性(例如名词,动词,形容词,副词等)过程。实体识别:将文本中发现的命名实体标记到预定义实体类型。依存分析:分配语法依

2020-09-25 14:34:37 502

原创 NLP

语音合成(文本转语音)title:High Fidelity Speech Synthesis with Adversarial Networkslink:https://openreview.net/pdf?id=r1gfQgSFDrcode:https://github.com/mbinkowski/DeepSpeechDistances

2020-08-21 16:50:06 190

原创 OCR识别、场景文字识别、票据账单识别

场景识别,OCR识别EasyOCR: 支持40+语言的OCR模块 可以用来识别银行账单

2020-07-30 17:49:08 808

原创 4行Python代码实时获取股市数据

https://mp.weixin.qq.com/s/g3QrGnU8F3WygJJw0wl2iA

2020-07-15 17:48:14 363

原创 横向切割图片,并识别

横向切割图片,再识别图片上的文字:''' 按行将图片横切成多张小图'''import cv2from PIL import Imagefrom crnn.crnn_torch import crnnOcr as crnnOcrim = cv2.imread("picture7.jpg")img_size = im.shapem = img_size[1] #读取图片的宽度n = img_size[0] #读取图片的高度print(m, n)w = m #

2020-05-27 17:51:15 704

原创 图像校正:霍夫直线校正

根据图片中的文字,将图片摆正''' 图片霍夫直线校正'''import cv2import mathimport numpy as npfrom scipy import ndimageimport imageiofilepath = './'img = cv2.imread('picture3_1.jpg')gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)edges = cv2.Canny(gray, 50, 150, apertu

2020-05-27 17:47:51 625

原创 获取图片像素

from PIL import Image########获取图片指定像素点的像素img = Image.open('cropped.jpg')size = img.sizew = size[0]h = size[1]img1 = Image.new('RGBA', (w, h), (255, 255, 255, 0))img2 = Image.new('RGBA', (w, h), (255, 255, 255, 0))# img1.show('img1')# img2.show('im

2020-05-22 15:43:58 314

原创 图片旋转不同角度;改变图片尺寸;两个向量之间的相似度;散点图

''' 图片旋转不同角度'''import cv2import imutilsimage = cv2.imread('D:\python course/tuxiangshibie\data/0.jpg')rotated = imutils.rotate(image, 180) # 图片旋转180度cv2.imwrite('D:\python course/tuxiangshi...

2020-03-26 10:37:42 740

原创 识别图片文本坐标;透视变换;输入点集坐标,输出凸包(最大多边形)顶点坐标

''' 识别图片文本坐标'''import cv2import pytesseractfrom pytesseract import Outputfrom PIL import Imagefrom PIL import ImageDrawfrom PIL import ImageFontimport numpy as npdef recoText(im): "...

2020-03-26 09:33:13 484

原创 图片人脸识别

参考了很多资料,自己改的,但是感觉人多的时候就不太准确,会持续优化。。。。。import cv2# 图片人脸识别face_patterns = cv2.CascadeClassifier('D:\python course/tuxiangshibie/venv\Lib\site-packages\cv2\data/haarcascade_frontalface_default.xml')s...

2020-03-26 09:24:20 450

原创 显示图片,识别图片上的文字,检测图像轮廓,识别验证码

一.显示图片import cv2img = cv2.imread('D:\python course/tuxiangshibie\data/3.jpeg')cv2.imshow('imshow', img)cv2.waitKey(0)cv2.destroyAllWindows()二.识别图片上的文字(中文英文数字)import pytesseractfrom PIL impor...

2020-03-17 11:02:22 382

原创 结巴分词

代码:import jiebatext = '我们在野生动物园玩'wordlist=jieba.lcut(text) # wordlist默认是列表形式print(wordlist)输出结果:

2020-03-06 15:57:03 125

原创 算法衡量指标

# 算法衡量指标from sklearn import metricsy_test = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2] # 真实标签predictions = [0, 0, 1, 1, 0, 0, 0, 0, 2, 0, 1, 1, 2, 1, 1, 2, 2, ...

2020-03-06 15:45:14 273

原创 navicat连接MYSQL之后的数据库操作

注:时隔多年没写SQL了,这次换了个软件学习,重温本科知识,感觉又学会了一个新的技能。点击查询,新建查询,写下语句CREATE DATABASE school,点击‘运行’按钮,就创建了名为school的数据库:对‘a’右键,点击最后一个‘刷新’,就可以看见名为‘school’的数据库了:双击school就可以开始对该数据库进行操作了。1、创建学生表(student),并将学号设为主键...

2019-10-12 21:22:47 1030

原创 数据规范化

数据规范化主要有三种,原理参见https://blog.csdn.net/qq_18888869/article/details/83898566代码必须用print输出,否则看不到结果:import pandas as pdimport numpy as npdatafile = 'D:\Python练习使用数据/normalization_data.xls'data = pd.rea...

2019-10-07 20:16:24 213

原创 数据相关性分析---菜式之间的相关性

挖掘菜品销售量之间的相关性可以得到不同菜品之间的关系,找出替补菜品、互补菜品或没有关系的菜品,为原材料采购提供参考。  例如,计算铁板酸菜豆腐与其他菜式的相关性系数。 代码:from __future__ import print_functionimport pandas as pdfood_sale = 'D:\Python练习使用数据/food_sale_all.xls'dat...

2019-10-06 17:52:27 2207 2

原创 用箱线图检测超市销售额数据异常值

画出箱线图并把异常值标注出来。代码:import pandas as pdsupermarket_sale = 'D:\Python练习使用数据\supermarket_sale.xls'data = pd.read_excel(supermarket_sale, index_col=u'日期')import matplotlib.pyplot as pltplt.rcParams...

2019-10-05 17:16:48 896

原创 用Python分析某超市日销售额,读取Excel表数据。

在Python的pandas库中,只需要读入数据,然后使用describe()函数就可以查看数据的基本情况了。import pandas as pdsupermarket_sale = 'D:\Python练习使用数据\supermarket_sale.xls'data = pd.read_excel(supermarket_sale, index_col=u'日期')print(len(...

2019-10-04 21:43:48 3187

原创 日常MATLAB、Python无聊画图,持续更新。。。

一号曲线图,代码:>> x=linspace(0,2*pi,30);>> y=sin(x);>> z=cos(x);>> plot(x,y,'r*',x,z,'b')>> legend('sin(x)','cos(x)');>> title('curve');

2019-10-04 15:16:51 189

原创 matplotlib画饼图

用Python的matplotlib画饼图:代码:#饼图:超市主要商品本月销售量import matplotlib.pyplot as pltplt.title('Sales of major commodities in supermarkets for this month')labels = 'Noodles', 'Milk', 'Biscuits', 'Chocolates'...

2019-10-03 21:02:49 260

原创 简单选择排序

简单选择排序法(Simple Selection Sort)就是通过n-i 次关键字之间的比较,从n-i +1个记录中选出关键字最小的记录,并和第i个记录交换。代码:def simpleSelection_sort(alist): n = len(alist) for i in range(n-1): min = i for j in range...

2019-10-02 20:22:43 88

原创 冒泡排序

步骤:1.从头开始,比较相邻两个数的大小,如果前面的数大于后面的数就交换位置 2.重复第1个步骤,直到没有数值交换,数列从小到大排序。代码:# 冒泡排序算法(升序排列)def bubble_sort(alist): n = len(alist) for i in range(n-1): for j in range(n-1-i)...

2019-09-26 17:32:23 68

原创 二分查找的递归实现

代码如下:def binary_search(alist, item): """二分查找 非递归方式""" n = len(alist) start = 0 end = n - 1 while start <= end: mid = (start + end) // 2 if alist[mid] == item: ...

2019-09-22 14:52:38 394

原创 二叉树的遍历

用自己的语言总结二叉树遍历的过程。假设我们有这样一棵二叉树:前序遍历:先根,再左子树,最后右子树;先把左子树所有左节点遍历下去,对每个节点都是先遍历根,再左,最后右;对右子树重复第2步骤。因此,上图前序遍历过程为:ABDHKE,此时左子树遍历完毕,跳到右子树C,CFIGJ,即前序遍历结果是 ABDHKECFIGJ。中序遍历:从最后一层开始,按照 左——>中——>...

2019-09-19 20:54:37 154

原创 用MATLAB将数据转成矩阵进行运算

数据转换成矩阵:原始数据格式:共有195个节点,两个节点之间有连接就令其等于1,否则等于0.转换成矩阵:代码如下:G=sparse(G(:,1),G(:,2),ones(m,1));是统计原始数据中有连接的节点,并令其值等于1.A=full(G);转换成方阵(邻接矩阵):...

2019-09-17 10:20:22 18683 5

原创 用递归方式实现斐波那契数列,并打印出来

用列表的方式存储该数列代码:list =[]for i in range(20):if i == 0 :list.append(0)elif i == 1 :list.append(1)else:list.append(list[i-2]+list[i-1])print(list)测试结果:

2019-09-10 16:21:36 1543 2

原创 求两数之和

x_str = input(‘请输入x的值:’)y_str = input(‘请输入y的值:’)#将字符串转换为数值x = eval(x_str)y = eval(y_str)sum = x + y;print(“两数之和为:”, sum)

2019-09-08 21:12:40 102

原创 使用turtle库绘制分形树、太阳花、五角星

1.太阳花的绘制import turtleturtle.pencolor(‘red’) # 画笔颜色turtle.fillcolor(‘yellow’) # 填充颜色turtle.begin_fill() # 准备开始填充图形for _ in range(50): # 画笔画了50次turtle.forward(200)turtle.left(170)turtle.end_...

2019-09-07 20:11:43 3306

原创 每日一练:实现 pow(x, n) ,即计算 x 的 n 次幂函数。

题目:实现 pow(x, n) ,即计算 x 的 n 次幂函数。代码:import mathx_str = input(‘请输入x的值:’)x = eval(x_str)n_str = input(‘请输入n的值:’)n = eval(n_str)a = math.pow(x, n)print(“输出结果为:”, a)以上代码实现于Python3.6版本,eval()的作用是将字...

2019-09-04 21:22:04 1632

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除