3 小白Jiang

尚未进行身份认证

暂无相关简介

等级
TA的排名 18w+

c#写一个识别扫描版pdf表格的程序,并把结果excel下载下来

需求:识别扫描版pdf中表格数据实现:调用百度OCR识别pdf中表格,然后把百度OCR识别好的结果excel下载下来,①就是两个函数,一个函数就是获得调用百度OCR,获得excel结果url,②用c#下载excel文件的接口获得excel文件;(其中新建项目,请看这篇文章:里面有新建项目)代码:using System;using System.IO;using System.Net...

2020-01-13 17:21:50

c#调用百度API识别表格,提取返回的json结果

最近要用c#写一个识别pdf扫描版里面表格,发现百度OCR识别表格还可以,下面介绍主要程序。(pdf扫描版我用python写的程序先改成png图片格式,之前我文章有完整代码)实现:①新建一个项目,因为我们这里是跑程序,就直接新建控制台(后期写成Addin做成word插件再改),然后下一步。②主要代码:下面是介绍百度OCR识别表格怎么调用的,以及c#怎么提取json数据using Syst...

2020-01-13 16:45:27

私人

import pandas as pdimport numpy as npimport requestsimport timefrom user_agent import getheadersimport urllib3urllib3.disable_warnings()class Add_Fresh(): def __init__(self,url): ...

2020-01-12 19:19:20

爬取西祠免费ip代理(随机请求头),保存到csv文件

python -V 3.7简介:python爬取免费IP代理,写成一个function函数。代码:# -*-coding:utf-8 -*-#作者:小白jiang#联系:bk_jiang@163.com#csdn:https://blog.csdn.net/weixin_37413070import requestsfrom lxml import etreefrom us...

2020-01-12 15:47:41

力扣 15题——三数之和,思路

力扣 15题——三数之和给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。注意:答案中不可以包含重复的三元组。例如, 给定数组 nums = [-1, 0, 1, 2, -1, -4],满足要求的三元组集合为:[ [-1, 0, 1], [-1, -1, 2]]...

2020-01-09 10:19:31

python中使用opencv对图片进行二值化处理,并保存图片

对图片进行二值化处理,并把数组保存成图片作者:小白jiangpython -V 3.7使用opencv的cv2Python: cv2.threshold(src, thresh, maxval, type[, dst]) → retval, dstsrc:是图片源thresh:是阈值type:表示的是这里划分的时候,用的什么算法,下面代码中使用的THRESH_BINARY的意思是:...

2020-01-05 17:53:27

图片中像素均值的概念,去均值的作用

作者:小白jiang像素均值:就是把所有通道(R、G、B)的像素求了均值。去均值的作用:把图片上每个位置的值减去均值,可以一定程度上移除它们共同的部分,凸显个性的部分,更有利于图片的处理。下图可以很明显看出去均值后的变化。...

2020-01-05 16:02:05

python中写计时器函数,可以用作其它函数的装饰器

python -V 3.7计时器函数import timedef cal_time(func): def wraper(*args,**kwargs): t1 = time.time() result = func(*args,**kwargs) t2 = time.time() print('%s running time %s second' % (func.__na...

2020-01-04 22:37:58

python中闭包是什么,1分钟带你理解

python -V 3.6闭包概念:在一个外函数中定义了一个内函数,内函数里运用了外函数的临时变量,并且外函数的返回值是内函数的引用。代码1:def outer( a ): b = 10 # inner是内函数 def inner(): #在内函数中 用到了外函数的临时变量 print(a+b) # 外函数的返回值是内函数的引用 return inner...

2020-01-04 22:19:31

python分割pdf文档

python -V 3.7需求需要将一个pdf文档分割成一页一页的pdf代码可以使用PyPDF2库from PyPDF2 import PdfFileReader, PdfFileWriterimport osdef split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param out_...

2020-01-04 13:51:43

python将pdf文档转为png图片

python -V 3需求五个pdf文档需要都转成png格式图片代码可以使用PyMuPDF库逻辑:1、首先读取一个文件夹下面的所有pdf文档2、然后对这些pdf文档一个一个的进行pdf转png,一页pdf转为一个png图片,一个pdf文档转成的所有png图片存在一个文件夹下面import fitzimport osdef f(position): name = os....

2020-01-04 13:44:37

pandas实战二、字典格式数据转成DataFrame格式(有行名、有列名)

pandas -V 0.25.11、需求在用python识别PDF文件、提取数据的时候,得到一组字典数据,为了更方便的保存,把字典数据转化成DataFrame格式(有行名、有列名)。数据dict1 = {'报告1': ['a', 'b', 'c', '13', 'd', '2018-05-11'], '报告2': ['f', 'g', 'h', '13', 'j', '2018-05...

2019-12-31 14:10:55

pandas实战一、字典格式数据转成DataFrame格式(有列名)

pandas -V 0.25.1

2019-12-31 14:02:46

七、pandas学习,pandas画图

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.0matplotlib -V 3.1.2import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# 随机生成1000个数据data = pd.Series(np.random.randn(1000), index...

2019-12-27 14:20:11

六、pandas学习,合并数据,用concat()、append()

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.01、DataFrame纵向合并,pd.concat()# 数据的合并处理,用concatimport pandas as pdimport numpy as np# 定义资料集df1 = pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c'...

2019-12-27 14:15:35

五、pandas学习,读取csv数据,资料存取成pickle,读取pickle数据

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.01、读取csv,用pd.read_csv()import pandas as pdimport numpy as npdata = pd.read_csv('student.csv')print(data)2、将资料存取成pickle(df.to_pickle()),读取pickle数据...

2019-12-27 13:57:15

四、pandas学习,处理丢失数据,删除空数据,替换空数据,判读是否存在空数据

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.0生成假数据import pandas as pdimport numpy as np# 处理丢失数据#创建DataFramedates = pd.date_range('20191227',periods=6)df = pd.DataFrame(np.arange(24).reshap...

2019-12-27 13:50:01

三、pandas学习,DataFrame数据,修改指定位置值,根据条件修改值,添加新列

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.01、指定位置修改值import numpy as npimport pandas as pd# 创建pandas的DataFramedates = pd.date_range('20191227','6')df = pd.DataFrame(np.arange(24).reshape((6...

2019-12-27 13:32:02

二、pandas学习,pandas的DataFrame提取数据,loc、iloc、ix使用,判断提取数据,获得DataFrame某列数据

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.01、生成DataFrameimport pandas as pdimport numpy as np# 生成DatetimeIndexdates = pd.date_range('20191227',periods=6)df = pd.DataFrame(np.arange(24).re...

2019-12-27 13:20:25

一、pandas学习,pandas与numpy区别,pandas两个数据结构,Series和DataFrame,DataFrame取值、查看索引、数据总结、转置、排序

pandas -V 0.25.3numpy -V 1.17.4python -V 3.8.01、pandas与numpy的区别如果说numpy是列表形式的,没有数值标签;但是pandas就可以说是字典形式的,有数值标签;pandas是基于numpy构建的,让numpy为中心的应用变得更简单。2、pandas两个数据结构pandas主要有两个数据结构:Series和DataFram...

2019-12-27 12:56:05

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。