迷茫小码农-CSDN博客

原创 python包导入规范

python包导入规范1 单行导入eg: import os impor sys2导入总应该放在文件顶部, 位于模块注释和文档字符串之后, 模块全局变量和常量之前. 导入应该按照从最通用到最不通用的顺序分组:标准库导入第三方库导入应用程序指定导入每种分组中, 应该根据每个模块的完整包路径按字典序排序, 忽略大小写.import foofrom foo import bar...

2019-08-01 10:45:30 1041

原创 Python程序重复执行方法

###方法一：报错后，重新启动.py文件，继续执行 while 1: run_ticker = 'python ticker.py' run_depth = 'python depth.py' run_depth_pct = 'python depth_pct.py' run_trade = 'python trade.py...

2019-08-01 10:44:15 38302 2

原创将pandas.Dataframe转化为字典格式的两种方法

将pandas.Dataframe转化为字典格式的两种方法da = df.to_dict(orient='records')das = df.to_json(orient='records')

2019-07-26 18:29:06 38005

原创解决ubuntu环境依赖问题 sudo apt install -f

更改Ubuntu系统中默认的Python版本sudo update-alternatives --install /usr/bin/python python /usr/bin/python3.6 2

2019-07-26 18:27:54 2552

原创解决ubuntu环境依赖问题

解决ubuntu环境依赖问题sudo apt install -f

2019-07-26 18:26:35 2166

原创 ubuntu优化问题更改分辨率

1，选好自己适合分辨率，比如我的是1440×900, 终端运行：cvt 1440 900输出：1440x900 59.89 Hz (CVT 1.30MA) hsync: 55.93 kHz; pclk: 106.50 MHzModeline "1440x900_60.00" 106.50 1440 1528 1672 1904 900 903 909 934 -hsync +vsyn...

2019-07-26 18:06:11 336

原创几个主流排序方法(冒泡、选择、插入、快排、希尔、归并)Python实现

冒泡排序 Bubble sort选择排序 Selection sort插入排序 Insertion sort快速排序 Quick sort希尔排序 Shell sort归并排序 Merge sort

2019-04-07 22:40:39 172

原创 odoo 模块(留言标签用户分类任务状态栏)

注意.xml中ID不用.留言模块view/views.xml <div class="oe_chatter"> <field name="message_follower_ids" widget="mail_followers" groups="base.group_user"/> <field name=&quo

2018-10-28 22:19:57 724

原创 odoo 安装

install pip3sudo apt-get updatesudo apt-get install python3-pipinstall odoo configpip3 install requirements.txt pip3 install -r requirements.txtinstall psqlapt-get install postgresql postgres...

2018-10-28 22:10:29 604

原创 python文本信息对比

使用python实现对两个文本信息的对比，查看文本更新、差异import difflibtext1 = """ """text2 = """ """text1_lines = text1.splitlines()text2_lines = text2.splitlines()d = difflib.Differ()diff = d.compare(text1_lines

2018-10-17 10:51:55 9650 2

原创解决pip不能使用的问题

在Ubuntu环境下，之前pip还可以使用，突然就开始报错试了很多方法,最终这样解决的wget https://bootstrap.pypa.io/get-pip.pysudo python get-pip.py

2018-09-17 16:08:08 2336

原创图表

from pyecharts import Pieattr = ['one', 'two', 'three', 'four']v1 = [11,12,34,20]pie = Pie("饼状图")pie.add('',attr,v1,is_label_show=True)pie.render()from pyecharts import Barbar = Bar("柱状图",...

2018-07-19 12:16:34 140

原创文件打包

打包zipdata = 'zip'zip_name = date + '.zip'zf = zipfile.ZipFile(zip_name, mode='w')try: zf.write(csv_name)finally: zf.close()#mode = w:gz 压缩大小

2018-07-18 12:17:44 108

原创获取时间

获取当天的日期today_date = datetime.date.today().strftime('%Y%m%d')获取当日00点的时间date = time.strftime('%Y%m%d')now_time = time.time()now_tm = time.localtime(now_time)zero_time = now_time - (now_tm.tm_s...

2018-07-18 12:15:01 123

原创文件内容合并

文件内容合并import osmeragefiledir = os.getcwd() + '/smt-btc'filenames = os.listdir(meragefiledir)file = open('result.csv', 'w')for filename in filenames: filepath = meragefiledir + '/' + filena...

2018-07-18 12:07:17 396

原创时间戳时间转换

１３位时间格式戳转换i = 1531271084284timeStamp = float(i/1000)timeArray = time.localtime(timeStamp)otherStyleTime = time.strftime("%Y-%m-%d %H:%M:%S", timeArray)print(otherStyleTime)

2018-07-18 12:04:16 408

原创常用激活函数图像

激励函数有很多, 不过我们平时要用到的就这几个. relu, sigmoid, tanh, softplus.import torchimport torch.nn.functional as F # 激励函数都在这from torch.autograd import Variable# 做一些假数据来观看图像x = torch.linspace(-5, 5, 200) #...

2018-05-31 13:16:08 9423

原创 influxdb数据库备份

启动数据库service influxdb start service influxdb status开启服务端influxd开启客户端influx创建数据库create database “db_name”显示所有的数据库show databases删除数据库drop database “db_name”使用数据库us...

2018-05-28 10:52:24 1798

原创 PDF 文字识别网站

https://convertio.co/zh/https://www.onlineocr.net/http://www.imagetotxt.com/

2018-05-28 10:47:54 4425 2

原创 git仓库配置方法

gitlab1 安装git2 输入邮箱生成秘钥ssh-keygen -t rsa -b 4096 -C "[email protected]"3复制秘钥提交给网站（settings/ssh keys）中4在本地创建文件夹及目录路径（以后文件存放的地方）5到网站复制项目ssh6 cd到文件夹该下7 git clone +SSH...

2018-04-08 16:14:43 1151

单个特征归一化归一化首先在特征（维度）非常多的时候，可以防止某一维或某几维对数据影响过大，也是为了把不同来源的数据统一到一个参考区间下，这样比较起来才有意义，其次可以程序可以运行更快。例如：一个人的身高和体重两个特征，假如体重50kg，身高175cm,由于两个单位不一样，数值大小不一样。如果比较两个人的体型差距时，那么身高的影响结果会比较大，k-临近算法会有这个距离公式。min-max方法常用的方

2017-12-23 17:27:25 1199

原创机器学习sklearn —数据类型和文本特征抽取

sklearn与特征工程数据的来源与类型来源大部分数据来源于已有的数据库、与爬虫工程师的采集数据的类型按数据分类标称型：标称型目标变量的结果只在有限目标中取值（如真与假）主要用于分类数值型：数值型目标变量则可以从无限的数值集合中取值（如0.100 ，42.001）主要用于回归分析按数据的分布分类离散型：离散变量是指其数值只能用自然或整数单位计算的则为离散变量（班级人数）连续型：指在指定区

2017-12-23 15:00:36 3585

原创 pandas—DataFrame算数运算和数据对齐

DataFrame和Series对象之间的运算DataFrame和DataFrame对象之间的运算pandas能将两个数据结构的索引对齐，这可能是与pandas数据结构索引有关的最强大的功能。这一点尤其体现在数据结构之间的算数运算上.参与运算的两个数据结构，其索引顺序可能不一致，而且有的索引项可能只存在一个数据结构中.

2017-12-23 14:15:19 7914

原创 pandas—Dataframe操作（选取插入删除）

数据from pandas import DataFrame, Seriesimport pandas as pdimport numpy as npcontries = { '俄罗斯': {'2013': 10, '2014': 20, '2015': 30}, '阿富汗': {'2013': 12, '2014': 25, '2015': 33}, '新加坡': {'

2017-12-21 18:40:21 2246 1

原创 pandas—DataFrame创建

DataFrame创建通过列表创建DataFrame通过字典创建DataFrame通过Numpy数组创建DataFrameDataFrame这种列表式的数据结构和Excel工作表非常类似，其设计初衷是讲Series的使用场景由一维扩展到多维. DataFrame由按一定顺序的多列数据组成，各列的数据类型可以有所不同(数值、字符串、布尔值).Series对象的Index数组存放有每个元素的标签，

2017-12-21 18:09:49 32026

原创 pandas—Series操作

选取操作Series对象支持查询方式：位置下标标签索引切片索引布尔型索引from pandas import Seriesimport pandas as pdseries1 = Series([10, 20, 30, 40], index=list('abcd'))# 通过位置查询series1[2]# 通过标签索引查询series1['b']#

2017-12-21 17:50:47 16258

原创 pandas —Series创建和索引

Series对象本质上是一个NumPy的数组，因此NumPy的数组处理函数可以直接对Series进行处理。每个Series对象实际上都由两个数组组成，他们内部的结构很简单，由两个相互关联的数组组成，其中主数组用来存放数据。主数组的每个元素都有一个与之县关联的标签，这些标签存储在另外一个叫做Index的数组中注意三点：Series是一种类似于一维数组(ndarray)的对象.数组中可存储多种数据类型

2017-12-21 16:33:09 13032

原创 numpy数组运算

数组运算不需要循环即可对数据进行批量运算，叫做矢量化运算. 不同形状的数组之间的算数运算，叫做广播.import numpy as npndarray1 = np.array([1, 2, 3, 4, 5])ndarray2 = np.array([3, 4, 5, 6, 7])# 数组和数组之间的运算ndarray3 = ndarray1 * ndarray2ndarray4 = ndarr

2017-12-15 17:34:02 4634 1

原创 numpy数据类型

数据类型可以通过ndarray的dtype来打印数组中元素的类型例： ndarray1.dtypendarray常见的数据类型如下:例：import numpy as npndarray1 = np.array([1, 2, 3, 4])ndarray2 = np.array(list('abcdefg'))ndarray3 = np.array([True, False, False, T

2017-12-15 17:19:54 1965

原创 numpy数组的创建

创建数组创建ndarray创建数组最简单的方法就是使用array函数。它接收一切序列型的对象（包括其他数组），然后产生一个新的含有传入数据的Numpy数组。array函数创建数组import numpy as npndarray1 = np.array([1, 2, 3, 4])ndarray2 = np.array(list('abcdefg'))ndarray3 = np.array([[

2017-12-15 16:48:28 66292 3

原创使用scrapy中crawlspider爬取csdn文章

生成crawlspider命令：scrapy genspider -t crawl csdn "csdn.cn"在csdn_spider.pyimport scrapyfrom scrapy.linkextractors import LinkExtractorfrom scrapy.spiders import CrawlSpider, Ruleclass CsdnSpdierSpider

2017-11-06 22:24:58 495

转载 python | sklearn ，做一个调包侠来解决新闻文本分类问题

https://zhuanlan.zhihu.com/p/30455047?utm_medium=social&utm_source=qq本文介绍一下使用朴素贝叶斯算法来做文本分类任务。数据集是搜狗新闻数据集“corpus_6_4000”，它包含六大类新闻，每类新闻4000篇，每篇新闻长度在几百到几千字不等。六类新闻分别是'Auto', 'Culture', 'Economy'

2017-10-26 10:31:00 3834

转载 Hadoop中的Python框架的使用指南

adoop的数据流(streaming)是最快也是最透明的选项，而且最适合于文本处理。mrjob最适合于在Amazon EMR上快速工作，但是会有显著的性能损失。dumbo 对于大多数复杂的工作都很方便(对象作为键名(key))，但是仍然比数据流(streaming)要慢。请继续往下阅读，以了解实现细节，性能以及功能的比较。一个有趣的问题为了测试不同的框架，我们不会做“统计词数”的实验

2017-10-24 17:14:05 708

转载常见的七种Hadoop和Spark项目案例

如果您的Hadoop项目将有新的突破，那么它必定与下边介绍的七种常见项目很相像。有一句古老的格言是这样说的，如果你向某人提供你的全部支持和金融支持去做一些不同的和创新的事情，他们最终却会做别人正在做的事情。如比较火爆的Hadoop、Spark和Storm，每个人都认为他们正在做一些与这些新的大数据技术相关的事情，但它不需要很长的时间遇到相同的模式。具体的实施可能有所不同，但根据我的经验，它们是最常

2017-10-23 12:08:45 404

转载 TensorFlowOnSpark 源码解析

这两天琢磨了下spark-deep-learning和spark-sklearn两个项目，但是感觉都不尽人如意。在training时，都需要把数据broadcast到各个节点进行并行训练，基本就失去实用价值了（tranning数据都会大于单节点内存的好么），而且spark-deep-learning目前还没有实现和tf cluster的结合。所以这个时候转向了开源已久的yahoo的TensorFlo

2017-10-23 12:07:06 1208

转载大数据前景分析：Hadoop将被Spark替代？

谈到大数据，相信大家对Hadoop和Apache Spark这两个名字并不陌生。然而，最近业界有一些人正在大张旗鼓的宣扬Hadoop将死，Spark将立。他们究竟是危言耸听？哗众取宠？还是眼光独到堪破未来呢?与Hadoop相比，Spark技术如何?现工业界大数据技术都在使用何种技术?如果现在想要参加大数据培训的话，应该从哪一种开始呢? （1）先说二者之间的区别吧。首先，Hado

2017-10-23 11:41:17 269

原创 python 字典

字典字典key:value 键值对（无序）字典是另一种可变容器模型，且可存储任意类型对象键是唯一的值不必键必须是不可变的如：字符串数字元组字典创建info = {'name':'班长', 'id':100, 'sex':'f', 'address':'中国'}print(info['name'])print(info['address'])注：列表使用

2017-10-19 20:32:39 257

原创 python 列表元组

列表列表非常适合利用顺序和位置定义某一个元素，尤其是当元素的顺序或内容经常发生改变的时候。与字符串不同，列表中元素的值是可以修改的。我们可以直接对列表中进行添加新元素、删除元素、或覆盖已有的元素。列表的格式（列表元素可以是不同类型）namesList = ['xiaoWang','xiaoZhang','xiaoHua']使用[]获取元素和字符串一样，通过偏移量可以从列表中提取对应位置的元素。

2017-10-19 18:34:52 319

原创 python 字符串操作

字符串len() 获得长度 s1 = "abcde" print(len(s1))spli（）分割字符串专用s = "aa bb cc dd,ee"s2 = s.split(" ，") # split函数是string对象专有的print(s2)find（）从左向右找指定的字符在字符串的位置若不存在返回-1rfind() 从右向左 s = "acdf1

2017-10-19 17:58:50 267

翻译 linux下 mysql 主从配置

mysql服务器的主从配置，这样可以实现读写分离，也可以在主库挂掉后从备用库中恢复需要两台机器，安装mysql，两台机器要在相通的局域网内主机A: 192.168.1.100从机B:192.168.1.101可以有多台从机1、先登录主机 Amysql>GRANT REPLICATION SLAVE ON . TO ‘backup’@’192.168.1.101‘ IDENTIFIED BY ‘123

2017-10-19 09:35:03 346

Tensorflow手写字体识别入门

深度学习 Tensorflow实战Google深度学习框架

空空如也