自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 520表白——送她一片星空模拟

"""代码目标:模拟3D星空作者:xxx"""from turtle import *from random import random,randintscreen = Screen()width ,height = 1200,600 #画布长宽screen.setup(width,height) #输入宽和高为整数时, 表示像素; 为小数时, 表示占据电脑屏幕的比例screen.title("模拟3D星空-阿黎逸阳") #设置标题screen.

2020-05-23 11:25:04 472 1

原创 520表白——每天都是爱你的一天

# coding=utf-8 import turtlefrom datetime import * # 抬起画笔,向前运动一段距离放下def Skip(step): turtle.penup() turtle.forward(step) turtle.pendown() def mkHand(name, length): # 注册Turtle形状,建立表针Turtle turtle.reset() Skip(-length * 0.1.

2020-05-23 11:22:49 369

转载 卓越人生的两大利器——任务分解与保持节奏

总有人说,什么方法论啊,价值观啊,人生观啊,都是一些虚无缥缈的东西,与现实中的自己距离太远,而且都是一些“虚幻”的东西,不如谈谈具体的技术实在,比如说什么Spring Cloud啊、Docker啊、Kubernetes啊、Angular啊、Kafka啊,这些都是实打实的技术,掌握了就是掌握了,没掌握就是没掌握,来不得半点虚假。没错,上面所列举的技术都是一些硬实力,这些硬实力是确保你职场竞争力的...

2019-07-14 09:55:10 347

原创 视野

在这个信息时代,没有人的视野会受阻,人们最缺乏的并不是视野的广度,而是视野的深度。事实上,可以粗略的把人分为两类:追求低成本的快乐的人,追求深层次体验的人。如果只是想想,当然每个人都会说”我要过丰富的生活,有极致的体验“。但落实到你需要付出多少代价层面,其实大多数人的选择,是在“低成本”的前提下,过的还算开心就可以,甚至做不到,只要不太痛苦也能承受。只有少数人,会愿意为了深层次的人生体验付...

2019-05-01 16:20:23 373

转载 中国保险行业市场现状及发展空间分析

    保险行业市场现状    1、保险行业运营现状    近五年来,保险股大幅跑赢沪深 300 指数。保险 II 指数五年年化增长 29.5%, 大幅跑赢沪深 300 年化 11.3%的指数上涨。保险板块大幅跑赢大盘的背后是行业的高成长性且盈利模式逐步改善的反馈。保险行业从投资理财型保险的大幅扩张推动行业总资产,净资产的增长,到...

2018-12-28 18:02:21 4311

原创 SQL数据库优化

前言:随着数据库中数据量的增长,系统的响应速度就自然成为需要解决的主要问题之一。对于大量数据而言,优劣SQL语句的运算速度可以差别很多倍。例如,如果SQL语句的where子句中条件SQL不合理,结果就会造成优化器舍弃索引而使用全表扫描,性能自然降低。(编写SQL语句时,应清楚优化器根据何种原则来使用索引,这也为高性能的SQL提供指导。)SQL优化的一般原则:1.减少服务器资源的消耗。...

2018-11-17 22:16:51 341

原创 香蜜沉沉烬如霜视频评论抓取

腾讯视频评论以最近火热的电视剧<香蜜沉沉烬如霜>为例,用fiddler抓包分析爬取腾讯动态视频import urllib.requestimport revid='2942827004'cid='0'for i in range(0,100): #爬取100次翻页 try: print('.....正在输出第'+str(i+...

2018-09-18 23:20:20 594 2

原创 抢票软件项目开发

项目需求分析整个项目应实现:浏览器自动登录12306网站,查询余票,车票预订,到自动提交系统支付的功能。具体包括:登录界面的cookie处理(保持登录界面)、登录时的验证码处理、余票查询、提交订单等部分。分析:借助工具fiddler,作为整个数据传输的记录环节。整个登录环节包括六个部分的验证才能实现。用到的模块:urllib.request:获取网页re:正则ssl:提供ht...

2018-09-12 19:38:24 12268 2

原创 网页爬取的三种方式

 爬取的重点在于分析网页结构,以爬取淘宝网图片为例:爬取网页有三种方式:1.urllib.request2.封装Request请求3.urlretrieve直接写入硬盘下面以第三种方法爬取xxx图片代码如下:#爬取网页有三种方式:urllib.request,封装Request请求,urlretrieve直接写入硬盘,下面以第三种方法爬取xxx图片import urllib.r...

2018-09-10 20:13:44 3226

原创 数据分析岗位需求分析报告

1.前言2.用到的工具3.网页结构分析4.数据预处理5.数据分析岗位分布情况5.1公司的城市分布5.2公司的融资情况 5.3岗位福利状况 ​ 6.数据分析岗位的发展状况6.1各城市平均薪资待遇6.2不同融资阶段平均工资待遇7.数据分析师岗位招聘要求7.1统计量描述 7.2学历与职位需求7.3学历水平与工资7.4工作经验与职位需求7.5...

2018-09-05 18:09:09 14970 3

原创 数据分析在保险销售中的应用

从营销的角度看数据产生的价值。此部分报告是笔者曾经在新人班中,给新人做过的培训内容(产生一定的成效)。在此,作详细记录(考虑到部分敏感词汇,故而部分内容省略)。一、背景分析及问题提出1.背景分析2.问题提出二、用到的主要工具三、用户画像解读四、数据清洗1.用Excel对数据进行预处理2.查看是否存在缺失值 五、特征分析1.客户区域分布2.从手机号中提取运...

2018-08-31 16:36:19 8133 5

原创 XPath部分总结

关键词:网络采集数据,网页特定内容提取在网络爬虫中,对爬取到的数据进行筛选和提取的方式主要有两种:正则表达式和XPath,后者常用于scrapy框架中。定义:XPath是一种XML路径语言,通过该语言可以在XML文档中迅速地查询到相应的信息,XPath表达式通常叫做XPath selector。1."/" 表示从顶端开始寻找某个标签(多层标签的查找)以提取title标题为例:例如...

2018-08-29 19:34:09 274

原创 多线程爬虫

关键词:多条路径,并行结构,同时进行正常情况下,爬虫程序都是有执行的先后顺序的,执行流程都在一条线上,即所谓的单线程爬虫。相对应的,如果爬虫中的某部分程序可以并行执行,即在多条线上执行,则这种执行结构称为多线程结构(这里的多线程和Java等语言中的类似),对应的爬虫也称为多线程爬虫,。代码解读如下:#AB线程同时运行,时间上会减少import threadingclass A(t...

2018-08-29 19:31:10 335

原创 爬虫打破封禁的几种方法

写在前面的话:爬虫有风险,使用需谨慎(应当遵守行业道德及职业操守,遵守国家法律法规。以下内容均是在此前提下进行操作)反爬技术基本有:模拟登陆,模拟浏览器,代理服务器......文章在持续更新总结梳理中......1.代理服务器的设置目的:防止自有IP地址被屏蔽推荐免费的代理服务器列表:http://www.xicidaili.com/ 建立自定义函数,利用代理服务器爬取网页内容...

2018-08-24 22:25:25 856

原创 决策树算法及其应用案例

决策树算法主要分为三类:ID3、C4.5、CART算法以ID3算法为例:对上表某图书销量进行预测.思考:建立测试模型,各个变量数据权重?数据的转化?重点在于:计算各个信息熵(数据预处理),可参考百度百科内容决策树算法模块:关注点:对数据需要进行预处理,转化为结构化数据,然后进行分析处理,信息熵的计算,权重大小的比较数据的预处理模块:#数据的处理模块fname="C:/Use...

2018-08-20 22:29:21 12195 2

原创 贝叶斯算法及其应用案例

贝叶斯分类算法:贝叶斯分类是统计学的一种分类算法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美。缺陷:与其本身的设定有关,由于贝叶斯假设一个属性值对给定类的影响独立于其它属性的值,但是该假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。升级版:降低独立性假设的贝叶斯分类算法,如TAN(tre...

2018-08-20 22:27:56 9379 2

原创 KNN算法及其应用案例

1.常见的分类算法:(1).KNN算法(2).贝叶斯算法(3).决策树算法(4)人工神经网络算法(5)支持向量机(SVM)算法2.今天我们用KNN算法解决手写体数字的识别问题(包括验证码识别,二维码识别等都可以归属为同一类问题)KNN算法又名K-近邻算法,总体思想是:通过把现实中的数据映射到坐标系,然后通过计算"点"之间的距离(欧几里得公式)sqr[(x1-xm)**2+(y1-ym...

2018-08-20 22:27:01 10855 2

原创 Python数据预处理

1.导入数据文件(excel,csv,数据库文件等)df=read_table(file,names=[列名1,列名2,,,],sep="",encoding)#file是文件路径,names默认为文件的第一行为列名,sep为分隔符,默认为空,表示默认导入为一列#encoding设置文件编码,导入中文时,需设置utf-82.导出数据文件to_csv(filepath,sep="...

2018-08-14 23:43:00 8694 1

转载 一种新型分割图像中人物的方法,基于人物动作辨认

想要进行图像分割,传统方法是先检测图中物体,在进行分离。在本文中,来自清华大学、腾讯AI研究室和英国卡迪夫大学的研究者们提出了一种新型分割图像中人物的方法,基于人物动作辨认。以下是论智对原文的编译。 图像分割的一般方法是先对物体进行检测,然后用边界框对画中物体进行分割。最近,例如Mask R-CNN的深度学习...

2018-08-04 00:02:25 2402 1

原创 Python基本绘图案例

目录一、折线图二、柱状图 三、饼图bar四、直方图一、折线图#绘制折线图import matplotlib.pyplot as plt#绘制X轴对应的点x_values=[1,2,3,4,5]#每一个X点,对应的Y值squares=[1,4,9,16,25]#绘制图形plt.plot(x_values,squares,linewidth=5)#设置图表标题...

2018-07-22 23:36:53 2029

原创 概率统计基础(部分)

目录一、曲线的特点二、数据分布特点三、抽样分布与参数估计四、假设检验五、相关与回归分析六、非参数估计七、时间序列一、曲线的特点数据特点名词:离散程度:四分位差,平均差,方差,标准差标准化值:(变量—平均值)/标准差离散系数或者变异系数:极差,四分位差,平均差或者标准差。等指标与算术平均数的比率离散系数一般用标准差来计算,称为标准差系数,比...

2018-07-21 23:31:52 1138

转载 Excel本身就能编写大量基础机器学习算法

编者按:当初学者第一次接触机器算法时,直观了解算法正在做什么是一项非常重要的任务,这也是论智一直推崇可视化方法的原因之一。虽然初级算法的数学计算并不难掌握,但当他们一看到满篇的数学理论和符号,学习下去的兴致和气势就消减了不少。 作为一名数据工作者,这年头“熟悉机器学习算法”远比“精通Excel”在求职市场上要抢手得多,但前者的“熟悉”究竟是熟悉到什么程度呢?Ex...

2018-07-19 22:19:15 4028

转载 文本数据分析:文本挖掘还是自然语言处理?

数据分析师Seth Grimes曾指出“80%的商业信息来自非结构化数据,主要是文本数据”,这一表述可能夸大了文本数据在商业数据中的占比,但是文本数据的蕴含的信息价值毋庸置疑。KDnuggets的编辑、机器学习研究者和数据科学家Matthew Mayo就在网站上写了一个有关文本数据分析的文章系列。本文是该系列的第一篇,主要讲述了文本...

2018-07-17 17:10:44 23570

转载 关于Python那些事

Python的火热,刺激了市场的需求,在国内某知名互联网招聘网站上,Python开发工程师的年薪普遍在25万-50万之间,岗位数量多达数万。如果你只能选读一门编程语言,那么除了 Python,还是 Python。要赶上这趟快车不容易,尤其是对于非专业出身的小白来说,面...

2018-07-17 13:03:33 1229

原创 数据库机房管理系统的设计(SQL)

设计背景 随着社会的发展,经过本院全体师生的共同努力,学校的规模不断的扩大,校园网的普及学校机房的硬件设施越来越好,如何充分发挥校园计算机机房的管理效能,开放机房,最大限度的为机房管理服务,既要提高机房的科学管理水平,又要减轻机房管理员工作,使机房管理更加规范、有序。管理所需的信息管理,把管理人员从繁琐的数据计算处理中解脱出来,使其有更多的精力从事其它管理政策的研究实施,机房上机管理的制定执行监督...

2018-07-15 17:34:37 10666 93

转载 IBM SPSS Modeler 算法简介

IBM SPSS Modeler以图形化的界面、简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学、机器学习、人工智能等方面的分析算法和数据模型,包括如关联、分类、预测等完整的全面挖掘分析功能,下面让我们一起来了解这些算法:首先,针对刚入门数据挖掘领域的初学者来说,即使你不懂数据挖掘算法,你一样可以使用SPSS Modeler进行建模,这里提供了自动...

2018-07-14 10:57:14 2125

原创 安装Python中的Wordcloud(词云)的一点心得

Wordcloud(词云安装)正常cmd-->pip install wordcloud,结果出现下面安装失败的界面,最好的处理方法如下:第一:下载.whl文件http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud找到对应的版本下载第二:下载路径:将下载文件直接自定义保存到pip所在的目录\c:\python34\sc...

2018-07-10 20:37:56 1496

转载 Python数据分析需要搭建的知识结构

随着大数据以及人工智能等热词的出现,Python现在已经逐步成为最受欢迎的动态编程语言之一,Python最大的特点是拥有一个巨大而活跃的科学计算社区。进入21世纪以来,在行业应用和学术研究中采用Python进行科学计算的势头越来越猛。 在数据分析和交互、探索性计算以及数据可视化方面,Python将不可避免地接近于其他开源和商业领域的特定编程语言/工具,如R、matlab、SAS、stata等。 ...

2018-07-09 23:20:54 862

原创 Python数据结构:列表、元组、字典、集合

数据结构可以说是相互之间存在一种或者多种特定关系的数据类型的集合,相比于其他编程语言Python的数据结构更加灵活。Python中常用的序列结构有:列表、元组、字典、集合、字符串等。有序序列:列表、元组、字符串无序序列:字典、集合、(range、Zip、map、enumerate等)其中,列表、字典、集合又属于可变序列,其余属于不可变序列序列是Python中最基本的数据结构。列表元组字符...

2018-07-06 23:18:16 1958

原创 Python学习笔记:变量、运算符与表达式

对象是Python最基本的概念之一。在Python中一切都是对象,常用的内置对象有:数字、字符串、列表、字典、元组、文件、集合、布尔型、空类型、编程单元(函数、类)。注1:不需要事先声明变量名及其类型,直接赋值即可,且变量类型可随时发生改变(系统自动识别和推断变量类型)(属于强类型编程语言,)。>>> x=5>>> x="hello world"&g...

2018-07-05 18:46:08 276

原创 Python学习笔记:Python介绍

1.Python是一种什么样的语言?严格来说,Python是一门跨平台、开源、免费的解释型高级动态编程语言。其次,Python还支持编译将源代码转换为字节码来优化程序提高运行速度和对源代码进行保密。Python支持命令式编程、函数式编程,完全支持面向对象程序设计。2.学习Python语言的目的?正如"我从哪里来,要到哪里去,这是每个人都应该经常思考的问题,人生必须有个明确的、高大上的目标并...

2018-07-05 18:42:40 479

转载 Python数据分析学习笔记:学习路线

来自: http://www.jianshu.com/p/14017390e05b本文摘自同行说用户“风一样的男子”,原文链接:http://www.yidianzixun.com/n/0CAz84ve?s=1&appid=yidian,如涉及版权问题请及时联系小编!Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简...

2018-07-05 15:18:23 356

转载 大数据时代,Java 统治地位危矣乎?

有云天下,有人江湖,编程的江湖亦是如此。编程的江湖上也是豪强诸起,门派众多,各足鼎立。虽说没有什么武林大会,也没有华山论剑,但是编程的江湖,也不比他们差,亦是精彩纷呈。在比较的老派和老牌的门派当中,C 门派最为受人尊敬,辈分较高,C++ 门派都属于 C 门派之列,后来由于其独有的气势和特点, C 门派中的 C 和 C++ ,都有一种华山门派剑宗和气宗的意思,但是毕竟同气连枝,在面对共同敌人的时...

2018-06-18 18:46:36 706

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除