自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据杂谈

关注大数据,分享Excel、R语言和Python等数据分析与数据挖掘技能。

  • 博客(32)
  • 收藏
  • 关注

转载 这是一个神奇的网站

可视化图表的词典http://tuzhidian.com/玩数据的你,一定会喜欢的 ...

2019-07-25 23:54:40 825

转载 Python爬虫:爬取拉勾网职位并分析

大数据杂谈一起行走数据江湖!作者:闲庭信步原文链接:https://blog.csdn.net/danspace1/article/details/80197106如需转...

2018-06-01 06:31:13 5650 8

转载 Python中用K-均值聚类来探索顾客细分

大数据杂谈一起行走数据江湖!本文由 伯乐在线 - 高冷的精神污染 翻译,toolate 校稿。英文出处:Greg。基于 Python 的顾客细分在这篇文章中,我要谈的东西...

2018-05-30 06:30:00 5041 1

转载 被称为“开发者神器”的GitHub,到底该怎么用?

导读:GitHub是一个拥有数十亿行代码的网站,每天有数百万开发者聚集在一起,研究开源软件中存在的问题。开发人员每天都要在工作中使用GitHub或其他基于Git的工具。G...

2018-04-22 00:00:00 411

转载 大数据实战:知乎百万用户分析

本文来源:http://wuzuozhi.com/背景这几天,同事都去出差,稍有感冒的我提前在办公室感受到了“孤独终老”的恐惧。于是,我想在自己有能力并且还有激情的时候,...

2018-04-18 12:11:30 11537 6

转载 Google Colab 免费GPU服务器使用教程

本文来源:https://blog.csdn.net/cocoaqin/article/details/79184540一、前言不知道大家是否为了寻找免费GPU服务器而焦...

2018-04-18 12:11:25 489

转载 非常实用的九个程序员工具网站

本文来源:辰语程序员学习笔记(公众号ID:cystudynote)1regex101官方网站:regex101.com强大的正则表达式工具,你可以实时查看匹配信息,并且会...

2018-04-18 12:11:15 2618

转载 12行Python暴力爬《黑豹》豆瓣短评

作者:黄嘉锋来源:https://www.jianshu.com/p/ea0b56e3bd86草长莺飞,转眼间又到了三月“爬虫月”。这时往往不少童鞋写论文苦于数据获取艰难...

2018-04-18 00:00:00 620

转载 大数据实战:知乎百万用户分析

本文来源:http://wuzuozhi.com/背景这几天,同事都去出差,稍有感冒的我提前在办公室感受到了“孤独终老”的恐惧。于是,我想在自己有能力并且还有激情的时候,去做一些以后值得回忆的事。我萌生了去“探望”下知乎的念头。前言我个人是15年注册知乎,三年过去了,我个人主页数据是:我一直不喜欢知乎上面的氛围,但是通过知乎我确实拿到了很多学习、设计、阅读和产品灵感的资源,都是通过知乎链接到其他平

2018-04-17 00:00:00 3053 1

转载 Google Colab 免费GPU服务器使用教程

本文来源:https://blog.csdn.net/cocoaqin/article/details/79184540一、前言不知道大家是否为了寻找免费GPU服务器而焦头烂额。 近些天,谷歌推出了Google Colab(Colaboratory)链接:https://colab.research.google.com/官方对其的说明是:Colaboratory 是一个研究项目,可免费使用。划重

2018-04-16 00:00:00 1246

转载 非常实用的九个程序员工具网站

本文来源:辰语程序员学习笔记(公众号ID:cystudynote)1regex101官方网站:regex101.com强大的正则表达式工具,你可以实时查看匹配信息,并且会用不同的颜色将 Group 标记出来。而且有 Quick Reference 来帮助你记忆正则表达式的规则和 Explanation 对你的正则表达式进行解释。重要的是,支持直接生成多种语言的代码。2VisuAlgo官方网站:vi

2018-04-15 00:00:00 6388

转载 Python 爬虫实践:《战狼2》豆瓣影评分析

本文作者:hang本文来源:https://segmentfault.com/a/1190000010473819简介刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在最新上映的电影里面是排行第一的,如下图所示。准备把豆瓣上对它的影评做一个分析。目标总览主要做了三件事:抓取网页数据清理数据用词云进行展示使用的python版本是3.5.一、抓取网页数据第一步要对网页进行访问

2018-04-01 00:00:00 536 1

转载 Python 爬虫实践:《战狼2》豆瓣影评分析

本文作者:hang本文来源:https://segmentfault.com/a/1190000010473819简介刚接触python不久,做一个小项目来练练手。前几天...

2018-04-01 00:00:00 663

转载 Python 爬虫实战:股票数据定向爬虫

本文作者:hang本文来源:https://segmentfault.com/a/1190000010520835功能简介目标: 获取上交所和深交所所有股票的名称和交易信息。输出: 保存到文件中。技术路线: requests—bs4–re语言:python3.5说明网站选择原则: 股票信息静态存在于html页面中,非js代码生成,没有Robbts协议限制。选取方法: 打开网页,查看源代码,搜索网页

2018-03-29 00:00:00 832 2

转载 Python 爬虫实战:股票数据定向爬虫

本文作者:hang本文来源:https://segmentfault.com/a/1190000010520835功能简介目标: 获取上交所和深交所所有股票的名称和交易信...

2018-03-29 00:00:00 461

转载 【Excel】用公式提取Excel单元格中的汉字

昨天一个前端的朋友找我帮忙用excel提取代码中的汉字(字符串),可算费了劲儿了,他要提取的内容均在单引号中,但问题是没有统一的规律,同一个单元格可能存在多个要提取的内容,而且汉字中间也夹杂其他字符。所以总结了一下提取汉字的几种情况。一、用公式提取Excel单元格中的汉字对于一个混杂各种字母、数字及其他字符和汉字的文本字符串,要提取其中的汉字,在Excel中通常可用下面的公式。例如下图A列中的字符

2018-03-28 00:00:00 41363 2

转载 【Excel】用公式提取Excel单元格中的汉字

昨天一个前端的朋友找我帮忙用excel提取代码中的汉字(字符串),可算费了劲儿了,他要提取的内容均在单引号中,但问题是没有统一的规律,同一个单元格可能存在多个要提取的内容...

2018-03-28 00:00:00 2508

转载 用Python爬虫获取自己感兴趣的博客文章

来源:  CDA数据分析师在CSDN上有很多精彩的技术博客文章,我们可以把它爬取下来,保存在本地磁盘,可以很方便以后阅读和学习,现在我们就用python编写一段爬虫代码,来实现这个目的。我们想要做的事情:自动读取博客文章,记录标题,把心仪的文章保存到个人电脑硬盘里供以后学习参考。过程大体分为以下几步:1. 找到爬取的目标网址;2. 分析网页,找到自已想要保存的信息,这里我们主要保存是博客的文章内容

2018-03-27 00:00:00 698 1

转载 用Python爬虫获取自己感兴趣的博客文章

来源:  CDA数据分析师在CSDN上有很多精彩的技术博客文章,我们可以把它爬取下来,保存在本地磁盘,可以很方便以后阅读和学习,现在我们就用python编写一段爬虫代码,...

2018-03-27 00:00:00 1519

转载 如何用 Python 执行常见的 Excel 和 SQL 任务

作者:ROGER HUANG本文翻译自:http://code-love.com/2017/04/30/excel-sql-python/来源:https://www.jianshu.com/p/51bb7726231b本教程的代码和数据可在 Github 资源库 中找到。有关如何使用 Github 的更多信息,请参阅本指南。数据从业者有许多工具可用于分割数据。有些人使用 Excel,有些人使用S

2018-03-26 00:00:00 364

转载 如何用 Python 执行常见的 Excel 和 SQL 任务

作者:ROGER HUANG本文翻译自:http://code-love.com/2017/04/30/excel-sql-python/来源:https://www.j...

2018-03-26 00:00:00 531

转载 从 Zero 到 Hero ,一文掌握 Python

本文来源:开源中国,译者rever4433, Tocy, Tony, 南宫冰郁本文链接:https://www.oschina.net/translate/learning-python-from-zero-to-hero英文原文:https://medium.freecodecamp.org/learning-python-from-zero-to-hero-120ea540b567第一个问题,

2018-03-25 00:00:00 319

转载 Python难懂?买一次西瓜就懂了!

来源:代码湾什么是code?code就就是一种语言,一种计算机能读懂的语言。计算机是一个傻*,他理解不了默认两可的任何东西。比如,你让你老公去买个西瓜,你老公会自己决定去哪里买,买几个,找个搞活动打折的买,总之,你给他钱,他就给你买回来让你吃到爽的西瓜。但是,你想让计算机买一个西瓜?你要告诉他:去门口的鲜丰水果店买,买沙瓤无子西瓜,若旁边的店打折,就去旁边的店买。总之,你不能让计算机做任何决定,你

2018-03-24 00:00:00 621

转载 用Python读写Excel文件的方式比较

【导读】本文转自GoCalf Blog,原文链接:http://www.gocalf.com/blog/python-read-write-excel.html,本文对python读写excel的几种方式进行了比较,写的非常全面。python读写excel的模块地址:http://www.python-excel.org/虽然天天跟数据打交道,也频繁地使用Excel进行一些简单的数据处理和展示,但

2017-12-10 00:00:00 3620

转载 Python爬取北京地区短租房信息

本文利用Requests和BeautifulSoup第三方库,爬取小猪短租网北京地区短租房的信息。代码参考《从零开始学Python网络爬虫》。完整代码如下:from bs4 import BeautifulSoupimport requestsimport timeheaders = {    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x

2017-12-06 00:00:00 1414

转载 20个超实用的工具学习网站,还不收藏?

来源:优达学城Udacity工具类www.autodraw.com——由谷歌开发的一个基于AI分析并猜出你要画什么的平台,是原先“你画我猜”的升级版,让你从现有图库里找出最符合脑中形象的图案。  www.notion.so——团队协同处理工具,将文件、任务、知识库等衔接起来。 www.100millionbooks.org——是一个基于谷歌Chrome浏览器的扩展程序,安装这款插件以后,每次打开新

2017-12-02 00:00:00 2015

转载 Chrome控制台使用详解

来源:码农网作者:刘哇勇链接:http://www.codeceo.com/article/chrome-console.htmlChrome的开发者工具已经强大到没朋友的地步了,特别是其功能丰富界面友好的console,使用得当可以有如下功效:更高「逼格」更快「开发调试」更强「进阶级的Frontender」Bug无处遁形「Console大法好」console.log大家都会用log,但鲜有人很好

2017-08-08 00:00:00 483

转载 史上最全的Chrome使用技巧集锦

来源:码农网作者:YouYaInsist(原作者博客已删除文章)链接:http://www.codeceo.com/article/chrome-usage-most-useful.htmlChrome的隐身模式先来说说隐身模式的启用方法吧1. 键盘快捷:Ctrl + Shift + N。2. 在Windows7下的任务栏处,右击“Chrome”图标,会出一个下拉菜单,点击“新建隐身窗口”。3.

2017-08-07 00:00:00 1424

转载 Python爬取自己微信好友信息,并制作好友签名词云

本文参考教程来自微信公众号【Alfred在纽西兰】,文章如下:《一件有趣的事: 爬了爬自己的微信朋友》(点击阅读原文查看)根据原作者的思路以及代码,爬取自己的微信好友信息并制作好友签名词云图,在本次实践中,主要使用itchat、jieba、wordcloud等包,原作者使用R进行图表可视化,我这里略做改进,使用了pyecharts包。关于itchat包,中文文档:1、https://itchat.

2017-08-06 00:00:00 3872 3

转载 Conda:误解与迷思

翻译自:https://jakevdp.github.io/blog/2016/08/25/conda-myths-and-misconceptions/译者:taopanpantao链接:http://blog.csdn.net/taopanpantao/article/details/53982752我试着尽可能简洁,但如果你想要跳过这篇文章,并得到讨论的要点,你可以阅读每个标题以及下面的摘要

2017-08-04 00:00:00 354

转载 如何在jupyter中同时使用python2和3

如何在jupyter中同时使用python2和3?由于我是通过anaconda来安装的Jupyter Notebook,所以首先需要解决Anaconda2(Python2)和Anaconda3(Python3)的共存。只需要将Anaconda3的安装目录选在D:\Anaconda2\envs子目录下即可。详细安装教程请看这篇博文:http://blog.csdn.net/infin1te/arti

2017-08-03 00:00:00 3276

转载 Windows下python2和3共存问题

在学习python的过程中,有人推荐2,也有人推荐3。但是,不管选择了哪一个版本,总是想着是否能2个版本同时安装并兼容使用呢?真的可以吗?答案是肯定的,完全没有问题。那么第一件事,你需要在电脑上安装2个版本的python。安装过程详见:想学Python?做好第一步:环境配置安装了多个Python版本(这里指2和3,而不是3.4和3.6这样的),那么该如何进行版本的切换呢?一个比较笨的方法是,通过改

2017-08-02 00:00:00 585

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除