自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (4)
  • 收藏
  • 关注

原创 下载《Hadoop权威指南》的气象数据

下载《Hadoop权威指南》的气象数据 #! /usr/bin/env bash for i in {1903..2000} do wget -r -c ftp://ftp.ncdc.noaa.gov/pub/data/noaa/$i done 亲测可以运行,这样就可以先down到linux机器上,用awk跑一边。然后再传到hdfs上,用mapreduce再跑一遍。 wget的“-r”为递归下载方式。 ...

2021-01-27 10:31:45 226

原创 Centos 配置django到apache

1.Centos安装Python31)首先下载python3的安装包 https://www.python.org/downloads/2)需要安装依赖:# yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gcc make3)将安装包解压,进入解...

2018-04-17 10:12:20 394

原创 CrawlSpider爬取拉勾网,解决302问题。

前言:     在慕课上买了个付费视频,里面有一章是讲用CrawlSpider来爬取拉勾网,可能因为视频录的时候比较早,老师没加headers,也没用cookie所有的拉勾的工作的详情页面就全部200了,但是自己动手的时候,怎么都是302,去网上查了查,说是加上cookie和headers就可以了,自己动手试了试还真是成功了,拿出来和大家分享一下 1.Selenium获得登陆的cookie: ...

2018-03-26 21:22:15 2751 8

MovieLens 数据集下载,截止到2019年12月,25million条

MovieLens 数据集下载,截止到2019年12月,25million条

2021-03-07

corejava.zip

Java核心技术 卷1的代码

2021-01-15

快速排序、冒泡排序等排序测试集

本资源为测试排序的测试集。 其中包括: 1w个0~10000之间的随机数 10w个0~100000之间的随机数 100w个0~1000000之间的随机数 10w个全部为0的文件

2018-12-14

【planar_utils.py】吴恩达机器学习视频中用到的planar_utils.py

该资源为吴恩达深度学习课程在讲解多隐层神经网络时用到的工具类,主要用于获取原始数据

2018-09-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除