自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 网易云音乐爬虫实战——肖战《红梅赞》下评论数据挖掘与分析

前言这个学期终于结束,空余时间慢慢多了。正逢最近肖战余温又起,而我对饭圈文化和所谓网络水军一直非常感兴趣,这次不如拿网易云练练手,蹭蹭这波热度。让我们本着科学的精神,用python爬虫和数据可视化来分析一下,究竟是怎样一首翻唱能在不到三个月内获得网易云评论100万+的成就。本文以2020年7月1日0:00-23.59网易云歌曲“《红梅赞》——肖战”评论进行分析。

2020-07-02 03:11:15 3055 6

原创 基于k-means聚类算法对NBA球员数据的一次聚类分析

数据挖掘大作业前言本章工具前言聚类分析的研究成果主要集中在基于距离(或者称为基于相似度)的聚类方法,用距离来作为相似性度量的优点是十分直观,从我们对物体的识别角度来分析,同类的数据样本是相互靠近的,不同类样本应该相聚较远。k-means聚类算法是划分聚类方法中最常用、最流行的经典算法,许多其他的算法都是k-means聚类算法的变种。其主要思想是通过迭代过程将数据集划分为不同类别,使评价聚类性能的准则函数达到最优,使生成的每个聚类类内紧凑,类间独立。本文用到的数据来自我的一门数据分析课程,是一个包括了2

2020-05-11 12:05:43 5458 13

原创 python爬虫的一次尝试——华北电力大学图书馆读者荐购系统:基于python爬虫的web数据爬取

因为疫情原因,本学期到目前第九周仍未回校,也感谢有这么好的一段空窗期,给了我们足够的时间和精力提升自己。本学期数据仓库与数据挖掘课程大作业是编程实现一种数据挖掘方法,鉴于假期学了一点python编程和爬虫基础,之前也注意过学校图书馆的荐购系统,数据十分有趣,于是想借这次机会尝试一下。

2020-04-19 05:15:17 2763

原创 学习笔记(01):5天Python基础小课-Python函数哪里不一样

命名关键字参数命名关键字参数在关键字参数的基础上限制传入的的关键字的变量名和普通关键字参数不同,命名关键字参数需要一个用来区分的分隔符*,它后面的参数被认为是命名关键字参数#这里星号分割符后面的city、job是命名关键字参数person_info(name, age, *, city, job): print(name, age, city, job)>&gt...

2020-04-10 00:56:27 189

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除