自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 用Scrapy框架爬取豆瓣电影,构建豆瓣电影预测评分模型

文章目录前言一、Scrapy爬虫爬取豆瓣电影1. Scrapy框架介绍(1) Scrapy框架构造:(2) 数据流(3) 项目结构2. 创建爬虫爬取豆瓣(1)创建项目(2) 创建Item(3) 解析Response和Request(4) Item Pipeline连接mysql数据库存储数据二、构建豆瓣电影评分预测模型1.引入库2.读入数据总结前言这段时间对爬虫进行了一定的学习,爬虫除了requests和BeautifulSoup还有很多框架,使用requests等库写爬虫如果爬取量不是太大,速度要求

2021-05-31 00:12:25 3879 4

原创 关联规则算法——Apriori算法解析及Python实现

文章目录关联规则挖掘过程Apriori算法1. Apriori算法的基本思想2. Apriori算法产生频繁项集的过程3. Apriori算法的主要步骤4. 举例及代码实现关联规则挖掘过程关联规则挖掘问题可以分解为以下两个子问题找频繁项集找出事务集T中所有大于或等于用户指定最小支持度的项集,即频繁项集。(项集的支持度可简单用包含该项集的事务数来表示)利用频繁项集生成所需要的关联规则对每一频繁项集A,找到A的所有非空子集a,如果support(A) / support(a) >= min

2021-04-26 21:50:40 4133 1

原创 使用pandas实现Excel的十种函数

文章目录前言1. 计算每个同学的总分2.计算每门课程的平均分3. 计算每门课程的最高分4.计算每门课程的最低分5. 根据总分进行排序6.计算低于每门课程平均分的分数7.计算每门课程低于平均分的人数8. 提取某位同学的总分9. 获取某门课程成绩为某值的同学10.找到某门课程中第k个最小的数总结前言通过使用pandas实现Excel的十个函数来熟练对pandas的使用。加载Excel表格并对数据索引进行处理import pandas as pdimport numpy as npdata = p

2021-03-27 17:59:46 1773 1

原创 线性回归的pytorch简洁实现

文章目录前言一、生成数据集二、读取数据集三、定义模型四、初始化模型参数五、定义损失函数六、定义优化算法七、训练模型前言随着深度学习框架的发展,开发深度学习应用变得越来越便利,在学习深度学习的过程中,自己从0开始动手实现才有利于深入理解深度学习是如何工作的,但在真正的实践中,我们通常可以用框架中更简洁的代码来实现相同的模型,本文基于pytorch框架实现线性回归的训练。一、生成数据集构造一个简单的人工训练数据集,训练样本数为1000,输入特征数为2,使用线性回归模型真实权重ω = [2, -3.4

2021-03-26 17:56:23 291 1

原创 链表5个常见操作:单链表反转、链表中环的检测、两个有序单链表的合并、删除链表中的倒数第n个结点、求链表的中间结点

链表5个常见操作:初学链表手写链表代码时很容易出现各种各样的错误,这还导致需要写代码时有了很大的心理障碍,但是在自己把这几个常见的链表操作写熟练后对链表中终于不再望而生畏了,记录一下。单链表反转链表中环的检测两个有序链表合并删除链表倒数第n个结点求链表的中间结点链表实现:public class Node { int data; Node next; Node(int data){ this.data = data; }}单链表反转:单链表反转有迭代反转法、递归

2021-03-14 17:58:19 276 1

原创 CCF模拟考试202012-1期末预测之安全指数

CCF模拟考试系列文章开始准备CCF CSP认证了,主要记录自己的思路和在做题过程中学到的东西,这是第一篇。文章目录CCF模拟考试系列文章问题描述思路和代码总结问题描述试题编号: 202012-1试题名称: 期末预测之安全指数时间限制: 1.0s内存限制: 512.0MB问题描述:思路和代码import java.util.Arrays;import java.util.Scanner;public class examPredict { public static

2021-03-14 16:52:33 198 1

原创 3.利用PageRank(重启随机游走)预测蛋白质相互作用

文章目录算法描述设计思想源代码及运行结果运行结果源代码总结算法描述重启随机游走算法(Random Walk with Restart)重启随机游走算法是在随机游走算法的基础的改进。从图中的某一个节点出发,每一步面临两个选择,随机选择相邻节点,或者返回开始节点。算法包含一个参数a为重启概率,1-a表示移动到相邻节点的概率,经过迭代到达平稳,平稳后得到的概率分布可被看作是受开始节点影响的分布。设计思想要求实现:1. 获得相互作用数最多的蛋白质P2. 预测与P相互作用的Top-20蛋白质.

2020-10-27 03:43:47 1805 5

原创 2.系统发生树构建(非加权分组平均法、邻接法python实现)

文章目录算法描述设计思想源代码及运行成果1.运行成果2.源代码遇到的问题及总结问题总结算法描述分子进化与系统发生:计算分子进化——利用算法在分子水平上构建物种的进化树。这里说的分子水平是指DNA、RNA、以及蛋白质序列。非加权分组平均法:对于某几条不同的序列,找出距离最小的一对序列(两条序列之间的距离为两条序列相同位置上不同的碱基总数),将其合并聚集,形成一个分支,聚集后将两条序列看成一个整体,再分别计算与其他序列之间的距离,直到所有序列归为一类,系统发生树构建完成,树枝的长短直接反应了它们与共同

2020-10-27 02:51:28 5862 3

原创 python实现直方图均衡及灰度窗口变换

文章目录前言一、直方图均衡原理二、源代码及运行结果1.运行结果2.源代码总结前言在学习图像增强的理论知识后使用python自己编程实现直方图均衡及灰度窗口变换一、直方图均衡原理直方图均衡化的数学原理二、源代码及运行结果1.运行结果运行结果如下:2.源代码代码如下:#!/usr/bin/env python# -*- coding:utf-8 -*-from pylab import *import cv2import numpy as npimport matplotli

2020-10-22 01:59:51 1121 6

原创 1.序列比较算法(全局序列比对及局部序列比对的python实现)

1.序列比较算法(全局序列比对及局部序列比对的python实现)前言算法思想介绍实现功能及实现方法运行结果演示源代码遇到的问题及总结前言阶段性的完成了序列比较算法,还有很多不足和需要完善的地方有待日后改进。算法思想介绍一个很详细完整的算法介绍双序列全局比对及算法Needleman-Wunsch 算法:动态规划法输入值:两条序列、替换记分矩阵以确定不同字母间的相似度得分,以及空位罚分双序列局部比对算法局部比对的计算公式在全局比对的基础上增加了第四个元素“0”。得分矩阵初始值仍是0,但第一行

2020-10-05 03:14:16 13846 15

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除