自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(168)
  • 收藏
  • 关注

原创 深度学习每周学习总结P5(运动鞋识别)

数据导入及处理部分:本次数据导入没有使用torchvision自带的数据集,需要将原始数据进行处理包括数据导入,数据类型转换。划分数据集:划定训练集测试集后,再使用torch.utils.data中的DataLoader()加载数据.注意:与之前不同的是,本次的数据集是已经划分好的。模型构建部分:有两个部分一个初始化部分(init())列出了网络结构的所有层,比如卷积层池化层等。第二个部分是前向传播部分,定义了数据在各层的处理过程。

2024-04-19 21:52:04 868

原创 深度学习每周学习总结P4(猴痘识别)

数据导入部分:本次数据导入没有使用torchvision自带的数据集,需要将原始数据进行处理包括数据导入,数据类型转换。划分数据集:划定训练集测试集后,再使用torch.utils.data中的DataLoader()加载数据模型构建部分:有两个部分一个初始化部分(init())列出了网络结构的所有层,比如卷积层池化层等。第二个部分是前向传播部分,定义了数据在各层的处理过程。

2024-04-11 22:06:38 715

原创 深度学习每周学习总结P3(天气识别)

数据导入部分:本次数据导入没有使用torchvision自带的数据集,需要将原始数据进行处理包括数据导入,数据类型转换,划定训练集测试集后,再使用torch.utils.data中的DataLoader()加载数据模型构建部分:有两个部分一个初始化部分(init())列出了网络结构的所有层,比如卷积层池化层等。第二个部分是前向传播部分,定义了数据在各层的处理过程。设置超参数:在这之前需要定义损失函数,学习率,以及根据学习率定义优化器(例如SGD随机梯度下降),用来在训练中更新参数,最小化损失函数。

2024-03-28 23:20:43 1347 1

原创 DataFrame:postgresql数据下载及上传

【代码】DataFrame:postgresql数据下载及上传。

2024-03-22 10:47:02 365

原创 力扣hot 100:1. 两数之和(未完成待更新)

给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1]。你可以假设每种输入只会对应一个答案。输入:nums = [2,7,11,15], target = 9。输入:nums = [3,2,4], target = 6。进阶:你可以想出一个时间复杂度小于 O(n2) 的算法吗?输入:nums = [3,3], target = 6。

2024-03-22 00:47:10 352

原创 深度学习每周学习总结P2(CIFAR10彩色图片分类)

数据导入部分:数据导入使用了torchvision自带的数据集,获取到数据后需要使用torch.utils.data中的DataLoader()加载数据模型构建部分:有两个部分一个初始化部分(init())列出了网络结构的所有层,比如卷积层池化层等。第二个部分是前向传播部分,定义了数据在各层的处理过程。训练前的准备:在这之前需要定义损失函数,学习率,以及根据学习率定义优化器(例如SGD随机梯度下降),用来在训练中更新参数,最小化损失函数。

2024-03-20 16:45:04 1023

原创 GeoPy1.2 地理数据处理入门(数据读取及展示)

高校教师,中科院 GIS 博士本文为原文章基础上,加上自己以及GPT4.0的总结整理而来提取码:7cbe–来自百度网盘超级会员V5的分享。

2024-03-18 16:00:40 975

原创 深度学习每周学习总结P1(pytorch手写数字识别)

总结:数据导入部分:数据导入使用了torchvision自带的数据集,获取到数据后需要使用torch.utils.data中的DataLoader()加载数据模型构建部分:有两个部分一个初始化部分(init())列出了网络结构的所有层,比如卷积层池化层等。第二个部分是前向传播部分,定义了数据在各层的处理过程。训练前的准备:在这之前需要定义损失函数,学习率,以及根据学习率定义优化器(例如SGD随机梯度下降),用来在训练中更新参数,最小化损失函数。

2024-03-15 17:26:13 1094

原创 SQL进阶(五):With 函数 vs 视图函数

综合考虑,如果你的需求是经常重用某个特定的统计结果,且这些统计结果不需要在更复杂的查询中作为子查询使用,那么使用视图是个好选择。同样的,VIEW 和 WITH 能够帮助我们更好的去梳理 SQL 查询语句的结构,相较于使用复杂的子查询嵌套, 两者都可以帮助我们提升代码的可阅读性,方便代码报错的时候提供更好的纠错调整能力。你可能很快注意到了,上面的 SQL 语句返回的是一个空的数组,不要担心,这是因为 executescript 在执行多条语句之后并不知道返回哪一条语句的结果。

2024-03-13 18:32:49 941

原创 SQL进阶(四):Window 函数技巧

A通过每日登录的用户数,分析登录用户总数的趋势日期当日登录人数2023-07-011122023-07-024352023-07-031011我们希望输出的表是日期当日登录人数2023-07-011122023-07-023232023-07-03576。

2024-03-13 11:44:03 1123

原创 GeoPy1.1 地理数据处理入门

在地理学及相关专业,我们往往需要处理大量的地球观测数据和模拟结果,基于这些数据的处理结果进一步分析,得到一些客观规律或者研究结论。但是在处理过程中,我们会发现这些数据可能来源不同,格式不一。对于一些常见的地理数据格式,比如栅格数据、矢量数据等,大家比较容易想到用专业软件来处理,比如 Arcgis、MapGIS、ENVI 等,这些软件使用简单,也很强大,但是也有着一定的不足,比如(1)往往只能处理专业格式的数据(2)批量处理一般有着一定的门槛,需要进行二次开发(3)一般为商业软件,正版的授权费用较高等等。

2024-03-11 18:36:38 1057

原创 SQL进阶(三):Join 小技巧:提升数据的处理速度

简而言之,这个查询是为了找出每个乘客等级(Pclass)中乘客生存状态与该等级平均生存率之间差异的平均平方值(即方差)。这可以帮助理解不同等级乘客生存率的一致性或波动性。

2024-02-26 00:10:01 1227

原创 SQL进阶(二):复杂数据结构处理:让你的 SQL 更加高效

复杂数据结构处理:让你的 SQL 更加高效

2024-02-22 11:46:54 921

原创 SQL进阶(一):SQL基础速览,以SQLite为例

本文是在原本sql闯关的基础上总结得来,加入了自己的理解以及疑问解答(by GPT4)

2024-01-20 11:04:27 1054 1

原创 数据结构(五)数据结构与算法中的经典题

本文是在原本数据结构与算法闯关的基础上总结得来,加入了自己的理解和部分习题讲解。至此数据结构介绍已完结,后续会把数据结构算法题系列更完。邀请码: JL57F5。

2024-01-16 15:39:54 873

原创 数据结构(四)树

本文是在原本数据结构与算法闯关的基础上总结得来,加入了自己的理解和部分习题讲解原活动链接邀请码: JL57F5​ 其实, 在现实生活中也存在类似的结构。例如,在一个公司中员工架构最顶端是CEO,CEO的下面有若干副总,每个副总下面有若干部门经理,每个部门经理下面有若干基层员工。这种员工架构很容易用树这种数据结构来表示。​ 二叉查找树(又叫作二叉搜索树或二叉排序树)是一种数据结构,采用了图的树形结构。 数据存储于二叉查找树的各个结点中。​ 请记住: 树是一种特殊的图, 它是一种无向无环的图,其中每个节点只有

2024-01-16 11:27:47 1073

原创 数据结构(三)堆和哈希表

哈希表存储的是由键(key)和值(value)组成的数据。例如,我们将每个人的性别作为数据进行存储,键为人名,值为对应的性别, 一般来说,我们可以把键当成数据的标识符,把值当成数据的内容。为了对比一下哈希表的优势 , 我们先把这些数据存储到数组中看看效果此处准备了6个箱子(即长度为6的数组)来存储数据。假设我们需要查询Ally的性别,由于不知道Ally的数据存储在哪个箱子里,所以只能从头开始查询。这个操作便叫作“线性查找”。

2024-01-11 16:11:56 1130

原创 数据结构(二)栈和队列

栈也是一种数据呈线性排列的数据结构,不过在这种结构中,我们只能访问最新添加的数据。栈就像是一摞书,拿到新书时我们会把它放在书堆的最上面,取书时也只能从最上面的新书开始取。与前面提到的数据结构相同,队列中的数据也呈线性排列。虽然与栈有些相似,但队列中添加和删除数据的操作分别是在两端进行的。就和“队列”这个名字一样,把它想象成排成一队的人更容易理解。在队列中,处理总是从第一名开始往后进行,而新来的人只能排在队尾。

2024-01-01 21:20:28 1139

原创 数据结构(一)

算法,通俗点讲 , 就是一堆小伙伴和一份旅行指南一起前往目的地的过程。每个小伙伴都需要按照指南中的步骤来行动,以达到旅行的目的。同样地,编程中的算法也是一组指令,帮助我们完成特定任务或解决问题.请注意 : 这里所说的特定问题是多种多样,比如面试经常问的 “将随意排列的数字按从小到大的顺序重新排列”“寻找出发点到目的地的最短路径”,等等一些让人头皮发麻的问题结构,简单的理解就是关系,比如分子结构,就是说组成分子的原子之间的排列方式。严格点说,结构是指各个组成部分相互搭配和排列的方式。

2023-12-29 15:53:20 881

原创 pytorch文本分类(三)模型框架(DNN&textCNN)

假设选择的激活函数是Sigmoid函数,隐藏层和输出层的输出值为a ,则对于下图的三层DNN,利用和感知机一样的思路,我们可以利用上一层的输出计算下一层的输出,也就是所谓的DNN前向传播算法。填充,卷积核与图像尺寸不匹配,往往填充图像缺失区域,如果原始图片尺寸为5X5,卷积核的大小为3X3,如果不进行填充,步长为1的话,当卷积核沿着图片滑动后只能滑动出一个3X3的图片出来,这就造成了卷积后的图片和卷积前的图片尺寸不一致,这显然不是我们想要的结果,所以为了避免这种情况,需要先对原始图片做边界填充处理。

2023-12-18 23:24:30 1563 3

原创 pytorch文本分类(二):引入pytorch处理文本数据

PyTorch是一个开源的Python机器学习库,应用于人工智能领域,如自然语言处理。它主要由Facebook的人工智能研究团队开发。

2023-12-14 09:41:48 986

原创 pytorch文本分类(一):文本预处理

本文为自己在鲸训练营答题总结,作业练习都在和鲸社区数据分析协作平台 ModelWhale 上。在这里相关数据链接:https://pan.baidu.com/s/1iwE3LdRv3uAkGGI2fF9BjA?pwd=ro0v提取码:ro0v–来自百度网盘超级会员V4的分享。

2023-11-16 11:58:56 1043

原创 数据分析实战 - 2 订单销售数据分析(pandas 进阶)

题目来源:和鲸社区的题目推荐:刷题源链接(用于直接fork运行。

2023-11-01 15:00:37 1426

原创 pytorch 入门 (五)案例三:乳腺癌识别-VGG16实现

本文为内部限免文章在本案例中,我将带大家探索一下深度学习在医学领域的应用–完成乳腺癌识别,我们的数据集是由多张组成。关于环境配置请看我之前缩写博客:https://blog.csdn.net/qq_33489955/article/details/132890434?数据集:链接:https://pan.baidu.com/s/1xkqsqsRRwlBOl5L9t_U0UA?pwd=vgqn提取码:vgqn–来自百度网盘超级会员V4的分享。

2023-10-27 12:00:09 1130 1

原创 pytorch 入门 (四)案例二:人脸表情识别-VGG16实现

本文为内部限免文章参考本文所写记录性文章,请在文章开头注明以下内容,复制粘贴即可。

2023-10-23 16:53:20 1211

原创 pytorch 入门 (三)案例一:mnist手写数字识别

本文为内部限免文章。

2023-10-20 14:11:15 762

原创 pytorch 入门(二)

本文为内部限免文章。

2023-10-17 13:17:52 462

原创 Pandas进阶修炼120题-第五期(一些补充,101-120题)

其中,equal_rows 将是一个元组,包含一个数组,数组中的值是满足条件的行号,可以通过 equal_rows[0] 来访问这个数组。方法更改了 DataFrame 的显示样式,实际上您并没有修改 DataFrame 本身的数据,只是修改了其显示的样式。这是一个很好的方式来格式化 pandas DataFrame 的显示样式,而不真正更改 DataFrame 中的数据。是用来设置 Pandas 显示选项的,确保当您显示 DataFrame 时,所有的列都会被显示出来,而不是被截断。

2023-10-03 19:32:19 421

原创 pytorch 入门(一)

本文为内部限免文章参考本文所写记录性文章,请在文章开头注明以下内容,复制粘贴即可⬇️基础版模板⬇️。

2023-09-21 13:09:39 380

原创 pytorch环境配置

现在,你应该已经在 Jupyter Notebook 中设置了一个专门的 PyTorch 环境。每次你想使用这个环境时,只需在 Notebook 中选择相应的内核即可。在已激活的环境中,根据你的 CUDA 版本和操作系统,使用适当的命令来安装 PyTorch。注意这里需要点击自定义安装,点击展开所有选项,如果出现新版本比当前版本低则取消打勾。我的cuda是12.0 发现最新的pytorch是11.8,选择最新的即可。选择 Python 3.8 作为该环境的版本,你也可以选择其他版本。你可以选择其他名称。

2023-09-15 02:10:13 458 2

原创 Pandas进阶修炼120题-第四期(当Pandas遇上NumPy,81-100题)

d欧式距离(Euclidean distance)是在欧几里得空间中两点之间的 “直线” 距离。对于两个向量A\mathbf{A}A和B\mathbf{B}BdAB∑i1nAi−Bi2dABi1∑n​Ai​−Bi​2​在 Pandas DataFrame 中,你可以很容易地计算两列之间的欧式距离。

2023-09-01 01:31:38 638 2

原创 自动化邮件--用以拿到已fork项目中的原数据

【代码】自动化邮件--用以拿到已fork项目中的原数据。

2023-08-11 09:41:26 163

原创 Pandas进阶修炼120题-第三期(金融数据处理,51-80题)

因此,如果您在Python或Java等语言的路径中使用反斜杠,则需要转义它们(’ \ ')或使用原始字符串字面量(例如,在Python中,‘r ’ c:\path\to\file’ ')。Bollinger带包括一个作为n周期简单移动平均线(SMA)的中间带,一个在中间带之上的K倍n周期标准差处的上带,以及一个在中间带之下的K倍n周期标准差处的下带。因此,总而言之,df.isnull().sum()是一个方便的一行代码,它将返回DataFrame df的每列中缺失或NaN值的数量。

2023-07-29 15:49:00 1731 2

原创 Pandas进阶修炼120题-第二期(Pandas数据处理,21-50题)

pandas 120题

2023-06-24 17:39:13 555 4

原创 Pandas进阶修炼120题-第一期(Pandas基础,1-20题)

pandas 120道习题总结

2023-06-07 17:10:46 1225

原创 数据分析实战 - 1 农民工数据预测(线性回归模型的使用)

以下是农民工收入的统计数据,使用历史年份对制造业,建筑业,批发和零售业,交通运输仓储和邮政业,住宿餐饮业,居民服务修理和其他服务业 收入分别建立回归模型训练,并且对2023年的这几个维度的值进行预测;以下是农民工收入的统计数据,使用历史年份对东部地区,中部地区,西部地区,东北地区收入分别建立回归模型训练,并且对2023年的这几个维度的值进行预测;以下是农民工收入的统计数据,使用历史年份对总体农民工,外出农民工,本地农民工分别建立回归模型训练,并且对2023年的这几个维度的值进行预测;

2023-06-02 17:13:40 450

原创 TensorFlow 1.x学习(系列二 :4):自实现线性回归

w1∗x1w2∗x2w3∗x3wn∗xnbiasw1​∗x1​w2​∗x2​w3​∗x3​...wn​∗xn​bias1:准备好1特征1目标值(都为100行1列)yx∗0.70.8yx∗0.70.82: 建立模型 随机初始化准备一个权重w,一个向量bypredictx∗wbypredict​x∗wb3:求损失函数,误差y1−。

2023-05-02 22:56:23 1917 4

原创 TensorFlow 1.x学习(系列二 :3):变量与tensorboard可视化

cmd中输入相应命令:tensorboard --logdir=C:\Users\24474\Desktop\DataAnalysis\classification_working\tmp\summary\test\ --port=6006。参考路径:tensorboard --logdir=C:\Users\24474\Desktop\DataAnalysis\classification_working\tmp\summary\test\ --port=6006。打开上述网址即可看到可视化结果。

2023-04-16 17:40:14 313

原创 TensorFlow 1.x学习(系列二 :2):张量的动态形状与静态形状,基本的张量api

对于静态形状来说,一旦张量形状固定了,不能再次设置静态形状,不能跨维度修改动态形状可以去创建一个新的张量,改变的时候一定要注意元素数量要匹配。

2023-04-01 16:05:05 513

原创 DataFrame:依条件进行数据抽取

抽取符合条件的数据(我这里某种分类的数据条数大于1000)作为新的数据集,原来的数据集删除抽取的部分。

2023-03-24 17:52:32 804

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除