大地之灯-CSDN博客

原创深度学习每周学习总结P5（运动鞋识别）

数据导入及处理部分：本次数据导入没有使用torchvision自带的数据集，需要将原始数据进行处理包括数据导入，数据类型转换。划分数据集：划定训练集测试集后，再使用torch.utils.data中的DataLoader()加载数据.注意：与之前不同的是，本次的数据集是已经划分好的。模型构建部分：有两个部分一个初始化部分（init()）列出了网络结构的所有层，比如卷积层池化层等。第二个部分是前向传播部分，定义了数据在各层的处理过程。

2024-04-19 21:52:04 868

原创深度学习每周学习总结P4（猴痘识别）

数据导入部分：本次数据导入没有使用torchvision自带的数据集，需要将原始数据进行处理包括数据导入，数据类型转换。划分数据集：划定训练集测试集后，再使用torch.utils.data中的DataLoader()加载数据模型构建部分：有两个部分一个初始化部分（init()）列出了网络结构的所有层，比如卷积层池化层等。第二个部分是前向传播部分，定义了数据在各层的处理过程。

2024-04-11 22:06:38 715

原创深度学习每周学习总结P3（天气识别）

数据导入部分：本次数据导入没有使用torchvision自带的数据集，需要将原始数据进行处理包括数据导入，数据类型转换，划定训练集测试集后，再使用torch.utils.data中的DataLoader()加载数据模型构建部分：有两个部分一个初始化部分（init()）列出了网络结构的所有层，比如卷积层池化层等。第二个部分是前向传播部分，定义了数据在各层的处理过程。设置超参数：在这之前需要定义损失函数，学习率，以及根据学习率定义优化器（例如SGD随机梯度下降），用来在训练中更新参数，最小化损失函数。

2024-03-28 23:20:43 1347 1

原创 DataFrame：postgresql数据下载及上传

【代码】DataFrame：postgresql数据下载及上传。

2024-03-22 10:47:02 365

原创力扣hot 100：1. 两数之和(未完成待更新)

给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。解释：因为 nums[0] + nums[1] == 9 ，返回 [0, 1]。你可以假设每种输入只会对应一个答案。输入：nums = [2,7,11,15], target = 9。输入：nums = [3,2,4], target = 6。进阶：你可以想出一个时间复杂度小于 O(n2) 的算法吗？输入：nums = [3,3], target = 6。

2024-03-22 00:47:10 352

原创深度学习每周学习总结P2（CIFAR10彩色图片分类）

数据导入部分：数据导入使用了torchvision自带的数据集，获取到数据后需要使用torch.utils.data中的DataLoader()加载数据模型构建部分：有两个部分一个初始化部分（init()）列出了网络结构的所有层，比如卷积层池化层等。第二个部分是前向传播部分，定义了数据在各层的处理过程。训练前的准备：在这之前需要定义损失函数，学习率，以及根据学习率定义优化器（例如SGD随机梯度下降），用来在训练中更新参数，最小化损失函数。

2024-03-20 16:45:04 1023

原创 GeoPy1.2 地理数据处理入门（数据读取及展示）

高校教师，中科院 GIS 博士本文为原文章基础上，加上自己以及GPT4.0的总结整理而来提取码：7cbe–来自百度网盘超级会员V5的分享。

2024-03-18 16:00:40 975

原创深度学习每周学习总结P1（pytorch手写数字识别）

总结:数据导入部分：数据导入使用了torchvision自带的数据集，获取到数据后需要使用torch.utils.data中的DataLoader()加载数据模型构建部分：有两个部分一个初始化部分（init()）列出了网络结构的所有层，比如卷积层池化层等。第二个部分是前向传播部分，定义了数据在各层的处理过程。训练前的准备：在这之前需要定义损失函数，学习率，以及根据学习率定义优化器（例如SGD随机梯度下降），用来在训练中更新参数，最小化损失函数。

2024-03-15 17:26:13 1094

原创 SQL进阶（五）：With 函数 vs 视图函数

综合考虑，如果你的需求是经常重用某个特定的统计结果，且这些统计结果不需要在更复杂的查询中作为子查询使用，那么使用视图是个好选择。同样的，VIEW 和 WITH 能够帮助我们更好的去梳理 SQL 查询语句的结构，相较于使用复杂的子查询嵌套，两者都可以帮助我们提升代码的可阅读性，方便代码报错的时候提供更好的纠错调整能力。你可能很快注意到了，上面的 SQL 语句返回的是一个空的数组，不要担心，这是因为 executescript 在执行多条语句之后并不知道返回哪一条语句的结果。

2024-03-13 18:32:49 941

原创 SQL进阶（四）：Window 函数技巧

A通过每日登录的用户数，分析登录用户总数的趋势日期当日登录人数2023-07-011122023-07-024352023-07-031011我们希望输出的表是日期当日登录人数2023-07-011122023-07-023232023-07-03576。

2024-03-13 11:44:03 1123

原创 GeoPy1.1 地理数据处理入门

在地理学及相关专业，我们往往需要处理大量的地球观测数据和模拟结果，基于这些数据的处理结果进一步分析，得到一些客观规律或者研究结论。但是在处理过程中，我们会发现这些数据可能来源不同，格式不一。对于一些常见的地理数据格式，比如栅格数据、矢量数据等，大家比较容易想到用专业软件来处理，比如 Arcgis、MapGIS、ENVI 等，这些软件使用简单，也很强大，但是也有着一定的不足，比如（1）往往只能处理专业格式的数据（2）批量处理一般有着一定的门槛，需要进行二次开发（3）一般为商业软件，正版的授权费用较高等等。

2024-03-11 18:36:38 1057

原创 SQL进阶（三）：Join 小技巧：提升数据的处理速度

简而言之，这个查询是为了找出每个乘客等级（Pclass）中乘客生存状态与该等级平均生存率之间差异的平均平方值（即方差）。这可以帮助理解不同等级乘客生存率的一致性或波动性。

2024-02-26 00:10:01 1227

原创 SQL进阶（二）：复杂数据结构处理：让你的 SQL 更加高效

复杂数据结构处理：让你的 SQL 更加高效

2024-02-22 11:46:54 921

原创 SQL进阶（一）：SQL基础速览，以SQLite为例

本文是在原本sql闯关的基础上总结得来，加入了自己的理解以及疑问解答（by GPT4）

2024-01-20 11:04:27 1054 1

原创数据结构（五）数据结构与算法中的经典题

本文是在原本数据结构与算法闯关的基础上总结得来，加入了自己的理解和部分习题讲解。至此数据结构介绍已完结，后续会把数据结构算法题系列更完。邀请码: JL57F5。

2024-01-16 15:39:54 873

原创数据结构（四）树

本文是在原本数据结构与算法闯关的基础上总结得来，加入了自己的理解和部分习题讲解原活动链接邀请码: JL57F5 其实，在现实生活中也存在类似的结构。例如，在一个公司中员工架构最顶端是CEO，CEO的下面有若干副总，每个副总下面有若干部门经理，每个部门经理下面有若干基层员工。这种员工架构很容易用树这种数据结构来表示。二叉查找树（又叫作二叉搜索树或二叉排序树）是一种数据结构，采用了图的树形结构。数据存储于二叉查找树的各个结点中。请记住: 树是一种特殊的图, 它是一种无向无环的图，其中每个节点只有

2024-01-16 11:27:47 1073

原创数据结构（三）堆和哈希表

哈希表存储的是由键（key）和值（value）组成的数据。例如，我们将每个人的性别作为数据进行存储，键为人名，值为对应的性别, 一般来说，我们可以把键当成数据的标识符，把值当成数据的内容。为了对比一下哈希表的优势 , 我们先把这些数据存储到数组中看看效果此处准备了6个箱子（即长度为6的数组）来存储数据。假设我们需要查询Ally的性别，由于不知道Ally的数据存储在哪个箱子里，所以只能从头开始查询。这个操作便叫作“线性查找”。

2024-01-11 16:11:56 1130

原创数据结构（二）栈和队列

栈也是一种数据呈线性排列的数据结构，不过在这种结构中，我们只能访问最新添加的数据。栈就像是一摞书，拿到新书时我们会把它放在书堆的最上面，取书时也只能从最上面的新书开始取。与前面提到的数据结构相同，队列中的数据也呈线性排列。虽然与栈有些相似，但队列中添加和删除数据的操作分别是在两端进行的。就和“队列”这个名字一样，把它想象成排成一队的人更容易理解。在队列中，处理总是从第一名开始往后进行，而新来的人只能排在队尾。

2024-01-01 21:20:28 1139

原创数据结构（一）

算法，通俗点讲 , 就是一堆小伙伴和一份旅行指南一起前往目的地的过程。每个小伙伴都需要按照指南中的步骤来行动，以达到旅行的目的。同样地，编程中的算法也是一组指令，帮助我们完成特定任务或解决问题.请注意 : 这里所说的特定问题是多种多样，比如面试经常问的 “将随意排列的数字按从小到大的顺序重新排列”“寻找出发点到目的地的最短路径”，等等一些让人头皮发麻的问题结构，简单的理解就是关系，比如分子结构，就是说组成分子的原子之间的排列方式。严格点说，结构是指各个组成部分相互搭配和排列的方式。

2023-12-29 15:53:20 881

原创 pytorch文本分类（三）模型框架（DNN&textCNN）

假设选择的激活函数是Sigmoid函数，隐藏层和输出层的输出值为a ，则对于下图的三层DNN，利用和感知机一样的思路，我们可以利用上一层的输出计算下一层的输出，也就是所谓的DNN前向传播算法。填充，卷积核与图像尺寸不匹配，往往填充图像缺失区域，如果原始图片尺寸为5X5，卷积核的大小为3X3，如果不进行填充，步长为1的话，当卷积核沿着图片滑动后只能滑动出一个3X3的图片出来，这就造成了卷积后的图片和卷积前的图片尺寸不一致，这显然不是我们想要的结果，所以为了避免这种情况，需要先对原始图片做边界填充处理。

2023-12-18 23:24:30 1563 3

原创 pytorch文本分类（二）：引入pytorch处理文本数据

PyTorch是一个开源的Python机器学习库，应用于人工智能领域，如自然语言处理。它主要由Facebook的人工智能研究团队开发。

2023-12-14 09:41:48 986

原创 pytorch文本分类（一）：文本预处理

本文为自己在鲸训练营答题总结，作业练习都在和鲸社区数据分析协作平台 ModelWhale 上。在这里相关数据链接：https://pan.baidu.com/s/1iwE3LdRv3uAkGGI2fF9BjA?pwd=ro0v提取码：ro0v–来自百度网盘超级会员V4的分享。

2023-11-16 11:58:56 1043

原创数据分析实战 - 2 订单销售数据分析（pandas 进阶）

题目来源：和鲸社区的题目推荐：刷题源链接（用于直接fork运行。

2023-11-01 15:00:37 1426

原创 pytorch 入门（五）案例三：乳腺癌识别-VGG16实现

本文为内部限免文章在本案例中，我将带大家探索一下深度学习在医学领域的应用–完成乳腺癌识别，我们的数据集是由多张组成。关于环境配置请看我之前缩写博客：https://blog.csdn.net/qq_33489955/article/details/132890434?数据集：链接：https://pan.baidu.com/s/1xkqsqsRRwlBOl5L9t_U0UA?pwd=vgqn提取码：vgqn–来自百度网盘超级会员V4的分享。

2023-10-27 12:00:09 1130 1

原创 pytorch 入门（四）案例二：人脸表情识别-VGG16实现

本文为内部限免文章参考本文所写记录性文章，请在文章开头注明以下内容，复制粘贴即可。

2023-10-23 16:53:20 1211

原创 pytorch 入门（三）案例一：mnist手写数字识别

本文为内部限免文章。

2023-10-20 14:11:15 762

原创 pytorch 入门（二）

本文为内部限免文章。

2023-10-17 13:17:52 462

原创 Pandas进阶修炼120题-第五期（一些补充，101-120题）

其中，equal_rows 将是一个元组，包含一个数组，数组中的值是满足条件的行号，可以通过 equal_rows[0] 来访问这个数组。方法更改了 DataFrame 的显示样式，实际上您并没有修改 DataFrame 本身的数据，只是修改了其显示的样式。这是一个很好的方式来格式化 pandas DataFrame 的显示样式，而不真正更改 DataFrame 中的数据。是用来设置 Pandas 显示选项的，确保当您显示 DataFrame 时，所有的列都会被显示出来，而不是被截断。

2023-10-03 19:32:19 421

原创 pytorch 入门（一）

本文为内部限免文章参考本文所写记录性文章，请在文章开头注明以下内容，复制粘贴即可⬇️基础版模板⬇️。

2023-09-21 13:09:39 380

原创 pytorch环境配置

现在，你应该已经在 Jupyter Notebook 中设置了一个专门的 PyTorch 环境。每次你想使用这个环境时，只需在 Notebook 中选择相应的内核即可。在已激活的环境中，根据你的 CUDA 版本和操作系统，使用适当的命令来安装 PyTorch。注意这里需要点击自定义安装，点击展开所有选项，如果出现新版本比当前版本低则取消打勾。我的cuda是12.0 发现最新的pytorch是11.8，选择最新的即可。选择 Python 3.8 作为该环境的版本，你也可以选择其他版本。你可以选择其他名称。

2023-09-15 02:10:13 458 2

原创 Pandas进阶修炼120题-第四期（当Pandas遇上NumPy，81-100题）

d欧式距离（Euclidean distance）是在欧几里得空间中两点之间的 “直线” 距离。对于两个向量A\mathbf{A}A和B\mathbf{B}BdAB∑i1nAi−Bi2dABi1∑nAi−Bi2在 Pandas DataFrame 中，你可以很容易地计算两列之间的欧式距离。

2023-09-01 01:31:38 638 2

原创自动化邮件--用以拿到已fork项目中的原数据

【代码】自动化邮件--用以拿到已fork项目中的原数据。

2023-08-11 09:41:26 163

原创 Pandas进阶修炼120题-第三期（金融数据处理，51-80题）

因此，如果您在Python或Java等语言的路径中使用反斜杠，则需要转义它们(’ \ ')或使用原始字符串字面量(例如，在Python中，‘r ’ c:\path\to\file’ ')。Bollinger带包括一个作为n周期简单移动平均线(SMA)的中间带，一个在中间带之上的K倍n周期标准差处的上带，以及一个在中间带之下的K倍n周期标准差处的下带。因此，总而言之，df.isnull().sum()是一个方便的一行代码，它将返回DataFrame df的每列中缺失或NaN值的数量。

2023-07-29 15:49:00 1731 2

原创 Pandas进阶修炼120题-第二期（Pandas数据处理，21-50题）

pandas 120题

2023-06-24 17:39:13 555 4

原创 Pandas进阶修炼120题-第一期（Pandas基础，1-20题）

pandas 120道习题总结

2023-06-07 17:10:46 1225

原创数据分析实战 - 1 农民工数据预测（线性回归模型的使用）

以下是农民工收入的统计数据，使用历史年份对制造业，建筑业，批发和零售业，交通运输仓储和邮政业，住宿餐饮业，居民服务修理和其他服务业收入分别建立回归模型训练，并且对2023年的这几个维度的值进行预测；以下是农民工收入的统计数据，使用历史年份对东部地区，中部地区，西部地区，东北地区收入分别建立回归模型训练，并且对2023年的这几个维度的值进行预测；以下是农民工收入的统计数据，使用历史年份对总体农民工，外出农民工，本地农民工分别建立回归模型训练，并且对2023年的这几个维度的值进行预测；

2023-06-02 17:13:40 450

原创 TensorFlow 1.x学习（系列二：4）：自实现线性回归

w1∗x1w2∗x2w3∗x3wn∗xnbiasw1∗x1w2∗x2w3∗x3...wn∗xnbias1：准备好1特征1目标值(都为100行1列)yx∗0.70.8yx∗0.70.82: 建立模型随机初始化准备一个权重w,一个向量bypredictx∗wbypredictx∗wb3:求损失函数，误差y1−。

2023-05-02 22:56:23 1917 4

原创 TensorFlow 1.x学习（系列二：3）：变量与tensorboard可视化

cmd中输入相应命令：tensorboard --logdir=C:\Users\24474\Desktop\DataAnalysis\classification_working\tmp\summary\test\ --port=6006。参考路径：tensorboard --logdir=C:\Users\24474\Desktop\DataAnalysis\classification_working\tmp\summary\test\ --port=6006。打开上述网址即可看到可视化结果。

2023-04-16 17:40:14 313

原创 TensorFlow 1.x学习（系列二：2）：张量的动态形状与静态形状，基本的张量api

对于静态形状来说，一旦张量形状固定了，不能再次设置静态形状，不能跨维度修改动态形状可以去创建一个新的张量,改变的时候一定要注意元素数量要匹配。

2023-04-01 16:05:05 513

原创 DataFrame：依条件进行数据抽取

抽取符合条件的数据（我这里某种分类的数据条数大于1000）作为新的数据集，原来的数据集删除抽取的部分。

2023-03-24 17:52:32 804

空空如也

空空如也