自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 [学习报告]《LeetCode零基础指南》(第一讲) 函数

不用加法对两个数相加(下面三题一样 因此总结到一起)leetcode 371. 两整数之和面试题17.01 不用加号的加法剑指offer 65 不用加减乘除做加法解法一:过辣解法二:亦或运算结合与运算 递归或循环 注意判断条件 以及python自身的特殊情况class Solution(object): def getSum(self, a, b): """ :type a: int :type b: int :rt.

2022-04-04 23:03:57 1502

原创 连接服务器免密登录

最近几天实验室服务器经常连接中断,每次中断后我要重新输入一遍密码,密码因为安全设置的也不短,每次熟真的很累。于是想起来之前师兄说可以设个密钥什么的,刚刚成功实践了下,记录一下。目录第一步:本地生成公钥和密钥第二步:服务器第三步(扩展):多台电脑连接服务器本次教程建立在VS Code+Remote-SSH插件开发环境。本地环境是Windows,远程环境是Linux的普通用户,非root。第一步:本地生成公钥和密钥打开C:\Users\你的用户名文件夹,中文Windows系统是C:\用户\你的用户名文件

2021-10-08 16:53:45 488

原创 记录一个问题:pip命令安装失败

1.pytorch安装今天换了新的环境 安装pytorch的时候使用官网命令怎么都安装不上去 去掉python -c之后成功安装2.pip安装东西想安装一个nvitop(GPU实时显示管理工具)之前用的很舒服 但是今天换环境安装一直安装失败 之后加上了豆瓣源安装成功,应该是国内网的原因 所有的pip安装都可以按照这种方式安装,又快又好 -i接豆瓣网址(清华也行)后面的trust表示信任pip install nvitop -i http://pypi.douban.com/simple/ --tru

2021-09-23 20:45:51 396

原创 2.2 Transformer相关原理-图解transformer

目录1. 前言2.从整体宏观来理解Transformer3. 从细节理解Transformer3.1 Transformer 的输入3.2 Encoder(编码器)3.3 Self-Attention 整体理解3.4 Self-Attention 的细节计算Query 向量,Key 向量,Value 向量(Q K V)计算 Attention Score(注意力分数)使用矩阵计算 Self-Attention多头注意力机制(multi-head attention)4. 代码实现矩阵计算 Attention

2021-08-18 23:25:49 1794

原创 2.1 Transformer相关原理-图解Attention

目录图解AttentionSeq2seq模型细节图解Transformer图解AttentionSeq2seq模型序列到序列(seq2seq)顾名思义输入和输出都是序列,应用场景有很多,比如机器翻译、文本摘要、图像描述生成等。一个序列到序列(seq2seq)模型,接收的输入是一个(单词、字母、图像特征)序列,输出是另外一个序列。一个训练好的模型如下图所示:在神经机器翻译中,一个序列是指一连串的单词。类似地,输出也是一连串单词。细节seq2seq模型是由编码器(Encoder)和解码器(De

2021-08-18 15:25:14 429

原创 机器学习吃瓜(西瓜、南瓜书)笔记 task05-第六章支持向量机

目录6.1.算法原理6.2 软间隔6.3 支持向量机6.1.算法原理几何角度,对于线性可分的数据集,SVM就是找一个离正负样本都最远的超平面,相比于感知机,其解是唯一的,(感知机只要能分开正负样本即可),且泛化性更好。现实任务中,线性不可分的情形最常见的,因此要允许支持向量机犯错。6.2 软间隔6.3 支持向量机...

2021-07-28 22:16:43 385

原创 机器学习吃瓜(西瓜、南瓜书)笔记 task04-第五章神经网络

目录5.1 MP神经元5.2 感知机5.3 神经网络5.1 MP神经元模拟生物神经元,接受n个输入并得到加权和,和自身特有的阈值进行比较(作差),经过激活函数得到输出结果。单MP神经元:感知机,对数几率回归(逻辑回归)多MP神经元:神经网络5.2 感知机5.3 神经网络...

2021-07-25 23:16:46 348

原创 机器学习吃瓜(西瓜、南瓜书)笔记 task03-第四章决策树

文章目录1. 算法原理2. ID3决策树3. C4.5决策树4. CART决策树1. 算法原理逻辑角度:一堆if-else的组合(一堆判断 核心在于判断条件)几何角度:特征空间,找划分点最终目的:将样本约分越“纯”——信息熵度量纯度2. ID3决策树自信息 I(X)=−log2P(x)I(X)=-log_{2}P(x)I(X)=−log2​P(x)信息熵-自信息的期望,概率*自信息值以离散型为例: H(X)=E[I(X)]=−∑xPlog2P(x)H(X)=E[I(X)]=-\sum_{x

2021-07-22 11:25:28 571

原创 机器学习吃瓜(西瓜、南瓜书)笔记 task02-第三章 线性回归

文章目录线性回归 求解w,b最小二乘法极大似然估计凸函数最优解证明凸函数海塞矩阵机器学习三要素模型策略算法线性回归 求解w,b最小二乘法极大似然估计凸函数最优解证明凸函数海塞矩阵机器学习三要素模型根据问题,确定假设空间。例如根据发际线高度预测计算机水平。假设空间是 根据我们的经验和观察到的数据形态 应该是个线性关系策略算法...

2021-07-20 00:39:14 580

原创 机器学习吃瓜(西瓜、南瓜书)笔记task01-第一、二章

根据南瓜书作者的建议,一二章简单看下。西瓜书第1章和第2章主要是讲一些基本概念和术语,大家自己看就好,不过第1章和第2章有一些知识点可以跳过不看,这些知识点在没有学过后面章节的具体机器学习算法之前较难理解,下面我将其划出来:第1章:【1.4-归纳偏好】可以跳过第2章:【2.3.3-ROC与AUC】及其以后的都可以跳过1. 绪论2. 模型评估感谢datawhale提供的学习交流平台和资源,学习视频可以参照https://www.bilibili.com/video/BV1Mh411e7VU.

2021-07-13 11:17:37 248

原创 数据分析-task5: 作者信息关联

文章目录1. 任务说明2. 数据处理步骤3. 社交网络分析3.1 图类型3.2 图统计指标4 具体代码以及讲解1.读数据2.创建作者链接的无向图3.将作者关系图进行绘制4.得到作者之间的距离5.最大连通子图绘图显示1. 任务说明学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系;学习内容:构建作者关系图,挖掘作者关系学习成果:论文作者知识图谱、图关系挖掘2. 数据处理步骤将作者列表进行处理,并完成统计。具体步骤如下:将论文第一作者与其他作者(论文非第一作者

2021-01-23 23:10:03 177

原创 数据分析-task4:论文种类分类

文章目录任务说明数据处理步骤文本分类思路具体代码实现以及讲解通用部分:数据读取+预处理+类别编码1.字段读取2.预处理:拼接+整理格式扩展知识3.类别编码思路1思路2任务说明学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;学习内容:使用论文标题完成类别分类;学习成果:学会文本分类的基本方法、TF-IDF等;数据处理步骤在原始arxiv论文中论文都有对应的类别,而论文类别是作者填写的。在本次任务中我们可以借助论文的标题和摘要完成:对论文标题和摘要进行处理;对论

2021-01-22 22:56:24 367 2

原创 数据分析-task3:论文代码统计

文章目录任务说明数据处理步骤正则表达式任务说明任务主题:论文代码统计,统计所有论文出现代码的相关统计;任务内容:使用正则表达式统计代码连接、页数和图表数据;任务成果:学习正则表达式统计;数据处理步骤在原始arxiv数据集中作者经常会在论文的comments或abstract字段中给出具体的代码链接,所以我们需要从这些字段里面找出代码的链接。确定数据出现的位置;使用正则表达式完成匹配;完成相关的统计;正则表达式正则表达式(regular expression)描述了一种字符串匹配

2021-01-18 23:07:20 307 2

原创 数据分析-任务2:论文作者统计

文章目录2.1 任务说明2.2 数据处理步骤2.3 字符串处理2.4 具体代码实现以及讲解2.4.1 数据读取2.4.2 数据统计2.1 任务说明任务主题:论文作者统计,统计所有论文作者出现评率Top10的姓名;任务内容:论文作者的统计、使用 Pandas 读取数据并使用字符串操作;任务成果:学习 Pandas 的字符串操作;2.2 数据处理步骤在原始arxiv数据集中论文作者authors字段是一个字符串格式,其中每个作者使用逗号进行分隔分,所以我们我们首先需要完成以下步骤:使用逗号对

2021-01-14 15:44:03 794 2

原创 pandas-task11-综合练习.md

文章目录显卡日志解决思路水压站点的特征工程显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchma

2021-01-12 15:18:04 521

原创 数据分析-任务1:论文数据统计.md

文章目录论文数据统计1.1 任务说明1.2 数据集介绍1.3 arxiv论文类别介绍1.4 具体代码实现以及讲解论文数据统计1.1 任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用 Pandas 读取数据并进行统计;任务成果:学习 Pandas 的基础操作;可参考的学习资料:开源组织Datawhale joyful-pandas项目1.2 数据集介绍数据集来源:数据集链接;数据集的格式如下:id:arXiv ID,可用于

2021-01-10 22:25:40 538

原创 pandas-task10-时序数据.md

文章目录一、时序中的基本对象二、时间戳三、时间差四、日期偏置五、时序中的滑窗与分组六、练习Ex1:太阳辐射数据集Ex2:水果销量数据集本周末期末考试 三门 需要复习 只能大概快速梳理一下了 写了下练习题 写的不全请见谅 之后会补上一、时序中的基本对象二、时间戳三、时间差四、日期偏置五、时序中的滑窗与分组六、练习Ex1:太阳辐射数据集现有一份关于太阳辐射的数据集:将 Datetime, Time 合并为一个时间列 Datetime ,同时把它作为索引后排序。先看下表格什么样子:d

2021-01-08 15:57:52 336 1

原创 pandas-task09-分类数据.md

文章目录一、cat(category)对象1. cat对象的属性2. 类别的增加、删除和修改1. 增加 add_categories2.删除 remove_categories3.改 rename_categories二、有序分类1. 序的建立2. 排序和比较三、区间类别1. 利用cut和qcut进行区间构造2. 一般区间的构造3. 区间的属性与方法四、练习Ex1:统计未出现的类别Ex2:钻石数据集一、cat(category)对象1. cat对象的属性pandas中有一个dtype为category

2021-01-07 21:29:15 201

原创 pandas-task08-文本数据.md

文章目录一、str对象1. str对象的设计意图2. []索引器3. string类型二、正则表达式基础1. 一般字符的匹配2. 元字符基础3. 简写字符集三、文本处理的五类操作1. 拆分2. 合并3. 匹配4. 替换5. 提取四、常用字符串函数1. 字母型函数2. 数值型函数3. 统计型函数4. 格式型函数五、练习Ex1:房屋信息数据集![在这里插入图片描述](https://img-blog.csdnimg.cn/2021010622052797.png?x-oss-process=image/wate

2021-01-06 22:11:40 331 3

原创 pandas-task07-缺失数据.md

文章目录缺失数据一、缺失值的统计和删除1. 缺失信息的统计2. 缺失信息的删除二、缺失值的填充和插值1. 利用fillna进行填充2. 插值函数三、Nullable类型1. 缺失记号及其缺陷2. Nullable类型的性质3. 缺失数据的计算和分组四、练习(待完成)Ex1:缺失值与类别的相关性检验Ex2:用回归模型解决分类问题缺失数据在数据处理过程种我们经常会遇到缺失数据如NaN或None这样的值,我们一般会对这些数据单独处理,删除或者修改或者忽略等,下面分不同情况讨论下如何处理缺失数据。下面操作以此

2021-01-02 23:45:08 1381 3

原创 pandas-task-special.md

【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份,在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据,在前一张表中增加一列表示该公司该年份的收入熵指标 I。df1 = pd.read_csv('./data/task_special/company.csv')df2 = pd.read

2021-01-01 23:20:42 161 2

原创 pandas-task06-连接.md

文章目录一、关系型连接1. 连接的基本概念2. 值连接 merge练一练3. 索引连接二、方向连接1. concat2. 序列Series与表DataFrame的合并三、类连接操作1. 比较2. 组合四、练习Ex1:美国疫情数据集Ex2:实现join函数一、关系型连接1. 连接的基本概念对DataFrame或命名的Series对象,按照键连接,和数据库的连接基本一致一样,同样也有左连和右连。重复数据按照笛卡尔积进行连接。2. 值连接 merge上面说的按照键连接也是一种值连接,除了按照一列值进行连

2020-12-29 23:14:53 184 2

原创 pandas-task05.md

文章目录变型一、长宽表的变形1. pivot-长变宽2. pivot_table3. melt-宽变长4. wide_to_long二、索引的变形1. stack与unstack2. 聚合与变形的关系三、其他变形函数1. crosstab2. explode3. get_dummies四、练习Ex1:美国非法药物数据集Ex2:特殊的wide_to_long方法变型为什么要变型?在不同的场景下我们可能需要不同形式的数据,以便更好地展示。如练习1中的数据除了年份其余大部分数据都是相似的,将不同的年份细分可

2020-12-27 00:29:25 1114

原创 pandas-task04.md

文章目录第四章 分组一、分组模式及其对象1. 分组的一般模式2.分组的本质-按条件列表中元素的值的组合来分组(数据来源组合的unique值)多属性分组复杂逻辑分组练一练3.Groupby对象二、聚合函数1. 内置聚合函数2.agg方法三、变换和过滤1. 变换函数与transform方法2. 组索引与过滤四、跨列分组五、练习Ex1:汽车数据集第四章 分组一、分组模式及其对象1. 分组的一般模式分组依据 、 数据来源(要操作的数据,如身高、体重、分数) 、 操作及其返回结果df.groupby(分组依

2020-12-25 22:34:44 207

原创 pandas-task03.md

索引一、索引器1. 表的列索引一般通过[ ]来索引,如单列df[‘Student’],多列[]要传入列表如df[[‘School’,‘Grade’]].head()单列也可以df.Student取出2. 序列的行索引【a】以字符串为索引的 Series

2020-12-22 22:49:35 204

原创 pandas-task02.md

Mon 06Mon 13Mon 20Completed task Active task Future task Future task2 Completed task in the critical line Implement parser and jison Create tests for parser Future task in critical li

2020-12-19 23:25:58 213 3

原创 pandas_task01-预备知识.md

第一章 预备知识python基础1. 列表推导式与条件赋值列表表达式#第个*是映射函数,第二个*是指代的对象 [* for i in *]列表表达式还支持多层嵌套 [m+'_'+n for m in ['a', 'b'] for n in ['c', 'd']]个人理解:虽然简单了,字数变少了,但是是可读性降低了,对程序员没那么友好。简单的一步操作可以,多层嵌套或者复杂逻辑不太建议过多使用该方式。条件赋值value = a if condition else b :2.匿名函数和

2020-12-16 21:19:07 171

原创 深度学习七日入门体验-PaddlePaddle

疫情期间在家闲着没事,想学一些CV方面的知识。之前学了七月在线的一个CV课和一个DL课程,但是都是去年的视频了,对CV知识有了初步的了解,但也不深,尤其是代码方面没有讲解,还是云里雾里的。刚好七月的课结束了看到百度的的七日入门深度学习,每天以直播的形式教学,每天有理论知识讲解和现场撸代码,群里助教回复的都很及时,给的建议也都很有效,即使问的很低级的问题大家也不会嘲笑你,终于七天的学习结束了...

2020-04-08 00:12:50 307

转载 SVN(转载自周家大小姐)

安装说明开发人员强烈建议使用IDE中的SVN插件更加智能与人性化。首先安装SVN客户端,windows一般选择乌龟客户端https://tortoisesvn.net/downloads.html。根据系统位数选择相应客户端进行安装。如果你喜欢用命令行操作,请务必记得勾选command line client tool为will be install on local ha...

2019-05-16 15:17:26 126

原创 java定时任务

记录一下遇到的坑和学到的东西。我有一个需求是显示一个表格,表格由两部分组成。一部分是每月一日从数据库中查出的固定数据,这部分表格数据在当月一直不变,另外一部分是实时查出的数据。刚开始没绕过来,只知道要用定时任务,后来跟同学交流后明白了应该每月一日去数据库查我需要的数据,查处后插入一个专门记录这个数据的表,定时任务做的事只是每月一次的查询和插入。固定数据我还是从数据库中查,只不过现在查的是我之前...

2019-05-16 14:56:40 523

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除