自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 关于log

关于log的知识小记

2023-04-24 12:06:59 90

原创 关于docker

关于docker的一些知识点

2023-04-24 12:01:10 198

原创 关于gdb

GDB全称GDB Debugger。GDB具备各种调试功能,使用GDB的调试人员可以查看及修改程序的内部变量值。

2023-04-24 11:29:18 874

原创 每天一点点--C++

每天一点点--C++

2023-04-18 08:41:33 73

原创 每天一点点--C++

每天一点点--关于C++

2023-04-18 08:34:15 33

原创 每天一点点--md5sum

每天一点点--关于md5sum

2023-04-18 08:32:49 434

原创 关于新手使用git

新手入门git

2023-04-18 08:26:47 36

原创 每日学习(1)关于shell脚本

关于shell脚本的一些小tips

2022-12-01 22:26:55 277

原创 Pandas打卡第三次任务

第三章 索引1.表的列索引df=pd.read_csv('data/learn_pandas.csv',usecols=['School','Grade','Name','Gender','Weight','Transfer'])df['Name'].head()解释:1. usecols是什么意思:pd.read_csv中的usecols函数实现读取指定列2.df[‘Name’].head()df[‘name’] #得到的是不包含列索引的Series结构df[[‘name’]

2020-12-22 21:45:33 216

原创 pandas打卡预备知识

因为自己电脑配置的问题,开始喜欢上用其他平台写代码,直接看结果;最近天池或许是长期不用,发现老是不能保存,是不是就出现错误,开始偏心百度AIstdio;第一次任务完成的情况如下:my_func(i)=for i in range(5)只复制粘贴如下内容,显示错误 菜鸡提问: []的作用是什么?[my_func(i) for i in range(5)]个人理解就是,加[]表示属于数组,输出为数组;否则认为是函数,并且是错误的函数书写my_func = lambda x: 2*xmy_fun

2020-12-16 15:30:46 231

原创 每日刷题笔记——leetcode 767. 重构字符串

今天的每日一题,我学到了一个新知识:pair题目:767. 重构字符串给定一个字符串S,检查是否能重新排布其中的字母,使得两相邻的字符不同。若可行,输出任意可行的结果。若不可行,返回空字符串。示例 1:输入: S = “aab”输出: “aba”示例 2:输入: S = “aaab”输出: “”注意:S 只包含小写字母并且长度在[1, 500]区间内。题目理解:贪心算法计算每个字母出现的次数,只有满足出现次数最多的字母的个数小于等于(n+1)/2,才会使得两个相邻的字符不相同;所

2020-11-30 20:16:02 129

原创 Leetcode每日刷题——两数之和

Leetcode每日一题——两数之和题目描述给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]题目大意找到一个数组里相加为目标值的两个整数,同时返回其数组下标。注意要求,数组中同一个元

2020-10-03 15:29:06 108

原创 Leetcode打卡

二. 对撞指针LeetCode 1 Two Sum题目描述给出一个整型数组nums,返回这个数组中两个数字的索引值i和j,使得nums[i] + nums[j]等于一个给定的target值,两个索引不能相等。如:nums= [2,7,11,15],target=9 返回[0,1]审题:需要考虑:开始数组是否有序;索引从0开始计算还是1开始计算?没有解该怎么办?有多个解怎么办?保证有唯一解。分析实现暴力法O(n^2)时间复杂度为O(n^2),第一遍遍历数组,第二遍遍历当前遍历值之后的

2020-08-28 21:11:48 153

原创 leetcode打卡——临时copy

一.查找表考虑的基本数据结构第一类: 查找有无–set元素’a’是否存在,通常用set:集合set只存储键,而不需要对应其相应的值。set中的键不允许重复第二类: 查找对应关系(键值对应)–dict元素’a’出现了几次:dict–>字典dict中的键不允许重复第三类: 改变映射关系–map通过将原有序列的关系映射统一表示为其他349 Intersection Of Two Arrays 1题目描述给定两个数组nums,求两个数组的公共元素。如nums1 = [1,2,2,1

2020-08-25 19:50:05 112

原创 datawhale组队打卡--动态规划

动态规划若要解一个给定问题,我们需要解其不同的部分(即子问题),再根据子问题的解以得出原问题的解。动态规划往往用于优化递归归类,例如斐波那契数列,如果运用递归的方式来弥补会重复计算很多相同的子问题,利用动态规划的思想可以减少计算量。动态规划法仅解决每个子问题一次,具有天然剪枝的功能,从而减少计算量,一旦有人给定子问题的解已经算出,则将其记忆化存储,刹车下一步需要同一个子问题解之时直接查表。动态规划模板步骤:确定动态规划状态写出状态转移方程(画出状态转移表)考虑初始化条件考虑输出状态考虑对时

2020-08-22 21:08:14 166

原创 DataWhale打卡——分治

分治主要思想分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。分治算法的步骤分:递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题);治:将这些规模更小的子问题逐个击破;合:将已解决的子问题逐层合并,最终得出原问题的解;分治法适用的情况原问题的计算复杂度随着问题的规模的增加而增加。原问题能够被分解成更小的子问题。子问题的结构和性质与原问题一样,并

2020-08-19 19:36:35 98

原创 动手学数据分析Task01

动手学数据分析Task01第一章:数据加载1.1 载入数据1.1.1任务一:导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 任务二:载入数据(1) 使用相对路径载入数据(2) 使用绝对路径载入数据df = pd.read_csv('train.csv')df.head(3)**【思考】**知道数据加载的方法后,试试pd.read_csv()和pd.read_table()的不同,如果想让他们效果一样,需要怎么做?了解

2020-08-19 10:23:40 296

原创 LeetCode每日刷题 109.有序链表转换二叉搜索树

每日刷题–109.有序链表转换二叉搜索树目录题目描述题目大意解题方法

2020-08-18 10:06:09 163

原创 SQL ZOO:SELECT within SELECT Tutorial

SELECT within SELECT Tutorial1.List each country name where the population is larger than that of ‘Russia’.SELECT name FROM world WHERE population > (SELECT population FROM world WHERE name='Romania')2.Show the countries in Europe with a

2020-08-17 09:50:25 1531

原创 Task6 基于深度学习的文本分类

学习目标了解Transformer的原理和基于预训练语言模型(Bert)的词表示学会Bert的使用,具体包括pretrain和finetune文本表示方法Part4Transformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。重点关注编码部分。他们结构完全相同,但是并不共享参数,每一个编码器都可以拆解成两部分。在对输入序列做词的向量化之后

2020-08-04 20:11:48 131

原创 SQL ZOO--SUM and COUNT问题与解答

1.Show the total population of the world.SELECT SUM(population)FROM world2.List all the continents - just once each.SELECT DISTINCT(continent)FROM world关键词 distinct用于返回唯一不同的值。3.Give the total GDP of AfricaSELECT SUM(gdp)FROM worldwhere contine

2020-08-04 13:18:42 117

原创 Task5 基于深度学习的文本分类

Task5 基于深度学习的文本分类Word2Vec通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并基于这个中心词去预测窗口里其他词出现的概率。因此,word2vec模型可以方便地从新增语料中学习到新增词的向量表达,是一种高效的在线学习算法(online learning)。word2vec的主要思路:通过单词和上下文彼此预测,对应的两个算法分别为:Skip-grams (SG):预测上下

2020-07-31 21:45:38 108

原创 task4 基于深度学习的文本分类1-fastText

task4 基于深度学习的文本分类1-fastText学习目标1.学习FastText的使用和基础原理2.学会使用验证集进行调参文本表示方法FastTextFastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。所以FastText是一个三层的神经网络,输入层、隐含层和输出层。FastText在文本分类任务上,是优于TF-IDF的:FastText用单词的Em

2020-07-27 20:11:34 184

原创 Datawhale组队学习——打卡任务Task3 基于机器学习的文本分类

Task3 基于机器学习的文本分类学习目标学会TF-IDF的原理和使用使用sklearn的机器学习模型完成文本分类文本表示方法 Part1在机器学习算法的训练过程中,假设给定 N 个样本,每个样本有 M 个特征,这样组成了 N×M 的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×width×3的特征图,一个三维的矩阵来进入计算机进行计算。但是在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计算机能够运算的数字或向量的方法一

2020-07-25 20:37:03 187 1

原创 Datawhale组队学习——打卡任务Task2数据读取与数据分析

数据读取与分析本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。学习目标学习使用Pandas读取赛题数据分析赛题数据的分布规律数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.read_csv('./data/train_set.csv', sep='\t', nrows=100)这里的read_c

2020-07-22 19:51:31 122

原创 Datawhale组队学习——打卡任务Task1赛题理解

Datawhale组队学习——打卡任务Task1赛题理解赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:入门自然语言处理,接触NLP的预处理、模型构建和模型训练赛题任务:对新闻文本进行分类属于典型的字符识别问题学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路打开在网站下载的赛题数据文件,我们可以看到对应的训练集和测试集的下载网址,自行去对应网站下载数据集。数据读取使用Pandas库完成数据读取操作,并对赛题数据进行分析解题思路思路1:TF-IDF+

2020-07-21 17:43:00 218

原创 SQL之SELECT from Nobel Tutorial

经过一段时间练习,第二部分习题终于可以很好的做出来啦。题目源自 https://sqlzoo.net。这个网站是一个很好的练习SQL学习网站。可以配合书《SQL必知必会》一起使用。1.Change the query shown so that it displays Nobel prizes for 1950.SELECT yr, subject, winner FROM nobel WHERE yr = 1950很简单的过滤数据,数据根据WHERE子句中指定的搜索条件yr = 1950进行

2020-06-19 12:10:30 275

原创 决策树--ID3详细代码

写在前面的话:所有代码均是照着《机器学习实战》书上敲得,只是自己在学习过程中的一些注释仅供自己复习。只是调试成功之后的留档,不喜勿喷,可以绕道。from math import logimport operatorimport matplotlib.pyplot as pltimport pickle#计算给定数据集的香农熵def calcShannoEnt(dataSet): numEntries=len(dataSet) labelCounts={} for fea

2020-05-14 11:41:28 358

原创 机器学习实战-k近邻算法-约会网站代码以及详细解释

from matplotlib.font_manager import FontPropertiesimport matplotlib.lines as mlinesimport matplotlib.pyplot as pltimport numpy as npimport operatordef classify0(inX,dataSet,labels,k): #输入向量是...

2020-05-07 14:20:45 228

原创 #**机器学习之K邻近算法代码实现以及详细解释****

import numpy as npimport operatordef createDataSet(): group=np.array([[3,104],[2,100],[101,10],[99,5]]) labels=['爱情片','爱情片','动作片','动作片'] return group,labelsdef classify0(inX,dataSet,l...

2020-05-06 10:32:58 194 1

原创 python编写小错误

NameError: name 'tile' is not defined编写时命名未定义源程序为diffMat=tile(inX,(dataSetSize,1))-dataSet更改后应该为diffMat=np.tile(inX,(dataSetSize,1))-dataSetValueError: only 2 non-keyword arguments ac...

2020-05-06 10:28:17 433

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除