自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 特征处理—特征筛选

特征处理特征筛选方差过滤相关性过滤卡方过滤F检验互信息法Embedded嵌入法Wrapper包装法特征筛选来源:菜菜方差过滤相关性过滤卡方过滤F检验互信息法Embedded嵌入法Wrapper包装法

2021-09-27 16:39:38 174

原创 colab地址

colab地址https://drive.google.com/drive/my-drive

2021-03-14 21:08:47 979

原创 2021-03-01

机器学习一1 逻辑回归2 决策树

2021-03-01 18:12:17 146

原创 2021-03-01

排序1.快排原理:2.堆排序3.滑动窗口4.双指针(1)对撞指针(2)快慢指针

2021-03-01 16:43:13 92

原创 leetcode-169、229

169.多数元素https://leetcode-cn.com/problems/majority-element-ii/solution/liang-fu-dong-hua-yan-shi-mo-er-tou-piao-fa-zui-zh/摩根投票法摩根投票法思路根据上述的算法思想,我们遍历投票数组,将当前票数最多的候选人与其获得的(抵消后)票数分别存储在 major 与 count 中。当我们遍历下一个选票时,判断当前 count 是否为零:若 count == 0,代表当前 major

2020-08-30 15:47:10 464

原创 数据结构与算法——排序

排序冒泡排序比较相邻两个元素,大的往后放,第一次冒泡把最大的找出来放到组后,第二次冒泡把第二大的数放在最后,以此类推,图如下:选择排序感觉和冒泡是反着来的,找最小的放在第一位,以此类推,不对,和冒泡原理还是不一样,它是一直把第一个和后面的进行比较,而冒泡是两两比较...

2020-08-28 23:10:28 85

原创 决策树

1.决策树的介绍决策树是一种常见的分类模型,在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通常会先看男方是否有房产,如果有房产再看是否有车产,如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。决策树的主要优点:具有很好的解释性,模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。决策树的主要缺点:模型容易过拟合,需要采用减枝技术处理。不能很好利用连续

2020-08-23 23:50:06 129

原创 基于逻辑回归的分类预测

基于逻辑回归的分类预测逻辑回归的介绍逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。而对于逻辑回归而言,最为突出的两点就是其模型简单和模型的可解释性强。逻辑回归模型的优劣势:优点:实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低;缺点:容易欠拟合,分类精度可能不高逻辑回归的应用逻辑

2020-08-20 23:52:41 301

原创 数据挖掘实践(资金流入流出预测)

01.数据探索与分析import pandas as pdimport numpy as npimport warnings import datetimeimport seaborn as snsimport matplotlib.pyplot as pltimport datetime from scipy import statsimport warningswarnings.filterwarnings('ignore')# 设置数据集路径dataset_path =

2020-08-20 23:44:53 408

转载 阿里巴巴2017秋招研发工程师笔试题笔记

(单选题) 有个特殊的餐厅,对客人的要求是如果要离开餐厅一定要看下餐厅内有没有比你迟进来的人,一定要所有比你迟进来的人离开后你才能离开,有一天甲,乙,丙,丁四个客人先后进入了这家餐厅,那么他们离开的顺序不可能是:A、丙、乙、甲、丁B、甲、乙、丙、丁C、乙、甲、丙、丁D、乙、丙、甲、丁E、丁、丙、甲、乙F、丁、丙、乙、甲先进入餐厅的人可能在后面的人进来之前已经出去参考:https://blog.csdn.net/weixin_43538934/article/details/8853475

2020-08-14 21:14:09 267

原创 递归

递归(1)终结条件(2)进行处理(3)调用函数(4)清理当前层

2020-08-09 23:34:43 77

原创 树、二叉树、二叉搜索树

树二叉树二叉搜索树空树也是二叉搜索时

2020-08-09 23:00:34 72

原创 数组、链表、跳表

数组、链表、跳表数组的插入、访问等操作的时间复杂度都是O(1)链表的时间复杂度如下表所示:除了查找是O(n),其他都是O(1)然后是跳表,为了处理链表中,查找时间复杂度为O(n),所以出现了跳表...

2020-08-09 22:28:07 99

原创 时间复杂度和空间复杂度

时间复杂度第二个是嵌套的循环第一个时间复杂度是O(N)第二个时间复杂度是O(1)面试四件套(1)和面试官确认题目是什么意思(2)像有多少种解决办法,并且同时分析程序的时间复杂度和空间复杂度(3)找到最优的解法(4)测试结果斐波那契额数列时间复杂度怎么计算,这个是一个递归问题,递归就是要不断地调用函数,一直重复进入函数,可以画一个树状图来表示:可以看出节点数是按照指数级增长的,所以写代码的时候一定不可以直接写递归,要用一个内存把数据缓存下来简单的思考:二叉树的遍历每个

2020-08-09 20:41:55 89

原创 数据结构与算法——Leetcode11

11. 盛最多水的容器给你 n 个非负整数 a1,a2,…,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器,且 n 的值至少为 2。来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/container-with-most-water图中垂直线代表输入数组 [1,8,

2020-08-09 12:05:12 112

原创 “2020创青春·交子杯” 新网银行金融科技挑战赛

“2020创青春·交子杯” 新网银行金融科技挑战赛 AI算法赛道https://www.kesci.com/custom_landing/xwbank赛事背景2020年“创青春·交子杯”新网银行金融科技挑战赛-AI算法赛道,旨在鼓励选手运用前沿的人工智能技术解决金融科技等领域中的实际问题,激发选手创新能力,增强其动手能力。比赛挑战题目为“看见你的呼吸”,该项技术可应用于金融在线业务的生物识别、智能家居感应、智慧健康监控管理、健身训练助手等多个领域,期待挑战者利用机器学习和人工智能的最新成果,根据手机传

2020-08-09 10:52:33 1284

原创 数据结构与算法——Leetcode

Leetcode26. 删除排序数组中的重复项给定一个排序数组,你需要在 原地 删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/remove-duplicates-from-sorted-array示例 1:给定数组 nums = [1,1,2], 函数应该返回新的长度 2,

2020-08-06 11:29:31 182

原创 kaggle——全球小麦检测

这里写自定义目录标题全球小麦检测导入依赖的库导入数据数据增强全球小麦检测使用图像处理来检测小麦头https://www.kaggle.com/c/global-wheat-detection导入依赖的库import pandas as pdimport numpy as npfrom sklearn.model_selection import StratifiedKFoldimport albumentations as Afrom albumentations.pytorch.tran

2020-08-04 22:10:53 4900 7

原创 Leetcode——分治

分治引文MapReduce(分治算法的应用) 是 Google 大数据处理的三驾马车之一,另外两个是 GFS 和 Bigtable。它在倒排索引、PageRank 计算、网页分析等搜索引擎相关的技术中都有大量的应用。尽管开发一个 MapReduce 看起来很高深,感觉遥不可及。实际上,万变不离其宗,它的本质就是分治算法思想,分治算法。如何理解分治算法?为什么说 MapRedue 的本质就是分治算法呢?主要思想分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子

2020-08-03 12:23:38 287

原创 Datawhale 零基础入门数据挖掘-Task3 特征工程

Datawhale 零基础入门数据挖掘-Task3 特征工程Tip:此部分为零基础入门数据挖掘的 Task3 特征工程 部分,带你来了解各种特征工程以及分析方法,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX细阅读这篇文章,了解一下Markdown的基本语法知识

2020-08-01 10:23:10 224

原创 anaconda创建环境时出现CondaHTTPError问题的解决

搞了一天终于把pytorch给弄好了之前由于想看youtube,就照着网上给的安装教程设置了一下代理,如果不是今天发生这么麻烦的事情,我不会觉得随便设置代理会带来这么麻烦的事情。自从之前设置代理以后,只有打开vpn,ie浏览器才能上网,一直觉得很神奇,但是太懒了,所以就没有管这个事情,反正谷歌浏览器可以正常使用。结果今天说弄一个pytorch吧,创建环境一直失败,查了好多资料都没有弄好,耽误...

2020-07-30 10:07:22 4065 1

转载 python 错误:‘Cannot connect to proxy.‘由于目标计算机积极拒绝,无法连接

改了浏览器代理,系统代理还是报错。网上找了很多方法都没解决,很多人都被这个问题困扰很久了。可能是以前的vpn设置没有把注册表的代理删掉导致的。所以更直接的解决办法是找到注册表里面用户的代理设置,删掉它:运行:regedit→找到如下位置 \HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Internet Settin...

2020-07-30 10:06:43 13702 12

原创 Colab笔记

Colab安装NNIhttps://nni.readthedocs.io/en/latest/CommunitySharings/NNI_colab_support.htmlColab不掉线:右键——检查——console——输入以下代码,然后回车:function ClickConnect(){console.log("Working"); document.querySelector("colab-toolbar-button#connect").click() }setInterval

2020-07-29 23:02:38 218

转载 Google colab使用教程

https://drive.google.com/drive/my-drive 谷歌云盘网址谷歌colab使用教程一、What is Google Colab?Colaboratory 是一个 Google 研究项目,旨在帮助传播机器学习培训和研究成果。它是一个 Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行。Colaboratory 笔记本存储在 Google 云端硬盘中,并且可以共享,就如同您使用 Google 文档或表格一样。Colaboratory 可免费使

2020-07-29 10:16:41 3807

原创 数据结构与算法-字符串

字符串我们古人没有电影电视,没有游戏网络,所以文人们就会想出一些文字游戏来娱乐。比如宋代的李禺写了这样一首诗:“枯眼望遥山隔水,往来曾见几心知?壶空怕酌一杯酒,笔下难成和韵诗。途路阻人离别久,讯音无雁寄回迟。孤灯守夜长寥寂,夫忆妻兮父忆儿。”显然这是老公想念老婆和儿子的诗句。曾经和妻儿在一起,享受天伦之乐,现在一个人长久没有回家,也不见书信返回,望着油灯想念亲人,能不伤感吗?可仔细一读发现,这首诗竟然可以倒过来读:“儿忆父兮妻忆夫,寂寥长夜守灯孤。迟回寄雁无音讯,久别离人阻路途。诗韵和成难下笔,酒杯一酌

2020-07-28 22:47:33 251

原创 数据结构与算法-队列

这里写自定义目录标题队列1. 队列的定义与操作1.1 队列的定义1.2 队列的操作2. 队列的存储与实现2.1 顺序存储2.2 链式存储(链队)3. 练习参考答案队列队列也是我们经常使用的一种数据结构,如下图所示,购物结账,去食堂打饭等都需要排队,而结账或打饭的顺序与我们排队的顺序是相同的,即谁先排队就为谁先服务。比如我们发送邮件、打印资料,这些都是队列的具体应用。我们把需要发送的邮件先放到发送队列中,然后按照放入的顺序进行发送,把需要打印的文件先放到打印队列中, 然后按照放入的顺序进行打印。下面我

2020-07-28 22:43:01 225

转载 colab使用

Colab 使用挂载云端硬盘:from google.colab import drivedrive.mount('/content/drive/')不掉线:在Colab网页,右键检查,控制台console中输入一下代码回车,能够时不时点击页面,保证Colab不掉线function ClickConnect(){ console.log("Working"); document .querySelector("#top-toolbar > colab-connect-

2020-07-28 19:55:44 323

原创 Datawhale 零基础入门数据挖掘-Task2 数据分析

EDA-数据探索性分析Tip:此部分为零基础入门数据挖掘的 Task2 EDA-数据探索性分析 部分,带你来了解数据,熟悉数据,和数据做朋友,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX2.1 EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集

2020-07-25 23:47:41 174

原创 数据结构与算法——栈与递归

栈与递归栈是我们经常使用的一种数据结构,如下图所示,手枪发射子弹的顺序与子弹压入弹夹的顺序是相反,即后压入弹夹的子弹先发射出来。比如我们使用的Word、Excel、Photoshop等软件系统中的撤销操作,也是栈的具体应用,最后做的操作,一定是最先撤销的。下面我们就来详细介绍“栈”这种数据结构。栈的定义与操作1.1 栈的定义插入(入栈)和删除(出栈)操作只能在一端(栈顶)进行的线性表。即先进后出(First In Last Out)的线性表。例1 :线性表(a0,a1,…,an) 进栈与出栈演

2020-07-24 22:28:48 767

原创 Datawhale 零基础入门数据挖掘-Task1 赛题理解

Datawhale 零基础入门数据挖掘-Task1 赛题理解一、 赛题理解Tip:此部分为零基础入门数据挖掘的 Task1 赛题理解 部分,为大家入门数据挖掘比赛提供一个基本的赛题入门讲解,欢迎后续大家多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX1.1 学习目标理解

2020-07-23 23:29:58 139

原创 数据结构与算法——顺序表和链表

顺序表和链表顺序表和链表1线性表的定义与操作1.1线性表的定义线性表(Linear List)是由n(n >= 0)个相同类型的数据元素a1,a2,…,an 组成的有序序列。即表中除首尾元素外,其它元素有且仅有一个直接前驱和直接后继。首元素仅有一个直接后继,尾元素仅有一个直接前驱。表中数据元素的个数称为表的长度,记为:(a1,a2,…,an)。1.2线性表的操作随机存取:获取或设置指定索引处的数据元素值。(支持索引器)插入操作:将数据元素值插入到指定索引处。移除操作:移除线性表指定索引

2020-07-23 23:17:27 191

原创 Datawhale零基础入门NLP赛事 - Task2 数据读取与数据分析

在上一章节,我们给大家简单介绍了赛题的内容和几种解决方案。从本章开始我们将会逐渐带着大家使用思路1到思路4来完成本次赛题。在讲解工具使用的同时,我们还会讲解一些算法的原理和相关知识点,并会给出一定的参考文献供大家深入学习。Task2 数据读取与数据分析本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。学习目标学习使用Pandas读取赛题数据分析赛题数据的分布规律数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因

2020-07-22 22:43:57 76

原创 Datawhale零基础入门NLP赛事 - Task1 赛题理解

新闻文本分类——天池本章将会对新闻文本分类进行赛题讲解,对赛题数据进行说明,并给出解题思路。赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题

2020-07-22 22:32:40 114 2

原创 数据结构与算法——数组

数组数组是具有一定顺序关系的若干对象组成的集合,组成数组的对象称为数组元素。例如:向量对应一维数组矩阵对应二维数组数组名表示群体的共性,即具有同一种数据类型;下标表示个体的个性,即各自占有独立的单元。数组的存储2.1 n维数组的定义下标由n个数组成的数组称为n维数组。例如:int[] a = new int[10]; //一维数组(线)int[ , ] a = new int[2,3];//二维数组 (面)int[ , , ] a = new int[2,3,4];//三维数组 (体

2020-07-22 21:51:17 234

原创 零基础入门数据挖掘-Baseline(二手车交易价格预测)

二手车交易价格预测baselineTip:这是一个最初始baseline版本,抛砖引玉,为大家提供一个基本Baseline和一个竞赛流程的基本介绍,欢迎大家多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX# 查看数据文件目录 list datalab files!ls

2020-07-21 21:47:41 1121 1

原创 变量、运算符与数据类型python

变量、运算符与数据类型python1 注释在 Python 中,# 表示注释,作用于整行。【例子】单行注释# 这是一个注释print("Hello world")# Hello world‘’’ ‘’’ 或者 “”" “”" 表示区间注释,在三引号之间的所有内容被注释【例子】多行注释'''这是多行注释,用三个单引号这是多行注释,用三个单引号这是多行注释,用三个单引号'''print("Hello china") # Hello china"""这是多行注释,用三个双引

2020-07-20 16:29:28 355

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除