3 图灵的猫.

尚未进行身份认证

我要认证

给行业以ai,而不是给ai以行业

等级
TA的排名 998

「01」机器学习与深度学习,到底在学些什么?

大家好,欢迎来到久违的机器学习系列,这是「美团」算法工程师带你入门机器学习专栏的第一篇文章,不会太长,一半聊想法,一半聊干货。熟悉我的朋友可能知道,我以前的文章比较随意,涉及的内容极广,包括但不限于Python/Java/C/C++,网络编程,Hadoop等,但主要核心还是机器学习算法和数据科学相关的主题,这一点没变过。最近认真总结和思考了之前的博客内容,决定将自己从入门到现在一路...

2019-12-24 17:48:12

「15」支持向量机Python实战篇——蓝瘦香菇到底有没有毒?

上一篇文章:「14」支持向量机——我话说完,谁支持?谁反对?,我们通过SVM的数学原理讲解了这个最常见的机器学习算法。这一篇我们用一个非常简单的python实战项目来练习一下SVM并加深理解。复习SVM是一种二分类模型,处理的数据可以分为三类:线性可分,通过硬间隔最大化,学习线性分类器 近似线性可分,通过软间隔最大化,学习线性分类器 线性不可分,通过核函数以及软间隔最大化,学习非线性分类器线性分类器,在平面上对应直线;非线性分类器,在平面上对应曲线。硬间隔对应于线性可分数据集,可.

2020-05-24 11:27:51

「14」支持向量机——我话说完,谁支持?谁反对?

1. 支持向量1.1 线性可分首先我们先来了解下什么是线性可分。在二维空间上,两类点被一条直线完全分开叫做线性可分。严格的数学定义是:1.2 最大间隔超平面从二维扩展到多维空间中时,将 d0 和 d1 完全正确地划分开的 y = wx + b 就成了一个超平面。为了使这个超平面更具鲁棒性,我们会去找最佳超平面,以最大间隔把两类样本分开的超平面,也称之为最大间隔超平面。两类样本分别分割在该超平面的两侧; 两侧距离超平面最近的样本点到超平面的距离被最大化了。..

2020-05-24 11:21:56

5月博客恢复更新的通知

DEAR 粉丝,前段时间比较忙,博客停更了几个月,加上又在B站做视频,文章也没怎么写。这个月开始恢复博客更新,订阅算法入门系列的小伙伴可以继续了~另外大家有什么想看的主题也可以评论或者私信给我,我会挑一些写博文图灵的猫2020.5.10...

2020-05-10 17:31:10

滴滴是如何对用户和司机进行派单匹配的?

说到滴滴的派单算法,大家可能感觉到既神秘又好奇,从出租车扬召到司机在滴滴平台抢单最后到平台派单,大家今天的出行体验已经发生了翻天覆地的变化,面对着每天数千万的呼叫,滴滴的派单算法一直在持续努力让更多人打到车,本篇文章会着重介绍我们是如何分析和建模这个问题,并且这其中面临了怎样的算法挑战,以及介绍一些我们常用的派单算法,这些算法能够让我们不断的提升用户的打车确定性。1.为什么我们需...

2020-02-29 16:48:42

「13」朴素贝叶斯Python实战:计算打喷嚏的工人患上新冠肺炎的概率

上一期文章:「12」你们啊,naive!——朴素贝叶斯谈笑录中,我们剖析了朴素贝叶斯算法的本质和特点以及贝叶斯学派的一些知识。这里我们用python代码进行Naive Bayes算的的实现。第1部分是计算打喷嚏的建筑工人患上新冠肺炎的概率,第2部分是上一期文章中提到的西瓜分类实战项目。实战项目一、计算打喷嚏的建筑工人患上新冠肺炎的概率有多大?class NBClassif...

2020-02-28 14:58:04

「12」你们啊,naive!——朴素贝叶斯谈笑录

前言上1期的文章 「10」民主投票法——KNN的秘密中,我们详细探讨了KNN算法是如何作为一种民主制度而存在,并在分类和回归中发挥作用的。这1期我们将跳出传统概率论的频率学派,从一个有趣的角度来看看什么是朴素贝叶斯算法以及这种算法的前世今生。什么是朴素贝叶斯?概率基础在正式介绍贝叶斯之前,先简单介绍下概率的基础知识。概率是某一结果出现的可能性。例如,抛一枚匀质硬币,...

2020-02-28 14:57:20

最全知乎专栏合集:爬取11088个知乎专栏,打破发现壁垒(编程、python、爬虫、数据分析..)

最近逛博客,看到一篇很好的文章,整合了知乎上所有优秀的编程、算法专栏,对学习的帮助非常大,转载过来分享给大家:众所周知,知乎官方没有搜素专栏的功能,于是我通过爬取几十万用户个人主页所关注的专栏从而获取到11088个知乎专栏。本回筛选出其中涉及:编程、python、爬虫、数据分析、挖掘、ML、NLP、DL等关键词的专栏,按照排名、关注人数、专栏名称、专栏简介等顺序,罗列出史上...

2020-02-22 22:54:14

回顾|腾讯AI打败王者荣耀职业队,AI训练一天等于人类440年

2019年8月2日,腾讯策略协作型AI「绝悟」,战胜了王者荣耀职业选手。事情发生在吉隆坡世界冠军杯半决赛,期间有一场特殊的对决上演:5v5水平测试。五位电竞顶尖高手组成赛区联队:曹操(eStarPro-XIXI)、娜可露露(EMC-Sun)、武则天(Nova-Seek)、狄仁杰(KZ.Night)、张飞(M8HEXA-Mike)。腾讯AI绝悟(Wukong):达摩(AI_001)、雅...

2020-02-19 22:48:56

「11」Python实战篇:利用KNN进行电影分类

上一期文章:「10」民主投票法——KNN的秘密中,我们剖析了KNN算法的本质和特点、局限。这里我们用python代码进行KNN的实现。第1部分是KNN的基础算法步骤,第2部分是一个电影分类的实战项目。OK, let's begin~KNN算法实现 1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 4 import csv ...

2020-02-14 21:06:17

「10」民主投票法——KNN的秘密

古巴比伦王在汉谟拉比法典。。。KNN的秘密——民主投票

2020-02-14 21:04:45

「09」真损啊!——损失函数与极大似然估计

前言上期文章:「07」回归的诱惑:深入浅出逻辑回归中 ,我们介绍了逻辑回归的原理,组成和优缺点,并探讨了分类的本质含义。在这一期,我们会继续07的部分,从逻辑回归开始,引出机器学习中最重要的概念——参数学习。还记得我们的线性回归是如何学习直线方程参数的吗?最小二乘法(多元情况下叫做正规方程) 梯度下降法关于梯度下降,在之后的优化方法综述中会详细讲述,这里我们聚焦参数学习的本质—...

2020-02-01 17:02:19

「08」回归的诱惑:深入浅出逻辑回归(Python实战篇)

在上一篇文章「07」回归的诱惑:深入浅出逻辑回归里,我们详细解释了什么是分类算法以及逻辑回归、逻辑回归的特点,这一期给出实战案例的Python代码,供大家参考第一步 导入数据from collections import OrderedDictimport pandas as pd#数据集examDict={ '学习时间':[0.50,0.75,1.00,1.25...

2020-01-21 18:17:49

「07」回归的诱惑:深入浅出逻辑回归

前言上期文章:「05」回归的诱惑:一文读懂线性回归中 ,我们介绍了线性回归的原理,组成和优缺点,并探讨了回归的本质含义。在这一期,我们将从回归开始,引出一个机器学习中最重要的任务——分类。还记得我们上一节的课后题吗?其实答案很简单,任意一条线都可以把任意的数据点分为不同的类,也就是有无数个直线方程存在,这种解并没有意义。这就引出了我们的主题——分类。对于分类问题来说,不同的数据必须分为...

2020-01-21 18:14:11

「06」回归的诱惑:一文读懂线性回归(Python实战篇)

在上一篇文章「05」回归的诱惑:一文读懂线性回归里,我们详细解释了什么是线性回归,以及线性回归的特点,这一期给出实战案例的Python代码,供大家参考回归实战第一步 导入数据from collections import OrderedDictimport pandas as pd#数据集examDict={ '学习时间':[0.50,0.75,1.00,1....

2020-01-19 20:19:36

「05」回归的诱惑:一文读懂线性回归

前言从这一篇文章开始,就正式进入「美团」算法工程师带你入门机器学习系列的正文了,之前的几篇算是导读和预热,想必大家看的并不过瘾。从这里开始,我们将会以线性回归为起点,贯通回归方法在机器学习算法中所扮演的角色、具有的功能和使用的方法。说起回归,它是我们在高中时就接触过的内容。具体的,回归(Regression)是指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组随机变量(X1,X2,…,...

2020-01-19 20:18:15

AI漫谈:我们距离实现《庆余年》里的五竹叔机器人还有多远?

​(警告:本文包含少量剧透内容,请酌情阅读)五竹叔是机器人吗?看过庆余年的朋友,一定对五竹叔印象深刻,外表英俊潇洒,一袭黑衣加黑布条蒙眼,充满神秘侠客气息。五竹叔不但神秘,而且言行举止常常很怪异。五竹从未练过武,但武功超绝,天下四大宗师都不是对手;陪伴范闲从小长大,范闲已经成年,五竹容颜却丝毫未变;记忆受损,对很多往事略有印象,却又想不起关键细节,口头禅是“忘了”,有...

2020-01-19 11:44:30

“木兰”去哪儿了?被全国700所中小学引入的国产编程语言“木兰”,为何在官网删除了下载链接

​“同行12年,不知木兰裙下有Python”。昨天的时候,我看到了一则新闻:当时内心就是一震!号召国产编程语言这么多年,在如今中美对抗的自主化浪潮下,终于有一个靠谱的语言出世了!中科院计算所背书,应该没问题,值得高兴!当然,这篇报道点进去都是一些泛泛而谈的内容,没有具体的介绍这门语言的特点和属性,于是我又搜了搜。然后,看到了这几个报道:当时我就感觉吃了X一样,...

2020-01-18 19:06:06

有哪些让人相见恨晚的Python库(一)

对于我这个经常用python倒腾数据的人来说,下面这个库是真·相见恨晚记得有一次我在服务器上处理数据时,为了解决Pandas读取超过2000W条数据就内存爆炸的问题,整整用了两天时间来优化。最后通过数据转换,数据类型,迭代读取和GC机制解决了(具体方法在我的博客:Python优化之使用pandas读取和训练千万级数据)我一直觉得python处理大规模数据是真的不行,除非上Hadoop。直到...

2020-01-16 12:54:58

GitHub 标星 2.4w+,最适合编程新手入门的宝藏项目推荐

照惯例这周给大家推荐几个Github上高星的优秀项目,我的github:图灵的猫 ,也欢迎大家follow~下面这是第一个,也是首推的新手入门项目,以前我入门的时候如果有这样一个项目,知识广度和深度都会比现在更好啦,当然现在看也不晚。一起来瞅瞅吧在项目中,内容每月 28 号以月刊的形式更新发布,这是一个面向编程新手、热爱编程、对开源社区感兴趣人群的项目,内容每月 28 号以月刊的形...

2020-01-13 14:00:49

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 博客之星-入围
    博客之星-入围
    授予每年博客之星评选结果第21-200名的用户
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。