10 磐创 AI

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 1k+

NumPy解释线性代数

作者|Soner Yıldırım编译|VK来源|Towards Data Science机器学习和深度学习模型需要大量的数据。它们的性能在很大程度上取决于数据量。因此,我们倾向于收集尽可能多的数据,以建立一个稳健和准确的模型。数据以多种不同的格式收集,从数字到图像,从文本到声波。然而,我们需要将数据转换为数字以便对其进行分析和建模。仅仅将数据转换为标量(单个数字)是不够的。随着数据量的增加,使用标量的操作开始变得低效。我们需要向量化或矩阵运算来有效地进行计算。这就是线性代数发挥作用的地方。线性

2020-09-27 23:27:04

使用Python调整图像大小

作者|Nicholas Ballard编译|VK来源|Towards Data Science可以说,每一个“使用计算机的人”都需要在某个时间点调整图像的大小。MacOS的预览版可以做到,WindowsPowerToys也可以。本文使用Python来调整图像大小,幸运的是,图像处理和命令行工具是Python的两个特长。本文旨在向你展示三件事:图像的基本概念。用于操作图像的Python库。你可以在自己的项目中使用本文的代码。我们要构建的命令行程序可以一次调整一个或多个图像文件的大

2020-09-25 23:27:24

使用卷积神经网络和openCV预测年龄和性别

作者|Nagesh Singh Chauhan编译|Flin来源|towardsdatascience越来越多的应用程序与年龄和性别的自动分类相关,特别是自从社交平台和社交媒体兴起以来。尽管如此,现有的方法在真实图像上的性能仍然明显不足,特别是与最近报道的与人脸识别相关的任务在性能上的巨大飞跃相比。——使用卷积神经网络进行年龄和性别分类(https://talhassner.github.io/home/publication/2015_CVPR)介绍年龄和性别是人脸的两个重要属性,在社会交往中

2020-09-25 23:07:18

基于OpenCV对神经网络预处理人脸图像的快速指南

作者|Jaime Duránx编译|Flin来源|medium目前我正在研究一个涉及面部分类的计算机视觉问题。这通常意味着应用深度学习,因此在将图像注入到我们的神经网络之前需要一个特殊的预处理阶段。为了提高我们的模型精度,这是一项非常重要的任务,通过以下几个简单的步骤可以很容易地完成。对于本文,我们可以使用OpenCV:一个高度优化的计算机视觉开源库,在C++、java和Python中可用。这是一篇简短的文章,包含了一些基本的指导原则、示例和代码,你可能需要将它们应用到每个面部分类或识别问题上。

2020-09-25 23:02:17

测试使用K-最近邻(kNN)算法的30个问题

作者|SUNIL RAY编译|Flin来源|analyticsvidhya 介绍如果你要问我机器学习中2种最直观的算法——那就是k最近邻(kNN)和基于树的算法。两者都易于理解,易于解释,并且很容易向人们展示。有趣的是,上个月我们对这两种算法进行了技能测试。如果你不熟悉机器学习,请确保在了解这两种算法的基础上进行测试。它们虽然简单,但是功能强大,并且在工业中得到广泛使用。此技能测试将帮助你在k最近邻算法上进行自我测试。它是专为你测试有关kNN及其应用程序的知识而设计的。超过650人注册了该

2020-09-25 22:57:20

测试数据科学家进行机器学习的40个问题

作者|ANKIT GUPTA 编译|Flin来源|analyticsvidhya介绍机器学习是近来最受欢迎的技能之一。我们组织了各种技能测试,以便数据科学家可以检查自己的这些关键技能。这些测试包括机器学习,深度学习,时间序列问题和概率。本文将为机器学习技能测试提供解决方案。如果你错过了上述任何一项技能测试,仍然可以通过下面的链接查看问题和答案。机器学习https://courses.analyticsvidhya.com/courses/introduction-to-data-science

2020-09-25 22:38:43

创建自己的人脸识别程序

作者|Jerin Paul编译|Flin来源|towardsdatascience这是一个繁忙的市场场景;七月的烈日在头顶上照耀。炎热的天气并没有阻止顾客的到来。在人群不知情的情况下,一个怀有恶意的人藏在他们中间。他披着一层正常的外衣,走着去实现他的邪恶目的。在一个角落里,一个监控摄像头会定期扫描这个区域,这时它会瞥见这个家伙。它会立刻认出看到的每一张脸,而且碰巧这家伙是一个通缉犯。几毫秒之内,他附近的警察就得到了警报,他们开始着手消除这一威胁。这个故事曾经出现在科幻小说中,但现在情况大不相同了。

2020-09-23 22:05:14

10个强大的Python数据科学技巧

作者|LAKSHAY ARORA编译|Flin来源|analyticsvidhya介绍你上一次学习新的Python技巧是什么时候?作为数据科学家,我们习惯于使用熟悉的库并每次都调用相同的函数。现在该打破旧的惯例了!Python不仅限于Pandas,NumPy和scikit-learn(尽管它们在数据科学中绝对必不可少)!我们可以使用大量的Python技巧来改进代码,加速数据科学任务并提高编写代码的效率。更重要的是,学习我们可以在Python中做的新事情真的非常有趣!我喜欢玩各种不同的程序包和函数

2020-09-23 19:20:24

测试时间序列的40个问题

作者|SAURABH JAJU编译|Flin来源|analyticsvidhya介绍时间序列预测与建模在数据分析中起着重要的作用。时间序列分析是统计学的一个分支,广泛应用于计量经济学和运筹学等领域。这篇技能测试文章是为了测试你对时间序列概念的了解程度。共有1094人报名参加了这次技能测试。这个测试是为了测试你对时间序列的了解的水平。如果你错过了这次技能测试,这里有一些问题和对应的解决方案。如果你错过了实时测试,也可以通过阅读本文以了解你有多少题目是可以正确回答的。这是所有参赛者的排行榜htt

2020-09-21 19:34:23

机器学习和数据科学的最佳公共数据集

作者|Towards AI Team编译|Flin来源|medium此资源不断更新。如果你知道任何其他合适且开放的数据集,请通过电子邮件通知我们:pub@towardsai.net 或者在下面发表评论。数据集查找器Google Dataset Search:与Google Scholar的工作方式类似,Dataset Search 可以让你在任何托管的地方找到数据集,无论是一个出版商的网站,一个数字图书馆,还是一个作者的网页。它是一个非凡的数据集查找器,它包含超过2500万个数据集。https

2020-09-21 19:27:31

如何在自定义数据集上训练YOLOv5

作者|Jacob Solawetz, Joseph Nelson编译|Flin来源|blogYOLO系列的目标检测模型随着YOLOv5的引入变得越来越强大。在这篇文章中,我们将介绍如何训练YOLOv5为你的定制用例识别定制对象。非常感谢Ultralytics将此存储库组合在一起。我们相信,与干净的数据管理工具相结合,任何希望在其项目中部署计算机视觉项目的开发人员都可以轻松地使用此技术。我们使用公共血细胞检测数据集,你可以自己导出。你也可以在自己的自定义数据上使用本教程。公共血细胞检测数据集

2020-09-21 19:12:12

使用Python为初学者构建AI汽车和行人跟踪

作者|Nidhi punj编译|Flin来源|medium 第1步:获取大量汽车图片第2步:把它们都变成黑白图片灰度图像使算法更快。颜色增加了模型的复杂性,或者我们可以说灰色图像是用来简化数学的。例如,我们可以谈论亮度、对比度、边缘、形状、轮廓、纹理、透视、阴影等,而不必讨论颜色。第3步:训练算法以检测汽车现在问题来了:计算机如何训练算法?我们只是找到匹配项。我们可以匹配上述功能,以实际检测到汽车的后保险杠,如下所示。检测行人的想法是一样的一切都是为了匹配特征或形状。如果

2020-09-20 21:07:45

spaCy教程学习

spaCy教程学习作者|PRATEEK JOSHI编译|VK来源|Analytics Vidhya介绍spaCy是我的自然语言处理(NLP)任务的必备库。我冒昧地说,大多数专家都是这样!如今,在众多的NLP库中,spaCy确实独树一帜。如果你在NLP上用过spaCy,你就会知道我在说什么。如果你对spaCy的强大功能还不熟悉,你会被这个库的多功能性和灵活性所吸引。spaCy的优点是它提供一系列优良的特性,库也是易用的,以及库总是保持最新。spaCy入门如果你对spaCy还不熟悉,你应该注

2020-09-19 13:22:25

使用Python和OpenCV在线打乒乓球

作者|Robin White编译|Flin来源|towardsdatascience我最喜欢的YouTuber之一,CodeBullet,曾经尝试创建一个乒乓球 AI来统治所有人。可悲的是,他遇到了麻烦,不是因为他没有能力,而是我认为他当时的经验对计算机视觉没有太大影响。他绝对是个好笑的人,如果你考虑阅读这篇文章的其余部分,我强烈建议你观看他的视频。同样,他是个天才。在这里看他的视频。https://www.youtube.com/watch?v=tcymhYbRvw8&这似乎是一个

2020-09-19 13:09:33

通过迁移学习建立一个易于使用的图像分割工具

在Jupyter notebook中为图像添加标签,预测新图像并可视化神经网络(并使用Docker Hub共享它们!)作者|Jenny Huang编译|Flin来源|towardsdatascience作者:Jenny Huang, Ian Hunt-Isaak, William PalmerGitHub Repo: https://github.com/ianhi/AC295-final-project-JWI介绍在新图像上训练图像分割模型可能会令人生畏,尤其是当你需要标记自己的数据时。为

2020-09-19 12:46:51

应对机器学习中类不平衡的10种技巧

作者|GUEST BLOG编译|Flin来源|analyticsvidhya总览熟悉类失衡了解处理不平衡类的各种技术,例如-随机欠采样随机过采样NearMiss你可以检查代码的执行在我的GitHub库在这里介绍当一个类的观察值高于其他类的观察值时,则存在类失衡。示例:检测信用卡欺诈交易。如下图所示,欺诈交易大约为400,而非欺诈交易大约为90000。类不平衡是机器学习中的常见问题,尤其是在分类问题中。不平衡数据可能会长时间妨碍我们的模型准确性。类不平衡出现在许多领

2020-09-19 12:45:15

用对比学习训练说话人初步验证模型

作者|OngKoonHan编译|Flin来源|towardsdatascience 在我大学的Android开发课程的组项目部分中,我们的团队构建并部署了一个认证系统,通过说话人的语音配置文件进行认证。在我上一篇文章(请参阅下一部分)描述了语音认证系统的高级体系结构之后,本文将深入探讨所使用的深度学习模型的开发过程。我以前的文章可以在这里找到(一个带有移动部署的初级语音认证系统)。https://medium.com/@ongkoonhan.lovefad/a-rudimentary-voi

2020-09-18 21:57:12

词袋模型和TF-IDF

作者|PURVA HUILGOL编译|VK来源|Analytics Vidhya机器理解文本的挑战“语言是一种极好的交流媒介”你和我很快就会明白那句话。但机器根本无法处理原始形式的文本数据。他们需要我们将文本分解成一种易于机器阅读的数字格式(自然语言处理背后的理念!)。这就引入“词袋”(BoW)和TF-IDF。BoW和TF-IDF都是帮助我们将文本句子转换为向量的技术。在这篇文章中,我将讨论“词袋”和TF-IDF。我们将使用一个直观和一般的例子来详细理解每个概念。示例我将用一个流行的例子

2020-09-17 23:41:38

利用机器学习模型对PySpark流数据进行预测

作者|LAKSHAY ARORA编译|VK来源|Analytics Vidhya概述流数据是机器学习领域的一个新兴概念学习如何使用机器学习模型(如logistic回归)使用PySpark对流数据进行预测我们将介绍流数据和Spark流的基础知识,然后深入到实现部分介绍想象一下,每秒有超过8500条微博被发送,900多张照片被上传到Instagram上,超过4200个Skype电话被打,超过78000个谷歌搜索发生,超过200万封电子邮件被发送(根据互联网实时统计)。我们正在以前所未

2020-09-17 23:35:24

使用PCA可视化数据

作者|Conor O'Sullivan编译|VK来源|Towards Data Science主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数。PCA的显著优点是它能产生不相关的特征,并能提高模型的性能。它可以帮助你深入了解数据的分类能力。在本文中,我将带你了解如何使用PCA。将提供Python代码,完整的项目可以在GitHub链接:https://github.com/conorosully/medium-articles。什么是PCA我们先复习一下这个理论。如果你想

2020-09-17 23:33:57

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。