自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 VSCode执行VBS脚本出现乱码

VSCode执行VBS脚本出现乱码一、单击设置二、单击时间和语言三、单击区域、其他日期、时间和区域设置四、单击更改日期、时间或数字格式五、单击管理、更改系统区域设置六、勾选使用Unicode UTF-8...

2020-12-08 11:59:42 1738

原创 《内容算法》——推荐的起点:断物识人

断物最好的方式就是“贴标签”在不同的应用场景下,我们会对标签全集进行有针对性地投射,有倾向性地选用不同地标签以换取信息匹配效率最大化标签地产出方式有专家系统产出(PGC)和普通网友产出(UGC)两种为了更好地促进用户标签的产出,我们可以借助产品层的调整和引导标签适合的是文字表意歧义较小、可以枚举的类型标签的尺寸越大代表用于对这个类型的音乐越感兴趣...

2020-05-27 15:28:11 236 1

原创 《内容算法》——走近内容推荐

推荐是一个协作与进化的过程:对内容而言,每一个用户既是消费者又是决策者,被认可的内容得以进一步扩散,不被认可的内容则被系统纠偏,以免给更多人造成负面影响对用户而言,

2020-05-27 14:57:11 401

原创 如何更改jupyter notebook起始目录和设置默认浏览器

一、更改起始目录方案1:cmd打开命令行窗口cd+切换到的目录jupyter notebook命令打开jupyter方案2:进入所在的起始目录,按住shift右键点击 在此处打开powerpoint窗口输入jupyter nootbook,Enter即可二、设置默认浏览器将默认浏览器直接改为Google即可...

2020-05-26 20:16:36 1077

转载 Jupyter notebook安装

1、jupyter notebook简介Jupyter notebook是一个在线编辑器,可以在网页上编辑程序,在编辑的过程中,每次编辑一行代码就可以运行一行代码,运行的结果也可以显示在代码的下方,方便查看。当所有的程序编写和运行完毕之后,还可以直接把编辑和运行之后的所有信息保存在文件中。2、jupyter notebook启动在cmd环境下,输入命令:jupyter notebook之后就可以启动jupyter botebook编辑器,启动之后会自动打开浏览器,并访问http://localhost

2020-05-26 16:05:34 183

原创 《用数据讲故事》——第10章 最后的思考

数据可视化——和一般意义上的用数据沟通——处在科学和艺术的交叉点10.1 下一步走向何方五条建议:学好使用工具、迭代并寻求反馈、投入充足的时间、从榜样中获得启发、以及享受这一过程10.1.1 建议1:学好使用工具Google电子表格Tableau10.1.2 建议2:迭代并寻求反馈对于迭代,为取得成功,或许你最需要的是:时间10.1.3 建议3:投入充足的时间10.1.4 建议4:从榜样中获得启发10.1.5 建议5:享受并寻找自己的风格10.2 在团队中培养用数据讲故事的能力10.

2020-05-26 14:54:34 180

原创 《用数据讲故事》——第9章 案例研究

9.1 案例研究1:深色背景上的颜色选择9.2 案例研究2:在图表中使用动画效果9.3 案例研究3:顺序的逻辑一旦你有沟通的需求,总该有希望突出的故事或要点底线是:你所展示数据的顺序应该有逻辑9.4 案例研究4:避免“意大利面”式图表的策略9.4.1 一次只强调一条线9.4.2 空间隔离9.4.3 混合方法9.5 研究案例5:饼图的替代方案9.5.1 方案1:直接展示数字9.5.2 方案2:简单条形图9.5.3 方案3:10

2020-05-26 14:24:47 308

原创 《用数据讲故事》——第8章 综合所有的课程

8.1 第一节课:理解上下文自产品C在2010年上市起,所有产品的市场价格都有所下降对象、内容、方式8.2 第二节课:选择合适的图表8.3 第三节课:消除杂乱弱化图表标题去除图表边框和网络线将x轴、y轴和标签置成灰色以融入背景消除折线之间的颜色差异直接标记折线8.4 第四节课:引导受众的注意8.5 第五节课:像设计师一样思考用文字使图表理解无障碍将元素对齐以更美观8.6 第六节课:讲故事8.7 小结...

2020-05-26 13:26:05 394

原创 《用数据讲故事》——第7章 讲故事的课程

7.1 故事的魔力7.1.1 戏剧中的故事故事应该有明确的开始、中间和结尾第一幕进行故事设计第二幕构成了故事的主要部分第三幕解决故事及次要情节首先,三段式结构可以作为沟通的一般模型。其次,冲突和紧张时故事的组成部分7.1.2 故事与电影用故事以超越事实的方式让受众从情感上...

2020-05-26 10:35:28 503

原创 《用数据讲故事》——第6章 剖析样例图表

6.1 样例图表1:折线图6.2 样例图表2:注释预测类折线图6.3 样例图表3:100%堆叠条形图6.4 样例图表4:利用正负堆叠条形图6.5 样例图表5:水平堆叠条形图6.6 小结在数据可视化中,很少会有单一的“正缺”答案,但从来不缺少“好”的味道...

2020-05-26 09:31:19 273

原创 《用数据讲故事》——第5章 像设计师一样思考

形式服从功能5.1 可供性可供性是设计的固有属性,使得产品的使用方式显而易见。5.1.1 突出重要的内容突出整体图表中的一部分,因为突出的效果会随着突出的百分比增加而减弱。粗体、斜体和下划线大小写和字体颜色反色元素字号5.1.2 消除干扰5.1.3 建立清晰的信息层次5.2 无障碍无障碍的概念在于,设计应该对不同能力的人都可用5.2.1 不要过于复杂保持图表易读保持图表简洁使用直观的语言去除不必要的复杂5.2.2 文字是你的朋友文字在数据沟通中能起到以下作用:

2020-05-26 09:05:38 339

原创 《用数据讲故事》——第4章 聚焦受众的视线

4.1 用脑阅读4.2 记忆微解密4.2.1 形象记忆对于形象记忆很重要的一点在于,它作用于一套前注意属性。因此前注意属性是视觉设计工具链中的重要组成部分。4.2.1 短期记忆短期记忆具有局限性4.2.3 长期记忆当一件事情离开短期记忆,要么开始被遗忘,很可能永远丢失,要么被传递到长期记忆中。4.3 前注意属性能够引导视线如果有策略地使用前注意属性,就能够让受众不知不觉地看到我们期望展现的内容4.4 文字中的前注意属性除了将受众的注意力引导到我们期望的地方,还可以利用前注意属性建

2020-05-25 18:53:50 188

原创 《用数据讲故事》——第3章 杂乱是你的敌人

3.1 认知负荷人脑处理信息的能力是有限的,作为信息的设计师,应该更合理地使用受众的脑力谈到视觉沟通,最重要的在于受众感知的认知负荷:他们认为需要付出多少精力才能提取出信息3.2 杂乱造成过度或者无关的认知负荷的一个元凶就是杂乱3.3 视觉认知的格式塔原则至于如何识别图形中的信号(希望沟通的信息)和噪声(杂乱),可以使用视觉认知的格式塔原则3.3.1临近原则我们倾向于认为物理上临近的物体属于同一个群体3.3.2 相似原则拥有相似颜色、形状、大小或者方向的物体会被视作相关或从属于一个群体

2020-05-25 17:46:57 319

原创 《Fluent Python》—前言

不成熟的抽象和过早的优化一样,都会坏事。第一部分单独的一章,讲解的是Python的数据模型(data model),以及如何为了保证行为一致性而使用特殊方法(比如__repr__)第二部分包含了各种集合类型:序列、映射、和集合,另外还提及了字符串和字节序列的区分第三部分如何把函数作为一等对象(first_order object)来使用第四部分书的重点转移到了类的构建上面第五部分Python中有些结构和库不在满足诸如条件判断、循环和子程序之类的顺序控制流程,第五部分的笔墨会集中在这些构造

2020-05-25 16:26:07 195

原创 《用数据讲故事》——第2章 选择有效的图表

2.1 简单文本当你只有一两项数据需要分享时,简单文本是绝佳的沟通方式。当只有一两项数据需要分享时,直接使用数据本身2.2 表格让设计融入背景,让数据占据核心地位。不要让厚重的边框和阴影与数据争夺受众的注意力。相反,要使用窄边框或者空白来区分表格的元素。边框应该用来提升表格的易读性。用灰色让边框融入背景,或者干脆去掉边框。应该突出的是数据,而非边框。热力图将表格中的细节和视觉暗示的使用结合起来。2.3 图表经常使用的图形可分为四类:点图、线图、条形图和面积图。2.4 点图散点图

2020-05-25 15:59:02 446

原创 《用数据讲故事》——第1章 上下文的重要性

1.1 探索性分析和解释性分析探索性分析:指理解数据并找出其中值得关注或分享给他人的精华解释性分析:将数据抽象为受众能够消化的信息1.2 对象、内容和方式在可视化数据或创建图表之前必须思考并明确:一、你在跟谁沟通?二、你希望受众了解哪些内容或者做什么?回答出以上两个问题时,才真正准备号面对第三个问题:如何用数据表达自己的观点?1.3 对象1.3.1 你的受众受众越具体,越能成功地进行沟通。细分受众的方法之一是识别决策者。1.3.2 你自己思考你与受众的关系以及你期望他们如何看待你

2020-05-25 13:44:29 501

原创 《用数据说话》——正文前笔记

推荐序一:数据数据图表没有达到效果,因为犯了如下三个错误:1、没有选择最合适的关系图表呈现2、用了过多的修饰和美化,分散了听众对核心信息的注意力3、数据图表的呈现形式过于单调前言:内容主要包括以下6节课程:(1)读懂上下文(2)选择合适的图表(3)消除杂乱(4)聚焦受众的视线(5)像设计师一样思考(6)用数据讲故事第1章:上下文的重要性第2章:选择有效的图表第3章:杂乱是你的敌人第4章:聚焦受众的视线第5章:像设计师一样思考第6章:剖析样例图表第7章:讲故事的课程第8

2020-05-25 11:07:40 198

原创 机器学习的基础——矩阵

一、基本概念1、矩阵的定义

2020-05-21 09:14:58 912

原创 《实用机器学习》(孙亮 黄倩.著)笔记——第七章 无矩阵分解的基准方法

bui表示基准算法对于评价rui的预测,bu和bi分别是用户u和商品i各自对应的偏差,μ是所有评价的平均值在推荐问题中引入损失函数,通过最小化损失函数,得到参数的最佳估计值,这里采用平方和损失函数:需要考虑模型的过拟合问题,我们加入正则化项:λ1≥0是控制正则化项权重的参数...

2020-05-20 15:16:38 136

原创 《实用机器学习》(孙亮 黄倩.著)笔记——第七章 基于内容的推荐算法

在基于内容的推荐中,首先为每件商品i构建一个向量Xi来表示该商品的特征。对于用户u,考虑所有在集合I(u)中的商品,一种简单的方式是将用户u的特征表示为I(u)中所有商品i的加权和,且权重为rui:在得到商品和用户的特征后,就可以计算它们之间的相似度。...

2020-05-20 14:52:35 109

原创 《实用机器学习》(孙亮 黄倩.著)笔记——第七章 推荐算法基础

一、推荐算法基础两类基本对象:1、用户(user);2、商品(item)除了用户-商品的交互信息外,其他可以利用的数据包括:(1)商品的信息,包括商品的价格、类型等;(2)用户的信息,如用户的性别、年龄、居住地点等。推荐算法分类:(1)基于内容的推荐算法;(2)基于协同过滤的推荐算法。基于内容的推荐算法:利用商品的相关信息为每件商品构建一个特征向量来表示对应的商品。基于协同过滤的推荐算法:利用用户和商品之间的相互关系来构建推荐模型和进行推荐。所谓协同过滤:就是找出类似的用户或者商品(这一阶

2020-05-20 14:37:09 198

原创 《实用机器学习》(孙亮 黄倩.著)笔记——第二章 R语言

2.1R的简单 介绍一、R是一种自由、免费、开源的解释型编程语言,具有强大的数据分析工具和图形工具,支持多种设备上的分析和展示。S语言无须关心内存分配与数据结构细节,具有良好的可移植性与可扩展性。2.2R的初步体验...

2020-05-20 11:44:45 225

原创 《Python编程从入门到实践》——Django入门(Windows环境下)

Django是一个Web框架一、建立项目1、建立虚拟环境要使用Django,首先需要建立一个虚拟工作环境。虚拟环境是系统的一个位置,可以在其中安装包,并将其与其他Python包隔离为项目新建一个目录,将其命名为learning_log,再在终端切换到这个目录,并创建一个虚拟环境python -m venv ll_env2、激活虚拟环境激活命令:ll_env\Scripts\activate退出虚拟环境:deactivate3、安装Django安装命令:pip install Dj

2020-05-20 11:43:40 575

原创 《Python入门经典》——Flask开发Hangman游戏

源代码如下:import pygameimport sysfrom random import choicefrom pygame.locals import *RED = (255, 0, 0)GREEN = (0, 255, 0 )BLUE = (0, 0, 255)YELLOW = (255, 255, 0)ORANGE = (255, 100, 0)PURPLE = (100, 0, 255)def get_words():f = open(“E://word.txt...

2020-05-20 09:38:20 519

原创 《Python入门经典》——用PyGame开发游戏

一、什么是PyGamePyGame是一个开源的库,它帮助我们完成创建桌面应用程序的很多实际工作。包括屏幕的分辨率、视频、对象冲突、硬件甚至图像渲染。二、安装PyGamecdm打开命令行窗口,输入pip install pygame显示Successfully installed pygame-1.9.6,表示安装成功三、创建屏幕创建一个one.py的新文件,输入以下文本:结果显示了400*400的正方形屏幕窗口注:原教材是窗口一闪而过,但是在实际运行中,窗口一直存在1、主程序循环:

2020-05-20 08:50:23 291

原创 《Python入门经典》——用Flask进行Web开发

一、什么是FlaskFlask是一种Web框架。二、Windows下安装Flask1、安装setuptools浏览setuptools的地址:https://pypi.python.org/pypi/setuptools/0.7.2下载名为ez_setup.py的文件并运行它。运行完之后,需要把setuptools添加到你的路径。如果你使用的是Spyder (Anaconda3),将不需要进行setuptools这一步。...

2020-05-19 13:36:57 632

原创 Windows下安装Spyder (Anaconda3)

一、访问https://www.anaconda.com/,进入Anaconda官网二、点击GetStarted三、点击Install Anaconda Indivdual Edition四、点击D

2020-05-19 09:38:13 1223

转载 可汗学院公开课——统计学(1)——统计图

均值:平均数中位数:又称中值众数:具有明显集中趋势点的数值极差:范围误差中程数:统计一组数据最大值和最小值的平均数象形统计图:条形图:折线图:饼图:误导人的线形图茎叶图箱线图...

2020-05-12 16:07:12 246

原创 RStudio下载与安装

一、进入RStudio官网https://rstudio.com/products/rstudio/二、RStudio有两个版本可选择:单机版RStudio Desktop和服务版RStudio Server,我们选择RStudio Desktop三、下载开源版RSTUDIO桌面四、选择路径、安装五、安装完成,界面如图所示...

2020-05-12 10:32:57 17792 2

原创 R下载与安装详细指南

一、登陆www.r-project.org进入R官网二、点击左侧CRAN或右侧的download R三、在China选项,随机点击一个镜像四、R语言可以在Linux、MAC OS和Windows上运行,根据个人的操作系统选择需要下载的镜像五、点击下载、运行、选择中文版本六、安装过程七、下载完成八、测试获取工作目录命令:getwd()创建文件夹的命令:dir.create()修改工作目录的命令:setwd()...

2020-05-12 10:16:05 2714

原创 《实用机器学习》(孙亮 黄倩.著)笔记——第一章 引论

机器学习的主要类型:一、回归问题二、分类问题三、推荐问题四、排序问题1.1什么是机器学习从概念上讲,在机器学习中,我们的目标是从给定的数据集中学习出一个模型f,使得它能够有效地从输入数据中预测我们感兴趣的量。在机器学习中,通常我们解决问题的流程如下:(1)搜集足够多的数据;(2)通过分析问题本身或者分析数据,我们认为模型f是可以从数据中学习出来的;(3)选择合适的模型和算法,从数据中学习中模型f;(4)评价模型f,并将其利用在实际中处理新的数据。1.2机器学习算法的分类一、监督学习

2020-05-11 21:14:06 156

原创 《图解机器学习》(杉山将.著)笔记——第一章 什么是机器学习

1.什么是机器学习1.1学习的种类一、监督学习:监督学习,是指有求知欲的学生从老师那里获取知识、信息,老师提供对错提示、告知最终答案的学习过程。典型任务:预测数值型数据的回归、预测分类标签的分类、预测顺序的排序等。二、无监督学习:无监督学习,是指在没有老师的情况下,学生自学的过程。典型任务:聚类、异常检测等三、强化学习:强化学习,是指在没有老师提示的情况下,自己对预测的结果进行评估的方法。典型任务:机器人的自动控制、计算机游戏中的人工智能、市场战略的最优化等。1.2机器学习任务的例子

2020-05-10 12:17:15 261

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除