自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

记录学习痕迹的公众号:Piper蛋窝

985研究生在读,现役微软学生大使MLSA,公众号:Piper蛋窝,记录学习痕迹,分享技术心得

  • 博客(387)
  • 资源 (1)
  • 收藏
  • 关注

原创 在 spark pipeline 中加入已训练模型(以 离散化编码 ValueIndexerModel 为例)

现在有个需求,对于“将职业离散化”这个过程,我已经有了一套标准,该怎么办呢?举个例子,假设有职业列有三个值:`学生`、`工作`以及`未知`。如果将离散化交给 Spark ,那么,我们可能得到 `学生0` `工作1` `未知2` 或者 `学生1` `工作2` `未知0` 等不确定的编码。现在业务上要求必须使用一套确定的编码,该怎么办呢?

2022-02-10 20:03:09 1644

原创 Windows 运行 spark-hadoop 报错 java.io.IOException: (null) entry in command string: null chmod 0644

这个很简单,去 https://github.com/cdarlint/winutils 这里找到你的对应版本,用其中的 bin 代替你本地的 bin 。然后配置环境变量 %HADOOP_HOME% 以及 PATH+=%HADOOP_HOME%/bin 。

2022-02-10 17:15:05 1829 1

原创 Spark 训练机器学习模型莫名报错(java.lang.stackoverflow)

归根结底是当时不了解 Spark 原理。

2022-02-09 11:45:13 887

原创 将本地 jar 安装到本地 maven 仓库

mvn install:install-file 使用示例。

2022-02-09 10:58:11 1387

原创 2021.9.11周六PAT甲级考试复盘与总结

2021-09-12 23:25:45 493

原创 为什么在 Windows 下用 Ctrl+Z 退出 Python 而 Linux 下用 Ctrl+D 呢?

当我们想退出 python ,返回我们的 shell 时,你将如何退出?

2021-09-08 14:55:19 695

原创 Spark 自己实现分箱逻辑遇到的坑

说一所小学有好几个班级,现在要 以班级为单位 给孩子们按照身高进行排序,并且记录下来。问题就是,全学校只有一条测身高的尺子,而且因为孩子们过于顽劣等主客观因素,测量身高、按身高排序、登记身高这些过程,必须在一间教室里进行。 没有被轮到测量的班级,就在操场活动。

2021-07-21 09:18:23 652 2

原创 【求助】如何从 Spark 的 DataFrame 中取出具体某一行?我自己的一些思考

如何从 Spark 的 DataFrame 中取出具体某一行?根据阿里专家Spark的DataFrame不是真正的DataFrame-秦续业的文章-知乎的文章:DataFrame 应该有『保证顺序,行列对称』等规律因此「Spark DataFrame 和 Koalas 不是真正的 DataFrame」确实可以运行,但却看到一句话,大意是数据会被放到一个分区来执行,这正是因为数据本身之间并不保证顺序,因此只能把数据收集到一起,排序,再调用 shift。这样就不再是一个分布式的程序了,甚至比 pa

2021-07-18 22:33:40 1923 1

原创 递推算法题:令人费解的开关『拉灯』

有趣的智力面试题目。

2021-07-15 21:07:04 675 1

原创 Python 中非常狗的一个坑(在 `a={1:2},`后面多了一个逗号,自动被判为 tuple 类型了)

本意是好的,语法灵活一点,随意一点,用起来方便。可是不限制声明类型,甚至元组的声明都不用加括号,这就有点狗了。a = {'a': 2}# a 是 dicta['a']# a['a'] 是 2a = {'a': 2},# a 是 tuple ({'a': 2}, )a['a']# 报错a[0]['a'] # 才是 2...

2021-07-14 00:59:13 480

原创 Scala,一门「特立独行」的语言!

Scala,一门「特立独行」的语言!

2021-07-12 13:28:38 673 2

原创 分形之城:递归超典型例题,还没明白?手把手画给你看!

递归超典型例题,还没明白?手把手画给你看!

2021-07-12 13:14:45 411 1

原创 如何优雅地实现浏览器兼容与CSS规则回退

本文就是探讨如何优雅地应对浏览器兼容问题,包括四点:层叠机制来支持较早的浏览器,Modernizr设置辅助类来分别编写样式,使用 @supports 规则回退,简短的 JavaScript 代码实现回退。

2021-07-06 17:25:37 361

原创 《Visual Studio Code权威指南》读后总结

五分满分我给四分,毕竟作者的水平与专业性是值得称道的,但是全书内容太过全面:从各个语言到前端、从云计算到物联网,以至于大部分内容都是一带而过。

2021-07-01 11:39:31 2318 1

原创 npm 更新依赖 / 更新库 / 更新包 的命令 | npm outdated | npm updated

最近在用一个开源项目的 beta 版,很不稳定,想升级一下 node 项目依赖。这些命令会很常用,在这里记录一下。

2021-06-29 22:33:57 1513

原创 巧技拾遗 | JavaScript 中 Array.every 和 Array.map 的巧妙结合

前端开发时表单验证的小心得。

2021-06-20 16:45:29 428 4

原创 又被分治题卡住好几个小时!用最笨的方法搞懂分治法边界,告别死循环!

花了一晚上和一上午,把所有情况都捋了一遍、把迭代过程考虑清楚了。

2021-06-19 11:08:33 336 1

原创 【吐血经验】在 windows 上安装 spark 遇到的一些坑 | 避坑指南

你肯定会遇到。

2021-06-14 16:42:57 1854 2

原创 给 Python 添加进度条 | 给小白的 tqdm 精炼实例!

tqdm包教包会!

2021-06-14 12:09:02 566

原创 @wraps 修饰器:让你的 Python 代码更加简短可爱 | 从简单实例来认识它

本文简单与读者朋友们「科普」一下修饰器,注意到我们这里实际上仅仅修饰了无参数的函数。其实,修饰器还有许多更加优雅用途,比如传入参数 *args, **kwargs ,修饰类 __call__ 等用法。期待以后我遇到好的应用场景,将经验分享给朋友们。

2021-06-13 22:19:30 521 5

原创 并发和并行 | Python中实现多线程 threading 和多进程 multiprocessing

深入浅出比喻说明线程与进程,附小白都能看懂的对比试验。

2021-06-10 21:35:52 6025 2

原创 Python格式化字符串字面值 | 被官方文档称之为『漂亮』的输出格式

用法可以参考Python 的字符串格式示例(format examples)。咱们这里自己造个场景:打印表格。

2021-06-08 13:54:02 621 1

原创 Python 添加类型标注 | 散发着自由松散气息的代码

Python 如此简洁,书写者在声明变量时甚至无需考虑类型。但是简洁与复杂间,是存在一个平衡点的。当我们书写较为复杂的项目时,还是希望可以拥有「静态类型语言」强大的类型检查和智能的提示。

2021-06-06 16:19:10 541 1

原创 【菜鸡学算法】用最笨最直观的方法讨论递归取中值时是不是陷入死循环

所谓少壮不知道,老大徒伤悲。被很简单的快排 代码运行状态: Memory Limit Exceeded 老半天。最后琢磨半天越界这事儿。总结起来一句话:避免出现 func(l, r) { func(1, r) } 这种情况,因为这是死循环。 如何避免? (l, jj), (jj+1, r)中,jj至少从r身上离开,就可用。

2021-05-06 10:00:30 349

原创 我是如何高效录制出那么多高质量 gif 动图的呢?

来!看!毫不保留!独门秘笈!

2021-03-22 22:15:30 2044 1

原创 用 powershell 脚本 .ps1 写一个自动化的「编译->链接->运行C++文件」脚本

一次小小的笔记。

2021-03-16 00:38:36 822

原创 powershell / ps脚本ps1中.exe(可执行文件)没反应

我们首先键入路径下可执行文件的名字,没反应。当我们以管理员身份运行时,程序可以正常执行。

2021-03-15 23:57:12 1159

原创 讲座笔记:图匹配 Graph Matching 问题 | 机器学习&组合优化

机器学习与组合优化问题实例,研究对象是 Graph Matching 。

2021-03-13 09:14:25 4108

原创 为 VS Code 配置 C++ task,增加外部库文件并且自动运行脚本 | 应用 powershell 语句

相当于写“宏”。

2021-03-07 23:13:26 1337 1

原创 『力荐汇总』这些 VS Code 快捷键太好用,忍不住录了这34张gif动图

工欲善其事,必先利其器。

2021-03-05 15:04:57 567

原创 随笔 | 写代码时极有可能面临的焦虑

写代码为了生活,而生活要快快乐乐的。因此,不能被代码搞了心态。

2021-02-22 13:46:13 631 2

原创 跳转引用、禅模式...VS Code 中 11 个快捷键/操作,让你的效率与舒适度翻倍!

本文我们继续讨论 VS Code 中的快捷键。实际上,相比前两篇文章,本文更加注重介绍“操作”,快捷键不是重点,重点是功能的探索与应用。

2021-02-17 22:01:23 4973

原创 VS Code 中的 Vim 操作 | 无需修改 VSC 默认快捷键 | 常用组合与逻辑

尽管 VS Code 自带的快捷键已经足够强大 ,但存在一个问题:使用方向键是一个有些“反人类”的行为,双手放在键盘上,如果只敲击字母,那么便无需移动手腕;如果需要去敲击方向键,则需要移动手腕或者小臂。Vim插件让绝大部分敲击集中在字母的区域,让操作更加快捷、舒适。本文我将推荐我常用的Vim操作。

2021-02-05 08:38:26 6783 1

原创 你真的会用 VS Code 的 Ctrl、Shift和Alt吗?高效易用的快捷键:多光标、跳转引用等轻松搞定

本文我为大家总结了 Ctrl 、 Shift 、 Alt 与方向键结合的妙用,简单易学,又功能强大。我录制了大量动图,帮助读者更好地理解这些快捷键的高效。

2021-02-03 13:41:08 2024

原创 是时候给为的 C 盘清理污垢了!一个830KB的神器安全解决烦恼 | C 盘快满了,如何清理 C 盘? | win 10 OS盘清理

这篇文章我强力推荐一款软件: SpaceSniffer 。其作用大概是:可视化各个文件夹的容量,让我们有方向地、有效率地删除大容量无用的文件。

2021-01-31 19:14:38 640 1

原创 dgl._ffi.base.DGLError: Cannot assign node feature “n_feat“ on device cuda:0 to a graph on device

记得从原理出发。

2021-01-31 17:48:11 3630 3

原创 【bug解决方案】powershell 中无法激活 conda 环境 /Anaconda 使用 powershell 无效

工作需求原因,拿到一台新电脑,首先需要安装 python 。一般地,我用 conda 管理自己的 python 环境。使用 conda 管理环境,大多需要用到命令行。使用 Anaconda 自带的 Anaconda Prompt 虽然没什么问题,但终究没有集成到自己的命令行工具中,对我而言,多开命令行很麻烦。一般,我会把所有命令行工具集成到 powershell 中,软件用 Windows Terminal 。这里遇到了 bug 。问题描述安装了 Anaconda 。输入 conda acti

2021-01-31 17:04:51 3385 4

原创 「大厂实习心得」久坐办公写程序的我,差点忘了『呼吸』也能锻炼身体

可别小看这每天10+个小时的久坐——其实「磨刀不误砍柴工」,了解几个小 tips 并且执行下去,或许会让自己的事业与身体健康达成一致,生活更加舒适。但“站着说话不腰疼”——如今我终于体会到了“有一个舒适的工位是多么容易让人不想站起来”,我也可以针对这种情况,设计自己的方案,并且分享给各位。

2021-01-18 09:47:08 477

原创 「CSDN年度征文」微软学生大使、VSC中文社区、KDD CUP...2020年,我与技术社区

2020年,我的关键词是「改变」。

2021-01-03 16:00:59 1621 10

原创 「管理数学基础」4.3 模糊数学:模糊关系与模糊矩阵、模糊关系的运算与合成、模糊等价关系

模糊关系与模糊矩阵及其运算。

2020-12-12 21:05:11 8411 3

BA_network-SEIR-Sim.rar

https://mp.weixin.qq.com/s/TLfMSeDlqpIvlL0fNT40OA 很实用的 python 病毒仿真模拟,适于有python基础课、系统工程、病毒仿真相关大作业的同学使用。

2020-08-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除