Foools-CSDN博客

原创《操作系统导论》吐血万字整理 - 附下载地址及思维导图

前言我看的是这本，豆瓣9.4，很经典的教材书，在文章末尾我附上了网盘链接这篇博客算是一个完整的读书笔记，我大概读了20天看完的，电子版做笔记很方便，推荐一波，很多课上没有讲到的知识在这本书里都详细阐释了全书的思维导图操作系统介绍一个正在运行的程序会做：取址执行。从内存中获取指令，对其解码，执行。操作系统主要利用一种通用的技术，我们称之为虚拟化(virtualization)。也就是说，操作系统将物理(physical)资源(如处理器、内存或磁盘)转换为更通用、更强大且更易于使用的虚拟形式。

2021-08-07 21:37:09 20276 27

原创 hive使用改写with cube优化实例：运行时间180分钟--＞30分钟

背景数据需求，要求计算各个维度下的用户数，并将数据落在目标表中，结果需要支持任意维度的筛选。维度包括：平台(platform)，是否新用户(is_new)，年龄(age)，人生阶段(life_stage)，城市类型(city_class)，省份名称(province_name)，使用年限(use_age)，当前APP版本(app_version_final)，启动播放(start_play)。启动播放维度涵盖：启动用户，播放用户，启动无播放用户，播放无启动用户。数据举例：platform

2021-07-30 16:39:42 1771

原创从只会单表查询到应用hive完成日常数据需求：hive入门到应用实战

hive入门到应用实战前言1. 语法补充hive查看表信息hive查看某个参数的设置hive grouping_IDhive qubehive rolluphive left semi join （左半连接）hive row_number() over()hive cast函数切换字段的格式hive lateral view explodehive concat拼接字符串concatconcat_wshive nvl相关函数hive日期比较函数2. hive表操作Hive列操作（增加列，删除列，修改列，移

2021-07-30 14:35:41 350

原创 linux命令行大全

文章目录前言LINUX命令行大全学习shell基本的操作文件与目录命令重定向echo高级键盘技巧权限进程配置与环境环境vi定制提示符常见任务和主要工具软件包管理存储介质网络检查和检测网络通过网络传输文件与远程主机的安全通信文件搜索归档和备份压缩文件归档同步文件和目录正则表达式编译程序编写shell脚本编写一个shell脚本启动一个项目自顶向下的设计流控制：IF分支语句读取键盘输入while和until循环故障诊断方法case分支位置参数for循环总结前言本文是我阅读了《linux命令行大全》之后做的.

2021-05-12 21:21:13 3925 2

原创 git使用指南

目录简单操作版本管理远程仓库分支管理暂时存放一个任务多人协作的工作模式打标签git自定义颜色显示gitignore配置别名爱奇艺的魔方报表代码同步简单操作查看个人信息$ git config --global user.name "Your Name"$ git config --global user.email "[email protected]"初始化一个Git仓库，使用git init命令。添加文件到Git仓库，分两步：使用命令git add <file&

2021-04-08 17:49:58 1587 2

原创 Clickhouse学习整理

前言吃水不忘挖井人，我看的视频课：https://www.bilibili.com/video/BV1Yh411z7os?spm_id_from=333.337.search-card.all.click我看的参考书是下面这本，整体介绍很全面，但是不用全都读，需要的地方看一看就好，有几章废话很多…但是整体质量不错Clickhouse学习笔记clickhouse：列式存储数据库，C++编写，主要用于在线分析处理查询（OLAP），支持SQL，多主架构（客户端访问任何一个节点效果相同）适合的场景：大体

2022-03-23 22:46:02 1705

原创 Hive学习整理

写在前面吃水不忘挖井人视频课地址：https://www.bilibili.com/video/BV1W4411B7cN?from=search&seid=3089375730995965944&spm_id_from=333.337.0.0学习参考书籍：书中内容需要拥有hive和hadoop的基础，通读一遍感觉还需要在实际工作中翻读，但是也算有些收获Hive学习笔记环境变量的配置sudo vim /etc/profile.d/my_env.sh加入信息：export H

2022-02-08 03:27:26 614

原创 Hadoop学习整理

前言吃水不忘挖井人，我看的课是这个，课程带着安装，搞虚拟机，很详细，推荐一波思维导图环境Hadoop102:cd / 表示的是返回/cd ～表示的是返回/home/fools$HADOOP_HOME 配置的位置为/opt/module/hadoop-3.1.3集群出现问题如果某个集群namenode或datanode等出现异常，这时候只要先停掉每个集群sbin/stop-xxxxx.sh，删除每个服务器的data，logs目录rm -rf data/ logs/，然后再初始化hdfs

2022-01-27 04:31:52 1848 1

原创《计算机网络自顶向下》吐血万字整理 - 附下载地址及思维导图

前言我看的是这本，豆瓣9.4，很经典的教材书，在文章末尾我附上了网盘链接这篇博客是重要的前六章的读书笔记，面试需要掌握的部分，读了之后脑子里能有一个整体的框架，还是收获很大的。但是如果要应付面试，应该还需要多看面经多整理细枝末节的知识思维导图和笔记更适合唤起回忆，串起来已经掌握的知识，不建议作为学习使用，这里只做分享思维导图一计算机网络和因特网1.1 什么是因特网一个世界范围的计算机网络，互联了遍及全世界计算设备的网络一个为应用程序提供服务的基础设施因特网广泛的使用了协议以完成不同的

2021-12-26 21:24:37 2701 1

原创《NoSQL精粹》了解NoSQL这一篇就够了

前言本博客写于阅读完《NoSQL精粹》这本书之后，作为一篇读书笔记，想要了解NoSQL的朋友可以从这个博客里面整理一些知识，也希望熟练NoSQL的朋友读完也有收获首先对NoSQL进行一个简单的介绍，最初的NoSQL表示的是“开源分布式的非关系型数据库”，但是NoSQL具体含义是什么并没有一个权威的定义，实际上大部分人的定义是“not only sql”，而并非是对sql说不，不用去纠结为什么不是NOSQL而是NoSQL，我们只需要理解NoSQL表示的是一般具有开源特征，不适用SQL，为了在集群中使用（不

2021-09-09 22:52:25 535

原创尚硅谷Java数据结构与java算法全194章笔记整理

前言视频地址：https://www.bilibili.com/video/BV1E4411H73v?from=search&seid=13120683720695451628评价：整个教程的数据结构部分讲的挺好的，知识点全都覆盖了，而且每个数据结构都有代码解释，但是最后20节算法部分讲的有点乱，算法部分我决定直接刷leetcode了数组稀疏数组：二维数组的省内存的保存方法，一般是n行3列，三列分别为行，列，值。二维数组转稀疏数组：遍历整个二维数组，查看有多少个有效数字根据有效数字

2021-08-11 19:28:01 1947 1

原创哈工大操作系统笔记（4）外设与文件系统

操作系统之外设与文件系统本篇博客是看了李治军教授哈工大的操作系统网课做的笔记，原课程视频地址：https://mooc.study.163.com/course/1000002009?tid=2403044005&trace_c_p_k2=40bf5f80317341d3af0f9fad437208f1#/info本节思维导图：20.外设与显示器操作系统让外设工作起来，使用类似out这样的指令让外设工作起来，等外设工作完了之后写中断处理程序。CPU向控制器中的寄存器读写数据控制器完成

2021-07-19 23:22:32 394 1

原创哈工大操作系统笔记（3）内存管理

操作系统之内存管理本篇博客是看了李治军教授哈工大的操作系统网课做的笔记，原课程视频地址：https://mooc.study.163.com/course/1000003007?tid=2403044006&trace_c_p_k2=2ca81044d5094af1a1f084ae07ee86e0#/info本节思维导图：14.内存使用与分段内存使用重定位：修改程序中的地址，使之成为相对地址。在运行每条指令的时候才完成重定位，相对编译时重定位，这样更灵活，而且也不会出现在操作系统中切换

2021-07-19 23:18:53 376 1

原创哈工大操作系统笔记（2）进程与线程

操作系统之进程与线程本篇博客是看了李治军教授哈工大的操作系统网课做的笔记，原课程视频地址：https://mooc.study.163.com/course/1000002008?tid=2403044007&trace_c_p_k2=307652c373f1486c9fcd4f987b661e32#/info本节思维导图：6.CPU管理cpu管理的最直接方法：设置好pc的初值，cpu运行时自动取址执行这样存在的问题是cpu利用率很低，使用多道程序，交替执行的方式可以提高cpu利用率并

2021-07-19 23:11:58 427 1

原创哈工大操作系统笔记（1）操作系统基础

操作系统基础本篇博客是看了李治军教授哈工大的操作系统网课做的笔记，原课程视频地址：https://mooc.study.163.com/course/1000002004?tid=2403042008&trace_c_p_k2=2673c9a0949246379ecb5ae19fa57e02#/info本节思维导图：1. 什么是操作系统操作系统就是在计算机硬件上面包一层软件，使我们的操作更加方便，高效。操作系统实际上做了什么：它取得 CPU、内存或磁盘等物理资源 (resources)，

2021-07-19 23:04:24 784 2

原创 AttributeError: module ‘keras.backend‘ has no attribute ‘eager‘

项目场景：windows环境下，python3.6，各个conda包的版本如下\# Name Version Build Channelabsl-py 0.13.0 <pip>astor 0.8.1 <pip>cached-property

2021-07-01 11:43:05 1017

原创通过Xshell方便从linux服务器上传下载文件

通过Xshell方便从linux服务器上传下载文件背景我使用的是Xshell6进行的操作，sz和rz命令可以方便地上传下载文件，使用zip和unzip文件可以打包上传下载文件，下面分别进行介绍sz&rzsz命令：从Linux下载文件到本机 , 在Linux终端输入命令回车后，选择本地存储路径即可。命令格式： sz filename 下载文件filenamesz file1 file2 下载多个文件sz dir/*　　　下载dir目录下所有文件rz命令:直接输进去就行了，然

2021-06-18 15:05:58 251

原创指数平滑法，二次指数平滑法（Holt’s linear trend method），季节性预测算法（Holt-Winters’ seasonal method）

指数平滑法概念：对过去的观察值得加权平均值进行预测的一种方法，适用于水平历史数据一次指数平滑法：Ft+1 =aYt+(1-a)FtFt表示t时预测值，Yt表示t时观察值。t取1时，F1=Y1。a为平滑系数，介于0到1之间。最终的式子展开为平滑系数接近1：越近的值影响越大，模型对时间序列的反应越及时，适合随机波动较大的数列平滑系数接近0：更适合时间序列比较平稳的序列实际应用时，应该用均方误差来判断预测误差的大小。但是如果数据是有整体趋势的，指数平滑法并不适用（因为无论如何调整参数都是误差极大的

2021-06-18 14:51:03 11083

原创 python文件产生的.idea, .vscode, \pycache文件都可以删除吗？

python文件产生的.idea, .vscode, __pycache__文件都可以删除吗？背景工作需要更改部分python代码的文件位置，需要删除不需要的文件，但是代码文件中包含了.idea.vscode__pycache__文件，并不知道要不要删除之后再进行移动，所以查阅了资料，如下。.idea当使用pycharm作为IDE时，会自动生成.idea/文件夹来存放项目的配置信息。其中包括版本控制信息、历史记录等等，可以进行删除，删除它是不会影响代码的正常使用的，但是如果删除就不能使用pychar

2021-06-18 14:40:35 5178 1

原创 hive如何导出数据至本地/HDFS/HIVE？

hive如何导出数据至本地/HDFS/HIVE？应用背景windows下使用xshell进行hive的操作，代码编辑使用vscode。这时候如果有数据需求的话，正常情况是登录hive，输入hql，然后出数据，复制粘贴在excel里稍微美化一下，交给运营和产品，但是这种情况是在数据量不大的情况下可以实现的，那如果行数太多，无法直接复制，如何操作呢？方法一：将数据以文件格式存到到本地分为两步：把数据存储在linux服务器，从linux服务器复制文件到本地windowsinsert方法（有风险）

2021-06-17 16:00:05 5483 1

原创 sql中 group by多个字段，对所有字段做group by

表内容三列内容，其中有重复的内容一个group by首先是大家都明白的一个group by操作，用B做group by的条件，a一共有4个，b一共有6个select count(A),B from test_table group by B同理select count(A),C from test_table group by C两个group by其实就是做了两次聚合，如下例子，先对B列做一个聚合，再对C列做一次先对B列进行拆分，拆分成a，b两个，然后分别针对a和b进行拆分。a

2021-06-16 10:44:39 19128

原创 Adtributor: Revenue Debugging in Advertising Systems 微软论文翻译

前言毕设在做异常点检测与根因分析，就拿微软14年的文章作为主要参考文献了，这里把中文的翻译以及一些整理一起放在博客里，以作分享交流。Adtributor: 广告系统中的收入调试作者：Ranjita Bhagwan, Rahul Kumar, Ramachandran Ramjee, George Varghese, Surjyakanta Mohapatra, Hemanth Manoharan, and Piyush Shah Microsoft原文地址：https://www.usenix.or

2021-05-28 16:05:08 1789 1

原创一文了解Dao，Service，Controller，View

基本介绍首先，我理解的这三层是这样的DAO层DAO层主要是做数据持久层的工作，负责与数据库进行联络的一些任务都封装在此，DAO层的设计首先是设计DAO的接口，然后在Spring的配置文件中定义此接口的实现类，然后就可在模块中调用此接口来进行数据业务的处理，而不用关心此接口的具体实现类是哪个类，显得结构非常清晰，DAO层的数据源配置，以及有关数据库连接的参数都在Spring的配置文件中进行配置。Service层Service层主要负责业务模块的逻辑应用设计。同样是首先设计接口，再设计其实现的类，接

2021-05-18 20:59:03 178

原创 mac电脑下pycharm多行编辑

option+command+shift实现多行编辑

2021-05-16 11:52:31 1928

原创 java lombock知识整理

目录lombock知识整理lombock的使用前提lombock常用的注解的使用`@Getter / @Setter`: 自动生成Getter/Setter方法`@NonNull`: 可以帮助我们避免空指针。`@Cleanup`: 自动帮我们调用`close()`方法。`@ToString`: 直接生成toString方法`@data`: 自动生成相关方法`@cleanup`: 自动资源管理`@builder``@slf4j` 打印日志信息其他lombock知识整理lombock主要是将getter/s

2021-05-13 15:58:23 306 2

光纤通信-思维导图(双语课)

linux中如何输入下列语句