8 sodleave

尚未进行身份认证

我要认证

私信一般不怎么看,请发邮件联系:luoyu06@mail.ustc.edu.cn

等级
TA的排名 9w+

spark使用笔记

1. 注意repartion和colese的区别,shuffle上的区别:https://blog.csdn.net/xianpanjia4616/article/details/820531962.注意repartion和partionBy的区别,后者会以Key来聚合:https://blog.csdn.net/xianpanjia4616/article/details/84328...

2019-03-20 18:41:49

关于python中值传递和引用传递的问题

主要参见于下面两个博客:http://blog.csdn.net/dream_angel_z/article/details/51496044http://www.cnblogs.com/buptldf/articles/4976561.html自己这里再做下总结:python的传递方式可以认为“传对象引用”,是传值和传引用的一种综合。针对于不可变对象(变量,tuple

2017-08-06 17:42:42

Dataquest学习总结[10]

Step 6: Machine Learning Decision Trees>>Introduction to Decision Trees构建决策树时将类别型特征转换为数值型数据:用到pandas的categorical,使用Categorical.from_array方法numpy.bincount  计算array中各值出现的频次,类似于pandas的value_c

2017-06-10 17:15:28

Dataquest学习总结[9]

Step 6: Machine Learning Machine Learning In Python: Intermediate>>Multiclass classification:pandas.get_dummies()  对dataframe或Series中value值进行变换,尤其是在value有多个取值时,转换为多个二进制的结果,需要进行dummy处理的依据:针对于

2017-06-01 20:41:56

Dataquest学习总结[8]-Machine Learning

Step 6: Machine Learning Machine Learning In Python: Beginner数据集:their machine learning repository   >>读取表格型数据文件 read_table methodmpg = pd.read_table("auto-mpg.data", delim_whitespace=True

2017-05-24 21:14:11

Dataquest学习总结[7]

继续Step 5: Statistics And Linear Algebra/Probability And Statistics In Python: Intermediate Introduction to probabilityCalculating Probabilities>>数据集bike sharing Dataset,地址here  地板除//,5//4=

2017-05-22 21:57:13

Dataquest学习总结[6]

暂时跳过Step 3: The Command Line 和Step 4: Working With Data Sources 现在学习Step 5: Statistics And Linear Algebra 部分Probability And Statistics In Python: BeginnerIntroduction To Statistics>>Series和D

2017-05-20 17:30:08

Dataquest学习总结[5]

Step 2: Intermediate Python And Pandas/Data Cleaning>>表格的合并,pandas.concat()  z = pd.concat([x,y], axis=0)  #合并x和y,y在x下面(对每一列操作得到行)>>pd.read_csv() 也可以读取txt文件,根据传入的参数,对编码格式和分隔符进行设置all_survey=p

2017-05-17 09:54:23

Dataquest学习总结[4]

继续Intermediate Python and Pandas / Data Analysis with Pandas: Intermediate /Guided Project: Analyzing Thanksgiving Dinner:  数据集地址:here用到的方法: pandas.Series.value_counts()     import pandas as p

2017-05-11 20:47:02

Dataquest学习总结[3]

Step 2: Intermediate Python And PandasChallenge: Summarizing Data   数据集地址:Github repository对数据集进行处理:#1.读文件import pandas as pdall_ages=pd.read_csv("all-ages.csv")recent_grads=pd.read

2017-05-10 22:18:22

Dataquest学习总结[2]

Step 2: Intermediate Python And PandasA.使用numpy读取csv文件import numpynfl = numpy.genfromtxt("nfl.csv", delimiter=",")会返回一个numpy array的结果,即numpy.ndarray class,但是读取进来的好像只有数字有效。

2017-05-10 11:36:51

Dataquest学习总结[1]

关于step1 introduction to python 中Error Handling部分:可以用于对异常数据,缺失数据进行处理

2017-05-08 22:36:07

python基本语法和注意事项

1.几个常用的网站Python IDE下载:(1)Python(x,y)的官方下载地址(2)Python(x,y)的其他下载地址(3)Anaconda下载地址(推荐下载此IDE,网站稳定,使用方式与Python(x,y)基本一样)2.Python参考教程和网站(1)Magnus Lie Hetland,Beginning Python: from Novice to...

2017-05-05 11:30:54

刷leetcode 经历与总结

1.关于局部变量与全局变量的问题  在做38. Count and Say 时需要返回一个字符串,以为在函数中定义字符串并返回地址就可,实际上在写的函数被调用完之后里面的字符串空间就会被释放掉,所以即使返回字符串地址也传不出需要的值。还是得用老方法,定义全局变量。

2017-05-03 15:10:39

Matlab矩阵分解

矩阵分解是指根据一定的原理用某种算法将一个矩阵分解成若干个矩阵的乘积。常见的矩阵分解有LU分解(三角分解)、QR分解(正交变换)、Cholesky分解,以及Schur分解、Hessenberg分解、奇异分解等。(1) LU分解(三角分解)矩阵的LU分解就是将一个矩阵表示为一个交换下三角矩阵和一个上三角矩阵的乘积形式。线性代数中已经证明,只要方阵A是非奇异(即行列式不等于0)

2015-11-04 17:07:21

【笔记3】获取csi文件,并用MATLAB处理

利用MATLAB对csi数据进行分析与获取,参照网站 http://dhalperi.github.io/linux-80211n-csitool/faq.html的第二部分HowdoIprocessCSIwithMATLABorOctave?以下过程全在MATLAB中进行。首先是包含csi数据的文件存放位置,参考前面的installinstruction。新版的

2015-03-19 12:58:48

【笔记2】关于Linux 802.11n csi tool的安装注意事项

本人采用的是old installation instruction的方法,将对http://dhalperi.github.io/linux-80211n-csitool/old_installation.html 中的内容逐一进行说明。首先网站中提供的是Ubuntu 10.04 server-i386版的安装,为了使用方便,我安装Ubuntu10.04 desktop-i386版,

2015-03-12 11:15:41

【笔记1】关于联想g470更换intel5300网卡的问题

为了毕设要求要使用intel wifi link 5300网卡(半高卡)。买好装上后发现电脑无法识别硬件,即通不过bios。 (显示:unauthorized wireless network card is plugged in.......)即要刷新BIOS白名单,使开机无线网卡检测能通过。这里参照两个帖子:(1)http://js.13168.org/2014a/0614/2

2015-02-28 23:53:10

关于虚拟机安装Ubuntu10.04 server 网络配置的问题

从发现Ubuntu不能联网,到解决该问题差不多用了一周,虽然效率低下,但写下一点我的经验,希望对之后的人能有所帮助。首先是软硬件情况:我连接的是校园网,本机是静态IP,虚拟机是VMware7.0,安装Ubuntu10.4 server。安装中遇到的问题是无法连接DHCP,安装完成后无法联网。以为是连校园网没有设置自动获取IP的问题,其实与这个无关。按照网上的资料,NAT模式和桥接模

2015-01-13 10:36:07

Matlab数字图像处理:DCT变换

clear;RGB=imread('原始图像');GR=rgb2gray(RGB);%转换成灰度图像figure(1);imshow(GR);D=dct2(GR);  %计算DCTfigure(2);imshow(log(abs(D)),[]);colormap(gray(4));colorbar;D(abs(D)I=idct2(D)

2014-10-16 17:33:52

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!