2 很吵请安青争

尚未进行身份认证

暂无相关简介

等级
TA的排名 2k+

Dataframe 删除相邻相同的元素

loc + shift data.loc[data.clean_Message != data.clean_Message.shift(-1)]

2020-01-15 12:37:09

tf.Dataset.shuffle

shuffle( buffer_size, seed=None, reshuffle_each_iteration=None)buffer_size参数,指元素的个数,最完美的shuffle是所有数据一起shuffle,但是避免内存不够,每次选buffer_size个数据进行shuffle。比如Dataset一共10000个元素,buffer_size=1000, ...

2020-01-02 09:58:24

将dataframe写入到kusto table

官方非常confused的API https://github.com/Azure/azure-kusto-python/blob/master/azure-kusto-ingest/tests/sample.pydata = pd.DataFrame(data=[['zz',1],['b', 2]], columns=['name', 'age'])cluster = "https://i...

2019-11-22 17:03:22

pycharm 删除无用的import

点击code–> optimize import快捷键 ctrl + alt + o

2019-11-11 10:00:57

ImportError: No module named 'src'

把本地python项目,比如pycharm中的项目拷贝到服务器运行时,出现Module引入错误解决方法:在project的根目录下运行子目录的文件,而不是直接在子目录下运行文件...

2019-11-06 21:39:21

dataframe groupby 后求每个key最大值所在的行号

dataframe groupby 后求每个key最大值所在的行号,用idxmax()函数import pandas as pdarray = []for charc in ['a', 'b', 'c']: for i in range(5): array.append([charc, i])data = pd.DataFrame(array, columns=["...

2019-11-06 15:28:12

pandas groupby max

假设数据如下:array = [ ['a', 2], ['a', 1], ['a', 0], ['b', 2], ['b', 4], ['b', 6],]data = pd.DataFrame(array, columns=["name", "age"])数据如下: name score0 a 21 a ...

2019-11-02 11:19:23

随机森林有放回抽样

为什么要有放回抽样如果不放回抽样,每棵树用的样本完全不同,结果是有偏的,基学习器之间的相似性小,投票结果差,模型偏差大如果不抽样,基学习器用所有样本,那么模型的泛化能力弱,基学习器之前相似性太大差异性太小,模型的偏差大为什么不随机抽样? 自助采样首先可以产生一部分袋外样本,可以用来做袋外估计,另一方自助采样一定程度上改变了每个基学习器的所用数据的样本分布,一定程度上引入了噪音,增加了模型的...

2019-10-28 23:05:23

VSCode 使用code runner

写C++的时候如果发现右键没有run code 选项,可以安装code runner,可以不Debug直接运行代码;配置setting.json文件, 加入下面代码即可: "code-runner.runInTerminal": true, "code-runner.ignoreSelection": true, "code-runner.fileDirectoryAs...

2019-10-28 15:02:05

python itertools groupy踩坑

groupy前必须对key进行排序, 不然结果不是期望的from itertools import groupbyarray = []for i in ['a', 'a', 'b']: for j in range(10): array.append([i, j])for key, val in groupby(array,key=lambda x:x[0]):...

2019-10-25 15:05:16

VSCode配置python环境

配置settings文件.vscode下建立, settings.json文件{ "python.testing.pytestArgs": [], "python.testing.unittestEnabled": false, "python.testing.nosetestsEnabled": false, "python.testing.pytestEna...

2019-10-24 17:35:04

VSCode 配置C++运行环境

MinGW-w64https://sourceforge.net/projects/mingw-w64/

2019-10-22 11:20:11

LC.1228. Missing Number In Arithmetic Progression

class Solution1(object): def missingNumber(self, arr): """ [5,7,9,11,13]. """ step = (arr[-1] - arr[0]) // len(arr) if step == 0: return arr[0...

2019-10-21 20:47:03

LC.1221. Split a String in Balanced Strings

class Solution(object): def balancedStringSplit(self, s): """ 分别用l,r变量,记录L和R出现的次数,当l==r时可以分裂出去,然后重置l r即可 """ l, r, res = 0, 0, 0 for char in s: ...

2019-10-21 20:13:22

LC.356. Line Reflection

class Solution(object): def isReflected(self, points): """ 求所有点中横坐标最大和最小的,取其中心店作为对称轴 对于每一个点,看起轴对称的点是否在points里即可 注意dict value存的是个set """ from collec...

2019-10-12 21:48:38

LC.1217. Play with Chips

class Solution(object): def minCostToMoveChips(self, chips): """ 最终移动到的位置不是奇数就是偶数, 偶数位置移动到奇数位置和奇数位置移动到偶数位置才会消耗 所以在求奇偶位置数量最小值即可, 可以在不用知道最pivot点在哪里的情况下求出结果 ...

2019-10-12 21:24:27

git 本地版本回退

查看commit历史git log会显示最近三次提交记录,上下键可翻页,q退出如果只想看commit的版本号和每次commit的messagegit log --pretty=oneline本地版本回退下面命令都可以使版本回退(n表示回退到前n个版本)git reset --hard version#version为commit 的版本号,可实现回退和前进gi...

2019-10-12 11:34:32

LC.839. Similar String Groups

class Solution1(object): def numSimilarGroups(self, A): """ 方法1,求连通通分量的个数 先根据是否相似建立词与词之间的联通关系 接着对每个单词进行dfs,找到最大的连通分量, 用visited 集合记录已经访问过的节点 此方法超时 "...

2019-10-11 09:53:57

LC.928. Minimize Malware Spread II

class Solution1(object): def minMalwareSpread(self, graph, initial): """ 方法1,借鉴928. Minimize Malware Spread II 的思路,在对于每一个remove 的节点单独处理 超时 """ def helper(o...

2019-10-09 23:59:08

MySQL安装测试数据集

数据地址https://dev.mysql.com/doc/employee/en/employees-installation.htmlwindows下载解压,编辑employees.sql文件,将set default_storage_engine = InnoDB;注释去掉安装连上sql服务器, 在sql下使用source + xx.sql即可安装安装成功显示下图异常如...

2019-10-08 15:54:36

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。