10 计科小白兔

尚未进行身份认证

我要认证

不忘初心,记录成长

等级
TA的排名 453

【学习方法】有一个成绩很好的哥哥是什么体验?

Part 1 成为出题者我哥第一次认真的教我。不同于以前的敷衍,他帮我从书上画出重点,自己出题目给我做,他要求我反复的去做他画的重点题目,不停的做,反复的做,全神贯注的去体会,让大脑自己去熟悉这个解题过程,而不是单纯的去记忆解题方法,更不是记住答案,必须要用自己的思维去感受,去揣摩一步步解开这个逻辑命题的步骤,体会这种感觉,并牢牢记住这种感觉。然后以此为基础,自己想出在同样的条件下,出题者可能会以何种方式来考察你的逻辑推理步骤,这样一来,一道题就可以变幻出至少十道题,三道题的结合就可以变幻出五十道,正.

2020-10-19 13:33:54

【科研】基于Aminer的各领域文献统计

【上升领域】特点:上升曲线,或者突然爆发的支柱,多以2020-2023结尾。fake news (up)deep learning (up)community detection (up)machine learning (up)graph neural network (up)【下沉领域】特点:连续三条柱体呈现下降趋势,多以2017-2020结尾。complex network (down)data mining (d...

2020-10-16 16:58:30

【论文写作】英文论文句子的流水记录

解决迁移问题:addressing the effects of migration in parallel evolutionary algorithms.排除简单并联:Finally, from a technological perspective, we also do not consider distributed optimization that makes use of geographically dispersed computers and allows using gri...

2020-10-12 23:29:39

【学术】计算传播学:自然语言处理技术的应用情况和前景

社会传播学的研究方法可为实证和阐释两大类别:实证性方法假设事实真相是确定且唯一的,可通过量化分析或测试推导出因果关系。阐释性方法则立足于多重事实与真相的假设,侧重于研究语言、文本等交互信息自身的意义和价值。想象阐释性和实证性方法分别处于地球的两极,七大流派就填充于两极之间的空白地带,分别为:社会心理学派、控制论学派、修辞学派、符号学派、社会文化学派、批判学派、现象学派。排序越靠前的流派,越多地采用实证性研究方法,反之则表示阐释性研究方法在该理论中占上风。倾向实证性的学派与NLP的联系更加紧.

2020-10-09 22:06:49

【收藏夹2020】

《千与千寻》背后暗藏的寓意你真的明白吗?在一个无国界( borderless)的时代,无立足之地的人是最受人鄙视的。立足之地就是过去,就是历史。 在我看来,没有历史的人和忘记了过去的民族,只能如蜉蝣一般消失,或者像一只鸡一样只知埋头生蛋,直到自己被吃掉。《 异境中的千寻——这部电影的主旨》—— 宫崎骏 1999年11月6日“曾经发生的事情不可能忘记,只是想不起来而已”,这是钱婆婆对千寻说的话。https://www.sohu.com/a/321946610_100205824...

2020-09-16 21:35:53

【数学】线性增长,指数增长,对数增长,幂增长

线性增长,斜率固定不变:y=ax+b y=ax+by=ax+b指数增长,曲率不断趋近于无穷大或0:y=ax+by=a^x+by=ax+b对数增长,曲率不断趋近于0:y=logax+by=log_ax+by=loga​x+b幂增长,曲率的绝对值不断趋近于无穷大或0,情况复杂:y=xay=x^ay=xa只从正坐标轴的角度看过去,幂函数和指数函数很像,但是指数函数的曲线更陡峭、开口较小,幂函数的曲线更平缓、开口相对较大。...

2020-09-15 11:03:00

【Python】YAML版本导致的读取错误LoadWarning: calling yaml.load() without Loader=... is deprecated

原因是新版本yaml弃用了原版本的用法。解决:yaml.load(list, Loader=yaml.FullLoader)原理:

2020-09-05 20:37:57

【科研故事】小王的故事(二)

小王没消停两天,又主动找我吃饭。我打趣道:怎么了?又和你导闹矛盾了?小王笑笑没说话,叫我去了食堂。我们边吃边东拉西扯地聊点有的没的。快吃完的时候,聊起交叉学科研究的问题。我提出一个观点:”交叉学科在做的时候,不能直接拿CS的皮毛去探那个领域的问题,这样做第一篇可以,但是后面的就不行。我记得某某年的时候,有人拿CS的网络去模拟一个视网膜疾病,发了很高级别的刊,但是后来再也没有人做过,因为CS部分的工作本身就很low。但是那人的data collection做得非常好,不论是数据量,还是特征误差,都控制

2020-08-28 15:13:45

【科研故事】小王的故事(一)

博士生小王最近突发奇,想投稿个计算机的会议。摆在面前的首要问题是如何同导师沟通。小王作为学生,想的是:导师并不熟悉这部分工作,但是鉴于国内普遍的家长式管理思维,找人合作这个议题就很难开口。背着导师投稿又是学术大忌,约等于送人头。导师方面倒不一定看得上小王做的东西,只是知情之后就有担责的风险。小王选择让他知情,他就要负责任,署名不署名都很被动。小王如果不让他知情,小王就比较被动。作为一个纠结型小伙,小王纠结了两天,主动放弃了。其实在我看来,他这一篇大概率被拒稿的文章出师未捷身先死,也算死得其所

2020-08-27 15:42:26

【报告笔记】大数据与人工智能的伦理挑战

今天分享大数据与人工智能的伦理挑战。(1)中立性算法表面中立,在学习中却可能形成隐形的歧视,甚至放大这些鸿沟。算法角度是合理的,但是社会往前发展,不能仅建立在数字化的优化上,而是要考虑很多人文的东西。例如高级职位推荐,女性占比8%-15%,系统开始偏向男性推荐,加剧性别差异。同理的还有秘书推荐给女性,卡车司机推荐给男性。随着系统对人购买力的打分,会有价格歧视。美国低矮桥,在设计的时候,就有把穷人挡在外面的意思。(2)时效性算法预测犯罪不犯罪。酒驾有些国家可以。燃放烟花爆竹是.

2020-08-22 12:12:57

【学术】集百家之长,有一家之言

又到了一年一度的和其他博士交流的时间。通过对话,我总结了几点收获。以下都是以讲述者的视角来记录。两个关键词:identity、insight。identity指你在学术领域的成体系的、有标识度的研究成果。insight指对问题本质的理解和打破现有认知的角度。(1) identity不能太大。比如,具体到数学统计学中的张量研究,而不能说identity是机器学习,或者数据挖掘。这太宽泛了!也太累了!Z.ZH的identity就是机器学习。他基本上在机器学习领域的各个领域都立了碑。但是他很

2020-08-22 10:36:10

【bash】快速切分数据文件

第一步:在Windows下安装git,通过开始菜单打开git bash第二步:切换路径。切换方式和cmd有区别,表现为以斜杠开头、作为分隔符,根目录后没有冒号。如: cd /d/第三步:使用split切分文件,可自动切分并命名。下面是按行切分:split -l 1000000 test.txttest.txt...

2020-08-20 21:56:17

【Python】for循环中修改索引变量只对当前循环体有效

(1)歪打正着偶然在for循环中用了同一个计数变量,结果却歪打正着。原因是操作放在子计数变量之前。如下:>>> for i in range(20):... print(i)... for i in range(5):... i+=100...012345678910111213141516171819这是因为在python中,一个for循环在每次迭代开始时将list / iterable中的下一个元

2020-08-16 11:41:54

【数据处理】UltraEdit处理超大文件的扩容方法

UltraEdit原始设置是限制51200大小的文件,有时候进行文件排序很容易超出限制,就会报出缓存错误,导致信息丢失。扩容步骤:高级-》配置-》设置-》临时文件-》上述的阈值-》多加一个0或者两个0...

2020-08-14 10:11:38

【Python】数据处理神器 savetxt() 和 loadtxt()

还在为存取数据而烦恼吗? numpy帮你解决这个困扰。(1)用savetxt() 函数将数据存储到文件import numpy as npdata = np.ones((3,4))np.savetxt("./data.csv")文件保存成功:(2)用 loadtxt函数读取文件import numpy as npdata = np.loadtxt("./data.csv")print(data)数据读取成功:利器啊,利器!...

2020-07-31 23:27:55

【Python】networkx关于网络分析的几个指标

(1)读取网络def load_graph(file_path): with open(file_path, "r") as fd: data = fd.readlines() # 分离出标题和数据行,如果没有标题,用#号注释掉下面这两行) title = data[0] data = data[1:] # 从数据中提取边,建立一个空的有向图G edges = [it.strip().strip(",").split(",")[:2] f

2020-07-31 14:07:46

【数据处理】为什么CSV文件用WPS打开总是比原始文件少若干行

处理一个csv文件,每次用文本编辑器打开,是某行。换成WPS打开总少几百行。人工定位了一下异常的数据,锁定在这里:2020/07/03 00:43:24,SikorskyFlights,"Linsk Minyk“ Sikorsky2020/07/03 00:43:26,wendy_marchese,Wendy Marchese2020/07/03 00:43:26,Smartkr13564931,smart_Krish2020/07/03 00:43:26,ChiTsz1,ChiTsz1,

2020-07-30 18:23:07

【Python】LDA使用LatentDirichletAll报错TypeError: __init__() got an unexpected keyword argument ‘n_topics‘

报错代码:LatentDirichletAllocation(batch_size=128, doc_topic_prior=None, evaluate_every=-1, learning_decay=0.7, learning_method='online', learning_offset=50.0, max_doc_update_iter=100, max_iter=50, mean_change_tol=0.00

2020-07-28 17:10:56

【Windows】右键菜单“新建”选项没有word和excel

点击电脑开始菜单,点选“运行”;在弹出窗口输入“regedit”,点击确定;弹出注册表,在搜索栏检索“HKEY_CLASSES_ROOT”,点击展开;在下拉菜单中找到“.doc”;在“.doc”文件夹内右键新建“项”,命名为“ShellNew”;在“ShellNew”右键新建字符串,命名为“NullFile”。成功!亲测可行!...

2020-07-25 15:31:31

【Python】unicode编码和bytes编码不能混用

报错:出现’ascii’ codec can’t decode byte 0xef in position 0:ordinal not in range(128)的错误。1、unicode和utf-8的区别。unicode指的是万国码,是一种“字码表”。而utf-8是这种字码表储存的编码方法。unicode不一定要由utf-8这种方式编成bytecode储存,也可以使用utf-16,utf-7等其他方式。目前大多都以utf-8的方式来变成bytecode。2、Python中字符串类型分..

2020-07-24 13:48:28

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 分享小兵
    分享小兵
    成功上传3个资源即可获取