3 羊城迷鹿

尚未进行身份认证

暂无相关简介

等级
TA的排名 3w+

论文阅读:Fake News Detection on Social Media:A Data Mining Perspective

问题背景当前的社交媒体由于具有成本低、访问易、传播快、社交参与度高等特点,吸引着越来越多的人从中获取和消费新闻,但这也同时给假新闻的快速传播创造了条件。对于社会,假新闻会扰乱整个新闻系统的生态,使得偏见深入人心;而对于每个个体,假新闻和真新闻的交织会让人感到困惑,逐渐丧失分辨真伪的能力。为了尽量减少假新闻给个人和社会带来的消极影响,社交媒体上的假新闻检测这一新兴研究领域得到了越来越多的关注。问...

2019-11-15 01:33:59

拿R来画画(四):毫无技巧的箱线图

绘制箱线图观察数据head(ToothGrowth)A data.frame: 6 × 3 lensuppdose <dbl><fct><dbl> 4.2VC0.5 11.5VC0.5 7.3VC0.5 5.8VC0.5 6.4VC0.5 10.0VC0.5基础箱线图:传入因子型变量x和数值变量yboxpl...

2019-11-15 01:27:44

拿R来画画(三):左手bar右手histogram

其实之前一直都有些分不清bar和histogram,感觉它们都是柱子一样的形状,今天学习才知道bar的每一个柱子对应一个不同的变量或者是同一变量的离散值,而histogram的每一个柱子对应相同变量的一段区间。因此,即使只看形状,bar的每个柱子之间通常是相邻的,以更好地区分变量间的关系,而histogram的柱子之间往往没有空隙,来表现它们之间的连续不断。bar观察数据head(BOD...

2019-11-13 01:08:51

kaggle竞赛记录之衣服分类

文章目录竞赛概述获取测试集和验证集准备原始数据分层抽样数据集类加载数据引入模型训练函数开启训练生成预测结果竞赛概述比赛地址:https://www.kaggle.com/c/dm2019springproj3数据集为包含八类衣服的图片,目标是预测测试集中的衣服的类别。获取测试集和验证集准备原始数据from typing import Listimport loggingfrom t...

2019-11-01 23:03:03

让jupyter notebook颜值up:jupyterthemes的不同样式

github:https://github.com/dunovank/jupyter-themesoceans16chesterishgrade3gruvboxdgruvboxlmonokaionedorksolarizeddsolarizedl

2019-11-01 19:27:12

手动实现随机森林并做数据实验

获取波士顿房价数据集import numpy as npfrom numpy import *import randomfrom sklearn.model_selection import train_test_splitfrom sklearn.datasets import load_bostonfrom sklearn.metrics import r2_scorebost...

2019-10-31 14:18:58

Kaggle竞赛:Histopathologic Cancer Detection(VGG加RNN)

文章目录划分训练集和测试集训练及评估函数加载函数训练函数挺不错的vgg不太好的RNN模型的保存和加载计算最终的结果划分训练集和测试集import pandas as pdimport osimport shutilimport random!cd train && ls -l |grep "^-"|wc -l220025Train_label = pd.rea...

2019-10-31 13:54:16

青蒿素抗疟疾效果预测比赛

比赛网址及说明https://www.synapse.org/#!Synapse:syn16924919/wiki/583955读取文件并简单分析import pandas as pdtrain_data = pd.read_csv('./SubCh1_TrainingData.csv')test_data = pd.read_csv('./SubCh1_TestData.csv'...

2019-10-27 13:55:17

拿R来画画(二):毫无技巧的折线图

绘制折线图观察数据head(pressure)A data.frame: 6 × 2 temperaturepressure <dbl><dbl> 00.0002 200.0012 400.0060 600.0300 800.0900 1000.2700基础折线图plot(pressure$temperature,...

2019-10-11 00:29:48

随便搞点随机数

文章目录从有到有:从样本中抽样categorical:给定样本的概率之后随机取样stateless_categorical:给定样本的概率之后伪随机取样给定样本的分布之后从中取样shuffle:简单粗暴打乱样本从无到有:生成符合某种分布的样本均匀分布gamma分布正态分布poisson分布伪随机分布(seed好使)从有到有:从样本中抽样categorical:给定样本的概率之后随机取样令人...

2019-10-10 17:46:11

拿R来画画(一):毫无技巧的散点图

绘制散点图观察数据head(mtcars)A data.frame: 6 × 11 mpgcyldisphpdratwtqsecvsamgearcarb <dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl>&lt...

2019-10-08 00:41:15

走近tensor常量

常量(constant)篇import tensorflow as tf最常规x = tf.constant([1, 2, 3, 4, 5, 6])x<tf.Tensor: id=1, shape=(6,), dtype=int32, numpy=array([1, 2, 3, 4, 5, 6])>加上形状属性x = tf.constant([1, 2, 3, 4,...

2019-10-06 20:16:18

tensorflow基础流程

引入包并查看版本号import tensorflow as tfimport tensorflow.keras as kerasprint(tf.__version__)print(keras.__version__)2.0.02.2.4-tf引入数据集如果下载不顺利的话可以从 https://www.kaggle.com/vikramtiwari/mnist-numpy/...

2019-10-05 21:06:24

迭代法动态生成谢尔宾斯基三角形

定义初始点和随机点import matplotlib.pyplot as pltimport numpy as npcolors = ['r','g','b']x0 = (0,0)x1 = (10, 0)x2 = (5, np.sqrt(75))z = (3,4)开始迭代%matplotlib inline# 绘制初始地图fig = plt.figure()# ...

2019-10-02 17:28:32

宏基因组测序流程(不完全版)

文章目录所做工作收获宏基因组分析流程Step1.去除宿主污染Step2.去除接头序列Step3.对序列进行进一步质控Step4.对read进行进一步拼接(contig)Step5.对contig进行orf预测Step6.查找orf区翻译出来的氨基酸序列对应的蛋白质家族所做工作Step1.去除宿主污染Step2.去除接头序列Step3.对序列进⾏进⼀步质控Step4.对read进⾏进⼀步拼...

2019-09-18 21:17:42

对两个研究方向进行横向比对

观察热度网址:https://apps.webofknowledge.com/UA_GeneralSearch_input.do?product=UA&search_mode=GeneralSearch&SID=8FbxrGEk7sefp16wfsL&preferencesSaved=搜索图神经网络相关领域论文点击右上角分析索引结果研究方向包括计算机科学、数...

2019-09-17 15:46:26

CNN模型的可视化方式

文章目录打印模型结构生成类原型 (Classes Prototype Generation)创建模型加载已经训练好的模型生成图片基于梯度的方法(Gradient based Methods)热力图(Saliency Map)定义网络计算热力图特征激活图(Feature activation map)Class Activation Map(CAM)Gradient-weighted Class A...

2019-09-14 14:05:45

Mendeley使用笔记

快进入研究生阶段了,paper警告。为了更高效地阅读和总结paper,特学习Mendeley这一文献管理软件。新建文件夹首先需要新建文件夹,当然这种文件夹是思维逻辑上的,并不真的在哪个盘里。这一步可以从太多地方着手了,左上角有file点开可以添加,下方的Add点开也可以添加,如果要在文件夹下新建文件夹,直接右键添加即可。添加和删除文件点击某个文件夹,直接把文件拖动到中央的空白区域。...

2019-09-14 09:08:08

使用爬虫对植物定种

代码# -*- coding: UTF-8 -*-import urllibimport urllib2import rename = str(raw_input('请输入物种名:'))values={}values['id'] = namedata = urllib.urlencode(values)url = "http://frps.iplant.cn/frps"getu...

2019-09-02 10:58:28

早期败血症预测比赛记录

比赛官网https://physionet.org/challenge/2019/代码原始数据整合首先,手头数据的长相是这样式儿的一个psv文件中存储着一个患者随时间变化的数据,一行代表一天的数据计算缺失值大于0.5的列收获了解了一些医学常识,提升了自己的数据分析和处理能力,通过在群里和大家交流收获了不少有趣的想法,对于机器学习类比赛有了更深入的了解。取得了进入复赛的好成...

2019-09-01 09:58:28

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。