自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 资源 (1)
  • 收藏
  • 关注

原创 LeetCode刷题之路 --- 字典树

目录1 字典树的概念2字典树的套路2 .1 字典树的特点2.2实现方法【通用模板】3. Leetcode 648 单词替换1 字典树的概念 在算法导论中,Trie并不是叫字典树,而是叫基数树,也就是说实际上并不是只有和字符串有关。字典树实际上是一个N叉树 。 在这个N 二叉树中,如果是共父节点的N个子节点是有序的,这样构造出来的树就和字典很像了,故叫字...

2020-02-06 22:48:01 510

原创 LeetCode刷题之路 --- 787. K 站中转内最便宜的航班

C语言完整解法:#defineMaxValue1000001intfindCheapestPrice(intn,int**flights,intflightsSize,int*flightsColSize,intsrc,intdst,intK){/*异常判断*/if(n<1||n>100||...

2020-02-05 23:54:32 392

原创 菊厂 --- 华为 面试经历

华为笔试面试没什么套路的,感觉就是很随性,本以为聊人生聊理想,反被怼的像狗屎的一次面试经历。 华为的秋招可以说非常晚了,等到十月中旬才开始,(没拿到BAToffer的我非常忧伤,阿里秋招提前批的三面挂掉了,就没有机会参加正式批秋招了,百度的笔试太特喵难了,根本没面试机会,因为哥哥在TX的缘故,我超级想去TX,TX挂掉的时候还在图书馆大哭了一场),感谢华为最后收留了我,言归正传...

2019-07-06 11:24:00 1799 3

原创 我的大厂offer全凭貌美如花!!!

身为学渣的我,如何在秋招中逆袭???貌美如何???不存在的!!! 其实我秋招还算满意,拿到了许多大公司的offer,也面了很多企业,涉及范围非常广:互联网、金融(银行、证券、保险、P2P)、传统行业(美的、格力)等。 找完工作,整个人都非常懒散,本想好好分享一下经验,学渣的我还是选择了躺尸和刷剧,最近又忙于毕业。今天突然登录了一下发现很多学弟学妹的评论。...

2019-05-10 22:39:47 672 3

原创 网易互娱面试总结(上)

~~~~总结基础知识~~~1.生成随机数组       方案一: import random  === random.shuffle       方案二:随机输出一个数,然后和前面的一个数进行交换2.快速排序      基本思想:         1)找一个基准点,(一般直接中间的点),然后设置两个变量        2)#-*-coding=utf-8-*-d...

2018-09-25 23:15:21 15123 1

原创 基础编程篇总结

戒躁戒躁,踏实学习~1.给定一个数判断素数思路:1不是素数,2及以后只能被1和自身整除的就是素数。#-*-coding=utf-8-*-def isPrime(n): flag = True if n &lt; 2: flag = False else: i = 2 while i &lt; n: ...

2018-09-24 13:20:49 434

原创 滴滴机器学习工程师面试总结

        非常感谢滴滴给了我非常多次面试机会,也由衷地佩服滴滴面试官的素质,希望大家不要再黑滴滴了。        也不知自己为什么这么有勇气,投遍了大厂的算法,然而最近的状态一直是做笔试,做测评,跑面试,什么公司都投,像赶场一样四处跑面试,真替自己心酸,仔细想一想,一家企业平均0.5小时投简历 + 2小时笔试 + 1小时测评 ,也就是一家公司平均要花3.5小时,然后细数这一个月,每天都...

2018-09-21 23:54:19 1025

原创 美的大数据挖掘笔试总结

美的大数据挖掘: 20单选 + 5多选 + 5 对错判断我做完后发现一下挺好的资料,发现最近做的很多关于数据挖掘的题在这里都能找到类似的,堪称数据挖掘题库,贴过来学习一下~                                                                                 数据挖掘题库一、异常值是指什么?请列举1种识别连续型...

2018-09-18 18:22:01 8713

原创 腾讯微众银行(算法工程师)笔试总结

刚做完,有点懵逼(好像投了风险策略岗,风控不太熟悉=_=)一、选择题 (20*3分)1.二叉树给出后序遍历和中序遍历,求前序遍历2.概率题(队0,队1那个,我觉得考了有十遍了=_=)3.简单的算法,对,全是机器学习算法,二、问答题(4*15分)1.计算电话号码(我没做出来诶=_=)2.boosting 和bagging 的算法过程讲解 以及二者区别3.给出必胜策略...

2018-09-18 18:11:07 3711

原创 顺丰科技大数据挖掘与分析工程师笔试总结

大厂的算法岗被我投遍了,然后意识到竞争太激烈,自身实力还是比较弱,开始找数据挖掘和数据分析了。两场笔试+ 一场面试,顺丰科技笔试做的不好,估计要凉,好吧,我真的不喜欢用赛玛,怎么选择题那么多---35个啊=_=顺丰其实考的听基础的,这也反映了我基础不扎实,想把做过的题好好整理一下,发现最近笔试有很多重复的题。主要回忆知识点:1.调用函数时,入参及返回地址使用了【栈】2.关于视图...

2018-09-15 22:00:02 4723 2

原创 搜狐畅游2018笔试总结(数据挖掘方向)

刚做完回忆一波题目,记得不太全了,设计概率论、基础算法,简单编程一、选择题1.选择题分为单选和多选,我主要记录一下当时觉得比较棘手的2.第一部分单选全是关于游戏的,大概是我没理解这是做游戏的=_=二、填空题1.有一个人下8级的楼梯,他一次可以选择走一个台阶或者两个台阶,请问这个人有多少种方式下楼 【34】2.设随机变量的X的概率密度函数为F(x) = 0.5*g(x) + ...

2018-09-15 21:46:30 864 3

原创 欢聚时代(YY)2018笔试总结(数据挖掘方向)

附上我自己的答案,题目顺序可能有误,我记不太清楚了=_=一、单选题(24分)1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)   A. 关联规则发现       B. 聚类  C. 分类                      D. 自然语言处理2.以下两种描述分别对应哪两种对分类算法的评价标准?(A)  (a)警察抓小偷,描...

2018-09-15 09:42:28 1680

原创 上传本地项目到Github讲解

1.首先你得有个GitHub账号吧~2.下载一个git工具,Git工具下载地址(傻瓜式next~就好)3.再回到GitHub网页:打开respositories,复制如下地址https://github.com/susuxuer/QA_System.git4.回到要上传的文件夹,右击出现:Git Bash Here,单击进入                   ...

2018-08-19 15:40:20 259

原创 机器学习算法总结

~~~~~·个人整理,如需转载,请说明并备注,不甚感激~~~~~~(这篇文章我很早发布在简书上,不用简书好多年了,哈哈哈,居然上了热搜,特复制在CSDN上供大家参考,为秋招攒点人品)suxuer简书原文地址BAT机器学习面试系列1.请简要介绍下SVM。SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的目标是为确定一个...

2018-08-19 11:23:02 8066 2

原创 剑指offer --- 循环打印

不知道为啥在牛客上一直编译不通过,我在本地运行很正常呀~  import reimport numpy as npimport mathdef printIncircle( matrix, columns, rows, start): endX = columns -1 - start endY = rows-1 - start res = [] ...

2018-08-10 20:50:05 157

原创 MySQL 权限恢复问题

     好久没用MySQL忘记了账号密码,一直没有使用权限。有木有和我一样健忘的?!     解决方案:(网上好多,但素不全,害我整了一个多小时)     1)打开CMD,进入MySQL安装文件下的bin 文件路径                                                 2)先断开MySQL服务器!!!!!!!             ...

2018-08-08 17:22:44 528

原创 在网易财经上抓取股价信息

1.在网易财经上抓取股票价格信息代码:"""date:2018-7-31function:在网易财经上抓取股价信息(仅选取2016年举办的业绩说明会信息)author:susuxuer"""import urllib.requestimport reimport csvimport timedef get_wenben(path): csvfile = ope...

2018-08-02 14:15:05 911

原创 Pandas读取文件的OSError: Initializing from file failed错误解决

pandas读取文件 path = 'D:/GFZQ/GFZQ/project/7_30_test/data/conferences/ST獐岛2016年度业绩说明会.csv' df_data = pd.read_csv(path)错误如下:错误原因:file文件名中包含了中文字符,(即无中文字符时可以正常运行)改成如下形式即可正常运行 path = ...

2018-08-01 13:56:02 11493 4

原创 股价预测的几点疑问

1.以“600548”为例import tushare as tsimport pandas as pdimport numpy as npimport datetimeimport globimport csvimport refrom dateutil.parser import parseimport matplotlib.pyplot as pltimport se...

2018-07-29 22:36:01 611

原创 利用时间序列模型进行股价趋势分析——tushare获取股价信息

 继续以周大生为例,获取2017/4/10 -- 2018/6/20 import tushare as tsimport pandas as pdimport numpy as npimport datetimefrom dateutil.parser import parseimport matplotlib.pyplot as pltimport seaborn a...

2018-07-26 13:29:34 8478 1

原创 ARIMA模型(股价趋势预测)

一、ARIMA模型的含义  ARIMA模型包括了三部分:  AR+ I + MA ,ARIMA模型针对非平稳时间序列模型,如果非平稳时间序列要建立ARMA模型,首先必须经过差分转换为平稳时间序列,然后建立ARMA模型。  AR--auto regression 自回归模型;   I --- integration 单整阶数,时间序列必须是平稳性序列才能建立计量模型  MA --mo...

2018-07-26 11:06:44 17311

原创 金融情感分析--基于业绩说明会的研究

额,基本工作完成了,先整理一下这个小项目。发现一个非常棒的网址:https://github.com/yaleimeng/Final_word_Similarity项目内容: 一、数据准备       项目数据来源:抓取全景网上业绩说明会文本内容       实验所用词典数据  == 基本词典 + 金融词典      1.1 基本词典:          1)大连理工情...

2018-07-25 17:45:11 2133 6

原创 基于同义词词林的词语间相似度计算

基于哈工大同义词词林的词语间相似度计算局限:单纯使用同义词词林来计算相似度,如果词典中没有该词,就算不出相似度。代码(在python3.6上正常运行)#!/usr/bin/env python3# -*- coding: utf-8 -*-#2018/7/25import mathclass CilinSimilarity(object): """ 基于...

2018-07-25 13:33:41 7452 2

原创 Doc2Vec计算句子相似度

X_train  就是自己的训练语料“”“date:2018_7_25doc2vec计算句子相似性”“”# coding:utf-8import sysimport timeimport csvimport globimport gensimimport sklearnimport numpy as npimport jieba.posseg as psegimp...

2018-07-25 11:29:50 3778 1

原创 金融情感分析,股市预测(二)

"""已周大生为例;2018/4/10-2018/6/20抓取业绩说明会前后的股民评论"""#!/usr/bin/env python# -*-coding:utf-8 -*-import urllibimport urllib2import re#导入对excel文件进行操作的库import xlwt#创建表格,设置编码模式,创建新的sheetbook=xlwt....

2018-07-24 15:15:27 2344

原创 金融情感分析--股市预测(一)

(PS:趋势分析)我选的是周大生2018年第二季度的股市行情,在这里选择周大生直接复制粘贴得到xlsx文件(文件内容如下)(已在Win7、python3.6上运行成功)""""以周大生为例;说明会时间:2018/4/20前10天-后60天 4/10-6/20"""from pandas import DataFrame, Seriesimport pa...

2018-07-24 10:54:16 4610

原创 word2vec 计算相似度(基于Wiki)

__author__ = 'su'import osimport loggingimport sysimport reimport jiebaimport multiprocessingimport gensimfrom gensim.corpora import WikiCorpusfrom gensim.models import Word2Vecfrom gens...

2018-07-18 09:21:43 1509

原创 基于Word2Vec 的相似度计算

#coding=UTF-8import reimport timeimport csvimport sysimport osimport gensim.models.word2vec as w2vimport jiebaimport globdef loadPoorEnt(path2 = 'G:/project/sentimation_analysis/data/stopwo...

2018-07-16 21:52:55 2787 1

原创 情感分析

# encoding:utf-8import pymysqlimport jiebaimport osimport pickle# import datetimeimport timefrom collections import namedtuplefrom langconv import *#import matplotlib as mplimport matplot...

2018-07-16 20:16:57 364

原创 谈一下SnowNLP的情感分析

SnowNLP是一个封装好的python库,可以做情感分析,计算文本相似度(BM25方法)、提取关键词等。安装方法:pip install SnowNLP ,该库仅适用于python3版本我也是无意发现这玩意儿,听说下过不错,我实验了一下"""学习一下使用SnowNLP"""from snownlp import SnowNLPimport csvimport sysfrom sn...

2018-07-12 16:22:44 6720

原创 金融领域词典构建

做情感分析还是需要结合情景和业务,之前直接用词典库效果太差,准备自建金融词典构建1.tfidf提取关键词import jieba.posseg as psegimport numpy as npimport pandas as pdimport jiebaimport timeimport csvimport sysimport globimport osfrom collect...

2018-07-12 14:05:37 7191 4

原创 基于词典的情感分析

# -*- coding: utf-8 -*-"""author = 'suxuer'date ="""import jiebaimport jieba.posseg as psegimport sysimport importlibprint("加载用户词典...")importlib.reload(sys)#sys.setdefaultencoding('utf8')...

2018-07-03 09:39:28 618 1

原创 简单的情感分析

运行环境:python3.6数据下载:Hownet (知网)情感词典https://bosonnlp.com/resources/BosonNLP_sentiment_score.zipimport timeimport jiebaemotion_dic = {}filename = './BosonNLP_sentiment_score.txt' # txt文件和当前脚本在同一目录下...

2018-07-02 20:05:11 1049 3

原创 each_company(note)

# -*- coding: utf-8 -*-"""author:suxuerdate:2018/6/18version-1.0"""import pandas as pdimport requestsimport jsonimport timeimport csv"""#获取每一家公司的业绩说明会基本信息#title:业绩说明会标题#speaktime:说明会举行...

2018-07-02 19:57:12 187

原创 python多线程

一、概念        单线程:串行执行,即执行流程在一条线上        多线程:并行执行,即执行流程在多条线上多任务可以由多进程完成,也可以由一个进程的多个线程完成。进程由若干个线程组成,一个进程至少包含一个线程。线程是操作系统直接支持的执行单元,许多高级语言都是内置多线程的支持。python也不例外。二、python中多线程的库介绍:    thread 和threading两个标准库  ...

2018-06-27 14:25:20 2920 1

原创 python爬虫的异常处理

进行异常处理我们经常使用try....except语句,在try中执行主要代码,在except中捕获异常信息,并进行相应的异常处理。一、爬虫中异常主要有两大类:    (1)URLError类    (2)HTTPError类def error_process(): try: import urllib.request import urllib.error...

2018-06-27 11:06:19 6270 1

原创 VLAD讲解2

局部聚合向量noteVLAD stands out for the following reasons:(1)    计算很原始(加法/减法操作)(2)    和CNN相比,训练一个VLAD编码器更直接,也不需要大量的训练集(3)    VLAD 被认为是FV的一个特例,所以具有FV的一些性质(例如最重要的Fisher kernel)(4)    从经验上来看,VLAD is state-of-a...

2018-06-26 20:20:51 678

原创 VLAD讲解

局部聚合向量(Vector of Locally Aggregated Descriptors,VLAD)一种编码方法,广泛用于基于音频的人脸识别、动态场景识别、头部姿态分类等。(1) 欧式空间的VLAD:               具有非常高的辨别能力    仅利用常规的VLAD能够使用初始向量的加法和减法。常规的欧式空间上的VLAD:分    给定一个局部描述子集合,假设他们是高斯混合模型 ...

2018-06-26 19:43:18 9005

原创 链接爬虫实战(CSDN博客)

#coding=utf-8"""author:susudate:2018/6/25function:get the links of blog"""import reimport urllib.requestdef getlink(url): #模拟成浏览器 headers = ("User-Agent","Mozilla/5.0 (Linux; Android 6.0; ...

2018-06-25 11:10:21 156

原创 批量处理CSV文件

有必要介绍两个个棒棒的库1)glob        #用于查找符合规定的文件路径(如果你os 模块用的6,用哪个也挺好的)def get_all_content(): all_files = glob.glob(r'D:/../../*.csv') #填写自己的文件路径 return all_files这样就搜索到了文件夹中所有的CSV文件2)re        #用于匹配not...

2018-06-24 19:02:04 3111

精密全波整流,电子设计大赛必备

电子设计大赛必备资料 精密全波整流,为啥要写50字。精密全波整流,为啥要写50字。

2018-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除