- 博客(3)
- 收藏
- 关注
原创 Python处理千万级数据
从别人的论文里找到要用的数据的原始数据自己做过滤捣鼓了两天觉得代码太慢开始用pandas做处理不得不说最大的感触就是 pandas 以及numpy在一定程度上在还原MATLAB比如MATLAB中利用逻辑值取数、元素的用法,pandas中有几乎一样的方法test:同时pandas中有很多很好用的方法,猜测使用了很多哈希值但是pandas同numpy一样,增量添加很慢也...
2018-08-05 15:17:05 8121
原创 给服务器装cuda时踩过的坑
花了一下午加一早上终于把碰到的问题都解决了读官方文档给服务器安装cuda和cudnn1.~/.bashrc 文件和 /etc/profile这两个文件都可以添加环境变量,但是又有区别这也是为什么第一天晚上在管理员账号下可以看到(nvcc -V)版本是9.0 但是普通用户看不到的原因~/.bashrc 只能修改当前用户的环境路径,而/etc/profile修改的是所有用户的。当然...
2018-07-20 10:56:40 4324 1
原创 用gensim库训练word2vec踩过的坑
最近在进行毕设,也用tensorflow写了一个skip-gram算法的embedding由于是论文复现,需要的embedding matrix(skip-gram,dimension = 400,negative samples =10) 和网上现有的训练好的词向量不太一样,于是开始尝试自己训练整个过程分为两部分1.训练demo: text8.zip先贴代码 #!/usr...
2018-03-28 22:23:23 10882 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人