4 admin_maxin

学生身份

我要认证

1.了解Tensorflow 框架,能够构建 LeNet 和 AlexNet 等深度卷积神经网络模型对图像进行分类及预测,了解基于NLP 的情感挖掘基本流程; 2.了解常用机器学习算法原理,有较为扎实的线性代数、概率论及统计等数学基础; 3.熟练使用PyCharm进行 Python 程序设计,了解C/C /Linux/Html 等编程语言及其简单使用; 4.熟悉协同过滤推荐系统原理及实现,了解协同过滤推荐系统前沿及推荐系统常用算法; 5.熟练使用XMind 等办公软件,了解 SQL sever ,mongodb及SPSS Modeler 的简单使用; 6.研究生一年级公开发表4篇学术论文

等级
TA的排名 1w+

数据存储 | MySQL —— MySQL学习框架图(持续更新)

2020-08-13 11:09:26

数据存储 | MySQL —— ORM框架的使用(python:sqlalchemy库)

1.参考博客https://www.cnblogs.com/wupeiqi/articles/5713330.html2.实战代码from sqlalchemy.ext.declarative import declarative_basefrom sqlalchemy import Column, Integer, String, ForeignKey, UniqueConstraint, Indexfrom sqlalchemy import create_enginefrom

2020-08-11 15:37:50

数据存储 | MySQL—— pymysql连接远程mysql提示pymysql.err.OperationalError: (2003, “Can‘t connect to My问题的解决

1.环境说明[客户端] windows 10 / PyCharm/ Python 3.7[服务端] ubuntu/ mysql2.问题说明[问题描述]pymysql.err.OperationalError: (2003, "Can't connect to MySQL server on '192.168.x.x' ([WinError 10061] 由于目标计算机积极拒绝,无法连接。)")[原因分析] 1.mysql中用户权限不足 2.mysql远程连接配置存在问题.

2020-07-30 15:05:31

Linux | linux —— 基础学习框架(持续更新!)

目录1.linux学习框架图2.说明1.linux学习框架图2.说明补充资料:相关视频教学可关注博主 bilibili账号(_ssh小星)自行观看

2020-07-29 15:46:57

数据存储 | MySQL —— MySQL命令练习题(持续更新!)

1.表结构2.建库/建表建库create database test default charset utf8;创建class表 / 插入数据-- 创建表create table class ( cid int(11) not null auto_increment primary key, caption char(12) not null) engine=innodb auto_increment=1 default charset=utf8;-- 插入数据

2020-07-24 15:34:36

机器学习 | 算法模型 —— 算法训练:损失函数之交叉熵(熵/相对熵/KL散度/sigmoid/softmax)

目录1.信息论1.1.信息量1.2.熵1.3.KL散度(相对熵)1.4.交叉熵2.交叉熵的类型2.1.多分类交叉熵2.2.二分类交叉熵3.学习过程(以二分类为例)3.1.第一项求偏导3.2.第二项求偏导3.3.第三项求导3.4.计算结果1.信息论交叉熵(cross entropy)是深度学习中常用的一个概念,一般用来求目标与预测值之间的差距。同时,交叉熵也是信息论中的一个概念,要想了解交叉熵的本质,需要先从最基本的概念讲起。1.1.信息..

2020-07-10 17:36:38

机器学习 | 特征工程 —— 降维:PCA(主成分分析)

1.数学原理1.1.【参考博客】https://www.cnblogs.com/xinyuyang/p/11178676.html1.2.【精简描述】PCA实际上是将含有冗余特征的高维空间数据集投影到地位空间中,在保证信息量的同时,对数据集冗余特征进行筛选。而投影的关键就在于确定高维空间向低维空间转换的基向量。而基向量选取的原则则是尽可能的保持投影后的数据的信息量,也就是高维数据投影到低维空间中某个基向量之上以后,数据越分散越好(常用方差衡量数据的分散程度,即相同特征之间方差越大越好)。同

2020-07-04 12:54:08

机器学习 | 算法模型 —— 聚类:FCM模糊聚类算法

1.FCM模糊聚类原理模糊c均值聚类FCM算法融合了模糊理论的精髓,相较于k-means的硬聚类,FCM算法(Fuzzy C-Means,FCM)提供了更加灵活的聚类结果。因为大部分情况下,数据集中的对象不能划分成为明显分离的簇,将一个对象划分到一个特定的簇有些生硬,不符合人的客观认知。因此,对每个对象和每个簇赋予一个权值,指明对象属于该簇的程度即可。当然,基于概率的方法也可以给出这样的权值,但是有时候我们很难确定一个合适的统计模型,因此使用具有自然地、非概率特性的FCM聚类算法就是一个比较好的选择。

2020-07-03 19:57:36

网络爬虫 | 猫眼电影最受期待榜信息抓取 —— 基于multiprocessing / re(多进程/正则表达式)

import reimport requestsfrom requests.exceptions import RequestExceptionimport multiprocessingimport randomheaders = {'User-Agent': "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.151 Safari/.

2020-07-02 18:24:52

python3__进程__分布式进程

1.task_mater.py在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。Python的multiprocessing模块不但支持多进程,其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者,将任务分布到其他多个进程中,依靠网络通信。由于managers模块封装很好,不必了解网络通信的细节,就可以很容易地编写分布式多进程程序。举个例

2020-06-29 18:04:48

python3__零散问题处理

目录1.dataframe中可迭代元素因长度不同修改时报错的问题1.dataframe中可迭代元素因长度不同修改时报错的问题原始代码:将商品标题对应特征词列表转换为向量并重新赋值 for i in range(itemsData.shape[0]): words = itemsData["name"][i].split(" ") tmp1 = np.zeros(w2c.wv.vector_size) for word in word

2020-06-09 16:33:01

网络爬虫 | 腾讯招聘信息采集——基于Python中Scrapy框架

1.爬虫项目工具:①PyCharm集成开发环境②Google浏览器③Google浏览器插件:xpath helper, json viewer视图插件2.命令行scrapy重要参数:①check : 检查项目,并由crawl返回②crawl : 运行爬虫抓取数据③edit :通过编辑器编辑爬虫文件④fentch :使用Scrapydownlo...

2018-04-18 19:07:35

网络爬虫 | 京东全站数据采集(类目、店铺、商品、评论)——基于Python中Scrapy框架

123

2020-05-08 23:17:24

论文|翻译——行为数据挖掘(持续更新!)

1.作者简介【姓名】:赵玺【个人主页】:http://som.xjtu.edu.cn/info/1014/3587.htm【研究方向】:大数据驱动的行为理论、行为分析和仿真;基于大数据行为的决策支持;人工智能与深度学习;区块链2.近期学术论文[1]位置推荐[1]A complementing preference based method for locationr...

2020-05-07 23:53:51

数学分析|最优化——梯度下降法、牛顿法、拟牛顿法等

1.最优化问题分类按照约束条件分,可以分为:无约束优化问题、有不等式优化问题、有不等式优化问题。按照是否线性,可以分为线性优化问题(目标函数和约束均线性)、非线性优化问题(目标函数和约束中任意部分非线性)。按是否凸,可以分为凸优化问题、非凸优化问题。对于有约束优化问题,常见的做法是转换到无约束问题上:对于只有等式约束的问题,通过拉格朗日乘子转换;对于有不等式约束的问题,通过KKT...

2020-04-20 19:02:05

图论 | 无向图 —— 二部图/二分图

123

2020-04-10 11:01:47

MongoDB | 运算符 —— 查询(query)与投影(projection)运算符 (16.1)

目录1.比较运算符2.逻辑运算符3.元素查询运算符4.求值查询运算符5.地理空间查询运算符6.数组查询运算符7.按位查询运算符8.投影运算符1.运算符1.1.查询(query)与投影(projection)运算符1.1.1比较运算符查询操作符 含义 {field:{$eq:value}} 匹配字段field值等于指定值val...

2020-03-27 13:42:37

MongoDB | 基本概念 + 数据类型(二)

1.基本概念1.1.数据库(database)1.1.1.基本性质①一个MongoDB中可建立多个数据库②默认数据库为“db”,且存储在“data”目录当中③单个实例可容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中1.1.2.基本操作①启动数据库:mongo②显示所有数据库:show dbs③显示当前数据库对象与几何:d...

2020-03-26 18:33:53

MongoDB | 概述(一)

1.MongoDB概述MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,可以保证服务器性能,其旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。2....

2020-03-25 16:53:59

推荐系统 | 重排序 —— 贝叶斯个性化排序(Bayesian Personalized Ranking, BPR)

1.“排序推荐算法”分类2.贝叶斯个性化排序(Bayesian Personalized Ranking, BPR)2.1.应用场景传统的近邻协同过滤推荐算法的核心思想是基于现有“用户-商品评分矩阵”计算用户之间的相似度,并通过评分预测公式对整个矩阵中的缺失评分进行预测,并依据评分的高低对用户进行推荐,实践证明使用起来也很有效。但是,在千万级别的商品中用户感兴趣的商品仅仅是个位数...

2020-03-17 10:49:52

查看更多

勋章 我的勋章
  • 领英
    领英
    绑定领英第三方账户获取
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 脉脉勋章
    脉脉勋章
    绑定脉脉第三方账户获得
  • 签到王者
    签到王者
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv1
    阅读者勋章Lv1
    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。