8 esc_ai

尚未进行身份认证

我要认证

DougCutting从实习生做起1985年,Cutting毕业于美国斯坦福大学。他并不是一开始就决心投身IT行业的,在大学时代的头两年,Cutting学习了诸如物理、地理等常规课程。因...

等级
TA的排名 2k+

BPE算法

BPE,(byte pair encoder)字节对编码,也可以叫做digram coding双字母组合编码,主要目的是为了数据压缩,算法描述为字符串里频率最常见的一对字符被一个没有在这个字符中出现的字符代替的层层迭代过程。具体在下面描述。该算法首先被提出是在Philip Gage的C Users Journal的 1994年2月的文章“A New Algorithm for Data Compr...

2020-04-19 16:18:19

统计机器学习-4-三维绘图

用python绘制三维函数图像:Z=X2+Y2Z = X^2 + Y^2Z=X2+Y2import matplotlib as mplfrom mpl_toolkits.mplot3d import Axes3Dimport numpy as npimport matplotlib.pyplot as pltfig = plt.figure()ax = fig.gca(proje...

2019-10-19 20:12:02

统计机器学习-3-numpy100题

numpy 100道练习题这100道练习题从numpy的mailing list、Stack Overflow和numpy官方文档收集而来,其目的是提供一个快速入门的参考文档为numpy学习者,也可以用作教学练习题。如果你发现错误或者有更好的解法,欢迎在github上提交issue: https://github.com/rougier/numpy-1001.如何导入numpy包?impo...

2019-05-02 00:38:26

统计机器学习-2-矩阵范数与导数

矩阵基础矩阵的知识是从行列式而来,矩阵和行列式的区别在于矩阵是一张表,行列式是一个数:(A)[993426719] \begin{bmatrix} 9 & 9 & 3\\ 4 & 2 & 6 \\ 7 & 1 & 9 \end{bmatrix} \tag{A}⎣⎡​947...

2019-05-01 21:47:20

统计机器学习-1-统计机器学习基础

一、统计机器学习的研究内容网络 算法 机器 优化 概率 统计数据 矩阵 信息 模型 推理获知识 靠学习We are drowning in information and starving for knowledge. -John NaisbittData -> Model -> Knowledge二、机器学习与应用统计学对比MLSTATISTICS...

2019-04-28 00:08:54

jupyter打开.ipynb文件

看到很多python笔记都使用.ipynb格式,第一个问题便是怎么打开这种格式的文件?使用.ipynb格式和使用markdown相比优势在哪里?带着这些疑问整理一篇博客一、jupyter功能按百度百科的介绍:Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。Jupyter Notebook 的本质是一个 ...

2019-04-27 23:41:14

MySQL根据字段名查找数据库名和表名

SELECT DISTINCT TABLE_SCHEMA,TABLE_NAME FROM information_schema.COLUMNS WHERE COLUMN_NAME = '要查找的字段名称'

2019-03-10 16:12:21

Python 风格规范(Google)

本项目并非 Google 官方项目, 而是由国内程序员凭热情创建和维护。如果你关注的是 Google 官方英文版, 请移步 Google Style Guide以下代码中 Yes 表示推荐,No 表示不推荐。分号不要在行尾加分号, 也不要用分号将两条命令放在同一行。行长度每行不超过80个字符以下情况除外:长的导入模块语句注释里的URL不要使用反斜杠连接行。Python会将...

2019-02-28 11:05:17

机器学习之KNN鸢尾花分类

KNN简介邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一...

2019-02-24 16:34:28

python处理搜狗新闻数据_140万条

一、文件处理gzip -d SogouCA.tar.gztar -xvf SogouCA.tarcat *.txt > SogouCA.txtcat SogouCA.txt | iconv -f gbk -t utf-8 -c > SougouCA_UTF8.txt二、数据清理与入库建表:CREATE TABLE `news` ( `id` int(10) NOT ...

2019-02-13 15:35:01

canal配置

一、MySQL密码策略修改set global validate_password_policy=0;set global validate_password_length=1;二、安装canal serverCREATE USER canal IDENTIFIED BY 'canal'; GRANT SELECT, SHOW VIEW, REPLICATION SLAVE, REP...

2019-01-05 15:08:00

MySQL主从(MS)、主主(MM)复制

一、安装MySQL 5.7如果安装过mysql,删除停掉mysql进程:pkill -9 mysqld删除mysql:rpm -qa|grep -i mysqlyum -y removemysql-community-client-5.6.38-2.el7.x86_64依次卸载 直到没有yum安装cd /usr/local/src/wget http://rep...

2018-12-23 23:12:02

zookeeper概念、应用场景、数据组织、集群搭建、客户端操作、Java客户端、curator

一、zookeeper简介1.1 zookeeper简介Apache的很多项目以动物来命令,比如Hadoop(大象)、Hive(小蜜蜂)、Pig(猪猪),这些项目都是hadoop生态系统的成员。Hadoop生态系统是为了解决大数据存储、大数据计算和大数据数据分析的,解决大数据问题的核心思想是分布式,而分布式系统的开发中一个关键问题是如何解决数据在不同系统之间的一致性问题。zookeeper顾名...

2018-11-23 22:03:54

mac安装fabric找不到fabric.api

先卸载再安装低版本:pip uninstall fabricpip install fabric==1.14.0

2018-10-16 16:29:22

Lucene索引合并

@Test public void mergeIndex() throws IOException { Analyzer analyzer=new HanLPAnalyzer(); IndexWriterConfig icw = new IndexWriterConfig(analyzer); icw.setOpenMode(Inde...

2018-08-24 15:07:35

Elasticsearch电商搜索分词效果调优

分词是搜索中非常核心的一步,下面通过一个案例介绍在没有专业分词系统的情况下,如何做分词性能的调优。

2018-08-06 00:17:59

javax.jms.JMSException: Could not connect to broker URL: tcp://localhost:61616

spring.activemq.broker-url=tcp://localhost:61616改为:spring.activemq.broker-url=tcp://0.0.0.0:61616

2018-07-19 20:50:49

spring boot获取resource目录下文件

Resource resource = new ClassPathResource("resource目录下的文件路径"); File file = resource.getFile();例如:resource目录下: a/1.txt获取1.txt文件的方法: Resource resource = new ClassPathResource("a/1....

2018-07-14 23:38:23

spring boot 工程创建、常用注解、控制器、模板引擎使用

最近要狂补Spring boot了,总结一下相关知识点。一、工程创建与运行访问:http://start.spring.io/按如图所示,配置好项目信息,生成project。 Dependencies里面选择项目依赖,一般初始化工程的时候加上web即可。解压下载好的代码,用IDEA打开。 新建一个Hello.java的Controller类:package co...

2018-07-02 14:01:35

Elasticsearch 同义词配置

什么是同义词就不用说了,直接说怎么实现。测试环境:ES 5.5.1 一、同义词词库准备一个同义词词库,每行一个同义词词组,例子syno.dic:西红柿,番茄,tomato马铃薯,土豆二、配置分析器DELETE synoPUT syno{ "settings": { "analysis": { "filter": { &

2018-06-27 10:29:56

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 图书勋章
    图书勋章
    CSDN技术图书作者专属勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。