自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4496)
  • 收藏
  • 关注

转载 电脑组装之硬件选择

了解电脑电脑主要配件:主板、CPU、显卡、显示器、电源、机箱、内存条、硬盘。CPU、显卡、内存条、硬盘是插在主板上的,电源用来给主板上的部件进行供电,CPU,主板,显卡,内存条、硬盘、电源这几个放在机箱中就构成了我们通常所说的主机。摩尔定律,硬件的性能每隔18~20个月就会提升一倍。主板主板性能指标:芯片组、供电项数目、做工、扩展能力(是否支持USB3.0或者USB3.1,是...

2019-09-29 15:54:00 1150

转载 基于MFCC的语音数据特征提取概述

1. 概述  语音是人类之间沟通交流的最直接也是最快捷方便的一种手段,而实现人类与计算机之间畅通无阻的语音交流,一直是人类追求的一个梦想。  伴随着移动智能设备的普及,各家移动设备的厂家也开始在自家的设备上集成了语音识别系统,像Apple Siri、Microsoft Cortana、Google Now等语音助手的出现,使得人们在使用移动设备的同时,也能够进行语音交流,极大的方...

2019-09-28 12:14:00 801

转载 Keras保存模型并载入模型继续训练

我们以MNIST手写数字识别为例import numpy as npfrom keras.datasets import mnistfrom keras.utils import np_utilsfrom keras.models import Sequentialfrom keras.layers import Densefrom keras.optimiz...

2019-09-28 08:40:00 924

转载 Audio Bit Depth Super-Resolution with Neural Networks

Audio Bit Depth Super-Resolution with Neural Networks作者:Thomas Liu、Taylor Lundy、William Qi摘要 Audio Bit Depth Super-Resolution是一个尚未通过深度学习的视角来研究的问题,目前使用的有效方法很少。在本文中,我们提出了一种基于WavaNet结构来...

2019-09-27 20:29:00 238

转载 自编码器

  神经网络就是最简单的自动编码器,区别在于其输出和输入是相同的,然后训练器参数,得到每一层中的权重,自然地我们就得到了输入x的不同的表示(每一层代表一种)这些就是特征,自动编码器就是一种尽可能复现原数据的神经网络。  “自编码”是一种数据压缩算法,其中压缩和解压缩过程是有损的。自编码训练过程,不是无监督学习而是自监督学习。  自编码器(AutoEncoder,AE)是一种利...

2019-09-27 09:26:00 381

转载 深度学习中的激活函数

  众所周知神经网络单元是由线性单元和非线性单元组成的,而非线性单元就是我们今天要介绍的--激活函数,不同的激活函数得出的结果也是不同的。他们也各有各的优缺点,虽然激活函数有自己的发展历史,不断的优化,但是如何在众多激活函数中做出选择依然要看我们所实现深度学习实验的效果。  这篇博客会分为上下两篇,上篇介绍一些常用的激活函数(Sigmoid、tanh、ReLU、LeakyReLU...

2019-09-26 17:17:00 113

转载 经典深度学习模型发展

一、简介AlexNet:(2012)主要贡献扩展 LeNet 的深度,并应用一些 ReLU、Dropout 等技巧。AlexNet 有 5 个卷积层和 3 个最大池化层,它可分为上下两个完全相同的分支,这两个分支在第三个卷积层和全连接层上可以相互交换信息。它是开启了卷积神经网络做图像处理的先河。VGG-Net:2014年。该网络使用3×3卷积核的卷积层堆叠并交替最大池化层,有两个...

2019-09-26 15:42:00 247

转载 稀疏

机器学习的很多领域中存在很多稀疏矩阵,比如用来表示分类数据的独热编码、用于表示文档中词汇频率的计数编码、用于表示词汇中标准化的单词频率得分的TF-IDF编码。稀疏矩阵稀疏矩阵:在矩阵中,若数值中为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律。稠密矩阵:在矩阵中,若数值中为0的元素数目远远少于非0元素的数目。$$矩阵的稠密度=\frac{非零元素的总数}{矩...

2019-09-26 11:11:00 135

转载 Kettle性能优化

Kettle性能优化是一个系统工程,不仅涉及工具本身的优化,更涉及ETL工具之外的诸多因素,比如,ETL要读取数据库,那么目标DMBS的性能,SQL语句,网络等相关因素都影响到执行效率。根据Kettle对数据ETL的过程性能调优,主要取决于三个因素:上游渠道,工具的大小与数量,下游渠道。一 Kettle调优调整JVM大小进行性能优化,修改Kettle定时任务中的Kitchen...

2019-09-24 14:42:00 970

转载 librosa语音信号处理

  librosa是一个非常强大的python语音信号处理的第三方库,本文参考的是librosa的官方文档,本文主要总结了一些重要,对我来说非常常用的功能。学会librosa后再也不用用python去实现那些复杂的算法了,只需要一句语句就能轻松实现。先总结一下本文中常用的专业名词:sr:采样率、hop_length:帧移、overlapping:连续帧之间的重叠部分、n_fft:窗口...

2019-09-23 20:19:00 184

转载 Batch Normalization

深度神经网络难训练一个重要的原因就是深度神经网络涉及很多层的叠加,每一层的参数变化都会导致下一层输入数据分布的变化,随着层数的增加,高层输入数据分布变化会非常剧烈,这就使得高层需要不断适应低层的参数更新。为了训练好模型,我们需要谨慎初始化网络权重,调整学习率等。原理分析为了解决这个问题,一个比较直接的想法就是对每层输入数据都进行标准化。Batch Normalization确实就...

2019-09-22 10:11:00 107

转载 json解析模块

json.loads(json)把json格式的字符串转为Python数据类型html_json = json.loads(res.text)json.dumps(python)把 python 类型 转为 json 类型import json​# json.dumps()之前item = {'name':'QQ','app_id':1}print...

2019-09-22 10:00:00 205

转载 install slax record

#!/usr/bin/bash#apt update#apt upgradeapt install build-essential cmake gdb git vim binutils-doc cpp-doc gcc-6-locales gcc-6-doc manpages-dev autoconf autoconf-doc automake automake-doc libtool...

2019-09-22 06:40:00 124

转载 matlab中的colormap

matlab colormaps默认颜色图是parula,颜色图从左往右数值不断增大。颜色图名称色阶parulajethsvhotcoolspringsummerautumn...

2019-09-21 19:41:00 152

转载 语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现

梅尔倒谱系数(MFCC)  梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC)。依据人的听觉实验结果来分析语音的频谱,MFCC分析依据的听觉机理有两个第一Mel scale:人耳感知的声音频率和声音的实际频率并不是线性的,有下面公式$$f_{mel}=2595*\log _{10}(1+\frac{f}{700}...

2019-09-21 09:56:00 568

转载 python做傅里叶变换

傅里叶变换(fft)  法国科学家傅里叶提出,任何一条周期曲线,无论多么跳跃或不规则,都能表示成一组光滑正弦曲线叠加之和。傅里叶变换即是把一条不规则的曲线拆解成一组光滑正弦曲线的过程。  傅里叶变换的目的是将时域(即时间域)上的信号转变为频域(即频率域)上的信号,随着域的变换,对同一个事物的了解角度也就随之改变,因此在时域中某些不好处理的地方,在频域就可以较为简单的处理。这就可以...

2019-09-20 19:18:00 230

转载 Kettle中ETL的效率优化

ETL效率优化开启数据库日志记录及性能监控如果我们想要优化一个ETL(KTR或者KJB)的性能,我们首先需要知道的就是它的瓶颈在哪里。而这些信息一般只能在ETL运行的步骤度量中看到,并且是不会持久化的。如果你希望把一些数据记录下来,帮助以后进行查阅,那么可以开启数据库日志和性能监控。作业Edit -> Settings -> Log具体设置过程就不细讲...

2019-09-20 17:34:00 341

转载 kettle 数据提取效率提升

本文链接:https://blog.csdn.net/xpliruizhi123/article/details/54580850 最近发现KETTLE抽数越来越慢,特别是增量INSERT/UPDATE的时候,速度已经达到了令人发指的地步(从一个400W数据规模的表中每天增量量抽取30W数据的TRASFORMATION 竟然要20个小时!!!!读取速率是5条/s......)...

2019-09-20 17:26:00 179

转载 Python实现语音识别和语音合成

声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础。案例:画出语音信号的波形和频率分布,(freq.wav数据地址)# -*- encoding:utf-8 -*-imp...

2019-09-20 12:28:00 357

转载 slax中改变终端字体

修改~/.Xresources文件 ! English font Xterm*faceName: DejaVu Sans Mono=True:size=16修改颜色: ! colos XTerm*background: black XTerm*foreground: lightgreen转载于:https://www.cnblogs.com/guocha...

2019-09-20 10:34:00 148

转载 python集合、元组、字典

主要内容:2、集合3、元组4、字典复习:  字符串和元组一样,只能读不能写。列表和字典可以嵌套任何东西,列表可以嵌套列表  L = list("hello") # L = ['h', 'e', 'l', 'l', 'o']  集合、字典是无序的;列表、元组、字符串是有序的  集合、字典、列表是可以修改的;元组、字符串、数字是不能修改的  for 语句...

2019-09-19 19:09:00 120

转载 为win10下的linux子系统终端添加powerline

一切按照上一篇完成,如果成功了,你厉害了我的哥,如果不成功,win10安装powerline字体才可以,才可以,才可以转载于:https://www.cnblogs.com/guochaoxxl/p/11549991.html...

2019-09-19 15:32:00 1177

转载 C# Task 多任务 限制Task并发数量

LimitedTaskScheduler:using System;using System.Collections.Concurrent;using System.Collections.Generic;using System.Diagnostics;using System.Linq;using System.Runtime.InteropServi...

2019-09-19 14:58:00 3903

转载 为ubuntu安装powerline记录

sudo apt install powerlinewget https://github.com/Lokaltog/powerline/raw/develop/font/PowerlineSymbols.otfmv PowerlineSymbols.otf .local/share/fonts/cd .local/share/mkdir fontssudo fc-...

2019-09-18 18:25:00 466

转载 这可能是国内最全面的char RNN注释

char RNN代码来源于https://github.com/hzy46/Char-RNN-TensorFlow前言本人在学习char RNN的过程中,遇到了很多的问题,但是依然选择一行代码一行代码的啃下来,并且注释好,我在啃代码的过程中,就想要是有一位大神在我旁边就好了,我在看代码的过程中,不懂那里,就问那里,可是现实中并没有,所有问题都要自己解决,今日我终于把代码全部弄懂了...

2019-09-18 16:09:00 162

转载 MySQL增删改查和修改

数据库是一个存储数据的仓库,主要用在:金融机构、游戏网站、购物网站、论坛网站,现在的主流数据库有:MySQL、SQL_Server、Oracle、Mariadb、DB2、MongoDB ...那么我们在生产环境中,如何选择使用哪个数据库1. 是否开源开源软件:MySQL、Mariadb、MongoDB商业软件:Oracle、DB2、SQL_Server2. 是...

2019-09-17 18:58:00 144

转载 python网络线程

线程线程是一种多任务编程的方式,可以使用计算机多核资源。线程又被称为轻量级的进程线程特征   * 线程是计算机核心分配的最小单位   * 一个进程可以包含多个线程   * 线程也是一个运行过程,也要消耗计算机资源。多个线程共享其进程的资源和空间   * 线程也拥有自己特有的资源属性,比如指令集,TID等   * 线程无论创建还是删除还是运行资源消耗都小于进程   *...

2019-09-17 10:21:00 110

转载 python网络进程

多任务编程意义:充分利用计算机的资源提高程序的运行效率定义:通过应用程序利用计算机多个核心,达到同时执行多个任务的目的实施方案: 多进程、多线程并行:多个计算机核心并行的同时处理多个任务并发:内核在多个任务间不断切换,达到好像内核在同时处理多个任务的运行效果进程:程序在计算机中运行一次的过程程序:是一个可执行文件,是静态的,占有磁盘,不占有计算机运行资源进...

2019-09-16 15:21:00 147

转载 python网络编程、套接字、HTTP协议

网络编程网络目的 : 数据的传输网络数据传输是一个复杂的过程OSI 七层模型 --》 网络通信标准化流程应用层: 提供用户服务,具体内容由特定程序规定表示层: 数据的压缩优化会话层: 建立应用连接,选择传输层服务传输层: 提供不同的传输服务,流量控制网络层: 路由选择,网络互连链路层: 提供链路交换,具体消息以帧发送物理层: ...

2019-09-15 19:00:00 92

转载 TensorFlow中实现RNN,彻底弄懂time_step

  这篇博客不是一篇讲解原理的博客,这篇博客主要讲解tnesorlfow的RNN代码结构,通过代码来学习RNN,以及讲解time_steps,如果这篇博客没有让你明白time_steps,欢迎博客下面评论交流。  我曾翻阅各大网站,各大博客,他们的对RNN中time_steps的讲解,都没有一个让人醍醐灌顶的答案,甚至让人越看模糊。有的博主在博客中讲的看似他懂了,一问他自己他答不上来...

2019-09-15 11:10:00 397

转载 机器学习——支持向量机(SVM)

支持向量机原理支持向量机要解决的问题其实就是寻求最优分类边界。且最大化支持向量间距,用直线或者平面,分隔分隔超平面。基于核函数的升维变换通过名为核函数的特征变换,增加新的特征,使得低维度空间中的线性不可分问题变为高维度空间中的线性可分问题。线性核函数:linear,不通过核函数进行维度提升,仅在原始维度空间中寻求线性分类边界。基于线性核函数的SVM分类相...

2019-09-12 11:46:00 160

转载 python实现语音信号处理常用度量方法

信噪比(SNR)有用信号功率与噪声功率的比(此处功率为平均功率),也等于幅度比的平方$$SNR(dB)=10\log_{10}\frac{\sum_{n=0}^{N-1}s^2(n)}{\sum_{n=0}^{N-1}d^2(n)}=10*\log_{10}(\frac{P_{signal}}{P_{noise}})=20*log_{10}(\frac{A_{signal}}{A...

2019-09-11 17:02:00 219

转载 常用的etl工具比较

ETL是什么?ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。(数据仓库结构)通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ET...

2019-09-11 16:37:00 1056

转载 常见ETL工具一览

这些年,几乎都与ETL打交道,接触过多种ETL工具。现将这些工具做个整理,与大家分享。一 ETL工具【国外】1. datastage点评:最专业的ETL工具,价格不菲,使用难度一般下载地址:ftp://ftp.seu.edu.cn/Pub/Develop ... taStage.v7.5.1A-iSOBT种子下载:http://pan.baidu.com/share/link?sha...

2019-09-11 16:18:00 623

转载 为ubuntu找个能用的桌面,顺便进行适当的改造

  最近,开始玩ros,结果官方推荐ubuntu linux,虽然都是差不多的linux,无非就是软件包形式不同而已。但是,个人对ubuntu的unity桌面实在是没有爱,最让人无语的是,kubuntu无法安装成功,不知道是故意的还是故意的。  一、安装sudo apt-get install gnome-tweak-tool gnome-shell-extensions...

2019-09-11 09:19:00 297

转载 修复grub rescue问题

  前几天,手欠点了下win10的系统升级,直接从17.09升级到了19.3虽然也有些波折,总体顺利,以为一切都完事大吉之时,重启系统,原来,万恶的win10给我挖好了坑,早等着我呢。我去,千万只cnm脑海中呼啸而过,这微软还真是没有最烂,只有更烂,启动有没有改变,自己把自己作的不能好好启动,也是让我无语。就开始了,查找办法,最后记录如下:  set root=(hd0,gpt4)...

2019-09-11 09:17:00 118

转载 有意思的php多线程扩展 pthreads

最近有个windwos小项目用到了php多线程,没什么可选的只能使用 pthreads,遇到一些有意思的小坑坑,记录下希望对读到的朋友有帮助。1、只能在主线程创建子线程 我本来想把自己的一个class通过zephir编译成扩展,这部分代码刚好继承了thread,调用->start()提示错误。2、两个线程变量名称一样,只能一个一个执行(阻塞)。class cc...

2019-09-10 18:37:00 195

转载 机器学习——分类问题

人工分类特征1>特征2 输出 0特征1<特征2 输出 1特征1特征2输出3102511816405203514714-10.........681...

2019-09-10 15:01:00 122

转载 Fiddler 手机爬虫

Fiddler抓包工具配置Fiddler添加证书信任,Tools - Options - HTTPS,勾选 Decrypt Https Traffic 后弹出窗口,一路确认...from browsers only设置只抓取浏览器的数据包Tools - Options - Connections,设置监听端口(默认为8888)关闭Fiddler,再打开Fiddl...

2019-09-09 16:23:00 106

转载 多线程爬虫

应用场景1、多进程 :CPU密集程序2、多线程 :爬虫(网络I/O)、本地磁盘I/O知识点回顾队列# 导入模块from queue import Queue# 使用q = Queue()q.put(url)q.get() # 当队列为空时,阻塞q.empty() # 判断队列是否为空,True/False线程模块# 导入模块...

2019-09-09 09:54:00 79

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除