3 yzh_cloud

尚未进行身份认证

热爱技术、乐于分享

等级
博文 77
排名 4w+

电商产品评论数据情感分析代码详解

本章代码建议在linux下面运行,windows下安装gensim会比较麻烦。我是在python3.5.2的pycharm下运行的下面代码的意思是从评论数据中抽取品牌是美的的数据(15-1)[python]viewplaincopy#-*- coding: utf-8 -*-  import pandas as pd    input

2018-01-30 11:33:30

win7,64位系统安装Tesseract和pytesseract,用python轻松实现中文识别,超全攻略!

OCR(OpticalCharacterRecognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为4.0step1:安装tesseract从官网下载这个文件:tesser

2017-12-19 11:13:33

windows下安装AnyProxy抓取移动App Http请求

AnyProxy是阿里巴巴基于Node.js开发的一款开源代理服务器。做为中间代理服务器,它可以收集所有经过它的http请求流量(包括https明文内容);它提供了友好的web界面,便于直观的查看经过它的http请求;同时它支持二次开发,可以用javascript控制整个代理的全部流程,便于前端调试和收集http请求页面内容。它可以用于移动app和移动web页面调试、抓取。 一、实验

2017-11-24 17:27:45

Java操作 ActiveMQ 远程监控JMX设置

activemq.xml设置第一个配置:在你下载activemq文件夹下的config中,找到activemq.xml,在broker节点增加useJmx=”true”useJmx表示开启jmx监控2.在managementContext节点更改3.修改bin/文件夹中的启动脚本activemq1,WindowsSUNJMX=-Dcom.sun.man

2017-11-24 16:27:20

使用JavaScript开发IE浏览器本地插件实例

这篇文章主要介绍了使用JavaScript开发IE浏览器本地插件实例,本文讲解使用JS+注册表的方式开发一个IE浏览器本地插件,需要的朋友可以参考下。使用js开发的IE插件可以在当前浏览的页面中执行js代码,在此基础上实现任何用户可以想到的功能。可以针对不用的网站做一些common处理(比如提取某类信息),也可以针对特定网站做特色处理(比如抢购火车票)。实现这种插件方法比较简单,只

2017-11-24 11:03:09

Kafka集群搭建详细步骤

Kafka集群搭建1、Kafka的安装需要java环境,centos7自带java1.6版本,可以不用重新安装,直接使用自带的jdk即可;如果觉得jdk版本太旧,也可以自己重新安装;2、准备好kafka安装包,官网下载地址:http://kafka.apache.org/downloads.html3、下载好kafka安装包后,将其解压到/usr/local目录下,删

2017-11-22 10:23:33

Kafka、RabbitMQ、RocketMQ消息中间件的对比 —— 消息发送性能 (阿里中间件团队博客)

引言分布式系统中,我们广泛运用消息中间件进行系统间的数据交换,便于异步解耦。现在开源的消息中间件有很多,前段时间我们自家的产品RocketMQ(MetaQ的内核)也顺利开源,得到大家的关注。那么,消息中间件性能究竟哪家强?带着这个疑问,我们中间件测试组对常见的三类消息产品(Kafka、RabbitMQ、RocketMQ)做了性能比较。Kafka是LinkedIn开源的分布式发

2017-11-21 14:43:59

分布式环境下限流方案的实现redis RateLimiter Guava,Token Bucket, Leaky Bucket

业务背景介绍 对于web应用的限流,光看标题,似乎过于抽象,难以理解,那我们还是以具体的某一个应用场景来引入这个话题吧。 在日常生活中,我们肯定收到过不少不少这样的短信,“双11约吗?,千款….”,“您有幸获得唱读卡,赶快戳链接…”。这种类型的短信是属于推广性质的短信。为什么我要说这个呢?听我慢慢道来。 一般而言,对于推广营销类短信,它们针对某一群体(譬如注册会员)进行定点推送,有时这

2017-11-19 18:14:40

Orleans框架------基于Actor模型生成分布式Id

一、Actor简介actor模型是一种并行计算的数学模型。响应于收到的消息,演员可以:做出决定,创建更多Actor,发送更多消息,并确定如何响应接收到的下一条消息。演员可以修改自己的状态,但只能通过消息相互影响(避免需要任何锁)。   actor是一个计算实体,当其收到消息时,可以并发执行如下操作:  1.发送有限数量的消息给其他actor  2.创建有限数量的新a

2017-11-19 17:12:23

flickr 的全局主键生成方案

flickr的全局主键生成方案类似于京东的数据库设计,我们的用户分库有Shop_1/2/3/4…那么uid怎样生成?现在的做法是在用一张索引表Shop_share.user_index取其自增主键,insert_id便是uid。但缺点是,有单点负载的风险。flickr提供了一个扩展的更好的方案:他们把user_index抽出一个专门用作生成uid的表

2017-11-19 16:41:53

Ubuntu16.04以太坊开发环境搭建

这里记录一下开发环境的搭建,方便以后再用。带*为可选。Ubuntu16.04安装ubuntu16.04。下载链接git之后的安装都需要依赖Gitsudoadd-apt-repositoryppa:git-core/ppasudoapt-getupdatesudoapt-getinstallgit查看版本号git--versiongitversio

2017-09-20 11:33:36

排序算法之归并排序(JAVA)

public class MergeSort {      /**      * 归并排序      * 简介:将两个(或两个以上)有序表合并成一个新的有序表 即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列      * 时间复杂度为O(nlogn)      * 稳定排序方式      * @param nums 待排序数组      * @return

2017-08-10 17:09:55

【TensorFlow】Windows10 64位下安装TensorFlow - 官方原生支持

写过一篇在ubuntu下安装TensorFlow的教程,那个时候TensorFlow官方还不支持Windows系统,虽然可以通过其他方法安装,但是终究不是原生的,而且安装过程繁琐易错。好消息是,Google官方在11月29号的开发者博客中宣布新的版本(0.12)将增加对Windows的支持,我11月30号知道的,立马就安装试了试,安装过程非常简单,不过也有一些需要手动调整。

2017-08-06 08:52:55

简析SynchronousQueue,LinkedBlockingQueue,ArrayBlockingQueue

SynchronousQueue       SynchronousQueue是无界的,是一种无缓冲的等待队列,但是由于该Queue本身的特性,在某次添加元素后必须等待其他线程取走后才能继续添加;可以认为SynchronousQueue是一个缓存值为1的阻塞队列,但是 isEmpty()方法永远返回是true,remainingCapacity() 方法永远返回是0,remove()

2017-05-11 17:50:21

关于Spring IOC (DI-依赖注入)你需要知道的一切

关联文章:关于SpringIOC(DI-依赖注入)你需要知道的一切关于SpringAOP(AspectJ)你该知晓的一切《spring入门经典》这本书无论对于初学者或者有经验的工程师还是很值一看的,最近花了点时间回顾了Spring的内容,在此顺带记录一下,本篇主要与springIOC相关,这篇博文适合初学者也适合spring有过开发经验的工程师,前者可用于全面了解

2017-05-10 14:53:24

redis分布锁Redisson性能测试

综述  redisson是一个用于连接Redis的Java客户端工作,相对于jedis,是一个采用异步模型,大量使用nettypromise编程的客户端框架,需要测试性能。代码importjava.util.concurrent.CountDownLatch;importorg.redisson.Config;importorg.redisson.Redisson;

2017-04-21 16:36:08

Java获取Process进程ID,并杀掉相应的进程树

在使用java过程中,很多人可能遇到过这样的问题,当我们通过cmd.exe执行命令的时候,如下:Runtimert=Runtime.getRuntime();Processprocess =rt.exec(cmd);java会在后台进程中开启一个cmd.exe的进程,当我们想要杀死该进程的时候使用process.destroy(),只能杀死java程序启动的cmd.exe

2017-04-14 17:21:45

CountDownLatch使用

本文由ImportNew-张涛翻译自howtodoinjava。欢迎加入翻译小组。转载请见文末要求。正如每个Java文档所描述的那样,CountDownLatch是一个同步工具类,它允许一个或多个线程一直等待,直到其他线程的操作执行完后再执行。在Java并发中,countdownlatch的概念是一个常见的面试题,所以一定要确保你很好的理解了它。在这篇文章中,我将会涉及到

2017-04-14 10:47:00

RabbitMQ详细介绍

引言你是否遇到过两个(多个)系统间需要通过定时任务来同步某些数据?你是否在为异构系统的不同进程间相互调用、通讯的问题而苦恼、挣扎?如果是,那么恭喜你,消息服务让你可以很轻松地解决这些问题。消息服务擅长于解决多系统、异构系统间的数据交换(消息通知/通讯)问题,你也可以把它用于系统间服务的相互调用(RPC)。本文将要介绍的RabbitMQ就是当前最主流的消息中间件之一。RabbitMQ

2017-04-06 15:22:58

MyEclipse中搭建spring-boot+mybatis+freemarker框架

1.在MyEclipse里创建一个maven项目。File>New>MavenProject:勾选图中红色部分,然后点击Next。2.填写下图中红色部分然后点击Finish。3.此时一个maven项目已经生成,目录结构如下:4.打开pom.xml在里面编辑如下内容:    xsi:

2017-03-31 17:50:40
奖章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!