自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

风远陌

知识是一片海洋,因分享而共同远航。

  • 博客(199)
  • 收藏
  • 关注

原创 奔驰车雨刷喷水

方向盘左侧预发横截面按钮,死劲按。我就是按的太轻只挂不喷水~~

2023-07-14 18:19:57 148

原创 map long 做 key 引发的灾难

似乎明白了所以然,问题出现在 json转map,虽然泛型里限制了Long,而实际上map的key是fastjson默认的类型。Map 定义的map,用Long的key查询为null。Map还是尽量用String来做key,不然类型能搞死人,而且不报任何错误。我们想理想的结果是 true ,结果是 false,百思不得其姐。脑袋瓜嗡嗡的吧,剧情完全不是我们想象的样子。

2023-03-15 17:54:43 410 1

原创 【bug修复】java: Internal error in the mapping processor: java.lang.NullPointerException

java: Internal error in the mapping processor: java.lang.NullPointerException

2021-12-19 11:20:07 614

原创 mac系统转发80端口

备份 sudo cp /etc/pf.conf /etc/pf.conf_backup 编辑 sudo vi /etc/pf.conf 找到内容rdr-anchor "com.apple/*" 在随后一行添加rdr on lo0 inet proto tcp from any to 127.0.0.1 port 80 -> 127.0.0.1 port 8080(其中 lo0 是指绑定127.0.0.1的设备,可以在终端使用ifconfig查看) 保存退出 依次运行以下命令

2021-07-05 15:58:42 454

原创 xxljob 任务没有触发

参考:https://www.yht7.com/news/14410原因:时区不对解决方案:启动命令添加-Duser.timezone=GMT+08

2021-06-30 15:48:19 2218

原创 python根据第一个文件,获取Excel的数据

需求: 根据第一个文件,获取Excel的数据代码:# -*- coding:UTF-8 -*-import sysresult = []col_name_list = []col_nums = []# 先读取第一个文件,获取想要的列名称with open(sys.argv[1], 'r') as lines: for line in lines: col_name_list.append(line.strip())print ('col_name_...

2021-05-13 16:03:36 148

原创 springboot 修改启动打印

登录网站 patorjk.com/software/taag/ 输入字符串,生成自己想要的图案。3.把图案复制到banner.txt文件中

2021-04-23 14:30:41 295

原创 @profileActive@ 不生效

application.propertiesapplication-dev.propertiesapplication-pro.propertiesapplication-test.propertiesspring.profiles.active=@profileActive@@profileActive@未起作用---------解决方案:<plugin> <groupId>org.springframework.boot</g..

2021-04-23 14:09:11 1910 1

原创 翻页 表单重复提交问题

问题: 一个页面中包含了两个表单,其中 js 中有$("form").submit(); ,那么导致表单翻页就提交所有表单。解决办法: 将form中的action拿掉,在点击提交按钮时动态添加action,再表单提交完成后也去掉action,这样$("form").submit(); 就无法提交没有action的表单了。代码:$("#uploadExcel").attr("action", "/batchAdd");$("#uploadExcel").s...

2021-02-19 18:32:21 130

原创 mac idea 程序包com.sun.javadoc不存在

问题: 程序包com.sun.javadoc不存在解决:<dependency> <groupId>jdk.tools</groupId> <artifactId>jdk.tools</artifactId> <version>1.7</version> <scope>system</scope> <systemPath>/Library/Ja...

2021-01-12 17:22:19 2496 1

原创 python 读取两个excel,根据第一列进行合并(不使用pandas)

需求: 不用pandas来实现,两个 excel根据首列进行合并。实现: 平时太依赖第三方包了,这么简单的问题居然在一开始被吓到了。思路: 将每一行读取成数组,然后对比数组的第一个值是否相同,相同则合并数组即可。代码:# 读取一个文件,每一行用 \t 切割成数组# 例如:[['1', 'a', 'b'], ['2', 'w', 'r'], ['3', 'q', 'm']]# 例如:[['3', 'a1', 'b1'], ['2',...

2021-01-06 16:18:25 1820 1

原创 一道国美面试题

昨天面试国美遇见一个到面试题,用了半个小时才答出来。。。。。。。。。。答案:91为啥呢? 首先这道题不是很难,并不是整体一个规律。先看最后一列的值都等于 2列 * 3列,这就简单了。 说明第四列和前三列存在某种计算方法,简单推敲一下便能看出 (1列+2列)* 2列 = 四列。 就这么简单,很多时候我们把问题想复杂了。...

2020-11-20 15:03:27 734

原创 Docker 快速上手

1、执行命令安装:yum install docker漫长的等待……2、执行查看版本命令:docker version创建一个docker镜像 # 先创建一个文件夹 mkdir docker_test # 创建一个脚本 vim myhttp.py # coding:utf-8 import json from urlparse import parse_qs from wsgiref.simple_serve

2020-11-14 11:08:47 128

原创 java两个字符串最大公共子串

自己写的无脑代码public static String LCS (String str1, String str2) { // 子串 String arr = "-1";// int total = Math.abs(str1.length()-str2.length()); // 对第一个字符串进行遍历,并根据 item截取两个公共子串 for(char item : str1.toCharArray()){

2020-11-10 11:46:29 556

原创 shell 删除关键词行,根据行数切割文件

sed -i -e '/paramenter/d' out.txtsplit -l 4 out.txt subfile_原始文件:paramenter condition: |log2foldchange|>=1.0, p<=0.05, q<=1.0Compare bb_ML_U_bb_SL_UUp 2Down 5Total 7paramenter condition: |log2foldchange|>=1.0, p<=0.1, q&

2020-10-29 17:06:26 475

原创 获取指定目录下的文件路径列表

import os# 获取文件名file_names = os.listdir("./data/")print(file_names)# 文件名拼接路径file_list = [os.path.join("./data/",file) for file in file_names]print(file_list)代码显示['01.txt', '02.txt', '03.txt', '04.txt', '05.txt']['./data/01.txt', './data/02.txt.

2020-10-29 11:33:23 410

原创 MySQL的索引失效

参考 :https://segmentfault.com/a/1190000021464570理解mysql:https://www.infoq.cn/article/OJKWYykjoyc2YGB0Sj2c

2020-10-16 15:48:28 112

原创 SOA&微服务 区别

看了很多资料,还是很模糊。 后来想了想,原因很简单,因为脱离了时代做对比。 简单理解: SOA :对功能进行拆分; 微服务:对业务进行拆分; 本质上都是对一个大工程拆分成多个小工程的过程。至于技术较为雷同,所以站在技术框架上就很难区分。...

2020-10-12 10:15:53 123

转载 Kafka分区与消费者的关系

from:https://www.cnblogs.com/cjsblog/p/9664536.html1. 前言我们知道,生产者发送消息到主题,消费者订阅主题(以消费者组的名义订阅),而主题下是分区,消息是存储在分区中的,所以事实上生产者发送消息到分区,消费者则从分区读取消息,那么,这里问题来了,生产者将消息投递到哪个分区?消费者组中的消费者实例之间是怎么分配分区的呢?接下来,就围绕着这两个问题一探究竟。2. 主题的分区数设置在server.properties配置文件中可以指定...

2020-09-01 14:06:09 635

原创 python 连续值分组统计

需求: 将左表 按照连续值分组统计思路: 给 vlue 做标记,自上而下如果相同值不变,不同则加一,如下图所示。 然后根据 token 进行分组即可方便实现。 方法使用:pandas.core.groupby.DataFrameGroupBy.cumsum代码:import pandas as pddata = [['a','1'], ['a','2'], ['a','3...

2020-08-25 11:22:17 1506

原创 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd6 in position 19: invalid continuation byte

解決方案:修改字符集,从 utf-8改成gbk 。import pandas as pddf = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\result.csv',encoding='utf-8',index_col=0,header=2)print(df)問題如下:Traceback (most recent call last): File "E:/workspace/nlp_workspace/nlpdata/tmp/zhiji..

2020-08-24 14:20:07 638

原创 bert_serving 获取张量

安装:pip install bert-serving-server # serverpip install bert-serving-client # client, independent of `bert-serving-server`启动server/data/apps/opt/anaconda3/bin/python /home/nlp/.local/bin/bert-serving-start -model_dir /data/nlp/pretrained_models/c...

2020-08-20 11:56:06 443

原创 python pandas 分组后 列上移

import pandas as pdtrain_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\xuhao', sep='\t',encoding='utf-8',names=['id','xuhao', 'txt'])# train_data.drop_duplicates(inplace=True)df = pd.DataFrame(train_data)df['new_data'] = df.groupby('id')['txt'].s.

2020-08-18 17:37:18 741

原创 python 相同数据加序号

官网参考:https://pandas.pydata.org/pandas-docs/version/0.15.0/generated/pandas.core.groupby.GroupBy.cumcount.htmlimport pandas as pdtrain_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\20200818.txt', sep='\t',encoding='utf-8',index_col=0,header=0)trai

2020-08-18 16:05:54 1734

原创 【demo】python 按照标签分组取前N行

import pandas as pdtrain_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\tagging.tsv', sep='\t',encoding='utf-8',index_col=0,header=None, names=["label", "textA", "textB"])train_data.drop_duplicates(inplace=True)df = pd.Data.

2020-08-18 14:37:07 472

原创 spring-boot-tools-2.1.6.RELEASE.pom. Return code is: 501, ReasonPhrase: HTTP

修改 maven setting ,/usr/local/maven3/conf/settings.xml <mirror> <id>repo1</id> <mirrorOf>central</mirrorOf> <name>Human Readable Name for this Mirror.</name> ...

2020-07-27 16:45:52 262

原创 python TabError: inconsistent use of tabs and spaces in indentation

问题: print(2) ^ TabError: inconsistent use of tabs and spaces in indentation原因: 缩进不统一了,把编译器干蒙了。都统一用空格就好了

2020-07-22 15:40:18 175

原创 AttributeError: ‘RefVariable‘ object has no attribute ‘_id‘

添加tf.enable_eager_execution()

2020-07-20 14:31:07 731

原创 python 打乱文本

import osimport randomout = open("还款意愿shuffle.tsv",'w', encoding='utf-8')lines=[]with open("还款意愿.tsv", 'r' , encoding='utf-8') as infile: for line in infile: lines.append(line)random.shuffle(lines)for line in lines: out.write(line) infile.c.

2020-07-16 16:19:30 608

原创 0、bert 初尝试

开年公司安排做NLP ,一开始真的是丈二的和尚摸不着头脑。对机器学习一无所知,一直都是感觉高大上而又遥不可及的东西。幸运的是团队中有人能做建模的工作,而我知道四个月后才渐渐摸到门槛。 如果有缘,我建议看几本书,一本好书真的会节省很多时间,少走很多弯路: 《数学之美》、《Python深度学习》、《python自然语言处理》、《简单粗暴 TensorFlow 2.0》 后面讲学习的历程一一补充吧。 1、下载 bert 代码,直接找原生的 git clone https:...

2020-07-13 15:55:47 179

原创 jq 动态添加 radio

for(var item in types){ var str="<input type='radio' name='label' value="+ JSON.stringify(types[item])+ " title="+ JSON.stringify(types[item])+">" $("#myRadio").append(str) } $.

2020-07-09 12:25:53 1508

原创 复制 span 文本到剪贴板

创建一个 span:查看GPU <span id="nvidia-smi" onclick="copyData('nvidia-smi')">nvidia-smi</span><hr/>js 代码:<script type="text/javascript"> function copyData(target){ var text =document.getElementById(target).innerText; .

2020-07-06 11:33:49 402

原创 scala java 混编 Error:(100, 28) value setId is not a member of com.nlp.entity.RepaySortTaggingE

Error:(100, 28) value setId is not a member of com.geo.nlp.entity.RepaySortTaggingEntity repaySortTaggingEntity.setId(curDateStr + "_" + tongNum)问题描述: scala 下单独运行没有什么问题,然后当与java混编调用时就发生的问题。原因: java 实体类中使用了 lombok 中的 @Data 标签。改成手动...

2020-06-30 10:23:20 346

原创 python 画热力图

# encoding:utf-8import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltfrom matplotlib import cmfrom matplotlib import axesimport pylabpylab.mpl.rcParams['font.sans-serif'] = ['SimHei'] # 防止中文乱码pylab.mpl.rcParams['axes.unicode_.

2020-06-12 18:08:30 1691

原创 ModuleNotFoundError: No module named nltk.corpus

你自己的文件夹名称(nltk)不能和人家包名(nltk)相同,呵……

2020-06-03 10:53:53 1014

原创 scala list 转 java list

val resJson:mutable.Buffer[JSONObject] = jSONArrayA.map(v=>v.asInstanceOf[JSONObject]).sortBy(v=>v.getInteger("start"))// import scala.collection.JavaConversions.bufferAsJavaList val javaArr:JavaList[JSONObject] = JavaConversions.bufferA...

2020-05-26 12:44:53 731

原创 layui 表格按照某一列的值划分颜色

参考:table.render({ elem: "#test", // id: "table_cell_data", url: "http://localhost:3000/all", toolbar: "#toolbarDemo", //指向自定义工具栏模板选择器 defaultToolbar: [], //除去打印,导出 title: "用户数据表", col

2020-05-18 16:58:50 1420

原创 Anaconda3 Windows 和 liunx 部署安装

环境搭建Anaconda3(Linux)下载Anaconda3: wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh 开始安装: bash Anaconda3-5.3.1-Linux-x86_64.sh 报错: Anaconda3-5.3.1-Linux-x86_64.sh: line 353: bunzip2:...

2020-05-12 15:55:02 312

原创 NLP读书笔记

NLP读书笔记,在看过《python自然语言处理实战核心技术与算法》、《数学之美第二版》记录一些笔记,日后常看看然语言处理技术可以帮助这样的用户使用自然语言和机器交流; NLP基本可以分为两个部分:自然语言处理以及自然语言生成,演化为理解和生成文本的任务;NLP可以被应用于很多领域,这里大概总结出以下几种通用的应用:●机器翻译:计算机具备将一种语言翻译成另一种语言的能力。●情感分析:计算机能够判断用户评论是否积极。●智能问答:计算机能够正确回答输入的问题。●...

2020-05-12 15:40:16 941

原创 java.lang.UnsatisfiedLinkError: /tmp/snappy-1.1.2-libsnappyjava

给 tmp 盘加个执行执行权限即可:sudo mount /tmp -o remount,exec如果不想给 tmp 执行权限,那么就自己改配置吧。

2020-05-06 14:35:17 700

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除