自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习菜鸟

机器学习、数据挖掘、数据分析

  • 博客(204)
  • 资源 (27)
  • 问答 (2)
  • 收藏
  • 关注

原创 GraphHopper调研笔记

graphhopper有以下几种常见的地图应用:(1) 把一个GPS点垂直投影到最近的道路上(2)根据输入的两个GPS点进行路径规划,支持设置起点的离开方向和终点的到达方向(3)根据一个GPS点和给定的时间范围给出等时圈的点ghLoc是OSM格式的地图路径cachePath是读取OSM地图之后的地图缓存,下次可以直接使用缓存中的地图// OSM 文件路径 hopper . setOSMFile(ghLoc);

2023-05-10 14:33:42 2528 3

原创 [笔记]利用python中的re模块正则匹配

代码中的test.txt 是利用requests请求得到的html文本。

2023-06-14 16:29:29 150

原创 ArcMap打开shp文件笔记

点击连接到文件夹,在本地找到shp文件所在的目录。1、点击文件菜单-添加数据-添加数据。我用的是ArcMap 10.8.1。鼠标右键图层,点击打开属性表。2、选择shp文件所在目录。修改标注要素的大小和颜色。把属性表的值标注在图中。修改标注的颜色、大小。

2023-06-14 16:23:18 4868

原创 python对象转geojson,geojson转shp文件

工作中遇到需要把经纬度坐标在地图上进行可视化,需要写成geojson格式的文件。笔记记录一下学习过程。生成的geojosn文件可以在中地图展示。

2023-06-14 16:16:24 1217

原创 写PPT的步骤

编写幻灯片内容:根据主题和目标受众,编写幻灯片的内容。调整字体和颜色:选择易读的字体和配色方案,确保幻灯片的整体风格一致。设计幻灯片布局:选择一个适合主题的幻灯片布局,包括标题页、正文页和结论页等。确定主题和目标受众:首先需要明确你要展示的主题是什么,以及你的目标受众是谁。练习演讲:在制作好幻灯片后,要多次练习演讲,熟悉内容和流程。收集素材:根据主题和目标受众,收集相关的图片、文字、数据等素材。确保素材的质量和准确性。总之,写PPT需要注意内容的准确性、逻辑性和连贯性,同时也要注重展示效果和视觉效果。

2023-05-10 18:04:06 340 1

原创 [笔记]信息化、数字化、智能化三者的区别

信息化是指企业基于电脑和网络技术,广泛应用以ERP为核心的信息系统,实现经营活动的电子流,改进和再造流程,并对流程进行有效控制和管理,降本增效并提升可靠性。数字化是利用数字技术来改变商业模式并提供新的收入和价值创造机会;是转向数字业务的过程。数字化的三个关键点:改变商业模式、实现价值创造、转向数字业务。智能化有两方面的含义:一是采用“人工智能”的理论、方法和技术处理信息与解决问题。二是具有类人智能的特性和功能,自适应、自校正、自协调等。是企业信息化发展的不同阶段。

2023-05-09 16:53:59 336

原创 形象说明数据仓库与数据中台的区别

数据仓库系统的作用能实现跨业务条线、跨系统的数据整合,为管理分析和业务决策提供统一的数据支持。数据仓库能够从根本上帮助你把公式的运营数据转化为高价值的可以获取的信息或者知识,并且在恰当的时候通过恰当的方式把恰当的信息传递给恰当的人。,根据不同客户提供不同的户型、不同的装修。数据中台不是一套软件,也不是一个信息系统,而是一系列数据组件的集合,企业基于自身的信息化建设基础、数据基础以及业务特点对数据中台的能力进行定义,基于能力定义利用数据组件搭建自己的数据中台。数据仓库:就好比给我们。

2023-05-09 16:49:04 75

原创 高德POI数据采集笔记

高德POI数据采集

2023-04-20 17:17:43 2359

原创 百度墨卡托坐标转化笔记

墨卡托坐标转换

2023-04-10 10:07:18 1165

原创 Nginx搭建Netty负载均衡

Nginx搭建Netty负载均衡笔记记录一下用Nginx实现netty的负载均衡学习过程。

2022-12-20 16:15:37 2762 1

原创 Nginx部署SpringBoot项目

nginx 部署springboot项目

2022-12-15 15:16:38 4492

原创 nohup提交jar包脚本

【代码】linux提交任务脚本。

2022-12-15 13:00:37 162

原创 问题 java.net.SocketException Too many open files

解决too many files

2022-11-25 12:00:17 3093

原创 MATSim笔记01-controler结构梳理

MATSim笔记01-controler结构梳理。

2022-09-27 12:18:25 196

原创 UTM坐标系与GPS坐标系转换笔记

UTM与GPS坐标系转换

2022-08-11 10:34:01 1804 2

原创 Flink State示例

Flink State示例// 流1 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的DataStreamSource<Order> sourceStream1 = env.addSource(consumer);KeyedStream<Order, String> stream1 = sourceStream1.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtra

2022-04-22 07:45:22 296

原创 Flink State的初始化总结

ValueState示例ValueState<T> lastDataState ;this.lastDataState = getRuntimeContext().getState(new ValueStateDescriptor<>("lastDataState ", T.class));ValueState<Tuple2<Long, Long>> lastSimIdDataTimeState;this.lastSimIdDataTimeState

2022-04-20 13:22:58 2705 2

原创 根据输入地铁站获取所有出口坐标

百度拾取坐标系统

2022-03-11 11:16:27 342

原创 window环境下玩flink(一)

一、安装flink1、下载https://archive.apache.org/dist/flink/flink-1.8.1/flink-1.8.1-bin-scala_2.11.tgz2、解压到目录D:\bigdata\flink-1.8.1-bin-scala_2.113、启动start-cluster.bat4、在浏览器中输入http://localhost:8081/二、测试执行测试程序flink.bat run ../examples/batch/WordCount.jar

2022-03-01 14:49:11 1861

原创 window环境下玩kafaka

参考链接一、安装zookeeper1、https://zookeeper.apache.org/releases.html下载后解压到目录,我这里是D:\bigdata\apache-zookeeper-3.7.0目录结构:2、 解压并进入ZooKeeper目录,笔者:D:/bigdata/apache-zookeeper-3.7.0/conf3、 将“zoo_sample.cfg”重命名为“zoo.cfg”4、 打开“zoo.cfg”找到并编辑dataDir=D:/bigdata/apa

2022-03-01 14:14:20 245

原创 成功利用arthas解决一个cpu占用100%的问题

最近在项目中,发现一个程序的cpu瞬间会占用100%,经验来说应该是某个方法死循环了或者迭代次数过多。利用arthas可以查看问题的症结所在。arthas用户手册1、首先启动arthasjava -jar arthas-boot.jar2、找到对应的程序序号3、输出最繁忙的前3个线程thread -n 3例如输出如下格式可以看出可能有问题的方法是 at com.tsingvast.intelligent.smartbus.service.match.BusShiftMatch

2022-03-01 11:43:12 1088

原创 impala 实现滑动累计求和

最近在工作中遇到这样一个需求:从一天24小时中找出客流量最大的90分钟。基础数据格式如下:一个字段是时段,一个字段是客流如果通过python或者java循环遍历,非常easy,这里主要是通过sql实现。用到了窗口函数ROWS BETWEEN [ { m | UNBOUNDED } PRECEDING | CURRENT ROW] [ AND [CURRENT ROW | { UNBOUNDED | n } FOLLOWING] ]RANGE BETWEEN [ {m | UNBOUNDED

2022-02-28 14:15:50 1520

原创 SpringBoot项目问题总结

SpringBoot项目启动问题整理1、启动SpringBoot报错,报错信息:错误1:SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]Exception in thread "main" java.lang.ExceptionInInitializerError at com.tsingvast.SpringBootTest.main(SpringBootTest.java:27)Cau

2021-08-11 13:15:12 358

原创 executeBatch报语法错误,分析是inert into的语句后面加了;

最近在工作中,利用jdbc往数据库中插入新数据时,发现一直报错,复制出来每个insert 语句,在数据库中执行是可以执行的,分析了好长时间。。。。。,最后发现是由于insert into后面加了;导致的。错误的语句:insert into table_name values(?,?,?,?)**;**把;去掉就可以了。具体原理...

2021-03-02 10:17:00 399

原创 fastjson转换java对象时,json与java属性不一致时怎么办?

在最近的工作中遇到利用fastjson转换json串为java对象时,发现json的字段和java定义的属性名不一致,无法直接转换,百度了一下,json转换时,是调用的属性的setter,getter方法,因此需要在set/get方法上添加 @JSONField(name=”json_firled”) @JSONField(name="driver_no") public String getDriverId() { return driverId; } @J

2021-03-02 09:56:23 2834

原创 字符串转成GB2312 十六进制转换为字符串

最近在工作中遇到需要将字符串转换成GB2312编码,然后转换成十六进制返回字符串转换成GB2312编码byte[] result = ss.getBytes("GB2312")GB2312编码数组转换成十六进制/**字节数组转换成为十六进制字符串 * @param b * @return */ public static String bytes_String16(byte[] b) { StringBuilder sb = new StringBuilder();

2021-01-15 15:04:43 3403 1

原创 excel中时间加分钟运算公式

例如时间为06:30 要计算40分钟以后的时间,正确应该是07:10excel公式中输入,其中C2表示06:30 G2表示40=TEXT(C2+TIME(0,G2,0),"hh:mm")TIME(hour,minute,second)

2020-12-03 11:10:09 13668

原创 关闭HttpClient日志中遇到的坑

最近在用HttpClient请求api的时候,控制台打印了太多无用的日志14530 [main] DEBUG org.apache.http.headers - http-outgoing-0 >> POST /api/Run/GetRoadRun HTTP/1.1 14530 [main] DEBUG org.apache.http.headers - http-outgoing-0 >> Content-Length: 43 14530 [main] DEBUG org.a

2020-11-21 09:53:07 3771

原创 excel里面时间加减

例如当时时间为7:10分,计算40分钟后的时间,用公式计算假设7:10是单元格C3,40是单元格D3,则公式为=C3+D3/24/60

2020-10-21 09:47:47 3620

原创 java链接opc报异常org.jinterop.dcom.common.JIException: Access is denied解决

记录一下这次从发现问题到解决问题的过程项目是通过java链接OPC,读取数据,并且发送数据的程序一直运行正常,最近客户反馈说无法读取数据,通过查看,发现访问异常了。花了2天的时间才解决了这个异常。org.jinterop.dcom.common.JIException: Access is denied, please check whether the [domain-username-password] are correct. Also, if not already done please c

2020-08-06 14:00:14 8857 5

原创 redisClusterCRC16错误解决

上述错误的原因是redis版本的问题,用redis2.9就可以解决在pom中添加,重新编译 <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version> </dependency&gt.

2020-07-25 08:13:36 703 1

原创 maven 把所有的依赖打到lib中

命令行执行:mvn dependency:copy-dependencies -DoutputDirectory=lib

2020-07-24 23:26:29 1669

原创 JDBC 链接Hive

JDBC链接Hive使用JDBC链接Hive测试样例以及maven配置测试代码package mytest;import java.sql.Connection;import java.sql.DriverManager;import java.sql.PreparedStatement;import java.sql.ResultSet;import java.sql.SQLException;public class HiveConnection { public stati

2020-07-15 07:10:31 440

原创 mysql 终端命令行执行sql语句把结果写入文件中

bin/mysql -u用户名 -p -D数据库 -e “select * from table” > /data/temp/result.csv

2020-04-13 11:10:52 1496

原创 linux 批量删除指定日期的日志

find . -type f -name ‘.log.2020’ -mtime +10 -exec rm -f {} ;参考链接

2020-03-27 20:57:36 3600 2

原创 字符串里面的 % 是一个普通字符怎么办

字符串里面的 % 是一个普通字符怎么办?这个时候就需要转义,用 %% 来表示一个 % :print('growth rate is %.2f %%' % 4.56)

2019-08-30 15:26:14 454

原创 利用java读取OPC里面的数据总结

利用java与OPC通讯读取数据Matrikon_opc模拟器S7-200 PC Access SMARTMatrikon_opc模拟器1、Matrikon-OPC-server模拟器的安装参考链接软件下载:OPC软件安装包下载软件安装:安装OPC-server.2、与matrikon-opc通讯读取数据参考链接利用java与opc通讯下载和安装参照链接就可以完成,重点记录一下与op...

2019-08-30 15:25:59 6121 3

转载 linux cp与scp

参考链接:cp命令与scp命令

2019-07-16 21:38:08 517

原创 Spring Tools 4 for Eclipse

软件下载链接:链接:https://pan.baidu.com/s/11-iexIMF5xYXxIMl85Lcrg提取码:flmf复制这段内容后打开百度网盘手机App,操作更方便哦

2019-07-07 19:56:10 12096 4

原创 搭建简易的springboot项目

我对springboot也是初学者,把自己搭建的过程整理下来,本质原理自己还没有弄明白工具:eclipse maven,默认工具已经准备好,开始搭建springboot项目1、点击New-Other-Maven,就会出现下面的图2、点击简易搭建选项,点击next3、输入maven所需的group id,artifact id version …最后点击finish4、修改pom.xm...

2019-07-07 18:15:09 1002

利用python中的re模块正则匹配

利用python中的re模块正则匹配

2023-06-14

高德城市编码表excel格式

高德城市编码表

2023-04-20

坐标系转换库proj源码

坐标系转换proj库源码

2022-08-11

坐标系转换库 proj 教程

PDF Manual proj.pdf https://proj.org/download.html 手册文档

2022-08-11

国内常用EPSG坐标系

坐标系转换需要的资源

2022-08-11

关闭HttpClient日志的logback文件

关闭HttpClient日志的logback文件

2020-11-21

手写识别数据集MNIST

MNIST 数据分为两个部分。第⼀部分包含 60,000 幅⽤于训练数据的图像。这些图像扫描 ⾃ 250 ⼈的⼿写样本,他们中⼀半⼈是美国⼈口普查局的员⼯,⼀半⼈是⾼校学⽣。这些图像 是 28 × 28 ⼤小的灰度图像。第⼆部分是 10,000 幅⽤于测试数据的图像,同样是 28 × 28 的灰 度图像。

2018-06-21

通过jdbc链接hive所需要的jar包

通过jdbc链接hive时所需要的jar包,把需要的jar都下载下来汇总到一起,供有需要的人使用

2018-05-08

hive jar包

hive metastore jar包,可以直接下载使用,hadoop,hive

2018-05-07

win7下注释掉checkReturnValue方法体后的jar文件

Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-ywf\mapred\staging\ywf1760469788\.staging to 0700 win7下报错,需要注释掉checkReturnValue的方法体

2018-05-07

UCI分类数据集

UCI数据集

2017-08-17

Weka 3.4 教程

Weka3.4教程

2017-08-17

selenium源码

selenium源代码

2016-09-27

WeatherCrawl

提供了解析天气网址信息的程序

2016-07-15

CrawlerDemo

利用url,httpurlconnection,socket爬取任意网页demo

2015-04-17

利用TikaAPI解析各种文档

利用开源工具Tika解析PDF文档,HTML文档,微软形式的文档

2015-01-23

复旦自然语言处理技术NLP

复旦NLP,自然语言处理技术,很棒的奥,包括了分词,词性标注,命名体识别

2015-01-08

最大连续子串问题

求一个数组的最大连续子串,和最大的串即为最大连续子串,其中还包括了最大连续子矩阵

2015-01-08

K均值聚类算法

利用k均值聚类算法对词进行聚类,输入是词之间的相似度矩阵

2015-01-08

建立二叉树,前后中序遍历二叉树,求二叉树的深度

建立二叉树,前后中序遍历二叉树,求二叉树的深度

2015-01-08

通过JAVA执行命令行程序

文件中包含两个方法,一个是读取文件路径下的文件列表,另一个是通过JAVA调用命令行程序,涉及到线程阻塞问题

2013-08-17

Dijkstra算法JAVA代码

Dijkstra 求任意两个点的最短路径算法

2013-08-01

传播图谱、意见领袖、社区分析笔记

在做文本挖掘应用时的调研笔记,包括传播图谱、意见领袖、社区分析三部分的笔记

2013-07-29

JAVA 常见的小程序

这是我在自学JAVA时练习写的小程序,包括 递归,继承,排序,打印星型,随机数等,适合初学JAVA的练习

2013-04-07

21天学通JAVA

21天学通JAVA,快速学会JAVA,比较适合的电子版教程,适合初学者

2013-04-07

JAVA基础教程

JAVA基础教程,写的很详细,非常适合初学者学习。

2013-04-07

JAVA程序员必读-基础篇

JAVA程序员的基础知识,适合初学者学习

2013-04-07

数据结构、算法及应用代码

数据结构算法及应用 源代码 书籍作者是 Sartaj Sahni著 孔芳 高伟译

2012-12-06

JAVA笔记总结

自己学习JAVA,总结的笔记,适合初学JAVA学习

2012-11-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除