自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 oracle索引和视图

索引参考博客基础:https://www.cnblogs.com/wishyouhappy/p/3681771.html深入:https://www.jianshu.com/p/ebf56728e087https://blog.csdn.net/WuLex/article/details/79394072视图参考博客基础:https://www.cnblogs.com/ggll...

2020-05-05 10:18:23 177

原创 vba编程学习记录1

1 表格的三种表示方法Sheets("1月").Select Sheets(2).Select '该种方式较常用,可较表量sheets(i)Sheet1.Select2 复制表Sheet3.Copy after:=Sheets(Sheets.Count) '复制表,加在最后一张表后面3 对应弹窗和程序运行屏幕显示的处理Excel.Application.Display...

2020-05-05 10:07:46 365

转载 支持向量机(机器学习笔记)

1、硬间隔SVM-统计学习基础一开始讲解了最小间距超平面:所有样本到平面的距离最小。而距离度量有了函数间隔和几何间隔,函数间隔与法向量www和bbb有关,www变为2w2w2w则函数间距变大了,于是提出了几何距离,就是对www处理,除以∣∣w∣∣||w||∣∣w∣∣,除以向量长度,从而让几何距离不受影响。但是支持向量机提出了最大间隔分离超平面,这似乎与上面的分析相反,其实这个最大间隔是个什么...

2020-05-01 20:46:02 597

原创 条件随机场理解(机器学习记录)

条件随机场 (以线性链条件随机场为例)定义给定 X=(x1,x2,...,xn)X=(x_1,x_2,...,x_n)X=(x1​,x2​,...,xn​) ,Y=(y1,y2,...,yn)Y=(y_1,y_2,...,y_n)Y=(y1​,y2​,...,yn​) 均为线性链表示的随机变量序列,若在给随机变量序列 X 的条件下,随机变量序列 Y 的条件概率分布 P(Y∣X)P(Y|X)P(...

2020-04-29 21:44:21 156

原创 EM算法推导

2020-04-26 22:51:25 157

原创 贝叶斯算法(机器学习笔记)

1. 相关概念生成模型:在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。常见的基于生成模型算法有高斯混合模型和其他混合模型、隐马尔可...

2020-04-23 23:09:44 199

原创 在csdn的remarkdown使用mathtype编辑的公式

1确保mathtype是非精简版的如果过了30天使用期,需要去注册表删安装记录。方法如下:关闭mathtype打开电脑的注册表编辑器(按住win+R快捷键运行,然后输入regedit.exe)找到一级目录HKEY_CURRENT_USER下的software目录,在该级目录里找到install option目录,删除注册列表中的第二项,蓝色箭头指的那个option6.9文件重启电脑,打开m...

2020-04-21 22:18:49 221

原创 线性回归算法(机器学习笔记)

1单变量线性回归1定义假设:hθ(x)=θ0+θ1x{假设:h_\theta }\left( x \right) = {\theta _0} + {\theta _1}x假设:hθ​(x)=θ0​+θ1​x代价函数:J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2代价函数:J\left( {{\theta _0},{\theta _1}} \right) = {1 \ove...

2020-04-21 18:34:09 235

原创 SQL50题选解(oracle版)

SQL50题中选取以下编号题目:1、4、7、8、9、10、11、14、15、16、33、35、36、421.查询" 01 "课程比" 02 "课程成绩高的学生的信息及课程分数查询同时存在"01"课程和"02"课程的情况SELECT student.sname,student.sage,student.ssex,course.cname,sc.score from sc ...

2020-04-17 22:10:55 711

原创 informatica笔记

目标表数据条数不对,控制变量法,七张中间表,使用测试表关联逐一排查,发现是一张表的selec语句字段顺序没有对应映射图。恰当使用表达式,只输入(存在时才会输出)和只输出(直接对字段输出想要的表达式)教训:1排查先做基础性检查,中午空闲时间可以用来跑中间表(合理利用时间)。2.SQL语句可先放PLSQL跑看有没问题。...

2019-01-03 21:36:31 320

原创 informatica学习笔记

好久没写了,还是得养成习惯,每天不管多少,及时总结整理。多张源头表,一张目标表,由于源头表有关联关系,并且抽取字段在不同源头表中,因此考虑使用SQL源限定符。推送表数据差异,排查原因方法,对比缺什么数据,思考为什么会缺这些数据,逐级排查。...

2019-01-02 20:53:18 387

原创 每日总结

1完成word讲稿修改 1.5h2跑剔除3大类数据提疑问,在书写问题的过程中明确解决问题的思路。有疑问自己去解答自己的疑问,靠程序去实现。3.5h3应用SVM算法进行时间序列预测(可以找点论文看看别人的思路)1h这一周定的计划,提问交流,搞定滤波法或者其他方法辨别异常值,提升预测准确率或者用SVM ,BP法提升预测准确率  ...

2018-10-22 21:16:34 99

原创 时间序列预测工作记录

airts <- ts(ss,frequency = 12)# 给定frequency周期为12,不然下一行stl函数显示序列没周期ss2 <- stl(airts,s.window = "per") #s.window = "per"控制季节变化的速度上面程序报错,百度搜问题,看帮助文档fit4 <- ets(airts) #使用ets方法拟合fore4 <- forec...

2018-07-10 21:51:36 225

原创 书写数据分析报告体会

1.模仿别人的分析思路,并实现数据可视化2.并进一步扩展,如发现异常趋势或者更为具体地分析细节3.对比不同规格表用表量的趋势图,找出共性特点;在一种规格表的趋势图中,找出类似的业务类型,或者带有周期规律的类型尝试对时间序列进行聚类4.可视化有什么意义:有几种业务类型的用表量指数型下降,到后期就没什么分析价值了明确哪种表用表量较大,分析预测价值较大;哪种表用表量小,甚至以后都不会采购了;在折线图中明...

2018-07-05 21:40:31 733

原创 每日工作记录

梳理业务逻辑:1.2011-2017年各规格表按年用表量汇总,merge全排列汇总,哪些规格表用表量消失了,哪些长期保持,哪些长期保持高用表量2.明确可视化所需数据,相应取数3.难题,R在一张图画多条折线,且所有类数据在一列。需要去解决4.merge默认inner汇总作用,找出长期出现的表规格5.分析某一类业务的用表量,找出数据较全的某一规格表来画图6.学习tableau缓慢,还是明确基本概念,多...

2018-06-29 21:29:05 794

原创 每日工作记录

insert 比update 快清理数据后,再次统计清理的数据数目是否为0梳理业务逻辑:1.一种智能表可能用到的芯片数目统计,按照比例,比例大的,这种电能表更可能使用该种芯片2.有某种芯片,来统计哪几种智能表使用到该种芯片3.联合智能表和芯片名称做联合统计4.对某规格智能表做细分统计,联合电压电流和芯片名称联合统计数据存在问题归纳:1.两种芯片具体到各规格,没有指定表可以找相应频率2.模块表两百多...

2018-06-28 21:19:50 1092

原创 每日工作记录

1.思考如何如何匹配三张表中的三个字段,三个字段相同时匹配出数值来,刚开始考虑用excel函数行不通,应该快速想其他方法SQL left join 或者 R语言的left join(通过尝试找到用法)2.每次看需求文档都有不同的发现,多看几次发现遗漏,如细化到芯片(需要处理由载波频率反推芯片名称)3.每一步预处理数据做详细记录,删去多少条,填充什么缺失值(这种先统计缺失值有多少并做记录)等等。第一...

2018-06-27 21:15:46 963

原创 对比数据方法

对原表和预处理表使用相同筛选条件,对比结果不同。

2018-06-26 22:04:30 1006

原创 PL/SQL使用心得

调节一下参数提升oracle运行效率alter system set fast_start_mttr_target = 3600( 是一个加快实例恢复的参数)alter session set db_file_multiblock_read_count = 512(数据库文件多块读技术。代表一次最大I/O多少个块) 批量更新值,可将update..where..的where后的字段设为索引,提升更...

2018-06-25 21:24:43 302

原创 oracle存储过程学习

存储过程与存储函数区别,存储过程没有返回值create or replace procedure raisesalary(eno in number)as   psal emp.sal%type;begin   select sal into psal from emp where empno=eno;   update emp set sal=sal+100 where empno=eno;db...

2018-06-18 19:47:50 370

原创 R语言RODBC连接oracle

1.管理工具>ODBC 数据源(32 位)>添加oracle驱动并设置参数2.Rstudio中连接oracle服务端和客户都是32位,R是64位,连接报错:在指定的 DSN 中,驱动程序和应用程序之间的体系结构不匹配解决方案:卸载64位的R,安装32位R后连接成功。library(RODBC)con<-odbcConnect("oracle",uid="scott",pwd="1...

2018-06-18 19:40:54 1287

原创 django-rest 重写ModelViewSet中的create方法

实现基本功能,网页上post一张图片(字段name,image),存入re_photo表,使用字段name在worker表(字段name,number,gender,job,photo)中做查询,匹配出具有相同name的两张图片做识别class RecognitionViewSet(viewsets.ModelViewSet): queryset = re_photo.objects.al...

2018-03-20 09:21:12 11139 2

原创 django基础学习之restful api

新建django项目,选择已存在的django文件,在新窗口中打开,设置端口。编写的api需要认证,使用postman进行调试。处理queryset数据类型先进入终端目录调试 运行 python manage.py shell命令,实验数据提取形式from face.models import re_photo  #引入模型 ,face.model 代表face文件夹下的model.py文件,re...

2018-03-12 19:47:08 286

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除