自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

笔记

个人笔记,欢迎交流!

  • 博客(372)
  • 收藏
  • 关注

原创 Coggle 30 Days of ML(23年7月)打卡

最近开始关注LLM相关知识,但之前的NLP范式的技能不能丢。

2023-07-13 19:16:03 280

原创 Transformer模型添加新的[token]

huggingface transformer 如何添加自定义[token], 亲测有效!

2023-02-08 15:57:32 1018 1

原创 Coggle 30 Days of ML(23年1月)打卡

Coggle 30 Days of ML ,文本匹配任务打卡记录。

2023-01-31 21:13:54 606

原创 leetcode 218. 天际线问题

题意:如第一幅图所示,求由很多可能重叠矩形能够覆盖最终的最终图案的形状,如第二幅图所示。思路:用扫描线思想, 从左往右扫描,另外加上一个最大堆来维护满足条件的所有矩形里的高度的最高值。另外实现的时候有一些小细节很巧妙。c++和python里对元组的排序,默认都是从低位从小大大排序。时间复杂度: (nlogn)代码:class Solution: de...

2020-02-22 19:28:45 347 1

原创 leetcode 174 周赛题解

1337. 方阵中战斗力最弱的 K 行题意:返回二维数组,每行1个数的排序。pythonclass Solution: def kWeakestRows(self, mat, k) : ans = [[sum(line), i] for i , line in enumerate(mat)] ans.sort(key = lambda x:x[0]...

2020-02-18 00:27:48 297

原创 leetcode 176 周赛

5340. 统计有序矩阵中的负数题意:统计二维矩阵中非负个数。代码:class Solution: def countNegatives(self, grid: List[List[int]]) -> int: ans =0 for row in grid: for num in row: ...

2020-02-17 22:26:39 261

原创 python【heapq】&& leetcode 23. Merge k Sorted Lists

heapq模块heapq 模块是python里用来实现 ——最小堆 ,又被称为优先队列算法,官方文档。最近用python刷leetcode用的比较多,用一些例子做个笔记。创建堆 - 最小堆单个添加创建堆 - heappushimport heapqdata = [1,5,3,2,8,5]heap = []for n in data: heapq.heappush(hea...

2020-02-17 15:38:42 289

原创 Leetcode 1345. 跳跃游戏 IV

Leetcode 1345. 跳跃游戏 IV题意:给一个一维的数组,你从下标0开始出发,有三种操作:每次可以向左,右移动一位,或者移动到与自己数值相同的位置。思路:这类搜索求最短步数的解法是典型的bfs,注意这题数据的特殊性,裸bfs会超时。这是因为第三个操作枚举所有相同数值的位置时候,如果出现很多相同值的数值,时间复杂度会近似O(n)。这一步枚举,可以把连续出现相同值的区间只保留左...

2020-02-15 22:10:51 465

原创 leetcode 168 周赛题解

1295. 统计位数为偶数的数字简洁(优美)写法:class Solution: def findNumbers(self, nums) -> int: return sum(1 if len(str(num))%2 == 0 else 0 for num in nums)啰嗦的写法:class Solution: def findNumbers(s...

2020-02-14 11:35:15 258

原创 Leetcode 76:最小覆盖子串 (滑动窗口)

76. 最小覆盖子串题意:问一个思路 :代码:class Solution: def minWindow(self, s: str, t: str) -> str: i,j , ans = 0, 0 , '' import collections cnt = collections.Counter(t) n =...

2020-02-14 11:26:41 195

原创 leetcode 10. 正则表达式匹配 && leetcode 44 通配符匹配

leetcode 10. 正则表达式匹配题意:给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。‘.’ 匹配任意单个字符‘*’ 匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。思路:这个匹配的过程实际上就是一个回溯的搜索(暴力), 如果是这个思路,难点就是这个写法,然后注意这个过程具有子结构的特点...

2020-02-13 15:10:05 157

原创 leetcode1044. 最长重复子串 (Rabin-Karp + 二分 )

leetcode1044. 最长重复子串class Solution: def maxProduct(self, root: TreeNode) -> int: def get_sum(root): if not root: return 0 ret=root.val+get_sum(r...

2020-02-06 23:01:48 507

原创 C++ 11 vector 的遍历,auto关键词(未完)

遍历vector方式假设有这样的一个vector:vector<int> line={1,2,3,4,5,6,7,8,9};需要我们去遍历它。void showvec(const vector<int>& line) { for (vector<int>::const_iterator iter = line.cbegin();iter !...

2020-01-05 22:39:15 12775 2

原创 leetcode 167周赛题解

二进制链表转整数代码:class Solution: def getDecimalValue(self, head): ans = 0 while head !=None: ans = ans* 2 + head.val head = head.next return ans顺次数代码...

2019-12-15 22:50:05 210

原创 leetcode 160周赛题解

题目1题意:第一次看,没看懂,就是调一个函数,找出符合它的解。思路:这题是考阅读理解能力。代码:class Solution {public: vector<vector<int>> findSolution(CustomFunction& customfunction, int z) { vector<vector&lt...

2019-11-01 21:24:58 200

原创 简述 GCN &&GAT(Graph Attention Networks )

Graph attention worksGCNCNN处理的图像或者视频数据中像素点(pixel)是排列成成很整齐的矩阵,论文提到Euclidean Structure。非Euclidean Structure的网络结构,也是图论抽象意义的拓扑图。Graph Convolutional Network中的Graph是指数学(图论)中的用顶点和边建立相应关系的拓扑图。提取拓扑图空间特...

2019-10-30 09:05:12 12415

原创 leetcode 159周赛题解

题目1题意给出二维平面n个点,问是否全部在一条直线上?思路根据已知两点(x1,y1),(x2,y2)的直线公式: (y-y1)/(y2-y1)=(x-x1)/(x2-x1)代码class Solution {public: bool checkStraightLine(vector<vector<int>>& coordinates) { ...

2019-10-25 10:58:25 255

原创 C++ vector 的初始化

前言最近再刷leetcode,快一年没用过c++,很多语言特性需要做个笔记。一维数组初始化vector v vectorV(n) vectorV(n,m)默认初始化,vector为空, size为0,表明容器中没有元素,而且 capacity 也返回 0,意味着还没有分配内存空间。这种初始化方式适用于元素个数未知,需要在程序中动态push_back()添加的情况。这里也可以用v.r...

2019-10-24 23:17:02 1393

原创 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

Relations are Important尽管传统的GAT在获取网络结构上取得成功,但直接用于KG里是不合适的,因为它忽略KG里很重要的一部分信息——边,实体之间的关系(relation)。作者认为在KG里,实体起到不同的作用是因为,不同的关系在起作用!...

2019-10-16 22:56:56 5844 2

原创 爬虫模拟登陆网站

前言在爬取很多需要先登陆的网站的时候,第一步是需要模拟浏览器登陆过程,向目标网页(url) post一个含有账户密码以及额外信息的表单,成功登陆操作后,就获取到目标网页的内容。分析登陆过程这里以我本科学校的图书管座位预约系统为例,F12打开浏览器开发者模式的网络界面,可以查看浏览器与服务器之间数据的交互过程。首先打开目标网页,即向目标服务器发送一个get请求后,返回登陆界面的网页内容。接...

2019-08-23 16:21:46 1607

原创 衡量两个向量相似度的方法:余弦相似度

import numpy as npdef cos_sim(vector_a, vector_b): """ 计算两个向量之间的余弦相似度 :param vector_a: 向量 a :param vector_b: 向量 b :return: sim """ vector_a = np.mat(vector_a) vector...

2019-08-03 15:40:33 36945 11

原创 Tensorflow笔记:

tf.nn.embedding_lookup在 Tensorflow里Variabletf.nn.embeding_looku

2019-07-27 23:00:00 156

原创 hiho一下 第264周 投掷硬币

题目:中文题目思路:非常简单的概率dp,dp[i][j]表示投掷i次,恰好j次正面的概率。dp[i][j] = dp[i-1][j-1] * p[i] + dp[i-1][j] *(1 - p[i])代码:#include<bits/stdc++.h>using namespace std;const int N= 1000+10;double dp[N][N], p...

2019-07-23 17:27:45 116

原创 hiho一下 第263周 小Hi和小Ho的礼物描述 hiho1505

题意:从N(N<=1000)个数里找四元组(i, j, p, q)满足i, j, p, q两两不同,并且i < j, p < q, Ai + Aj = Ap + Aq的数量。思路:计数 + 容斥原理:从N的范围,这题的解法必须是O(n^2) 附近的解法。我们可以思考遍历i,j时候,能不能O(1)知道A[i]+A[j]=x的对数呢?是可以的,预处理出num[A[i]],s...

2019-07-19 22:00:41 264

原创 Python里Dict格式的存储: 转为 json 格式进行读写

前言Python里字典类型(Dict)的数据进行保存的时候可以用借用pickle序列化的方式,同时pickle序列化可以保存python里复杂的数据模型, 但缺点是无法用本的记事本打开直观的查看数据内容:import pickle def save_obj(obj, name ): with open('obj/'+ name + '.pkl', 'wb') as f: ...

2019-07-05 22:42:50 12041 1

原创 远程部署ElasticSearch

部署ElasticSearchubuntu下ssh连接远程服务器:这步参考博客很详细:本地安装ssh客户端服务sudo apt install openssh-client 连接指定端口号,地址的服务器:ssh -p [端口号] [用户名]@[ip地址]ssh -p 8001 [email protected].安装并配置ElasticSearch环境整个过程参考我之...

2019-06-26 17:24:18 674 1

原创 朴素贝叶斯原理及Python实战

原理朴素贝叶斯(Naive Bayes)法是基于贝叶斯定理和特征条件独立的假设(这是一个较强的假设,虽然使得方法变得简单,但有时会牺牲一定的分类准确率)的分类方法,属于生成(Generative Approach)方法的一种。为什么说它属于生成方法呢?它通过训练数据集学习联合概率分布p(X,Y)p(X,Y)p(X,Y) , 所以就可以从统计的角度表示数据的分布情况,能够反映同类数据本身的相似...

2019-06-17 22:18:33 363

原创 SSH连接远程服务器 ,SCP命令 向远程服务器上传/下载文件

SSH 连接远程服务器命令格式:ssh -p [端口号] [用户名]@[ip地址]例如:通过8001端口,连接服务器117.121.38.xxx:ssh -p 8001 [email protected]上传/下载利用scp传输文件,实现从远程服务器下载文件或上传文件到服务器上,本地使用window,/linux/mac命令行完成操作 。从本地向远程服务器上传文件:命...

2019-05-12 22:42:01 1452

原创 hiho一下 第252周 1479 一面砖墙

题面 :网址题意:一共有N层砖的平面,每一层砖块数宽度不定,问穿过这个平面直线与最小砖相交数量,从两块砖缝之间划过,不算相交。思路:统计每行宽度的前缀和出现次数,出现数量cnt最多的位置就是满足题意的位置,输出N-cnt就是结果。代码:#include<bits/stdc++.h>using namespace std;typedef long long ll;m...

2019-05-01 10:55:55 180

原创 Tensorfow填坑记(不定期更新)

写法类报错类could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED参考博客tensorflow 框架下设置GPU按需分配:import tensorflow as tfconfig = tf.ConfigProto()config.gpu_options.allow_growth = Truewith tf.Sessi...

2019-04-10 21:28:06 282

原创 Python collections.defaultdict()笔记

与dict的差别其实defaultdict解释是数据类型容器模块,本质就是一个字典(dict),只不过python自动的为它的键赋了一个初始值。为什么要定义一个这样容器呢?因为Python中dict是通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。比如你想计算...

2019-03-24 12:48:20 707

原创 tensorflow里name_scope与variable_scope区别

摘要tf.name_scope和tf.variable_scope在Tensorflow里都是关于变量的管理的操作, 字面理解就是指定了变量的不同作用域:命名域(name_scope)和变量域(variable_scope).两者对应的创建/调用变量的函数分别是tf.variable()和tf.get_variable(),而关于这两种使用的差别也决定了tf.name_scope()和tf.va...

2019-03-21 21:02:11 712

原创 hiho一下 第243周 1485 hiho字符串

尺取做法,注意这题是恰好为2个h,1个i,1个o。#include&lt;bits/stdc++.h&gt;using namespace std;string Str;int main(){ while(cin&gt;&gt;Str){ int l= 0,r=-1,n = Str.size(),ans = -1; map&lt;char,int&...

2019-03-05 10:47:16 171

原创 Tensorflow:实战Google深度学习框架 学习笔记(四): 卷积神经网络

卷积神经网络结构卷积层Tensorflow中利用tf.nn.conv2d()函数实现卷积神经网络的卷积层操作。conv = tf.nn.conv2d(input, filter_weight, stride = [1,1,1,1],padding = 'SAME')conv2d函数第一个参数input为当前层的节点输入矩阵,注意这个矩阵是一个四维的矩阵input[A,B,C,D],后面三...

2019-02-24 01:08:17 406

原创 python-语法笔记

title: python-语法笔记date: 2017-03-24 22:10:39tags: “Python”categories: “Python”python语法学习笔记前言不定期更新python里重要的和特色的语法规则。set,dictstr,tuple是不变对象,而list是可变对象。和list比较,dict有以下几个特点:1.查找和插入的速度极快,不会随着...

2019-02-23 10:32:16 202

原创 《Python基础编程》笔记

title: 《Python基础编程》笔记date: 2017-06-02 10:37:37tags:pythoncategories:Python第一章 基础知识让脚本像普通程序一样运行:代码首句 #!/usr/bin/env python告诉系统这是py文件,默认用py解释程序运行。(可惜我电脑.py文件默认打开方式是pycharm…)‘ # ‘ 行注释。...

2019-02-23 10:27:53 302

原创 hiho一下 第240周 出勤记录II

题面 :Link题意:长度为n的只含有O,A,L序列,满足不能有连续三个L,最多一个A的要求的序列数量?思路:基础dp,设dp[i][j][k][l]表示长度为i序列;j用0,1,2来区分结尾为O,L,A;k用0,1,2表示连续出现几次L;l用0,1来区分A是否出现过。状态转移方程就很容易写出。貌似只用三维就可以表示,我写复杂呢…代码#include&lt;bits/stdc++.h...

2019-02-21 10:27:48 163

原创 吴恩达《卷积神经网络》第一周笔记

第一周 卷积神经网络1.计算视觉(Computer vision)Deep learning在计算视觉的研究可以启发很多领域,包括语音识别等计算视觉任务:图片分类(Image classification)目标检测(Object detection)风格迁移(Neural style transfer)计算机视觉面临输入数据大挑战带来两个问题,一是神经网络复杂,参数多...

2019-02-19 16:32:14 473

原创 hiho一下 第241周 1483 区间价值

题面 :Link题意:n个数,他们相同的数的次数就是区间的价值,求n个数价值第k大区间的价值是?思路:最暴力求出n*(n+1)/2区间不同的值,然后排序求第k大的值,明显TLE。我们先分析发现区间越大,价值肯定越大,并且呈单调性。我们就可以用二分去查找第k大的值。对于每次二分的check,这里利用尺取的思想,尺取从左往右扫一遍最大区间[L,R]里的价值都是小于二分的mid,O(n)时...

2019-02-16 10:22:43 272

原创 【阅读笔记】Reasoning With Neural Tensor Networks for Knowledge Base Completion

前言论文地址PosterAbstract这篇论文里,作者介绍了一个适用于推理两个实体关系的神经网络(Neural Tensor Network).相比之前的工作要么将实体表示成离散的最小单元或者是单个的实体向量,而这篇论文实验表明当实体被表现成他们词向量的平均值时实验的效果会提升。最后,论文证明当这些词向量通过大量非监督学习的语料学习结果作为参数的初始化值,对于预测知识库里两个实体是否有关...

2019-01-12 20:24:43 7631 20

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除