The Crooked Man-CSDN博客

原创任天堂游戏购买记录

在购买之前，查看一下jump、豆瓣目前要买的有：胡闹厨房都好吃动森357马里奥派对

2021-11-11 15:44:56 4055

原创 gpu使用的命令

gpustat --watch 查看谁在使用，要先安装gpustat包conda install gpustat

2021-10-30 16:35:24 287

分类和序列标注区别在于，序列标注针对的问题是一个序列，每个样本会有前后的关系。三种标注方式：IO BIO BIOES序列标记：词性标记（POS）、分块和命名实体识别（NER）BiLSTM可以综合利用过去和未来的特征CRF可以利用句子的特征BiLSTM-CRF模型效果好，鲁棒性强，对词向量依赖不强CRF可以带来更高的标签准确率，因为CRF可以带来标签的依赖关系，如果没有CRF，则标签之间是相互独立的。CRF损失函数与维特比解码CRF的标签可以互相依赖，所有标签跟整个输入都是相关的。隐

2021-09-27 16:59:36 2353 1

原创强化学习学习笔记

1、强化学习的基本概念agent environment 交互agent输出actionenvironment反馈rewardstate environment的反应强化学习和监督学习的区别在于，监督学习是认知，强化学习是决策。监督学习的样本事独立同分布的，强化学习的样本是序列决策数据基于模型：动态规划无模型：按学习目标分类可分为Value-based求解每个状态的价值，向价值高的状态走确定性策略：Sarsa Q-learning DQNPolicy-based随机性策略

2021-09-16 15:58:19 255

原创生成式摘要调研

1、Coreference-Aware Dialogue Summarization把共指信息通过GNN融入到系统中，提升factual correctness创新点：首次通过GNN将共指信息融入到对话摘要中可以做出改进的地方：在GNN结构上进行改进，添加其他语义信息，定义新的评价方式…摘要目前的对话摘要存在的问题有：非结构信息、说话人之间的非正式交互、随着对话发展说话人角色的动态变化。这些问题产生了复杂的共指关系。这篇文章调查了多种方式，关于详细地融合了共指信息在神经生成式对话摘要模型中，去解决

2021-09-08 13:50:33 1378

原创文本摘要的调研

文本摘要方式：抽取式文本摘要（extractive），按照一定的权重，从原文中寻找跟中心思想最接近的一条或几条句子。生成式文本摘要（abstractive），在计算机通读原文后，在理解整篇文章意思的基础上，按自己的话生成流畅的翻译。抽取式文本摘要：Text rank排序算法，大体思想是先去除文章中的一些停用词（为节省存储空间和提高搜索效率，在处理之前或之后会自动过滤掉某些字或词，这些字或词即被称为Stop Words），之后对句子的相似度进行度量，计算每一句相对另一句的相似度得分，迭代传播，直到误差小

2021-08-29 10:07:45 974

原创组会记录8.27

Synthesizer:Rethinking self-attention for transformer models提出了synthesizerDense SynthesizerRandom SynthesizerKACE NLI对为什么分出这个类别进行解释。不光要判断出为什么是why A 还要判断为什么是not B构造样本给定Premise Hypothesis SNLI Label红色的词为线索，用Word-net的知识库中一个范围更大的词将Hypothesis中红色的词进行替换

2021-08-27 14:47:17 118

原创 leetcode排序算法

按时间复杂度划分：a. O(n2)的性能:插入排序>选择排序>冒泡排序选择排序也不稳定对于大规模的乱序数组的排序，可以使用希尔排序（也不稳定）b. O(nlogs)快速排序，如果分区点选的不够对的话，可能会降到O（n2）归并排序在任何情况下的时间复杂度都是O(nlogn)，虽然时间复杂度很稳定，但是需要的空间复杂度大。快速排序的空间复杂度为O(logn)，接近于常数快速排序不稳定，归并排序稳定c.O(n)的要求比较苛刻桶排序，要求桶与桶之间有序，元素均匀地划分到桶中计数排序，.

2021-08-24 16:52:11 265

原创 leetcode位运算

1.位运算&与|或^异或～取反<<左移">>"有符号右移">>>"无符号右移2.有符号整数和无符号整数0000 1010 正数1000 1010 负数第一位为符号位，正数的符号位为0，负数的符号位为1byte 8位 short 16位 int 32位 long 64位 -->有符号整数整数一般使用补码表示3.原码、反码、补码原码10: 00000000 00000000 00000000 00001010-10: 1

2021-08-21 20:11:00 471

原创 Leetcode之数学

7.整数反转1.把数字转换为字符串进行处理的方法：x = list(str(x))把字符串转换为数字的方法：int("".join(x))2.把符号位保留的方法： if x[left] < '0' or x[right] > '9': left += 13.范围的限制 max_ = 2**31-1 min_ = -2**31 if res > max_ or res < mi

2021-08-19 11:31:21 102

原创 Leetcode字符串

28.实现strStr()KMP算法当出现字符串不匹配时，可以记录一部分之前已经匹配的文本内容，利用这些信息避免从头再去做匹配。class Solution: # 获取next数组 def get_next(self, T): i = 0 #指向主串的指针 j = -1 #指向模式串的指针，一开始 next_val = [-1] * len(T) #要返回的next数组 while i < len(T)-1:

2021-08-17 09:44:42 127

原创 Leetcode之滑动窗口

643.子数组最大平均数给定 n 个整数，找出平均数最大且长度为 k 的连续子数组，并输出该最大平均数。示例：输入：[1,12,-5,-6,50,3], k = 4输出：12.75解释：最大平均数 (12-5-6+50)/4 = 51/4 = 12.75前缀和通过计算前缀和的方式避免重复计算，每一个窗口的和等于prefixsum[i+k]-prefixsum[i]class Solution: def findMaxAverage(self, nums: List[int], k:

2021-08-15 11:22:17 100

原创 Leetcode之堆和优先队列

堆是一个数组pq = []pq[0] 堆顶的元素pq = nums[:k]heapq.heapify(pq) 堆化for x in nums[k:]:heapq.heappush(pq,x) 向堆中添加元素heapq.heappop(pq)return pq[0]默认堆为小顶堆大顶堆：tmp = [-x for x in nums]pq = tmp[:n-k+1]heapq.heapify(pq)for x in tmp[n-k+1:]:heapq.heappush(pq,x)

2021-08-14 09:54:26 128

原创 Leetcode之栈和队列

栈和队列是操作受限的线性结构栈：先进后出，压栈和出栈的时间复杂度为O(1)队列：队尾进入，队首出去。先进先出，出队和入队的时间复杂度为O(1)collections.deque() deque是指双端队列，队首和队尾均可入队和出队...

2021-08-11 17:22:38 105

原创 Leetcode之二叉树

144.二叉树的前序遍历先遍历树的根节点，然后遍历树的左节点，然后遍历树的右节点。class Solution: def preorderTraversal(self, root: TreeNode) -> List[int]: res = [] def dfs(root): if not root: return None res.append(ro

2021-08-08 15:29:29 272

原创 Leetcode矩阵

leetcode73.矩阵置零给定一个 m x n 的矩阵，如果一个元素为 0 ，则将其所在行和列的所有元素都设为 0 。请使用原地算法。思路：该题的解法，主要是设置一个标记，如果矩阵中某个元素的值为0，标记该行或列。如何标记该行或列？我们从新定义了两个数组，一个代表哪一行是否有0，一个代表哪一列是否有0.具体做法为，首先遍历一边二维数组，找出0元素，标记其行和列。再遍历一遍数组，看它的标记是否满足行或列之一，若满足其中之一即可把该元素置0.def setZeros(matrix):

2021-08-06 14:44:52 165

原创 Leetcode笔记之字符串

125.验证回文串给定一个字符串，验证它是否是回文串，只考虑字母和数字字符，可以忽略字母的大小写。说明：本题中，我们将空字符串定义为有效的回文串。要注意的是大小写字母的转换以及过滤掉除了字母和字符串之外的字符。.isalnum()判断是否是数字或者字符串.lower()是把大写字母转化为小写字母class Solution: def isPalindrome(self, s: str) -> bool: left = 0 num = []

2021-08-05 17:50:53 57

原创 leetcode中与哈希表有关的题

关于哈希表，你该了解这些！242.有效的字母异位词1002.查找常用字符349.两个数组的交集202.快乐数1.两数之和454.四数相加II383.赎金信15.三数之和18.四数之和哈希表：总结篇！作者：carlsun-2链接：https://leetcode-cn.com/problems/find-common-characters/solution/1002-cha-zhao-chang-yong-zi-fu-ha-xi-fa-jing-dian-/来源：力扣（LeetCod

2021-08-05 15:12:39 86

原创 Leetcode刷题笔记

163.缺失的区间def findMissingRanges(nums,lower,upper): low = lower-1 nums.append(upper+1) res = [] for num in nums: diff = num - low if diff == 2: #nums[i]-nums[i]==2时，说明中间只跨了一个数，所以把这个数字单独作为一个区间 res.append(str(nu

2021-08-05 09:56:37 220

转载 python3-cookbook

https://python3-cookbook.readthedocs.io/zh_CN/latest/c08/p07_calling_method_on_parent_class.html

2021-07-07 07:03:19 229

转载 json的使用

1.json.loads&json.loadjson的loads和load方法都是把其它类型的对象转为Python对象，Python对象包括：列表、元组、字典、自己定义的类等，不包括字符串类型（把字符串或者文件流中的字符串转为字符串会报错）1.1不同点1.loads操作的是字符串2.load操作的是文件流1.2相同点1.除了第一个参数（要转换的对象）类型不同，其它所有参数都相同2.最终都是转换成Python对象1.3例子s = '{"name": "wade", "age": 54

2021-07-06 15:57:25 50

转载 logging模块

1.基本使用配置logging基本的设置，然后在控制台输出日志import logginglogging.basicConfig(level = logging.INFO,format = '%(asctime)s - %(name)s - %(levelname)s - %(message)s')logger = logging.getLogger(__name__) logger.info("Start print log")logger.debug("Do something")log

2021-07-06 10:56:30 58

转载 termcolor模块

@[TOC]termcolor模块termcolor是一个python包，可以改变控制台输出的颜色，支持各种terminal（WINDOWS的cmd.exe除外）。它支持下列的文字颜色：grey, red, green, yellow, blue, magenta, cyan, white支持下列的背景高亮：on_grey, on_red, on_green, on_yellow, on_blue, on_magenta, on_cyan, on_white支持下列属性：bold, dark,

2021-07-06 10:48:22 264

原创新闻文本分类问题

新闻文本分类赛题理解新闻文本分类问题赛题理解解题方法新闻文本分类问题新闻文本分类问题是典型的字符识别问题。赛题理解赛题本质是一个文本分类问题，需要根据每句的字符进行分类。但赛题给出的数据是匿名化的，不能直接使用中文分词等操作因此本次赛题的难点是需要对匿名字符进行建模，进而完成文本分类的过程。由于文本数据是一种典型的非结构化数据，因此可能涉及到特征提取和分类模型两个部分。解题方法思路1：TF-IDF + 机器学习分类器直接使用TF-IDF对文本提取特征，并使用分类器进行分类。在分类器的选择上，

2020-07-21 22:23:34 762

qq_42920313的博客