自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(377)
  • 资源 (1)
  • 收藏
  • 关注

原创 NLP实战干货汇总(公式、代码、比赛系列)

自然语言处理优质GitHub、推文资料合集,本文持续更新当下最新的NLP资料,方便各位学习和查阅。1、中文资料【1】复旦大学NLP上手教程:NLP-Beginner(2019.5)邱锡鹏老师《神经网络与深度学习》链接:https://nndl.github.io/复旦大学NLP上手教程:https://github.com/FudanNLP/nlp-beginner【2】Awe...

2019-05-19 21:43:30 2223

原创 NLP小白的入门学习路线

新学期开始了,看了一些经验贴,现在学习前辈的经验给自己总结点规划,希望今年是收获满满的。一、推荐Github/博客系列(持续更新……)NLP/ML/CV[1]Algorithm_Interview_Notes-Chinese[2]THUNLP机器阅读理解[3]52nlp[4]深度学习前沿笔记[5]cs224n-camp[6]火爆 GitHub 的《机...

2019-02-24 13:59:39 3063 1

原创 剑指OfferII-字符串-14.15.32.33-变位词

14. 字符串中的变位词题目链接给定两个字符串 s1 和 s2,写一个函数来判断 s2 是否包含 s1 的某个变位词。换句话说,第一个字符串的排列之一是第二个字符串的 子串。输入: s1 = "ab" s2 = "eidbaooo"输出: True解释: s2 包含 s1 的排列之一 ("ba").输入: s1= "ab" s2 = "eidboaoo"输出: False题解:双指针+哈希表package String;public class checkInclusion14 {

2022-05-03 21:13:29 561

原创 LeetCode307. 区域和检索 - 数组可修改(树状数组、线段树)

1、树状数组树状数组专题:https://leetcode-cn.com/tag/binary-indexed-tree/problemset/视频:https://www.bilibili.com/video/BV1LW411e7jo?spm_id_from=333.337.search-card.all.click2、题目描述https://leetcode-cn.com/problems/range-sum-query-mutable/3、代码详解https://leetcode-c

2022-04-04 18:47:17 865

原创 数组-LeetCode2016. 增量元素之间的最大差值

1、题目描述力扣链接给你一个下标从 0 开始的整数数组 nums ,该数组的大小为 n ,请你计算 nums[j] - nums[i] 能求得的 最大差值 ,其中 0 <= i < j < n 且 nums[i] < nums[j] 。返回 最大差值 。如果不存在满足要求的 i 和 j ,返回 -1 。2、代码详解举一反三DP、贪心-LeetCode121. 买卖股票的最佳时机(k = 1)public class maximumDifference2016 {

2022-02-26 19:09:09 348

原创 Python基础篇笔记:常用代码汇总

1、统计词频的三种方法1、利用字典dict来完成统计a = [1, 2, 3, 1, 1, 2] dict = {} for key in a: dict[key] = dict.get(key, 0) + 1 #字典的get函数可以查询键的值,0代表默认值,每出现一次加1print (dict) 输出结果: >>>{1: 3, 2: 2, 3: 1} 2、利用Python的collection包下Counter的类from collect

2022-01-04 20:06:11 1021

原创 TensorFlow模型保存pb或ckpt

Tensorflow的保存分为三种:1. checkpoint模式;2. pb模式;3. saved_model模式。

2021-12-21 20:33:30 1678

原创 搭建Python虚拟环境:source bin/activate

LInux搭建Python虚拟环境

2021-12-08 16:37:39 7856

原创 语音识别笔记

1、语音基础2、模型结构2.1 卷积神经网络1 时频域上的卷积相比于二维的图像输入,语音信号往往是一维时序信号。然而,直接使用一维时序信号建模很难获得不错的识别结果。因此,与前馈神经网络的做法一致,在网络的输入中也采用经过处理的帧级别特征,比如MFCC特征或者FBANK特征。如果我们利用相邻的语音帧信息,整合成二维的语谱图作为输入,则此时的输入输出与图像识别任务很像,就可以利用二维卷积操作对输入的语谱图特征进行处理。而在卷积神经网络语音识别系统中,通常会采用整合了相邻帧的语谱特征图作为输入。相比

2021-11-24 19:50:13 2384

原创 idea运行报错Error running ‘javafilename‘: Command line is too long

报错:Error running 'xx': Command line is too long解决方式:在项目的.idea/workspace.xml文件中,找到<component name="PropertiesComponent">,添加一行<property name="dynamic.classpath" value="true" />https://blog.csdn.net/Manyu_Java/article/details/78993294参考

2021-04-18 12:39:37 260 1

原创 解决AttributeError: module ‘pandas‘ has no attribute ‘computation‘

Python脚本包含import numpy、tensorflow却报错:AttributeError: module 'pandas' has no attribute 'computation'File "D:\IT\Anaconda3\lib\site-packages\tensorflow\contrib\learn\python\learn\learn_io\__init__.py", line 26, in <module> from tensorflow.cont

2021-04-14 17:28:07 1008 1

原创 食物声音识别:CNN

1、数据集来自Eating Sound Collection,数据集中包含20种不同食物的咀嚼声音,赛题任务是给这些声音数据建模,准确分类。https://tianchi.aliyun.com/competition/entrance/531887/information

2021-04-13 21:07:14 924 2

原创 pip install出现ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org‘, port=443)

pip install jieba时提示如下异常:pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.解决方法:通过指定镜像源的方式进行安装就可以了。pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba...

2021-04-06 17:02:47 431

原创 win10下安装pyhanlp

1、安装jpype1conda install -c conda-forge jpype1==0.7.0报错:Solving environment: failed InvalidVersionSpecError: Invalid version spec: =2.7解决方式:手动安装https://blog.csdn.net/wenwen360360/article/details/80971071安装包地址:https://www.lfd.uci.edu/~gohlke/pyt.

2021-03-23 09:51:34 1088

原创 Excel打开csv文件出现中文乱码的解决方法(Notepad打开正常)

原因:Excel 在读取 csv 的时候是通过读取文件头上的 bom 来识别编码的,这导致如果我们生成 csv 文件的平台输出无 bom 头编码的 csv 文件(例如 utf-8 ,在标准中默认是可以没有 bom 头的),Excel 只能自动按照默认编码读取,不一致就会出现乱码问题了。方法:只需将不带 bom 头编码的 csv 文件,用文本编辑器(工具随意,如 notepad++ )打开并转换为带 bom 的编码形式。附:对于 utf-8 编码,unicode 标准中是没有 bom 定义的,微软在自

2021-02-26 16:30:26 2220

原创 天池预训练

预测

2021-02-21 23:51:41 188

原创 LeetCode1423. 可获得的最大点数(滑动窗口)

1、题目描述https://leetcode-cn.com/problems/maximum-points-you-can-obtain-from-cards/几张卡牌 排成一行,每张卡牌都有一个对应的点数。点数由整数数组 cardPoints 给出。每次行动,你可以从行的开头或者末尾拿一张卡牌,最终你必须正好拿 k 张卡牌。你的点数就是你拿到手中的所有卡牌的点数之和。给你一个整数数组 cardPoints 和整数 k,请你返回可以获得的最大点数。输入:cardPoints = [

2021-02-10 23:47:20 165

原创 LeetCode665. 非递减数列(分类讨论)

1、题目描述https://leetcode-cn.com/problems/non-decreasing-array/给你一个长度为n的整数数组,请你判断在 最多 改变1 个元素的情况下,该数组能否变成一个非递减数列。定义一个非递减数列的:对于数组中任意的i (0 <= i <= n-2),总满足 nums[i] <= nums[i + 1]。输入: nums = [4,2,3]输出: true解释: 你可以通过把第一个4变成1来使得它成为一个非递减数列。...

2021-02-10 22:55:30 141

原创 LeetCode567. 字符串的排列(滑动窗口、Counter)

1、题目描述https://leetcode-cn.com/problems/permutation-in-string/给定两个字符串s1和s2,写一个函数来判断s2是否包含s1的排列。换句话说,第一个字符串的排列之一是第二个字符串的子串。输入的字符串只包含小写字母 两个字符串的长度都在 [1, 10,000] 之间输入: s1 = "ab" s2 = "eidbaooo"输出: True解释: s2 包含 s1 的排列之一 ("ba").输入: s1= "a...

2021-02-10 22:37:03 257

原创 LeetCode978. 最长湍流子数组(动态规划)

1、题目描述https://leetcode-cn.com/problems/longest-turbulent-subarray/当 A的子数组A[i], A[i+1], ..., A[j]满足下列条件时,我们称其为湍流子数组:若i <= k < j,当 k为奇数时,A[k] > A[k+1],且当 k 为偶数时,A[k] < A[k+1];或 若i <= k < j,当 k 为偶数时,A[k] > A[k+1],且当 k为奇数时,...

2021-02-08 23:40:23 288 2

原创 LeetCode643. 子数组最大平均数 I(前缀和、滑动窗口)

1、题目描述https://leetcode-cn.com/problems/maximum-average-subarray-i/给定n个整数,找出平均数最大且长度为k的连续子数组,并输出该最大平均数。输入:[1,12,-5,-6,50,3], k = 4输出:12.75解释:最大平均数 (12-5-6+50)/4 = 51/4 = 12.752、代码详解法一:前缀和先遍历一次,求数组每个位置的 preSum,然后再遍历一次,求长度为 k 的每个区间的最大和。最...

2021-02-05 22:46:12 385

原创 LeetCode1208. 尽可能使字符串相等(滑动窗口)

1、题目描述https://leetcode-cn.com/problems/get-equal-substrings-within-budget/给你两个长度相同的字符串,s 和 t。只含小写英文字母。将 s中的第i个字符变到t中的第 i 个字符需要|s[i] - t[i]|的开销(开销可能为 0),也就是两个字符的 ASCII 码值的差的绝对值。 用于变更字符串的最大预算是maxCost。在转化字符串时,总开销应当小于等于该预算,这也意味着字符串的转化可能是不完全的。如果...

2021-02-05 22:37:35 208

原创 LeetCode480. 滑动窗口中位数(二分查找)

1、题目描述https://leetcode-cn.com/problems/sliding-window-median/中位数是有序序列最中间的那个数。如果序列的长度是偶数,则没有最中间的数;此时中位数是最中间的两个数的平均数。[2,3,4],中位数是3 [2,3],中位数是 (2 + 3) / 2 = 2.5给你一个数组 nums,有一个长度为 k 的窗口从最左端滑动到最右端。窗口中有 k 个数,每次窗口向右移动 1 位。你的任务是找出每次窗口移动后得到的新窗口中元素的中位数,并输.

2021-02-03 23:04:40 176 1

原创 LeetCode424. 替换后的最长重复字符(双指针:滑动窗口)

1、题目描述https://leetcode-cn.com/problems/longest-repeating-character-replacement/给你一个仅由大写英文字母组成的字符串,你可以将任意位置上的字符替换成另外的字符,总共可最多替换k次。在执行上述操作后,找到包含重复字母的最长子串的长度。注意:字符串长度 和 k 不会超过10^4。输入:s = "ABAB", k = 2输出:4解释:用两个'A'替换为两个'B',反之亦然。输入:s = "AABCA...

2021-02-02 19:58:25 223 2

原创 LeetCode888. 公平的糖果棒交换(两数之和变形)

1、题目描述https://leetcode-cn.com/problems/fair-candy-swap/爱丽丝和鲍勃有不同大小的糖果棒:A[i] 是爱丽丝拥有的第 i 根糖果棒的大小,B[j] 是鲍勃拥有的第 j 根糖果棒的大小。 因为他们是朋友,所以他们想交换一根糖果棒,这样交换后,他们都有相同的糖果总量。(一个人拥有的糖果总量是他们拥有的糖果棒大小的总和。)返回一个整数数组 ans,其中 ans[0] 是爱丽丝必须交换的糖果棒的大小,ans[1]是 Bob 必须交换的糖果棒的大小.

2021-02-01 18:14:02 212 1

原创 LeetCode287. 寻找重复数(二分)

1、题目描述https://leetcode-cn.com/problems/find-the-duplicate-number/给定一个包含n + 1 个整数的数组nums ,其数字都在 1 到 n之间(包括 1 和 n),可知至少存在一个重复的整数。假设 nums 只有 一个重复的整数 ,找出 这个重复的数 。nums.length == n + 1 1 <= nums[i] <= n nums中只有一个整数出现两次或多次,其余整数均只出现一次进阶:...

2021-01-31 21:31:32 194 2

原创 LeetCode49. 字母异位词分组(字典)

1、题目描述https://leetcode-cn.com/problems/group-anagrams/给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。输入: ["eat", "tea", "tan", "ate", "nat", "bat"]输出:[ ["ate","eat","tea"], ["nat","tan"], ["bat"]]所有输入均为小写字母。 不考虑答案输出的顺序。2、代码详解先排序,再用字典di..

2020-12-14 10:52:04 199

原创 Go环境配置(Win10+vscode)

go安装包下载地址:https://studygolang.com/dl安装程序一路next安装成功命令行中查看vscodevscode地址:https://code.visualstudio.com/

2020-12-13 20:59:49 205

原创 LeetCode217. 存在重复元素(哈希)

1、题目描述https://leetcode-cn.com/problems/contains-duplicate/给定一个整数数组,判断是否存在重复元素。如果任意一值在数组中出现至少两次,函数返回true。如果数组中每个元素都不相同,则返回false。输入: [1,2,3,1]输出: true输入: [1,2,3,4]输出: false输入: [1,1,1,3,3,4,3,2,4,2]输出: true2、代码详解哈希:用字典记录以及访问的元素O...

2020-12-13 16:22:16 169

原创 DP-LeetCode376. 摆动序列

1、题目描述https://leetcode-cn.com/problems/wiggle-subsequence/如果连续数字之间的差严格地在正数和负数之间交替,则数字序列称为摆动序列。第一个差(如果存在的话)可能是正数或负数。少于两个元素的序列也是摆动序列。例如,[1,7,4,9,2,5] 是一个摆动序列,因为差值 (6,-3,5,-7,3)是正负交替出现的。 相反, [1,4,7,2,5]和[1,7,4,5,5] 不是摆动序列,第一个序列是因为它的前两个差值都是正数,第二个序...

2020-12-13 16:08:44 96

原创 LeetCode842. 将数组拆分成斐波那契序列(回溯+剪枝)

1、题目描述https://leetcode-cn.com/problems/split-array-into-fibonacci-sequence/给定一个数字字符串S,比如S = "123456579",我们可以将它分成斐波那契式的序列[123, 456, 579]。另外,请注意,将字符串拆分成小块时,每个块的数字一定不要以零开头,除非这个块是数字 0 本身。返回从 S 拆分出来的任意一组斐波那契式的序列块,如果不能拆分则返回 []。输入:"123456579"输出:[...

2020-12-08 17:29:12 170

原创 LeetCode861. 翻转矩阵后的得分(贪心)

1、题目描述https://leetcode-cn.com/problems/score-after-flipping-matrix/有一个二维矩阵A 其中每个元素的值为0或1。移动是指选择任一行或列,并转换该行或列中的每一个值:将所有 0 都更改为 1,将所有 1 都更改为 0。在做出任意次数的移动后,将该矩阵的每一行都按照二进制数来解释,矩阵的得分就是这些数字的总和。返回尽可能高的分数。输入:[[0,0,1,1],[1,0,1,0],[1,1,0,0]]输出:39...

2020-12-07 22:12:43 176

原创 LeetCode118. 杨辉三角(Python)

1、题目描述https://leetcode-cn.com/problems/pascals-triangle/给定一个非负整数numRows,生成杨辉三角的前numRows行。在杨辉三角中,每个数是它左上方和右上方的数的和。输入: 5输出:[ [1], [1,1], [1,2,1], [1,3,3,1], [1,4,6,4,1]]2、代码详解当前一行只比上一行多了一个元素,最最关键的一点:本行元素等于上一行元素往后错一位再逐个相加只要...

2020-12-06 19:49:46 212

原创 TianChi新闻推荐03:排序模型+模型融合

Task05 天池新闻推荐入门赛之【排序模型+模型融合】http://datawhale.club/t/topic/202排序模型通过召回的操作, 已经进行了问题规模的缩减,对于每个用户, 选择出了N篇文章作为了候选集, 并基于召回的候选集构建了与用户历史相关的特征,以及用户本身的属性特征,文章本省的属性特征,以及用户与文章之间的特征,下面就是使用机器学习模型来对构造好的特征进行学习, 然后对测试集进行预测,得到测试集中的每个候选集用户点击的概率,返回点击概率最大的topk个文章,

2020-12-06 15:32:44 130

原创 LeetCode321. 拼接最大数(单调栈、分治)

1、题目描述给定长度分别为m和n的两个数组,其元素由0-9构成,表示两个自然数各位上的数字。现在从这两个数组中选出 k (k <= m + n)个数字拼接成一个新的数,要求从同一个数组中取出的数字保持其在原数组中的相对顺序。求满足该条件的最大数。结果返回一个表示该最大数的长度为k的数组。输入:nums1 = [6, 7]nums2 = [6, 0, 4]k = 5输出:[6, 7, 6, 0, 4]输入:nums1 = [3, 9]nums2 =...

2020-12-02 21:39:34 237

原创 LeetCode402. 移掉K位数字(单调栈)

1、题目描述https://leetcode-cn.com/problems/remove-k-digits/给定一个以字符串表示的非负整数num,移除这个数中的k位数字,使得剩下的数字最小。输入: num = "1432219", k = 3输出: "1219"解释: 移除掉三个数字 4, 3, 和 2 形成一个新的最小的数字 1219。输入: num = "10200", k = 1输出: "200"解释: 移掉首位的 1 剩下的数字为 200. 注意输出不能有任何前导...

2020-12-02 18:26:01 301 2

原创 LeetCode767. 重构字符串(贪心+Count)

1、题目描述https://leetcode-cn.com/problems/reorganize-string/给定一个字符串S,检查是否能重新排布其中的字母,使得两相邻的字符不同。若可行,输出任意可行的结果。若不可行,返回空字符串。输入: S = "aab"输出: "aba"输入: S = "aaab"输出: ""S只包含小写字母并且长度在[1, 500]区间内。2、代码详解基于计数的贪心算法贪心的思想,想明白这个就解出来了。 判断解存在很容易,出现次数最多..

2020-12-01 11:37:47 181

原创 TianChi新闻推荐02:多路召回+特征工程

faissfaiss工具包一般使用在推荐系统中的向量召回部分。在做向量召回的时候要么是u2u,u2i或者i2i,这里的u和i指的是user和item. 在实际的场景中user和item的数量都是海量的,最容易想到的基于向量相似度的召回就是使用两层循环遍历user列表或者item列表计算两个向量的相似度, 但是这样做在面对海量数据是不切实际的,faiss就是用来加速计算某个查询向量最相似的topk个索引向量。faiss使用了PCA和PQ(Product quantization乘积量化)两种技术

2020-11-30 20:23:08 264

原创 LeetCode454. 四数相加 II(哈希)

1、题目描述https://leetcode-cn.com/problems/4sum-ii/给定四个包含整数的数组列表A , B , C , D ,计算有多少个元组 (i, j, k, l),使得A[i] + B[j] + C[k] + D[l] = 0。为了使问题简单化,所有的 A, B, C, D 具有相同的长度N,且 0 ≤ N ≤ 500 。所有整数的范围在 -228 到 228 - 1 之间,最终结果不会超过231 - 1 。输入:A = [ 1, 2]B = [...

2020-11-29 21:33:28 283 1

原创 LeetCode976. 三角形的最大周长(Python)

1、题目描述https://leetcode-cn.com/problems/largest-perimeter-triangle/给定由一些正数(代表长度)组成的数组A,返回由其中三个长度组成的、面积不为零的三角形的最大周长。如果不能形成任何面积不为零的三角形,返回0。输入:[2,1,2]输出:5输入:[1,2,1]输出:0输入:[3,2,3,4]输出:10输入:[3,6,2,3]输出:83 <= A.length <= 10000 1 &..

2020-11-29 21:12:33 188

NLP2018发展综述

NLP2018发展综述《Recent Trends in Deep Learning Based Natural Language Processing》

2019-02-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除