5 谁怕平生太急

尚未进行身份认证

我要认证

110010

等级
TA的排名 8w+

汽车参数理解和QA

参数理解以奥迪Q5L,宝马X3(中型SUV)和特斯拉Model 3为实例描述。从几大块汽车参数配置来讲: 车身、发动机、变速箱、底盘、车轮、安全、舒适性、辅助配置。口碑的评价维度: 油耗、空间、动力、操控、油耗、舒适性、外观、内饰、性价比、购车目的。首先是车身。几大方面主要参数简单说明奥迪Q5L宝马x3特斯拉model 3车身长宽高4.7m * 1.89m * 1.659m4.7m * 1.89m * 1.68m4.69m * 1.85m * 1.44m

2020-07-16 14:19:05

excel文件转json

import xlrdfrom collections import OrderedDictimport jsonimport codecsconvert_list = []sh = wd.sheet_by_index(0)title = sh.row_values(0)num = 1for rownum in range(1, sh.nrows): rowvalue = sh.row_values(rownum) single = OrderedDict()

2020-05-22 11:34:26

斯坦福NLP库python版:Stanza

项目地址官方教程能够使用的中文模型相关新闻

2020-03-30 16:15:45

huggingface/transformers之Usage

这个板块给出一些已经微调完全的模型示例,主要有两种方式:pipelines和tokenizer。如果你要针对性的进行微调,可以参考示例中的run_$TASK.py首先是 pipelines 方式。以文本分类为例,代码如下import timefrom transformers import pipelinenlp = pipeline("sentiment-analysis")s...

2020-03-30 12:02:12

pytorch bert 快速开始

huggingface-transformers快速开始import torch from transformers import BertTokenizer,BertForMaskedLMtokenizer = BertTokenizer.from_pretrained('bert-base-uncased')text = "[CLS] Who was Jack Ma ? [SEP] J...

2020-03-25 16:39:31

事件抽取与金融事件图谱构建 陈玉博 2018. 分享记录

学习视频来源####其他学习笔记介绍信息抽取技术:实体抽取、消歧、关系抽取、事件抽取事件抽取:现有kg主要以实体为核心,缺少事件知识事件和事物是n对n关系,人们以事件为单位来认知世界事件抽取与事件图谱的意义:丰富现有的知识图谱,支撑其他信息获取引擎语义搜索、事件监控、检测相关事件(孟晚舟、华为5G、外交部发言相关)、预警风险事件(关联交易、黑铁事件)、梳理历史事件(事件长链条)代表...

2020-03-17 11:12:26

事件抽取---2020.3 收集

Exploring pre-trained language models for event extraction and generationACL2019解决在事件抽取任务训练数据的不足。论文阅读笔记Document-level Framework for Chinese Financial Event ExtractEMNLP2019 金融领域文档级别事件抽取将文档级别的事件表...

2020-03-16 15:42:36

搜索技术相关的技术框架(部分)

1 特定站点搜索和通用搜索的对比搜索用户天生的“懒惰”、表达含糊以及对搜索结果智能的期待从未改变过。用户对于全网通用搜索和站内搜索的期望差别仅在于搜索范围从全网变为特定站点。而由于用户对他所喜爱的站点的了解、熟悉程度远远超出其对全网的了解,所以用户对搜索服务所存在的各种问题更为敏感,从而有更高的要求。1.1 搜索引擎和全文检索的区别搜索引擎的门槛主要是技术门槛,包括网页数据的快速采集、海...

2020-03-12 17:20:39

条件关系和因果关系,原因和理由的区别

条件关系和因果关系的对比:条件关系:分句之间的关系是条件和结果的关系。偏句提出一种真实或假设的条件,正句说明在这种条件下所产生的结果。因果关系:正句和偏句之间是原因和结果的关系的句子。偏句说明原因,正句说明结果。一般是偏句在前,正句在后。因果复句分为说明因果句和推论因果句两类。条件关系属于思想中命题的某种逻辑关系,因果关系属于对客观事实的某种认识。条件关系是关于命题的,而因果关系是关于事实...

2020-03-05 01:02:05

推荐系统和搜索引擎的比较

比较推荐系统搜索引擎获取信息的方式不同被动;模糊主动;明确个性化程度高低服务特性持续服务 (“好”的推荐系统往往让用户停留更多的时间,带来的增量点击,推荐成功数,成交转化提升量等)快速满足*(“好”的搜索算法是需要让用户获取信息的效率更高、停留时间更短。)*特点(用户存在大量的需求是比较难用精炼的文字组织的:一方面用户不愿意,另一方面搜索对语义...

2020-03-04 11:49:58

pymongo的一些操作记录

记录菜鸟教程中不包含的部分操作:获得collection中documents总数mycol.count_documents({})用python操作MongoDB查询collection中最新的一个documentmycol.find_one(sort=[(’_id’, -1)])pymongo的比较排序查询性能比较,sort参数和sort函数, find和find_one...

2020-03-02 11:18:49

查询关键字理解的难度

简单说明查询关键字,即通过搜索引擎,填入到搜索框中的内容,不限于百度,微信搜一搜,美团,微博等站内搜索。也可以称之为query。用户意图识别方面:爱情公寓资源 – 重点是资源医生表情包 – 重点是表情包怎么恢复聊天记录 – 和健康无关华侨城集团招聘 – 和旅游无关烧烤店爆炸 – 重点是爆炸面朝大海、春暖花开 – 和旅游无关“宝宝”的query 大概率被分成母婴类q...

2020-03-01 13:26:59

倒排索引

由来正向索引: 文档–>单词如果使用正向索引, 当用户搜索 关键词 A 时, 需要扫描索引库中的所有文档,找出所有包含 A 的文档, 然后根据打分模型进行打分, 排出名次后 呈现给用户。这样做,无法满足实时返回结果给用户的 需求。倒排索引: “关键词” --> 带有此关键词的 文档ID列表详细实现 “单词–文档矩阵”的一种具体存储形式。示例参数解释:单词ID:...

2020-02-27 15:52:48

搜索系统评测的指标

“二元相关”原理从根本上不支持排序的评测。基于多程度相关原理的评测折扣化的累积获得,简称DCG(discounted cumulative gain)。1)首先,一个排序的整体相关度,是这个排序的各个位置的相关度的某种加权2)其次,每个位置上面的“获得”是和这个文档原本定义的相关度相关的,但是,根据不同的位置,要打不同的“折扣”即位置越低,折扣越大。原始的DCG定义:“折扣”是文档的相...

2020-02-27 11:06:50

查询关键字的分类、解析、扩展

搜索的第一步:对query的理解

2020-02-26 16:44:57

简单判断两个字符串的相似程度

可直接使用difflib.SequenceMatcherdef ratio(self): """Return a measure of the sequences' similarity (float in [0,1]). Where T is the total number of elements in both sequences, and ...

2020-02-25 15:17:33

代码质量管理

2020-02-18 18:31:18

SemEval初识(一)

SemEval2020 日程安排SemEval2020 TaskSemEval2020-Task4-常识-验证和解释SemEval2020-Task5-基线SemEval2020-Task6-deft_corpus

2020-02-17 15:48:49

了解搜索引擎爬虫(一)

搜索引擎爬虫magi.com 的网页抓取工具

2020-02-17 11:23:08

git和docker部分命令

Gitgit config --global user.name " "git config --global user.email " "git remote add origin git@ :git statusgit add README.mdgit commit -m “修改readme.md”git push -u origin masterDockerdocker b...

2020-02-07 18:54:24

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。