7 CopperDong

尚未进行身份认证

纯属巧合

等级
TA的排名 1k+

中文机器翻译数据集

DatasetWMT2018AI challenger(英中翻译规模最大的口语领域英中双语对照数据集)UM-Corpus: A Large English-Chinese Parallel CorpusOpenSubtitles2016MultiUNMethodsAI Challenger 2017 奇遇记机器翻译如何解决数据量小的问题?...

2020-05-18 16:08:37

NLP:自回归(Autoregressive LM)与自编码语言模型(Autoencoder LM)

链接:https://zhuanlan.zhihu.com/p/70257427自回归根据上文内容预测下一个可能跟随的单词,就是常说的自左向右的语言模型任务,或者反过来也行,就是根据下文预测前面的单词,这种类型的LM被称为自回归语言模型。(GPT,ELMO)GPT 就是典型的自回归语言模型。ELMO尽管看上去利用了上文,也利用了下文,但是本质上仍然是自回归LM,这个跟模型具体怎么实现有关系。ELMO是做了两个方向(从左到右以及从右到左两个方向的语言模型),但是是分别有两个方向的自回归LM,然后把LST

2020-05-13 09:45:46

A project

1、创建 Django 环境Pycharm Python 3.7pip install Django==2.2.5pip install djangorestframework==3.10.22、项目创建新建extra_apps (扩展的源码包)apps (放所有app)media (保存图片)# 把extra_apps和apps标记为sources root,然后settings中也要加路径# 修改 settings.pyimport s.

2020-05-11 19:18:47

小程序 tfjs

在小程序中添加 tensoflowjs 插件(详细的说明文档)在小程序的根目录下$ npm init$ npm install @tensorflow/tfjs-core$ npm install @tensorflow/tfjs-converter$ npm install @tensorflow/tfjs-layers$ npm install fetch-wechar构建 npmnpm install regenerator_runtime 异步加载库cons.

2020-05-10 15:07:58

用tensorflow.js实现浏览器内的手写数字识别

原文简介Tensorflow.js是google推出的一个开源的基于JavaScript的机器学习库,相对与基于其他语言的tersorflow库,它的最特别之处就是允许我们直接把模型的训练和数据预测放在前端,置于浏览器内。本文会用一个简单的demo介绍如何从零开始训练一个tensorflow模型,并在浏览器内实现手写数字识别,最终效果大约如下:手写数字识别示例本文会假设你有基本的python和JavaScript的知识。项目的完整代码参考github。准备项目代码的目录.

2020-05-08 18:56:30

常见的32项NLP任务以及对应的评测数据、评测指标、目前的SOTA结果以及对应的Paper

任务 描述 corpus/dataset 评价指标 SOTA 结果 Papers Chunking 组块分析 Penn Treebank F1 95.77 ...

2020-05-07 16:19:45

Deep Biaffine Attention for Neural Dependency Parsing

原文https://www.hankcs.com/nlp/parsing/deep-biaffine-attention-for-neural-dependency-parsing.html这是斯坦福专攻Dependency Parsing的博士生Dozat在ICLR 2017上的论文,拿到了graph-based方法中的最高分,改进版还拿到了CoNLL 2017 Shared Task的第一...

2020-05-07 15:28:31

Deep Learning with JS

一、基础知识code:https://github.com/tensorflow/tfjs-examples第一个示例,线性回归codepen.io/tfjs-book/pen/VEVMMd<!DOCTYPE html><html lang="en"><!-- >python -m http.server 8080 -->&...

2020-05-04 17:56:44

比Python快100倍,利用Cython实现高速NLP项目

原文https://juejin.im/post/5b4c3a6de51d4519044a6765选自Medium,作者:Thomas Wolf,机器之心编译。Cython 是一个工具包,可以使你在 Python 中编译 C 语言,这就是为什么 numpy 和 pandas 很快的原因,Cython 就是 Python 的超集。在本文中,作者将为我们介绍他的 GitHub 项目 Neur...

2020-04-29 09:09:19

Python自然语言处理第二章-2.5WordNet(III)——更多词汇关系:部分、整体、集合、蕴含等

WordNet(III)——更多词汇关系:部分、整体、集合、蕴含等0. 本节内容从条目到部分(部件、实质)part_holonyms()substance_holonyms()或从条目到包含它们的东西(整体)part_meronyms( )substance_meronyms( )或从条目到集合member_meronyms( )特别注意:本文提到的部分方法在书中并没有括号...

2020-04-18 18:42:34

ubuntu – 找不到lgfortran

得到了错误/usr/bin/ld: cannot find -lgfortran虽然安装了:ldconfig -p | grep fortran libgfortran.so.3 (libc6,x86-64) => /usr/lib/libgfortran.so.3解决办法:sudo ln -s /usr/lib/x86_64-linux-gnu/l...

2020-04-01 17:11:35

微信小程序template模板与component组件的区别和使用

原文https://www.cnblogs.com/xyyt/p/9559326.html

2020-03-20 14:51:50

python自带的用于解析HTML的库HtmlParser

HtmlParser,顾名思义,是解析Html的一个工具。python自带的。一、常用属性和方法介绍HtmlParser是一个类,在使用时一般继承它然后重载它的方法,来达到解析出需要的数据的目的。1.常用属性:lasttag,保存上一个解析的标签名,是字符串。2.常用方法:handle_starttag(tag, attrs) ,处理开始标签,比如< div>;...

2020-03-19 16:36:54

CSS3实现对话气泡效果

以前我们要实现对话气泡效果很麻烦,从有了CSS3以后就变得简单多了,我们就来看下CSS3如何实现对话气泡效果。CSS3开始改变我 们的生活了。现在要创建一个在个浏览器下面都看起来不错的对话浮层就简单了很多,一个HTML元素,一些CSS3代码,不需要图片,也不需要 Javascript。一点一点开始吧,先来看看HTML结构,只需要一个元素就可以了。我们使用p标签。 1 ...

2020-03-13 11:33:45

tensorflow2.0学习-4 低阶API

原文https://github.com/lyhue1991/eat_tensorflow2_in_30_days1、张量张量的操作主要包括张量的结构操作和张量的数学运算。张量结构操作诸如:张量创建,索引切片,维度变换,合并分割。张量数学运算主要有:标量运算,向量运算,矩阵运算。另外我们会介绍张量运算的广播机制。本篇我们介绍张量的结构操作。创建张量:张量创建的许多方法和nu...

2020-03-02 17:44:20

tensorflow2.0学习-3 API层次结构

低阶、中阶和高阶API1、低阶API使用TensorFlow的低阶API实现线性回归模型。低阶API主要包括张量操作,计算图和自动微分。import tensorflow as tf#打印时间分割线@tf.functiondef printbar(): ts = tf.timestamp() today_ts = ts%(24*60*60) hour...

2020-03-02 16:40:48

tensorflow2.0学习-2 基本概念

原文https://github.com/lyhue1991/eat_tensorflow2_in_30_days1、张量程序 = 数据结构+算法。TensorFlow程序 = 张量数据结构 + 计算图算法语言张量和计算图是 TensorFlow的核心概念。Tensorflow的基本数据结构是张量Tensor。张量即多维数组。Tensorflow的张量和numpy中的array...

2020-03-02 16:29:06

tensorflow2.0学习-1

原文https://github.com/lyhue1991/eat_tensorflow2_in_30_days1、数据准备有三种数据形式:结构化数据、图像和文本结构化数据:一般使用panda图像数据:在tensorflow中常用方案有两种,第一种是使用tf.keras中的ImageDataGenerator工具构建图片数据生成器。 第二种是...

2020-03-02 16:02:28

人工智能实战小程序之语音_前端开发

https://github.com/yuzd/microsoft_ai1. 人工智能实战小程序之准备工作2. 人工智能实战小程序之语音_前端开发今天这部分主要讲小程序前端功能的开发由于我偏后端,css是我的弱项,可能很多人和我一样开发小程序不知道如何下手,希望本篇文章对你有帮助我的学习路线是:大略看一遍小程序的api文档然后在github上找一些小程序(我倾向于...

2020-01-15 10:41:44

tf.nn,tf.layers, tf.contrib模块介绍

原文

2020-01-14 19:20:58

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。