3 只爱写代码

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 2w+

自然语言处理实践Task6

基于Bert的文本分类Bert Pretrainclass WhitespaceTokenizer(object): """WhitespaceTokenizer with vocab.""" def __init__(self, vocab_file): self.vocab = load_vocab(vocab_file) self.inv_vocab = {v: k for k, v in self.vocab.items()} def t

2020-08-05 17:57:21

自然语言处理实践Task5

import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asctime)-15s %(levelname)s: %(message)s')# set seed seed = 666random.seed(seed)np.random.seed(seed)torch.cuda.manual_seed(seed)torch.man

2020-07-29 23:37:11

自然语言处理实践Task4

FastTextFastText通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。FastText是一个三层的神经网络,输入层、隐藏层和输出层。# coding: utf-8from __future__ import unicode_literalsfrom keras.models import Sequentialfrom keras.layers import Embeddingfrom keras.layers

2020-07-27 21:32:05

自然语言处理实践Task3

One-hot这里的One-hot与数据挖掘任务中的操作是一致的,即将每一个单词使用一个离散的向量表示。具体将每个字/词编码一个索引,然后根据索引进行赋值。One-hot表示方法的例子如下:句子1:我 爱 北 京 天 安 门句子2:我 喜 欢 上 海首先对所有句子的字进行索引,即将每个字确定一个编号:{‘我’: 1, ‘爱’: 2, ‘北’: 3, ‘京’: 4, ‘天’: 5,‘安’: 6, ‘门’: 7, ‘喜’: 8, ‘欢’: 9, ‘上’: 10, ‘海’: 11}在这里共包括

2020-07-26 00:25:42

自然语言处理实践Task2

一、读取训练数据# sep设置分割符# nrows设置读取的行数train_df = pd.read_csv('./data/train_set.csv', sep='\t', nrows=100)train_df.head()第一列label为新闻的类别,第二列text为新闻的字符。二、数据分析计算句子的长度train_df['text_len'] = train_df['text'].apply(lambda x: len(x.split(' ')))train_df['text

2020-07-22 23:49:02

自然语言处理实践Task1

一、数据集结构:共14个分类:{‘科技’: 0, ‘股票’: 1, ‘体育’: 2, ‘娱乐’: 3, ‘时政’: 4, ‘社会’: 5, ‘教育’: 6, ‘财经’: 7, ‘家居’: 8, ‘游戏’: 9, ‘房产’: 10, ‘时尚’: 11, ‘彩票’: 12, ‘星座’: 13}二、评测标准:F1=2∗(precision+recall)(precision∗recall)F_1=2* \frac{(precision+recall)}{(precision∗recall)}F1​=2∗

2020-07-21 22:37:05

刷题笔记2020-06-26

1.给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。leetcode136def singleNumber(self, nums: List[int]) -> int: res = 0 for num in nums: res ^= num return res异或运算有以下三个性质:任何数和 0 做异或运算,结果仍然是原来的数,即 a ^ 0 = a。任何数

2020-06-26 14:22:12

二叉树

满二叉树如果二叉树中除了叶子结点,每个结点的度都为 2,则此二叉树称为满二叉树。完全二叉树如果二叉树中除去最后一层节点为满二叉树,且最后一层的结点依次从左到右分布,则此二叉树被称为完全二叉树。参考链接:http://c.biancheng.net/view/3384.htmlhttps://www.cnblogs.com/-citywall123/p/11788764.html...

2020-06-26 16:12:42

Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (2)

Take a Quick Look at the Data Structurehousing =load_housing_data()# show the total number of rows, each attribute’s type, and the number of nonnull valueshousing.info()# how many districts belong to each category housing["ocean_proximity"].value_coun

2020-06-20 11:43:50

mac下使用pyenv

一、安装pyenv安装命令brew updatebrew install pyenv添加环境变量echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bash_profileecho 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bash_profile二、pyenv基本用法# 查看已安装的版本pyenv versions# 查看正在使用的版本pyenv version

2020-06-06 15:15:38

ubuntu安装scala开发环境

到官网下载scala-2.11.12.tgz解压到要安装的目录sudo tar -zxvf scala-2.11.12.tgz -C /usr/local/Software/Scala打开~/.bash_profile,配置环境变量export SCALA_HOME=/usr/local/Software/Scala/scala-2.11.12export PATH=$PATH...

2020-05-05 11:04:56

docker下使用solr

安装sudo docker pull solr:7.7.2启动sudo docker run -d -p 8983:8983 --name crsolr solr:7.7.2创建coresudo docker exec -it crsolr solr create_core -c gettingstarted官方手册

2020-04-05 22:56:57

docker下使用redis

启动redis容器docker run --name crredis -p 6379:6379 -d redis --requirepass "123456"进入redis容器docker exec -it crredis bashredis命令# 登陆客户端redis-cli -a 123456# 查看所以keykeys *# 清空内容FLUSHALL...

2020-03-18 14:33:17

ubuntu下安装psycopg2报错

错误信息如下:Error: pg_config executable not found. pg_config is required to build psycopg2 from source. Please add the directory containing pg_config to the $PATH or specify the full executa...

2020-03-14 19:49:02

docker中使用postgresql

拉取postgersql镜像sudo docker pull postgres启动postgresql容器sudo docker run --name crpsql -e POSTGRES_PASSWORD=123456 -p 5432:5432 -d postgres进入容器sudo docker exec -it crpsql bash...

2020-03-13 18:54:20

ubuntu18安装sublime

1.到官网下载源码包2.解压到指定文件夹sudo tar -jxvf sublime_text_3_build_3211_x64.tar.bz2 -C /opt/3.建立软链接ln -s /opt/sublime_text_3/sublime_text /usr/local/bin/sublime34.卸载sudo rm /usr/local/bin/sublime3sudo r...

2020-03-13 18:36:07

ubuntu18找不到wifi适配器

连接网络输入以下命令,重启后即可使用wifisudo apt-get updatesudo apt install broadcom-sta-dkms

2020-03-11 16:01:05

ubuntu18.04安裝搜狗輸入法

一、安裝fcitx打开ubuntu software,安装Fcitx和Fcitx Configuration打开setting => Region & Language => Lauguage Support,添加中文支持重启电脑二、官网下载搜狗输入法,双击deb文件安装即可。...

2020-03-11 15:57:45

mac安装openjdk

1.修改bash_profile文件# Javaexport JAVA_8_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_241.jdk/Contents/Homeexport JAVA_11_HOME=/Library/Java/JavaVirtualMachines/jdk-11.0.6.jdk/Contents/Home# 默认jdk...

2020-03-09 16:17:47

Mac下卸载Idea

先将idea拖入垃圾篓删除以下文件cd ~/Library rm -rf Preferences/IdeaIC2019.3rm -rf Caches/IdeaIC2019.3 rm -rf Application\ Support/IdeaIC2019.3rm -rf Application\ Support/IntelliJ\ IDEArm -rf Logs/IdeaIC201...

2020-02-23 15:20:54

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。