- 博客(16)
- 收藏
- 关注
原创 embedding中的normalize_embeddings参数
在句子嵌入的背景下,将它们归一化可以在使用余弦相似度作为衡量句子或文档相似性的度量时特别有用。余弦相似度可解释性: 当嵌入进行归一化时,两个向量之间的余弦相似度等同于它们的点积。这使得余弦相似度更具解释性,因为它的取值范围从-1(完全不相似)到1(完全相似)。提高训练稳定性: 归一化嵌入可以提高训练的稳定性,特别是在模型对输入特征的尺度敏感的情况下。它可以防止模型过于敏感于大幅度的值。正则化效果: 归一化充当正则化的一种形式,通过约束嵌入的幅度可以帮助防止过拟合,特别是在训练数据有限的情况下。
2023-12-20 17:45:29 281
原创 模型+分类器做文本分类
如果你的数据有限,或者你希望保留更多的预训练知识,那么可以选择冻结部分参数或全部参数。在使用BGE模型和分类器进行文本分类时,要冻结BGE模型的参数,你可以使用深度学习框架(如PyTorch或TensorFlow)提供的参数冻结功能。在这种情况下,你可以选择冻结BGE模型的参数,以充分利用其预训练知识,减少过拟合风险,并提高训练效率。如果你的任务要求模型适应特定的领域、风格或文本类型,或者你有足够的任务特定数据来微调整个模型,那么进行全量微调可能是一个合理的选择。
2023-10-27 18:06:28 561
原创 个人操作docker手册
Docker Tool中输入:1.查看2.进入ubuntu容器交互系统:6.查看容器的信息7.进入容器docker start CONTAINER_ID #进入前需要先启动8、终止容器docker stop CONTAINER_ID #用来终止一个运行中的容器。docker stop $(docker ps -a -q) #停止所有容器9、启动容器docker start CONTAINER_ID #启动ID 为CONTAINER_ID的容器。
2023-05-29 16:20:33 81
原创 gitlab拉取、上传指定文件目录
参考文章:https://blog.csdn.net/Michaelwubo/article/details/126407862?注意:子目录路径不包含clone的一级文件夹名称,直接写成:tests/ , 错误: /LangChain/tests/$ git remote add origin https://*****.git // 你的git仓库地址。
2023-05-11 11:36:21 1347
原创 用python安装opencv-python提示报:ModuleNotFoundError: No module named ‘skbuild’
用python安装opencv-python提示报:ModuleNotFoundError: No module named ‘skbuild’
2023-01-21 12:32:04 1124
原创 依据标签数量进行分布展示
import seaborn as snsimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['font.serif'] = ['SimHei']fig, ax = plt.subplots()fig.set_size_inches(20, 8)sns.set_style("darkgrid", {"font.sans-serif": ['simhei', 'Aria
2022-02-22 16:46:02 584
原创 关于for-loop效率,python3.8 是python3.6的多少倍?
python3.8 进行for循环---每行1~2秒开始计算第1行... 共67371行2021-03-05 14:49:39开始计算第101行... 共67371行2021-03-05 14:49:43开始计算第201行... 共67371行2021-03-05 14:49:45开始计算第301行... 共67371行2021-03-05 14:49:46开始计算第401行... 共67371行2021-03-05 14:49:47开始计算第501行... 共67371行2021
2021-03-05 15:06:15 146
原创 Neo4j问题及解决
报错1:The client is unauthorized due to authentication failure.报错2:WARN Failed authentication attempt for 'neo4j' from 127.0.0.1进入neo4j安装目录, 并进入bin目录; 运行./cypher-shell命令, 输入用户名,密码(初始默认用户名和密码为neo4j)3.停止neo4j服务,并且删除data/dbms/auth4.修改D:\neo4j-commu.
2020-10-12 10:48:41 7533 3
原创 多特征聚类,依据坐标显示
from conf.config import *mysql = MYSQLmysql.open()def read_data_mysql(table_name,n,label,num_features): select_sql = "SELECT * FROM %s " % table_name # select_sql = "SELECT * FROM %s " %...
2020-05-06 11:29:58 902
原创 linux-ubuntu设置静态IP
d /etc/netplanchmod 777 01-XXXXXXXXXvim 01-XXXXXXXXX# Let NetworkManager manage all devices on this systemnetwork: version: 2 renderer: NetworkManager ethernets: ens33 : #配置的网卡名称,使用ifc...
2020-04-28 15:56:08 182
原创 docker&dockerfile&容器实用操作,帮你填坑
步骤一:启动、进入容器docker run -i -t python_requirements:201 /bin/bash#容器内Python包的位置,查看Python包ls /usr/local/lib/python3.6/dist-packages/步骤二:查询容器IDdocker ps -adocker inspect -f '{{.ID}}' [容器NAMES]得...
2020-04-28 15:48:57 265
原创 for 循环, 多进程并行加速
########## for 循环并行,单一参数 #############import timeimport multiprocessingdef do(i): print(i) time.sleep(2)if __name__ == '__main__': param = [] #假设有100次循环 for i in range(0,...
2019-11-05 11:39:38 4039
原创 Kylin实战,cube及查询优化,更小更快更好用!
1、聚合组(Aggregation Group)针对不同的查询目的,结合查询语句中涉及到维度,将所有维度分为不同的组,这样可以减少Cuboid的数量。图12、 必要维度(Mandatory Dimension)用户有时会对某一个或几个维度特别感兴趣,所有的查询请求中都存在group by这个维度,那么这个维度就被称为必要维度,只有包含此维度的Cuboid会被生成(如图2...
2019-05-07 17:59:44 925
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人