自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(173)
  • 收藏
  • 关注

原创 开源python-向timm学习

timm

2022-10-04 12:25:15 459

原创 开源python-向tensorflow-addons学习

https://github.com/tensorflow/addons

2022-10-03 14:49:39 547

原创 开源python-向transformers学习

open source

2022-08-20 10:47:09 407

原创 开源Python-单元测试

测试

2022-07-14 17:29:37 439

原创 开源python-代码规范与检查

规范PEP8谷歌代码规范检查flake8pylint

2022-04-16 14:19:37 794

原创 开源python-自动集成CI

熟悉需要注册pypi:https://pypi.org/manage/projects/利用github action自动发布填写pypi用户和密码作为repo secrets

2022-04-14 21:17:36 939

原创 开源python-打包发布

在根目录建立.pypirc, 注意其目录。

2022-04-11 21:36:33 1152

原创 开源python-文档撰写

python开源文档

2022-03-08 13:46:29 394

原创 书生·浦语大模型-第七节课笔记/作业

通过将关键信息随机插入一段长文本的不同位置,形成大语言模型 (LLM) 的Prompt,通过测试大模型是否能从长文本中提取出关键信息,从而测试大模型的长文本信息提取能力的一种方法,可反映LLM长文本理解的基本能力。但评测对于模型优化是非常重要的,指引了模型选择与优化的方向。

2024-04-25 14:25:08 97

原创 书生·浦语大模型-第六节课笔记/作业

serverapp。

2024-04-25 11:49:58 87

原创 书生·浦语大模型-第四节课笔记/作业

【代码】书生·浦语大模型-第四节课笔记/作业。

2024-04-22 17:37:43 156

原创 书生·浦语大模型-第五节课笔记/作业

lmdeploy kv-cache推理耗时:2.9s。lmdeploy推理耗时: 0.43s。原7b模型问题耗时: 4.5s。

2024-04-10 23:24:27 247

原创 书生·浦语大模型-第三节课笔记/作业

第一步就判断是否落在工作时间?第一感觉扎心,第二感觉就很有画面感了,“你们这群开发人员在阴阳怪气什么,无法无天了,别以为不知道你们在想什么,抓起来”基础配置通过pytoml (新版改为tomllib)读取config.ini。如何控制群聊中对话的控制?包括多人聊,以及单人可能对话中换了topic。大模型服务: 类似微服务的方式?一个server, 一个clinet。如何实现对pdf, excel, ppt的读取?如何判断介入本地知识库搜索还是网络搜索?

2024-04-06 23:40:31 279

原创 书生·浦语大模型-第二节课笔记/作业

【代码】书生·浦语大模型-第二节课笔记/作业。

2024-04-01 21:19:49 207

原创 书生·浦语大模型-第一节课笔记

23年发布的模型在一些材料中归位指令微调模型,后面逐渐升级应该已经是train的模型了。

2024-03-31 01:44:36 232

原创 APS排产相关的leetcode

【代码】APS排产相关的leetcode。

2024-01-17 22:26:13 510

原创 大模型入门0: 基础知识

自然语言处理包括几大任务。

2024-01-01 01:45:42 542

原创 大模型入门2: 指令微调

微调7B模型需要3×28G的显存(SGD+Momentum),至少需要2张A100的显卡才能满足。

2023-12-17 00:55:57 2401

原创 算法工程师-机器学习-数据科学家面试准备4-ML系统设计

数据仓库used for the analysis and reporting of structured and semi-structured data from multiple data sources, such as point-of-sale transactions, marketing automation, customer relationship management, and more.include an analytical database and critical a

2023-10-26 14:53:39 456

原创 路径规划入门

然后让chatgpt写了一个cbs方法。

2023-10-17 17:53:38 175

原创 APS开源源码解读: 排程工具 frepple

【代码】APS: frepple 开源解读。

2023-10-13 11:49:08 1278

原创 Open Book LLM Science Exam

工作太忙,导致完全没有时间学习了。国庆期间,抽空找个baseline继续学习一波。得到wiki 增强的数据。

2023-09-28 22:21:41 189

原创 Debug Pytorch: RuntimeError: CUDA error: device-side assert triggered

我这里只要to device就报错了。把to device注释掉,可以解决问题。首先采用普通的torch.randint测试,发现报同样的错误,可知是模型的问题。或者能重启也就解决了。

2023-06-07 17:27:44 321

原创 IJCAI Track 2 Forecasting Future Turn-Based Strokes in Badminton Rallies - baseline学习

需要注意的是6月13号发布的测试数据集,所以之前的成绩似乎是A榜,并不完全重要。

2023-05-27 00:35:40 396 1

原创 Parkinson‘s Freezing of Gait Prediction- baseline 学习

【代码】Parkinson‘s Freezing of Gait Prediction- baseline 学习。

2023-05-20 09:40:59 555

原创 Riiid Answer Correctness Prediction - lgb baseline 学习

使用的五个特征含义分别是。

2023-05-19 23:59:03 326

原创 Predict Student Performance - baseline学习

通过学习以上baseline进行学习。

2023-05-14 22:51:54 190

原创 CAFA5 baseline学习

本次比赛的目标是预测一组蛋白质的功能。您将开发一个模型,该模型根据蛋白质的氨基酸序列和其他数据进行训练。您的工作将帮助研究人员更好地了解蛋白质的功能,这对于发现细胞、组织和器官的工作方式非常重要。这也可能有助于开发针对各种疾病的新药和疗法。预测列表包含蛋白质目标和 GO 术语之间的成对列表,然后是关系的概率估计注意过拟合:这是一个前瞻性(即未来)的数据竞赛。测试数据中的许多蛋白质目前没有任何指定的功能。研究人员在比赛策划阶段发表的具有一项或多项功能的蛋白质将构成未来的测试集。

2023-05-10 13:16:19 346 1

原创 芒果用户未来价值预估 baseline学习

3.一个用户未来7天一共观看了1000秒,代表这个用户7日观看视频时长为1000。1.一个用户的7日留存分等于3,代表这个用户未来的7天里,有3天会访问芒果TV。2.一个用户未来7天观看了20次视频,代表这个用户7日观看视频次数为20。过去一段时间的活跃天数,观看视频数量,观看时长的统计特征。我们从三个层面定义用户未来价值。用户观看行为序列数据。

2023-05-10 13:16:07 563

原创 算法工程师-机器学习-数据科学家面试准备1- 概述 外企和国外公司、春招、秋招

该仓库记录了如何准备机器学习工程师面试,尤其海外与外企岗位申请岗位:软件工程师-机器学习方向、机器学习工程师、数据科学家、应用科学家。

2023-04-26 09:54:24 690

原创 大语言模型-alpaca-lora

微调本地知识库本文读的代码为。

2023-04-21 18:44:53 1304

原创 大语言模型-ChatGLM-Tuning

主要讲alpaca的数据改变为形式。相当于转化为Instrucrtion+Answer的形式。tokenizer函数转化为input_id、seq_len的形式。准备数据为standford alpaca的形式。

2023-04-21 18:07:37 1489

原创 大语言模型-中文chatGLM-LLAMA微调

中文instruct在chatGLM, LLAMA上的表现。

2023-04-19 13:55:28 3294

原创 大语言模型-中文Langchain

使用chatGLM6b + langchain实现本地化知识库检索与智能答案生成。

2023-04-19 13:25:34 4803 1

原创 大语言模型-微调chatglm6b

还是来自上一篇文章documentsearch的作者。

2023-04-19 11:53:32 1215

原创 大语言模型-DocumentSearch解读

大语言模型学习,继续还是在应用端进行学习,之后才会深入模型本身和原理。

2023-04-19 11:28:57 450

原创 大语言模型2-document ai解读

大语言模型的学习,首先来看简单有效的document.ai。

2023-04-19 10:57:37 824

原创 比赛ID候选

别人疯狂我谨慎,别人恐慌我贪婪,我人小输,我破产。《丑奴儿》《清平乐》《青玉案》《水龙吟》怎么不把闲置的房子租出去呢,不喜欢吗。撒旦-巴基-King-Yuetan。也许根本没有大佬,也许人人都是大佬。键盘侠 Keyboard Man。Anchor free 印钞鸡。秦始皇捡小花椒,莫以麻小而不赢。勿以恩小而不感勿以赢小而不麻。农民工yyds永远不会失业。农民伯伯-农民兄弟-农民工。四海无闲田,农夫犹饿死。遍身罗绮者,不是养蚕人。YueTan和鲁小夫。工农联盟YueTan。谭谈宇宙YueTan。

2023-04-13 17:48:09 334

原创 APS入门8-C++开发-从源码解读一个APS项目

关注我的公众号YueTan进行交流探讨。

2023-04-12 16:42:38 443

原创 gitbook简单使用

新建space与github整合关联仓库。

2023-04-11 13:34:02 50

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除