自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 书生浦语大模型实战营-课程笔记(6)

opencompass的整体流程。这个飞书状态上报功能后续可以试试。模型评测的意义与方式。有点类似论文里大家用来比较性能的公开数据集。评测用于减少社会风险这个角度确实没想到过,学到了。

2024-02-20 00:26:56 323

原创 书生浦语大模型实战营-课程作业(6)

这次作业比较简单,用现成的模型和测试集跑一下推理就行了。主要熟悉一下OpenCompass用于评测模型性能。

2024-02-20 00:21:41 352

原创 书生浦语大模型实战营-课程作业(5)

之前作业里尝试过web_demo的部署方式了,这次直接简单点用了命令行本地对话。

2024-02-20 00:19:37 320

原创 书生浦语大模型实战营-课程笔记(5)

移动端竟然也可以部署LLM。之前以为只能在服务端部署,移动端作为客户端发起请求来调用大模型。LLM部署特点,内存开销大,TOKEN数量不确定。LMDeploy用于模型量化。量化主要作用:降低现存开销。模型量化:降低内存消耗。

2024-02-20 00:18:29 423

原创 书生浦语大模型实战营-课程作业(4)

作业教程里的文件路径好像有点小问题,遇到了点坑。

2024-02-18 00:28:29 378

原创 书生浦语大模型实战营-课程笔记(4)

2.训练时数据为一问一答的形式(input和output)微调分为两种,增量预训练和指令跟随。只需要output的数据进行训练。操作部分的笔记参考git上的文档。1.只对答案计算Loss。xtuner:微调框架。

2024-02-17 16:20:26 427

原创 书生浦语大模型实战营-课程笔记(3)

区别在于生成了这个prompt,猜测是用数据库里最接近的向量来辅助模型找出答案。涉及了文本相似度匹配,是不是和传统的问答系统(直接匹配数据库)有点类似?本节课主要是跟着教程做的,操作的东西放到作业里记录了。RAG=外挂知识库?优点是成本低,不用重新训练。langchain的介绍,用来构建LLM应用。这里主要记录一些视频里讲的非操作性的东西。RAG的一个整体流程。

2024-02-15 22:10:25 481

原创 书生浦语大模型实战营-课程作业(3)

不知道为啥我这里是白色的,看视频是黑色的。但猜测应该是gradio框架设置的问题,导致前端显示不太一样,反正不影响模型,问题不大。下载sentence_transformer的代码运行情况。sentence_transformer用于embedding(转向量)本地构建持久化向量数据库。就是把txt和md文件抽取出纯文本,分割成定长(500)后转换成向量,保存到本地,称为知识库构建。把InternLM 接入 LangChain,然后构建检索问答链。最后用Gradio做成一个网页的demo。

2024-02-15 22:04:25 473

原创 书生浦语大模型实战营-课程作业(2)

hugging face下载模型(过年在家实在没电脑用,只好用开发机了抱歉。生成了一个DOTA2的小故事。玩黑鸟使人目光呆滞.jpg。

2024-02-14 23:12:35 363

原创 书生浦语大模型实战营-课程笔记(2)

web_demo启动方式(主要不是直接用python运行,需要streamlit run)InternLm是训练框架,Lagent是智能体框架。Lagent是智能体框架,相当于LLM的应用。这个预训练需要这么多算力,大模型确实花钱。介绍了一下InternLm的总体情况。hugging face下载模型的代码。

2024-02-14 23:10:19 448

原创 书生浦语大模型实战营-课程笔记(1)

模型应用过程,大致还是了解的。和之前实习做CV项目的时候比起来,多了智能体这个环节。8G内存就能做微调。比想象中算力需求低了一点点,但还是得靠企业才能玩。评测单独拿出来讲了,感觉很重要?我理解就类似于以前论文里的公开数据集?类似上张图,智能体不太清楚。感觉是偏应用而不是模型的东西?数据集类型很多,有文本/图片/视频。所以大模型=多模态?安全性单独列了出来,确实现在算法公平性这块越发严格。所以智能体其实是在LLM外面套了一层用来应用。这个部署做性能优化感觉很厉害。这个和CV做的好像差不多。

2024-02-14 23:03:57 533

原创 Linux常用命令

1.返回上级目录cd..2.创建文件夹mkdir [选项] DirName3.创建软连接ln -s file1 file1new

2020-12-28 21:40:11 114

原创 Linux wipe工具

1.wipe是一种小命令,能够安全删除磁性媒介上的文件,该命令能够在各种unix平台进行汇编,包括Linux 2.*、(Open+Net+Free)BSD、 aix 4.1、 SunOS 5.5.1以及Solaris 2.6等。从磁性媒介上恢复已经被擦除的数据要比人们想象的容易得多,一种称为“Magnetic Force Microscopy (MFM)”的技术能够恢复写入磁盘的最后2层或者3层的数据。而wipe命令能够向已删除的文件反复写入特殊图案,使用fsync() call和/或 O_SYNC bit

2020-12-28 14:52:04 1718

原创 Linux Shred命令

我们大多数时候总是使用 rm 命令来删除文件。但是文件去哪儿了呢?真相是 rm 命令所做的事情并不是像你所想像的那样,它仅仅删除了文件系统和硬盘上的数据的硬链接。硬盘上的数据依旧存在,直到被另一个应用重写覆盖。对于非常敏感的数据来说,这会带来一个很大的安全隐患。shred 命令是 rm 命令的升级版。当你使用 shred 命令删除一个文件之后,文件中的数据会被多次随机覆写。甚至有一个选项可以在随机覆写之后对所有的数据进行清零。参数-f, --force 必要时修改权限以使目标可写-n, --iter.

2020-12-28 14:07:28 2160 1

原创 Java LC刷题注意点

以前一般用C++刷题,现在转JAVA了。仅以此文记录一些语法上的差别1.Java里的布尔值 boolean2.Java中定义栈Stack st1 = new Stack();

2020-10-19 09:07:54 174

原创 ML笔记(一)

线性回归的代价函数永远是凸函数即只有全局最优,无局部最优

2020-10-19 09:05:56 142

原创 操作系统复习(八)[王道]

第5章 输入/输出(I/O)管理1.I/O控制方式程序直接控制方式中断驱动方式:I/O控制器与存储器之间的数据传输必须经过CPU,仍会消耗较多的CPU时间。DMA方式:通道控制方式2.I/O子系统...

2020-04-29 15:08:47 290

原创 操作系统复习(七)[王道]

第四章.文件管理1.文件逻辑结构(1)无结构文件(流式文件)(2)有结构文件(记录式文件)1.顺序文件2.索引文件文件控制块(FCB):包含文件基本信息(文件名,物理位置),存取控制信息(存取权限),使用信息(建立时间,修改时间)文件目录:FCB的有序集合索引结点:有的系统采用文件名与文件描述信息分开的方式,文件描述信息单独形成一个称为索引结点的数据结构。简称i结点4...

2020-04-28 00:25:25 154

原创 操作系统复习(六)[王道]

第3章.内存管理1.程序装入内存的过程(1)编译:有源代码->目标模块(2)链接:将目标模块与库函数相链接,形成完整装入模块静态链接:程序运行前进行链接,以后不再拆开装入时动态链接:将目标模块装入内存时,边装入边链接运行时动态链接:运行时,装入需要的目标模块(3)装入:由装入程序将装入模块装入内存运行 绝对装入:程序中的逻辑地址与实际内存地址完全相同.只适用于单道程序环境...

2020-04-26 21:00:02 170

原创 操作系统复习(五)[王道]

第二章.操作系统2.2处理机调度1.调度层次(1)高级调度(作业调度):从外存的后备队列挑选作业,为它分配内存、建立进程。作业调度是外存与内存之间的调度。(2)中级调度(内存调度):将不能运行的进程调至外存(即挂起),这时进程进入挂起态。当内存有空闲时,由中级调度决定将外存上的哪些进程调入内存,放入就绪队列(唤醒)。(3)低级调度(进程调度):负责从就绪队列选进程,将CPU分配给它。2...

2020-04-25 14:55:50 141

原创 数据库知识点回顾(三)

第8章.数据库管理1.一个程序中包含多个事务2.ACID性质(1)原子性(Atomicity):事务对数据库的更新要么全部起作用,要么都不起作用(2)一致性(Consistency):一个事务独立执行的结果,应使数据库从一个一致性状态转变为另一个一致性状态(3)隔离性(Isolation):事务相互隔离(4)持久性(Durability):事务一旦成功提交,对数据库的更新永久有效...

2020-04-24 21:13:03 217

原创 操作系统复习(四)[王道]

1.操作系统特征(1)并发(2)共享:资源分为临界/非临界资源并发与共享互为条件,有并发才能谈共享,做好了共享的管理才能实现并发(3)虚拟:把一个物理上的实体变为若干逻辑上的对应物例如:虚拟存储器技术通过多道程序设计技术,采用让多道程序并发执行的方法,来分时使用一个处理器。让每个用户感觉有一个处理器专门为它服务。(4)异步:多道程序环境允许多个程序并发执行,每个进程并不是一贯到底,以不...

2020-04-22 22:41:28 203

原创 数据库知识点回顾(二)

第5章.规范化设计1.关系模式R是静态的关系模式R对应的关系r是动态的2.存储异常包括:数据冗余,修改异常,插入异常,删除异常3.完全函数依赖:X函数决定Y,且X的任何真子集都不能函数确定Y4.传递函数依赖:X——>Y,Y——>Z,且Z不是Y的子集,不存在Y——>X5.候选码:所有属性完全函数依赖于候选码候选码中的属性为 主属性6.FD推理规则(Armstron...

2020-04-20 22:14:04 699

原创 数据库知识点回顾(一)

第2章.数据库系统结构1.数据模型(1)概念数据模型:用于建立信息世界的数据模型,与硬件、DBMS无关(2)结构数据模型:直接面向数据库的逻辑结构,与硬件、DBMS有关2.实体联系模型(ER模型)(概念模型的一种)3.(1)层次模型(2)网状模型(3)关系模型4.三级结构-两级映像(1)三级结构外模式:也称子模式,是个别用户的数据视图,即个别用户涉及到的数据的逻辑结构模式:...

2020-04-19 17:00:53 239

原创 数据结构知识点复习归纳(三)

第八章.排序1.直接插入排序:平均时间复杂度O(n^2)若待排序列为接近有序,时间复杂度可以达到O(n)2.希尔排序不稳定3.快速排序空间复杂度:最好O(logn),最坏O(n),平均O(logn)时间复杂度:最坏O(n^2),序列基本有序或逆序平均O(logn)4.简单选择排序比较次数与序列初始状态无关,始终为n*(n-1)/2次不稳定5.堆排序(1)n个结点的完全二叉树...

2020-04-11 00:11:02 144

原创 数据结构知识点复习归纳(二)

第五章.树1.二叉树的存储结构(1)顺序存储(2)链式存储2.树的存储结构(1)双亲表示法(2)孩子表示法(3)孩子兄弟表示法(又称二叉树表示法),也可用于实现树转换为二叉树3.树和森林的遍历(1)树的先根遍历=对应二叉树的先序遍历森林的先序遍历=对应二叉树的先序遍历(2)树的后根遍历=对应二叉树的中序遍历森林的中序遍历=对应二叉树的中序遍历4.并查集用树(森林)的双...

2020-04-09 00:16:51 398

原创 数据结构知识点复习归纳(一)

第一章1.存储结构:顺序存储,链式存储,索引存储,散列存储2.逻辑结构:线性结构(线性表,栈,队列)非线性结构(树,图,集合)第二章.线性表1.线性表:除第一个元素外,每个元素有且仅有一个直接前驱。除最后一个元素外,每个元素有且仅有一个直接后继。2.顺序表:线性表的顺序存储(特点:逻辑上相邻的元素在物理位置上也相邻)支持随机访问3.单链表:线性表的链式存储4.引入头结点的好处(...

2020-04-07 00:35:41 370

原创 操作系统原理学习笔记(三)

7.3.5页面淘汰1.页面抖动:页面在内存和辅存之间频繁交换的现象“抖动”会导致系统效率下降2.最佳算法(OPT):淘汰以后不再需要或最远的将来才会用到的页面3.先进先出淘汰算法(FIFO算法)该算法存在异常现象(Belady现象),对于特定的访问序列,可能缺页率随着分配的页框数量增多而上升4.最久未使用淘汰算法(LRU):淘汰最长时间未使用的页面5.最不经常使用算法(LFU):淘汰...

2020-04-03 23:26:31 250

原创 leetcode 面试题62.圆圈中最后剩下的数字【O(n)复杂度的约瑟夫环】

题意:0,1,n-1这n个数字排成一个圆圈,从数字0开始,每次从这个圆圈里删除第m个数字。求出这个圆圈里剩下的最后一个数字。例如,0、1、2、3、4这5个数字组成一个圆圈,从数字0开始每次删除第3个数字,则删除的前4个数字依次是2、0、4、1,因此最后剩下的数字是3。class Solution {public: int lastRemaining(int n, int m) {...

2020-03-30 10:10:40 78

原创 操作系统学习笔记(二)

第四章 进程管理1.进程(1)程序在某个数据集合上的一次运行活动(2)特点动态性:是程序的一次执行过程,动态产生/消亡并发性:进程同其他进程一起向前推进异步性:进程按各自的速度向前推进独立性:进程是OS分配资源和调度CPU的单位(3) 进程是动态的:程序的一次执行过程 程序是静态的:一组指令的有序集合 进程在内存上暂时驻留...

2020-03-29 23:08:49 118

原创 操作系统学习笔记(一)

1.(1)开机时,进入rom bios映射区。rom bios映射区是通电时内存中唯一有代码的位置。(2)rom bios映射区的代码首先检查RAM,键盘,显示器,软硬磁盘。(3)然后将磁盘0磁道0扇区读入0x7c00处0磁道0扇区是操作系统的引导扇区(512字节),是开机后第一段可控制的程序(4)设置CS=0x07c0,IP=0x0000即开始执行OS引导扇区的指令...

2020-03-28 13:19:08 517

原创 MongoDB学习记录

主要记录一些常用的指令,方便以后查阅1.启动一个CMD窗口:mongod --dbpath g:\data\db另一个 :mongo.exe2.数据库show dbs 显示数据库db 显示当前使用的数据库use DB_NAME 切换到名为DB_NAME的数据库,若该数据库不存在,则创建相应数据库db.dropDatabase() 删除当前使用的数据库注意,只有向新建的数...

2020-03-27 15:11:02 52

原创 计算机网络学习笔记(五)(运输层)

1.各层提供的服务数据链路层:在相邻两节点之间实现数据帧的透明传输网络层:将分组从源节点传送到目的节点运输层:为应用进程提供端到端的逻辑通信,进行差错检测注意:IP协议是主机到主机,TCP/UDP协议是端到端2.复用与分用(运输层)复用:不同进程的报文通过不同端口交给运输层,复用IP报文分用:分组到达接收端的运输层后,使用分用交给不同端口所对应的进程3.TCP(1)TCP连接的端...

2020-03-26 22:47:42 113

原创 计算机网络学习笔记(四)(网络层)

1.服务的可靠与连接的关系(1)可靠是指数据没有丢失、损坏或重复;采用应答来实现,即可靠/不可靠可用有/无应答来区分。(2)面向连接本质是保证数据的顺序传送;特征是数据传送必须经过建立连接、传送数据和拆除连接三个阶段。2.IP地址注:路由器有多个MAC地址和IP地址3.IP地址与MAC地址(物理地址)物理地址:数据链路层和物理层使用的地址IP地址:网络层和以上各层使用...

2020-03-25 23:00:37 159

原创 计算机网络学习笔记(三)(数据链路层)

1.数据链路层传送的数据单位:(数据)帧物理层间传输的是比特流物理媒体上传送的是 电或光信号2.组帧:在网络层的IP数据报前后添加首部和尾部,使接收方能准确识别帧的边界3.差错控制:发现差错后如何处理(1)前向纠错:即发送方发送能使接收方检错并纠错的冗余位,纠错任务由接收方完成;常采用海明码。(2)自动重发请求:即发送方发送能使接收方检错的冗余位,若无差错,则接收方回送一个肯定应答(A...

2020-03-25 13:27:21 744

原创 计算机网络学习笔记(二)(物理层)

数字信号:连续变化的电压波形模拟信号:表示“0”和“1”的电脉冲“模拟的”——连续变化的“数字的”——取值是离散值调制——数字信号到模拟信号解调——模拟信号到数字信号2.常见指标信号传输速率(波特率):每秒发送码元数目,单位波特。1波特=每秒传送1个码元理想低通信道:信号的所有低频分量,只要频率不超过某个上限,都能不失真地通过信道理想带通信道:信号频率在范围F1~F2之间的...

2020-03-23 23:06:12 117

原创 计算机网络学习笔记(一)

1.通信方式分为:CS和P2P2.路由器是实现分组交换的关键构件,任务是转发收到的分组3.电路交换(1)面向连接(2)通信双方占据固定传输带宽,数据传输效率低4.分组交换(1)采用存储转发技术(2)先将报文划分为较短的、固定长度的数据段每段前加上首部构成分组(3)以分组作为数据传输单元5.路由器处理分组过程:(1)收到的分组放入缓存(2)查找转发表,找出到某个目的地址应从哪...

2020-03-23 21:06:56 124

原创 计算机网络视频学习笔记

一.传输层1.socket:位于应用层与传输层之间的接口2.多路分用:(接收端)传输层依据头部信息将报文段(segment)交给正确的socket,从而到达正确的进程(位于应用层)多路复用:(发送端)从多个socket接受数据,为每个数据封装头部信息,生成报文段(segment),交给网络层。3.传输层:负责不同进程之间通信网络层:负责不同主机之间通信...

2020-03-23 11:15:46 99

原创 《算法笔记》学习记录(二)[C++STL]

6.1vector(1).迭代器vector<int>vi;vi.push_back(3);vi.push_back(4);vector<int>::iterator it=vi.begin(); //定义迭代器,使用*it访问vector中元素printf("%d ",*(it+1) //输出vi[1](2).vi.begin() //数组首元素地址v...

2020-03-06 19:55:22 78

原创 PTA甲级做题记录

4.4贪心1.A1038 (贪心策略:若A+B<B+A,则字符串A一定要在B之前,根据此原则sort,要用string类去除前导零)4.5二分1.A1085 (二分答案,需要用到long long)(也可以直接upper_bound,返回第一个大于X的元素的指针)2.A1044 (二分答案,也可直接lower_bound)4.6two pointers1.A1085 (给一...

2020-03-01 23:20:52 239

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除