- 博客(9)
- 收藏
- 关注
原创 Datawhale 动手学大模型应用开发 第六章第七章笔记 迭代优化prompt / 大模型评估 / 项目结构 / Gradio&FastAPI
Datawhale 动手学大模型应用开发 第六章第七章笔记 迭代优化prompt / 大模型评估 / 项目结构 / Gradio&FastAPI
2023-11-23 23:30:02 165
原创 Datawhale 动手学大模型应用开发 第四五章笔记 向量数据库 / Prompt / 检索chain / 记忆
Datawhale 动手学大模型应用开发 第四五章笔记 向量数据库 / Prompt / 检索chain / 记忆
2023-11-21 21:42:24 137
原创 吃瓜教程ch5 神经网络
第五章 神经网络这章内容比较少神经元x:接受n个输入,用权重向量对这个n输入加权。然后和阈值做比较。最后通过一个激活函数(非线性函数)输出x。激活函数:最好是连续可导的函数,方便优化。最好还要简单,提高网络计算效率。激活函数最好还拥有挤压性质,以免数值爆炸,而且只用至少一个拥有挤压性质的激活函数是【通用近似定理】的三个条件之一。感知机:激活函数为sgn, 损失函数为误分类点到平面的“距离”(忽略分母的距离),学习算法是SGD,向着梯度反方向优化:∂ wTx∂ w=x\frac{
2022-05-29 22:54:51 57
原创 吃瓜教程ch3线性模型
1.当标签yyy和特征向量x\boldsymbol xx,似乎具有线性关系yi≈w^Tx^iy_i \approx \hat{\boldsymbol{w}}^{\mathrm{T}} \hat{\boldsymbol{x}}_{i}yi≈w^Tx^i时(前后二者相近),此时就可以从(线性关系假设空间)中通过最小二乘法估计,得到最合适的w^\hat{\boldsymbol{w}}w^。PS:最小二乘估计得到的w 与 假定噪音ε符合正态分布时去最大化 样本的似然函数得到的w。所以二者是等价的。2.求w和
2022-05-22 23:27:05 118
原创 吃瓜教程第一第二章
第一章 绪论1. 基本知识这些数据集将被用来训练或者测试模型,训练模型的过程被称为学习,测试模型的过程被称为测试。模型学习到的数据与结果之间的潜在规律被称为假设,所有可能的规律的集合被称为假设空间,而客观世界中,数据与结果的真实规律被称为真相(ground-truth)学习任务可以被分为两类有监督学习,其中有分类,回归。无监督学习,其中有聚类。当模型预测的数值为离散值时,这种学习任务被称为分类;当模型预测的数值为连续值时,这种学习任务被称为回归;将无标签的样本各自依据相似度,分别聚成一个个小群
2022-05-17 20:17:05 256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人