自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(294)
  • 资源 (5871)
  • 收藏
  • 关注

原创 人工智能|推荐系统——工业界的推荐系统之交叉

SENet 对离散特征做field-wise加权,如果有𝑚 个fields,那么权重向量是𝑚 维。FiBiNet可以理解为同时考虑了SENet 结合 Field 间特征交叉。之前提到过的召回、排序模型中的神经网络可以用任意网络结构;LHUC起源于语⾳识别,快⼿将LHUC应⽤在推荐精排,称作PPNet。深度交叉网络就是两个分支,一边是全连接,一边是交叉网络。线性模型预测是特征的加权和。交叉网络就是多个交叉层串起来的网络。可以通过矩阵分解减少模型参数量。Field 间特征交叉。

2024-05-06 10:16:41 80 3

原创 人工智能|推荐系统——工业界的推荐系统之排序

完播率通常和视频时长有关,不能直接把预估的完播率⽤到融分公式。训练时通常会遇到类别不平衡问题,可以考虑做采样。多目标有多个预估分数就可以有不同融合方式。进一步考虑对多个神经网络的输出进行加权。可以通过dropout的方式来解决极化。预测概率和实际是否交互求交叉熵损失。多目标模型就是要预测多个目标。几个专家就是放几个神经网络。视频完播用回归或分类都可以。通常做个调整再用到融分公式。双塔模型牺牲准确性换计算量。可以通过校准公式进行校准。精排模型的线上推理代价大。回顾一下推荐系统的链路。可能会出现极化的现象。

2024-05-06 09:36:10 199

原创 人工智能|推荐系统——工业界的推荐系统之召回

离散特征可以用Embedding Layers,连续特征可以归一化、分桶等处理。Swing额外考虑重合的⽤户是否来⾃⼀个⼩圈⼦,两个⽤户重合度⼤,则可能来⾃⼀个⼩圈⼦,权重降低。简单负样本可以是全体物品(考虑非均匀采样打压热门物品)或者Batch内负样本。⽤户兴趣动态变化,⽽物品特征相对稳定,事先存储物品向量𝐛,线上现算⽤户向量𝐚。困难负样本主要考虑被召回,但是被排序淘汰的样本。一个物品的两个向量可以通过一些特征变换得到。⽤索引,离线计算量⼤,线上计算量⼩。正样本的选择需要考虑冷门、热门物品。

2024-05-04 10:26:54 296

原创 人工智能|推荐系统——工业界的推荐系统之概要

但是随机分桶的问题在于无法做多个实验,因此通常考虑分层实验,同层互斥就是做的分桶,不同层正交可以避免不同实验之间的干扰,就可以做无数组实验。实验推全是逐步将新推荐策略应用到所有用户的过程,而反转实验是通过将部分用户回退到旧策略来评估新策略的有效性。粗排、精排会考虑用户特征、物品特征、统计特征来建模,同时考虑多个消费指标,然后得到一个最终的排序分数。通常会考虑用户的一些消费指标。

2024-05-02 23:41:55 179

原创 科研学习|研究方法——小波相干分析在时间序列分析中的应用

在某些情况下,两个时间序列中的共同行为是由一个时间序列驱动或影响另一个时间序列引起的,对于联合平稳时间序列,用于表征时间或频率相关行为的方法通常是互相关、(傅立叶)互谱和相干性。然而,时间序列通常是非平稳的,即它们的频率内容会随着时间而变化,对于这些时间序列,重要的是时频平面中的相关性或相干性。因此可以使用小波相干性来检测非平稳信号中常见的时间局部振荡,且在将一个时间序列视为影响另一个时间序列的情况下,可以使用小波交叉谱的相位来识别两个时间序列之间的相对滞后。

2024-04-28 16:03:34 1079 1

原创 科研学习|论文解读——CVPR 2021 人脸造假检测(论文合集)

deepfake的人脸伪造技术在互联网上广泛传播,并引起了严重的社会关注。近年来,如何检测此类伪造内容已成为一个研究热点,并提出了许多深度伪造检测方法。其中,大多数将深度伪造检测建模为普通的二元分类问题,即首先使用骨干网络提取全局特征,然后将其输入二元分类器(real/fake)。但由于这个任务中,真实图像和虚假图像之间的差异通常是微妙和局部的,我们认为这种香草解决方案不是最优的。在本文中,我们将深度伪造检测描述为一个细粒度的分类问题,并提出了一种新的多注意力深度伪造检测网络。

2024-04-28 15:42:39 715

原创 人工智能|推荐系统——推荐系统经典模型YouTubeDNN

我们可以把召回模型的结构分为三层。输入层:输入层总共有四种特征。用户看过视频的 Embedding(embedded video watches)用户搜索的关键词的 Embedding 向量(embedded search tokens)用户所在的地理位置的特征(geographic embedding)适用于冷启动用户基本特征(example age, gender)

2024-04-27 22:11:16 572

原创 人工智能|推荐系统——推荐大模型最新进展

Embedding 已成为表示关于实体、概念和关联的复杂的信息的关键手段,并以简洁且有用的格式呈现。然而,它们通常难以直接进行解释。尽管下游任务利用这些压缩表示,但要进行有意义的解释通常需要使用降维或专门的机器学习可解释性方法进行可视化。本文解决了使这些嵌入更具解释性和广泛实用性的挑战,通过利用大语言模型(LLMs)直接与嵌入进行交互,将抽象向量转化为可理解的叙述。通过将嵌入注入LLMs,我们使复杂的嵌入数据可以进行查询和探索。

2024-04-27 21:56:52 967

原创 人工智能|深度学习——多模态条件机制 Cross Attention 原理及实现

虽然之前写过 Attention 的文章,但现在回头看之前写的一些文章,感觉都好啰嗦,正好下一篇要写的 Stable Diffusion 中有 cross-attention,索性就再单拎出来简单说一下 Attention 吧,那么这篇文章的作用有两个:第一是为 Stable Diffusion 做补充,第二是为后续的 Vision Transformer 和 Swin Transformer 做铺垫。

2024-04-25 10:40:17 912

原创 科研学习|论文解读——交叉注意力融合2024经典论文(配套模块和代码)

多模态学习和注意力机制是当前深度学习研究的热点领域之一,而,具有很大的发展空间和创新机会。作为多模态融合的一个重要组成部分,交叉注意力融合通过注意力机制在不同模块之间建立联系,促进信息的交流和整合,从而提升了模型处理复杂任务的能力,展现出其在多模态学习和聚类分析等领域的强大优势。本文盘点交叉注意力融合相关的13个技术成果,包含2024年最新的研究,这些模块的来源文章以及代码我都整理了,希望能给各位的论文添砖加瓦。

2024-04-25 10:21:39 910

原创 心理学|变态心理学&健康心理学——躯体疾病患者的一般心理特点

患者除了内部器官有器质或功能障碍外,他们的自我感觉和整个精神状态也会发生变化。使人改变对周围事物的感受和态度,也可以改变患者对自身存在价值的态度。这种主观态度的改变,可以使患者把自己置于人际关系中的特殊位置上(好像已经或将要被人群抛弃)。

2024-04-22 16:28:47 224

原创 人工智能|tensorflow2.0框架——在TensorFlow2.0中使用TensorFlow1.0的代码

使用import tensorflow.compat.v1 as tf来导入TensorFlow 1.x的兼容性模块,并通过tf.disable_v2_behavior()来禁用TensorFlow 2.0的行为。

2024-04-21 16:53:20 99

原创 科研学习|论文解读——大模型综述!一文带你理清全球AI巨头的大模型进化史

大模型必然是未来很长一段时间我们工作生活的一部分,而对于这样一个与我们生活高度同频互动的“大家伙”,除了性能、效率、成本等问题外,大规模语言模型的安全问题几乎是大模型所面对的所有挑战之中的重中之重,机器幻觉是大模型目前还没有极佳解决方案的主要问题,大模型输出的有偏差或有害的幻觉将会对使用者造成严重后果。同时,随着 LLMs 的“公信度”越来越高,用户可能会过度依赖 LLMs 并相信它们能够提供准确的信息,这点可以预见的趋势增加了大模型的安全风险。除了误导性信息外,

2024-04-21 16:39:19 661

原创 科研学习|科研软件——如何使用SmartPLS软件进行结构方程建模

SmartPLS是一种用于结构方程建模(SEM)的软件,它可以用于定量研究,尤其是在商业和社会科学领域中,如市场研究、管理研究、心理学研究等。

2024-04-14 22:47:43 479 1

原创 人工智能|机器学习——基于机器学习的信用卡办卡意愿模型预测项目

通过本项目,我们使用了机器学习模型预测了客户的信用卡办卡意愿,并通过Django实现了数据的可视化展示。这使得银行和金融机构能够更好地理解客户行为模式,并做出相应的业务决策。

2024-04-13 22:12:09 537 1

原创 科研学习|可视化——Origin绘制相关性系数矩阵

Origin2021版本。

2024-04-12 23:19:42 590

原创 科研学习|可视化——相关性结果的可视化

常用于度量两个或多个变量之间相关程度的有:如何把这些关联特征表达得更易于理解,那就需要借助将的方法了。在平时的论文阅读中我们经常看到有关相关性分析的内容,作者们根据自己的表达需求,也向我们展示了五花八门的绘图样式,比如:散点图、拟合线、相关矩阵(热力图)、相关性空间分布图等。接下来详细向大家介绍这些图表的特点。

2024-04-11 22:44:56 1298 1

原创 科研学习|论文解读——基于旅游知识图谱的游客偏好挖掘和决策支持(IPM,2023)

目前,旅游管理研究的重点是通过对异构用户生成的内容进行广泛分析,来理解旅游偏好的波动,制定有针对性的发展策略。然而,鉴于在线景点评论涉及过多的混合和无形维度,广泛使用的无监督文本挖掘可能是不完整的或不准确的。此外,现有文献通常局限于几个旅游目的地和起源地的某些类型的景点,很难保证具有全面的洞察力。为了克服这些局限性,本研究提出了一种新的知识图谱驱动框架,该框架涉及旅游知识图谱(TKG)的系统构建和深入的研究与推理。

2024-04-10 21:48:56 1170

原创 科研学习|研究方法——定性数据的定量编码方法

数据可以根据不同的属性和特征进行分类。除了上述常见的数据分类方式,还可以根据数据的结构、性质和用途等进行更详细的分类,例如结构化数据、半结构化数据和非结构化数据等。今天我们要讨论的内容是--分类型数据:表示为不同的类别或标签,通常用于描述某个事物的属性或特征。例如性别、学历、职业等。即定性数据或者叫属性数据。

2024-04-09 22:25:39 871 1

原创 科研学习|研究方法——扎根理论三阶段编码如何做?

主题标引”意指对文献内容进行分析, 然后对文献所表达的中心思想、所讨论的基本问题以及研究的对象等进行提取, 以形成主题概念, 然后在此基础上把可检索的主题词表示出来, 再将这些主题词按一定顺序 (如字顺) 排列, 对论述相同主题内容的文献加以集中, 从而提高文献的查全率与查准率。而在主题标引的过程中, 主题词的提取是非常关键的步骤之一, 但目前国内对主题词提取的相关实践, 一方面较偏重主题词的词义本身, 忽略主题词之间可能存在某种相互链接的“关系”;

2024-04-07 22:45:52 1482 1

原创 科研学习|科研软件——SPSS统计作图教程:多组折线图(≥3个变量)

研究者想研究45-65岁不同性别人群中静坐时长和血胆固醇水平的关系,分别招募50名男性和女性(gender)询问其每天静坐时长(time,分钟),并检测其血液中胆固醇水平(cholesterol, mmol/L),部分数据如图1。研究者该如何绘图展示这两者间的关系呢?

2024-04-07 10:52:03 727 1

原创 环境配置——python代码打包超详细教程

网上的文章对小白都不太友好呀,讲得都比较高大上,本文章就用最简单的方式来教会大家如何打包。既然各位已经学习到了python打包了, 深适度应该跟我查不多。1. 这个插件只能打包 mac 、win系统运行的文件,也就是打出来的包,只能在这两个系统中运行,在 mac系统打包则能在mac中运行, 在win中打包则能在win中运行。

2024-04-06 23:26:24 1002 2

原创 环境配置——OSError:无法在路径上找到 Ghostscript

本文介绍了OSError:无法在路径上找到 Ghostscript的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

2024-04-06 23:12:57 389

原创 人工智能|深度学习——基于Xception实现戴口罩人脸表情识别

Xception是Google公司继Inception后提出的对 Inception-v3 的另一种改进。作者认为,通道之间的相关性与空间相关性最好要分开处理。于是采用 Separable Convolution来替换原来 Inception-v3中的卷积操作。传统卷积的实现过程:Depthwise Separable Convolution 的实现过程:深度可分离卷积 Depthwise Separable Convolution。

2024-04-03 13:52:33 1004 2

原创 人工智能|深度学习——基于Xception算法模型实现一个图像分类识别系统

在计算机视觉领域,图像识别是一个非常重要的任务,其应用涵盖了人脸识别、物体检测、场景理解等众多领域。随着深度学习技术的发展,深度卷积神经网络(Convolutional Neural Networks,简称CNN)在图像识别任务上取得了巨大成功,其中Xception算法作为一种改进型CNN,被广泛应用于图像分类和特征提取任务。本章节将重点介绍Xception算法的背景、原理及其在图像识别系统中的应用。

2024-04-02 23:03:05 1053 1

原创 环境配置——已解决ModuleNotFoundError: No module named ‘cv2’(python)

在网上搜到不少用Python处理图形的代码,于是复制别人的代码直接运行却报错,得到的结果却是:已解决ModuleNotFoundError: No module named ‘cv2’。

2024-04-01 15:56:34 389 1

原创 科研学习|论文解读——情感对感知偶然信息遭遇的影响研究(JASIST,2022)

图片及其相关的文本信息是。

2024-03-31 21:16:33 1024

原创 编程语言|C语言——C语言操作符的详细解释

这篇文章主要详细介绍了C语言的操作符,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧。

2024-03-30 15:51:41 743

原创 编程语言|C语言——数组与指针

同一类型的变量——元素(element)集中在一起,在内存上排列成一条直线,这就是数组(array)。

2024-03-29 11:52:49 982

原创 人工智能|推荐系统——搜索引擎广告

随着人工智能应用的日益广泛,搜索引擎供应商越来越多地要求广告商使用基于机器学习的自动竞价策略。这样的自动决策系统让广告商对所使用的数据以及它们如何影响决策过程的结果一无所知。以前关于人工智能的文献缺乏对与人工智能系统相关的危险及其缺乏透明度的理解。针对这一问题,本文研究了搜索引擎广告中广告主竞价策略自动优化的内在风险。因此,所选服务公司的实证案例说明了数据可用性如何引发广告绩效的长期下降,以及搜索引擎广告绩效指标在数据稀缺事件前后的发展情况。

2024-03-29 11:04:42 1383

原创 编程语言|C语言——C语言变量的存储方式

变量是程序中数据的存储空间的抽象。变量的存储方式可分为静态存储和动态存储两种。静态存储变量通常是在程序编译时就分配一定的存储空间并一直保持不变,直至整个程序结束。在上一部分中介绍的全局变量的存储方式即属于此类存储方式。动态存储变量是在程序执行过程中使用它时才分配存储单元,使用完毕立即释放。典型的例子是函数的形参。在函数定义时并不给形参分配存储单元,只是在函数被调用时,才予以分配,调用函数完毕立即释放。如果一个函数被多次调用,则反复地分配、释放形参变量的存储单元。

2024-03-27 14:41:50 954

原创 编程语言|C语言——C语言基本数据类型

针对不同的数据,采取不同的存储方式和进行不同的处理。随着处理对象的复杂化,数据类型也要变得更丰富。数据类型的丰富程度直接反映了程序设计语言处理数据的能力。C语言很重要的一个特点是它的数据类型十分丰富。因此,C语言程序数据处理功能很强。

2024-03-27 14:14:03 1029 1

原创 编程语言|C语言——C语言标识符的命名规则

2.2 标识符中只能包含英文大小写字母、下划线和阿拉伯数字,但是不能以阿拉伯数字开头。2.3 标识符区分大小写,Acd和acd、caDd和cadd、_8Fc9和_8fc9都是不相同的标识符。2.5 ANSI标准规定,标识符可以为任意长度,但外部名1 必须至少能由前6个字符唯一地区分,并且不区分大小写。这是因为某些编译程序(如IBM PC的MS C)仅能识别前6个字符。2.6 除了这些硬性规则外,标识符的命名最好具有具体的意义,以便于观察、阅读和维护。可以改写为:

2024-03-26 16:26:01 514

原创 编程语言|C语言——C语言实现玫瑰花(情人节)

在古希腊神话中,玫瑰花集爱与美于一身,既是美神的化身,又溶进了爱神的血液,所以它所代表的含义是爱情。我们应该用玫瑰花来表达我们的爱意,但是好多的恋人都是因为异地而没有办法去买一束新鲜的玫瑰去送给自己的爱人。女孩子需要的只是一个态度而已,所以!我们男孩子要发挥自己的理性脑瓜来准备一份特殊的玫瑰何乐而不为呢!so!接下来让我们用代码的方式亲手送出自己的那一份爱!❤。

2024-03-26 16:17:30 790

原创 科研学习|论文解读——这取决于你什么时候搜索(MIS Quarterly,2022)

互联网搜索已被证明对股票价格、公司销售和疫情传播具有强大的预测能力。在研究提出搜索频率作为投资者关注的更直接和及时的衡量指标之后,我们探索了搜索数据的异质性,并解决了当前文献中的几个问题。使用来自谷歌的标准普尔500股票的每日搜索量指数(SVI),我们将周末的互联网搜索量与工作日的互联网搜索区分开来,发现周末搜索可以更好地捕捉到散户投资者的注意力。首先,我们发现市场对周五财报反应减弱只发生在周末搜索量(注意力的一个代表)低的时候,为这一众说纷纭的现象给出了解释。

2024-03-24 20:31:32 990

原创 科研学习|论文解读——真实与综合:研究设置和任务配置对搜索行为的影响(JASIST,2021)

在信息检索和检索研究中,研究者经常收集用户行为数据来预测任务特征,为用户提供个性化信息提供参考。数据采集方法可能会直接影响到用户行为的可靠性。本文描述了一项混合方法的研究,检查研究环境的影响labsetting(实验室环境vs远程设置)和任务的真实性authentictask(真实的任务vs模拟任务)对用户的在线浏览和搜索行为。36名本科生参与者完成了一个实验实验和一个远程实验,其中他们完成了一个真实的和一个模拟的任务,共从144个任务会话中收集到了日志数据。本研究表明,

2024-03-23 21:56:31 696

原创 科研学习|论文解读——通过调查实验了解公民对政府财政信息的认知(GIQ,2022)

州和地方政府定期向公众披露财务信息,以便公开承认政府当前的财务状况。此类披露的目的是实现问责制并让公民了解政府的财务决策。背景)尽管在努力提高金融信息的可访问性和可读性,但我们不知道公民是否以及如何处理金融信息。(背景存在问题)本研究调查了在呈现不同的财务信息时,公民如何评估政府的财务状况。我们进行了一项在线调查实验,以了解披露的财务信息如何影响公民对政府财政压力的感知水平以及他们对政府增收战略的态度。(方法内容)我们发现公民优先考虑他们熟悉的财务指标,例如债务和盈余比率。

2024-03-22 12:42:32 663 1

原创 科研学习|论文解读——“我们最珍贵的财产”:将弗洛里迪的信息隐私概念应用于信息行为和信息素养模型(JASIST,2020)

这篇概念性文章根据卢西亚诺·弗洛里迪 (Luciano Floridi) 的信息和信息伦理哲学,论证了数字信息环境中隐私方法的价值。这种方法可用于修改信息行为和信息素养的模型,使它们更全面,更有效地覆盖信息领域的隐私问题。

2024-03-20 14:21:00 649 1

原创 科研学习|论文解读——产品评论:好处、负担还是小事?卖家声誉如何影响产品评论的作用?( MIS Quarterly,2021)

对于声誉良好的卖家,消费者心目会产生较高的期望值。因此,如果卖家销售的产品获得负面评价,对消费者来说是一种冲击。这种负面的预期可能会向消费者传达产品质量差的强烈信号,进而降低销售额。而如果卖家销售的产品获得正面评价,消费者可能会将一致的信息视为简单的确认他们的期望。因此,正面评价并不能显著提高高声誉卖家的产品销售。如果高声誉和正面评论之间没有明确的区别,消费者可能不会对正面产品评论中呈现的新信息留下太多印象。因此,正面评价可能不会显著提高高声誉卖家的产品销售。

2024-03-20 13:58:09 720

原创 科研学习|研究方法——实验法

今天我们说物理学、生物学是实验的科学,应该不会有人再持异议了,然而连物理学这样的学科在历史上也并非一开始就是实验科学。在2000多年以前的亚里士多德时代,众人都认为物理学是非实验性质的,物理学成为实验科学是从伽利略开始的,此前的物理学只能算是哲学的一个分支,多数只是对亚里士多德的著作做诠释,称不上是实验科学。例如:亚里士多德认为物体在自由下落时重的比轻的落得更快些,长久以来从直观感觉出发,世人对此一直深信不疑。※但是伽利略通过在比萨斜塔上做的自由落体的实验。

2024-03-19 21:07:59 954 1

这个项目是基于论文YOLO9000 Better, Faster, Stronger的keras

人工智能-深度学习-Xception

2024-04-03

一个人类可以阅读的基于Keras的代注意力机制的序列到序列的框架模型.zip

人工智能-深度学习-Xception

2024-04-03

通过Keras实现基于RNN与LSTM的藏头诗自动生成模型, 并将生成的古诗翻译成英文.zip

人工智能-深度学习-Xception

2024-04-03

通过cv处理验证码图片,基于TensorFlow2.0 keras 训练识别验证码模型.zip

人工智能-深度学习-Xception

2024-04-03

使用keras实现的基于Bi-LSTM + CRF的中文分词+词性标注.zip

人工智能-深度学习-Xception

2024-04-03

神经风格迁移——基于keras实现(VGG19).zip

人工智能-深度学习-Xception

2024-04-03

模式识别期末项目-基于Keras的人物面部表情识别.zip

人工智能-深度学习-Xception

2024-04-03

基于tensorflow2.0中的keras进行中文的文本分类,实验数据为中文新闻分类文本cnews数据集.zip

人工智能-深度学习-Xception

2024-04-03

基于Python的自然语言处理 on nltk、keras.zip

人工智能-深度学习-Xception

2024-04-03

基于Python+opencv+keras+numpy+sklearn的人脸识别门禁系统.zip

人工智能-深度学习-Xception

2024-04-03

基于keras使用dcgan自动生成动漫头像.zip

人工智能-深度学习-Xception

2024-04-03

基于keras实现的CycleGAN.zip

人工智能-深度学习-Xception

2024-04-03

基于keras实现的transformer.zip

人工智能-深度学习-Xception

2024-04-03

基于Keras实现seq2seq,进行英文到中文的翻译.zip

人工智能-深度学习-Xception

2024-04-03

基于Keras面部表情识别.zip

人工智能-深度学习-Xception

2024-04-03

基于keras集成多种图像分类模型: VGG16、VGG19、InceptionV3、Xception、MobileNet等

人工智能-深度学习-Xception

2024-04-03

基于Keras框架,结合LSTMGRUArimaWNN实现多方式的水质参数预测.zip

人工智能-深度学习-Xception

2024-04-03

基于keras的评论文本情感分类.zip

人工智能-深度学习-Xception

2024-04-03

基于keras和keras_bert的中文命名实体识别,搭建的网络为bert+bilstm_crf.zip

人工智能-深度学习-Xception

2024-04-03

基于Keras的LSTM多变量时间序列预测 (2).zip

人工智能-深度学习-Xception

2024-04-03

a state-of-the-art-level open visual language model - 多模态预训练模型

a state-of-the-art-level open visual language model | 多模态预训练模型 CogVLM是一个功能强大的开源视觉语言模型 (VLM)。 CogVLM-17B拥有100亿个视觉参数和70亿个语言参数,支持图像理解和多轮对话,分辨率为490*490。 CogVLM-17B 在 10 个经典跨模式基准测试中实现了最先进的性能,包括 NoCaps、Flicker30k 字幕、RefCOCO、RefCOCO+、RefCOCOg、Visual7W、GQA、ScienceQA、VizWiz VQA 和 TDIUC。 CogAgent是基于CogVLM改进的开源视觉语言模型。 CogAgent-18B拥有110亿个视觉参数和70亿个语言参数,支持1120*1120分辨率的图像理解。除了CogVLM的功能之外,它还具备GUI图像代理功能。 CogAgent-18B 在 9 个经典跨模态基准测试上实现了最先进的通用性能,包括 VQAv2、OK-VQ、TextVQA、ST-VQA、ChartQA、infoVQA、DocVQA、MM-Vet 和 POP

2024-04-26

CorrelationPlot.opx

CorrelationPlot.opx

2024-04-12

人工智能-Transformer-图像分类-基于Swin-transformer训练图像分类并部署web端

具体包含以下几个步骤: 1.加载预训练权重√ 2.图片数据集准备√ 3.训练√ 4.推理测试√ 5.新的数据增强调优 6.部署在web端√ 服务器端部署:运行flask_demo, 客户端测试:运行client.py 也可以使用postman测试服务器端

2024-04-09

人工智能-深度学习-基于Keras的双向Seq2Seq的多轮对话模型

基于Keras的双向Seq2Seq的多轮对话模型

2024-04-03

人工智能-深度学习-基于三国演义小说,使用tensorflow,keras构建语言模型,根据一段文本,预测新字和生成新文本

lm-LSTM 通过训练小说《三国演义》,对给定的文本,预测下一个汉字。 1.对训练数据ETL,生成<N个汉字,N+1汉字>方式; 2.进行独热(one-hot)编码; 3.使用LSTM训练 环境 python3.6 tensorflow1.9 模型训练 python lm_lstm.py

2024-04-03

人工智能-深度学习-使用yolov3-keras模型进行实时目标检测(基于Penn-Fudan Database行人数据集

使用yolov3_keras模型进行实时目标检测(基于Penn-Fudan Database行人数据集 使用方法: 通过以下命令将源项目克隆到本地工作目录 git clone https://github.com/qqwweee/keras-yolo3 下载此修改过的项目,复制到上面项目的文件夹,全部替换:是 把数据集更改成你要训练的数据集 keras-yolo3/VOCdevkit/VOC2007文件make_main_txt01.py脚本和根目录下voc_annotation02.py相继执行将xml转为voc要求的格式 config配置后执行traing

2024-04-03

自动驾驶之交通指示牌的识别,基于keras,支持GPU加速.zip

人工智能-深度学习-Xception

2024-04-03

自动驾驶之方向盘转动角度预测,基于keras,支持GPU加速.zip

人工智能-深度学习-Xception

2024-04-03

唐诗,藏头诗,按需自动生成古诗,基于Keras、LSTM-RNN。文档齐全.zip

人工智能-深度学习-Xception

2024-04-03

使用Flask+Keras部署的基于Xception神经网络的细胞图像AI医疗辅助识别系统(含简单前端demo).zip

人工智能-深度学习-Xception

2024-04-03

使用TensorFlow2.0中的Keras实现基于BiLSTM-CRF的NER.zip

人工智能-深度学习-Xception

2024-04-03

看图说话,基于keras,支持GPU。Image captioning code in keras, runs on GPU

人工智能-深度学习-Xception

2024-04-03

利用keras框架, 做基于LSTM或者GRU的音乐生成.zip

人工智能-深度学习-Xception

2024-04-03

基于tf.keras的多标签多分类模型.zip

人工智能-深度学习-Xception

2024-04-03

基于Python,使用Opencv+keras的实时手势识别系统.zip

人工智能-深度学习-Xception

2024-04-03

基于pyqt5和Keras图形化的手写识别小程序.zip

人工智能-深度学习-Xception

2024-04-03

基于Keras使用LSTM对电商评论进行情感分析.zip

人工智能-深度学习-Xception

2024-04-03

基于Keras实现Kaggle2013--Dogs vs. Cats12500张猫狗图像的精准分类.zip

人工智能-深度学习-Xception

2024-04-03

基于keras框架,用lstm解决回归和分类问题.zip

人工智能-深度学习-Xception

2024-04-03

基于keras的银行卡号识别.zip

人工智能-深度学习-Xception

2024-04-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除