自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(338)
  • 收藏
  • 关注

原创 一文讲清chatGPT的发展历程、能力来源和复现它的关键之处

chatGPT是什么?这可能是最近被问的最多的一个。大家第一反应这应该是GPT系列的一个最新模型,普通大众可能更愿意把它看做是一个人工智能。实际上,它其实就是一个基于大规模语言模型的对话系统产品。官网对它定义十分的明确:Optimizing Language Models for Dialogue.最大的问题在于,它的背后究竟是一个什么?很多人都以为,chatGPT是一个单一模型,就如同GPT-1/2一样,应该是一个可以被加载和训练的。

2023-02-12 16:46:16 36049 19

原创 [ChatGPT为你支招]如何提高博客的质量,找到写作方向,保持动力,增加粉丝数?

作为一个博主,您可能会面临很多挑战,比如如何提高博客的质量,如何找到自己的写作方向,如何保持持续写作的动力,以及如何增加博客的粉丝数量。在这篇文章中,我们将为您提供一些有用的建议,帮助您解决这些问题,让您的博客更加精彩。

2022-12-10 10:22:28 2311 1

原创 chatGPT与世界杯的故事:人工智能的双重面对

(本文是 CSDN 的世界杯征文)在本文中,我们将借助chatGPT的智慧,一起探究世界杯与人工智能之间的关系,并展望人工智能在体育领域的应用。同时,我们也将思考人工智能如何影响着我们的生活,以及我们对人工智能的看法。标题:我的第一次踢球:从紧张到自信的旅程2002年的夏天,我第一次拿起了足球。一开始,我非常紧张。我手心汗湿,拿着球的时候我都害怕掉了。我不知道怎么踢,所以我就踢了一脚脚后跟。球从我的脚尖飞了出去,没有任何力量。我感觉自己很笨,也很沮丧。但是,我并没有放弃。我继续练习,一次又一次地踢球。慢慢

2022-12-07 12:14:43 11326 37

原创 科研论文撰写相关工具一条龙服务指南

我们科研论文撰写过程需要很多注意的部分,例如,选择撰写平台、latex的图表的设计和制作,为自己的模型起一个名字,英文写作,还有参考文献的搜集和整理,以及适合的投稿会议候选等。本文将一条龙的介绍下去,保证科研论文撰写中遇到的主要困难都能够得到很好的解决。

2021-11-30 18:23:56 816 1

原创 增加你的生产力!VS Code程序员鼓励师插件,你值得拥有!

1. 前言前几日,我们还在红警优美的代码中沉醉,最近这几天,我们又发现宝了!一个鼓励你写代码的插件!它声称可以在你写代码的时候,给你鼓励,伴你前行!它具体是个什么东西呢?我们先来看看一个第三方的评价吧:简而言之,就是能根据代码关键词,播放贴近代码意义的语音,在你编程的过程中,疯狂输出赞美。真的是,萝莉音程序员鼓励师24小时在线,陪你 coding 到天明。内置中文语音包采用真人语音,支持 JavaScript 语言的常用关键字(支持到 ES6 版本)。不仅如此,还有专门针对时间的语音。比如连

2020-06-22 15:51:43 25448 66

原创 惊艳于红警开源代码?赏心悦目的代码注释,我们也可以 !

这几天,红警1的开源代码重现江湖,这个20年前,甚至25年前的代码,被我们所有的后来者所惊叹,这才是一个艺术品一般的存在。那么如果我们也想写出如此优美的代码,应该注意的事项有哪些?本文将讲述3个编码时需要注意的部分,并着重讲解如何编写出规范的代码注释并加以利用。

2020-06-10 13:55:45 33194 52

原创 看一次就会的python正则表达式的使用指南

前言正则表达式作为一名合格的程序员的必备的基本技术之一,其有用性不言而喻。但是它为什么会非常难以掌握,甚至想用一用也都感觉难以下手呢?本文将会让你一次就看会如何使用Python正则表达式。1. 正则表达式的组成在介绍如何使用Python的正则表达式时,我们需要先认识一下正则表达式的各种功能,以及其组成形式如何。正则表达式可以从非结构化的文本中提取到我们想要的内容,其本质为模式匹配,也是体现...

2020-03-06 22:31:11 11346 21

原创 3年长跑,修成正果

文章目录相遇相识相知相恋相守我和CSDN的故事很短,只有6个字:“人生若如初见”;我和CSDN的故事很长,我要用一生去讲。相遇2014年,我在计算机科学与技术这个曾经“万金油”的苦海里苦苦挣扎时,偶然间遇到了CSDN。无论什么问题,她都会耐心的解答。我需要什么材料,她都能给我帮助。在专业领域中,我感觉到她什么都知道。她的亲切、温柔、耐心、博学,还有她的美丽,让我一见钟情。我自认为自己幸运,...

2019-10-12 21:25:28 2576 27

转载 一文看懂25个神经网络模型

1. 引言在深度学习十分火热的今天,不时会涌现出各种新型的人工神经网络,想要实时了解这些新型神经网络的架构还真是不容易。光是知道各式各样的神经网络模型缩写(如:DCIGN、BiLSTM、DCGAN……还有哪些?),就已经让人招架不住了。因此,这里整理出一份清单来梳理所有这些架构。其中大部分是人工神经网络,也有一些完全不同的怪物。尽管所有这些架构都各不相同、功能独特,当我在画它们的节点图时……其中潜在

2017-06-17 10:26:08 243356 22

原创 段落向量与句子向量表达

这是Tomas Mikolov的一篇关于段落向量和句子向量的论文。本文是我翻译加自我理解的结果,如需要更详细的介绍,请看英文文献。摘要许多机器翻译的算法都需要使用固定长度的词向量特征。在到达文本层面时,我我们最常用的一个固定长度的特征时词袋模型。尽管他们很流行,但是词袋模型有两大缺点:1、失去了词序特征;2、忽略了语义特征,例如,powerful与strong和Paris距离都是非常远的。在本文中,

2017-05-20 17:08:27 28240 20

原创 查询slurm集群各个节点的运行情况

slurm系统是一个集群,它原生的使用方式可以参考《有时候我们想知道我们能申请哪些节点,以及各个节点的使用情况。原生的指令大概有这两个,一个是使用squeue的方式列举出当前的工作列表。而另一个则是sinfo。这两个命令给出的内容十分有限。即使借鉴一些参数让给出的参数多一些,也最多能像教程里给出的那样。如果我们想要下面这样清楚的显示整个集群的使用情况,该怎么操作呢?

2024-01-05 09:51:07 594

原创 Dependency Dialogue Acts — Annotation Scheme and Case Study [论文解读]

在本文中,我们介绍了依存对话行为(Dependency Dialog Act, DDA),这是一个新颖的框架,旨在捕捉多方对话中说话者意图的结构。DDA结合并适应了现有对话标注框架的特点,并强调了对话的多关系响应结构,除了对话行为和修辞关系。它表示了多方多线程对话中的功能性、话语性和响应结构。DDA与现有的对话标注框架(如SWBD-DAMSL和ISO24617-2标准)相比有几个关键特点。首先,DDA优先考虑对话单元的关系结构和对话上下文,将对话行为和修辞关系都标注为特定话语的响应关系。

2024-01-04 20:30:08 407

原创 【年终总结】2024,三十而立!

2023年是一个非常激荡的一年。在这一年里,大家都在找新的节奏和方向,我也还在不断学习过程中。严格意义上,今年算是一个转型时期吧,人生还早,世界还没有探索完整,如果2024年,我仍然无法安定下来,那我希望,三十岁应该立着的旗杆,将会插在我探索世界的船上,与我一同前往,那些未知的区域。你问我害不害怕,我当然害怕。但是,人生又何尝不是一个更长的旅行呢?我们没有机会拒绝,也无法拒绝。

2023-12-31 00:13:42 909

原创 使用FastChat部署Baichuan2

近来,大型语言模型的市场需求呈现出蓬勃发展的态势。然而,仅仅掌握模型的数据准备和训练是不够的,模型的部署方法也变得至关重要。在这篇文章中,我们将以Baichuan2为例,利用FastChat进行模型部署的实战操作。

2023-09-24 15:13:58 1453

原创 手把手教你微调GPT-3.5 Turbo[8.22新特性]

3天前,OpenAI公布了一个新特性,那就是宣布用户可以自定义微调GPT-3.5 Turbo了。这意味着什么呢?这就意味着很多任务都可以先拿GPT-3.5 Turbo进行一个微调作为基准系统了。但是,需要注意的是,这里能够微调GPT-3.5 Turbo应该和之前能够微调GPT-3使用的是相似的技术,也就是参数高效的微调,不然每个用户光保存模型大小,即使是传言中的10B左右的模型,也是很难做到的。那么什么场景比较适合它呢?

2023-08-26 00:00:18 1108

原创 EM Pre-training for Multi-party Dialogue Response Generation [论文解读]

对话回应生成要求代理根据当前的对话历史生成回应,这方面双方对话已经有了很多研究,但同时也给多方对话留下了很大的空白。与双方对话不同的是,在多方场景中,在生成回应之前需要指定回应话语的收信人。由于存在大量的双方对话数据,已经提出了各种用于双方对话回应生成的预训练语言模型。然而,由于多方对话数据集中缺乏注释的收信人标签,很难将它们用于为多方对话预训练回应生成模型。为了克服这个障碍,我们提出了一种期望最大化(EM)方法,通过迭代执行期望步骤生成收信人标签,并进行最大化步骤来优化回应生成模型。

2023-08-24 14:52:08 131

原创 NaturalConv: A Chinese Dialogue Dataset Towards Multi-turn Topic-driven Conversation [论文解读]

在这篇论文中,我们提出了一个中文多轮主题驱动对话数据集——NaturalConv,参与者可以自由聊天,只要话题中的任何一个元素被提及且话题转换平滑。我们的语料库包含来自六个领域的19.9K个对话和400K个话语,平均每轮对话有20.1个话语。这些对话包含了对相关话题的深入讨论,或者多个话题之间的自然过渡。我们认为这两种方式在人类对话中都是正常的。为了促进对该语料库的研究,我们提供了几个基准模型的结果。比较结果显示,在这个数据集上,通过引入背景知识/话题,我们目前的模型无法提供显著的改进。

2023-08-22 22:30:19 183

原创 RPTCS: A Reinforced Persona-aware Topic-guiding Conversational System [论文解读]

虽然关于开放领域对话系统的研究已经很多,但大部分缺乏控制对话中概念转换的机制。对于从随意闲聊切换到任务导向对话等活动,一个具备管理对话中概念流程能力的代理人可能会很有帮助。如果在进行概念转换时考虑到用户的个性,用户会发现对话更加有趣和吸引人,并且更容易接受这种转换。针对个性感知的概念转换,我们提出了一种强化个性感知主题引导对话系统(RPTCS)。由于缺乏个性感知主题转换数据集,我们提出了一种新颖的对话数据集创建机制,其中对话代理人根据说话者的个性和对话的上下文引导话语漂移到一组目标概念。

2023-08-22 15:46:32 50

原创 香港中文大学(深圳)李海洲/王本友教授招收大模型方向的博士生(2023Fall/2024Spring&Fall),研究助理和博后

香港中文大学(深圳)是一所经国家教育部批准,传承香港中文大学的办学理念和学术体系的大学。目前,来自世界各地的8000多名优秀学子正在港中大(深圳)求学。经过九年的发展,大学学科建设已逐步完善,已面向全球招聘引进了400 余名国际知名优秀学者和研究人员,其中包括诺贝尔奖得主 5名,图灵奖得主 2 名,菲尔兹奖 1 名,各国院士近 30 名(其中全职 10名),国家级特聘专家近 60 名,ACM/IEEE 等协会会士近 40名。目前引进的教师 100%具有在国际一流高校执教或研究工作经验。

2023-07-17 19:40:15 1031

原创 Flask or FastAPI? Python服务端初体验

最近由于工作需要,又去了解了一下简单的python服务搭建的相关工作,主要是为了自己开发的模型或者工具给同组的人使用。之前介绍的针对于数据科学研究比较友好的一个可以展示的前端框架Streamlit可以说是一个利器。不过,随着ChatGPT的流行,基于chat的服务越来越多了起来,streamlit有一个chat衍生物,但是它能提供的只是一个简单的聊天功能,并不能具有更高级显示,例如支持markdown和流式输出等。因此,更加适合大模型前端的可能是更好的选择。

2023-05-28 21:48:16 2607

原创 大规模语言模型微调技术——Instruction和Question的区别和联系

在ChatGPT的时代,每个人都能够轻松使用这一强大的语言模型。这一切的实现速度比我之前所想象的要快得多。这得益于大规模语言模型微调技术,其实并没有引入太多新颖的元素。特别是有了ChatGPT作为引路人,许多事情变得更加容易和简单。尤其是借助LLaMA开源项目为基础,许多模型都是以LLaMA作为基座模型,并通过微调特定的指令数据集来实现与ChatGPT的对齐。

2023-05-18 16:32:24 2625

原创 关于人工智能的25部电影[休闲工作两不误]

希望大家在五一期间都能过的开心愉快,特地整理了25部关于人工智能的电影用于休闲时候观看。一方面能够享受科幻电影带来的放松,另一方面,也许未来的人工智能的研究和发展就会受到这些电影的启发。下面是按照剧情中人工智能发展的阶段进行的划分,需要注意的是,剧情中可能存在多个层次的人工智能并存的局面。

2023-05-03 18:32:46 1731

原创 自己再造一个大规模预训练语言模型?可以的

自ChatGPT发布至今已近半年,一路走来,我们可以清楚地看到的一个趋势是,到了下半年,每位研究者都会拥有一个类似ChatGPT的模型。这种现象与当年BERT推出后,各种BERT变体层出不穷的情况颇为相似。实际上,我认为,这次ChatGPT的浪潮依然是一次技术迭代更新,不断推动我们迈向最终的AI目标。而之所以如此轰动,则是因为OpenAI只做了一个每个人都可以访问的网页,让大众体会到了最先进的科技水平。那么,我们能否自己再造一个大规模预训练语言模型呢?回答是肯定的。

2023-04-08 00:46:29 839

原创 看过近百份简历后,才悟到简历应该怎么写【以申请硕博为例】

撰写一份出色的硕博申请简历并不容易。通过精心准备简历,展示你的专业实力、实践经验和独特个性,你将在众多申请者中脱颖而出。提前准备:简历撰写是一个长期的过程,建议你提前开始整理自己的经历和成果。这样,你在申请季到来时就能迅速完成简历,避免临时抱佛脚。多版本简历:根据不同的项目和学校,可能需要准备多个版本的简历。针对每个申请目标,精心调整简历内容和结构,确保简历具有针对性。跟进申请进度:在递交简历后,及时跟进申请进度。与招生办或导师保持沟通,了解录取情况,以便及时调整申请策略。自信心态。

2023-03-19 18:01:06 1280

原创 NLP以后还要研究些什么?

如今,随着NLP技术的迅速发展,越来越多的人开始关注这个领域的研究。然而,自从ChatGPT出来以后,我已经被问了N次了:“我们还能研究什么呢?”本文将从多个方面探讨这个问题,并分享一些关于未来NLP研究方向的拙见。

2023-03-17 14:50:48 441

原创 任务栏中的windows资源管理器点开后显示该文件没有与之关联的应用来执行该操作

然后我尝试了许多方法,包括网上搜的还是问AI模型的,大概尝试了几十种不同的方法后(丝毫没有夸张,因为我尝试解决了很多次),包括但是不限于修改windows默认程序、注册表修改、用户权限修改、用户/组策略修改、甚至是bash命令、reg命令等等都用过了,但是仍然没有效果。这是一个非常可怕的事情,一个非常常见的问题,但是却没有一个有效的解决方案,这说明,我遇到的问题是非典型的。但是下面一个用户的评论引起了我的关注,他说,没有解决我的问题,我认为应该是CLSID的映射出现了问题。顺着这个思路,我终于找到了一篇。

2023-02-18 21:11:56 2219 8

原创 与写代码相关的工具,你知道第几层?

我们一直以为,写代码就是一个很简单的事情,也许就是打开一个文本文件,然后在上面写一些代码就可以了。这种说法对于小白和大佬都是适用的,尤其是借助舌尖上的中国的话语:“高端的食材,往往只需最朴素的烹饪方式”一样。我们曾经开玩笑说,对于大神级写代码的人,可能只需要01两个按钮即可(其实这恰恰是计算机在做的事情,难道程序员的尽头是计算机?但是,作为普通人,我们可能需要一些特定的工具来帮助我们进行代码的编写,按照需求层次,可以分为5层,看看你知道第几层。

2023-02-02 10:31:27 425

原创 提交python代码到仓库前,一定要做这3件事

话说,一个程序员成长最快的时候,就是在看别人代码的时候,不仅可以帮别人看出错误,也能够从优秀的代码中获得成长。今天,我要说的是提交python代码到仓库前,一定要做这3件事。他们能够帮助大家规范代码,在提交到github上的时候更加清晰和易维护。

2023-01-29 22:34:24 423

原创 [Ubuntu]安装Docker简单指南

由于业务需要,又亲自上手在服务器上安装了Docker,并且需要使用GPU显卡。简单来说,就需要3个步骤,安装Docker Engine,然后将用户加入到Docker组里。如果有需要GPU的,需要安装nvidia-container-toolkit。(需要注意的是,以下操作均需要root权限,普通用户无法安装Docker)。

2023-01-29 21:47:20 4216 1

原创 ChatGPT可以做些什么?[ChatGPT已探索的143个功能分类]

ChatGPT的强大我们已经不用再去强调了,我们现在可能缺少的是对ChatGPT能做什么和怎么做的一个大致了解。下面,请让我和ChatGPT一起,为你去解读目前和分类,具体如何使用和所有的英文描述,请参见原仓库。

2023-01-26 19:25:11 25798 2

原创 计算机科学与技术专业学什么?为什么要学数据结构、操作系统、计算机组成原理和计算机网络?

计算机科学与技术专业学什么?这可能是很多人非常好奇的事情。在2023年,我的第一篇博客将会从自身的本硕博三代“计算机科学与技术”专业出身的经历,自我介绍一下计算机科学与技术专业最少要学什么。计算机科学与技术是一个一级学科的定义,代号为0812,实际上就是表明与计算机最相关的专业要么是它要么就隶属于它。就学科包含范围的广泛性和与计算机本身的相关性而言,它是计算机大类中的正统专业,当然还有一个兄弟专业叫做软件工程(0836),是一个新的一级学科分支。如果说,计算机科学与技术需要学习的最小范畴是什么?

2023-01-01 15:38:53 2136

原创 NLP到底现在在研究些什么?从ACL2023投稿领域及细分领域看一看

我们经常会被外行人问到,现在自然语言处理到底在研究些什么啊?也经常会被内行人问到,你是做NLP的吗?你是做哪个方向的?正好借ACL的调查问卷,梳理一下NLP现在到底都在研究些什么。

2022-12-29 19:49:19 2520 1

原创 [年终总结] 2023,希望一切都能够好起来

正如我之前所说的,在2012年之前,我接受了12年的基础教育,而2012年之后,我则接受了10年的高等教育。前面12年是让我成人,后10年是让我成才。而在接下来的10年,应该是让我能够稳定发挥,奉献社会的最好的时光,每一年我都会倍加珍惜,过好每一天。无论是春夏秋冬,还是晴阴风雨,我都希望在每一天,我都能够有所收获,有所感悟。有人喜欢安稳的生活,有人对未知的未来感觉到恐惧、彷徨、迷茫。我也是如此。

2022-12-29 15:19:39 2088 3

原创 chatGPT教你设计模式[3] ——创建型模式(单例模式、建造者模式和原型模式)

在上一篇博客中,我们已经介绍了创建者模式的最主要的部分:工厂模式及其变种。本篇博客将继续介绍创建者模式的其他三种模式:单例模式、建造者模式和原型模式。这三种模式都用于控制对象的创建过程,但是它们使用了不同的方法。单例模式确保某个类只有一个实例,建造者模式提供了一种分离复杂对象的构建过程和它的表示的方式的方法,而原型模式允许在运行时动态地创建新的对象副本。在本篇博客中,我们将深入探究这三种模式,了解它们的优缺点和使用场景,并通过示例代码加深理解。

2022-12-25 21:47:22 1104

原创 chatGPT教你设计模式[2] ——创建型模式(工厂模式)

在软件开发中,我们经常需要创建对象来封装数据和实现业务逻辑。然而,如果直接在代码中使用 new 关键字来创建对象,会使得代码的耦合度增加,系统的可扩展性和可维护性降低。这时,工厂模式就派上用场了。工厂模式是软件设计模式中最常用的创建型模式之一,它提供了一种创建对象的最佳方式。工厂模式可以将对象的创建和使用分离开来,使得代码更加灵活,并且提高了系统的可扩展性和可维护性。在工厂模式中,我们通常有三种实现方式:简单工厂模式、抽象工厂模式和工厂方法模式。

2022-12-23 23:06:30 1782

原创 chatGPT教你设计模式[1] ——设计模式介绍和分类

在编程领域,设计模式是一种经过验证的、可复用的解决方案,用于解决常见的设计问题。它们不是某一种特定的编程语言的语法,而是一种抽象的解决方案,可以在多种不同的编程语言中应用。设计模式有助于程序员快速解决设计问题,并且能够使软件系统更加稳定、可扩展。

2022-12-23 22:31:58 1945

原创 [streamlit]数据科学科研工作者的神器,必须要推荐一下

做科研当然要有过硬的专业知识,但是也少不了一些辅助,才能最大程度发挥我们的能力。因此,除去我们模型性能优秀,结果良好以外,如何进行一个好的展示,也是非常有必要的。那么今天,我们就隆重介绍,这个几乎可以替代掉Flask作为构建demo首选的。(这次不是chatGPT了,毕竟chatGPT只会描述,不会感受。)

2022-12-20 21:08:21 1291 1

原创 职场中最想听到的一句话是什么?

对于已经工作10年以上的中层领导来说,最爱听到的一句话可能是“你的工作为公司带来了巨大的贡献,我们对你的领导能力和专业知识十分信赖”。而作为对别人说话的人,我们也应该认真思考,如何用一句话,去肯定别人,去欣赏别人,去信任别人,从而让别人感到自己是受尊敬的。这样的公式可以指导我们在对别人说话的时候,避免言过其实,避免虚假恭维,而是着重表扬别人的优秀品质和成就,从而让别人感到自己是受尊敬的。总的来说,我们最想听到的一句话应该是一句表扬性的话,它应该表明我们的工作得到了认可,同时也表示公司对我们的贡献感到欣赏。

2022-12-14 09:40:04 594

原创 只会玩ChatGPT?惊艳我们的又不只是它一个对话系统

终于回归到本尊开始上手了。这次是介绍了几个和ChatGPT一样强大或者基于GPT系列的新鲜对话系统,各有优劣和长处吧。大家感兴趣的话可以自己搜索一下,这里仅做简要介绍。

2022-12-11 10:51:29 1029

原创 chatGPT教你算法(6)——贪心算法

在计算机科学中,贪心算法是一种用来解决多阶段决策最优化问题的算法。它的名字来源于贪婪策略,即每一步都选择当前看来是最优的选择,而不考虑未来的影响。这种算法的优点在于它的简单性和速度,能够快速找到满意解。本文将介绍贪心算法在解决覆盖问题和最小生成树问题中的应用。首先,我们将简要介绍贪心算法的基本概念,然后探讨它在解决这两种问题时的具体做法。最后,我们将简要介绍一些贪心算法的局限性,并提供一些可能的解决方案。贪心算法是一种在每一步选择中都采取在当前状态下最优(即最有利)的选择,从而希望导致结果是最优的算法。贪心

2022-12-11 09:00:00 1195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除