- 博客(766)
- 资源 (7)
- 收藏
- 关注
原创 第21课:大语言模型的节奏与中小创业者的入局
从年初的ChatGPT3.5开始,到国内大厂大模型百花齐放,国产大模型已经达到113个,国产大模型发布持续高涨。但显然,上一周的明星,显然就是LLaMA2。LLama2 宣布开源,大模型一直在改写历史和创造历史,然后我也有一些自己的看法。
2023-07-30 11:20:07 220
原创 开篇词:大模型国内应用落地思考与实践
相信,使用过ChatGPT的人,在被ChatGPT表现出的惊人的能力所征服时,也对ChatGPT在某些场景下的落地感到痛苦。受限于地域、网络、数据安全和法律合规等限制,ChatGPT的使用,总有一种被别人卡脖子的感觉。所以,国内各行业、企业拥有自己的大模型和技术就显得非常有必要,也势在必行。
2023-07-16 11:24:58 590
原创 第20课:解决痛点|如何让ChatGPT记住指令并随时调用呢?
本节内容总结了在使用ChatGPT过程中,通过锚定词让ChatGPT帮助我们记住指令。但是上面提到的方法,非常局限,首先把prompt的管理转嫁为锚定词管理了,那如果一场聊天中有很多锚定词,锚定词的管理又成了一个新的痛点;其次,锚定词没法解决跨场次记住指令,如果有用户想记住过往使用的所有prompt呢?
2023-07-15 15:54:20 395
原创 第19课:让ChatGPT帮助我们做情感分析
本节内容,使用ChatGPT帮助我们完成情感分析的任务。在传统的自然语言处理(NLP)中,处理情感分析类问题,我们会转化成一个分类问题进行处理。先采用人工标注的方法,训练一个逻辑回归或者朴素贝叶斯模型,然后使用模型对未标注过的数据进行打分或者计算概率,通过这一值来判断是积极还是消极。例如:模型对新的数据返回一个0-1的概率值,小于0.5为消极,大于0.5为积极。在传统的NLP任务中,除了模型,特征工程对我们的准确率影响也非常大。不同的方法在解决不同问题时效果各异。
2023-07-15 11:47:27 314
原创 第18课:让ChatGPT帮助我们做数据分析
对于类似数据提取、写Excel公式、写SQL等重复性的体力劳动,使用ChatGPT便可以轻松辅助完成分析工作,我认为在未来,数据分析确实会像ChatGPT一样,持续进化。以上就是利用ChatGPT 写SQL的实例,本质就是把表的Schema告诉ChatGPT,并把你相同统计的问题也给过去,ChatGPT最后返回给你需要的SQL。中,我曾说过,对于任何行业、任何一个人来说,未来与数据打交道的频率和机会只会越来越多,参与的越来越深,而数据分析思维可以说是未来任何工作中最核心的竞争力之一。
2023-07-07 22:55:51 387
原创 第17课:论文《Is GPT-4 a Good Data Analyst?》介绍
前面我们学习了很多开发ChatGPT的方法和工具,接下来我们重点介绍如何在具体的场景中,把我们学到的知识落地,为业务和企业赋能。GPT-4替代初级数据分析师的成本只有0.71%,换成高级数据分析师则是0.45%……你没看错,是百分之零点七一,不是百分之七十一。这项结论来自阿里达摩院与新加坡南洋理工大学的新论文,被网友评价为对AI和数据分析领域感兴趣的必读论文。那我们就从这篇论文《Is GPT-4 a Good Data Analyst?》说起吧。
2023-07-02 15:01:01 169
原创 第16课:《ChatGPT提示工程》—— Chatbot(聊天机器人)
使用OpenAI的ChatGPT是一个非常强大的聊天机器人模型,它可以产生自然流畅的对话,并且可以通过简单的代码进行实现。如果你想使用ChatGPT构建自己的聊天机器人,可以先查看OpenAI的文档和示例代码,然后逐步进行调试和优化。
2023-05-01 21:43:57 365 1
原创 第15课:《ChatGPT提示工程》—— Expanding(扩展)
扩展可以让大模型生成更长的文本,模型可以根据输入的上下文和语法规则,生成与之相关的文本。在自然语言生成领域,扩展可以帮助生成更加自然、流畅的文本,同时增加文本的多样性和创造力。在文本摘要和机器翻译领域,扩展可以帮助生成更加准确、完整的摘要和翻译。总之,扩展是一种非常有用的自然语言处理技术,可以帮助我们生成更加优质和有用的文本。
2023-05-01 12:04:47 536
原创 第14课:《ChatGPT提示工程》——Transforming(转换)
大型语言模型是非常擅长将输入转换为不同的格式,例如将一种语言的文本输入并将其转换或翻译成另一种语言,或帮助进行拼写和语法纠正,因此将输入的文本可能并不完全符合语法,帮助您修复一下。还可以进行转换格式,例如输入 HTML 并输出 JSON。因此,过去我们使用大量正则表达式痛苦地编写的一系列应用程序现在肯定可以使用大型语言模型和一些提示更简单地实现。
2023-05-01 11:06:30 230
原创 第13课:《ChatGPT提示工程》—— Inferring(推断)
关于推断的内容,你可以构建多个关于文本推断的系统,而以前这可能需要一个熟练的机器学习开发者花费几天甚至几周的时间来完成。所以,我觉得这非常令人兴奋,对于熟练的机器学习开发者以及对机器学习较为陌生的人来说,现在你可以通过提示来快速构建并开始处理诸如这些相当复杂的自然语言处理任务。
2023-05-01 10:38:26 175
原创 第12课:《ChatGPT提示工程》—— Summarizing(概括)
语言模型的概括功能是一项非常有用的技术,可以帮助人们更加高效地处理文本信息。随着技术的不断进步,我们相信这种功能将在越来越多的应用中得到广泛的应用。就现阶段来说,语言模型生成的概述可能不是完美的,因为它仍然是一个正在不断学习的技术。但是,它提供了一个很好的起点,让你快速了解文章的主要内容。
2023-04-30 23:27:58 180
原创 第11课:《ChatGPT提示工程》—— Iterative(迭代)
Prompt开发是一个迭代的过程。尝试一些东西,看看它是否符合你的要求,然后考虑如何澄清你的指令,或者在某些情况下,考虑如何给它更多的空间来思考,以使它更接近你想要的结果。我认为成为一个有效的Prompt工程师的关键不在于知道完美的Prompt,而在于有一个好的开发Prompt的过程,以使它对你的应用程序有效。
2023-04-30 22:56:23 161
原创 第10课:《ChatGPT提示工程》—— Guidelines(入门)
你应该通过提供尽可能清晰和具体的说明来表达你想让模型做什么。这将引导模型朝着期望的输出方向,并减少得到无关或不正确响应的可能性。不要将写清晰的提示与写简短的提示混淆,因为在许多情况下,更长的提示实际上为模型提供了更多的清晰度和上下文,这可能会导致更详细和相关的输出。第二个原则是给模型时间思考。如果模型在急于得出错误的结论,导致了推理错误,那么你应该尝试重新构造查询,以请求一系列相关推理的链或序列,在模型提供最终答案之前。
2023-04-30 11:36:26 641
原创 第09课:《ChatGPT提示工程》—— Introduction(引言)
ChatGPT 上线至今,在实际应用中,不少人还没真正掌握它的使用技巧。ChatGPT 的难点,在于 Prompt(提示词)的编写,OpenAI 创始人在今年 2 月时,在 Twitter 上说:「能够出色编写 Prompt 跟聊天机器人对话,是一项能令人惊艳的高杠杆技能」。如何写好 Prompt 已经成为了一个分水岭。熟练掌握 Prompt 编写的人,能够很快让 ChatGPT 理解需求,并很好的执行任务。
2023-04-30 10:09:08 446
原创 第08课:Prompt Engineering——提问ChatGPT的艺术
提示工程(Prompt Engineering,也称为In-Context Prompting)指在不更新模型参数的前提下、通过输入文本等方法来操控大型语言模型(Large Language Model)以指导其行为、引导其生成我们需要的结果的方法。
2023-04-29 22:37:58 835
原创 第07课:Prompt Learning 新范式
预训练语言模型通常采用无监督学习的方式进行训练,即不需要标注数据,只需要将大量的文本数据输入模型中进行学习。预训练语言模型的训练过程通常包括两个阶段:第一阶段是通过大规模的无标注语料库训练一个语言模型,例如使用自编码器或者递归神经网络等模型进行训练;第二阶段则是通过有标注数据对已经训练好的语言模型进行微调,例如使用条件语言模型或者序列标注模型等。预训练语言模型的发展历程:NLP领域中的预训练思路可以一直追溯到word2vec的提出,word2vec的提出启发了后来的预训练语言模型的发展。
2023-04-29 16:52:52 195
原创 第6课:创投前沿《陆奇的大模型世界观》笔记
本文对《陆奇的大模型世界观》进行了重点内容的解读。时代在高速地进行,且速度越来越快,它是结构上决定的,势不可挡。我们面临这样的一个时代,像当年淘金时代一样,如果你那个时候去加州淘金,一大堆人会死掉,但是卖勺子、卖铲子的人永远可以赚钱。所谓的shove and pick business。
2023-04-29 13:24:32 376
原创 第05课:一文说透大模型
最近,有一个明显的感受,AI开始快速从感知职能向认知智能迈进了,也就是说,正从“能听、会说、会看”的感知智能,逐渐走向“能思考、能回答、能总结、能创作”的认知智能,甚至开始进行“决策和推理”了。
2023-04-28 23:05:28 537
原创 第04课:使用revChatGPT动手制作问答机器人
revChatGPT是acheong08/ChatGPT 项目提供了一个很好的 ChatGPT 接口。地址:https://github.com/acheong08/ChatGPT该项目是采用python开发的,目前项目在github上已经获取了23.4k的star数量。
2023-04-09 22:17:40 2605 3
原创 第02课:ChatGPT好玩的主流应用150+个(不断补充中)
本节内容主要给大家详细介绍了ChatGPT的注册,在经过一番注册体验之后,你会不会想在自己的项目中使用ChatGPT呢?ChatGPT平台已经为技术提供了一个入口,下一节课的内容,我将给大家介绍ChatGPT API的使用方法,帮助你在自己的项目中集成ChatGPT。
2023-04-09 11:51:29 2766
原创 第01课:一文说透ChatGPT是什么?
ChatGPT(全名:Chat Generative Pre-trained Transformer),由美国顶尖AI实验室OpenAI开发的一个人工智能聊天机器人程序,该程序使用基于GPT-3架构的大语言模型并通过强化学习进行训练,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频、脚本、文案、翻译、代码,写论文等任务。
2023-02-26 11:17:33 2912
原创 开篇词:我为什么要写这个专栏?
这个专栏,我整理和筛选出了国内关于GPT、ChatGPT等NLP领域的关键技术和信息,同时加入自己的思考和学习、工作非保密内容,希望能够帮助大家短时间内就对ChatGPT有一个认知全景图,适合所有对ChatGPT感兴趣的人。
2023-02-25 23:03:35 1176
原创 个人成长:2022年终记
2022年收获的最具价值的成语:周期。下面这些话,是我读到关于周期最好的解释。如果把视野拉长到三年以上,你就能隐约感受到经济的周期波动;如果把视野拉长到十年到三十年,你就能看到人口结构的变化、技术进步的影响、社会风气的演变、经济格局的调整;如果把视野拉长到五十年到一百年,你就能看到国家的兴衰、世界政治经济格局的调整、战争与和平的更迭;如果把视野拉长到数百年到数千年,你能看到文化的形成与沉淀、宗教的兴起与衰落;如果把视野拉长到数万年乃至数百万年,你就能看到进化的脉络、气候的轮回。
2022-12-26 14:50:06 242
原创 读书笔记:《心若菩提》 曹德旺
为什么要读这本书,是因为最近微信短视频频繁刷到关于曹德旺先生的视屏、语录和书,故找来电子版的快速阅读。本书记录非常详实,曹德旺先生一路创业的历程也是真实丰富、跌但起伏,能够给人一定的启发,不管是个人还是企业家,都要思考个人与组织、国家的关系,也要留心国家与国家之间的交往。大国崛起,既要我们踏实肯干,也要仰望星空。...
2022-06-25 14:25:22 792
原创 纳瓦尔宝典:不靠运气致富的原则
最近刚刚阅读了《纳瓦尔宝典》这本书,非常推荐大家阅读本书。下面,是我摘录的纳瓦尔在认识财富创造的原理一节中,所写下的信息密集、简洁有力,影响广泛和历久弥新的理念和原则。
2022-06-18 23:20:19 424 1
原创 拉开你和同龄人差距的100个顶级认知
年少的时候,我们会更容易看重某些显性优势,比如智力、口才,而之后会逐渐让位于思维、自律、耐心和踏实。复盘是我最近几年一直坚持的习惯之一,这个习惯给我带来了很多改变和收获,让我的工作得到了质的提升,生活也逐渐平衡、变得有序。清明放假的第二天,我对过去一段时间的工作和生活做了一次复盘,我发现最好的学习方法、个人迭代方法,都是费曼学习法。既把最重要的事情的原理讲给不同的人听,或者把自己处理过的最复杂、最具有挑战性的事情,用简单的语句把事情讲清楚,让别人都能理解,这非常考验功力。很显然,如果你思考问题的出发
2022-04-04 17:56:47 10475 6
原创 结束语:投递简历和选公司的策略
当我们有了数据分析的能力时,工作实践才是我们真正的战场,在真实的场景中,付出自己的时间来给企业创造价值,同时还可以获取高薪享受生活。无论此时的你是正在就读的学生,亦或转行想要成为数据分析师,都要经历面试这一关卡,本节的内容将有针对性的给出一些影响数据分析师求职的建议,帮助你在面试过程中查漏补缺。认识数据类岗位知彼知已,百战不殆。随着大数据技术的发展,数据类工作岗位在企业中愈发的重要,相应的数据类岗位对从业人员有了更高的要求,对应的岗位也更加分工明确和专业细化,常见的数据类岗位分工,如数据挖矿工程师、算
2022-02-27 08:00:00 353
原创 SQL实战篇:SQL优化问题
本节内容,讲一个非常重要的知识点,关于SQL的优化问题,很多数据分析师经常会遇到一个问题,一个简单的数据分析,明明只要花1-2分钟就可以完成,但是跑数却需要花费几十分钟到几小时不等,这个时候提升SQL的执行效率就显的格外重要。回顾SQL执行顺序首先回顾一下SQL的执行顺序。编写过程:SELECT DISTINCT < select_list >FROM < left_table > < join_type >JOIN < right_ta
2022-02-27 07:15:00 374
原创 SQL实战篇:SQL解决连续X天的问题
上一节内容,通过用户留存率的案例,讲解了解决近X天问题的思路,接下来,在本节内容来看看关于连续X天的问题,该类问题是面试和实际业务中经常需要解决的问题。首先对连续指标、做个定义,如下:1日连续:当日登录后,第二天也登录了,比如2021.2.10登录过,2021.2.11登录的算作1日连续 。3日连续:当日登录后,第二和三天也登录了,比如2021.2.10登录过,2021.2.11和2021.2.12登录的算作3日连续 。以此类推···现假设,有一张用户登录表t_user_login,字段use
2022-02-27 07:00:00 1012
原创 SQL实战篇:SQL解决近X天的问题
在面试和实际项目中,我们经常会遇到这样两类问题,即以时间为轴线,沿着时间轴分析过去一段时间的用户特征或者行为。一类是根据用户第一次访问的时间统计最近N天的行为特征,称之为近X天问题;另一类是根据用户第一次访问的时间统计连续N天的行为特征,称之为连续X天问题。下面,先讲下近X天问题的解决方法。一般在BI报表里面,关于用户分析时,用户留存是个不可缺少的分析,而业界比较成熟的判断标准就是计算一些具体的指标,包括计算用户次日、3日、7日、30日和90日的留存率。这些指标的通俗定义如下:次日留存:当日登录后
2022-02-27 06:45:00 420
原创 SQL实战篇:SQL窗口函数及真题
在数据分析师面试笔试过程中,窗口函数是各大公司笔试题中高频出现的知识点,因为在实际工作中,很多涉及到组内排名或求topN等相关的问题,都有一个共同的特点,实现起来不是简单的表连接或者聚合函数就可以完成,而是需要在单表中满足某些条件的记录集内部做一些函数操作。要解决此类问题,最便捷的就是使用窗口函数来轻松解决,可以说窗口函数是数据分析师必须熟练掌握的技能。什么是窗口函数窗口函数也称为OLAP函数。OLAP是Online Analytical Processing的简称,意思是对数据库数据进行实时分析处理
2022-02-27 06:30:00 433
原创 SQL实战篇:SQL行列转换及真题
对于数据分析师来说,日常进行SQL分析和制作报表的过程中,经常会遇到通过SQL进行行列转换的需求,本节内容对常见的行列转换进行了总结,常见的行列转换包括以下四种情况:列转行行转列列转换成字符串字符串转换成列下面内容将具体进行案例讲解。列转行首先,创建一张表学生表t_student。DROP TABLE IF EXISTS `t_student`;CREATE TABLE `t_student` ( `id` int(20) NOT NULL AUTO_INCREMENT COMME
2022-02-26 18:48:01 578
原创 SQL实战篇:SQL基础及执行顺序
对于数据分析师来说,不管什么行业,大多数岗位要求都需要熟练使用SQL,尤其在互联网行业要求更是严格,海量的数据存储在数据库中,不懂SQL就寸步难行,更何谈数据分析了,而写的一手好SQL,却可以让自己提升工作效率,看问题也更深入。关于数据库,目前市面上按存储类型,分成关系型数据库、非关系数据库和NOSQL等,而在实际业务中,关系型数据库占绝大多数,故下面重点介绍和总结关于关系型数据库的SQL相关的知识,并以Mysql为例。SQL基础知识关于数据库相关的知识点,详细总结如下图所示:下面根据数据分析师的
2022-02-26 18:47:35 446
原创 业务专题篇:AB测试实验设计与评估
A/B测试已经成为互联网领域最常见的定量试验与数据收集方式,也是产品、运营和数据分析师的必备能力。对于互联网公司来说,A/B测试是一种有效的精细化运营手段,过去很多依靠经验的粗放式策略管理,通过A/B测试改变为可量化的精准决策。A/B测试是一种通过已有客观指标,通过对比不同分组方案来衡量哪种效果最佳的方法。它的优势在于能够在“真实的线上环境中”,通过部分或者少量用户验证不同的方案。例如,在对产品进行A/B测试时,我们可以为同一个优化目标(提升支付率)制定两个方案,让一部分用户使用A方案,另一部分用户使用
2022-02-26 18:41:02 1882
原创 业务专题篇:用户增长分析
最近几年,随着人口红利逐渐消失,越来越的行业和领域开始重视用户增长,而增长黑客这一概念也开始被普遍提及,甚至很多招聘网站专门出现关于增长黑客的招聘信息。什么是增长黑客增长黑客起源于美国硅谷,指通过数据分析的手段来实现用户增长的过程,具体过程是以数据为导向,通过对渠道数据、用户使用行为数据和活动推广等数据进行分析,发现存在的问题和新的增长点,并通过结果指标进行量化。在《精益数据分析》一书中,对于增长黑客的结果指标,总结为可执行指标和虚荣指标。可执行指标:指的是能够反映真实效果和指导具体行动的指标,比如
2022-02-26 18:40:17 1005
原创 业务专题篇:渠道流量分析
随着中国互联网发展到一个新的阶段,最近几年,我们我们经常听到圈内有人说人口红利消失了,流量枯竭了,这其实表明了一个问题,就是互联网存量用户已经接近天花板,获客男和获客成本高,已经成为用户增长乏力的不争事实。互联网圈又是一个马太效应非常强的圈子,强者恒强、弱者越弱,优质的渠道和流量都被头部互联网企业所占据,中小企业能够分到的流量越来越少,越来越贵。在这种情况下,很多企业产品渠道营销和推广正面临这前所未有的挑战,如何提升渠道质量,如果提高流量转化率直接关系到渠道ROI指标,而数据分析师正是通过对渠道流量的系
2022-02-26 18:39:41 1434
原创 业务专题篇:用户使用路径分析
用户使用路径分析,也称为用户行为路径分析,是互联网产品数据分析的重要分析模型,下面我们开始本篇的内容。产品用户路径迭代体验下面,我们以国内两款被大家经常使用的APP为例,来看看随行业变化和用户使用习惯的变化,引起APP自己本身产品迭代,以及不同领域产品对用户使用路径变化的趋势。先看看支付宝,自上线以来,从单一的定位网络支付,到目前核心功能已经发生巨大的变化,目前主要集中在理财、首付款和出行。如上图所示,左侧是2017年支付宝顶部导航和2020年导航的变化,随着支付宝功能模块越来越多,且想占领出行领
2022-02-26 18:38:54 879
JAVA码头船只出行及配套货柜码放管理系统的设计与实现
2022-12-02
基于Java的银行排号系统的设计与实现
2022-12-02
Linux时间同步方式和操作方式
2022-11-30
SMO算法学习最好的资料
2022-11-30
利用机器学习预测2022年的世界杯冠军
2022-11-30
企业级大数据平台CDH详细搭建过程
2022-11-28
中文自然语言处理中文分词训练语料
2018-07-02
提问的艺术-让 ChatGPT 导出高质量答案.pdf
2023-04-29
JAVA健康管理系统
2022-12-02
JAVA医院管理住院系统的研究与实现
2022-12-02
基于JAVA的医院在线挂号
2022-12-02
JAVA银行柜员业务绩效考核系统的设计与实现
2022-12-02
JAVA酒店管理系统的设计与实现
2022-12-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人