Debroon-CSDN博客

原创从电子病历（EMRs）构建医学知识图谱

在本研究中，通过使用中国一家三甲医院的大数据平台，我们构建了一个复杂的医学知识图谱，这个图谱不仅包含多种医学实体类型，还采用了四元组结构代替了传统的三元组结构，以提供更丰富的信息和关系表示。本研究通过使用大规模的数据和先进的分析技术，构建了一个能够全面反映糖尿病及其相关条件的知识图谱，这在以往的研究中是很少见的。在之前的研究中，构建糖尿病相关的知识图谱通常只利用了少量的数据，比如特定的医学文献或者小规模的病例记录。在这些四元组中，第四元素提供了关于关系的额外信息，如症状出现的频率或治疗的具体适应症。

2024-04-13 12:04:03 721

原创 PrimeKG：为精准医学分析设计的多模态知识图谱

PrimeKG是为精确医学研究专门设计的一个知识图谱，它集成了来自20个高质量数据源的信息，涵盖17,080种疾病和超过400万种数据关系。这些关系包括了疾病与蛋白质变化、生物过程、身体结构功能以及药物治疗作用等多个层面。与其他知识图谱不同的是，PrimeKG特别强调了包括药物的适应症、禁忌症和非标签用途等通常缺失的药物-疾病关系。

2024-04-13 10:04:02 691

原创 RCTKG：针对用户的罕见病临床试验知识图谱

RCTKG的规模和内容节点和边：知识图谱中有2,216,062个节点和8,437,108条边。节点代表数据点，比如临床试验、疾病等；边则代表节点之间的连接或关系。罕见病与临床试验的关联：这个图谱包含了2,086种被称为GARD的罕见病，这些疾病与一个或多个临床试验有关联。如何使用RCTKG通过编程方式，研究人员可以从这个知识图谱中提取关于临床试验的信息，这支持了罕见病的研究和治疗方法的开发。知识图谱的完善状态当前状态。

2024-04-13 09:21:33 663

原创 PBXAI：将疾病预测转为沿知识图谱的随机游走

表格展示了每种预测疾病的概率以及相应的转移概率，例如，患者从现在的高血压、糖尿病、肥胖、贫血状态，预测未来可能继续患有高血压（自循环概率0.88）、糖尿病（自循环概率0.81）、贫血（自循环概率0.87）；然后，一个数学对象沿着知识图谱行走，从一个患者实体开始行走，该实体根据患者当前的疾病或者风险因素连接知识图谱，停止在疾病的实体，数学对象的生成轨迹表示患者的疾病发展路径，对象的行走策略由强化学习模块控制，该模块由电子健康记录数据训练。这个图展示的是一个算法的伪代码，具体是疾病预测和路径推理的算法。

2024-04-12 17:30:41 789

原创怎么构建医学临床知识图谱?

因此，面对一个具体的患者，医生可能会选择一个基于个人偏好而不是最佳证据的治疗方案，这可能不是最优的选择，从而影响治疗效果和患者的长期健康。临床知识图谱不仅作为一个信息的整合者，还充当了一个智能的推理工具，它能够基于现有的知识和数据生成新的假设和见解，帮助找到新的治疗方法。然后，CKG还考虑了张阿姨的生活方式，提出了一系列个性化的饮食建议和运动计划，这些都是专门为她的情况量身定制的。最后，CKG分析了这种新药物可能的副作用和张阿姨目前正在服用的药物之间的交互作用，以确保新方案的安全性。

2024-04-11 14:58:49 584

原创用临床知识图谱 + 医学文本向量库，设计一个医疗诊断系统

两大类深度学习模型，分别用于不同的自然语言处理（NLP）任务：词嵌入模型是一类用于将单词、短语或者文档转换为向量形式的模型。这些向量捕捉了单词之间的语义关系，如相似性或上下文关联。例如，text2vec、M3E等模型能够将文本中的每个单词映射到一个高维空间中的点，这个点的位置与单词的语义密切相关。通过这种方式，模型能够理解和处理自然语言，为诸如文本分类、情感分析等任务提供基础。举个例子：在词嵌入模型中，"king"和"queen"这两个词虽然是不同的，但它们在向量空间中的位置会非常接近，因为它们有着相似的上

2024-04-09 17:30:46 1004

原创【中文医疗词嵌入模型】SMedBERT：结构化知识图谱 + 混合注意力机制 + 提及-邻居上下文建模

然后，图中显示了从知识图谱中提取的邻近实体信息，如“呼吸感染”（respiratory infection）、“发热”（fever）、“呼吸综合症”（respiratory syndrome）和“肺炎”（pneumonia），它们都与“新型冠状病毒”（novel coronavirus）相关联。两个知识图谱中的三元组数量分别是1,007,818和3,764,711。在训练语料中的每一个提及（如“糖尿病”），都与知识图谱中的实体集合E相对应，并形成实体和关系的三元组（S），比如（糖尿病，关联，心脏疾病）。

2024-04-09 15:42:58 990

原创秘塔 AI 搜索：颠覆搜索的常态体验，强大+惊艳

相比之下，微软的new bing就是单纯的“搜索+ai”，很多时候还没有传统搜索引擎好用，但是这样的搜索方式，依然能让new bing访问量上升了15.8%。给出的内容不亚于一篇专业的测评，而且还综合了其他博主的评测，让你知道最全面的消息，不知道你看了这个之后，还有没有所谓的“信息差”的概念，这是完全透明了。传统搜索引擎的结果是平铺的、零散的，需要我们自己去梳理，慢慢形成脉络，找到自己想要的信息或学到自己想学的知识。比如，今天是 4.8 号，ta引用了4.7号的数据，刚发的婚姻司法解释，这真的牛逼了。

2024-04-08 15:00:04 3261

原创男人圣经 9

我渴望的，是无可匹敌的力量——力量到让每一个与我交谈的人都带着求助的目光，而不是我向他们伸出求助之手。很多女人找有钱男人的思维方式是——他买房买车、负责一起生活、负责我的大额开销，然后我自己在外面工作，我的钱都是我的，他的钱都花给家里（相当于花给我）。我所想的，是财富的极致——不仅仅满足于基本的生活需求，而是富有到能够支撑我所有的梦想和追求，这关乎我所渴望的力量、自由和尊重。我追求的，是绝对的成功——不仅仅是微小的成就，而是让我站在世界的顶峰，拥有无数的仰慕者，远远超出普通人的羡慕和认可。

2024-04-07 21:18:15 916 7

原创 MiLP：低秩适应和贝叶斯优化，实现个性化的大模型响应生成

图2展示了MiLP方法的工作流程。描述了LLM的多层结构，包含添加和标准化（Add & Norm）、前馈（Feed Forward）和多头注意力（Multi-Head Attention）部分。每一层中都包含了用于记忆注入的低秩适应（LoRA）模块，这些模块由W_A和W_B矩阵组成。这部分展示了对LLM进行调整的可能配置。例如，决定在LLM的哪些层插入LoRA模块（通过二进制参数α控制），以及LoRA模块的数量和低秩大小（r）。

2024-04-05 17:30:41 717

原创 LongVLM：让大模型解读长视频 SOTA 的方法

这种结合局部和全局信息的策略，使得LongVLM能够实现对长视频内容的精细理解和响应生成，克服了现有方法在处理长视频时细节理解不足的问题。将长视频分解为短期片段，对每个片段应用令牌合并模块，生成紧凑的片段级特征，这些特征按顺序连接，显式保留短期片段在长视频中的时间顺序。不同于依赖全局语义进行长视频理解的传统方法，LongVLM提供了一种直接且有效的方法，用于实现长期视频中的精细级别理解。LongVLM的提出有效地解决了长视频理解的挑战，其结合局部和全局信息的策略为视频内容理解领域提供了新的视角和方法。

2024-04-05 17:09:06 1275

原创一点点金融 5

高成交密度区域表明该价格区间内有强烈的买卖意愿和大量的交易，而低成交密度区域则可能预示着价格的快速移动，因为较少的交易就能推动价格突破。以时间为单位的成交密度反映在特定时间内的交易活跃程度，而以价格区间为单位的成交密度则展示了在特定价格水平上的交易积聚情况。通过以上步骤，投资者利用对市场行为和价格波动背后深层次原因的理解，结合基本面分析和技术分析，实施了一套综合的交易策略。：左侧的趋势展示了一个总体向上的移动，其中包含了一个临时的下跌或“回撤”，由虚线标示。这种回撤是短暂的，并不意味着整体趋势方向的改变。

2024-04-05 10:41:56 1299

原创一点点金融 4

要找到股市里真正靠谱的"弹簧板"和"天花板"，就看在大事发生前，是不是有一大波人突然疯狂买卖，不管是价格不动还是突然直线下降或飙升，这就是大家默契的信号，表示这个价格很关键。在这个阶段，椰子的价格可能会因为各种预测和传言而出现波动，但总体上可能呈现出横盘的趋势，因为市场参与者都在等待这个关键事件的结果，以此作为做出买卖决策的依据。但如果某一天，你跳不过这个低高度了，就好比股价跌破了弹簧板，说明情况不妙，可能你累了或者有什么阻碍，接下来可能会跌倒，就像股价可能会继续下跌。

2024-04-04 11:51:40 1530 1

原创一点点金融 3

一开始，我进入股市，梦想着快速赚大钱。像玩游戏一样每天买卖股票，希望能捕捉到每一次价格的小波动来赚钱。但很快发现，频繁交易像是在给券商送钱，手续费堆积如山，加上几次买卖失误，钱包越来越瘪。

2024-04-03 21:11:31 555

原创一点点金融 2

在这种情况下，你在现货市场上因为价格上涨而获得了更多的利润，同时，在期货市场上，你之前的空单策略（赌价格会下跌）也让你获得了盈利。在这种情况下，尽管你在现货市场上因价格上涨而获得了盈利，但因为你之前在期货市场上建立了空头仓位（预测价格会下跌），期货市场价格的上涨导致你需要以更高的价格平仓，从而在期货市场上遭受亏损。最终的结果是，你通过在两个市场上的精明操作，成功地保护了自己的利润，即使在现货市场上的椰子价格没有按照你最初的期望那样高。这时候，你想出了一个聪明的计划：你在椰子“期货市场”上做了一些操作。

2024-04-03 11:46:25 1217

原创基于多数据源融合的医疗知识图谱框架构建研究

医疗大数据通常包括规范的电子病历、医疗健康社区中的用户生成内容（UGC）、医疗词典资源和相关政策文件等，这些数据根据其表现形式，可以被分为结构化数据、半结构化数据和非结构化数据三类。中文医疗知识图谱的构建过程，包括多数据源融合、医疗文本数据处理、医疗实体识别、实体及实体关系标注、实体链接与知识融合、实体关系抽取、知识图谱表示及存储和图谱的动态构建等关键技术环节。：收集到的数据需要进行清洗和预处理，包括格式统一、去除噪声数据、数据分词和词性标注等，以提高数据质量，为后续的实体识别和关系抽取打好基础。

2024-04-02 10:52:47 939

原创一点点金融

比如字节跳动、阿里、腾讯、拼多多、谷歌、英伟达、meta、微软、苹果、亚马逊，他们形成了一个互联网新世界，相当于新世纪的巨头，提供一切互联网运作的基础设施和服务，包含数据、算力、云、计算、支付、交易、社交、娱乐、吃喝玩乐、衣食住行。趋势减速的识别都是寻找趋势反转信号的关键步骤，通过观察这些减速迹象，可以更好地准备迎接可能的趋势转变，无论是采取止损措施，还是寻找新的入场机会。还有更傻的呢，债务缠身，就为了买辆看着体面的车，不管是奔驰还是保时捷，那车间一开工，车子成堆成堆的往外冒。你把辛苦钱都扔那儿了。

2024-04-01 21:46:30 980

原创 HyKGE = 预检索阶段生成假设性输出 + 知识图谱深入探索 + 信息片段重排序，解决了查询不完整性、准确度和深度不足、展示不佳问题，提升了答案的准确性、相关性和体验。

基于现有方法的局限性，作者提出了假设知识图谱增强（HyKGE）框架，该框架旨在通过结合知识图谱和LLMs，利用LLMs的零样本能力和预训练知识来弥补用户查询的不完整性，从而提供更准确和可靠的回答。通过上述四个子解法的组合运作，HyKGE框架能够有效地处理用户查询的不完整性，精准地从知识图谱中检索和整合信息，同时过滤掉噪声，最终提供准确、相关且高质量的回答。通过这种逐步拆解的方式，HyKGE框架利用LLMs的强大生成能力和知识图谱的准确性，有效处理了用户查询的不完整性，提高了回答的准确度和用户体验。

2024-03-31 23:13:18 846

原创 BioMedKGs：算法生成医学知识图谱，解决构建和维护工作量巨大问题

在关系识别方面，BIOS能够识别和表示生物医学概念之间的复杂关系，例如，它可能包含一个关系三元组[阿司匹林, 可治疗, 发热]，其中"可治疗"是连接阿司匹林和发热两个概念的关系，展示了BIOS如何用于自动诊断、问答和药物发现等多种AI任务。：我们从文献中收集关于肺结核的术语和短语，并为每个术语建立索引。比如，在BIOS中，“2型糖尿病"这一概念可能会以多种形式和名称存在，如"2型糖尿病”、“II型糖尿病”、“2型糖尿病糖尿病”、“T2DM”、“非胰岛素依赖型糖尿病”、"NIDDM"等。

2024-03-31 17:46:40 1212

原创【大而全被震惊到了】12个类别、100多万张视网膜数据集

图像可读性的更广泛的完整注释范围指的是，SynFundus-1M数据集不仅标注了眼底图像是否包含特定的疾病，还细致地标注了图像中不同区域的清晰度和可用性，这对于自动分析和医学研究来说至关重要。利用SynFundus-Generator，我们生成了超过一百万张合成眼底图像的集合，称为SynFundus-1M数据集，包含15种类型的注释（11种疾病标签和4种图像可读性标签）。广泛的实验表明，即使是经验丰富的标注者也难以将我们的合成图像与真实图像区分开来，合成的疾病相关视觉特征也无法与真实的区分。

2024-03-30 00:30:50 720

原创【医学嵌入模型】中文医疗文本处理大模型 PCL-MedBERT

提出背景与动机预训练语言模型（PLMs）在自然语言处理（NLP）领域取得了显著的成功，特别是BERT及其变体通过在大规模未标注文本上的自监督学习，显著推动了NLP的发展。尽管在通用领域PLMs取得了巨大成功，但直接将这些模型应用于生物医学等专业领域的效果并不总是理想的，因为专业领域具有独特的词汇、术语和语言结构，需要专门的预训练模型来处理。ELECTRA模型的限制ELECTRA模型采用令牌级别的二元分类任务进行预训练，虽有效，但可能不足以捕捉更复杂的语言模式。

2024-03-29 11:41:21 1035

原创【阿里近100人+花27.1万造的】中文医学数据集 ChineseBLUE 分析

需要注意的是，中文生物医学文本在语言上与英文不同，具有其领域特性，这需要专门为中文设计的评估BioNLP基准测试。在本研究中，我们专注于中文，旨在填补这一空白并开发第一个中文生物医学语言理解基准测试。我们收集了真实世界的生物医学数据，并提出了第一个中文生物医学语言理解评估（CBLUE）基准：包括命名实体识别、信息抽取、临床诊断标准化、单句/句对分类等自然语言理解任务的集合，以及一个用于模型评估、比较和分析的在线平台。

2024-03-29 09:57:02 688

原创男人圣经 8

钱的意义，意味着你必须为社会创造更大的价值，它意味着你必须有更强的责任心，它意味着你必须有更强的延迟满足感，它意味着你必须要冒险、存钱、没有休息日、不停的工作，你必须与众不同且足够自信。在你熟悉的领域里，一旦你有半年、1年的中断期，你去做别的了，比如陪你爸妈去了，或者生孩子去了，或者是辞职旅行去了，或者是买房子去了，你将失去在你本行业的生态位。是你的天赋、能力、野心、资源、勇气、毅力、专注、百折不挠、愿意为了实现自己的理想吃最大的苦，愿意去人最少的一条路走一趟，不管别人说什么。如果你想成为一个富人。

2024-03-28 20:28:54 1198 10

原创让机器理解语言，从字词开始，逐步发展到句子和文档理解：独热编码、word2vec、词义搜索、句意表示、暴力加算力

举例：在句子“猫坐在垫子上”中，如果目标词是“坐”，上下文词是“猫”和“在垫子上”，CBOW会使用“猫”和“在垫子上”对应向量的平均值来预测“坐”。举例：在句子“猫坐在垫子上”中，如果目标词是“坐”，Skip-Gram模型会尝试使用“坐”的词向量来预测“猫”和“在垫子上”的词向量。不同于Word2Vec模型生成的词向量，文档向量捕获了文档中所有词的上下文关系以及词之间的交互作用，提供了一个全面的文档表示。GPT-3有1750亿个参数，无疑是非常大的数字，但是在指数增长的算力面前，这些是有限的数字。

2024-03-27 10:44:55 1121

原创【大模型数据增强】LLM2LLM：迭代学习 + 针对性增强 + 错误分析 + 合成数据生成 + 质量控制

我们在使用LLaMA2-7B学生模型的低数据范畴中，在GSM8K数据集上实现了高达24.2%的改进，在CaseHOLD上为32.6%，在SNIPS上为32.0%，在TREC上为52.6%，在SST-2上为39.8%，超过了常规微调。在医学领域的具体应用中，例如提高模型在分类罕见病症或解析复杂医疗图像方面的能力，LLM2LLM能够生成更加贴近实际临床场景的数据，比如根据模型识别错误的病症症状生成新的案例，我们的结果显示，LLM2LLM在低数据范畴中显著提高了LLM的性能，超过了传统微调和其他数据增强基准。

2024-03-26 11:00:18 756

原创眼底 Fundus、OCT 图竞赛分析

ResNet（残差网络）是一种深度卷积神经网络（CNN），最初由微软研究院的研究人员在2015年提出。ResNet的关键创新是引入了所谓的“残差块”，这些残差块允许信息通过网络的跨层连接直接传递，帮助解决了更深层网络中的梯度消失和梯度爆炸问题，使得网络可以通过增加更多的层来提高准确性，而不会降低训练效率。

2024-03-26 09:58:31 820

原创 Bi-LSTM-CRF：其结合了 BI-LSTM 的上下文捕获能力和 CRF 的标签关系建模

BI-LSTM-CRF模型的独特优势在于它结合了双向LSTM的能力来捕获长距离的双向上下文依赖性，并通过CRF层来精确地建模标签之间的约束关系，从而在复杂的序列标注任务中提供了显著的性能提升。本节中，我们描述了本文中使用的模型：LSTM、BI-LSTM、CRF、LSTM-CRF和BI-LSTM-CRF。这些模型包括LSTM网络、双向LSTM（BI-LSTM）网络、带有条件随机场（CRF）层的LSTM（LSTM-CRF）以及带有CRF层的双向LSTM（BI-LSTM-CRF）。前置知识：序列模型、LSTM。

2024-03-25 14:05:22 687

原创【医学实体识别】从糖尿病论文和临床指南中，做关键信息分类

BiLSTM层的输出是每个单词对于不同实体类别的分数（例如B-Person表示一个人名的开始，I-Person表示人名的内部，B-Organization表示组织名的开始，I-Organization表示组织名的内部，O表示不属于任何实体类别）。例如，当处理用户的医疗咨询问题时，可以利用这个实体识别模型来分析问题文本，识别出里面提到的医疗实体，然后根据这些实体和知识图谱中的信息进行匹配，找到最合适的答案或建议给用户。在这句话中，命名实体识别（NER）的任务是识别并分类句子中的关键信息。

2024-03-25 11:23:59 797

原创 CycleGAN-Turbo：CycleGAN结合扩散模型，一步图像到图像转换方法

结合了CycleGAN的非成对图像翻译概念和Diffusion模型的强大生成能力，创造了CycleGAN-Turbo和Pix2Pix-Turbo这两个新模型。在本文中，作者团队解决了条件扩散模型存在的两个问题：推理速度慢和对成对数据的依赖。他们通过引入单步扩散模型来适应新任务和领域的方法，成功地整合了传统的CycleGAN和pix2pix模型的优点到扩散模型框架中。这不仅提升了推理速度，还允许在无需成对数据的情况下进行训练。

2024-03-23 14:13:44 1114

原创 AI大模型学习

未来会更新，偏项目部分，现在偏原理。笔记收录，持续更新。

2024-03-22 11:10:01 1014

原创好用的GPTs：指定主题搜索、爬虫、数据清洗、数据分析自动化

能不能 APP逆向抓取、JS 逆向抓取、APP 群控抓取、验证码拖拽、大规模抓取等！但我不知道，Scraper配合GPT4的多模态和智力，爬虫水平有多好？居然找到了改进的YOLOv5s模型在医学图像中肺结节检测的应用。不过我没做过肺结节检测，没推荐，没想到这都能找到。输入：搜索 YOLO+小目标+医学方面+最新论文。不过我更好奇，这个插件爬虫的能力到了什么程度。只能说，牛逼，不愧是最先进的生产力工具。这篇文章评论中，就有提到肺结节检测。输入：这只是第1页，总共有10页。

2024-03-21 15:24:51 724

原创【医学大模型数据增强】GPT4 生成多样性医学语料模版，医疗知识图谱抽取实体，填充语料模板

代入角色>假定你是深度学习领域的一位资深训练专家，目前你面临的任务是创建一套用于意图识别的数据集。特别是，在关于“疾病定义”的问题分类中，你发现现有的训练语料库显得相当匮乏。因此，你的目标是为这一特定类别扩充更多的训练样本。为了使问题样本更加多样和口语化，你需要构造各式各样的询问句，这些句子长度不一，风格各异，以避免重复的表达形式。在构建的语料模板中，将用[disease]来代替具体的疾病名，[symptom]用来代替具体的症状，[department]则代表相关的医疗科室。

2024-03-21 09:47:01 1694 1

原创婚姻情感 19

你也可以通过惩罚来设立规矩，如果你希望你的女友不要穿着太暴露，那么在她照做的时候，你就热情而快乐地回应她，当她没有按你说的做时冷淡对待她，但是不要说明是什么原因，也不用发脾气只要冷淡就可以。不管男人还是女人都喜欢自由，不愿意被束缚，所以咱们立规矩，方法不能态度强硬，像法规那样强制对方去执行这样不仅达不到你想要的效果，还会破坏你们两个人的感情，得不偿失。当然不会，相反，会觉得你很诚实，踏实靠谱。更关键的是，每次渣男都能给女生这么好的体验，那么时间久了，习惯养成，女生哪天失去了，就会感觉没有精神依赖。

2024-03-20 17:31:42 780 6

原创超级个体 & 营销 & 新商业模式

加微后不推销，先发一个红包，再介绍活动——您好，您朋友是我们店的VIP，我们有闺蜜/老友卡活动，只需要在上面写上自己最好的闺蜜/朋友的联系方式，我们会赠送一份999的独家特色礼品来见证你们之间的友情，只需要到店领取/体验即可。服务上增加一个笑脸牌机制，和顾客说，如果您对服务满意，把笑脸牌给服务人员，表示您对TA服务的认可；和顾客说，您是我们店的VIP，您可以留下您最好的五个闺蜜/老友的电话和姓名，我们会以您的名义，给您的闺蜜送一份价值999的礼品。真正独立的个体，并不是等待别人的命令、去完成别人布置的事。

2024-03-19 12:15:54 924

原创 vLLM：给大模型提提速，支持高并发吞吐量提高24倍，同时推理速度最少提高 8 倍

vLLM系统：在PagedAttention的基础上构建的一个高吞吐量的分布式LLM服务引擎，采用块级内存管理和预先请求调度，实现了KV缓存内存的近零浪费。这导致了大量的内部碎片化（预留的内存未被完全使用）和外部碎片化（由于连续内存的需求，可用内存块被分散，不能被有效利用）。按照改进的方式，你可以立即把客人A的订单向前推进到下一步（加汉堡肉），同时把新来的客人B的订单加入到加生菜的步骤中。通过这种方式，vLLM可以在有限的GPU内存中，以更高的效率处理更多的请求，提高了LLM服务的吞吐量和响应速度。

2024-03-18 23:55:45 984

原创 MPIKGC：大语言模型改进知识图谱补全

知识图谱就像一个大数据库，里面有很多关于不同事物的信息，这些信息是以三元组的形式存在的，比如（人物，关系，事物），如（Ian Bryce，制片，变形金刚：月黑之时）。基于描述的KGC方法通过分析文本描述来理解实体和关系，而大型语言模型则为这些方法提供了一个强大的工具，可以深入挖掘文本中的知识，帮助填补知识图谱中的缺口。：通过这样的操作，我们不仅补充了单个疾病的信息，还在不同疾病之间创建了新的联系，有助于揭示它们之间可能的共同生物学机制或治疗方法的对比。

2024-03-18 22:06:22 1431

原创 llama_index 从 0 到 1：别再用传统方法处理数据了！LlamaIndex如何革新你的信息检索？

用户可以根据需要自定义索引构建过程，包括文档分块、向量存储配置等，这为特定应用场景下的优化提供了可能。

2024-03-17 23:51:54 733

原创 VPTTA：为每张医疗图像生成特定的“提示”，解决跨不同设备和条件的医疗图像分割的准确性和适应性

这张图比较了三种不同的方法，它们都试图解决如何让一个用于分析医疗图像的电脑程序（比如分割脑部扫描图）适应不同医院或设备拍摄的图像，即便这些图像在外观上因为设备或拍摄方式不同而有所变化。在现实世界中部署医疗图像处理的语义分割模型时，不同医疗中心拍摄的图像在外观上会有所不同（这称为分布偏移），这使得原本在一组数据上训练好的模型在新数据上的性能下降。当医疗图像来自不同的医疗中心时，图像的外观可能会有所不同，这使得自动识别系统难以准确地识别图像中的特定部分（比如眼底图像中的视盘和视杯）。

2024-03-17 18:44:26 542

原创婚姻情感 18

一个真正厉害的男人，他天生就是那种特别有拼劲儿，想要争第一的性格，但他对你好，心疼你，这并不是因为他生来就温柔，也不是因为你非得让他对你温柔，而是因为你自己给了他一个安静的港湾。但人家又不是没脑子的，任何正经人都知道，老是这么玩耍，时间长了，心里头既不踏实也不觉得自己有啥成就感，总觉得空洞洞的，像是没啥希望似的。女人现在不是谁的私有财产，离婚自由，娶了也不是说休就休。跟你在一起，不需要再争高低，不用再斗来斗去，因为他知道你不是他的对手，你也不想跟他斗，所以他才会放下戒备，甚至让你感觉到你‘赢’了。

2024-03-17 17:18:24 936

原创 Apollo：如何打造全球化的医疗AI，轻量级，重量级

Apollo通过针对多语言覆盖、数据隐私保护、地方性知识整合和沟通效率的优化，解决了普通医学大模型在这些方面的问题和不足，提高了模型在全球多语言医疗信息处理方面的性能和适用性。代理调优是一种使用小型模型的输出来引导大型模型进行预测调整的技术，它能够在不直接更改大模型参数的情况下，提高大模型在特定任务上的表现。混合多语言的医学数据对模型的性能有显著提升，但如何平衡和整合这些多样的信息，仍是我们接下来需要关注的问题。：可能缺乏足够的多语言和地区特定的医疗数据，导致在非主要语言或地区的医疗知识处理上存在不足。

2024-03-15 17:00:51 621

blog配套资料、blog配套资料、blog配套资料

blog配套资料blog配套资料blog配套资料blog配套资料blog配套资料blog配套资料

2023-07-14

博客配套资料博客配套资料

博客配套资料博客配套资料博客配套资料

2022-08-06

博客配套博客配套博客配套

博客配套博客配套博客配套博客配套

2022-08-05

博客配套https://download.csdn.net/download/qq_41739364/86339152

https://download.csdn.net/download/qq_41739364/86339152

2022-08-05

配套博客资料，配套博客资料

配套博客资料

2022-08-05

processed_data.xlsx

博客配套数据：https://blog.csdn.net/qq_41739364/article/details/120967416

2021-10-27

original_data.xlsx

博客配套资源：https://blog.csdn.net/qq_41739364/article/details/120967416

2021-10-27

博客配套资源数据集.zip

博客配套资源

2021-10-09

莎士比亚诗歌数据集.txt.zip

博客配套资源

2021-10-08

恐龙名字数据集.txt.zip

博客配套数据集

2021-10-08

我的数据集+我的数据集.zip

博客配套资源

2021-09-07

data.xlsx.zip

博客配套数据

2021-08-21

神经网络识别猫的项目代码

博客程序：https://blog.csdn.net/qq_41739364/article/details/118094724

2021-07-17

疫情监控项目源码.zip

博客配套：https://blog.csdn.net/qq_41739364/article/details/115742139

2021-04-15

label.xlsx ....

2021-03-08

data.xlsx ....

配套博客：https://blog.csdn.net/qq_41739364/article/details/113818246

2021-03-08

smi_sol.dat

化学分子数据

2021-03-08

口罩厂亏损分析的相关数据

配套博客：https://blog.csdn.net/qq_41739364

2021-02-23

breast_cancer.xlsx

配套博客：https://blog.csdn.net/qq_41739364/article/details/113818246

2021-02-21

att_faces.zip

人脸数据集，数据集里有 40 个人，每个都有 10 张照片，分别存储在 40 个文件夹里，s1-s40，每个文件夹下面都有 10 张 .pgm 照片，每张照片的尺寸 112*92（长 * 宽）。

2020-07-04

att_face.zip

人脸测试数据集，配套博客：https://blog.csdn.net/qq_41739364/category_9414685.html

2020-07-03

阶的估计.pdf

配套博客：https://blog.csdn.net/qq_41739364/article/details/86718524

2019-09-03

1.数据挖掘入门.pdf

配套博客：https://blog.csdn.net/qq_41739364/column/info/42524 的第四章。

2019-08-13

3.机器学习常用算法.pdf

配套博客：https://blog.csdn.net/qq_41739364/column/info/42524 的第 4 篇。

2019-08-13

强大的防御跨站点请求伪造.pdf

配套博客：https://blog.csdn.net/qq_41739364/article/details/96846943

2019-08-01

dict.txt.zip

配套博客：https://blog.csdn.net/qq_41739364/article/details/96767359

2019-07-23

phpStudy.zip

配套博客：https://blog.csdn.net/qq_41739364/article/details/93403910

2019-07-19

SQL字符型注入漏洞.pdf

配套博客：https://blog.csdn.net/qq_41739364/article/details/94025729

2019-07-18

0day安全：软件漏洞分析技术（第2版）一 PART2.pdf

全书分为俩部分，这是第二部分。配套博客：https://blog.csdn.net/qq_41739364/article/details/96202158

2019-07-17

0day安全：软件漏洞分析技术（第2版）一 PART1.pdf

全书分为 2 部分，这是第一部，配套博客：https://blog.csdn.net/qq_41739364/article/details/96202158

2019-07-17

burpsuite实战指南.pdf

配套博客：https://blog.csdn.net/qq_41739364/article/details/93862232

2019-07-02

渗透测试实践指南：必知必会的工具与方法.pdf

中文版，配套博客：https://blog.csdn.net/qq_41739364/article/details/93862232

2019-06-28

端口大全介绍(2).doc

很详细，配套博客：https://mp.csdn.net/postedit/93862232

2019-06-27

初等数论大全

计算机数学专题5: 数论配套资料博客地址：https://mp.csdn.net/postedit/86761357

2019-04-24

C语言RSA素数部分

配套博客：https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-08

DES加密位操作部分 C语言

配套博客：https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

DES加密代码 C语言

配套博客：https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

RSA加密 C语言实现

配套博客：https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

DES加密代码 java

匹配博客：https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

系统学习公钥体系

配套博客 https://blog.csdn.net/qq_41739364/article/details/86775886 ，效果最佳。

2019-03-28

C++求救，一道编程题不知道怎么做

2021-03-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

blog配套资料、blog配套资料、blog配套资料

博客配套资料博客配套资料

博客配套博客配套博客配套

博客配套https://download.csdn.net/download/qq_41739364/86339152

配套博客资料，配套博客资料

processed_data.xlsx

original_data.xlsx

博客配套资源数据集.zip

莎士比亚诗歌数据集.txt.zip

恐龙名字数据集.txt.zip

我的数据集+我的数据集.zip

data.xlsx.zip

神经网络识别猫的项目代码

疫情监控项目源码.zip

label.xlsx ....

data.xlsx ....

smi_sol.dat

口罩厂亏损分析的相关数据

breast_cancer.xlsx

att_faces.zip

att_face.zip

阶的估计.pdf

1.数据挖掘入门.pdf

3.机器学习常用算法.pdf

强大的防御跨站点请求伪造.pdf

dict.txt.zip

phpStudy.zip

SQL字符型注入漏洞.pdf

0day安全：软件漏洞分析技术（第2版）一 PART2.pdf

0day安全：软件漏洞分析技术（第2版）一 PART1.pdf

burpsuite实战指南.pdf

渗透测试实践指南：必知必会的工具与方法.pdf

端口大全介绍(2).doc

初等数论大全

C语言RSA素数部分

DES加密位操作部分 C语言

DES加密代码 C语言

RSA加密 C语言实现

DES加密代码 java

系统学习 公钥体系

C++求救，一道编程题不知道怎么做

系统学习公钥体系