贺俊宏-CSDN博客

原创 DrugBAN：基于双线性注意力网络进行药物-靶点结合预测。

预测药物-靶点相互作用（DTI）时药物发现中的关键环节，近年来一些深度学习方法在该环节中显示了广泛的应用前景，但目前仍然存在两个关键问题： 1. 如何明确地建模和学习药物和靶标之间的局部相互作用，以便更好地预测。2. 如何提升药物-靶标对的预测的泛化能力。针对这两个问题，作者提出了一个深度双线性关注网络(drug- BAN)框架以学习药物和靶标之间的局部相互作用，并使用领域自适应模块应用到训练集分布以外地数据中（即未知的药物-靶标结构对）。

2024-04-15 13:53:23 706

原创 GPCR蛋白一般残基编号(Generic residue numbering)

介绍GPCR蛋白中的一般残基编号

2024-01-12 10:26:13 572

原创 WSL2-Ubuntu22.04子系统图形化界面搭建与远程桌面连接

为window的wsl子系统搭建图形化界面

2024-01-04 13:48:48 1192

原创 PocketMiner:基于深度学习发现蛋白的隐式口袋

标题：Predicting locations of cryptic pockets from single protein structures using the PocketMiner graph neural network期刊： Nature communictions团队：华盛顿大学生物化学与分子生物物理系靶点的成药口袋是药物研发的起点，而除了在自然状态下显而易见的”显式口袋“外。还存在一类由于蛋白结构的动态变化而形成的"隐式口袋"。

2023-08-30 16:31:12 1042 1

原创 Pathlib的基本用法

在项目运行的时候经常设计文件路径的读取与处理，Pathlib提供了非常方便的接口处理文件路径，本文将介绍一些Pathlib的基本用法。

2023-05-12 18:22:08 355 1

原创 chatmol：将chatgpt应用于pymol

Chatmol将chatgpt内置到了pymol当中，这使得以对话的方式调用pymol进行绘图成为可能。

2023-04-12 15:57:08 442

原创利用python构建分子碎片库

基于分子文件构建分子碎片库。内嵌Brics， Recap， MacFrags三种算法。RECAP（Retrosynthetic Combinatorial Analysis Procedure）：RECAP 是一种基于化学反应规则的分子切割方法，通过将分子沿特定的化学键进行断裂，生成更小的碎片。这些碎片可以帮助研究者更好地了解分子的结构和活性关系。BRICS。

2023-04-11 17:34:26 396

原创 diffdock：将扩散模型用于分子对接

基于深度学习中的扩散模型优化药物发现中的分子对接技术

2023-03-19 01:23:50 2770 9

原创分子对接中的相互作用特征分析(目视筛查)

介绍分子对接的相互作用特征，以及如何通过这些特征进行目视筛查

2023-02-22 21:27:26 1969 2

原创利用python从蛋白文件中提取特定类型的原子

从蛋白文件中提取某种原子并写出

2022-11-16 10:49:05 517

原创 linux切割文本

shell脚本切分文件

2022-08-30 14:22:07 486

原创 linux集群上的SCHRODINGER 分子对接工作流程

介绍schrodinger在无图形化linux集群上的分子对接流程

2022-08-26 10:52:00 3891 12

原创蛋白结构合理性评估软件-PROCHECK的安装与使用

介绍蛋白结构评估工具PROCHECK的安装和使用

2022-08-08 16:11:38 2955 1

原创 python处理含重复值的实验数据

项目场景：师妹有这样一张表:希望能按inchikey进行分组,然后删除掉logD最大值最小值数据相差超过百分之三十的数据,对剩下的数据进行取平均数的方法进行去重解决方案：import pandas as pddata = pd.read_csv("xxxxxxxxx")#删除浮动超过百分之30的数据data_valid = data.groupby( ["Smiles (InChiKey)"], as_index=False).filter( lambda x:max(x.log

2022-03-05 16:11:24 985

原创如何连接成组箱线图中的平均值(seaborn)

项目场景：师妹想要如下图的效果问题描述：理所应到得想到用箱线图组合折线图就可以,但出来的图发现不对劲:点并不在箱线图之上,而是按照坐标点成一条竖线解决方案：为pointplot函数加入dodge参数,下面看看seaborn官网对这个参数的解释:dodge:bool or float, optionalAmount to separate the points for each level of the hue variable along the categorical axis.(

2022-03-03 11:26:20 2699 3

原创 linux 带文件路径批量拷贝文件夹

需求：批量转移目录并保留目录结构：存在这一个数据结构A/B/C/{D,E,F,G …}/interest_dir , 希望能够将interest_dir批量转出到result 文件夹下并保留目录结构(比如: result/A/B/C/D/interest_dir)解决方案：为cp命令加入 --parents即可保留目录结构,加入-r即可转移文件夹,使用*匹配多个文件目录：cp --parents -rf /A/B/C/*/interst_dir/ ./result/ ...

2022-02-28 10:00:36 1415

原创如何利用shell脚本调用python并进行传参

shell脚本菜鸡学习日记用来记载我的笨蛋shell脚本学习之路文章目录shell脚本菜鸡学习日记一:情况简述二、脚本三、总结一:情况简述在一般运行分子动力学时候,我都采用这样一个python脚本,运行方式是xxx.py -p xx.pdb -l xx.pdb -n nember, p:蛋白文件路径 l:配体文件路径 n:使用的CPU数量.但当配体数量一多起来,显然会存在一个耗时耗力的情况,因此希望利用shell脚本实习一个简单的循环二、脚本废话少说,上脚本#!/bin/bashp

2021-12-17 10:09:39 1677

原创 antechamber 出现 Weird atomic valence问题以及解决

问题场景：Weird atomic valence问题的出现：今晚照常在用antechamber处理配体小分子的时候出现了一个从未见过的错误,特此记录一下问题描述：提示：在利用anatechamber讲配体转换为mol2格式后出现如下报错:acdoctor mode is on: check and diagnosis problems in the input file.-- Check Format for mol2 File -- Status: pass-- Check Unu

2021-12-15 22:49:52 1162

翻译使用schrodinger建立深度学习QSAR模型

使用schrodinger建立QSAR模型本篇教程将展示如何使用AutoQSAR/DeepChem去设定,建立和理解深度学习QSAR/QSPR模型.文章目录使用schrodinger建立QSAR模型一、深度学习QSAR模型是什么？二、使用步骤1.创立项目引入结构2.建立一个AutoQSAR/DeepChem 模型以预测污染物致突变性.3.分析和使用AutoQSAR/DeepChem 污染物致突变性模型3.1 分析3.2 使用4.分析来自AutoQSAR / Deepchem模型的Ames致突变性的预测

2021-09-14 14:48:09 3973 2

原创已知一个靶点,如何获取旗下相关的生物实验,临床试验,以及上市药物数据.

写在开头1.靶点信息数据收集1.1 uniprot生物实验数据收集2.1 PUCHEMchembl总所周知,科研是基于数据的,数据是基础也同样是目的.但如何全面且详细地回顾和收集世界各地地往期工作就是困扰诸多科研工作的难题.但随着大量公开且庞大数据库的出现,似乎在为我们登上巨人的肩膀铸造了电梯.今天就以个人经验总结了一下如何搭乘这一部电梯.如有不足之处也请大家在评论区补充,感谢~本文章全程采用Poly [ADP-ribose] polymerase 1(parp-1)蛋白作为例子进行展示1.靶点信息数

2021-05-21 10:47:35 4485 4

原创汇总药用数据库(Pubchem,bingdingDB,Chembl,ExcapeDB)数据

记载一下如何汇总4大数据库的数据

2021-05-21 10:18:00 2260

原创如何根据uniports号,爬取bindingDB的活性实验数据

上代码:import requestsimport jsonimport argparseimport timefrom pandas import json_normalizeparser = argparse.ArgumentParser(description="get ligands(BindingDB) by uniprots")parser.add_argument('--uniprots', '-u' , required=True, nargs='+', help='t

2021-05-21 09:46:09 938

原创如何依照靶点名称,找到chembl数据库中的相关实验数据

chembl提供了API(chembl_webresource_client)可以用来获取数据安装一下:pip install chembl_webresource_client废话少说,上代码:import pandas as pdfrom chembl_webresource_client.new_client import new_clientimport argparseparser = argparse.ArgumentParser(description="get chembl

2021-05-20 20:21:02 2338

原创如何提取论文中的表格数据(pdf转换excel)

如何从文献中提取表格数据1.下载连接2.下载2.1 选字版本并下载解压2.2 下载安装java3.使用说明3.1初始页面3.2 框选需要转换的表格3.3 结果展示文献中一些表格数据,非常有用,但是自己手打又很麻烦.因此突发奇想,是不是有大佬和我一样为其所困.开发了什么神奇软件啥的.没想到还真有,软件名字叫tabula1.下载连接https://tabula.technology/2.下载2.1 选字版本并下载解压选好对应版本,我时win10,后续操作也是基于windows之上.解压点击 ta

2021-05-13 09:38:33 5654 3

原创 ubuntu18.04更新内核导致显卡驱动失效

记一次手贱的经历一.问题出现二.问题分析三.问题解决1.版本内核回退2.更新显卡驱动适配新的内核一.问题出现在使用了apt-get update命令之后,出现NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running二.问题分析问题在于更新内核版本与显卡驱动不适配,服务器

2021-04-28 16:20:08 2732 3

原创基于rdkit将smiles转换为smarts

基于rdkit将smiles转换为smarts载入包转换结果载入包from rdkit import Chem载入smilesmol = Chem.MolFromSmiles("CC1=C(N(N=N1)C)C2=CC3=C(C4=C(N3C(C5CCOCC5)C6=CC=CC=C6)C=C(C=C4)C(C)(C)O)N=C2")转换s = Chem.MolToSmarts(mol)smart = s.replace('#6', 'C').replace('#8', 'O').repla

2021-03-25 17:10:47 2286 2

原创 MMPB/GBSA结合自由能计算以残基贡献度分析

MMPB/GBSA结合自由能计算以残基贡献度分析1.MMPB/GBSA结合自由能计算简介2.输入文件准备2.1 拓扑文件处理2.2 mmpbsa.in的编译运行程序绘图1.MMPB/GBSA结合自由能计算简介在运行完MD之后,毫无疑问需要对其进行分析.其中结合自由能计算就是必不可少的一部分:配体和受体的游离态到结合态之间存在一个能量差,用这个能量差可以衡量两者结合的亲密度.下图是结合MMGBSA的原理,其将结合自由能分为了分子力学能Emm,(范德华力Evdw,静电相互作用Eele),溶剂化自由能(Gs

2021-02-01 20:51:16 8249 8

原创迁移windows子系统

迁移wsl子系统window子系统安装问题出现安装使用更多功能自行探索window子系统安装可以按照该指南安装:https://docs.microsoft.com/zh-cn/windows/wsl/install-win10问题出现在经过长期的使用后,由于包装得越来越多.系统文件也越来越多.(C盘爆满),导致我的C盘长期处于红色状态.删除重装实在是太浪费时间,因此查阅得一神器(LxRunOffline)安装直接选择下载latest 我下载的是3.50https://github.com/D

2020-12-15 14:48:26 465

原创使用nvm切换nodejs版本

文章目录问题的出现NVM安装与nodejs版本切换1. ==删除电脑内部存在的nodejs 和 nvm 不然会有冲突==2.下载地址与安装3. 安装多版本nodejs问题的出现使用hexo部署网站的时候出现如下错误typeError [ERR_INVALID_ARG_TYPE]: The "mode" argument must be integer. Received an instance of Object经查阅是由于nodejs 版本过高不适配造成的,遂涉及一个nodejs版本切换的问题

2020-12-11 10:11:15 15261

原创药效团模型(pharmacophore model)构建与搜索(MOE2018)

记录一下完整的pharmacophore的过程初始文件复合物晶体结构->PLIF->药效团序列加载蛋白复合物以及初始设置准备1.读取蛋白文件2.修改背景颜色为白色,修改立场文件3.删除多余链与配体4.调整蛋白结构显示5.蛋白分子的预处理叠合蛋白-配体复合物1.为复合物分配不同的颜色以便于区分2.叠合蛋白-配体复合物3.观察蛋白-配体相互作用4.新建Database并导入蛋白-配体复合物生成PLIF和Pharmacophore Query1.生成PLIF2.生成pharmacophore quer

2020-10-16 10:25:53 6970 11

原创根据chembl_id 查询蛋白分类信息

记录笨比上班生活又一天没啥好说的直接上代码运行效果运行结果没啥好说的直接上代码以一个含有chembl target ID号的表格为起点,输入输入文件地址,chembl_id列名,以及输出文件地址chembl的api 分为多层 chembl_id>>>>>componen_id>>>>>protein_id# -*- coding: utf-8 -*-"""Created on Mon Sep 14 21:52:27 2020@au

2020-09-15 10:51:51 1409

转载 IC50、pIC50、EC50、ED50、Ki、Kd、KD、Ka、Km、Kon、Koff概念辨析

IC50：半抑制浓度(或称半抑制率)，即IC50，对指定的生物过程（或该过程中的某个组分比如酶、受体、细胞等）抑制一半时所需的药物或者抑制剂的浓度。药学中用于表征拮抗剂（antagonist）在体外实验（in vitro）中的拮抗能力。pIC50：pIC50=-log(IC50)EC50：是指在特定暴露时间后，能达到50%最大生物效应对应的药物、抗体或者毒素等的浓度。药学中除了用于表征体外实验中（in vitro）激动剂（agonist）的激活能力外，还可用于表示达到体内（in vivo）最大生物效应.

2020-08-03 14:45:03 34993

原创根据SID或者CID下载PUBCHEM数据库的smile信息(总结版)

PUBCHEM下载smile使用PUBCHEMbulk download功能把smile列加入到源文件中使用PUBCHEMbulk download功能参见我的一篇博文如何使用pubchem的bulk download功能把smile列加入到源文件中废话少说上代码# -*- coding: utf-8 -*-"""Created on Wed Sep 11 10:16:11 2019@author: 86177"""import osimport pandas as pdimp

2020-08-01 17:33:37 5006 5

原创利用Adobe Photoshop 2020导入和批量输出论文中的图片

阅读文献使我快[zhi]乐[xi]1. 导入pdf2. 创建动作1.创建组2.创建并记录动作3.批量导出1. 导入pdf文件>打开>选择文件>图像利用shift +左键选取所需要的图片,点击确定2. 创建动作1.创建组窗口>动作(alt+f9)>上图第四个图标创建组>命名为"批量操作"2.创建并记录动作上图第五个图标创建动作>命名为"批量另存为">文件>储存为>自选文件夹>上图的第一个图标停止记录3.批量导出文件&gt

2020-07-31 22:10:21 2656

原创 AMBER:使用Cpptraj计算RMSD 以及使用中遇到的问题

记录笨比生活又一天输入文件rms.in设置运行cpptraj遇到的问题1.cpptraj不输出结果2.空格的问题Tofirst:[空格]1-249&!@H= firstTofirst[空格]:1-249&!@H= first输入文件rms.in设置parm XXXXX.prmtop #载入拓扑文件trajin XXXX_prod.nc #载入轨迹文件 rms ToFirst :1-13&!@H= first out rmsd2.agrrun运行cpptrajcp

2020-07-10 16:52:30 3296 2

原创 ubuntu18.04 修改屏幕分辨率

笨比生活的又一天1.查看现有分辨率2.设置新的分辨率模式3.更改分辨率在用实验室服务器的时候,发现一切换分辨率就自动变化了所以查了一下如何更改屏幕分辨率,避免每次都要重启1.查看现有分辨率xrandr结果输出为Screen 0: minimum 320 x 200, current 1920 x 1080, maximum 1920 x 2048VGA-1 connected primary 1920x1080+0+0 (normal left inverted right x axis y

2020-07-09 13:36:15 3036

原创 AMBER:UBUNTU18.04安装编译AMBER18的过程和遇到的问题与解决

实验室新到了服务器,备有Tesla V100 GPU,并准备未来用于跑分子动力学.记录一下编译AMBER18的整个历程.

2020-06-23 14:40:05 5230 4

原创 Ubuntu18.04 设置多版本gcc、g++时所遇到的坑(无法修改版本）

又一次感叹自己的愚蠢为什么要设置多个版本修改程序包版本的方式问题所在解决方式如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入为什么要设置多个版本毫无疑问，在面对各种软件的时候，每种软件因为版本或者本质算法的需要，都会对gcc，g++这类编译器有不同的需求，而我们总不能用

2020-06-14 00:09:07 3757 4

原创 AMBER:处理不规则残基中遇到的问题

amber对于蛋白中的残基可以进行处理,但是Amber的标准氨基酸残基库不包含含非标准残基的原子类型和电荷. 但它们是任何分子力学模拟都必需的.所以需要单独构建残基文件,推导非标准残基的原子电荷并判定其原子类型至于如何判断蛋白中是否存在非标准残基,除开依据经验对pdb文件进行审查之外.,就是查看导入蛋白之后报的错误了.Loading PDB file: ./5ds3_pre.pdb/public1/soft/amber/18-parallel-new/amber18/bin/teLeap: Warn

2020-06-03 11:51:54 3455 10

原创如何使用pubchem的bulk download功能

好像还是有同学不会,就写个教程把puchem的上传分为compound 和assay 那下载同样也就分为这两种连接分别是化合物:https://pubchem.ncbi.nlm.nih.gov/pc_fetch/pc_fetch.cgi实验:https://pubchem.ncbi.nlm.nih.gov/assay/assaydownload.cgi其上传方式都很简单:上传只含AIDHUOZHE...

2020-05-22 11:35:59 2753 5

空空如也

空空如也