自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(80)
  • 收藏
  • 关注

原创 已知uniport ID 下载 seq

task如题,可以改成批处理的代码哦。

2024-04-23 14:54:12 230

原创 蛋白质致病突变的计算方法(四)

此外,已经报道了针对特定基因组或蛋白质家族的特殊基质,以及恶性疟原虫和约利疟原虫的富集基因组,整合膜蛋白, β-桶跨膜蛋白,G蛋白偶联受体的视紫红质家族,蛋白质-蛋白质相互作用网络的枢纽蛋白和本质紊乱蛋白。度中心性衡量的是网络中一个蛋白质(或氨基酸)与其他蛋白质(或氨基酸)相互作用的次数,而介数中心性衡量的是一个蛋白质在网络中充当其他蛋白质(或氨基酸)之间桥梁的次数。(举这些例子的目的是通过具体的案例来说明在不同蛋白质中突变的位置和性质可能导致的不同影响,以及这些影响可能如何与癌症的发生和发展相关联)

2024-04-23 14:47:26 626

原创 蛋白质治病突变的计算方法(三)

文献中使用了几种特征来识别蛋白质中的致病突变。它们大致分为三类:(1)序列,(2)结构和(3)网络,以及它们的组合。图1说明了这三组中的一些重要属性。图1 用于识别致病突变和热点的重要特征。基于氨基酸序列的特性包括理化特性、二级结构、位置特异性得分矩阵(PSSM)、特异性基序(motifs)和保守性得分。基于结构的性质包括界面分布(interface profiles)、残基的位置在核心和表面、相对溶剂可及面积(RSA)、体积、氢键供体和受体以及统计势能(statistical potentials)

2024-04-22 12:57:11 744

原创 蛋白质致病突变的计算方法(二)

(继续上一篇)

2024-04-19 13:53:39 792 1

原创 蛋白质致病突变的计算方法(一)

目前,文献中可用的突变数据已被整理(curate)并存储在几个数据库中,这些数据已被有效地用于开发利用蛋白质的序列和结构属性识别有害(deleterious)突变(drivers)的计算方法。在本章中,我们将描述特定数据库的内容,这些数据库包含致病和中性(neutral)突变的信息(information on),然后(followed by)是基于序列和结构的属性。列出了重要的基于序列和结构的属性,这些属性在文献和计算工具中广泛用于识别癌症热点残基,以及区分蛋白质中的致病突变和中性突变。

2024-04-18 11:36:49 402

原创 已知genebank号 批处理获取gene ID和序列信息

处理一个公开数据集,发现多个genebank号对应1个gene ID,所以写了个脚本在NCBI接口批处理了一下。同时为了避免被封,添加了sleep,不知道是否好用,结过是几万的数据依然很流畅~~

2024-04-10 12:38:45 176

原创 VSCode SSH 连接 Could not establish connection to “XXX“: spawn UNKNOWN.

进入 ssh 插件的设置(可以通过在插件上选择设置按钮,也可以 ctrl + shift + p 再输入 ssh,选择 settings),在里面找到 Remote.ssh:Path 选项。默认本地路径: C:\Windows\System32\OpenSSH。拉取vscode终端:快捷键 ctrl+`(数字1旁边那个)2.1 找到本地SSH 位置。2.2 找到要修改的位置。

2024-04-04 10:45:06 521

原创 variant calling--SComatic

方法来自论文:De novo detection of somatic mutations in high-throughput single-cell profiling data sets。找到需要的染色体的fa.gz文件,右击-->复制链接地址-->linux端。将以上代码段写在.sh脚本中,执行 ./ **.sh 运行即可。我的任务是在几个scRNA数据中找到在突变基因不同细胞中特异性的表达。2. 解压染色体文件,并得到染色体的.fai文件。声明:我要处理的是hg38的染色体。

2024-03-26 10:41:10 238

原创 Pymol 常用指令:mutation in Pymol

Pick-#73 Glu, Color->yellow, 可以看到黄色是点突变以后Trp, 红色是原来的Glu. 点击Apply保存就只剩下黄色的Trp了。点show->stick;最近想尝试突变是否会改变蛋白质结构,想起来之前安装的Pymol有蛋白质可视化功能,所以小小记录一下。可以看到,做完点突变后,周围残基并没有发生构象上的变化,意味着pymol不会自动做能量最小化处理。3. 点Wizard->Mutagenesis->protein;OK,介绍 1b27蛋白质第73个残基由E变成W的过程。

2024-03-18 11:18:37 348

原创 服务器权限:Error: EACCES: permission denied, open‘/Cardiac/uniquC.csv

我想在服务器上传一个文件uniquC.csv,但是服务器说我没有权限。1. 查看目前是否存在对文件夹的权限。这也意味着root也没有赋予写的权限。然后输入root密码。4. 查看当前的权限。

2024-02-26 15:16:40 344

原创 google cloud storage批量文件下载

注意:3中复制的语言需要修改:1)去掉开始位置的 \ 2)删除” 前后的空格 3) 最简单的方法去chatgpt粘贴一下,他会给你正确的格式(已经崩溃,自己改了好多次没改对……),所以最后的样子应该是。我是先cd进了目标文件夹,所以保存的local路径是 .。1.首先创建项目,或者用之前的项目都可以。2.然后选中要下载的文件,点击下载。4.修改指令,并使用项目名称。

2024-01-16 12:37:15 575 3

原创 google cloud storage: Bucket is a requester pays bucket but no user project provided

啊啊,一整天熬到2点就干了个这,这收钱的界面做的太隐蔽了,根本找不到,花钱都花不出去……关于Enformer脚本的解析和数据等问题也可以问,可以考虑写个专辑了。bash脚本如果有需要可以在评论区提问。

2024-01-11 10:36:45 419

原创 pymol--常用指令

3.还发现Pymol>后的框可以通过上↑下↓箭头会到前后指令,这与Linux是一样的。新年快乐~~~ 1.1号写了点 但是太少了没发。1. 显示蛋白质序列,点击右下角的S就可以。2. 隐藏其中一条蛋白质序列。

2024-01-09 16:28:42 427

原创 pymol--常用指令

1)Pymol> load name.pdb, name # 载入pdb文件,并命名,我还没试过Pymol> fetch proteinID # 直接就加载了 我用的这个右边选框,有A S H L C指令。

2023-12-28 10:34:43 626

原创 Pymol入门---安装Windows 多版本下载

Pymol需要文件,最好去下载清华提供的镜像,网速会很快由于我在本地有3.9的python,所以我先查了适配哪个Anaconda,然后选择在清华镜像源下载Anaconda3-2022.10的版本。下载后进行安装。

2023-12-28 10:21:34 1001

原创 在公共服务器/集群上 安装Linux pycharm 并在窗口调出pycharm界面

1.enter the web:https://www.jetbrains.com/pycharm/download/?section=linux#section=linux2.upload software (yourself folder)3.cd software4.find the Compressed package: .tar.gz5.Decompress:tar zxf pycharm-professional-2023.2.3.tar.gz6.cd pycharm-2023.2.3/bin/

2023-10-30 10:43:54 707

原创 如何根据蛋白质序列找到蛋白质ID

4. 筛选,左边有物种,0.98为score,取score最小的,原理不知。7. 验证结果:判断序列与找到的蛋白质ID序列是否一致。5. 可下载相关文件。

2023-08-20 20:26:46 1673

原创 RuntimeError: CUDA error: no kernel image is available for execution on the device

RuntimeError: CUDA error: no kernel image is available for execution on the deviceOSError: /home/aita/anaconda3/envs/FusionDTA/lib/python3.7/site-packages/nvidia/cublas/lib/libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not de

2023-04-06 20:11:09 722 1

原创 已知下载链接,使用python下载数据

平常数据一般下到本地然后上传到服务器,但是内存告急,想起来之前用命令行下载数据,写了2行代码搞定。

2023-03-22 11:43:57 299

原创 python pd.DataFram series转ndarry,然后转为(X,1)格式

在调试代码时报错:python key of type tuple not found and not a MultiIndex

2023-03-20 09:17:36 846

原创 tensor与numpy、array的转换,针对RuntimeError: Can‘t call numpy() on Variable that requires grad问题

tensor与numpy、array的转换,针对RuntimeError: Can‘t call numpy() on Variable that requires grad问题

2023-03-08 09:09:10 328

原创 记录 No module named ‘Bio‘

安装或调用python3,biopython。python2 里面用的module是。python3 里用的module是。

2023-02-24 21:47:32 2893 1

原创 ERROR: Could not install packages due to an OSError: [Errno 2] 没有那个文件或目录

ERROR: Could not install packages due to an OSError: [Errno 2] 没有那个文件或目录: '../lib/python3.7/site-packages/numpy-1.21.6.dist-info/METADATA'找到目录也就是:/lib/python3.7/site-packages/numpy-1.21.6.dist-info,然后创建一个文件METADTATA。

2023-02-24 21:43:06 1318

原创 Python + Uniprot获取蛋白质的功能向量

官网http://geneontology.org/docs/download-ontology/http://purl.obolibrary.org/obo/go.obo,右键点击该链接。我随机选中HSPA8基因的4个,然后 Download得到一个压缩包。3.对得到的压缩包进行数据处理,生成蛋白质数据的dataframe。1. 需要一个.obo文件,为了获得现在所有蛋白质的功能GO。选择’链接另存为’,即可下载最新版的go.obo文件。4. 处理得到最新的GO字典,并生成功能标签。

2023-01-17 15:04:12 457

原创 Linux导出环境包 .yaml permission deined

存在的目的是提供当前代码运行所需要的环境或者依赖信息,即这些东西的安装是当前代码运行的前提条件。这些信息相当于是开发者给使用者提供的用于恢复自己开发时的环境的信息。首先,我使用 ls -l,查看了anaconda的权限,发现权限正常,root,用户和其他都有读、写、可执行的权限。1. LInux导出环境包一般有2种:requirement.txt;然后,我发现当前路径不在代码目录下,换到代码目录下可以成功转出。4. 审稿意见涉及导出环境.yml,但是我一直permission deined。

2023-01-14 22:11:58 497

原创 HDIContact: a novel predictor of residue–residue contacts on hetero-dimer interfaces via sequential

HDIContact: a novel predictor of residue–residue contacts on hetero-dimer interfaces via sequential information and transfer learning strategy文章梳理

2022-08-31 11:07:00 2990 3

原创 python 获取某个字符指定字符的前面、后面和中间的字符

获取某个字符指定字符的前面或后面的所有字符内容

2022-08-18 15:59:03 10841 1

原创 python 读取.csv文件,跳过第一行的表头:drop

读取.csv文件,跳过第一行的表头:drop

2022-08-10 17:38:14 4525

原创 python: No module named ‘gensim‘ 和 Read timed out

No module named 'gensim' 和 Read timed out

2022-08-09 16:48:36 1569

原创 python tensorflow==1.13.1安装

python tensorflow==1.13.1安装

2022-08-09 14:56:30 2870 1

原创 根据Uniprot ID/PDB ID批处理获取蛋白质.pdb文件

根据Uniprot ID/PDB ID批处理获取蛋白质.pdb文件

2022-07-31 18:08:16 5060 6

原创 二维、三维、四维矩阵每个维度含义解释

shape维度分析

2022-07-20 21:11:46 9152

原创 python 服务器批处理得到PSSM矩阵

批处理获得蛋白质的PSSM矩阵

2022-07-20 11:10:36 1196 9

原创 国际学术论文写作与发表 期末考试

2多选题3判断题

2022-05-09 14:48:45 1460

原创 matlab .mat转.txt

matlab 处理数据将.mat转.txt,代码如下clear allload('MixPA.mat')T=cell2table(protein_A); #数据集里面有个名字writetable(T,'Mix.AC_P1.txt');我应该集齐了所有文件转换处理的方法,摸摸自己,今天又是洒泪的一天,嘿嘿嘿……#########################写代码头秃的分割线系统说我质量较低,我应该再写点废话。我是一个菜鸟,挣扎在毕业一线,还有3年毕业,每天担心毕业到头秃,

2022-05-08 17:31:47 1656 3

原创 matlab .txt转.mat,.csv转.mat

处理数据信息需要使用不同的软件,python与matlab共同处理数据,以下是使用matlab将.txt和.csv文件转为.mat文件的代码:clc;close all;clear all;cancerPA=importdata('cancerPA.txt') #.csv就直接输入 X.csv就行save cancerPA.mat cancerPA;至此,python的文件转换,matlab的文件转换都差不多经历了,期待与大家的交流。...

2022-05-06 15:14:18 2399 1

原创 .txt经过数据处理之后存为.txt

对.txt文件,经过处理提取之后,存为.txt文件,可以采用以下代码:file_1 = '/cancer_fasta_PA.txt' #读取的.txt文件file_3 = '/cancerPA.txt' #要保存的.txt文件# positive seq protein Apos_seq_protein_A = read_file(file_1) #这里的读取是前一个文章写的outfile1=open(file_3,'w')#方法一for line in po

2022-05-05 22:57:16 294

原创 蛋白质序列处理,只保存蛋白质序列,而不存ID等

通常蛋白质从数据库中下载后,会有如下的信息,每个蛋白质第一行的信息,对于只关注序列的人来说,是多余的,如何将第一行去掉,并将一条蛋白质完整显示,用以下代码:def read_file(file_name): pro_swissProt = [] with open(file_name, 'r') as fp: protein = '' for line in fp: if line.startswith('>sp|.

2022-05-05 16:42:54 933

原创 ModuleNotFoundError: No module named ‘astunparse‘

之前正常运行的代码报错:ModuleNotFoundError: No module named 'astunparse',解决方法:首先,关掉pycharm、vscode等编辑软件第二,别慌,百度什么pip不要信我pip以后报错 no attribute placeholder,后来无限循环报错。最终,我看到可能是tensorflow有问题,我用的是tensorflow==1.13.1版本,可能是软件包有问题,采用了卸载、重下,具体常规代码如下:pip uninstall tensorf

2022-05-05 16:32:30 1932

原创 服务器代码运行的小tips

在远程服务器跑代码时,半夜网络不稳定出现笔记本断网,且不能自动连接,而服务器在短暂断网后可以自动链接,导致代码运行终止。或者笔记本跑代码,但是可能要坐电梯一段时间没有网。我们针对这种情况,可以用screen指令。几个常用的指令如下:1)创建一个自己的screen,最好不要用数字,用字母screen -S LXX ##LXX是名字2)进去之后就是激活自己的环境啊,正常跑。然后退出这个screen用 ctrl+A当左下角有个条条闪的厉害,再+D。3)查看所有的screenscree

2022-04-21 10:36:36 603 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除