用python处理蛋白质互作信息 - 代码天地

用python处理蛋白质互作信息

其他 2019-04-13 10:31:13 阅读次数: 0

水一篇博客

f=open('tihuan.txt')#打开文件
old_id=[]#定义其为列表
new_id=[]
dict1={}#其为字典
string=[]#其为列表
for each_line in f:  #对f每行进行遍历
	（old,new)=each_line.strip().splist('\t',1)#见注释1
	old_id.append(old)#将old元素加入old_id列表中
	new_id.append(new)#同理
dict1=dict (zip(old_id,new_id)	)#见注释2
h=open('yuan.txt')#打开文件h
for each_line in h:
	(A,B)=each_line.strip().splist('\t',1)
	if A>B:
		C=A
		A=B
		B=C#以上三行的作用是保证A的字典序<B的字典序 
	if ((A in dict1) and  (B in dict1));#如果dict1中存在key 值为A和key 值为B
		now =dict1[A]+'\t'+dict1[B]+'\n'#则将A所映射的value值与B所映射的value值成两列放入now中
		string.append(now)#也就是将统一格式后的new_id放入了string中
	elif ((A in dict1) and (B  not in dict1)):#后半句是转换ID后的替换文件中的old_id没有源文件中的B
		now =dict [A] +'\t'+B +'\n'#因为源文件中的相邻两列经过处理必定是两个相互作用的蛋白id,而经过转换后的文件中，可能发生丢失，所以一下几步是必要的
		string.append(now)
	elif ((A not in dict1) and (B in dict1)):
		now = A +'\t'+dict1[B]+'\n'
		string .append(now)
	else :
			now =A+'\t' +B +'\n'
			string.append(now)
	now_file=open('gai.txt','w)
	new_file.writeliness(string)#注释三
	new_file.close()
	f.close()

注释一：strip函数是删去行首和行尾的空格的空白符（‘\n','\t',' ','r')

splist 函数是切割函数，如splist('\t',1)表示按制表符进行切割，并且只切割一次。（old,new)是切割后的两个元素分别赋予old,new。

注释二：zip函数定义：从参数中的多个迭代器取元素组合成一个新的迭代器。返回：返回一个zip对象，其内部元素为元组，可转化为列表或字典。如：m=[1,2,3];n=[4,5,6];zip(m,n)的返回结果是（1，4），（2，5），（3，6）。并且dict(zip())）是将zip的返回结果字典化，即变为dict[1]=4,dict[2]=5,dict[3]=6。

其中1是key值，4是value值。

注释三：writeliness 函数的参数是序列或字符串，将其写入文件中。

细节，调用open 函数后，还要调用close函数。而用with open as函数可以不用再调用close函数。

ps:代码来源他出。

猜你喜欢

转载自blog.csdn.net/weixin_43770577/article/details/89278321

用python处理蛋白质互作信息

6️⃣蛋白质序列的功能信息分析1:基于蛋白质基序motif

蛋白质结构信息获取与解析（基于Biopython）

蛋白质功能预测

蛋白质结构预测

蛋白质组的哲学

DNA RNA 蛋白质

Python在生物信息学中的应用：基因组学与蛋白质组学

蛋白与蛋白互作预测蛋白互作预测protein

5️⃣ 蛋白质序列基本和特征信息分析(1) :蛋白质序列基本信息分析(氨基酸组成，理化性质，亲疏水等)...

6️⃣蛋白质序列的功能信息分析2:基于蛋白质结构域domain和功能位点分析

蛋白质组学研究概述

读懂蛋白质PDB文件

蛋白质减肥法

蛋白质的翻译后修饰

蛋白质结构模建初探

生物信息010-Biopython操作DNA,RNA和蛋白质序列

蛋白质GO信息的一些数据库

5️⃣ 蛋白质的特征信息1:跨膜结构分析

5️⃣蛋白质的特征信息2:信号肽的预测和识别

MIT透过机器学习技术用胺基酸预测蛋白质结构

超越云存储，用一勺蛋白质保存整个图书馆

PSP - 蛋白质结构预测 OpenFold Multimer 训练过程的特征预处理

PSP - 蛋白质复合物结构预测模版 (Template) 特征处理逻辑

perl实现蛋白质翻译以及蛋白质个数统计

癌症蛋白质分析利器：癌症蛋白质组图谱（TCPA）

PSP - 蛋白质序列提取 Transformer 蛋白质语言模型 ESM2 特征

基于Python实现的蛋白质二级结构预测

蛋白冠™蛋白质组学技术实现快速深入精确地解析血浆蛋白质图谱

重写：目前，大多数蛋白质仍然没有结构信息，没有足够确定的蛋白质结构来支持精确的预测方法。因此，基于蛋白质的三维结构来预测其功能是一种常见的方法。例如，当一个铁原子附着到血红蛋白蛋白质上时，这种血红蛋白...

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)