【3】数据分析--10--科学计算--Pandas--7--Pandas字符串处理

1. 分割列的字符

import pandas as pd  
data['name'].str.split('|',expand=True)  

关键是参数expand,这个参数取True时,会把切割出来的内容当做一列。 如果不需要pandas为你分好列,expand=False就可以了。

然后,我们如果只想要第一列的话,只需要做:

data['name'].str.split('|',expand=True)[0]  

2. 合并列成一个新列

如果某一列是非str类型的数据,那么我们需要用到map(str)将那一列数据类型做转换:

dataframe["newColumn"] = dataframe["age"].map(str) + dataframe["phone"] + dataframe["address”]

3. 对某列的字符串做统计长度

test['contentLen2'] = test['content'].str.len()

3. 提出某一列某个位置的字符串

df['pfsc'] = df['PFSC Sequence'].str[2]

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学