指定多个分隔符——re.split()

1
2
3
import re
text='3,5.6:6'
print(re.split('[.,:]',text))
1
2
# 输出 
['3', '5', '6', '6']

表格分列——str.split()

1
pandas.Series.str.split(pat=None, n=-1, expand=False)

pat表示分隔符,默认以空格分隔;n表示分割次数,默认为 -1,即分隔所有;

expand为true,表示会把切割出来的内容当做一列,产生多列,若为False,则把切割后的内容当作一个列表。

提取前几个字符

1
2
# x[0:2]前二位
df['列名']=df['列名'].apply(lambda x:x[0:2]).tolist()

实例

1
2
3
Login_nei['shengfen'] = Login_nei['login_place'].apply(lambda x:x[2:5]).tolist()
Login_nei['chengshi'] = Login_nei['login_place'].apply(lambda x:x[5:]).tolist()
Login_nei.head()

指定分隔符分列

1
2
3
4
5
6
7
#将日期与时间分割
Login1 = Login["login_time"].str.split(" ",expand=True).fillna("")
Login1['login_data'] = Login1[0]
Login1['login_hour'] = Login1[1]
Login1['user_id'] = Login['user_id']
Login2 = Login1[['user_id','login_data','login_hour']]
Login2.head()