指定多个分隔符——re.split()
1 2 3
| import re text='3,5.6:6' print(re.split('[.,:]',text))
|
表格分列——str.split()
1
| pandas.Series.str.split(pat=None, n=-1, expand=False)
|
pat表示分隔符,默认以空格分隔;n表示分割次数,默认为 -1,即分隔所有;
expand为true,表示会把切割出来的内容当做一列,产生多列,若为False,则把切割后的内容当作一个列表。
提取前几个字符
1 2
| df['列名']=df['列名'].apply(lambda x:x[0:2]).tolist()
|
实例
1 2 3
| Login_nei['shengfen'] = Login_nei['login_place'].apply(lambda x:x[2:5]).tolist() Login_nei['chengshi'] = Login_nei['login_place'].apply(lambda x:x[5:]).tolist() Login_nei.head()
|
指定分隔符分列
1 2 3 4 5 6 7
| Login1 = Login["login_time"].str.split(" ",expand=True).fillna("") Login1['login_data'] = Login1[0] Login1['login_hour'] = Login1[1] Login1['user_id'] = Login['user_id'] Login2 = Login1[['user_id','login_data','login_hour']] Login2.head()
|