반응형
Pandas는 목록 열을 여러 열로 분할합니다.
다음과 같은 하나의 열이있는 pandas dataFrame이 있습니다.
`
In [207]:df2.teams
Out[207]:
0 [SF, NYG]
1 [SF, NYG]
2 [SF, NYG]
3 [SF, NYG]
4 [SF, NYG]
5 [SF, NYG]
6 [SF, NYG]
7 [SF, NYG]
`
이 목록 열을 pandas를 사용하여 team1과 team2라는 2 개의 열로 분할해야합니다.
당신은 사용할 수 있습니다 DataFrame
와 생성자 lists
로 변환하여 생성을 numpy array
에서 values
와 tolist
:
import pandas as pd
d1 = {'teams': [['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG'],
['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG']]}
df2 = pd.DataFrame(d1)
print (df2)
teams
0 [SF, NYG]
1 [SF, NYG]
2 [SF, NYG]
3 [SF, NYG]
4 [SF, NYG]
5 [SF, NYG]
6 [SF, NYG]
df2[['team1','team2']] = pd.DataFrame(df2.teams.values.tolist(), index= df2.index)
print (df2)
teams team1 team2
0 [SF, NYG] SF NYG
1 [SF, NYG] SF NYG
2 [SF, NYG] SF NYG
3 [SF, NYG] SF NYG
4 [SF, NYG] SF NYG
5 [SF, NYG] SF NYG
6 [SF, NYG] SF NYG
그리고 새로운 DataFrame
:
df3 = pd.DataFrame(df2['teams'].values.tolist(), columns=['team1','team2'])
print (df3)
team1 team2
0 SF NYG
1 SF NYG
2 SF NYG
3 SF NYG
4 SF NYG
5 SF NYG
6 SF NYG
솔루션 apply(pd.Series)
이 매우 느립니다.
#7k rows
df2 = pd.concat([df2]*1000).reset_index(drop=True)
In [89]: %timeit df2['teams'].apply(pd.Series)
1 loop, best of 3: 1.15 s per loop
In [90]: %timeit pd.DataFrame(df2['teams'].values.tolist(), columns=['team1','team2'])
1000 loops, best of 3: 820 µs per loop
훨씬 간단한 솔루션 :
pd.DataFrame(df2.teams.tolist(), columns=['team1', 'team2'])
수확량,
team1 team2
-------------
0 SF NYG
1 SF NYG
2 SF NYG
3 SF NYG
4 SF NYG
5 SF NYG
6 SF NYG
7 SF NYG
목록이 아닌 구분 된 문자열 열을 분할하려는 경우 다음과 같이 유사하게 수행 할 수 있습니다.
pd.DataFrame(df.teams.str.split('<delim>', expand=True).values,
columns=['team1', 'team2'])
제안 된 솔루션과 달리 구문 론적으로 더 간단한 방법이 있으므로 기억하기가 더 쉽습니다. 데이터 프레임 df에서 열이 '메타'라고 가정합니다.
df2 = pd.DataFrame(df['meta'].str.split().values.tolist())
This solution preserves the index of the df2
DataFrame, unlike any solution that uses tolist()
:
df3 = df2.teams.apply(pd.Series)
df3.columns = ['team1', 'team2']
Here's the result:
team1 team2
0 SF NYG
1 SF NYG
2 SF NYG
3 SF NYG
4 SF NYG
5 SF NYG
6 SF NYG
참고URL : https://stackoverflow.com/questions/35491274/pandas-split-column-of-lists-into-multiple-columns
반응형
'programing' 카테고리의 다른 글
vim에서 현재 파일을 어떻게 삭제할 수 있습니까? (0) | 2020.10.18 |
---|---|
HTML5 Canvas DrawImage : 안티 앨리어싱을 적용하는 방법 (0) | 2020.10.18 |
NSString 인스턴스가 NSArray에 포함되어 있는지 확인 (0) | 2020.10.18 |
Zsh로 iTerm2 시작하기 (0) | 2020.10.18 |
Joda-Time DateTime에 하루 추가 (0) | 2020.10.18 |