Showing
1 changed file
with
32 additions
and
0 deletions
knp.py
0 → 100644
| 1 | +import warnings | ||
| 2 | +warnings.simplefilter(("ignore")) | ||
| 3 | +import konlpy | ||
| 4 | +from konlpy.tag import * | ||
| 5 | +import openpyxl | ||
| 6 | +import pandas as pd | ||
| 7 | + | ||
| 8 | +#형태소분석라이브러리 | ||
| 9 | +#okt = Okt() | ||
| 10 | +hannanum = Hannanum() | ||
| 11 | +#filename= input("분석할 파일이름 입력:") #파일명 | ||
| 12 | +kfile=openpyxl.load_workbook('C:/Users/yangj/PycharmProjects/pythonProject1/고려아연2월.xlsx')#파일이름입력 | ||
| 13 | +sheet=kfile.worksheets[0]#sheet1에 있는 데이터 가죠오기 | ||
| 14 | +#print(sheet) | ||
| 15 | +data=[] | ||
| 16 | +for row in sheet.rows: #data에 크롤링한 뉴스 제목들 저장 | ||
| 17 | + data.append( | ||
| 18 | + row[1].value | ||
| 19 | + ) | ||
| 20 | +#print(data) | ||
| 21 | +#print(type(data[1])) #str | ||
| 22 | +#newData=[] | ||
| 23 | +newData2=[] | ||
| 24 | +#for i in range(len(data)): | ||
| 25 | +# newData.append(okt.nouns(data[i])) #명사만 추출okt | ||
| 26 | +#print(newData) | ||
| 27 | +for i in range(len(data)-1): | ||
| 28 | + newData2.append(hannanum.nouns(data[i+1])) #명사만 추출hannanum가 okt보다 성능좋음 | ||
| 29 | +#print(newData2) | ||
| 30 | +#print(type(newData2))#newData2 데이터 형식은 list | ||
| 31 | +df= pd.DataFrame.from_records(newData2)#newData2 dataframe으로 변환 | ||
| 32 | +df.to_excel('test.xlsx')#test라는 파일명의 엑셀로 변환 | ||
| ... | \ No newline at end of file | ... | \ No newline at end of file |
-
Please register or login to post a comment