Showing
5 changed files
with
17 additions
and
4 deletions
hmm1월.xlsx
0 → 100644
No preview for this file type
hmm1월_명사추출.xlsx
0 → 100644
No preview for this file type
hmm2월_명사추출.xlsx
0 → 100644
No preview for this file type
hmm2월_명사추출_숫자제외.xlsx
0 → 100644
No preview for this file type
| ... | @@ -9,7 +9,10 @@ import pandas as pd | ... | @@ -9,7 +9,10 @@ import pandas as pd |
| 9 | #okt = Okt() | 9 | #okt = Okt() |
| 10 | hannanum = Hannanum() | 10 | hannanum = Hannanum() |
| 11 | #filename= input("분석할 파일이름 입력:") #파일명 | 11 | #filename= input("분석할 파일이름 입력:") #파일명 |
| 12 | -kfile=openpyxl.load_workbook('C:/Users/yangj/PycharmProjects/pythonProject1/고려아연2월.xlsx')#파일이름입력 | 12 | +filefolder = input("종목폴더입력: ") |
| 13 | +filename=input("파일이름입력:") | ||
| 14 | +filepos = "C:/Users/yangj/PycharmProjects/pythonProject1/뉴스크롤링/"+filefolder+"/" + filename + ".xlsx" | ||
| 15 | +kfile = openpyxl.load_workbook(filepos)#파일이름입력 | ||
| 13 | sheet=kfile.worksheets[0]#sheet1에 있는 데이터 가죠오기 | 16 | sheet=kfile.worksheets[0]#sheet1에 있는 데이터 가죠오기 |
| 14 | #print(sheet) | 17 | #print(sheet) |
| 15 | data=[] | 18 | data=[] |
| ... | @@ -26,7 +29,17 @@ newData2=[] | ... | @@ -26,7 +29,17 @@ newData2=[] |
| 26 | #print(newData) | 29 | #print(newData) |
| 27 | for i in range(len(data)-1): | 30 | for i in range(len(data)-1): |
| 28 | newData2.append(hannanum.nouns(data[i+1])) #명사만 추출hannanum가 okt보다 성능좋음 | 31 | newData2.append(hannanum.nouns(data[i+1])) #명사만 추출hannanum가 okt보다 성능좋음 |
| 29 | -#print(newData2) | 32 | +print(newData2) |
| 33 | + | ||
| 34 | +newData3=[] | ||
| 35 | +for i in range(len(newData2)): | ||
| 36 | + newData3.append([]) | ||
| 37 | + for j in newData2[i]: | ||
| 38 | + if any(map(str.isdigit,j))==False: | ||
| 39 | + newData3[i].append(j) | ||
| 40 | +print(newData3) | ||
| 41 | + | ||
| 30 | #print(type(newData2))#newData2 데이터 형식은 list | 42 | #print(type(newData2))#newData2 데이터 형식은 list |
| 31 | -df= pd.DataFrame.from_records(newData2)#newData2 dataframe으로 변환 | ||
| 32 | -df.to_excel('test.xlsx')#test라는 파일명의 엑셀로 변환 | ||
| ... | \ No newline at end of file | ... | \ No newline at end of file |
| 43 | +df= pd.DataFrame.from_records(newData3)#newData2 dataframe으로 변환 | ||
| 44 | +df.to_excel(filename+'_명사추출_숫자제외'+'.xlsx') #파일명의 엑셀로 변환 | ||
| 45 | + | ... | ... |
-
Please register or login to post a comment