hannanum delte number_x

양지수
Commit cffaec027c801a497d0f25e1bafb494a62bd80b7 cffaec02 1 parent 37839d27
Showing 5 changed files with 17 additions and 4 deletions
hmm1월.xlsx
hmm1월_명사추출.xlsx
hmm2월_명사추출.xlsx
hmm2월_명사추출_숫자제외.xlsx
knp.py
--- a/hmm1월.xlsx 0 → 100644
View file @cffaec0
+++ b/hmm1월.xlsx 0 → 100644
View file @cffaec0
--- a/hmm1월_명사추출.xlsx 0 → 100644
View file @cffaec0
+++ b/hmm1월_명사추출.xlsx 0 → 100644
View file @cffaec0
--- a/hmm2월_명사추출.xlsx 0 → 100644
View file @cffaec0
+++ b/hmm2월_명사추출.xlsx 0 → 100644
View file @cffaec0
--- a/hmm2월_명사추출_숫자제외.xlsx 0 → 100644
View file @cffaec0
+++ b/hmm2월_명사추출_숫자제외.xlsx 0 → 100644
View file @cffaec0
--- a/knp.py
View file @cffaec0
+++ b/knp.py
View file @cffaec0
@@ -9,7 +9,10 @@ import pandas as pd
 #okt = Okt()
 hannanum = Hannanum()
 #filename= input("분석할 파일이름 입력:") #파일명
-kfile=openpyxl.load_workbook('C:/Users/yangj/PycharmProjects/pythonProject1/고려아연2월.xlsx')#파일이름입력
+filefolder = input("종목폴더입력: ")
+filename=input("파일이름입력:")
+filepos = "C:/Users/yangj/PycharmProjects/pythonProject1/뉴스크롤링/"+filefolder+"/" + filename + ".xlsx"
+kfile = openpyxl.load_workbook(filepos)#파일이름입력
 sheet=kfile.worksheets[0]#sheet1에 있는 데이터 가죠오기
 #print(sheet)
 data=[]
@@ -26,7 +29,17 @@ newData2=[]
 #print(newData)
 for i in range(len(data)-1):
     newData2.append(hannanum.nouns(data[i+1])) #명사만 추출hannanum가 okt보다 성능좋음
-#print(newData2)
+print(newData2)
+
+newData3=[]
+for i in range(len(newData2)):
+    newData3.append([])
+    for j in newData2[i]:
+        if any(map(str.isdigit,j))==False:
+            newData3[i].append(j)
+print(newData3)
+
 #print(type(newData2))#newData2 데이터 형식은 list
-df= pd.DataFrame.from_records(newData2)#newData2 dataframe으로 변환
-df.to_excel('test.xlsx')#test라는 파일명의 엑셀로 변환
\ No newline at end of file
+df= pd.DataFrame.from_records(newData3)#newData2 dataframe으로 변환
+df.to_excel(filename+'_명사추출_숫자제외'+'.xlsx') #파일명의 엑셀로 변환
+