Toggle navigation
Toggle navigation
This project
Loading...
Sign in
김건
/
Comment_Analysis
Go to a project
Toggle navigation
Toggle navigation pinning
Projects
Groups
Snippets
Help
Project
Activity
Repository
Pipelines
Graphs
Issues
0
Merge Requests
0
Wiki
Snippets
Network
Create a new issue
Builds
Commits
Issue Boards
Authored by
장준영
2019-12-08 22:01:50 +0900
Browse Files
Options
Browse Files
Download
Email Patches
Plain Diff
Commit
472a21caec8b7294df91443391346fce9b981dec
472a21ca
1 parent
06b9bee0
가장 많이 나온 단어 출력 함수 구현
Hide whitespace changes
Inline
Side-by-side
Showing
2 changed files
with
40 additions
and
2 deletions
naverNews/naverNews.md
naverNews/naverNews_crawling.py
naverNews/naverNews.md
View file @
472a21c
...
...
@@ -38,4 +38,8 @@
코드 추가)
2) 시간대별로 (시작시간, 끝시간)을 입력하여 그 시간에 해당하는 기사를 출력해주는 함수 구현
가장 자주 많이 나온 단어 검색과 MATPLOTLIB을 활용한 시각적 표현 구현 예정
\ No newline at end of file
가장 자주 많이 나온 단어 검색과 MATPLOTLIB을 활용한 시각적 표현 구현 예정
*
6차 수정사항
konlpy를 활용한 명사 추출 및 단어 빈도수가 많으 순대로 사용자가 입력한 limit만큼 출력해주는 함수 구현 완료
\ No newline at end of file
...
...
naverNews/naverNews_crawling.py
View file @
472a21c
...
...
@@ -2,6 +2,8 @@ from selenium import webdriver
from
selenium.common
import
exceptions
from
bs4
import
BeautifulSoup
from
datetime
import
datetime
,
timedelta
from
konlpy.tag
import
Twitter
from
collections
import
Counter
import
time
...
...
@@ -160,7 +162,27 @@ def search_by_time(c_List,startTime, endTime) :
result_List
.
append
(
item
)
return
result_List
def
printMostShowed
(
c_List
,
limit
):
temp
=
""
result
=
""
for
item
in
c_List
:
temp
=
str
(
item
[
'comment'
])
+
" "
result
=
result
+
temp
sp
=
Twitter
()
nouns
=
sp
.
nouns
(
result
)
_cnt
=
Counter
(
nouns
)
tempList
=
[]
repCnt
=
0
for
i
,
j
in
_cnt
.
most_common
(
limit
):
print
(
str
(
repCnt
+
1
)
+
'. '
+
str
(
i
)
+
" : "
+
str
(
j
))
repCnt
+=
1
def
printResult
(
c_List
):
for
i
in
range
(
0
,
len
(
c_List
)):
print
(
c_List
[
i
])
...
...
@@ -182,6 +204,7 @@ def main ():
print
(
'comment_list를 가져오는 중.....'
)
cList
=
getData
(
_url
)
refine_time
(
cList
)
#printMostShowed(cList,10)
print
(
'
\n
'
)
print
(
'comment_list를 다 가져왔습니다!'
)
...
...
@@ -190,6 +213,7 @@ def main ():
print
(
'1.닉네임 기반 검색'
)
print
(
'2.키워드 기반 검색'
)
print
(
'3.작성시간 기반 검색'
)
print
(
'4.자주 나타난 단어 출력'
)
menu
=
input
(
'메뉴를 입력해주세요: '
)
if
(
menu
==
str
(
1
)):
...
...
@@ -218,6 +242,16 @@ def main ():
_result
=
search_by_time
(
cList
,
startTime
,
endTime
)
printResult
(
_result
)
elif
(
menu
==
str
(
4
)):
print
(
'***********************************'
)
inputLimit
=
input
(
'상위 몇 개 까지 보고 싶은지 입력하세요(1~20): '
)
while
(
True
):
if
(
int
(
inputLimit
)
<=
0
or
int
(
inputLimit
)
>
20
):
inputLimit
=
input
(
'상위 몇 개 까지 보고 싶은지 입력하세요(1~20): '
)
else
:
break
printMostShowed
(
cList
,
int
(
inputLimit
))
else
:
print
(
'잘못된 입력입니다'
)
continue
...
...
Please
register
or
login
to post a comment