Showing
3 changed files
with
6 additions
and
108 deletions
naverNews/main.py
deleted
100644 → 0
1 | -{ | ||
2 | - "cells": [ | ||
3 | - { | ||
4 | - "cell_type": "code", | ||
5 | - "execution_count": 2, | ||
6 | - "metadata": {}, | ||
7 | - "outputs": [ | ||
8 | - { | ||
9 | - "name": "stdout", | ||
10 | - "output_type": "stream", | ||
11 | - "text": [ | ||
12 | - "******************************\n", | ||
13 | - "\n", | ||
14 | - "\n", | ||
15 | - "***< Naver News Crawling >****\n", | ||
16 | - "\n", | ||
17 | - "\n", | ||
18 | - "******************************\n", | ||
19 | - "검색하고자 하는 url을 입력해주세요: https://entertain.naver.com/ranking/comment/list?oid=144&aid=0000642175\n", | ||
20 | - "comment_list를 가져오는 중.....\n", | ||
21 | - "Message: element not interactable\n", | ||
22 | - " (Session info: chrome=78.0.3904.97)\n", | ||
23 | - "\n", | ||
24 | - "[{'userID': 'ydja****', 'comment': '옹벤져스 너무웃겨', 'time': '6일 전'}, {'userID': 'kims****', 'comment': '사랑해요 옹벤져스! 준기엄마 다리 찢을 때 웃겨죽는 줄 진짜 츤데레언니들', 'time': '6일 전'}, {'userID': 'hoho****', 'comment': '옹벤져스가 다른 마을 살인마 잡는 이야기로 시즌 2. 갑시다', 'time': '6일 전'}]\n", | ||
25 | - "comment_list를 다 가져왔습니다!\n" | ||
26 | - ] | ||
27 | - } | ||
28 | - ], | ||
29 | - "source": [ | ||
30 | - "import naverNews_crawling \n", | ||
31 | - "from time import sleep\n", | ||
32 | - "\n", | ||
33 | - "def print_cList(c_List) :\n", | ||
34 | - " for item in c_List :\n", | ||
35 | - " print(item)\n", | ||
36 | - "\n", | ||
37 | - "def search_by_author(c_List,user_ID) :\n", | ||
38 | - " result_List = []\n", | ||
39 | - " for item in c_List :\n", | ||
40 | - " print(item['userID'])\n", | ||
41 | - " if ( user_ID in item['userID']) :\n", | ||
42 | - " result_List.append(item)\n", | ||
43 | - " return result_List\n", | ||
44 | - "\n", | ||
45 | - "def search_by_keyword(c_List,keyword) :\n", | ||
46 | - " result_List = []\n", | ||
47 | - " for item in c_List :\n", | ||
48 | - " print(item['comment'])\n", | ||
49 | - " if ( keyword in item['comment']) :\n", | ||
50 | - " result_List.append(item)\n", | ||
51 | - " return result_List\n", | ||
52 | - " \n", | ||
53 | - "'''\n", | ||
54 | - "def search_by_time(c_List,_time) :\n", | ||
55 | - " result_List = []\n", | ||
56 | - " for item in c_List :\n", | ||
57 | - " print(item['time'])\n", | ||
58 | - " if ( keyword in item['comment']) :\n", | ||
59 | - " result_List.append(item)\n", | ||
60 | - " return result_List \n", | ||
61 | - " \n", | ||
62 | - "''' \n", | ||
63 | - "\n", | ||
64 | - "def main ():\n", | ||
65 | - " ## 시작화면\n", | ||
66 | - " \n", | ||
67 | - " _star = '*'\n", | ||
68 | - " print(_star.center(30,'*'))\n", | ||
69 | - " print('\\n')\n", | ||
70 | - " headString = '< Naver News Crawling >'\n", | ||
71 | - " print(headString.center(30,'*'))\n", | ||
72 | - " print('\\n')\n", | ||
73 | - " print(_star.center(30,'*'))\n", | ||
74 | - " \n", | ||
75 | - " \n", | ||
76 | - " # 검색하고자 하는 url을 입력받는다\n", | ||
77 | - " _url = input('검색하고자 하는 url을 입력해주세요: ')\n", | ||
78 | - " print('comment_list를 가져오는 중.....')\n", | ||
79 | - " cList = naverNews_crawling.getData(_url)\n", | ||
80 | - " print('comment_list를 다 가져왔습니다!')\n", | ||
81 | - "\n", | ||
82 | - "main()" | ||
83 | - ] | ||
84 | - } | ||
85 | - ], | ||
86 | - "metadata": { | ||
87 | - "kernelspec": { | ||
88 | - "display_name": "Python 3", | ||
89 | - "language": "python", | ||
90 | - "name": "python3" | ||
91 | - }, | ||
92 | - "language_info": { | ||
93 | - "codemirror_mode": { | ||
94 | - "name": "ipython", | ||
95 | - "version": 3 | ||
96 | - }, | ||
97 | - "file_extension": ".py", | ||
98 | - "mimetype": "text/x-python", | ||
99 | - "name": "python", | ||
100 | - "nbconvert_exporter": "python", | ||
101 | - "pygments_lexer": "ipython3", | ||
102 | - "version": "3.7.3" | ||
103 | - } | ||
104 | - }, | ||
105 | - "nbformat": 4, | ||
106 | - "nbformat_minor": 2 | ||
107 | -} |
... | @@ -24,4 +24,9 @@ | ... | @@ -24,4 +24,9 @@ |
24 | data를 get하여 정제하는 파일을 모듈로 분리해 내어 list형태로 저장된 데이터셋을 반환하여 | 24 | data를 get하여 정제하는 파일을 모듈로 분리해 내어 list형태로 저장된 데이터셋을 반환하여 |
25 | main 에서 사용할 수 있도록 한다. 이 후 main에서 리스트를 받아와 url을 입력받아 데이터를 | 25 | main 에서 사용할 수 있도록 한다. 이 후 main에서 리스트를 받아와 url을 입력받아 데이터를 |
26 | 받아오는 방식으로 사용한다. 이 후, keyword기반, id기반, 시간대 기반 검색 함수를 구현하였고 | 26 | 받아오는 방식으로 사용한다. 이 후, keyword기반, id기반, 시간대 기반 검색 함수를 구현하였고 |
27 | - 시간대별 검색 함수의 기능 보강과 가장 자주 나온 단어 검색 기능을 추가 구현할 예정이다. | ||
... | \ No newline at end of file | ... | \ No newline at end of file |
27 | + 시간대별 검색 함수의 기능 보강과 가장 자주 나온 단어 검색 기능을 추가 구현할 예정이다. | ||
28 | + | ||
29 | +* 4차 수정사항 | ||
30 | + | ||
31 | + 기존파일의 분라 관리 시, import관련 오류 문제 해결 완료(하나의 파일로 관리) | ||
32 | + 사용자 UI의 틀을 구축해놓았고, 곧바로 함수별 추가 세부 구현 예정 | ||
... | \ No newline at end of file | ... | \ No newline at end of file | ... | ... |
This diff is collapsed. Click to expand it.
-
Please register or login to post a comment