네이버 실시간 검색어 크롤링 (2줄) JSON 버전

네이버 실시간 급상승 크롤링 02

http://naver.com

JSON 데이터를 받아 DataFrame으로 만들기 import 문을 제외하면 딱 2줄 !

2017 https://fb.com/financedata

딱 2줄

실시간 검색어 순위 JOSN 데이터를 반환하는 URL

http://rank.search.naver.com/rank.js

In [1]:
import json, requests
from pandas.io.json import json_normalize

r = requests.get('http://rank.search.naver.com/rank.js')
json_normalize(json.loads(r.text), ['data', 'data'])
Out[1]:
change cvalue delta keyword rank ratio score tvalue
0 + 599 0 사전투표 시간 1 . 192 56.21390
1 + 749 0 사전투표 장소 2 . 132 52.45960
2 + 1164 0 사전투표소 3 . 78 54.46210
3 + 1421 0 함소원 4 . 147 44.00840
4 + 221 0 모나코 유벤투스 5 . 321 21.12321
5 + 291 0 중앙 선거 관리 위원회 6 . 141 18.95175
6 + 253 0 이태곤 7 . 210 15.83204
7 + 553 0 사전투표 8 . 33 15.79520
8 + 287 0 2017년 대통령선거 사전투표 9 . 48 13.27780
9 + 105 0 사전투표 방법 10 . 183 7.80736
10 + 76 0 한끼줍쇼 11 . 84 6.92447
11 + 99 0 연금복권 12 . 72 6.83610
12 + 214 1 가족관계증명서 인터넷발급 13 + 45 6.07105
13 + 76 1 이수경 14 - 129 5.79043
14 + 76 0 공유 15 . 81 5.32559
15 + 66 0 챔피언스리그 16 . 84 5.12675
16 + 217 0 백상예술대상 17 . 66 4.96103
17 + 96 0 유담 18 . 51 4.74116
18 + 86 0 주민등록등본인터넷발급 19 new 54 4.03766
19 + 350 0 한포진 20 . 297 41.36780
In [2]:
# time stamp

r = requests.get('http://rank.search.naver.com/rank.js')
json.loads(r.text)['ts']
Out[2]:
'2017-05-04T08:31:00+0900'

댓글

Comments powered by Disqus