네이버 실시간 검색어 크롤링 (2줄) JSON 버전

plusjune

2017-05-03 11:43

네이버 실시간 급상승 크롤링 02¶

http://naver.com

JSON 데이터를 받아 DataFrame으로 만들기 import 문을 제외하면 딱 2줄 !

2017 https://fb.com/financedata ¶

딱 2줄¶

실시간 검색어 순위 JOSN 데이터를 반환하는 URL

http://rank.search.naver.com/rank.js

In [1]:

import json, requests
from pandas.io.json import json_normalize

r = requests.get('http://rank.search.naver.com/rank.js')
json_normalize(json.loads(r.text), ['data', 'data'])

Out[1]:

	change	cvalue	delta	keyword	rank	ratio	score	tvalue
0	+	599	0	사전투표 시간	1	.	192	56.21390
1	+	749	0	사전투표 장소	2	.	132	52.45960
2	+	1164	0	사전투표소	3	.	78	54.46210
3	+	1421	0	함소원	4	.	147	44.00840
4	+	221	0	모나코 유벤투스	5	.	321	21.12321
5	+	291	0	중앙 선거 관리 위원회	6	.	141	18.95175
6	+	253	0	이태곤	7	.	210	15.83204
7	+	553	0	사전투표	8	.	33	15.79520
8	+	287	0	2017년 대통령선거 사전투표	9	.	48	13.27780
9	+	105	0	사전투표 방법	10	.	183	7.80736
10	+	76	0	한끼줍쇼	11	.	84	6.92447
11	+	99	0	연금복권	12	.	72	6.83610
12	+	214	1	가족관계증명서 인터넷발급	13	+	45	6.07105
13	+	76	1	이수경	14	-	129	5.79043
14	+	76	0	공유	15	.	81	5.32559
15	+	66	0	챔피언스리그	16	.	84	5.12675
16	+	217	0	백상예술대상	17	.	66	4.96103
17	+	96	0	유담	18	.	51	4.74116
18	+	86	0	주민등록등본인터넷발급	19	new	54	4.03766
19	+	350	0	한포진	20	.	297	41.36780

In [2]:

# time stamp

r = requests.get('http://rank.search.naver.com/rank.js')
json.loads(r.text)['ts']

Out[2]:

'2017-05-04T08:31:00+0900'

2017 https://financedata.github.io ¶