为了账号安全,请及时绑定邮箱和手机立即绑定

使用 Python 中的字典从 Hockey API 中抓取数据

使用 Python 中的字典从 Hockey API 中抓取数据

RISEBY 2023-05-09 15:06:07
我开始从事一个有趣的项目,以更好地练习我的数据抓取技能,我从 NHL API 抓取数据并尝试记录射门和进球的所有位置坐标(此 API 将向您显示任何 NHL 比赛并具有坐标以及在所述游戏中发生的每个事件的玩家信息)。但是,我在通过数据编制索引时遇到问题,而且我真的不确定如何处理它。下面是我的代码...import requests as rqimport csvGAME_ID = "2017021121" #Game ID indicates which game I want to look at...first 4 digits is the year, second two the point in season, (01 Pre, 02 Reg, 03 Playoffs, 04 All Star)#URL to access the coordinates of every event in given game...comes in nested dictionary formurl = f"https://statsapi.web.nhl.com/api/v1/game/{GAME_ID}/feed/live"game = rq.get(url)#turn the file into a readable onecontents = game.text#split text into list so we can fool around with itcontents_list = list(csv.reader(contents.splitlines()))def main():    file = open( f'coordinates.{GAME_ID}.txt', 'a')我现在要做的是使用 for 循环遍历数据集并检查“事件类型”以及它们是否等于“射门”或“目标”,以及它们是否要添加它们的值x, y 坐标到打印到新文件中的字典。我已经尝试通过自己建立索引,但我不太擅长数据抓取,所以我没有走得太远。作为参考,这里是数据集的样子(或至少是它的一个片段)。} ],        "result" : {          "event" : "Penalty",          "eventCode" : "COL162",          "eventTypeId" : "PENALTY",          "description" : "Blake Coleman Tripping against Erik Johnson",          "secondaryType" : "Tripping",          "penaltySeverity" : "Minor",          "penaltyMinutes" : 2        },        "about" : {          "eventIdx" : 30,          "eventId" : 162,          "period" : 1,          "periodType" : "REGULAR",          "ordinalNum" : "1st",          "periodTime" : "04:47",          "periodTimeRemaining" : "15:13",          "dateTime" : "2019-03-17T19:15:33Z",          "goals" : {            "away" : 0,            "home" : 0          }        },        "coordinates" : {          "x" : -58.0,          "y" : -37.0        },对我来说,它看起来像是一堆嵌套的字典,但我又不太确定。任何帮助将不胜感激!!谢谢你!!
查看完整描述

2 回答

?
慕仙森

TA贡献1827条经验 获得超7个赞

它看起来像一个大列表,包含字典列表。您可以使用for-each-loop.

for entry in list:

然后,您可以单独查看每个条目并检查它们是否eventTypeId等于shotgoal

if entry["result"]["eventTypeId"] == "SHOT":

在这种情况下,您可以像这样提取 X 和 Y 坐标的值:

x = entry["coordinates"]["x"]
y = entry["coordinates"]["y"]

之后,您可以使用这些坐标来做任何您想做的事情。


查看完整回答
反对 回复 2023-05-09
?
慕的地8271018

TA贡献1796条经验 获得超4个赞

您可以遍历列表,通过将所需数据放入字典中以使用 pandas 构建表。


import requests as rq

import pandas as pd


GAME_ID = "2017021121" #Game ID indicates which game I want to look at...first 4 digits is the year, second two the point in season, (01 Pre, 02 Reg, 03 Playoffs, 04 All Star)


#URL to access the coordinates of every event in given game...comes in nested dictionary form

url = f"https://statsapi.web.nhl.com/api/v1/game/{GAME_ID}/feed/live"

game = rq.get(url).json()

game = game['liveData']['plays']['allPlays']


rows = []

for each in game:

    if each['result']['event'] in ['Shot','Goal']:

        print(each['result']['event'])

        row = {

                'result':each['result']['event'],

                'x':each['coordinates']['x'],

                'y':each['coordinates']['y']}

        rows.append(row)

        

df = pd.DataFrame(rows)

输出:


print(df)

   result     x     y

0    Shot  76.0  -8.0

1    Shot -41.0 -24.0

2    Shot  69.0  -1.0

3    Shot  37.0  30.0

4    Shot -60.0   1.0

5    Goal  43.0 -20.0

6    Shot -85.0   6.0

7    Shot -83.0  11.0

8    Shot -85.0  -5.0

9    Shot  81.0  -1.0

10   Shot -84.0  -7.0

11   Shot -81.0  -3.0

12   Shot -57.0  12.0

13   Shot  74.0 -14.0

14   Goal  64.0   0.0

15   Shot  68.0   2.0

16   Shot  73.0   5.0

17   Shot  63.0  -2.0

18   Shot -26.0 -16.0

19   Shot -84.0  -2.0

20   Shot -74.0  36.0

21   Shot  83.0   6.0

22   Shot -88.0   7.0

23   Shot -39.0  30.0

24   Shot -69.0 -22.0

25   Shot  65.0  32.0

26   Shot  80.0  -3.0

27   Shot -70.0  -6.0

28   Shot -87.0  17.0

29   Shot -29.0 -20.0

..    ...   ...   ...

47   Shot  81.0   1.0

48   Shot -82.0   0.0

49   Shot  38.0 -28.0

50   Shot  66.0  -9.0

51   Shot  49.0   5.0

52   Shot -48.0 -12.0

53   Shot  39.0  20.0

54   Goal  75.0  -9.0

55   Shot -84.0  -7.0

56   Shot  88.0 -28.0

57   Shot  41.0 -20.0

58   Shot -41.0  12.0

59   Shot  40.0   7.0

60   Shot  72.0  -4.0

61   Goal  86.0   7.0

62   Shot -77.0  -8.0

63   Shot  34.0 -32.0

64   Shot -79.0 -10.0

65   Shot  61.0   6.0

66   Shot -43.0  17.0

67   Shot -41.0  -5.0

68   Shot -35.0  19.0

69   Shot -45.0 -11.0

70   Shot -77.0  -8.0

71   Shot  80.0  -1.0

72   Shot -87.0   7.0

73   Shot  84.0  24.0

74   Shot  76.0   7.0

75   Goal  83.0 -18.0

76   Shot -81.0  -5.0


[77 rows x 3 columns]



查看完整回答
反对 回复 2023-05-09
  • 2 回答
  • 0 关注
  • 99 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信