最近,伦敦证券交易所网站发生了变化。例如,通过解析html,可以获得每个公司的RNS新闻链接。
'https://www.londonstockexchange.com/news?tab=news-explorer&sources=RNS&period=lastweek‘
并寻找诸如SHEL或BDEV之类的公司代码,或者HTML中其他感兴趣的指标,例如newsitem。从那里摘录,从HTML,链接到RNS (监管新闻项目),从而下载新闻项目,以供进一步审查。
现在这是不可能的,数据被阻塞,公司代码等不出现在源中。
RNS新闻对于投资者来说是必不可少的,无论是大还是小,都应该有平等的机会。有些时候有大量的RNS,只有通过下载,小投资者才有可能在市场开放前一小时扫描他们,找到与他们的投资策略相关的新闻。
有谁能用一种方法重新访问RNS新闻?
如果我没有把这个问题放在正确的位置,或者它有什么问题,请告诉我,因为我以前没有写过很多问题。
发布于 2022-08-09 10:25:41
我看了一下那个url,我不知道你会怎么处理这个,tbh。我希望你有一些文章列表,这些文章可以用在一些抓取脚手架上。尽管如此,考虑到您提供的url,这是您可以绕过它的一种方法-check Dev Network选项卡,并查看是否正在对某个api进行任何XHR调用;如果您找到了一个,您可以刮掉该api端点,如下所示:
import requests
from bs4 import BeautifulSoup
url = 'https://api.londonstockexchange.com/api/v1/pages?path=news-article¶meters=newsId%253D15574524'
r = requests.get(url)
print(r.json())这将返回一个相当大的json对象,您可以对其进行剖析并获取所需的信息。例如:
html = r.json()['components'][1]['content'][0]['value']['body']
soup = BeautifulSoup(html, 'html.parser')
print(soup.select_one('title').get_text(strip=True))
print(soup.select_one('body').get_text(strip=True))只要您有一个'newsId's的列表,您就可以为每个这样的newsId抓取信息,修改上面使用的api端点。
Purchase of Own Ordinary Shares
8 August 2022abrdn Property Income Trust Limited (“the Company”)Legal Entity Identifier (LEI): 549300HHFBWZRKC7RW84PURCHASE OF OWN ORDINARY SHARESOn 5 August 2022 the Company purchased 345,935 Ordinary Shares at a price of 79.07 pence per share. These shares will be held in treasury.Following the transaction, the Company’s issued ordinary share capital comprises:386,018,977 Issued Ordinary shares (excluding treasury....https://stackoverflow.com/questions/73264049
复制相似问题