提供历史库存数据的来源很多,但它们只提供OHLC字段以及交易量和调整后的收盘价。此外,我发现有几个消息来源提供了市值数据集,但它们仅限于美国股市。Yahoo在线提供这些数据,但是没有下载的选项(或者没有我知道的)。
我需要过去十年左右的数据,因此需要一些脚本或API来做到这一点。
发布于 2014-06-25 18:12:04
对于获取金融数据的相关问题,量化SE是更好的选择:
发布于 2014-07-03 18:36:36
就收集数据而言,您可以查看Quandl (如果您感兴趣,可以在DataCamp上使用R)。
此外,Aswath的站点包含了许多有用的数据集。虽然它们没有被频繁更新,但它们仍然很有用,特别是作为比较您自己的输出的基准(您将不可避免地需要编写脚本来计算必要的指标)。
再说一次,Quant SE可能是个更好的地方.
发布于 2020-02-18 19:53:16
最近这个网站上发生了一些变化。下面的代码适用于我。
import csv
import requests
from bs4 import BeautifulSoup
url_base = "https://finviz.com/quote.ashx?t="
tckr = ['MSFT','AAPL','AMZN','FB','GOOG']
i = 1
url_list = [(s, url_base + s) for s in tckr]
headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:76.0) Gecko/20100101 Firefox/76.0'}
with open('C:\\Users\\ryans\\OneDrive\\Desktop\\AAA.csv', 'w', newline='') as f_out:
writer = csv.writer(f_out, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
for t, url in url_list:
print(i)
i = i + 1
print(t, url)
print('Scrapping ticker {}...'.format(t))
soup = BeautifulSoup(requests.get(url, headers=headers).content, 'html.parser')
writer.writerow([t])
for row in soup.select('.snapshot-table2 tr'):
writer.writerow([td.text for td in row.select('td')])我删除了旧的,不工作的代码。
https://datascience.stackexchange.com/questions/587
复制相似问题