我正在尝试制作一个股票市场模拟器(也许最终会成长为预测人工智能),但我在寻找数据方面遇到了麻烦。我正在寻找一个(希望是免费的)历史股市数据来源。
理想情况下,它应该是一个非常细粒度(秒或分钟间隔)的数据集,其中包含NASDAQ和NYSE上每个符号的价格和成交量(如果我喜欢冒险的话也可能是其他的)。有谁知道这类信息的来源吗?
我找到了this question,它表明雅虎提供CSV格式的历史数据,但我一直无法找到如何在粗略检查该网站的链接。
我也不喜欢在CSV文件中零散下载数据的想法……我想雅虎在最初的几千个请求之后会很生气,把我拒之门外。
我还发现了another question,这让我觉得自己中了大奖,但不幸的是,那个OpenTick站点似乎已经关门了……太糟糕了,因为我认为它们正是我想要的。
我也可以使用每天每个符号的开盘/收盘价和成交量的数据,但如果我能得到的话,我更喜欢所有的数据。还有其他建议吗?
发布于 2013-06-24 01:01:50
让我加上我的2美分,这是我的工作,为对冲基金获得良好和干净的数据,我见过相当多的数据馈送和历史数据提供者。这主要是关于美国股市的数据。
首先,如果你有一些钱,不要费心从雅虎下载数据,直接从下载结束时的数据,这是雅虎获得排爆数据以及AFAIK的地方。他们有一个API,你可以把数据提取成你想要的任何格式。我想每年的数据订阅费用是100美元。
从免费服务下载数据的主要问题是你只能得到仍然存在的股票,这被称为Survivorship Bias,如果你查看许多股票,可能会给你错误的结果,因为你只会包括到目前为止的股票,而不是那些被摘牌的股票。
对于一些日内数据,我会研究一下,它们提供了几个API来提取历史数据,尽管它们主要是用于实时提要。但这里有相当多的选择,一些经纪人甚至通过他们的API提供历史数据下载,所以只需选择你的毒药。
但通常所有这些数据都不是很干净,一旦你真正开始回测,你会发现某些股票缺失或显示为两个不同的符号,或者股票拆分没有正确考虑,等等。然后你意识到历史红利数据也是需要的,所以你开始循环运行,将100个不同数据源的数据拼凑在一起,等等。因此,从“折扣”数据馈送开始可以,但一旦您运行更全面的反向测试,您可能会遇到问题,这取决于您所做的工作。如果你只是看看,比方说,标准普尔500指数这不会是太大的问题,一个“便宜”的盘中馈送就可以了。
你找不到的是免费的日内数据。我的意思是,你可能会找到一些例子,我肯定有一些5年的MSFT节拍数据,但这不会让你走得太远。
然后,如果你需要真正的东西(二级订单簿,就像它们在所有交易所发生的那样),一个“负担得起的”,但很好的选择是。他们实际上会给你发一个带有of级数据的驱动器。如果我没记错的话,每年大概需要3000-4K美元的数据。但相信我,一旦你了解了获得好的盘中数据有多难,你就不会认为这是一笔很大的钱。
不是让你泄气,而是要获得好的数据是很难的,事实上,许多对冲基金和银行每月花费数十万美元来获得他们可以信任的数据。同样,你可以从某个地方开始,然后从那里开始,但在上下文中看到它是很好的。
编辑:上面的答案来自我自己的经验。有关可用数据馈送的This write-up from Caltech将提供更多见解,特别是推荐。
发布于 2010-01-28 11:34:47
由于雅虎订阅源已不复存在,因此此答案不再准确。
使用Yahoo的CSV方法,您还可以获得历史数据!您可以对以下示例进行反向工程:
http://ichart.finance.yahoo.com/table.csv?s=YHOO&d=0&e=28&f=2010&g=d&a=3&b=12&c=1996&ignore=.csv
本质上:
sn = TICKER
a = fromMonth-1
b = fromDay (two digits)
c = fromYear
d = toMonth-1
e = toDay (two digits)
f = toYear
g = d for day, m for month, y for yearly完整的参数列表:
a Ask
a2 Average Daily Volume
a5 Ask Size
b Bid
b2 Ask (Real-time)
b3 Bid (Real-time)
b4 Book Value
b6 Bid Size
c Change & Percent Change
c1 Change
c3 Commission
c6 Change (Real-time)
c8 After Hours Change (Real-time)
d Dividend/Share
d1 Last Trade Date
d2 Trade Date
e Earnings/Share
e1 Error Indication (returned for symbol changed / invalid)
e7 EPS Estimate Current Year
e8 EPS Estimate Next Year
e9 EPS Estimate Next Quarter
f6 Float Shares
g Day's Low
h Day's High
j 52-week Low
k 52-week High
g1 Holdings Gain Percent
g3 Annualized Gain
g4 Holdings Gain
g5 Holdings Gain Percent (Real-time)
g6 Holdings Gain (Real-time)
i More Info
i5 Order Book (Real-time)
j1 Market Capitalization
j3 Market Cap (Real-time)
j4 EBITDA
j5 Change From 52-week Low
j6 Percent Change From 52-week Low
k1 Last Trade (Real-time) With Time
k2 Change Percent (Real-time)
k3 Last Trade Size
k4 Change From 52-week High
k5 Percent Change From 52-week High
l Last Trade (With Time)
l1 Last Trade (Price Only)
l2 High Limit
l3 Low Limit
m Day's Range
m2 Day's Range (Real-time)
m3 50-day Moving Average
m4 200-day Moving Average
m5 Change From 200-day Moving Average
m6 Percent Change From 200-day Moving Average
m7 Change From 50-day Moving Average
m8 Percent Change From 50-day Moving Average
n Name
n4 Notes
o Open
p Previous Close
p1 Price Paid
p2 Change in Percent
p5 Price/Sales
p6 Price/Book
q Ex-Dividend Date
r P/E Ratio
r1 Dividend Pay Date
r2 P/E Ratio (Real-time)
r5 PEG Ratio
r6 Price/EPS Estimate Current Year
r7 Price/EPS Estimate Next Year
s Symbol
s1 Shares Owned
s7 Short Ratio
t1 Last Trade Time
t6 Trade Links
t7 Ticker Trend
t8 1 yr Target Price
v Volume
v1 Holdings Value
v7 Holdings Value (Real-time)
w 52-week Range
w1 Day's Value Change
w4 Day's Value Change (Real-time)
x Stock Exchange
y Dividend Yield发布于 2009-06-22 10:51:54
我知道你想要“免费”,但如果我是你,我会认真考虑以每年300美元的价格从csidata.com获取数据。
这就是雅虎用来提供数据的东西。
它附带了一个不错的API,而且数据(据我所知)非常干净。
当你订阅的时候,你会得到10年的历史记录,然后每晚更新一次。
他们还会为你处理各种讨厌的事情,比如拆分和分红。如果你还没有发现数据清洗的joy,你不会意识到你有多么需要这个,直到你的自动交易系统( ATS )第一次认为一些股票真的真的很便宜,只是因为它分成了2:1,而你没有注意到。
https://stackoverflow.com/questions/754593
复制相似问题