首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏pandas

    Pandas数据应用:金融数据分析

    引言金融数据分析是现代金融行业不可或缺的一部分。通过分析历史数据金融机构可以做出更明智的投资决策、风险评估和市场预测。 Pandas作为Python中强大的数据分析库,因其易用性和灵活性而广泛应用于金融领域。本文将由浅入深地介绍如何使用Pandas进行金融数据分析,并探讨常见的问题及解决方案。 导入数据金融数据分析中,我们通常需要从CSV文件、Excel表格或数据库中导入数据。Pandas提供了多种方法来读取这些数据源。 数据转换金融数据中的日期字段通常需要转换为Pandas的datetime类型,以便后续的时间序列分析。 希望本文能帮助读者更好地掌握Pandas在金融领域的应用,从而提高数据分析的效率和准确性。

    1.8K10编辑于 2025-01-04
  • 来自专栏北京马哥教育

    Python金融数据分析-PCA分析

    http://blog.csdn.net/qtlyx/article/details/53647159 1.pandas的一个技巧 apply() 和applymap()是DataFrame数据类型的函数 ,map()是Series数据类型的函数。 apply()的操作对象DataFrame的一列或者一行数据, applymap()是element-wise的,作用于每个DataFrame的每个数据。 map()也是element-wise的,对Series中的每个数据调用一次函数。 2.PCA分解德国DAX30指数 DAX30指数有三十个股票,听起来不多的样子,其实还是挺多的,我们很有必要对其进行主成分分析,然后找出最重要的几个股票。

    1.9K80发布于 2018-05-04
  • 来自专栏钱塘小甲子的博客

    Python金融数据分析-PCA分析

    1.pandas的一个技巧     apply() 和applymap()是DataFrame数据类型的函数,map()是Series数据类型的函数。 apply()的操作对象DataFrame的一列或者一行数据, applymap()是element-wise的,作用于每个DataFrame的每个数据。 2.PCA分解德国DAX30指数     DAX30指数有三十个股票,听起来不多的样子,其实还是挺多的,我们很有必要对其进行主成分分析,然后找出最重要的几个股票。 ,'DAI.DE', 'DB1.DE','DBK.DE','DPW.DE','DTE.DE','EOAN.DE','FME.DE','FRE.DE','HEI.DE','HEN3. ,'LIN.DE','LXS.DE','MRK.DE','MUV2.DE','RWE.DE','SAP.DE','SDF.DE', 'SIE.DE','TKA.DE','VOW3.

    1.9K40发布于 2019-01-28
  • 来自专栏钱塘小甲子的博客

    Python金融数据分析-回归分析

    1.pandas的线性回归         回归分析金融中一个绕不过的话题,其实最好的工具应该是R语言,但是pandas其实也是能够胜任绝大部分工作的。         这里,pandas的回归给出了上图的分析。决策系数是0.7621,调整后的是0.7597,不过笔者这里有一个疑问,一元线性回归的调整系数有意义吗?         当然,如果我们用的是真实世界的数据,恐怕就不会那么好了吧。

    1.9K30发布于 2019-01-29
  • 来自专栏数据科学和人工智能

    数据集 | 金融新闻情感分析数据

    下载数据集请登录爱数科(www.idatascience.cn) 数据集从零售投资者的角度包含了金融新闻头条的观点。数据集包含两列,情感标签和新闻标题,情感标签包含消极的,中立的或积极的。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用 Malo P, Sinha A, Korhonen P, et al.

    2.7K20编辑于 2022-03-30
  • 来自专栏技术沉淀

    Pandas雅虎金融数据获取与分析

    网站提供了csv格式数据下载服务。 利用DataReader抓取数据 # 定义获取数据的时间段 start = datetime.datetime(2010, 1, 1) end = datetime.datetime(2016,5,20 ) sh = data.DataReader("000001.SS", 'yahoo', start, end) sh.head(3) # 数据获取成功 Date Open High Low Close 设置nan如下: sh.iloc[0,:] = np.nan sh.iloc[[1,3],1] = np.nan sh.iloc[2,2] = np.nan sh.iloc[3,3] = np.nan 当然注意这里数据有缺失,有的日期没有记录。

    5.3K31发布于 2018-06-28
  • 来自专栏产品研究所

    【利用Python进行金融数据分析】合并

    import pandas as pd raw_data_1 = { 'subject_id': ['1', '2', '3', '4', '5'], 'first_name 'Bryce', 'Betty'], 'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']} raw_data_3 = pd.DataFrame(raw_data_3) 将Data1和data2两个数据框按照行的维度来进行合并 all_data = pd.concat([data1,data2]) print(all_data ) 将data1和data2两个数据框按照列的维度进行合并 all_data_col = pd.concat([data1,data2],axis=1) print(all_data_col) 按照subject_id 的值对all_data和data3作合并 print(pd.merge(all_data,data3,on="subject_id")) 对data1和data2按照subject_id作链接 print

    1.1K31发布于 2019-05-28
  • 来自专栏CDA数据分析师

    【CDAS 2017】大数据金融分论坛:量化分析,智能金融

    CDAS 2017中国数据分析师行业峰会下午的大数据金融分论坛中,来自IBM、诸葛io、民生银行等六位专家与教授,分享了大数据金融领域的实践和应用 人工智能助力银行审计管理 IBM Analytics 深入金融场景的数据驱动与应用 诸葛io产品VP于晓松 金融行业对用户的分析停留在人口属性方面,比如性别、工资结构、偿还能力等等,而缺乏用户行为方面的画像。 用R语言实现量化交易策略 《R的极客理想》系列图书作者、民生银行金融数据分析师张丹 中国的金融二级投资交易市场,是一个不成熟的市场,同时又是情绪化的市场。 “双创”大数据金融分析服务 北京赛智时代信息技术咨询有限公司CEO赵刚 目前我国创新创业形式喜人,给许多企业带来了机会。 赵刚先生在峰会现场讲解了Innov100的数据分析服务方法、数据雷达、数据洞察等内容,针对创新创业的中小微企业的数据分析有助于金融机构找准创业赛道,选好投资方向,评价投资价值,发现潜力项目,洞察关键成功因素

    2K80发布于 2018-02-26
  • 来自专栏数据科学与人工智能

    3月26日数据动态早报 | 大数据应用、智能金融、超级电商金融以及区块链金融

    数据动态早报,让您了解数据新变化、新创造和新价值。 一、通信行业数据动态 1 中国移动公布了截止2016年12月31日年度业绩报告,董事长尚冰在《董事长报告书》(以下简称“报告书”)中更是重提5G研发和物联网重点业务发展。 【搜狐网】 二、电子商务数据动态 1 江苏常熟京云数据科技有限公司和京东云签订合作协议,双方将在“大数据+服装产业”领域建立长期、全面的合作关系。 【DoNews网】 三、互金行业数据动态 1 “科技与金融结合的创新,在很大程度上决定金融业的核心竞争力。目前有四个领域受到高度关注。” 李礼辉指出的四个领域包括大数据应用、智能金融、超级电商金融以及区块链金融。【新浪网】 四、医疗健康数据动态 1 浙江大学成立睿医人工智能研究中心,构建全国首个开放式医学人工智能平台。

    1K80发布于 2018-02-28
  • 来自专栏王的机器

    金融数据结构』「3. 基于事件采样」

    本文含 6821 字,48 图表截屏 建议阅读 34 分钟 0 引言 本文是 AFML 系列的第三篇 金融数据类型 从 Tick 到 Bar 基于事件采样 在上贴〖从 Tick 到 Bar〗里,我们已经会从 它们虽然可以做到减少数据量,但是采样数据的方法都没有金融含义支撑,线性等分采样过于简单,均匀采样过于随机。 因此本帖来看看第二种基于事件采样,即背后有金融含义支撑的采样方法。 (df.tail(3)) 首先不做任何采样,画出 tick 数据的价格折线图。 dollar.head(3).append(dollar.tail(3)) 画出 dollar bar 的折现图。 3 总结 处理数据永远是最花精力和时间的,机器学习是,量化金融也是,数据科学更是。

    2.6K40发布于 2019-08-05
  • 来自专栏钱塘小甲子的博客

    Python金融数据分析-数据获取与简单处理

    Python的功能不可以说不大,在金融数据分析里面有着很方便的应用。 1.数据获取 pandas包中有自带的数据获取接口,详细的大家可以去其官网上找,是io.data下的DataReader方法。 dataframe的数据结构 print DAX.info() #绘制收盘价的曲线 DAX['Close'].plot(figsize=(8,5)) 我们获得的数据是dataframe的结构,毕竟是 这个是我们获取的数据的信息。 ? 绘制出来的收盘价曲线是这样的。 和FRM中提到的一样,在市场低迷,或者说,金融危机的时候,市场的波动率急剧增加。于是,就有了恐慌指数这个东西,也就是Vix,其实就是市场的波动率指数。

    2.2K40发布于 2019-01-29
  • 来自专栏产品研究所

    【利用Python进行金融数据分析-06】统计

    这个数据明显错误,创建函数处理该问题 def fix_century(x): year = x.year - 100 if x.year > 1989 else x.year return Yr_Mo_Dy') print(data.head(5)) 对应每一个location 一共有多少个缺失值 print(data.isnull().sum()) 对应每一个location ,一共由多少完整的数据值 shape[0]获取行数,shape[1]获取列数 print(data.shape[1]-data.isnull().sum()) 对于全体数据,计算风速的平均值 print(data.mean ().mean()) 创建一个名为loc_stats的数据框去计算并存储每一个location的最小值、最大值、平均值、标准差。 date.day) january_winds = data.query('month == 1') print(january_winds.loc[:,'RPT':'MAL'].mean())` 对于数据记录安年频率取样

    1K20发布于 2019-05-28
  • 来自专栏机器学习/数据可视化

    金融数据分析库yfinance,初次使用体验!

    公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~今天给大家介绍一个金融数据分析库yfinance,主要是基于该库下的股票数据分析及股价预测(使用LSTM模型)yfinance库yfinance 是一个用于从 Yahoo Finance 获取金融数据的 Python 库。 它提供了一个方便的接口,让用户能够轻松地下载和处理股票、指数、货币对等金融市场的历史价格数据和其他相关信息。yfinance 让开发者和分析师能够使用 Python 进行金融数据分析、可视化和研究。 数据处理和分析: 通过将数据转换为 pandas 数据框,用户可以方便地进行数据处理、计算技术指标和执行分析操作。全球市场: yfinance 不仅仅支持美国市场,还能够获取许多全球市场的金融数据。 这可以帮助分析者理解数据的波动情况,尤其是在金融分析等领域。

    21.3K47编辑于 2023-08-29
  • 来自专栏大数据文摘

    罗明雄:大数据金融运营模式分析

    平台金融模式中,是平台企业对其长期以来积累的大数据通过互联网、云计算等信息化方式对其数据进行专业化的挖掘和分析,通过研究并与传统金融服务相结合,创新性的为平台服务企业开展相关资金融通工作。 平台模式的特点在于企业以交易数据为基础对客户的资金状况进行分析,贷款客户多为个人以及难以从银行得到贷款支持的小微企业,贷款无需抵押和担保,能够快速发放贷款,且多为短期贷款。 同时,这也使平台模式具有了寡头经济的特点,平台模式中的企业必须在前期进行长时间交易数据的积累,在交易数据的积累过程中完善交易设备和电子设备,以及进行数据分析所需的基础设施积累和人才积累。 说到大数据,首当其冲的应该是已经围绕数据海洋中耕耘已久并衍生出金融借贷业务的阿里系。首先从宏观上对阿里系进行分析。阿里系的基础是“三流”:信息流、资金流以及目前马云退休后布局的物流。 笔者认为,无论采用上述哪种运营模式,大数据分析的能力和数据来源的合法性、持续性能力对于企业来说必不可少。企业应根据自身发展特点选择自身适合的模式。 摘自:搜狐证券

    2K70发布于 2018-05-22
  • 来自专栏数说工作室

    金融数据挖掘之决策树(ID3

    数说工作室提供策略编写、数据分析服务和量化支持。

    1K110发布于 2018-03-28
  • 来自专栏产品研究所

    【利用Python进行金融数据分析】开始了解和获取数据

    import pandas as pd import numpy as np 获取数据集 url = 'https://raw.githubusercontent.com/justmarkham /DAT8/master/data/chipotle.tsv' 导入数据集至chipo chipo = pd.read_csv(url,sep = '\t') 设置打印宽度 pd.set_option ('display.width',1000) 查看前10行数据 print(chipo.head(10)) 了解数据集中有多少个观察值 print(chipo.info()) 了解数据集中有多少列 print(chipo.shape[1]) 打印出全部列的名称 print(chipo.columns) 输出数据集的索引 print(chipo.index) 被下单数最多的商品( float(x[1:-1]) chipo.item_price = chipo.item_price.apply(dollarizer) print(chipo.item_price) 在该数据集对应的时期内

    1.1K10发布于 2019-05-28
  • 来自专栏数据猿

    金融科技&大数据产品推荐:Stratifyd大数据智能分析平台

    的产品投递 1、产品名称 Stratifyd大数据分析平台 2、所属分类 金融科技·智能获客 3、产品介绍 Stratifyd大数据分析平台是Stratifyd大数据团队设计和研发的快速分析响应解决方案 3、在AI引擎之上,Stratifyd也同时提供了领先于其他BI公司的网页版平台,这样银行分析人员无需编写繁琐的代码,只要简单地拖曳,就能轻松地制作丰富的图表,灵活地进行多维分析,快速地发现数据中的规律 3、实时的市场、客户动态把控 -准确的通过实时数据对新上线的产品和服务进行监控和管理。 7、服务客户/使用人数 Stratifyd目前服务的互联网金融客户如美国Ally金融集团公司等。 3、增加风险评估维度(风险定价能力永远是金融行业的核心竞争力) 金融企业之间最大的竞争力之一就是风险定价能力,准确的风险定价能力将会帮助金融企业获取更大的利润和稳健经营。 Stratifyd协助金融企业了解客户对产品的意见、建议并形成多维度的数据分析金融企业进行改进。

    2.7K40发布于 2018-04-24
  • 来自专栏产品研究所

    【利用Python进行金融数据分析数据的筛选和选取

    ,') 只显示Goals这一列 print(euro12["Goals"]) print(euro12.Goals) 有多少至球队参与了2012欧洲杯 print(euro12.shape[0]) 该数据集一共有多少列 print(euro12.info()) 将数据集中的列Team,Yellow Cards和Red Cards单独存为一个名叫discipline的数据框 discipline = euro12[[" Team","Yellow Cards","Red Cards"]] print(discipline) 对数据框discipline按照先Red Cards再Yellow Cards排序 print print(euro12[euro12.Goals>6]) 选取以字母G开头的球队数据 print(euro12[euro12.Team.str.startswith("G")]) 选取前7列 print (euro12.iloc[:,0:7]) 选取除了最后3列之外的全部列 print(euro12.iloc[:,:-3]) 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率

    1K20发布于 2019-05-28
  • 来自专栏python成长之路

    金融数据分析与挖掘具体实现方法 -2

    貌似三个月没有更新博客园了,当时承诺的第二篇金融数据分析与挖掘这几天刚好又做了总结,在国内经济不景气的现在来对这个话题结个尾。 1、(量化)投资的方法基础分析 1.1 投资的两种方法 技术分析 技术分析是指研究过去金融市场的资讯(主要是经由使用图表)来预测价格的趋势与决定投资的策略。 很多个人投资者也比较多技术分析,但缺乏丰富的经验等 基本面分析 基本面分析又称基本分析,是以证券的内在为依据,着重于对影响证券价格及其走势的各项因素的分析,宏观数据、市场行为、企业财务数据 、交易数据等进行分析,以此决定投资购买何种证券及何时购买。 实现思路和步骤是: 从文件读取股票数据 按照日期索引排序 增加一列index索引数据, 后续不需要日期索引 抽取index, open, close, high, low五列数据,

    2.9K21发布于 2019-02-22
  • 来自专栏钱塘小甲子的博客

    Python金融数据分析-正态性检验

    1.话题引入 我们在线性回归做假设检验,在时间序列分析做自回归检验,那么我们如何检验一个分布是否是正态分布的呢? 首先,我们定义一个用来生成价格路径的函数。 当然这是我们仿真出来的路径,那么如果我们真的获取了这样的价格数据,我们要知道他是不是服从正态分布我们该怎么办呢?比较在金融理论里面,正态分布有着很大的优越性。 2.正态性检验 我们知道,其实价格服从的是lognormal分布,而每天的收益率是服从正态分布呢,所以,首先我们根据上面的仿真数据来获得每天的收益率数据。 ',sta[1][1]) print "%14s %15.5f" % ('mean',sta[2]) print "%14s %15.5f" % ('std',np.sqrt(sta[3] 所以,写个函数来分析: def normality_test(arr): print "Skew of dataset %14.3f" % scs.skew(arr) print "Skew

    1.8K10发布于 2019-01-28
领券