钱是越多越好吗?这个问题似乎不用回答,那是肯定的啊。试问在座的各位看客哪位不是在挣钱,挣更多的钱,挣更多更多的钱的路上奔跑着的呢?钱是一种交换物质(当然也可以是精神层面的)的重要工具,对于每个人都很重要。所以狭义来说,钱当然是越多越好。
前言: 我们在日常维护数据库的时候,经常会遇到查询慢的语句,这时候一般会通过执行EXPLAIN去查看它的执行计划,但是执行计划往往只给我们带来了最基础的分析信息,比如是否有使用索引,还有一些其他供我们分析的信息 这三次的转换分别是 equality_propagation(等值条件句转换),如:a = b and b = c and c = 5 constant_propagation 如果查询中存在range扫描的话,对range扫描进行计划分析及代价估算。 table_scan:全表扫描的行数(rows)以及所需要的代价(cost)。 potential_range_indexes:该阶段会列出表中所有的索引并分析其是否可用,并且还会列出索引中可用的列字段。 analyzing_range_alternatives :分析可选方案的代价。 } considered_execution_plans{ :对比各可行计划的代价,选择相对最优的执行计划。
传统的投资组合收益与风险分析集中在两个关键统计量上:均值和方差。均值是指投资组合的期望收益率,是组合中所有投资产品的收益率加权平均;方差指的是投资组合收益率的方差,用以刻画收益率的变化和风险程度。 计算机和模拟技术可以放宽投资组合理论中的假设约束,使得分析对象与现实更加接近。 假设一个投资者有初始投资资金200万元,经过分析,他选择了4个投资产品:大盘股、小盘股、国际股和政府债券,每个投资产品的期望收益率和收益标准差如下图: ? 5、在收益率均值大于等于10%的条件下优化投资组合,使得收益率标准差最小。 ? 上图展示了投资组合回报分析的完整模型。 下面将说明上述5个问题的解决方法: 问题1:“计算该投资组合收益率的均值和标准差”。
模型量化对计算受限和内存受限的场景是否都有收益?如何使用工具在量化前和量化后进行性能瓶颈分析,指导模型后续的优化策略? 围绕以上问题,本文主要介绍: 1)Roofline 模型定义和绘制方法 2)如何使用Roofline分析模型量化前后性能瓶颈 3)针对模型在不同的受限场景给出优化策略。 1,Roofline 模型定义和绘制 定义:Roofline 模型是一种用于分析硬件计算性能瓶颈的工具,通过可视化计算性能与算术强度(计算量 / 数据搬运量)的关系,判断系统受限于计算能力还是内存带宽。 分析性能瓶颈 • 若任务的实际性能位于斜线下方,则受限于内存带宽(内存约束) • 若位于水平线下方且远离斜线,则受限于计算能力(计算约束)。 3,量化后性能提升的三种场景 场景 1:量化后仍为内存受限,但算术强度提升 条件:量化前模型的算术强度AI处于内存受限区间,且量化后算术强度AI未超过内存带宽与计算能力的临界值。
量化分析因子研究 前言 所谓的因子也就是某个衡量标准,选择不同的因子作为选股的参考,往往会得到不同的结果,本文简单介绍了一些因子以及它所表示的意义。 5% ROE 变动(ROEC) ROEC = ROE(上一期) − ROE(当期) 缺点:不能识别“不好变到好”还是“好变到不好” 最大 1% 优于最小 1%,最小 5% 优于最大 5% 资产报酬率( / 平均总资产 资产报酬率是衡量公司是否能够有效利用总资金的指标 总资产报酬率越高,表明资产利用效率越高,说明企业在增加收入、节约资金使用等方面取得了良好的效果;该指标越低,说明企业资产利用效率低,应分析差异原因 最小 1% 优于最大 1%,最小 5% 优于最大 5% 收入净利率(NPOR) 收入净利率 = 净利润 / 营业收入 当 NPOR 较高时企业营收能力较强,因此应该有较高的回报。 最小 1% 优于最大 1%,最小 5% 优于最大 5% 技术因子 动量 动量指的是一段时期内证券价格向某一方向持续变动的趋势。
量化分析就是将一些不具体,模糊的因素用具体的数据来表示,从而达到分析比较的目的。 ? 1. 从数据到模型,通过拟合等方式建立模型。具有明显科学背景的问题多以此为基础。 2. 4.由工业问题跟而直接建立的模型,量化大多是模型的解或者内体现出结论的相关变量的图片。 ? ? ? 对不起,今天太多事情.随便写一篇.文章没有意思.各位晚安
概述 和Python计算环境中的tushare包一样,在R中我们使用quantmod包接入第三方数据源,实现自定义量化分析平台的构建。 本文打算以陌陌的股票分析为背景,介绍如何通过quantmod包构建专属的量化分析平台。 什么是quantmod quantmod就是提供给宽客们使用的专业模块,Quantmod本身提供强大的数据接入能力,默认是雅虎财经的数据源,此外quantmod还以绘制专业的行情分析图表以及各种技术指标计算等功能著称 原理 分析底层数据结构后,我们知道quantmod包读取后的数据格式是 xts 和 zoo,我们只需要将csv文件按一定的格式读取到内存后再进行相应变换,quantmod强大的分析和作图能力就可以为我们所用
依旧,先贴一下目录: ├── README ├── MyQuant_v1 #量化分析程序目录 ├── __init__.py ├── data #数据处理目录 │ ├── __init 如果有对代码不感兴趣,但是对量化分析感兴趣的童鞋,可以去现成的量化分析平台模拟,比如JoinQuant聚宽量化交易平台,直接使用平台上现成的指标,组合一个自己想要的策略,然后进行回测。
也没啥好总结的,目录如下: 1 最后再贴一次框架目录 ├── MyQuant_v1 #量化分析程序目录 ├── __init__.py ├── data #数据处理目录 │ ├─ 总之,要做一个量化分析的项目,需要花费大量的精力时间去建模,不断的修正完善,有很多问题要实战起来,才会发现,哇靠,这么复杂!!! 至于,沪深300与策略收益曲线对比图呢,一把辛酸泪?!
'] #用来正常显示中文标签 plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 # 一个基本的折线图 plt.figure(figsize=(12,5)
这是奔跑的键盘侠的第112篇文章 依旧,先贴一下目录: ├── README ├── MyQuant_v1 #量化分析程序目录 ├── __init__.py ├── data #数据处理目录 date:1})建立数据集索引,还有前复权、后复权的数据集都建立索引,爬取数据的速度就会快非常多,至于为何,暂时还没得空去研究 先用起来再说 2 basic_crawler.py重写 《Python——量化分析常用命令介绍
本文转载自:掘金量化 量化分析经典策略总结 菲阿里四价(期货) 原理 菲阿里四价同 R Breaker 一样,也是一种 日内 策略交易,适合短线投资者。 策略思路 第一步:根据数据计算 BOLL 线的上下界 第二步:获得持仓信号 第三步:回测分析 策略代码 # coding=utf-8 from __future__ import print_function 本策略利用“动量”这一概念,认为过去 5 天连续上涨的股票具备继续上涨的潜力,属于强势股;过去 5 天连续下跌的股票未来会继续下跌,属于弱势股。 中国 A 股市场的行业轮动现象分析——基于动量和反转交易策略的检验[J]. 金融理论与实践, 2014, 000(009):111-114.) backtest_commission_ratio=0.0001, backtest_slippage_ratio=0.0001) 小市值(股票) 原理 因子投资 提到量化策略
这是奔跑的键盘侠的第115篇文章 依旧,先贴一下目录: ├── README ├── MyQuant_v1 #量化分析程序目录 ├── __init__.py ├── data #数据处理目录 2 data_module.py 这个模块是为后面做铺垫的,接下来在数据处理分析时,会时不时的从数据集中提取所需股票信息,而且不止一次两次的重复提取。
这是奔跑的键盘侠的第118篇文章 依旧,先贴一下目录: ├── README ├── MyQuant_v1 #量化分析程序目录 ├── __init__.py ├── data #数据处理目录 \ 'type=YJBB20_YJBB&token=70f12f2f4f091e459a279469fe49eca5&st=reportdate&sr=-1' \
这是奔跑的键盘侠的第116篇文章 依旧,先贴一下目录: ├── README ├── MyQuant_v1 #量化分析程序目录 ├── __init__.py ├── data #数据处理目录
合约量化如何制作: 1、制定交易策略,持仓分派:智能机器人内嵌有多种类型的交易策略,从”保守“到”激进“,考虑不一样的风险性种类。 量化交易系统软件开发 3、智能跟踪,止盈止损:设定开启标准,盈利占比超过标准后,智能机器人全自动开启跟踪止盈止损。价格持续上涨时,盈利占比持续攻克最大值,价格下降时,开启强制平仓标准,止盈止损。 合约跟单量化交易系统开发两种做法: 1.独立式跟单软件。
本小节主要介绍使用向量化的方式提升性能。 简单线性回归 先来回归一下简单线性回归优化目标以及通过最小二乘的方式求得的参数a,b的解析解。 ? 在上一个小节中,我们是通过循环的方式来求解分子和分母,前面也说过,使用for循环的这种方式,性能相对是比较低的,如果有办法将for循环的计算变成向量之间的计算的话,得益于numpy模块性能就会大大的提升,这就是向量化运算含义 上面我们将对应元素相乘然后相加的操作看成是向量之间的点乘,这也是为什么在最小二乘求解a的解析解的时候要把式子写成相乘累加的形式,这样就可以将其转换成向量之间的运算,进行向量化运算提升性能。 使用向量化运算实现线性回归算法 前面使用sklearn的思想封装了一个名为"SimpleLinearRegression1"的类,在类中使用for循环的方式来求解参数a的值。 ? ? ? ? 实现向量化的代码只需将for循环部分改成向量点乘即可: ? ? ? ? 为了比较两者的性能,将两种方式导入jupyter中,通过魔法命令来验证性能。 ? ? ? ?
图灵测试经常用来检验机器是否具备人的智能,但图灵测试受人为因素干扰太多,严重依赖裁判者和被测试者的主观判断,而且只判断机器是否具备了人的智能,但机器与人类智慧的差距和变化速度并不能得到定量的分析。 2013年以来我们在机器与互联智商方向进行了探索,初步成果已经发表在2014年6月6日举办的ITQM会议上,下面我们将简要介绍如何定量分析机器与人类智慧的未来之争。 3.世界搜索引擎排名与机器智慧的弱点 根据机器与人类通用智力量表,可以建立机器与人类通用智商测试题库(因为篇幅问题,本文不进行详细介绍),2014年5月我们利用这个测试题库对全世界50个搜索引擎和3个不同年龄阶段的人类群体进行测试得到结果如下 通用智商 1 人类 18岁 97 2 人类 12岁 84.5 3 人类 6岁 55.5 4 美国 google 26.5 5 最后需要指出,目前建立的机器与人类通用智商测试量表(M&H)还有很大的改进空间,但希望这是一个起点,能够解决图灵测试的不足和缺陷,为定量分析机器智慧能否超越人类智慧打下初步的基础。
我们使用RefConv替换YoloV5中的卷积,既能提高精度,又能降低运算量,使得模型更加轻量化! YoloV5官方结果 YOLOv5l summary: 267 layers, 46275213 parameters, 0 gradients, 108.2 GFLOPs c17 230 131 0.992 0.992 0.995 0.797 c5 tu-22 230 98 0.983 1 0.995 0.788 测试结果 YOLOv5l c17 230 131 0.984 1 0.995 0.839 c5
研究肿瘤免疫微环境组成的技术手段有很多,基于测序技术和生物信息学分析的方法是目前较为流程的一种策略。 通过转录组测序,可以获得肿瘤样本中不同基因的表达量数据,通过对应的生物信息学软件,可以得到肿瘤免疫微环境中各种细胞的表达量,从而对肿瘤微环境进行分型,识别浸润的免疫细胞亚群,比较不同亚群的表达情况,结合生存分析 基于基因表达谱数据,分析肿瘤免疫微环境组分的软件有很多,大致分成了以下3种策略 1. marker gene 将不同免疫细胞对应的marker genes作为基因集合, 采用类似GSEA的算法来评估样本中高表达的基因在不同免疫细胞的基因集合中是否富集 NMF非负矩阵分解 类似突变特征分析,NMF算法也可以用于从基因表达谱中提取免疫细胞表达谱特征,该策略对应的软件如下 deconf ssKL ssFrobenius 量化肿瘤浸润的免疫细胞之后,就可以进行差异分析 , 免疫分型,与其他特征的相关性分析等后续的数据挖掘。