首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 8-7 偏差方差平衡

    由于训练的这个算法对于整个数据来说是欠拟合,所以导致模型具有非常高的偏差。 通常来讲,非参数学习的算法都是高方差的算法,因为这类算法不对数据进行任何的假设,只能够根据我们现有的训练数据来进行相应的预测,所以模型对训练数据集本身是非常敏感的。 在这个课程中,假设我们此时已经有了相对比较好的数据数据也有相对比较好的特征,在这种情况下,问题的关键是使用算法来基于这些数据得到可靠的结果,此时我们的主要挑战大多数来自于方差。 减少数据的维度通常和降噪联系在一起,之前介绍PCA算法的时候说PCA是一种降维的算法,同时它还有一个副作用,在很多时候会降低数据的噪声。 而产生方差这种错误,很多时候是由于模型学习到数据中的噪音,通过减少数据维度进而进行降噪的手段能够有效的减小算法模型相应的方差; 增加样本数。

    1.2K10发布于 2020-01-14
  • 来自专栏悦思悦读

    开发一款A

    作者在自学机器学习的过程中,尝试开发了一个基于机器学习的A工具。本文是在赤兔的“数据挖掘”小组分享的此次开发过程和心得体会的整理。 A器开发过程 数据来源 就财经类的数据而言,现在各大门户网站都有专门的频道,信息很多,如果对实时要求高,通过爬虫取其中有用的部分应该是一个办法。 它是免费的,提供结构化的数据,感觉每天更新也挺快。 预处理 拿到数据后第一步是做预处理。我认为股票的数据主要是做归一化,使得不同股票具有可比性。比如涨幅百分比,复权等等。 最初是用了最近3年的数据,后来考虑到A从2007年到2015年恰好走过了一个上涨到下降再到上涨的完整周期,因此扩大到了8年的数据。 再是对算法的改进,我尝试引入了“推荐指数”的概念。 股灾日经常是“千跌停”,上涨的股票太少了…可以看出在这些“股灾日”的时候,模型也不太准确,出现了失真。 总结与心得 选工具利用机器学习算法,一般情况下比传统的算法(或者人为经验)的准确率高。

    3.3K80发布于 2018-03-15
  • 来自专栏镁客网

    遭血洗,科技大跌

    并且,隔夜美的暴跌态势已经蔓延到了亚太股市和欧洲股市。 今日早上,亚太市场开盘后随美一样暴跌。 其中,最早开盘的澳洲股指ASX200指数盘初跌2%,日日经225指数开盘跌2%,日本东证指数下跌3%,迈向3月以来最大跌幅,韩国KOSPI指数开盘下跌2.43%。 台加权指数开盘跌1.9%,目前跌幅扩大至逾4%。 在美惨遭血洗的时候,其中,科技巨头的股票也一路下跌。 国内媒体认为,美债收益率上升是美承压原因之一。美国国债收益率本月以来一直攀升,10年美债收益率一度触及3.25%的七年最高水平。10月5日,有数据显示,美国失业率降到了3.7%的历史低位。

    68040发布于 2018-10-18
  • 来自专栏小姚的后端记录

    浏览器输入网址到看到结果的全过程 ==首先是解析url,然后进行缓存判断,判断请求的资源在不在缓存中,如果在缓存中且没有失效,就直接使用,否则就要向服务器发起请求。 数据链路层(Data Link Layer): 主要功能:在直接连接的两个设备之间提供可靠的数据传输。 作用:将物理层提供的比特流分组成数据帧,并负责数据的错误检测和纠正。 网络层(Network Layer): 主要功能:实现数据包的路由和转发,为数据在不同网络之间的传输提供路径。 作用:负责逻辑寻址、数据包的路由选择和跨网络的数据传输。IP协议是网络层的代表。 通常用于实现不同应用程序之间的数据交互。 表示层(Presentation Layer): 主要功能:数据格式转换、数据加密和解密。 数据类型: Cookie:Cookie只能存储文本数据,通常用于存储小量的用户信息,如用户ID、首选语言或会话令牌。 Session:Session可以存储各种数据类型,包括对象和复杂数据结构。

    60940编辑于 2023-10-11
  • 股票数据API:日、韩、新加坡股票、印尼股票市场实时行情实时数据API—python

    本文将介绍一个高效的亚太股市数据 API,支持日本股市行情、韩国股市行情、新加坡股市行情和印尼股市行情的实时数据查询。 该 API 提供实时价格、K 线数据、历史数据查询、实时 tick、实时报价、低延时报价 api、盘口数据和逐笔成交等功能,特别适合量化交易开发者使用。 主要优势:实时数据:毫秒级更新,支持实时价格和逐笔成交。历史数据查询:批量获取多 K 线数据,包括开盘价、最高价、最低价、收盘价和成交量(OHLCV)。 批量历史 K 线查询支持多同时查询历史 K 线数据,周期从分钟线到月线。适合历史数据查询和 K 线数据分析。请求路径:GET /stock/klines? K 线数据分析,支持多批量操作。

    1.6K10编辑于 2025-12-11
  • ​A Level-2 行情数据 API 实战指南

    本文将系统介绍 A Level-2 行情数据 API 的技术特点、接入方案及实战应用,帮助开发者在量化交易的道路上构建坚实的数据底座。 数据量方面,A Level-2 行情每日增量约 30-45GB,历史数据可达 10TB 级别。这意味着,处理 Level-2 数据不仅需要高效的 API 接入方案,更需要强大的数据存储与计算能力。 同花顺 iFinD:延迟在 100-200 毫秒,覆盖全市场 A 及港股数据。采用年费制,数据质量稳定,功能丰富,适合专业投资机构使用。 4.2 实时行情接入代码示例以下提供 iTick API 的完整接入示例,包括 REST API 和 WebSocket 两种方式,涵盖 A 、港股、美等市场。 七、结语A Level-2 行情数据 API 为量化开发者打开了一扇通往市场微观结构的大门。从十档盘口的深度分析到逐笔成交的资金流向追踪,Level-2 数据承载着比传统行情丰富十倍的信号价值。

    2.7K21编辑于 2026-03-21
  • 来自专栏数据科学实战

    AkShare-股票数据-港股美复权后数据

    作者寄语 更新之前的港股和美接口直接返回复权后的数据,方便策略回测使用,具体的使用方法参见文档。 AkShare 股票数据-历史行情 接口: stock_us_daily 目标地址: http://finance.sina.com.cn/stock/usstock/sector.shtml 描述 : 获取美历史行情数据,设定 adjust="qfq" 则返回前复权后的数据,默认 adjust="", 则返回未复权的数据,历史数据按日频率更新 限量: 单次返回指定上市公司指定 adjust 后的所有历史行情数据 输入参数 名称 类型 必选 描述 symbol str Y 美代码, 可以通过 「get_us_stock_name」 函数返回所有美代码, 由于美股数据量大, 建议按需要获取 adjust str , 可以选择返回复权后数据,更新频率为日频 限量: 单次返回指定上市公司的历史行情数据(包括前后复权因子), 提供新浪财经拥有的该股票的所有数据(并不等于该股票从上市至今的数据) 输入参数 名称 类型

    2.7K20发布于 2020-05-07
  • 来自专栏数据科学实战

    AkShare-股票数据-千千评

    作者寄语 熟悉东方财富的小伙伴一定听过东方财富的吧评论数据,无论是学术论文还是业界的金工报告都有提及相关内容,本次更新根据吧浏览、自选添等数据统计得出,关注指数越高代表该越受市场关注的千千评指数接口 ,本数据有东方财富制定。 /stockcomment/ 描述: 获取东方财富网-数据中心-特色数据-千千评 限量: 单次获取所有数据 输入参数 名称 类型 必选 描述 - - - - 输出参数 名称 类型 默认显示 描述 TDate 接口示例 import akshare as akstock_em_comment_df = ak.stock_em_comment()print(stock_em_comment_df) 数据示例 - - -3953 2020-03-23T00:00:00 900955 海创B ...

    2.9K20发布于 2020-03-25
  • 来自专栏数据科学实战

    AkShare-股票数据-破净统计

    作者寄语 更新 破净统计 接口,破净是指市值跌破净资产值,破净是指股票的每股市场价格低于它每股净资产价格。 数据的时间段为:2005年-至今 更新接口 "stock_a_below_net_asset_statistics" # A 破净统计 破净统计 接口: stock_a_below_net_asset_statistics 目标地址: https://www.legulegu.com/stockdata/below-net-asset-statistics 描述: 获取 A 破净统计数据 限量: 单次获取所有历史数据 输入参数 名称 类型 必选 描述 - - - - 输出参数 名称 类型 默认显示 描述 date datetime Y 交易日 below_net_asset float Y 破净家数 total_company = ak.stock_a_below_net_asset_statistics() print(stock_a_below_net_asset_statistics_df) 数据示例

    92130发布于 2020-07-23
  • 来自专栏数据科学实战

    AKShare-股票数据-行业成份

    作者寄语 本次接口主要东方财富的行业板块中成份,可以与同花顺的对照使用。 更新接口 "stock_board_industry_cons_em" # 东方财富-成份 东方财富-成份 接口: stock_board_industry_cons_em 目标地址: https: //data.eastmoney.com/bkzj/BK1027.html 描述: 东方财富-沪深板块-行业板块-板块成份 限量: 单次返回指定 symbol 的所有成份 输入参数 名称 类型 描述 stock_board_industry_cons_em_df = ak.stock_board_industry_cons_em(symbol="小金属") print(stock_board_industry_cons_em_df) 数据示例

    1.8K30编辑于 2022-01-12
  • 实时行情与 K 线数据对接

    对于金融科技开发者而言,如何稳定、低延迟地获取美股数据是开发全球资产配置工具的第一步。本文将基于 StockTV 全球金融 API,为你详解如何快速集成美实时行情、历史数据及指数信息。 一、 美接口对接美股数据通常面临着交易所授权费高昂、API 协议复杂(如 FIX 协议)等痛点。 涨跌幅排行榜:使用 stock/updownList 接口快速获取美全市场的“涨幅榜”或“跌幅榜”,实时挖掘热点个股。 数据缓存:对于 stock/companies 接口提供的公司描述、行业分类等静态信息,建议在本地数据库做缓存,以优化 App 加载速度。 结语对接美股数据并不复杂,关键在于选择一个稳定且数据维度丰富的供应商。StockTV API 以其标准化的 JSON 结构和覆盖全球的金融数据,极大地降低了金融应用的开发门槛。

    60610编辑于 2026-02-26
  • 爬虫技术选:Python 自动化筛选潜力

    核心技术工具说明本次自动化选项目依赖 Python 的三大核心库,各自承担关键职责:Requests:轻量高效的 HTTP 请求库,负责向金融数据网站发送请求,获取公开的个股行情与财务数据,是爬虫实现的核心工具 Pandas:高性能的数据处理与分析库,负责对提取的金融数据进行清洗、整理、指标计算与筛选,是实现选逻辑的关键支撑。2. 二、项目实现流程概述本次 Python 自动化选的核心流程分为四步:爬虫搭建:抓取 A 股市场个股的基础信息(股票代码、名称)与核心财务 / 行情数据(每股收益、净利润增长率、市盈率、市净率等);数据清洗 :处理抓取到的缺失值、异常值、格式错误等问题,形成标准化数据集;选逻辑实现:基于价值投资与成长投资的核心指标,预设筛选规则,利用 Pandas 完成自动化筛选;结果输出:将筛选出的潜力整理为表格,保存为本地文件方便查阅 A 列表数据,提取核心选股指标。

    1K10编辑于 2026-01-14
  • 来自专栏kwai

    数据库基础(六) mysql八

    2,引擎:InnoDB,MyIsam 3,超键,候选键,主键,外键 4,Sql约束: 主键约束:唯一性,非空 唯一约束:唯一性,有一个可为空 检查约束:对列的数据范围限定 默认约束:数据的默认值 外键约束 5,事务实现原理 6,redo log,undo log 7,binlog 8,事务中可以混合使用引擎吗 不可以,正常情况下没问题,但是如果需要回滚,innodb没问题,myisam就会无法撤销,出现数据不一致 也可以对数据,如for update。 乐观锁有CAS和版本号机制。 4,InnoDB的行锁怎么实现 给索引项加锁,所以使用行锁一定要使用索引。 其他 1,为什么要使用分库分表 分表:数据太大 分库:并发太大 2,读写分离,主从同步,主从复制 就这两大类问题。

    1K60编辑于 2022-01-10
  • 历史数据历史行情,价格,走势,实时API

    历史数据和实时报价对量化工作意义重大。 日 API 为量化工作者获取这两类数据提供便捷途径,专业日 API 能定制数据获取,提高效率和准确性,满足量化交易要求,免费报价 API 虽有局限,但对初步量化研究和小型量化团队也有价值,能降低成本开展工作 近期日整体呈现上涨趋势,具体来看以下几个方面:指数表现:当地时间 1 月 15 日,日三大股指全面大幅上涨。 上涨原因分析通胀数据符合预期:最新发布的消费者价格指数(CPI)数据显示,日本 2024 年 12 月 CPI 同比上升 2.9%,环比升 0.4%,均与市场预期相符。 请求K线python -m pip install requests"""**iTick**:是一家数据代理机构,为金融科技公司和开发者提供可靠的数据源APIs,涵盖外汇API、股票API、加密货币API

    4K00编辑于 2025-02-04
  • 港美A实时盘口数据:Python 接入示例教程

    港美A实时盘口数据:Python 接入示例教程在量化交易和大宗交易决策中,实时盘口数据(也称为市场深度或 Level 2 数据)是关键要素。 本文聚焦港股(HK)、美(US)和 A (SH/SZ)的实时盘口,介绍如何通过 RESTful API 和 WebSocket 方式接入这些数据,支持多市场覆盖和毫秒级更新。 例如,在港股市场,腾讯控股(700.HK)的盘口可能显示买一价 568 HKD,挂单量 75000 。 美 (US):如 AAPL (苹果)、TSLA (特斯拉)。A (SH/SZ):上海和深圳交易所股票。接入方式有批量查询(REST)和实时推送(WebSocket)。 支持港美 A 订阅(如 params: "700$HK,AAPL$US,600000$SH")。

    91600编辑于 2025-12-01
  • 来自专栏数据科学实战

    AKShare-股票数据-技术选-创新低

    stock_rank_cxd_ths" # 创新低 创新低 接口:stock_rank_cxd_ths 目标地址:http://data.10jqka.com.cn/rank/cxd/ 描述:同花顺-数据中心 -技术选-创新低 限量:单次指定 symbol 的所有数据 输入参数 名称 类型 描述 symbol str symbol="创月新低"; choice of {"创月新低", "半年新低", "一年新低 akshare as ak stock_rank_cxd_ths_df = ak.stock_rank_cxd_ths(symbol="创月新低") print(stock_rank_cxd_ths_df) 数据示例

    80910发布于 2021-11-02
  • 来自专栏数据科学实战

    AkShare-股票数据-大宗交易-活跃A统计

    更新接口 "stock_dzjy_hygtj" # 大宗交易-活跃A统计 大宗交易 活跃A统计 接口: stock_dzjy_hygtj 目标地址: http://data.eastmoney.com /dzjy/dzjy_hygtj.aspx 描述: 获取东方财富网-数据中心-大宗交易-活跃 A 统计 限量: 单次返回所有历史数据 输入参数 名称 类型 必选 描述 period str Y period import akshare as ak stock_dzjy_hygtj_df = ak.stock_dzjy_hygtj(period='近三月') print(stock_dzjy_hygtj_df) 数据示例

    66410发布于 2020-12-22
  • 来自专栏数据科学实战

    AKShare-股票数据-港股通成份

    作者寄语 本次更新港股通成份的接口 更新接口 "stock_hk_ggt_components_em" # 港股通成份 港股通成份 接口: stock_hk_ggt_components_em 目标地址: https://quote.eastmoney.com/center/gridlist.html#hk_components 描述: 东方财富网-行情中心-港股市场-港股通成份 限量: 单次获取所有港股通成份股数据 输入参数 名称 类型 描述 - - - 输出参数 名称 类型 描述 序号 int64 - 代码 object - 名称 object - 最新价 float64 注意单位 HKD 涨跌额 float64 - 涨跌幅 float64 - 今开 float64 - 最高 float64 - 最低 float64 - 昨收 float64 - 成交量 float64 注意单位: stock_hk_ggt_components_em_df = ak.stock_hk_ggt_components_em() print(stock_hk_ggt_components_em_df) 数据示例

    1.2K10编辑于 2022-01-12
  • 来自专栏LB说IOT

    物联网龙头

    物联网(IoT)包括所有这些设备和对象,它们都通过Internet与数据中心相互通信。 在软件方面,思科提供了Cisco Kinetic平台和其他工具来管理IoT数据和设备。 思科还是最大的网络安全公司之一。 该公司的G6系统包括一个自动应用器,一个传感器和一个发射器以及一个显示实时葡萄糖数据的触摸屏接收器。兼容的智能手机和智能手表也可以用于显示数据。 根据疾病控制中心的数据,美国被诊断出患有糖尿病的人数从1958年的158万增加到2015年的2335万。 根据IDTechEx的数据,包括标签,读取器,软件和服务在内的RFID产品市场在2018年价值110亿美元,预计到2022年将增长到134亿美元。

    59940编辑于 2022-04-12
  • spring八记录

    ,并调用对应的业务逻辑方法 3.业务处理完毕,返回更新后的数据给servlet 4.servlet转向到jsp,jsp渲染页面 5.响应给前端更新后的页面C:控制器 1.取得表单数据/json数据 2. 15.spring三级缓存的数据结构是什么? 不用像jdbc那样打开关闭连接;提供对象字段映射,提供对象关系映射这里其实就是在定义数据库字段和Java属性之间的映射关系!重点:一对多;与spring集成2.jdbc连接数据库的步骤? 加载数据库驱动:不一样的数据库的驱动不一样 建立数据库连接连接:url name password 创建statement对象 executeupdate/executequery 处理查询结果 关闭连接 适配器 mybatis对jdbc不同数据源的适配{我们在springboot中会配置datasource}4.springcloud相关1.分布式是什么意思分布式系统是独立计算机的集合,对于用户来说访问分布式系统就像访问一个单个系统目的是利用更多的机器处理更多的数据

    37510编辑于 2024-12-04
领券