首页
学习
活动
专区
圈层
工具
发布

#pandas

再谈股票量化因子之人气

子晓聊技术

“做短线,就要做人气股。”这是做短线的同学经常听到的一句话。关注我的同学都知道,我的文章大多围绕短线逻辑展开,而“人气”二字,几乎是所有短线策略的核心。你可能遇...

12310

Polars 凭什么叫板 Pandas?

不吃草的牛德

在量化场景(数据处理、因子计算、滚动窗口),Polars 普遍比 Pandas 快 5-10 倍。

7510

Rust + Polars:量化回测为什么能比 Pandas 快 10–100 倍?

不吃草的牛德

最近很多人问: “Pandas 不是量化界的标配吗?为什么现在到处都在喊 Rust + Polars 碾压它?”

6310

10个内置在 Pandas 中却常被忽略的向量化操作

deephub

初始数据探索时在 .info() 和 .describe() 之后紧接着跑一次,异常的分类值很快就会暴露出来。需要更系统的分析工作流时,ydata-profil...

9910

别再写np.where嵌套地狱了!Pandas条件逻辑的向量化写法让效率翻倍

Crossin先生

这仅仅是一个5级分类,但实际项目中,我遇到过12层嵌套的np.where()!每次添加新条件,都像在走钢丝——一不留神,括号匹配就出错。

12210

pandas 3.0 内存调试指南:学会区分真假内存泄漏

deephub

我们首先就会想到这可能是"pandas 有内存泄漏",其实这不一定就是泄漏。可能是引用、分配器的正常行为。而且在pandas 3.0 之后这类情况更多了,因为C...

18810

python numpy、pandas之奇技淫巧

Dragon水魅

10410

基于MOOC嵩天《Python数据分析与展示》视频学习记录——第三周:Pandas

Dragon水魅

Series对象和索引都可以有一个名字,存储在属性.name中。 Series对象可以随时修改并即刻生效。

7410

pandas to_csv保存中文乱码问题

Dragon水魅

使用encoding='utf-8’无效,使用encoding='utf_8_sig’可以解决。

17810

第十五章:Python的Pandas库详解及常见用法

啊阿狸不会拉杆

在数据分析领域,Python的Pandas库是一个不可或缺的工具。它提供了高效的数据结构和数据分析工具,使得数据处理变得简单而直观。本文将详细介绍Panda...

57210

大数据处理:Pandas+Spark 高效分析海量数据

1xsss

在数字化时代,海量数据已成为企业和组织的核心资产——从用户行为分析到业务决策优化,从金融风控到智能制造,大数据分析的能力直接决定了数据价值的挖掘深度。然而,面对...

24310

从 Pandas 转向 Polars:新手常见的10 个问题与优化建议

deephub

Polars 速度快、语法现代、表达力强,但很多人刚上手就把它当 Pandas 用,结果性能优势全都浪费了。

50700

Python编程:Pandas详解

用户11754185

pandas是python的一个数据分析包,是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。pandas纳入了大量库和一些标准的数据模型,提供...

33810

如何系统的学习python中的numpy,pandas,matplotlib

用户11754185

随着大数据、云计算和人工智能的发展,越来越多的企业需要以数据为基础做出决策。数据分析是处理大量数据的过程,分析数据以识别趋势和模式,并从数据中提取有用的信息来支...

31410

pandas模块介绍

用户11754185

首先,你可以将问卷结果导入到一个CSV文件中,然后使用pandas的read_csv函数读取数据。接着,你可以利用pandas提供的筛选功能,找出喜欢某种食物或...

15810

从爬取到分析:使用 Pandas 处理头条问答数据

小白学大数据

在当下的内容生态中,头条问答汇聚了海量用户生成的问答数据,这些数据涵盖了用户的兴趣偏好、问题诉求、内容互动等多维度信息,是洞察用户行为、挖掘内容价值的重要资源。...

20910

人工智能之数据分析 Pandas:第十章 项目实践

咚咚王

本文通过一个完整的 Pandas 项目实践案例,从 数据加载 → 清洗 → 探索 → 分析 → 可视化 → 输出结论,全流程掌握 Pandas 在真实场景中的应...

39710

人工智能之数据分析 Pandas:第十章 知识总结

咚咚王

本文是对Pandas 核心知识点的系统性总结,涵盖从基础到进阶的关键概念、常用操作和最佳实践,适合用于快速复习、面试准备或日常开发参考。

24710

人工智能之数据分析 Pandas:第九章 性能优化

咚咚王

Pandas 是一个功能强大的 Python 数据分析库,它提供了高效的数据结构和数据分析工具。然而,在处理大规模数据集时,Pandas 的性能可能成为瓶颈。为...

26610
领券