polars几乎全线碾压pandas,尤其是在大型数据集的情况下,性能的提升很高。
不足的是目前一些用户层面的生态还是依赖于pandas。
不过这个不是什么大问题,毕竟python开发层面为了高效基本都是操作ndarray。
最大的优点就是小数据集到大数据集的性能开销很平滑,兼顾了各种场景下的功能与性能的综合考量。
下面是在不同数据量、不同周期下对tick数据进行处理,numba+ndarray和基于polars方案性能对比,涉及到的操作包括时间格式转…。
{dede:pagebreak/}
维护一个大型开源项目是怎样的体验?
扫黑风暴为什么他们费老大劲杀这么多人不如直接把督导组干掉?
我国有能力发现B2并摧毁吗?
为什么知乎上都是说电车没有油车好?
esbuild为什么不用Rust,而使用了Go?
把贵州省撤销,设立一个超大型国家自然公园,是不是一个好的提法?
为什么 macOS 并不差,可市场总敌不过 Windows?
PHP和Node.js哪个更爽?
两个人在家做饭,100元能享受到多丰盛的一顿饭?
为什么都说 Finder 难用?
有邻居的追求者出价三万,让我连续半个月每天找个女朋友晚上弄点动静,我该答应吗?
体制内女老师,被关系户欺负,大吼——"不干就给老子滚",我该怎么办?
你的低成本爱好是什么?
我特别不明白,我们这边做j***a 的,为什么要用windows 做server?
CPU 为什么很少会坏?
目前react的生态系统是什么情况,有没有比较公认的成熟的开发技术栈?