我如何使用Python使大数据看起来很小

我担任天体物理学研究助理。 这项工作需要管理和处理大型数据集。 为了做到这一点,我必须采用反映较大数据集的子集。 为了使我的计算机能够运行我的代码而不会出现运行时错误,我必须获取原始粒子的10%的子集。 这给了我与原始图像相似的图像,同时仍然可以在笔记本电脑上运行。 为此,我使用numpy.random 下面显示了如何执行此操作的示例。

我如何使用Python使大数据看起来很小
我的代码的图像。

提取随机粒子后,我将仅创建10%的粒子蒙版。 这使我可以更快地运行代码,并保持对数据集的准确描述。 数据集的这些快照提供了有价值的信息,并允许我更快地得出结论。

希望您能花些时间亲自尝试这种方法! 编码愉快!

感谢您的阅读!

From: https://hackernoon.com/how-i-used-python-to-make-big-data-seem-small-cb2beef679f5