PandasGUI,一个具有图形用户界面 pandas 库

PandasGUI 数据分析 数据可视化 Python 数据处理
PandasGUI 是一个为 Pandas 库提供图形用户界面的工具,旨在简化数据操作和可视化,特别适合初学者或偏好直观操作的用户。通过简单的安装步骤,用户可以加载数据集并利用其丰富的功能,包括查看和排序数据框、重塑数据、过滤数据、生成汇总统计以及创建多种交互式图表。本文以泰坦尼克号数据集为例,详细展示了 PandasGUI 的核心功能,帮助用户更高效地进行数据分析和探索。
文章内容
思维导图
常见问题
社交分享

Pandas 是进行数据处理和分析的流行的 python 库。

虽然对于初学者或那些喜欢更直观的方法来快速学习它并不容易。

但 PandasGUI 提供了一个令人难以置信的解决方案:一个具有图形用户界面的惊人库,可简化数据操作和可视化功能。

https://github.com/adamerose/PandasGUI

本文将逐步安装它并展示其可增强数据分析能力的卓越功能。

开始使用 PandasGUI

要开始使用 PandasGUI,第一步是安装它。可以直接通过 pip 命令来进行安装。

pip install pandasgui

接下来引入它。

import pandas as pd
import pandasgui

最后一步是加载数据集以用于演示该库的功能。

你可以加载你选择的结构化数据集,也可以使用 PandasGUI 可用数据集。

在本文中,我们将使用 PandasGUI 库附带的泰坦尼克号数据集。

from pandasgui.datasets import titanic

现在,我们准备启动 PandasGUI。只需调用 show() 函数,如下面的代码所示:

pandasgui.show(titanic)

执行这些命令后,将打开一个新窗口以显示你上传的数据框。

PandasGUI 功能

用户界面非常简单。它由以下组件组成。我将在后面的小节中介绍它们。

  • 查看和排序 DataFrame
  • 重塑数据框
  • 数据帧过滤
  • 汇总统计
  • 交互式绘图

查看和排序 DataFrame

PandasGUI 的第一个功能是按升序和降序查看和排序 DataFrame。这是数据探索的重要一步,可以轻松完成,如下图所示:

重塑数据框

PandasGUI 提供了两种重塑数据框的方法,即 pivot 和 melts。

pivot 通过将值从一列移动到多列来转换数据框。

另一方面,**melt **方法使你能够取消透视数据框,将多个列合并为一个列,同时将其他列保留为变量。

在下面的 gif 中,我们将使用 pivot 方法重塑泰坦尼克号数据框:

### 数据帧过滤

在许多情况下,你希望根据特定条件过滤数据集以进一步了解数据或从数据集中提取特定切片。

要首先使用 PandasGUI 对你的数据应用过滤器,你将转到过滤器部分并编写每个过滤器然后应用它。

假设我们只想获得以下乘客:

  • Sex == ‘male’
  • Pclass == ‘3’
  • Survived ==1
  • 30 < Age < 40

在下面的 gif 中是将这四个过滤器应用于泰坦尼克号数据集的分步指南:

### 汇总统计

你还可以使用 PandasGUI 为 DataFrame 提供详细的统计概览。这将包括数据集每一列的均值、标准差、最小值和最大值。

### 交互式绘图

最后,PandasGUI 为你的数据集提供了强大的交互式绘图选项,其中包括:

  • 直方图
  • 散点图
  • 线图
  • 条形图
  • 箱线图
  • 小提琴绘图
  • 3D散点图
  • 热图
  • 饼图
  • 词云

在下图中,我们将为我们的数据集创建三个交互:饼图、条形图和词云。

本文重点介绍了 PandasGUI 的功能,这是一个强大的库,它向广泛使用的 Pandas 库添加了图形用户界面。

我们首先演示了它的安装,加载了一个示例数据集,并探索了过滤、排序和统计分析等功能。

思维导图生成中,请稍候...

问题 1: 什么是 PandasGUI?
回答: PandasGUI 是一个为 Pandas 库提供图形用户界面的工具,旨在简化数据操作和可视化,特别适合初学者或喜欢直观操作的用户。

问题 2: 如何安装 PandasGUI?
回答: 可以通过 pip 命令安装 PandasGUI,具体命令为:pip install pandasgui

问题 3: 如何启动 PandasGUI 并加载数据集?
回答: 安装后,导入 PandasGUI 并加载数据集,然后使用 pandasgui.show(数据集) 启动界面。例如,可以使用泰坦尼克号数据集:from pandasgui.datasets import titanic

问题 4: PandasGUI 的主要功能有哪些?
回答: PandasGUI 的主要功能包括查看和排序 DataFrame、重塑数据框、数据帧过滤、汇总统计和交互式绘图。

问题 5: 如何在 PandasGUI 中过滤数据?
回答: 在 PandasGUI 的过滤器部分,编写并应用过滤条件即可。例如,可以过滤出性别为男性、舱位为三等、年龄在 30 到 40 岁之间的乘客。

问题 6: PandasGUI 支持哪些类型的交互式绘图?
回答: PandasGUI 支持多种交互式绘图,包括直方图、散点图、线图、条形图、箱线图、小提琴绘图、3D 散点图、热图、饼图和词云。

问题 7: 如何在 PandasGUI 中重塑数据框?
回答: PandasGUI 提供了两种重塑数据框的方法:pivot(将一列值移动到多列)和 melt(将多列合并为一列,保留其他列作为变量)。

问题 8: PandasGUI 的汇总统计功能包括哪些内容?
回答: 汇总统计功能提供数据集中每一列的均值、标准差、最小值和最大值等详细统计信息。

问题 9: PandasGUI 适合哪些用户?
回答: PandasGUI 特别适合初学者或那些希望通过直观的图形界面快速学习和操作数据的用户。

问题 10: 在哪里可以找到 PandasGUI 的更多信息和资源?
回答: 可以在 PandasGUI 的 GitHub 页面找到更多信息和资源,链接为:https://github.com/adamerose/PandasGUI